全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    社区供稿丨Jina-VLM:可在笔记本上跑的多语言视觉小模型

    作者:Hugging Face发布日期:2025-12-12 18:00:00

    今天我们正式发布 Jina-VLM,这是一款 2.4B 参数量的视觉语言模型(VLM),在同等规模下达到了多语言视觉问答(Multilingual VQA)任务上的 SOTA 基准。面对小参数量 VL

    阅读全文
  • 文章封面

    GPT-5.2获封“最强打工人”,谷歌同日以Gemini“性价比”系列应战

    作者:钛媒体AGI发布日期:2025-12-12 16:34:57

    文|飞向TAI空作者|胡珈萌编辑|李程程本文首发于钛媒体APP“我从未像现在这样对我们的研发和产品路线图,以及实现我们使命的整体方向感到如此乐观。”12月12日,在正式上线GPT-5.2的同时,Ope

    阅读全文
  • 文章封面

    AI版「互联网协议」面世,豆包手机们再也不怕被「封禁」了?

    作者:智能Pro发布日期:2025-12-12 15:59:58

    👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......作者:冬日果酱 | 监制:罗超最近封禁「豆包手机」(nubia M53)的 App 名单越拉越长

    阅读全文
  • 文章封面

    AD智驾的2025年:监管刹车、技术狂飙,“地大华魔”谁主沉浮?

    作者:智能Pro发布日期:2025-12-12 15:59:58

    👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......2025年即将结束,这一年关于汽车行业有很多关键词,其中之一就是“自动驾驶踩刹车”。今年春天,工

    阅读全文
  • 文章封面

    高质量资源搜索神器!支持全网,速速收藏!

    作者:智能Pro发布日期:2025-12-12 15:59:58

    👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......现在办公软件五花八门,作为资深打工人的小编,可用过不少。什么钉钉、企业微信、飞书啊,都格外熟悉。

    阅读全文
  • 文章封面

    我在闲鱼买东西,结果被AI给气笑了

    作者:智能Pro发布日期:2025-12-12 15:59:58

    👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......如果你是闲鱼的老用户,估计会觉得这个平台变得挺“陌生”的,自从AI托管、AI帮卖等功能上线后,已

    阅读全文
  • 文章封面

    中国机器人比赛应急救援,美国网友Reddit破防:我们还在给机器狗化妆拍段子

    作者:量子位发布日期:2025-12-12 14:37:48

    亨利 发自 凹非寺量子位 | 公众号 QbitAI崇“洋”媚外这一块,也是轮到美国网友了!最近,一篇“中国机器人在比火场救人,美国机器狗还在给扎克伯格套脸?”的帖子被顶上了Reddit热门。这位发帖的

    阅读全文
  • 文章封面

    10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

    作者:量子位发布日期:2025-12-12 14:37:48

    一水 发自 凹非寺量子位 | 公众号 QbitAI天下果然没有免费的午餐!为了让“米老鼠”加入Sora,OpenAI刚刚正式官宣与迪士尼达成合作。协议内容之一即为,OpenAI需向迪士尼出售价值10亿

    阅读全文
  • 文章封面

    只需三步,就能认领一台AI手机!

    作者:量子位发布日期:2025-12-12 14:37:48

    金磊 发自 凹非寺量子位 | 公众号 QbitAI拥有一台AI手机,竟能如此简单。这个AI手机,正是最近全面开源的、能让手机自己动起来的AutoGLM。先来看下效果:帮我在美团上点一杯冰豆花。只需要简

    阅读全文
  • 文章封面

    谷歌智能体发力:增强版Gemini Deep Research和专属API都来了

    作者:量子位发布日期:2025-12-12 14:37:48

    闻乐 发自 凹非寺量子位 | 公众号 QbitAIOpenAI强势更新,谷歌也没闲着。正式发布增强版的Gemini Deep Research,基于Gemini 3 Pro构建,专门减少幻觉,在复杂信

    阅读全文
  • 文章封面

    量子位编辑作者招聘

    作者:量子位发布日期:2025-12-12 14:37:48

    编辑部 发自 凹非寺量子位 | 公众号 QbitAIAI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来量子位呢?我们是一家以追踪AI新进展为核心的内容平台,经过8年积累,目前拥有顶流影响力,广

    阅读全文
  • 文章封面

    180万小时数据训练,VoxCPM 1.5开源:支持全量微调,精准复刻真人声

    作者:PaperWeekly发布日期:2025-12-12 13:31:09

    180 万小时、44k 高保真、支持全量微调——刚刚开源的 VoxCPM 1.5,技术细节全解密。最近,面壁技术团队发布了 VoxCPM 1.5 版本,在持续优化开发者开发体验的同时,也带来了多项核心

    阅读全文
  • 文章封面

    AAAI 2026 | System 1 & 2协同!快慢思考赋能VLM,重塑细粒度识别范式

    作者:PaperWeekly发布日期:2025-12-12 13:31:09

    以 CLIP 为代表的视觉语言模型(VLM)在大规模图文数据上进行了预训练,具备强大的通用视觉识别能力。然而,在细粒度识别任务上,VLM 往往难以区分相近类别之间的细微差异,识别能力显著下降。以 CL

    阅读全文
  • 文章封面

    桌面级AI Lab实测:千亿大模型开箱即跑,这个小盒子有点猛

    作者:夕小瑶科技说发布日期:2025-12-12 13:09:26

    等等!马上要进入 2026 年了,你还在和大模型部署扯皮吗?尤其是个人开发者和小团队,只是想跑个模型,为什么要经历九九八十一难啊?!配环境翻车、显存溢出报错、依赖冲突爆炸、模型下载失败……这种痛感你我

    阅读全文
  • 文章封面

    深度|AI教母李飞飞:在AI时代,信任绝不能外包给机器,它本质上属于人类,存在于个体、社区与社会层面

    作者:Z Potentials发布日期:2025-12-12 12:12:56

    图片来源:Masters of ScaleZ Highlights对层次丰富、复杂空间世界的深刻理解,正是具身智能(包括机器人)的“大脑”。空间智能不仅完善了感知–行动闭环,还将提升我们的认知能力:例

    阅读全文
  • 文章封面

    Z Event|年底最Vibe的一场聚会?MiniMax/Kimi/智谱/Trae/Kiro/CodeBuddy...都来啦!

    作者:Z Potentials发布日期:2025-12-12 12:12:56

    阅读全文
  • 文章封面

    速递|对标GitHub、AI初创Harness完成由高盛领投的2.4亿美元E轮融资

    作者:Z Potentials发布日期:2025-12-12 12:12:56

    图片来源:HarnessAI DevOps工具Harness由连续创业者Jyoti Bansal于2017年创立,其创始人告诉TechCrunch,该公司2025年的年度经常性收入(ARR)有望超过2

    阅读全文
  • 文章封面

    速递|谷歌DeepMind开设首个AI研究实验室,深耕材料科学发现全链条

    作者:Z Potentials发布日期:2025-12-12 12:12:56

    图片来源:Google DeepMindGoogle DeepMind将开设其首个用于发现新材料的研究实验室,例如用于电池或半导体的材料,这是其将人工智能应用于更多科学领域的推进举措之一。该设施将于明

    阅读全文
  • 文章封面

    实测 GPT-5.2 :价格暴涨能力微涨,凭什么反击 Gemini

    作者:APPSO发布日期:2025-12-12 12:02:21

    要吊打 Gemini 的 GPT 5.2 在今天凌晨正式发布了,向所有用户推出。上个月刚刚退订掉 ChatGPT Plus,转到 Gemini,这次需要因为 GPT-5.2 再回去吗?看完下面这些网友

    阅读全文
  • 文章封面

    推理快30%,性能超过千亿参数模型,15B模型Apriel-1.6重新定义端侧推理

    作者:AIGC开放社区发布日期:2025-12-12 11:39:26

    专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!Apriel-1.6-15b-Th

    阅读全文
  • 文章封面

    AI鸿沟正在拉大!OpenAI报告揭示:不用AI的企业将被淘汰

    作者:AIGC开放社区发布日期:2025-12-12 11:39:26

    专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!企业AI正在重塑全球商业流与组织架

    阅读全文
  • 文章封面

    南京大学开源SteadyDancer模型实现完美动作迁移,首帧保留彻底解决身份漂移难题

    作者:AIGC开放社区发布日期:2025-12-12 11:39:26

    专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!南京大学、腾讯PCG与上海人工智能

    阅读全文
  • 文章封面

    全球强化学习+VLA范式,PI*0.6背后都有这家中国公司技术伏笔

    作者:机器之心发布日期:2025-12-12 11:20:44

    机器之心发布机器之心编辑部在 Physical Intelligence 最新的成果 π0.6 论文里,他们介绍了 π0.6 迭代式强化学习的思路来源:其中有我们熟悉的 Yuke Zhu 的研究,也有

    阅读全文
  • 文章封面

    Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?

    作者:机器之心发布日期:2025-12-12 11:20:44

    机器之心报道编辑:+0随着扎克伯格将公司战略重心从「元宇宙」全面转向人工智能,公司内部正面临多重挑战。据《纽约时报》报道,Meta 新组建的顶尖 AI 团队与公司原有的核心业务部门之间,在资源分配、发

    阅读全文
  • 文章封面

    NUS LV Lab新作|FeRA:基于「频域能量」动态路由,打破扩散模型微调的静态瓶颈

    作者:机器之心发布日期:2025-12-12 11:20:44

    尹博:NUS 计算机工程硕士生、LV Lab 实习生,研究方向是生成式 AI,及参数高效率微调(PEFT)。胡晓彬:NUS LV Lab Senior Research Fellow, 研究方向是生成

    阅读全文
  • 文章封面

    我逆向了ChatGPT的Memory系统,发现它比想象中简单太多了 ChatGPT的Memory多好用不多说了,昨天,有个国外的老哥逆向了一波,发现了它由4层架构构成。 没有向量数据库,没有对历史对话做RAG检索。出乎意外的简单~ ChatGPT的上下文结构。一共由6部分构成。 前2部分是一些高级指令,如system prompt,instrucions。接下来4部分是Memory的核心。四层架构:会话元数据、长期用户记忆、最近对话摘要、当前对话窗口。 最后一部分是最后一条消息。 第一层:会话元数据 每次开启会话时,系统会注入一次性的环境信息,包括设备类型、浏览器、大致位置、订阅等级、使用习惯等。 包括你用深色模式还是浅色模式,屏幕尺寸多大。 这些信息帮助模型适配你的环境,但会话结束就没了,不会永久存储。 第二层:用户记忆 这是真正的长期记忆。ChatGPT有专门的工具来存储和删除关于你的稳定事实。 在我这里,模型存了33条,包括名字、年龄、职业目标、当前项目、学习方向等。 但这些不是猜测的,只有两种情况会存储:你明确说 记住这个 ,或者模型检测到符合条件的事实且你没反对。 想增删?直接说 记住xxx 或 删除xxx 就行。 第三层:最近对话摘要 这部分比较意外。大多数人应该会觉着他们会用RAG检索所有历史对话,其实它用的是轻量摘要。 格式大概是:时间戳 + 对话标题 + 用户消息片段。 只总结你说的话,不包括助手回复。大约保留15条左右。 这给了ChatGPT跨对话的连续感,但不需要拉取完整历史。 传统RAG需要嵌入每条消息、做相似度搜索、拉取完整上下文,延迟和成本都高。 ChatGPT的做法是预计算轻量摘要直接注入,用精度换速度。 第四层:当前对话窗口 这是当前会话的滑动窗口,包含完整对话历史(非摘要)。 具体token限制没问出来,但确认了:基于token数而非消息数计算,超出后旧消息滚动淘汰,但记忆事实和对话摘要始终保留。 在发消息的时候,会话元数据给环境上下文,用户记忆确保回复符合你的背景偏好,对话摘要提供跨对话的兴趣图谱,当前窗口维持会话内的连贯性。 当上下文紧张时,旧消息滚出,但核心记忆始终在。 详细细节可以在这里看到:https://manthanguptaa.in/posts/chatgpt_memory/

    作者:探索AGI发布日期:2025-12-12 11:11:20

    我逆向了ChatGPT的Memory系统,发现它比想象中简单太多了 ChatGPT的Memory多好用不多说了,昨天,有个国外的老哥逆向了一波,发现了它由4层架构构成。 没有向量数据库,没有对历史

    阅读全文
  • 文章封面

    GPT5.2发布:屠榜?不,是OpenAI在补课

    作者:硅星人Pro发布日期:2025-12-12 10:52:35

    作者|周一笑邮箱|zhouyixiao@pingwest.com四个月前,GPT-5 发布时一堆人吐槽,跑分是高了,但聊天冷冰冰;一个月前,GPT-5.1 回应了这波差评,主打“更好聊、更好调”,算是

    阅读全文
  • 文章封面

    告别LeCun,借力阿里,Meta能靠千问翻盘么?

    作者:硅星人Pro发布日期:2025-12-12 10:52:35

    作者|Yoky邮箱|yokyliu@pingwest.com谁也没想到,曾经高举“开源大旗”的Meta,会以这样一种充满讽刺意味的方式宣告新时代的到来。本周,彭博社爆出一则重磅消息:Meta正在秘密研

    阅读全文
  • 文章封面

    从冷门歌手到热门金曲,AI音乐成了?

    作者:硅星人Pro发布日期:2025-12-12 10:52:35

    文章转载于惊蛰研究所作者|雨谷最近两个月,使用AI创作的爵士版、R&B版、福音版《大东北我的家乡》,从B站鬼畜区一直火到抖音短视频。截至目前,B站《大东北我的家乡》相关视频的最高播放量超过690万,而

    阅读全文
  • 文章封面

    GPT-5.2全力出击!碾压44类专业工作,实测编程同价位无对手、深度推理封神,但速度太拉胯了

    作者:AI前线发布日期:2025-12-12 08:37:59

    整理|华卫刚刚,GPT-5.2来了。一共三个版本:GPT-5.2 Instant 是一款高效实用的日常工作与学习工具,在信息检索问答、操作指引、技术文档撰写及翻译等方面均有显著优化,同时延续了GPT-

    阅读全文
上一页下一页