万物皆可参考是种什么体验?Vidu Q2参考生Pro:特效、演技、细节全都要
编辑|+0最近,一段「威尔·史密斯吃意面」的今昔对比视频在社交媒体刷屏,引发了无数感慨。两年前,初出茅庐的 AI 视频还是「抽象鬼畜」的代名词,五官乱飞、逻辑崩坏;仅仅两年过去,当同一主题再次被演绎,
阅读全文编辑|+0最近,一段「威尔·史密斯吃意面」的今昔对比视频在社交媒体刷屏,引发了无数感慨。两年前,初出茅庐的 AI 视频还是「抽象鬼畜」的代名词,五官乱飞、逻辑崩坏;仅仅两年过去,当同一主题再次被演绎,
阅读全文机器之心编辑部在技术如火如荼发展的当下,业界常常在思考一个问题:如何利用 AI 发现科学问题的新最优解?一个普遍的解法是「测试时搜索」(Test-time search),即提示一个冻结的(不更新参数
阅读全文1. 深度学习下的场景理解:从密集网格到对象中心表征单目 3D 语义场景补全 (Semantic Scene Completion, SSC) 是具身智能与自动驾驶领域的一项核心技术,其目标是仅通过单
阅读全文编辑|Youli你的下一个视频团队,不一定非得是人。做电商的朋友,一定对这样的时刻不陌生:前期找团队、磨脚本、拍视频,筹备了半个月,好不容易在亚马逊或 TikTok 后台上新一款潜力爆款。谁想到,半夜
阅读全文机器之心编辑部一觉醒来,我们看到了微软自研 AI 芯片的最新进展。微软原定于 2025 年发布的下一代 AI 芯片 Maia 200,终于在今天问世!微软 CEO Satya Nadella根据微软官
阅读全文过去几年,机制可解释性(Mechanistic Interpretability)让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成:从单个神经元到注意力头,再到
阅读全文编辑|杨文2026 年,AI 大模型的军备竞赛仍在继续。各家公司争相发布更强大的模型版本,比拼参数量、推理速度、benchmark 得分,整个行业陷入了一种近乎狂热的「性能偏执」。在这种逻辑下,大部分
阅读全文编辑|张倩、陈陈过去两年,大模型的推理能力出现了一次明显的跃迁。在数学、逻辑、多步规划等复杂任务上,推理模型如 OpenAI 的 o 系列、DeepSeek-R1、QwQ-32B,开始稳定拉开与传统指
阅读全文近年来多模态大模型在视觉感知,长视频问答等方面涌现出了强劲的性能,但是这种跨模态融合也带来了巨大的计算成本。高分辨率图像和长视频会产生成千上万个视觉 token ,带来极高的显存占用和延迟,限制了模型
阅读全文编辑|杨文许多人梦想进入像 OpenAI 这样的前沿实验室从事研究工作,然而对于那些缺乏传统学术背景,比如没有发表过论文或知名导师推荐的人来说,这条路似乎格外艰难。最近,OpenAI 资深研究科学家
阅读全文编辑|杨文你的童年我的童年好像不一样。我的 17 岁,是坐在教室里苦哈哈地刷数学卷子;而这个名叫 Enrique Barschkis 的高中生,利用课间休息时间,成功解决了困扰数学家多年的埃尔德什第
阅读全文论文第一作者为清华大学博士、南洋理工大学博士后李寿杰,清华大学博士生吴同和人工智能硕士生徐建乐。论文通讯作者包括清华大学深圳国际研究生院副教授丁文伯,大连理工大学教授解兆谦,新加坡国立大学助理教授吴昌
阅读全文机器之心编辑部自从图灵奖得主 Yann LeCun 离开 Meta 创立 AMI Labs(Advanced Machine Intelligence) 以来,这家新公司便引发了业界的高度关注。本周,
阅读全文编辑|Panda刚刚,OpenAI CEO 山姆・奥特曼发了一条推文:「从下周开始的接下来一个月,我们将会发布很多与 Codex 相关的激动人心的东西。」他尤其强调了网络安全这个主题。当然,和奥特曼的
阅读全文从模型重编程(Model Reprogramming),到参数高效微调(PEFT),再到当下大模型时代的 Prompt Tuning ,Prompt Instruction 和 In-context
阅读全文编辑|杜伟、泽南今天一早,OpenAI CEO 奥特曼就发推晒收入,「仅我们的 API 业务而言,上个月就增加了超过 10 亿美元的 ARR(年度经常性收入)。」他继续说到,大多数人只看到了 Chat
阅读全文编辑|Panda、泽南前两天,Node.js 之父 Ryan Dahl 在 X 上断言:「人类编写代码的时代已经结束了。」该帖引发广泛讨论,浏览量更是已经超过了 700 万。而现在,我们迎来了一个对这
阅读全文在 LLM 时代,思维链( CoT)已成为解锁模型复杂推理能力的关键钥匙。然而,CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用,严重制约了模型的推理效率。为
阅读全文编辑|泽南在医疗健康这一容错率极低的领域,大模型不再凭空「想象」,而是已变得严谨可靠、能引会搜:百川刚刚推出的新模型,实现了一个里程碑式的突破。本周四,百川智能正式发布新一代大模型 Baichuan-
阅读全文编辑|陈陈、冷猫刘壮带队的无需归一化 Transformer 又有新的版本了。一直以来,在 Transformer 架构里,LayerNorm 几乎是标配,但它也有明显问题:比如计算和访存成本高,尤其
阅读全文机器之心编辑部近日,有消息传出,苹果正在研发一款由 AI 驱动的可穿戴「胸针」(Pin)设备,不过目前该设备仍处于早期研发阶段,最快可能也要在 2027 年才能面世。据知情人透露,该设备体积与 Air
阅读全文编辑|冷猫谷歌 2017 年提出的 Transformer 架构事实上已经基本垄断了大模型。不采用 Transformer 架构的大模型已经是少之又少,而采用非 Transformer 架构,还能与主
阅读全文近日,中国科学技术大学(USTC)联合新疆师范大学、中关村人工智能研究院、香港理工大学,在数据驱动的多功能双连通多尺度结构逆向设计领域取得重要突破。相关成果于 2026 年 1 月 8 日以 “Dat
阅读全文编辑|泽南、杜伟在语音大模型赛道上,GPT-4o、Gemini 的能力遥遥领先。近日,由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Di
阅读全文编辑|Panda一根 256 GB 内存条标价 5000 美元?这个价格已经轻松超过了英伟达顶配显卡 RTX 5090 的市场溢价。此推文引发了广泛讨论,已收获超 200 万浏览,图源:X@Yuche
阅读全文在迈向通用人工智能(AGI)的征途中,多模态大语言模型(MLLMs)虽然在视觉理解与文本生成上展现了惊人的能力,却始终面临一道难以逾越的鸿沟:如何在复杂的数学与几何推理中,克服固有的幻觉与逻辑断层?
阅读全文机器之心编译元旦期间,DeepSeek 发布的 mHC 震撼了整个 AI 社区。简单来说,DeepSeek 提出的 mHC 通过将传统 Transformer 的单一残差流扩展为多流并行架构,并利用
阅读全文机器之心编辑部开始前,温馨提醒一下各位投稿 ICML 2026 的小伙伴们,投稿已于 1 月 8 日开放,也请大家注意投稿截止时间:摘要提交截止日期:2026 年 1 月 23 日。全文提交截止日期:
阅读全文想象这样一个日常画面:你吩咐家用机器人「烧壶开水」,它却当场卡壳——水壶在哪?该接自来水还是过滤水?先插电还是先按开关?水开了又该如何判断?这些对人类而言像呼吸一样自然的家务,对过去的机器人却是大大的
阅读全文