机器之心

消耗1830亿token，Meta用AI把数学教材翻译成了一个超大Lean库
作者：机器之心发布日期：2026-05-29 12:03:29
编辑｜Panda数学正在迎来 AI 革命。最近几个月尤为明显。比如，就在前几天，Google DeepMind 新论文宣布其最新系统 AlphaProof Nexus 在一次自主运行中，解决了 353
阅读全文
超越TurboQuant，面向长上下文推理的真2-bit KV Quantization算法问世
作者：机器之心发布日期：2026-05-29 12:03:29
本文作者 Zhongzhu Zhou 是 TogetherAI 的 Senior Research Scientist，悉尼大学博士，研究方向为高效机器学习系统，方向覆盖模型训推算法与系统协同设计，
阅读全文
刚刚，国产预训练具身大模型开源了，让后训练不再是必选项！
作者：机器之心发布日期：2026-05-28 12:30:00
编辑｜panda、+02026 年初，国内具身智能赛道掀起了一波开源潮，越来越多团队开始公开自己的视觉-语言-动作（VLA）模型、数据集与训练框架。与此同时，行业竞争也逐渐集中到 benchmark
阅读全文
多变量神经缩放定律迈向大一统：Mila联手DeepMind提出UNSL
作者：机器之心发布日期：2026-05-28 12:30:00
机器之心编辑部过去的大模型 scaling law 通常回答的是：当模型参数量、数据量和训练计算量增加后，loss 会如何下降。但真实训练过程要复杂得多。模型性能不只受参数量和数据量影响，还会受到训练
阅读全文
ICML2026 | AutoMoT : B2D & nuScense双SOTA ，重新思考VLM和端到端驾驶的结合
作者：机器之心发布日期：2026-05-28 12:30:00
大模型进入自动驾驶后，最直接的价值在于场景理解。它可以识别前车是否准备并线、行人是否可能横穿、施工区域是否会影响车道，也可以分析复杂路口中的让行关系。但自动驾驶需要的不只是 “看懂”。车辆真正要做的是
阅读全文
让机器人「摸到」世界，复旦系新智具身完成近亿元天使轮融资
作者：机器之心发布日期：2026-05-27 11:55:25
机器之心发布触觉具身智能，正在成为打通机器人与物理世界交互的关键密码。当机器人执行精细操作时，真正的考验往往始于接触的瞬间：USB 插头看似对准接口，却在插入的瞬间因毫厘之差而被卡住；当夹爪抓住线束，
阅读全文
AMD新论文颠覆认知：FP4训练不稳定，原因不是随机性不足
作者：机器之心发布日期：2026-05-27 11:55:25
编辑｜冷猫众所周知，大模型训练成本极高。但大家又知道，降低训练精度能够显著降低训练成本。DeepSeek-V3 用 FP8 训练把成本打到了 560 万美元，已经让全行业侧目。在 FP8 成功后，行业
阅读全文
从Foundation Model到Physical AI，三星「杀入」大模型核心战场
作者：机器之心发布日期：2026-05-27 11:55:25
机器之心发布过去几年，大模型竞争主要发生在 AI 公司之间。但随着 AI 开始从数字世界进入真实设备与物理世界，竞争逻辑正在发生变化。最近，机器之心注意到，一个长期相对低调、但拥有全球最大消费电子生态
阅读全文
不用人类手写训练框架了！AI自己写代码，训出1B端侧「小钢炮」
作者：机器之心发布日期：2026-05-26 13:15:28
机器之心编辑部你的电脑里，或许很快会住进一只会聊天的「小怪兽」。它不需要庞大的云端算力，也不必每一次对话都把请求发往远处的数据中心。它可以安静地待在本地设备里，随时被唤醒，陪你聊天、回答问题、处理简单
阅读全文
xAI解散，但Grok还在上新，马斯克官宣新模型
作者：机器之心发布日期：2026-05-26 13:15:28
机器之心编辑部自从 xAI 解散、大批创始成员离职之后，大家都在关心一个问题：Grok 是不是要凉了？事实证明，并没有。就在昨天，马斯克对外透露了 Grok 最新模型的进展。据他介绍，参数量达 1.5
阅读全文
ACL 2026 Main | 不只是调用地图API，Spatial-Agent让大模型生成可执行地理分析工作流
作者：机器之心发布日期：2026-05-26 13:15:28
作者：Riyang Bao, Cheng Yang, Dazhou Yu, Zhexiang Tang, Gengchen Mai, Liang Zhao单位：Emory University；Rut
阅读全文
性能超越李飞飞，他们把10亿高斯点的3D世界装进浏览器
作者：机器之心发布日期：2026-05-25 14:31:07
编辑｜冷猫我们知道，世界是三维的。但互联网普及至今，受限于技术、硬件和传播载体，在几十年的时间里，都在把这个三维世界压成二维来表达。文字、图片、视频，这三种信息载体承载了我们今天在网上看到的几乎一切，
阅读全文
告别多奖励跷跷板：Flow-OPD将多教师OPD带入图像生成
作者：机器之心发布日期：2026-05-25 14:31:07
本文由中国科学技术大学、加州大学洛杉矶分校、香港中文大学和小红书等机构合作完成。共同作者第一为中国科学技术大学一年级研究生方镇，他的研究方向为通用多模态智能体。今年以来，在线策略蒸馏 OPD（On-P
阅读全文
Meta大裁员的「幸存者」们，正在经历进退两难...
作者：机器之心发布日期：2026-05-24 15:00:00
机器之心编辑部在 Meta，躲过裁员大刀的「幸存者」们发现，他们面对的不是劫后余生，而是一场更加激进的组织重塑。近期，Meta 内部的两场人事地震在社交媒体上引起了讨论：一是部分工程经理被要求转回个人
阅读全文
ICML 2026｜首个视觉语言模型并行思考框架，一文解析内在机制
作者：机器之心发布日期：2026-05-24 15:00:00
当前，测试时扩展范式普遍致力于增加推理长度。然而，已有研究表明，随着推理长度的持续增长，以垂直扩展为核心的计算范式容易陷入探索僵化等问题。因此，从另一维度拓展推理的宽度显得尤为重要。K2.5、Step
阅读全文
没有大模型、没有自有流量、股价一度跌成废墟，他靠什么把广告投放炼成千亿金矿？
作者：机器之心发布日期：2026-05-23 21:57:31
编辑｜Sia当别人看不懂你的时候就会觉得你在作弊。——Adam Foroughi（亚当·福瑞吉）「妖股」的绝地反杀想象这样一家公司：它 2021 年上市，市值一度接近 400 亿美元；一年后，股价暴
阅读全文
Bengio新论文刷新递归推理上限，并行轨迹碾压串行推理
作者：机器之心发布日期：2026-05-23 21:57:31
机器之心编辑部推理效率和质量是大模型领域永恒的命题。主流推理模型的共同选择是：生成更多的中间 token，用链式思维（CoT）把推理过程写出来。推理越深，生成的 token 越多，延迟越高，成本越大。
阅读全文
22.9倍加速！FlashAR：仅用0.05%数据，让预训练好的自回归图像模型飞起来
作者：机器之心发布日期：2026-05-23 21:57:31
背景：自回归图像生成的崛起与推理瓶颈大语言模型的成功让 "next-token prediction" 这套范式从文本延伸到了图像领域。把图像用视觉分词器编码成离散 token，再一个接一个的预测出来
阅读全文
Meta华人发布ATLAS，一个词搞定可泛化的视觉推理！
作者：机器之心发布日期：2026-05-22 10:00:00
机器之心发布近日，Meta AI 与香港中文大学颠覆性提出了一种全新的视觉推理范式 ATLAS，不用外部工具，不显式生成中间图像，没有视觉监督信号，只用一个离散 word，首次颠覆性地代替 Agent
阅读全文
人形机器人的「指尖心脏」：这个团队用898天完成空心杯电机国产突围
作者：机器之心发布日期：2026-05-22 10:00:00
机器之心编辑部最近，知名机器人厂商 Figure AI 做了一件全球瞩目的事情：让三个人形机器人在流水线上分拣包裹、轮番作业，还开启了全球直播。直播画面中，这些机器人动作流畅，能迅速完成包裹翻面、放到
阅读全文
CVPR 2026 | 突破短视，理解变化！HiF-VLA：以motion为中心打造「边想边做」的世界动作模型
作者：机器之心发布日期：2026-05-22 10:00:00
本文第一作者为西湖大学科研助理蔺明慧，通讯作者为阿里巴巴达摩院算法专家黄思腾和西湖大学人工智能系副主任王东林。所有作者均来自西湖大学机器智能实验室（MiLAB）和西湖机器人科技有限公司，团队工作 Re
阅读全文
推翻二十年组网逻辑，智谱落地ZCube，让同样的GPU多干15%的活
作者：机器之心发布日期：2026-05-21 11:02:33
编辑｜冷猫在 AI 发展的历程中，我们仍在经历一个野蛮生长的阶段：规模，就是一切。这条路确实管用。从千卡到万卡，算力规模的跃升支撑了大模型从 GPT-4 到 DeepSeek V4、GLM-5 的一路
阅读全文
刚刚，谢赛宁团队放出第二代表征自编码器
作者：机器之心发布日期：2026-05-21 11:02:33
编辑｜PandaAI 图像生成通常遵循「能力越强、代价越高」的铁律；与此同时，学界却在悄悄质疑另一个更根本的浪费：传统 VAE 对图像语义几乎一无所知，而 DINOv2、SigLIP 等视觉编码器早已
阅读全文
VAST+清华提出3D生成新范式，空间智能密度控制「把算力花在刀刃上」| SIGGRAPH 2026
作者：机器之心发布日期：2026-05-21 11:02:33
如果把现在最热门的几条 3D 生成技术线放在一起看，你会发现它们正在遇到一个很像的问题。做 3D AIGC 的人会发现，模型已经越来越会 “生成一个东西”，但生成结果的复杂度很固定，不够灵活；做图形学
阅读全文
字节奖学金首次全球开放，五年67位得主去向追踪
作者：机器之心发布日期：2026-05-20 11:48:57
编辑｜杨文众所周知，AI 科研极为烧钱，而全球高校普遍面临一道难题：没钱、没资源。为此，大佬们没少发牢骚。菲尔兹奖得主陶哲轩曾公开吐槽自身资源捉襟见肘，无法充分投入长期项目，部分工作被迫众筹甚至搁置。
阅读全文
I/O大会开完，谷歌连搜索框都变智能体了
作者：机器之心发布日期：2026-05-20 11:48:57
机器之心编辑部今天凌晨，谷歌全面撕掉「克制」标签，向智能体时代转型了。当地时间周二，谷歌 I/O 大会正式举行，今年一系列新产品的核心逻辑是「24 小时不停工作的智能体」。看来 OpenClaw 开了
阅读全文
ACL 2026 | 赋予视频生成「视觉思维链」：VChain显式建模时空规划与状态演变
作者：机器之心发布日期：2026-05-20 11:48:57
当视频生成模型在视觉保真度上不断突破时，一个核心瓶颈正变得愈发清晰：模型是否真正理解了真实世界？能否推理出合理的演变过程？在具身智能、影视制作以及物理仿真等应用场景中，要求模型不仅要生成 “平滑的像素
阅读全文
从卖token到卖结果，这些公司开始让AI背KPI了
作者：机器之心发布日期：2026-05-19 11:59:14
编辑｜张倩自从黄仁勋在 GTC 上大手一挥，鼓励企业把 token 消耗量算进工程师的 KPI，魔幻的事情就一天比一天多了。先是 Meta 内部搞起「烧 token 竞赛」，员工为冲 KPI，写死循环
阅读全文
LLM近期重大架构进化一览：从Gemma 4到DeepSeek V4
作者：机器之心发布日期：2026-05-19 11:59:14
机器之心编辑部过去一段时间，很多人对大模型都有一个明显感受：token 总是不够用。毕竟用户想大模型更「聪明」更连贯，上下文窗口只会越来越大。而在模型背后，长上下文是相当「奢侈」的。用户 token
阅读全文
ICML 2026 | 突破3DGS光度多义性瓶颈：北航/新国立提出AmbiSuR，重塑高保真3D几何重建
作者：机器之心发布日期：2026-05-19 11:59:14
近年来，3D 高斯泼溅（3D Gaussian Splatting, 3DGS）凭借其卓越的新视角合成能力和实时的渲染效率，极大地推动了神经渲染技术的发展。然而，当研究者试图直接从 3DGS 中提取精
阅读全文