击败谷歌、英伟达!清华陈建宇×斯坦福Chelsea团队世界模型Ctrl-World具身能力登顶全球
机器之心编辑部在全球具身智能领域的顶级权威评测 WorldArena 榜单中,清华陈建宇(星动纪元创始人)团队联合斯坦福 Chelsea Finn(PI 创始人) 团队研发的 Ctrl-World 世
阅读全文机器之心编辑部在全球具身智能领域的顶级权威评测 WorldArena 榜单中,清华陈建宇(星动纪元创始人)团队联合斯坦福 Chelsea Finn(PI 创始人) 团队研发的 Ctrl-World 世
阅读全文编辑|冷猫去年 7 月的 IMO 数学奥林匹克竞赛中,两大人工智能公司抢夺竞赛「金牌」成绩的闹剧搞得沸沸扬扬。当时 OpenAI 和 谷歌 同时声称取得竞赛金牌,而 OpenAI 因绕过官方竞赛规则提
阅读全文编辑|杨文IBM 成人工智能领域最新受害者。周一,IBM 股价单日暴跌 13.2%,收于 223.35 美元,创下该公司自 2000 年 10 月以来最惨烈的单日跌幅,且月内跌幅已达 25%。这场风波
阅读全文机器之心编辑部新年假期像水一样流走了。在这个刚过去的新年里,全民讨论的最大话题就是 AI 和机器人。尤其是在春晚舞台表演功夫杂技的机器人明星一哥宇树,全球首次展现了高动态、高协同的全自主集群控制技术。
阅读全文语音情感识别(Speech Emotion Recognition, SER)在过去基本遵循同一种范式:输入语音,输出情绪标签。这种设定在工程上有效,但在认知层面却过于简化。在人类交流中,情绪判断从来
阅读全文编辑|Sia这个春节,AI 圈最硬核的一场「真人秀」,悄然完成了阶段性收官。主角不是动漫人物,也不是舞枪弄棒的机器人,而是一位 7×24 小时从不疲倦的 AI 科学家 FARS( Fully Auto
阅读全文机器之心发布近日,具身智能头部企业千寻智能连续完成两轮融资近 20 亿元,为行业发展注入强劲动能。本轮融资阵容堪称行业资本的集中亮相:云锋基金、红杉中国、混沌投资(葛卫东)等超一线机构重磅入局;Syn
阅读全文机器之心编辑部在最近 AI 领域内,智能体(Agent)的研究和应用越来越多,原生多智能体工作的基础模型也已开始出现。作为一个能够推理、规划和行动的系统,智能体正逐渐成为现实世界人工智能应用的常见范式
阅读全文编辑|杨文这个春节,MiniMax 杀疯了。2 月 20 日,港股马年首个交易日,MiniMax 收盘股价报涨 14.52%,市值一度冲破 3042 亿港元。这轮上涨并非只是资本市场的情绪宣泄。过去两
阅读全文「首个公开的面向 Terminal-Bench 环境交互类任务的数据规模化生产管线正式发布!」开源完整自动化数据构建算法构建 1655 个高可靠 CLI 任务环境镜像通过 291 条轨迹数据带来 20
阅读全文编辑|张倩硅谷 AI 人才市场,正在经历前所未有的复杂周期:无论是招人还是找工作,想要双向匹配都比以前困难。站在招聘方这边,最常见的体验是:你想要的人根本招不到,甚至连对方愿不愿意聊一聊都很难说。站在
阅读全文近年来,大模型文本检索(LLM-based Text Retrieval)技术发展迅猛,SOTA 的 LLM Embedding Model 参数量普遍在 7B 以上,相关性搜索性能提升的同时,部署成
阅读全文机器之心编辑部当大多数的 AI 厂商都在忙着打造更多 AI 工具的时候,一家以制作 AI 视频著称的公司居然开始制作「第二个你」了。近日,Pika 推出 AI Selves 产品,宣称可以生成「AI
阅读全文在衡量大语言模型(LLM)代码生成能力的竞赛中,一个日益严峻的问题正浮出水面:当模型在 HumanEval、MBPP 等经典基准上纷纷取得近乎饱和的成绩时,我们究竟是在评估其真实的泛化推理能力,还是在
阅读全文机器之心编辑部上周,谷歌发布了 Gemini 3 Deep Think 的一次重大更新,以应对当今科学、研究和工程领域的复杂挑战。而就在刚刚,谷歌正式推出支撑这些突破的升级版核心智能:Gemini 3
阅读全文机器之心编译如果把人生看作一个开放式的大型多人在线游戏(MMO),那么游戏服务器在刚刚完成一次重大更新的时刻,规则改变了。自 2022 年 ChatGPT 惊艳亮相以来,世界已经发生了深刻变化。在短短
阅读全文现有 VLA 模型的研究和基准测试多局限于家庭场景(如整理餐桌、折叠衣物),缺乏对专业科学场景(尤其是生物实验室)的适配。生物实验室具有实验流程结构化、操作精度要求高、多模态交互复杂(透明容器、数字界
阅读全文在很多大模型和 Agent 的训练里,最常见的一种做法就是只看结果:最后答案对了就给奖励,错了就当 0 分。在单轮问答里,这样「只看结果」还勉强能用;可一旦换成 Agent 这种要多轮对话、搜索、刷网
阅读全文编辑 | 泽南这已经是宇树机器人第三次亮相春晚,我们却感到了前所未有的震撼。今年的央视春节联欢晚会上,还是那家全球领先的宇树科技,把舞台当成了新技术的展示场。一群活力十足的人形机器人,上演了一出武术表
阅读全文想象一下,你让 AI 助手结合搜索工具探索一个复杂问题。它第一次探索时走错了方向,但第二次、第三次,它依然重复同样的错误探索路径。虽然你可能可以从最终得到的多次探索结果中挑选出一个勉强满意的答案,但是
阅读全文本文来自香港浸会大学和上海交通大学的可信机器学习和推理组,已被 ICLR 2026 接收。目前,RLVR(Reinforcement Learning with Verifiable Rewards)
阅读全文编辑|Sia米兰冬奥村今年的年味儿,溢出屏幕 在冬奥村这个汇聚全球运动员短暂停靠的「天下第一村」里,文化在碰撞,友谊在生长,各种小故事每天都在悄悄发生。 与往年相比,今年米兰冬奥村,多了一点特别的气
阅读全文机器之心编辑部大年初二,海外就开始发新模型了!这次是 Anthropic,率先发布了他们称之为「我们目前能力最强的 Sonnet 模型」Claude Sonnet 4.6。Claude 称,新模型对编
阅读全文GUI 智能体最近卷到什么程度了?Claude、OpenAI Agent 及各类开源模型你方唱罢我登场,但若真想让 AI 成为 「能在手机和网页上稳定干活的助手」,仍绕不开三大现实难题:「知识缺失」难
阅读全文尽管目前文生图模型(Text-to-Image Models)在生成高保真图像上表现卓越,但在应对空间感知、空间逻辑推理及多目标空间交互等贴合现实场景的复杂空间智能任务时往往力不从心。现有评估基准主要
阅读全文机器之心编辑部2026年春晚,舞台上最忙的,除了演员,就是机器人。央视春晚贺岁节目《我最难忘的今宵》这一届上台的机器人各有各的路子——有的走仿生路线,模仿起人来连神态都安排上了;有的直接拼运动能力,一
阅读全文本文第一作者林俊一,共同第一作者薛敦耀来自中国人民大学。通讯作者为中国人民大学许洪腾副教授与孟澄助理教授。其他作者还包括来自北京理工大学的虞俊副教授。在衡量 3D 点云、高分子构型等结构性数据之间的距
阅读全文不可学习样本(Unlearnable Examples)是一类用于数据保护的技术,其核心思想是在原始数据中注入人类难以察觉的微小扰动,使得未经授权的第三方在使用这些数据训练模型时,模型的泛化性能显著下
阅读全文编辑|sia春节是个好日子,AI Agent 圈迎来一则重磅人事变动。没想到吧,OpenClaw(前身 Clawdbot / Moltbot)从爆火到加入 OpenAI,仅仅过去了一个月的时间。就在刚
阅读全文在训练与开发单个通用大语言模型 (LLM) 之外,越来越多的研究开始关注多模型协同 (model collaboration):由不同群体、基于不同数据、以不同目的训练的多个大语言模型,通过多样化的协
阅读全文