继宇树后,唯一获得三家大厂押注的自变量:具身模型不是把DeepSeek塞进机器人
编辑|张倩国内具身智能,接下来可能是「大脑」的战场了。2026 开年,自变量机器人传出融资消息,字节、红杉出手,融资额达到 10 亿。虽然自变量是一家软硬一体的公司,但这场融资背后,真正说服投资人的可
阅读全文编辑|张倩国内具身智能,接下来可能是「大脑」的战场了。2026 开年,自变量机器人传出融资消息,字节、红杉出手,融资额达到 10 亿。虽然自变量是一家软硬一体的公司,但这场融资背后,真正说服投资人的可
阅读全文编辑|+0站在 2026 年的开端回望,LLM 的架构之争似乎进入了一个新的微妙阶段。过去几年,Transformer 架构以绝对的统治力横扫了人工智能领域,但随着算力成本的博弈和对推理效率的极致追求
阅读全文一个智能驾驶系统,在迈向高阶自动驾驶的过程中,应当具备何种能力?除了基础的感知、预测、规划、决策能力,如何对三维空间进行更深入的理解?如何具备包含法律法规、道德原则、防御性驾驶原则等知识?如何进行基本
阅读全文编辑|Panda假如你是一个致力于将 AI 引入传统行业的工程团队。现在,你有一个问题:训练一个能看懂复杂机械图纸、设备维护手册或金融研报图表的多模态助手。这个助手不仅要能专业陪聊,更要能精准地识别图
阅读全文编辑 | 杜伟、泽南以人工智能技术闻名的 OpenAI,终于也要搞硬件了,而且一上来就是和苹果正面对标。最近,有关 OpenAI 硬件的消息越来越多。今天一早,数码博主 @智慧皮卡丘透露了关于 Ope
阅读全文“软工任务要改多文件、多轮工具调用,模型怎么学透?高质量训练数据稀缺,又怕轨迹含噪声作弊?复杂 RL 训练成本高,中小团队望而却步?”华为研究团队推出 SWE-Lego, 仅基于监督微调(SFT)的软
阅读全文编辑|Panda2024 年底,硅谷和北京的茶水间里都在讨论同一个令人不安的话题:Scaling Law 似乎正在撞墙。那时候,尽管英伟达的股价还在狂飙,但多方信源显示,包括彼时备受期待的 Orion
阅读全文01|“看懂世界” 这关,大模型还没上幼儿园过去一年,大模型在语言与文本推理上突飞猛进:论文能写、难题能解、甚至在顶级学术 / 竞赛类题目上屡屡刷新上限。但一个更关键的问题是:当问题不再能 “用语言说
阅读全文短视频搜索业务是向量检索在工业界最核心的应用场景之一。然而,当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据,导致系统陷入信息茧房,难以召回潜在相关的新鲜内容。针对这一问题,快手搜索团队提出了
阅读全文编辑|吴昕新年刚开局,AI 行业就直接拉满强度。在 CES 这个全球科技风向标上,机器人 × AI 成了真正的主角。在拉斯维加斯的霓虹灯下,中国机器人军团走到舞台中央——不靠堆概念,而是带着订单和规模
阅读全文机器之心编辑部GRPO 是促使 DeepSeek-R1 成功的基础技术之一。最近一两年,GRPO 及其变体因其高效性和简洁性,已成为业内广泛采用的强化学习算法。但随着语言模型能力的不断提升,用户对它们
阅读全文本文第一作者郭鹏鑫,香港大学博士生,研究方向是联邦学习、大模型微调等。本文共同第一作者王润熙,香港大学硕士生,研究方法是联邦学习、隐私保护等。本文通讯作者屈靓琼,香港大学助理教授,研究方向包含 AI
阅读全文编辑|Panda在生成式 AI 狂飙突进的 2026 年,如果你让一个 AI 编程智能体来写网页应用,它很大概率会用到 Tailwind CSS。要知道,其如今的周下载量已经超过了惊人的 2600 万
阅读全文跨学科突破:神经科学如何让 Agent 拥有「人类式」记忆?你是否想过 Agent 能像人类一样积累经验、不断成长?如今,这一愿景正加速走向现实。但是,现有研究要么只聚焦 AI 技术本身,要么对人脑记
阅读全文DeepSeek-OCR 的视觉文本压缩(VTC)技术通过将文本编码为视觉 Token,实现高达 10 倍的压缩率,大幅降低大模型处理长文本的成本。但是,视觉语言模型能否理解压缩后的高密度信息?中科院
阅读全文编辑|泽南、Panda如果 AI 工具早一点出现,我们的很多工作会不会提前几年完成?近日,整个科技圈都在感叹 AI 工具带来的效率提升。一些硅谷 AI 大厂工程师现身说法,表示在用了 AI 工具后,项
阅读全文编辑|张倩如果你是 Claude Code 的用户,你可能会注意到,它最近有个重要的版本更新,从节前的 2.0.76 更新到了 2.1.0。而且,这次的日志,你得往下翻好几屏。翻完这个日志,网友不淡定
阅读全文近日,清华大学等机构的研究团队提出了 MARSHAL 框架。该框架利用强化学习,让大模型在策略游戏中进行自博弈(Self-Play)。实验表明,这种多轮、多智能体训练不仅提升了模型在游戏中的博弈决策水
阅读全文机器之心编辑部先给大家看个视频,你能分辨出哪个是 AI 生成的吗?视频来源:tiktok 博主 @tkp..1001「真人拍摄还是 AI 生成」,如果搁一年前,这个问题还很容易回答,因为细节处总有一眼
阅读全文机器之心编辑部又快到博士申请季。这是一份复杂而又繁琐的工作:无尽的院校调研、纠结的方向选择、厚重的材料准备,以及决定命运的面试……不可能不感到迷茫、焦虑,甚至怀疑,这一切的辛勤付出,究竟能否换来梦想院
阅读全文针对端到端全模态大模型(OmniLLMs)在跨模态对齐和细粒度理解上的痛点,浙江大学、西湖大学、蚂蚁集团联合提出 OmniAgent。这是一种基于「音频引导」的主动感知 Agent,通过「思考 - 行
阅读全文机器之心发布当 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab (TML) 用 Tinker 创新性的将大模型训练抽象成 forward back
阅读全文机器之心发布Andrej Karpathy 大神力荐的 Vibe Coding,正在成为开发者的新宠。这种「只需聊一聊,AI 可以把功能写出来」的体验,极大提升了简单任务的开放效率。然而,当我们目光转
阅读全文编辑|PandaTransformer 已经改变了世界,但也并非完美,依然还是有竞争者,比如线性递归(Linear Recurrences)或状态空间模型(SSM)。这些新方法希望能够在保持模型质量的
阅读全文编辑|Panda、+0对于电子产品,我们已然习惯了「出厂即巅峰」的设定:开箱的那一刻往往就是性能的顶点,随后的每一天都在折旧。但对于通用机器人来说,这个设定必须被颠覆。试想,如果一个在实验室里完成训练
阅读全文机器之心发布2025 年,人工智能的发展重心正在发生一次根本性转移:从追求模型的规模,转向构建其理解与解决复杂现实问题的能力。在这一转型中,高质量数据正成为定义 AI 能力的新基石。作为人工智能数据服
阅读全文机器之心发布想象一下,你正在训练一个未来的家庭机器人。你希望它能像人一样,轻松地叠好一件衬衫,整理杂乱的桌面,甚至系好一双鞋的鞋带。但最大的瓶颈是什么?不是算法,不是硬件,而是数据 —— 海量的、来自
阅读全文2025 年,随着李飞飞等学者将 “空间智能”(Spatial Intelligence)推向聚光灯下,这一领域迅速成为了大模型竞逐的新高地。通用大模型和各类专家模型纷纷在诸多室内空间推理基准上刷新
阅读全文机器之心发布凭借成功预测 Polymarket 题目,连续登顶 Future X 全球榜首的 MiroMind 团队,于今日(1 月 5 日)正式发布其自研旗舰搜索智能体模型 MiroThinker
阅读全文机器之心发布明天,一年一度的 CES 即将在美国拉斯维加斯璀璨开幕。作为全球科技产业最重要的风向标之一,笔者在超前探访之后欣喜发现,在今年机器人「后厨翻炒」与 AI 眼镜「同声传译」的热闹之外,行业终
阅读全文