机器之心

拿下1亿美元种子轮！SGLang团队创立RadixArk，打造下一代开放AI基础设施
作者：机器之心发布日期：2026-05-08 16:59:50
机器之心发布当所有人都盯着模型层厮杀，一支手握开源推理事实标准的团队，带着硅谷最豪华的种子轮投资人阵容，正式将矛头对准了新时代的 AI 基础设施。5 月 5 日，AI 基础设施初创公司 RadixAr
阅读全文
OpenAI官方CLI上线，跟复杂的SDK说拜拜
作者：机器之心发布日期：2026-05-08 16:59:50
机器之心编辑部大家总说新科技会淘汰老技术。但大模型要想深度落地，必须拥抱老技术，拥抱兼容性。在过去很长一段时间里，开发者想要测试 OpenAI 的模型能力，通常有两种路径：要么在 Playground
阅读全文
ICLR 2026 I 英伟达 & 普渡大学用agent闭环实现文生3D
作者：机器之心发布日期：2026-05-08 16:59:50
大模型正在进入 “Agent 时代”大模型正在从 “会说会写” 走向 “会规划、会执行” 的 Agent 时代。对具身智能来说，这种变化尤其关键。因为真正限制机器人和智能体能力上限的，很多时候并不是算
阅读全文
刚刚，马斯克官宣xAI解散，22万张GPU算力租给Anthropic
作者：机器之心发布日期：2026-05-07 10:02:42
机器之心编辑部就在刚刚，马斯克正式对外确认，xAI 将被解散。xAI 及其旗下的大语言模型 Grok（以及社交平台 X 的相关业务）将被整合进 SpaceX 的一个全新子部门，统一命名为 SpaceX
阅读全文
0%完成率！Claude、GPT、Gemini 全灭，SWE-Bench作者新作把AI圈干沉默了
作者：机器之心发布日期：2026-05-07 10:02:42
编辑｜SiaSWE-Bench 的创建者，刚刚又放出了一个地狱级新 benchmark。结果相当震撼：Claude Opus 4.7、GPT-5.4、GPT-5 mini、Gemini 3.1 Pro
阅读全文
TACO: 让 CLI Agent 在自主迭代中学会丢掉无用上下文
作者：机器之心发布日期：2026-05-07 10:02:42
本项目由曼彻斯特大学、北京航空航天大学、香港科技大学，以及 Multimodal Art Projection（MAP）研究团队联合提出。本文由 Jincheng Ren、Siwei Wu、Yizhi
阅读全文
国产双开源：让Mac成为你的私人AI工作站
作者：机器之心发布日期：2026-05-06 12:00:00
编辑｜panda、+02026 年 3 月底，Ollama 发布了一则更新公告：其 Mac 版本的底层推理引擎，将从沿用多年的 llama.cpp 切换为苹果的 MLX 框架。这条消息在开发者社区引发
阅读全文
DeepSeek版Claude Code登顶热榜：8700星，鲸鱼哥火了
作者：机器之心发布日期：2026-05-06 12:00:00
编辑｜泽南感谢鲸鱼兄弟开源。DeepSeek V4 才推出一个星期，DeepSeek 版的 Claude Code 就登顶了 GitHub 热榜。大家缺的就是这么一个工具。目前已经有了超过 8700
阅读全文
阿里开源PromptEcho：用冻结多模态大模型为文生图训练提供高质量Reward
作者：机器之心发布日期：2026-05-06 12:00:00
本文作者团队来自阿里巴巴集团，共同第一作者为深度学习研究员刘锦龙和何旺贵，通讯作者为姜浩。用强化学习（RL）优化文生图模型的 prompt following 能力，是一条被广泛验证的路径 —— 让模
阅读全文
Anthropic联创定下deadline：2028年AI实现自我进化，没有人类了
作者：机器之心发布日期：2026-05-05 11:58:47
编辑｜杨文、陈陈AI 很快就能自己改造自己了？Anthropic 联合创始人 Jack Clark 发帖称，他最近几周阅读了大量公开的 AI 开发数据后，认为到 2028 年底，递归自我改进（recu
阅读全文
大型挂机现场：马斯克的55万英伟达GPU，利用率才11%
作者：机器之心发布日期：2026-05-05 11:58:47
编辑 | 泽南AI 时代堆 GPU，原来是这么个堆法？马斯克旗下的 xAI 目前 GPU 资源利用率只有大概 11%。相关报告指出，其 AI 软件栈的优化效果不尽如人意。近日，《The Informa
阅读全文
Agent-World：扩展真实世界环境，让智能体与环境协同进化！
作者：机器之心发布日期：2026-05-05 11:58:47
随着MCP、Agent Skills与各类Harness的快速发展，大模型能轻松调用成百上千种外部工具，但在多工具，具备复杂状态、长程交互的任务上仍有明显短板。尽管一系列环境扩展方法尝试复刻真实世界的
阅读全文
黄仁勋点名Anthropic达里奥，别一当CEO，就开「上帝视角」
作者：机器之心发布日期：2026-05-04 12:01:53
编辑｜杨文、陈陈过去一年，AI 圈最流行的说法之一，是替代。AI 要替代程序员，替代设计师，替代 SaaS，甚至替代一整套现有的工作方式。每隔一段时间，就会有人抛出新观点：多少岗位会消失，哪个行业会被
阅读全文
ACL 2026｜AI for聋哑群体，港理工开源思考型手语翻译模型
作者：机器之心发布日期：2026-05-04 12:01:53
本文作者分别来自香港理工大学以及四川大学。第一作者江奕飏是来自香港理工大学的博士生，指导老师为李青教授与魏骁勇教授。长期以来，听障群体在信息获取、公共服务和社会交流中都处于相对边缘的位置。主流社会的大
阅读全文
CTO不香了？百亿公司高管们为何集体转身，去Anthropic当工程师
作者：机器之心发布日期：2026-05-03 13:34:44
机器之心编辑部一件看似「反常」的人才大迁徙，正在硅谷悄然发生……事情是这样的，前两天，一位博主 Henry Shi 在 X 上发文称，自己看到科技界正在发生奇怪的事情，「一些曾经管理着数十亿美元公司业
阅读全文
CVPR 2026 Highlight | 超越传统检索方法！我们的激光雷达重定位方法在精度和效率上双丰收
作者：机器之心发布日期：2026-05-03 13:34:44
在自动驾驶的日常测试视频里，我们常能看到这样的场景：一辆无人车驶入幽深的地下车库，GPS 信号瞬间罢工，它只能靠激光雷达扫描周围环境，试图弄清楚 “我在哪”。然而，车辆可能已经原地掉头，拐过了好几个弯
阅读全文
这套题，GPT-5.5、Opus 4.7加起来没考到「1分」，人类却拿了满分100？
作者：机器之心发布日期：2026-05-02 13:31:12
机器之心编辑部在大模型「卷生卷死」的今天，大家似乎已经习惯了模型在各大榜单上刷出逼近满分准确率。然而，在一项名为 ARC-AGI-3 的基准测试中，堪称当下「最红炸子鸡」的两款顶尖模型 ——OpenA
阅读全文
ACL 2026 | RouteMoA：无需预推理的动态路由，实现高效多智能体混合
作者：机器之心发布日期：2026-05-02 13:31:12
本篇论文已被 ACL 2026 接收，主要作者来自上海交通大学自动化与感知学院 IWIN 中心团队。团队负责人为关新平教授，指导老师为陈彩莲教授和乐心怡教授，合作作者还包括南洋理工大学陶大程教授。其他
阅读全文
有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了
作者：机器之心发布日期：2026-05-01 13:00:00
机器之心编辑部最近，研究人员李博杰在 arXiv 发布论文，提出一个名为「不可压缩知识探针」的评测框架，尝试仅通过黑盒 API 调用，来逆向估算任意 LLM 的参数规模。论文标题：Incompress
阅读全文
强化学习的进化：从PPO到MaxRL，LLM推理训练的算法演进史
作者：机器之心发布日期：2026-05-01 13:00:00
机器之心编译强化学习已成为 LLM 后训练技术栈中最重要的技术之一。它是促成 GPT-3 向 InstructGPT 转变的关键要素。此后，它也成为当前这波推理能力提升浪潮的核心。第一代针对 LLM
阅读全文
Generalist之后，罗剑岚团队推出LWD，也要变革具身智能训练范式
作者：机器之心发布日期：2026-04-30 12:49:26
编辑｜泽南这一次，具身智能的范式算是彻底升级了。智元机器人的办公室里，最近员工们一上班就能看到机器人熟练地切着水果：有梨有黄瓜，一通操作完了之后装进破壁机，打成了健康饮料端上来：同样一套设备也能玩转调
阅读全文
哈萨比斯出的难题，GPT之父接上了：用一个知识停在1930年的模型
作者：机器之心发布日期：2026-04-30 12:49:26
机器之心编辑部「一个训练数据截止到 1911 年的模型，能不能自己推导出爱因斯坦 1915 年提出的广义相对论？」今年年初，哈萨比斯给出了一个极其硬核的 AGI 判定标准。没想到的是，这件事真的有人尝
阅读全文
ACL 2026 综述：从事后解释到内生解释，大模型内生可解释性的前沿进展
作者：机器之心发布日期：2026-04-30 12:49:26
论文链接：https://arxiv.org/pdf/2604.16042github 链接：https://github.com/PKU-PILLAR-Group/Survey-Intrinsic-
阅读全文
诺奖得主实验室走出的中国团队，正用世界模型重构生命分子设计
作者：机器之心发布日期：2026-04-29 11:08:19
机器之心发布过去几年，AI4Bio 最深入人心的突破，莫过于 Google DeepMind 开发的 AlphaFold。它让 AI 大规模、接近实验精度地 “看见” 蛋白质结构。到了 AlphaFo
阅读全文
无需训练，如何提升黑箱VLM？CARPRT用「类别感知」给出答案
作者：机器之心发布日期：2026-04-29 11:08:19
近年来，视觉-语言模型（Vision-Language Models, VLMs）如 CLIP 的出现，彻底改变了图像理解的范式。其中，零样本分类作为 VLM 的核心优势之一，无需额外标注数据即可完成
阅读全文
让大模型理解真实医疗视频，全球首个开源技术方案来了！
作者：机器之心发布日期：2026-04-28 15:40:59
编辑｜冷猫让 AI 进入医疗领域，是一件需要慎之又慎的事情。在这种事情上，总有人走得特别激进。今年 2 月，路透社发布了一篇调查报道，标题触目惊心 ——《As AI enters the operat
阅读全文
openJiuwen社区首发「Coordination Enginnering」，让智能体从「单兵作战」到「精锐团队」
作者：机器之心发布日期：2026-04-28 15:40:59
机器之心编辑部从Prompt Engineering提示词工程、Context Engineering上下文工程，到如今爆火的Harness Engineering，围绕大模型的落地方法论持续升级，核
阅读全文
ACL 2026｜答得更准还写得更短？华为泰勒实验室提出SHAPE，给LLM推理装了个「推理税」
作者：机器之心发布日期：2026-04-28 15:40:59
用强化学习训练大模型做数学推理，一个经典的尴尬局面是：模型要么答对了但废话连篇，要么写了一大堆最后答错了，而你根本不知道它到底在哪一步走偏的。来自华为泰勒实验室、北京大学和上海财经大学的研究团队提出了
阅读全文
从99行代码复刻冰雪奇缘，到引领3D AI，胡渊鸣的公司凭什么「爆火欧美」？
作者：机器之心发布日期：2026-04-27 08:01:11
编辑｜张倩不知道大家有没有注意到，身边的朋友，买 3D 打印机的是越来越多了。以前，谁要玩 3D 打印，那纯粹是「有闲钱」「爱动手」的表现。但如今，就像罗永浩在他的科技春晚中提到的，一款开箱即用的 3
阅读全文
苹果新论文发出惊人一问：What do your logits know?
作者：机器之心发布日期：2026-04-27 08:01:11
编辑｜Panda近日，有个大新闻：执掌苹果超过 14 年的蒂姆・库克宣布将于 9 月正式卸任 CEO 职位，将接力棒交接给现任硬件工程高级副总裁约翰・特努斯。回顾库克时代，人们津津乐道于他极致的供应链
阅读全文