OpenAI翁家翌:梯度之外,下一个AI训练范式有着落了?
机器之心编辑部如果有一天,一段由 AI 编程工具写的纯粹的程序代码 —— 没有神经网络,没有梯度下降,没有任何「训练」—— 却在经典游戏里打出了理论最高分,在机器人控制里跑出了媲美 Deep RL 的
阅读全文机器之心编辑部如果有一天,一段由 AI 编程工具写的纯粹的程序代码 —— 没有神经网络,没有梯度下降,没有任何「训练」—— 却在经典游戏里打出了理论最高分,在机器人控制里跑出了媲美 Deep RL 的
阅读全文机器之心编辑部DeepSeek 正在进行一轮 73 亿美元的巨额融资,估值高达约 515 亿美元,这使其成为中国有史以来最大的 AI 融资。知情人士透露,总部位于深圳的视频游戏和社交媒体巨头腾讯控股一
阅读全文如果说 2017 年的 PyTorch 让深度学习从 "少数派的炼丹炉" 变成了 "人人可用的工程平台",那么具身智能(Embodied AI)正在等待属于它自己的 "PyTorch 时刻"。过去两年
阅读全文机器之心发布当所有人都盯着模型层厮杀,一支手握开源推理事实标准的团队,带着硅谷最豪华的种子轮投资人阵容,正式将矛头对准了新时代的 AI 基础设施。5 月 5 日,AI 基础设施初创公司 RadixAr
阅读全文机器之心编辑部大家总说新科技会淘汰老技术。但大模型要想深度落地,必须拥抱老技术,拥抱兼容性。在过去很长一段时间里,开发者想要测试 OpenAI 的模型能力,通常有两种路径:要么在 Playground
阅读全文大模型正在进入 “Agent 时代”大模型正在从 “会说会写” 走向 “会规划、会执行” 的 Agent 时代。对具身智能来说,这种变化尤其关键。因为真正限制机器人和智能体能力上限的,很多时候并不是算
阅读全文机器之心编辑部就在刚刚,马斯克正式对外确认,xAI 将被解散。xAI 及其旗下的大语言模型 Grok(以及社交平台 X 的相关业务)将被整合进 SpaceX 的一个全新子部门,统一命名为 SpaceX
阅读全文编辑|SiaSWE-Bench 的创建者,刚刚又放出了一个地狱级新 benchmark。结果相当震撼:Claude Opus 4.7、GPT-5.4、GPT-5 mini、Gemini 3.1 Pro
阅读全文本项目由曼彻斯特大学、北京航空航天大学、香港科技大学,以及 Multimodal Art Projection(MAP)研究团队联合提出。本文由 Jincheng Ren、Siwei Wu、Yizhi
阅读全文编辑|panda、+02026 年 3 月底,Ollama 发布了一则更新公告:其 Mac 版本的底层推理引擎,将从沿用多年的 llama.cpp 切换为苹果的 MLX 框架。这条消息在开发者社区引发
阅读全文编辑|泽南感谢鲸鱼兄弟开源。DeepSeek V4 才推出一个星期,DeepSeek 版的 Claude Code 就登顶了 GitHub 热榜。大家缺的就是这么一个工具。目前已经有了超过 8700
阅读全文本文作者团队来自阿里巴巴集团,共同第一作者为深度学习研究员刘锦龙和何旺贵,通讯作者为姜浩。用强化学习(RL)优化文生图模型的 prompt following 能力,是一条被广泛验证的路径 —— 让模
阅读全文编辑|杨文、陈陈AI 很快就能自己改造自己了?Anthropic 联合创始人 Jack Clark 发帖称,他最近几周阅读了大量公开的 AI 开发数据后,认为到 2028 年底,递归自我改进(recu
阅读全文编辑 | 泽南AI 时代堆 GPU,原来是这么个堆法?马斯克旗下的 xAI 目前 GPU 资源利用率只有大概 11%。相关报告指出,其 AI 软件栈的优化效果不尽如人意。近日,《The Informa
阅读全文随着MCP、Agent Skills与各类Harness的快速发展,大模型能轻松调用成百上千种外部工具,但在多工具,具备复杂状态、长程交互的任务上仍有明显短板。尽管一系列环境扩展方法尝试复刻真实世界的
阅读全文编辑|杨文、陈陈过去一年,AI 圈最流行的说法之一,是替代。AI 要替代程序员,替代设计师,替代 SaaS,甚至替代一整套现有的工作方式。每隔一段时间,就会有人抛出新观点:多少岗位会消失,哪个行业会被
阅读全文本文作者分别来自香港理工大学以及四川大学。第一作者江奕飏是来自香港理工大学的博士生,指导老师为李青教授与魏骁勇教授。长期以来,听障群体在信息获取、公共服务和社会交流中都处于相对边缘的位置。主流社会的大
阅读全文机器之心编辑部一件看似「反常」的人才大迁徙,正在硅谷悄然发生……事情是这样的,前两天,一位博主 Henry Shi 在 X 上发文称,自己看到科技界正在发生奇怪的事情,「一些曾经管理着数十亿美元公司业
阅读全文在自动驾驶的日常测试视频里,我们常能看到这样的场景:一辆无人车驶入幽深的地下车库,GPS 信号瞬间罢工,它只能靠激光雷达扫描周围环境,试图弄清楚 “我在哪”。然而,车辆可能已经原地掉头,拐过了好几个弯
阅读全文机器之心编辑部在大模型「卷生卷死」的今天,大家似乎已经习惯了模型在各大榜单上刷出逼近满分准确率。然而,在一项名为 ARC-AGI-3 的基准测试中,堪称当下「最红炸子鸡」的两款顶尖模型 ——OpenA
阅读全文本篇论文已被 ACL 2026 接收,主要作者来自上海交通大学自动化与感知学院 IWIN 中心团队。团队负责人为关新平教授,指导老师为陈彩莲教授和乐心怡教授,合作作者还包括南洋理工大学陶大程教授。其他
阅读全文机器之心编辑部最近,研究人员李博杰在 arXiv 发布论文,提出一个名为「不可压缩知识探针」的评测框架,尝试仅通过黑盒 API 调用,来逆向估算任意 LLM 的参数规模。论文标题:Incompress
阅读全文机器之心编译强化学习已成为 LLM 后训练技术栈中最重要的技术之一。它是促成 GPT-3 向 InstructGPT 转变的关键要素。此后,它也成为当前这波推理能力提升浪潮的核心。第一代针对 LLM
阅读全文编辑|泽南这一次,具身智能的范式算是彻底升级了。智元机器人的办公室里,最近员工们一上班就能看到机器人熟练地切着水果:有梨有黄瓜,一通操作完了之后装进破壁机,打成了健康饮料端上来:同样一套设备也能玩转调
阅读全文机器之心编辑部「一个训练数据截止到 1911 年的模型,能不能自己推导出爱因斯坦 1915 年提出的广义相对论?」今年年初,哈萨比斯给出了一个极其硬核的 AGI 判定标准。没想到的是,这件事真的有人尝
阅读全文论文链接:https://arxiv.org/pdf/2604.16042github 链接:https://github.com/PKU-PILLAR-Group/Survey-Intrinsic-
阅读全文机器之心发布过去几年,AI4Bio 最深入人心的突破,莫过于 Google DeepMind 开发的 AlphaFold。它让 AI 大规模、接近实验精度地 “看见” 蛋白质结构。到了 AlphaFo
阅读全文近年来,视觉-语言模型(Vision-Language Models, VLMs)如 CLIP 的出现,彻底改变了图像理解的范式。其中,零样本分类作为 VLM 的核心优势之一,无需额外标注数据即可完成
阅读全文编辑|冷猫让 AI 进入医疗领域,是一件需要慎之又慎的事情。在这种事情上,总有人走得特别激进。今年 2 月,路透社发布了一篇调查报道,标题触目惊心 ——《As AI enters the operat
阅读全文机器之心编辑部从Prompt Engineering提示词工程、Context Engineering上下文工程,到如今爆火的Harness Engineering,围绕大模型的落地方法论持续升级,核
阅读全文