ICLR2026 Oral | 北大彭一杰团队提出高效优化新范式,递归似然比梯度优化器赋能扩散模型后训练
在 AI 视觉生成领域,扩散模型(DM)凭借其强大的高保真数据生成能力,已成为图像合成、视频生成等多模态任务的核心框架。然而,预训练后的扩散模型如何高效适配下游应用需求,一直是行业面临的关键挑战。近日
阅读全文在 AI 视觉生成领域,扩散模型(DM)凭借其强大的高保真数据生成能力,已成为图像合成、视频生成等多模态任务的核心框架。然而,预训练后的扩散模型如何高效适配下游应用需求,一直是行业面临的关键挑战。近日
阅读全文编辑|杜伟OpenClaw 火爆的盛况至今仍在持续,在国内甚至出现了排队在腾讯总部楼下等待安装 OpenClaw 的场景,让人感叹「一代人有一代人的领鸡蛋」。而就在几天前,谷歌发布了一个 CLI(命令
阅读全文编辑|冷猫前沿 AI 研究曾经是由「肉身计算机」完成的:人们在吃饭、睡觉、娱乐之间抽时间做研究,并且偶尔通过一种名为「组会」的仪式,用声波互联(也就是交谈)来同步信息。那个时代已经一去不复返了。如今,
阅读全文1. 真正的高级智能,在于认知自己的 “无知”如果把当下最强的大模型(如 GPT-5.2、Gemini-3 Pro)丢进一个从未去过的虚拟房间,让它自己探索并构建地图,它能做到吗?一直以来,我们评估多
阅读全文编辑|Sia、Panda春节期间, Seedance 2.0 爆火,堪称现象级,这也再次把视频生成推上风口。前两天,字节跳动又携手北大、安努智能和 Canva 共同开源了具备实时生成能力的视频模型 H
阅读全文机器之心编辑部近日,Anthropic 公布了一组惊人的数字,在与 Mozilla 公司进行合作,测试旗下模型 Claude Opus 4.6 发现漏洞能力的过程中,两周内,就找出 Mozilla 公
阅读全文机器之心编辑部电子游戏一直是 AI 领域发展的极大推动力之一。游戏本身就构建了一个相对完整的世界,并且具有相当易于理解的世界规则。不仅可以训练人工智能对物理世界的理解,训练智能体的交互,更是许多世界模
阅读全文当大模型推理进入 Parallel Thinking 时代,一个关键问题随之出现:模型在并行推理的过程中,究竟发生了什么?多条推理路径同时展开,看似为模型带来了更强的能力,却也引入了一个长期被忽视的问
阅读全文编辑|泽南AI 领域最前沿的方向「世界模型」,正在出现一场革命。互联网上,OpenClaw 的「赛博龙虾」在虚拟数字世界中灵活穿梭,无所不能;现实中,具身机器人却依然受困于试验场的围栏,难以迈向复杂的
阅读全文机器之心编辑部经过一年的努力,FlashAttention-4 终于正式上线了。近日,深度学习领域重要底层优化技术 FlashAttention 迎来大版本更新。FlashAttention 核心作者
阅读全文该论文由大连理工大学、快手可灵团队、香港中文大学联合完成,第一作者王清和是大连理工大学在读三年级博士,研究方向为视频生成,师从卢湖川、贾旭教授,目前在快手可灵团队实习。个人主页:https://qin
阅读全文编辑|张倩导读:近日,位于中关村的深度机智全球首次使用全新范式——人类学习,在多个国际 Benchmark 上取得 SOTA,史无前例地使用全新架构(仅使用人类第一视角数据、零真机数据)击败 Phys
阅读全文机器之心编辑部苹果的 Mac 产品线里,终于出现了一款真正意义上的「入门级」笔记本。昨天,在最新发布会上,苹果推出了 MacBook Neo。这款电脑的起售价为 4599 元,教育价甚至可以降到 39
阅读全文本文第一作者为香港科技大学博士生 陈浩东 和 西北工业大学本科生 尹新祥;通讯作者为香港科技大学教授 陈启峰 和 陈颖聪。人类在创作艺术时,大脑并非一味地输出,而是在每一笔落下时都在进行着复杂的、难以
阅读全文作者 | 白铂 博士白铂 博士 华为 2012 实验室理论研究部主任 信息论首席科学家引言在本系列的第二篇《信号处理篇》中,我们引入了一些信息论的概念和方法来理解语义嵌入/向量化。本篇将完全从信息论的
阅读全文机器之心编辑部AI 时代,我们已经习惯了用「说话」搞定一切:想要一个表格,动动嘴皮子,大模型分分钟就给生成出来;想完成个复杂任务,交代清楚目标和限制,「小龙虾」自己就干活去了。这个时代,只要会用语言,
阅读全文序言:数字镜像中的极端涌现风起于青萍之末、不稳定的害群之马、羊群效应、毒瘤行为......—— 在数字镜像的背面,这群科学家凝视着 AI 社会的「黑天鹅」时刻。2023 年,斯坦福「模拟小镇」(Sma
阅读全文编辑|杨文浏览器,正在成为 AI 落地最重要的战场。去年 10 月,OpenAI 推出 AI 浏览器 Atlas,奥特曼将其定义为「十年一遇的机会」,放言要「改变 30 亿人使用互联网的方式」。Goo
阅读全文机器之心编辑部近日,NVIDIA 发布的世界 - 动作模型 DreamZero,在两项颇具代表性的机器人基准测试 RoboArena 、MolmoSpaces 上双双登顶。DreamZero 核心思想
阅读全文本文第一作者为王赞毅,本科毕业于西安交通大学,现为加州大学圣迭戈分校(UCSD)ECE 系硕士一年级学生。其主要研究方向为:视频理解,生成式建模。本工作为作者在国家电网思极 AI 实验室(SGIT A
阅读全文机器之心报道近日,在运筹优化领域的顶级赛事 CVRPLib BKS 全球挑战赛中,由华为诺亚方舟实验室、华为云天筹 AI 求解器团队、华为云加拿大实验室和香港城市大学张青富教授团队联合而成的 “Opt
阅读全文编辑|+0任何在通风橱前熬过夜、被繁琐的湿实验折磨过的科研人,看到这一幕大概都会心跳加速。在星河启智科学智能开放平台推出全面升级版本的发布会现场,大屏幕上实时展示了这样一段流程:超级科研合伙人「大圣」
阅读全文一、引言从内容分发到商业转化,推荐系统早已成为互联网平台的关键基础设施。它在海量信息与有限注意力之间完成筛选和排序,直接影响内容曝光、商品成交以及流量变现效率。用户在电商平台上看到的商品列表、在信息流
阅读全文机器之心编辑部最近,复旦大学肖仰华教授的朋友圈引起了热议,其在研发测试的 AI 智能体通过自主学习学会了操作微信,在朋友圈发消息并与其好友在评论区自主互动。面对自然的互动,不少好友甚至开始要求 “证明
阅读全文编辑|PandaAlex Radford,出生于1993 年 4 月,即将 33 岁,但已经拥有超过 32 万的引用量。因为这位「独立研究员」不仅是 GPT、GPT-2 和 CLIP 的第一作者,同时
阅读全文当 AI Agent 逐渐走出对话框,真正的难点不再是 “回答得多聪明”,而是能否像人一样完成任务闭环:看懂屏幕、点击按钮、填写表单、整理文件、生成交付物,并把结果同步回团队协作系统。我们开源的 Op
阅读全文机器之心编辑部整个具身智能领域都在探索世界模型的实用化路径。这个被寄予厚望的「数字模拟器」,本应成为机器人训练的核心工具,却因物理保真度低等问题成为「空中楼阁」。去年年中,谷歌发布了 Genie-3
阅读全文本文第一作者朱子瑞为新加坡国立大学四年级博士生,本科毕业于清华大学,研究方向为多模态大模型和后训练优化。通讯作者为 TikTok 内容智能负责人 Kanchan Sarkar、Meta杨振恒博士(相关
阅读全文编辑|Panda我隐隐约约有种感觉,这封裁员信在历史上会被记上一笔的…… 它在后世有可能是以「人类正式进入 XXX 时代」的标志性事件而被铭记。今天凌晨,一封发布在 X 上的裁员信引发了讨论热潮,短短
阅读全文Prompt 作为一种接口,直接影响 LLM 与 agent system 的行为方式与性能表现。对 prompts 的理解与控制,本质上决定了系统能力能够被释放到什么程度。Prompt learni
阅读全文