机器之心

生成视频好看还不够，还要能自由探索！昆仑万维开源Matrix-Game，单图打造游戏世界
作者：机器之心发布日期：2025-05-13 10:37:07
机器之心报道作者：张倩、泽南世界模型的进度条，最近坐上了火箭。去年 11 月，两家创业公司打造的 Oasis，首次在开源世界模型中实现了实时、可玩、可交互。生成的虚拟环境不仅包含画面，也体现出了对物理
阅读全文
NYU教授公布2025机器学习课程大纲：所有人都在追LLM，高校为何死磕基础理论？
作者：机器之心发布日期：2025-05-13 10:37:07
机器之心报道编辑：+0最近，Meta 公司首席 AI 科学家、图灵奖得主 LeCun 转发了他在纽约大学的同事 Kyunghyun Cho 的一篇帖子：内容是关于这位教授 2025 学年机器学习研究生
阅读全文
突破大模型推理瓶颈！首篇「Test-Time Scaling」全景综述，深入剖析AI深思之道
作者：机器之心发布日期：2025-05-13 10:37:07
本文由来自香港城市大学、麦吉尔大学（McGill）、蒙特利尔人工智能实验室（MILA）、人大高瓴人工智能学院、Salesforce AI Research、斯坦福大学、UCSB、香港中文大学等机构的多
阅读全文
强迫模型自我争论，递归思考版CoT热度飙升！网友：这不就是大多数推理模型的套路吗？
作者：机器之心发布日期：2025-05-12 12:31:47
机器之心报道编辑：杜伟递归思考 + 自我批判，CoRT 能带来 LLM 推理力的飞跃吗？CoT（Chain-of-thought）大家都很熟悉了，通过模仿「人类解题思路」，进而大幅提升语言模型的推理能
阅读全文
RL训练总崩溃？R1-Reward稳定解锁奖励模型Long-Cot推理能力
作者：机器之心发布日期：2025-05-12 12:31:47
机器之心发布机器之心编辑部多模态奖励模型（MRMs）在提升多模态大语言模型（MLLMs）的表现中起着至关重要的作用，在训练阶段可以提供稳定的 reward，评估阶段可以选择更好的 sample 结果，
阅读全文
CMU朱俊彦等上新LEGOGPT，一句话就能搭乐高，网友：复杂零件行不行？
作者：机器之心发布日期：2025-05-12 12:31:47
机器之心报道机器之心编辑部AI 不允许有人不会搭乐高。近日，CMU 助理教授朱俊彦团队带来了新研究 —— 基于文本生成 3D 乐高的大模型。这款大模型有多强呢？比如输入文本「基本款沙发」，一眨眼的功夫
阅读全文
CVPR2025｜MCA-Ctrl：多方协同注意力控制助力AIGC时代图像精准定制化
作者：机器之心发布日期：2025-05-12 12:31:47
本文由中国科学院计算技术研究所研究团队完成，第一作者为硕士生杨晗，通讯作者为副研究员安竹林，助理研究员杨传广。论文标题：Multi-party Collaborative Attention Cont
阅读全文
Copilot上大分，仅数天，陶哲轩的估计验证工具卷到2.0！刚刚又发数学形式化证明视频
作者：机器之心发布日期：2025-05-11 11:20:53
机器之心报道编辑：杜伟、大盘鸡本周二，我们报道了菲尔兹奖得主陶哲轩的一个开源项目 —— 在大模型的协助下编写了一个概念验证软件工具，来验证涉及任意正参数的给定估计是否成立（在常数因子范围内）。在项目中
阅读全文
现在的大学生，不用大模型才是异类
作者：机器之心发布日期：2025-05-11 11:20:53
选自New York Magazine机器之心编译作者：James D. Walsh「大学现在学的就是掌握 ChatGPT 的程度了。」在北美的顶尖大学校园里，人工智能完成作业、写论文已经成为一种常态
阅读全文
转身世界就变样？WorldMem用记忆让AI生成的世界拥有了一致性
作者：机器之心发布日期：2025-05-11 11:20:53
本文一作为肖泽琪，本科毕业于浙江大学，现为南洋理工大学博士生，研究方向是基于视频生成模型的世界生成和模拟，导师为潘新钢。个人主页：https://xizaoqu.github.io近年来，基于视频生成
阅读全文
SIGGRAPH 2025 | 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster！
作者：机器之心发布日期：2025-05-11 11:20:53
Sora、可灵等视频生成模型令人惊艳的性能表现使得创作者仅依靠文本输入就能够创作出高质量的视频内容。然而，我们常见的电影片段通常是由导演在一个场景中精心布置多个目标的运动、摄像机拍摄角度后再剪辑而成的
阅读全文
机器人的「物理图灵测试」，英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law
作者：机器之心发布日期：2025-05-10 11:42:33
机器之心报道编辑：张倩、PandaJim Fan，英伟达机器人部门主管和杰出科学家、GEAR 实验室联合领导人、OpenAI 的首位实习生，最近在红杉资本主办的 AI Ascent 上做了一场 17
阅读全文
9年实现爱因斯坦级AGI？OpenAI科学家Dan Roberts谈强化学习扩展的未来
作者：机器之心发布日期：2025-05-10 11:42:33
机器之心报道编辑：陈萍、Panda近日，在红杉资本主办的 AI Ascent 上，OpenAI 研究科学家 Dan Roberts 做了主题为「接下来的未来 / 扩展强化学习」的演讲，其上传到 You
阅读全文
Harmon：协调视觉表征，统一多模态理解和生成（模型已开源）
作者：机器之心发布日期：2025-05-10 11:42:33
吴思泽，南洋理工大学MMLab@NTU四年级博士生，导师是Chen Change Loy，研究方向为基于多模态模型的视觉理解和生成、开放世界的检测分割等，在ICCV/CVPR/ICLR等顶级学术会议上
阅读全文
只有通过海量测试才能抓住泛化性的本质吗？
作者：机器之心发布日期：2025-05-10 11:42:33
本文第一作者为上海交通大学博士生程磊，指导老师为上海交通大学张拳石教授。当以端到端黑盒训练为代表的深度学习深陷低效 Scaling Law 而无法自拔时，我们是否可以回到起点重看模型表征本身——究竟什
阅读全文
在人流如织的大街小巷，这家公司的机器人正跑着自己的「马拉松」
作者：机器之心发布日期：2025-05-09 12:19:29
机器之心原创作者：张倩前段时间，在北京亦庄举办的「人形机器人半程马拉松」活动引发全民热议。有人对机器人在赛事中展现出的耐力和稳定性表示赞赏；当然，也有人因机器人频繁摔倒、出状况而感到失望，毕竟，这和短
阅读全文
KuaiMod来了！快手用大模型重构短视频生态格局
作者：机器之心发布日期：2025-05-09 12:19:29
机器之心发布机器之心编辑部在短视频成为亿万用户日常生活标配的当下，它不仅是一种娱乐方式，更是人们获取信息、表达观点、构建社交的主要媒介。随着内容量的井喷式增长，平台面临着前所未有的挑战：一方面，需要更
阅读全文
「ChatGPT+GitHub」，OpenAI搞了个大联合
作者：机器之心发布日期：2025-05-09 12:19:29
机器之心报道机器之心编辑部从此以后，ChatGPT 可以帮你分析 GitHub 了。现在，ChatGPT 可以直接连接 GitHub 了，解锁 Deep Research 超强技能！使用起来非常简单，
阅读全文
手机、PC更强大脑来了！联想个人超级智能体，开始觉醒L3级智能水平
作者：机器之心发布日期：2025-05-09 12:19:29
机器之心报道编辑：杜伟从天禧到城市中枢，联想用超级智能体重塑个人、企业、城市AI格局。2025 年的 AI 圈，你要说最火的是什么？推理模型是一个，尤以国产 DeepSeek-R1 为代表；另一个要属
阅读全文
原来，AI也有「搜商」高低的差别？
作者：机器之心发布日期：2025-05-08 13:51:09
机器之心原创作者：Panda五一假期刚过，相信不少人已经在朋友圈的「人海直播」中深刻体会到了一个真理：出门旅游，光靠一腔热情远远不够。翻了三十个小红书帖子，打开十几个 App 对比攻略，还没出发脑子就
阅读全文
2025年第二届「兴智杯」全国人工智能创新应用大赛正式启动，线上报名开启
作者：机器之心发布日期：2025-05-08 13:51:09
机器之心发布机器之心编辑部2025 年 5 月 8 日上午，第二届 “兴智杯” 全国人工智能创新应用大赛正式启动。前期，工业和信息化部、科学技术部、深圳市人民政府共同主办了首届 “兴智杯” 全国人工智
阅读全文
时隔两月，Mistral AI终于上新Medium 3，近期还有「One more thing」
作者：机器之心发布日期：2025-05-08 13:51:09
机器之心报道编辑：蛋酱、张倩时隔两月，Mistral AI 终于又上新了。「今天，我们欣喜地宣布推出 Mistral Medium 3，进一步提升语言模型的效率和可用性。」据官方博客介绍，Mistra
阅读全文
ICML 2025 | 清华、上海AI Lab等提出傅里叶位置编码，多项任务远超RoPE
作者：机器之心发布日期：2025-05-08 13:51:09
长文本能力对语言模型（LM，Language Model）尤为重要，试想，如果 LM 可以处理无限长度的输入文本，我们可以预先把所有参考资料都喂给 LM，或许 LM 在应对人类的提问时就会变得无所不能
阅读全文
机器人界「Sora」来了！清华、星动纪元开源首个AIGC机器人大模型，入选ICML2025 Spotlight
作者：机器之心发布日期：2025-05-07 12:34:18
机器之心发布机器之心编辑部从 2023 年的 Sora 到如今的可灵、Vidu、通义万相，AIGC 生成式技术的魔法席卷全球，打开了 AI 应用落地的大门。无独有偶，AIGC 生成式技术同样在具身智能
阅读全文
搞不懂CUDA的人有救了，Devin开发商开源Kevin，强化学习生成CUDA内核
作者：机器之心发布日期：2025-05-07 12:34:18
机器之心报道编辑：蛋酱、泽南本周三，知名 AI 创业公司，曾发布「全球首个 AI 软件工程师」的 Cognition AI 开源了一款使用强化学习，用于编写 CUDA 内核的大模型 Kevin-32B
阅读全文
OTC‑PO重磅发布 | 揭开 o3 神秘面纱，让 Agent 少用工具、多动脑子！
作者：机器之心发布日期：2025-05-07 12:34:18
王鸿儒目前就读于香港中文大学博士四年级（预计今年7月毕业），导师为黄锦辉教授，研究方向主要包括对话系统，工具学习以及大语言模型智能体等，英国爱丁堡大学和美国伊利诺伊大学香槟分校(UIUC)访问学者，
阅读全文
万字长文带你读懂强化学习，去中心化强化学习又能否实现？
作者：机器之心发布日期：2025-05-07 12:34:18
选自 Symbolic Capital作者：Sam Lehman机器之心编译强化学习（RL）是当今 AI 领域最热门的词汇之一。近日，一篇长文梳理了新时代的强化学习范式对于模型提升的作用，同时还探索了
阅读全文
陶哲轩：感谢ChatGPT，4小时独立完成了一个开源项目
作者：机器之心发布日期：2025-05-06 12:11:39
机器之心报道编辑：蛋酱、陈陈这个五一假期，世界顶级数学家是如何度过的？菲尔兹奖得主陶哲轩，似乎是忙着发布自己的开源项目：「我在大模型的协助下编写了一个概念验证软件工具，用于验证涉及任意正参数的给定估计
阅读全文
VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika
作者：机器之心发布日期：2025-05-06 12:11:39
机器之心发布机器之心编辑部随着 Deepseek 等强推理模型的成功，强化学习在大语言模型训练中越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的视频
阅读全文
GPT-4o图像生成的「核燃料」找到了！万字长文拆解潜在变量，网友：原来AI在另一个维度作画
作者：机器之心发布日期：2025-05-06 12:11:39
选自Sander Dieleman博客机器之心编译编辑：刘欣上个月， GPT-4o 的图像生成功能爆火，掀起了以吉卜力风为代表的广泛讨论，生成式 AI 的热潮再次席卷网络。而在这股浪潮背后，潜在空间（
阅读全文