机器之心

刚刚，豆包编程模型来了，我们用四个关卡考了考它！
作者：机器之心发布日期：2025-11-11 16:37:16
机器之心报道编辑：PandaAI 编程助手，人人都爱。从补全一行代码到生成整个函数，它们极大地改变了我们的开发工作流，就连曾经对它们嗤之以鼻的 Linus Torvalds 也改变了想法。他在近日一次
阅读全文
打破显存墙：谢赛宁团队提出CLM，单卡RTX 4090「撬动」1亿高斯点
作者：机器之心发布日期：2025-11-11 16:37:16
机器之心报道机器之心编辑部3D Gaussian Splatting (3DGS) 是一种日益流行的新视角合成方法，给定 3D 场景的一组带位姿的图像（即带有位置和方向的图像），3DGS 会迭代训练一
阅读全文
从VLA到RoboOmni，全模态具身新范式让机器人察言观色、听懂话外音
作者：机器之心发布日期：2025-11-11 16:37:16
复旦⼤学、上海创智学院与新加坡国立⼤学联合推出全模态端到端操作⼤模型 RoboOmni，统⼀视觉、⽂本、听觉与动作模态，实现动作⽣成与语⾳交互的协同控制。开源 140K 条语⾳ - 视觉 - ⽂字「情
阅读全文
上交×蚂蚁发布 DiagGym：以世界模型驱动交互式医学诊断智能体
作者：机器之心发布日期：2025-11-11 16:37:16
临床诊断并非一次性的「快照」，而是一场动态交互、不断「探案」的推理过程。然而，当下的大模型大多基于静态数据训练，难以掌握真实诊疗中充满不确定性的多轮决策轨迹。如何让AI学会「追问」、选择检查，并一步步
阅读全文
3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化
作者：机器之心发布日期：2025-11-10 12:37:07
机器之心发布机器之心编辑部近期，阿里巴巴 ROLL 团队（淘天未来生活实验室与阿里巴巴智能引擎团队）联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构（Asynchronou
阅读全文
与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本
作者：机器之心发布日期：2025-11-10 12:37:07
在 NeurIPS 2025 论文中，来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST（Vision-centric Token Compression in
阅读全文
2025宝山・智能机器人产业大会暨嘉年华启动在即
作者：机器之心发布日期：2025-11-10 12:37:07
机器之心发布机器之心编辑部当 AI 大潮席卷全球，智能机器人产业正站在发展的关键节点 —— 未来发展方向何在？产业要素如何协同？全要素、全产业链的生态如何构建？这场关乎产业未来发展的深度求索，即将在上
阅读全文
NeurIPS2025 Spotlight | RobustMerge: 多模态大模型高效微调模型合并的全新范式
作者：机器之心发布日期：2025-11-10 12:37:07
在 AI 技术飞速发展的今天，如何高效地将多个专业模型的能力融合到一个通用模型中，是当前大模型应用面临的关键挑战。全量微调领域已经有许多开创性的工作，但是在高效微调领域，尚未有对模型合并范式清晰的指引
阅读全文
全球第二、国内第一！最强文本的文心5.0 Preview一手实测来了
作者：机器之心发布日期：2025-11-09 19:46:26
机器之心报道编辑：杜伟、+0「Baidu is back」，在业界权威大模型公共基准测试平台 LMArena 发布最新一期文本竞技场排名（Text Arena）之后，有人发出了这样的惊呼。根据 11
阅读全文
HuggingFace发布超200页「实战指南」，从决策到落地「手把手」教你训练大模型
作者：机器之心发布日期：2025-11-09 19:46:26
机器之心报道机器之心编辑部近期，HuggingFace 发布的超过 200 页的超长技术博客，系统性地分享训练先进 LLM 的端到端经验。博客的重点是 LLM 开发过程中「混乱的现实」。它坦诚地记录了
阅读全文
大规模高精度量子化学模拟新范式：字节最新成果入选Nature子刊
作者：机器之心发布日期：2025-11-09 19:46:26
我们对世界的理解，越来越依赖计算。从药物、蛋白质设计到新材料发现，科学家们希望在计算机里「虚拟实验」出物质的性质。要做到这一点，就必须准确地模拟原子中，核、电子之间的相互作用。如果计算的精度不够，一种
阅读全文
IEEE | LLM Agent的能力边界在哪？首篇「图智能体 (GLA)」综述为复杂系统构建统一蓝图
作者：机器之心发布日期：2025-11-09 19:46:26
作者为 Griffith Unversity 的刘奕鑫，李世源，潘世瑞，National University of Singapore 的张桂彬，和 Nanyang Technological Un
阅读全文
Utopai联手LG、中东主权基金加码韩娱，新模型颠覆AI视频格局！
作者：机器之心发布日期：2025-11-08 11:59:07
机器之心发布机器之心编辑部当 Sora 2、Google Veo 3 还在卷短视频逼真度，AI 影视的下一站该是长片叙事了？在 AI 视频生成技术日新月异的今天，主流模型如 Sora 2、Google
阅读全文
6.4万star的开源智能体框架全面重构！OpenHands重大升级，叫板OpenAI和谷歌
作者：机器之心发布日期：2025-11-08 11:59:07
机器之心报道编辑：Panda刚刚，OpenHands 开发团队发布了一篇新论文，正式宣布广受欢迎的软件开发智能体框架 OpenHands （GitHub star 已超 6.4 万）中的智能体组件完成
阅读全文
SimKO：缓解RLVR训练中的概率过度集中，优化pass@K性能
作者：机器之心发布日期：2025-11-08 11:59:07
作者彭若天是西湖大学和浙江大学联培博士生，任毅是不列颠哥伦比亚大学博士，郁昼亮是香港中文大学博士生，刘威杨是香港中文大学计算机系助理教授，温研东是西湖大学人工智能系助理教授随着 Deepseek-R1
阅读全文
华为云的组合新范式，引爆了Agentic AI应用革命
作者：机器之心发布日期：2025-11-07 15:14:16
机器之心报道作者：泽南Agentic AI，从来没有这么简单过。刚刚，在 2025 全球计算大会（CGC 2025）上，华为云打出了一套 AI 时代技术落地的组合拳。今年是 AI 大模型的落地关键年。
阅读全文
没有内斗，Meta也没能留住PyTorch之父
作者：机器之心发布日期：2025-11-07 15:14:16
机器之心报道机器之心编辑部刚刚，PyTorch 之父 Soumith Chintala 宣布将于 11 月 17 日正式离开 Meta，结束他长达 11 年的职业旅程。「我不想一辈子都做 PyTorc
阅读全文
强化学习+大模型记忆：Mem-α，让智能体第一次学会“如何记忆”
作者：机器之心发布日期：2025-11-07 15:14:16
在大语言模型快速发展的今天，“记忆”正成为智能体能否真正具备长期智能的关键。即使是支持百万级上下文的GPT-4.1，当交互持续增长时，成本和延迟依然会呈指数级上升。于是，外部记忆系统应运而生——然而，
阅读全文
vivo AI Lab提出自我进化的移动GUI智能体，UI-Genie无需人工标注实现性能持续提升
作者：机器之心发布日期：2025-11-07 15:14:16
本文来自于香港中文大学 MMLab 和 vivo AI Lab，其中论文第一作者肖涵，主要研究方向为多模态大模型和智能体学习，合作作者王国志，研究方向为多模态大模型和 Agent 强化学习。项目 le
阅读全文
从扫街榜到Robotaxi，空间智能彻底打开了高德的想象空间
作者：机器之心发布日期：2025-11-06 13:25:37
机器之心原创作者：张倩这周一，一张神秘海报在科技圈引发热议。「高德要造车了？」「高德要造飞行汽车？」「高德要推出自己的无人驾驶 / 高级辅助驾驶？」一夜之间，社交媒体上出现了对于这张海报的各种解读。这
阅读全文
ICML 2026新规「避坑」指南：参会非必须、原稿将公开、互审设上限
作者：机器之心发布日期：2025-11-06 13:25:37
机器之心报道机器之心编辑部要投 ICML 2026 顶会的小伙伴需要注意了，论文征集有了新规，包括但不限于：论文被接收的作者可选择是否参会；已接收论文的原始提交版本将被公开；互审论文的数量有了限制。I
阅读全文
开源即爆火！英伟达重磅推出OmniVinci全模态大模型
作者：机器之心发布日期：2025-11-06 13:25:37
全模态智能，英伟达的下一步你是否想过，未来的 AI 将会是什么样子？是只会打字的 Chat Bot，只会看图的 VLM，还是只能分辨声音的 ALM？都不是！真正的智能，应该像我们人类一样，能够同时看
阅读全文
扩展外部测试时Scaling Law，中关村学院新发现：轻量级验证器可解锁LLM推理最优选择
作者：机器之心发布日期：2025-11-06 13:25:37
本文由北京中关村学院、哈尔滨工业大学、中科院自动化所等多家单位作者共同完成，第一作者为北京中关村学院与哈尔滨工业大学联培博士生俞斌，指导教师包括：哈尔滨工业大学教授 & 哈工大青岛研究院院长王佰玲，北
阅读全文
中英双语、29项第一、像素级理解：360 FG-CLIP2登顶全球最强图文跨模态模型
作者：机器之心发布日期：2025-11-05 12:12:44
机器之心原创编辑：吴昕、冷猫这年头，AI 创造的视觉世界真是炫酷至极。但真要跟细节较真儿，这些大模型的「眼力见儿」可就让人难绷了。比如，我让它画「一只穿红外套的猫，站在一辆蓝色跑车左边，蓝色跑车后面是
阅读全文
数字生命「培养皿」里，AI竟然学会了打架、结盟、抢地盘
作者：机器之心发布日期：2025-11-05 12:12:44
机器之心报道机器之心编辑部一直以来，关于人工生命（Artificial Life, ALife）的研究致力于回答这样一个问题：生命的复杂性能否在计算系统中自然涌现？这一探索的核心目标，被称为开放式复杂
阅读全文
清北联合推出Motion Transfer，比肩Gemini Robotics，让机器人直接从人类数据中端到端学习技能
作者：机器之心发布日期：2025-11-05 12:12:44
本文的作者来自清华大学、北京大学、武汉大学和上海交通大学，主要作者为清华大学硕士生袁承博、武汉大学本科生周睿和北京大学博士生刘梦真，通讯作者为清华大学交叉信息研究院的高阳助理教授。近期，Google
阅读全文
用更一致的轨迹、更少的解码步数「驯服」掩码扩散语言模型，扩散语言模型的推理性能和效率大幅提升
作者：机器之心发布日期：2025-11-05 12:12:44
扩散大语言模型得到了突飞猛进的发展，早在 25 年 2 月 Inception Labs 推出 Mercury—— 第一个商业级扩散大型语言模型，同期人民大学发布第一个开源 8B 扩散大语言模型 LL
阅读全文
刚刚，AI视频的天花板被掀翻！测完SkyReels后飘了：我亦有成为专业导演的潜质
作者：机器之心发布日期：2025-11-04 11:42:23
机器之心原创编辑：杜伟视频生成快速演进的脚步仍未停歇，就在今天，昆仑万维的新动作又一次突破行业想象。上个月，AI 视频赛道风起云涌，业界资深玩家纷纷抛下「重磅炸弹」。国外 OpenAI 祭出 Sor
阅读全文
字节Seed团队发布循环语言模型Ouro，在预训练阶段直接「思考」，Bengio署名
作者：机器之心发布日期：2025-11-04 11:42:23
机器之心报道机器之心编辑部现代 LLM 通常依赖显式的文本生成过程（例如「思维链」）来进行「思考」训练。这种策略将推理任务推迟到训练后的阶段，未能充分挖掘预训练数据中的潜力。为解决这一问题，字节 Se
阅读全文
英伟达帮你省钱，让大模型推理「短而精」，速度快5倍
作者：机器之心发布日期：2025-11-04 11:42:23
大模型推理到底要不要「长篇大论」？过去一年，OpenAI o 系列、DeepSeek-R1、Qwen 等一系列推理模型，把「长链思维」玩到极致：答案更准了，但代价是推理链越来越长、Token 消耗爆炸
阅读全文