打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点
机器之心报道机器之心编辑部3D Gaussian Splatting (3DGS) 是一种日益流行的新视角合成方法,给定 3D 场景的一组带位姿的图像(即带有位置和方向的图像),3DGS 会迭代训练一
阅读全文机器之心报道机器之心编辑部3D Gaussian Splatting (3DGS) 是一种日益流行的新视角合成方法,给定 3D 场景的一组带位姿的图像(即带有位置和方向的图像),3DGS 会迭代训练一
阅读全文复旦⼤学、上海创智学院与新加坡国立⼤学联合推出全模态端到端操作⼤模型 RoboOmni,统⼀视觉、⽂本、听觉与动作模态,实现动作⽣成与语⾳交互的协同控制。开源 140K 条语⾳ - 视觉 - ⽂字「情
阅读全文临床诊断并非一次性的「快照」,而是一场动态交互、不断「探案」的推理过程。然而,当下的大模型大多基于静态数据训练,难以掌握真实诊疗中充满不确定性的多轮决策轨迹。如何让AI学会「追问」、选择检查,并一步步
阅读全文机器之心发布机器之心编辑部近期,阿里巴巴 ROLL 团队(淘天未来生活实验室与阿里巴巴智能引擎团队)联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构(Asynchronou
阅读全文在 NeurIPS 2025 论文中,来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST(Vision-centric Token Compression in
阅读全文机器之心发布机器之心编辑部当 AI 大潮席卷全球,智能机器人产业正站在发展的关键节点 —— 未来发展方向何在?产业要素如何协同?全要素、全产业链的生态如何构建?这场关乎产业未来发展的深度求索,即将在上
阅读全文在 AI 技术飞速发展的今天,如何高效地将多个专业模型的能力融合到一个通用模型中,是当前大模型应用面临的关键挑战。全量微调领域已经有许多开创性的工作,但是在高效微调领域,尚未有对模型合并范式清晰的指引
阅读全文机器之心报道编辑:杜伟、+0「Baidu is back」,在业界权威大模型公共基准测试平台 LMArena 发布最新一期文本竞技场排名(Text Arena)之后,有人发出了这样的惊呼。根据 11
阅读全文机器之心报道机器之心编辑部近期,HuggingFace 发布的超过 200 页的超长技术博客,系统性地分享训练先进 LLM 的端到端经验。博客的重点是 LLM 开发过程中「混乱的现实」。它坦诚地记录了
阅读全文我们对世界的理解,越来越依赖计算。从药物、蛋白质设计到新材料发现,科学家们希望在计算机里「虚拟实验」出物质的性质。要做到这一点,就必须准确地模拟原子中,核、电子之间的相互作用。如果计算的精度不够,一种
阅读全文作者为 Griffith Unversity 的刘奕鑫,李世源,潘世瑞,National University of Singapore 的张桂彬,和 Nanyang Technological Un
阅读全文机器之心发布机器之心编辑部当 Sora 2、Google Veo 3 还在卷短视频逼真度,AI 影视的下一站该是长片叙事了?在 AI 视频生成技术日新月异的今天,主流模型如 Sora 2、Google
阅读全文机器之心报道编辑:Panda刚刚,OpenHands 开发团队发布了一篇新论文,正式宣布广受欢迎的软件开发智能体框架 OpenHands (GitHub star 已超 6.4 万)中的智能体组件完成
阅读全文作者彭若天是西湖大学和浙江大学联培博士生,任毅是不列颠哥伦比亚大学博士,郁昼亮是香港中文大学博士生,刘威杨是香港中文大学计算机系助理教授,温研东是西湖大学人工智能系助理教授随着 Deepseek-R1
阅读全文机器之心报道作者:泽南Agentic AI,从来没有这么简单过。刚刚,在 2025 全球计算大会(CGC 2025)上,华为云打出了一套 AI 时代技术落地的组合拳。今年是 AI 大模型的落地关键年。
阅读全文机器之心报道机器之心编辑部刚刚,PyTorch 之父 Soumith Chintala 宣布将于 11 月 17 日正式离开 Meta,结束他长达 11 年的职业旅程。「我不想一辈子都做 PyTorc
阅读全文在大语言模型快速发展的今天,“记忆”正成为智能体能否真正具备长期智能的关键。即使是支持百万级上下文的GPT-4.1,当交互持续增长时,成本和延迟依然会呈指数级上升。于是,外部记忆系统应运而生——然而,
阅读全文本文来自于香港中文大学 MMLab 和 vivo AI Lab,其中论文第一作者肖涵,主要研究方向为多模态大模型和智能体学习,合作作者王国志,研究方向为多模态大模型和 Agent 强化学习。项目 le
阅读全文机器之心原创作者:张倩这周一,一张神秘海报在科技圈引发热议。「高德要造车了?」「高德要造飞行汽车?」「高德要推出自己的无人驾驶 / 高级辅助驾驶?」一夜之间,社交媒体上出现了对于这张海报的各种解读。这
阅读全文机器之心报道机器之心编辑部要投 ICML 2026 顶会的小伙伴需要注意了,论文征集有了新规,包括但不限于:论文被接收的作者可选择是否参会;已接收论文的原始提交版本将被公开;互审论文的数量有了限制。I
阅读全文全模态智能,英伟达的下一步你是否想过,未来的 AI 将会是什么样子?是只会打字的 Chat Bot,只会看图的 VLM,还是只能分辨声音的 ALM?都不是! 真正的智能,应该像我们人类一样,能够同时看
阅读全文本文由北京中关村学院、哈尔滨工业大学、中科院自动化所等多家单位作者共同完成,第一作者为北京中关村学院与哈尔滨工业大学联培博士生俞斌,指导教师包括:哈尔滨工业大学教授 & 哈工大青岛研究院院长王佰玲,北
阅读全文机器之心原创编辑:吴昕、冷猫这年头,AI 创造的视觉世界真是炫酷至极。但真要跟细节较真儿,这些大模型的「眼力见儿」可就让人难绷了。比如,我让它画「一只穿红外套的猫,站在一辆蓝色跑车左边,蓝色跑车后面是
阅读全文机器之心报道机器之心编辑部一直以来,关于人工生命(Artificial Life, ALife)的研究致力于回答这样一个问题:生命的复杂性能否在计算系统中自然涌现?这一探索的核心目标,被称为开放式复杂
阅读全文本文的作者来自清华大学、北京大学、武汉大学和上海交通大学,主要作者为清华大学硕士生袁承博、武汉大学本科生周睿和北京大学博士生刘梦真,通讯作者为清华大学交叉信息研究院的高阳助理教授。近期,Google
阅读全文扩散大语言模型得到了突飞猛进的发展,早在 25 年 2 月 Inception Labs 推出 Mercury—— 第一个商业级扩散大型语言模型,同期人民大学发布第一个开源 8B 扩散大语言模型 LL
阅读全文机器之心原创编辑:杜伟视频生成快速演进的脚步仍未停歇,就在今天,昆仑万维的新动作又一次突破行业想象。上个月,AI 视频赛道风起云涌,业界资深玩家纷纷抛下「重磅炸弹」。国外 OpenAI 祭出 Sor
阅读全文机器之心报道机器之心编辑部现代 LLM 通常依赖显式的文本生成过程(例如「思维链」)来进行「思考」训练。这种策略将推理任务推迟到训练后的阶段,未能充分挖掘预训练数据中的潜力。为解决这一问题,字节 Se
阅读全文大模型推理到底要不要「长篇大论」?过去一年,OpenAI o 系列、DeepSeek-R1、Qwen 等一系列推理模型,把「长链思维」玩到极致:答案更准了,但代价是推理链越来越长、Token 消耗爆炸
阅读全文本文作者包括新加坡国立大学的王天一 (第一作者)、程轩昂、Mohan Kankanhalli (通讯作者),和山东大学的刘明慧。工作动机近些年来,针对深度伪造 (Deepfake) 的主动防御研究角度
阅读全文