机器之心

AI应用元年，这场标杆赛事见证了中国创新速度与野心
作者：机器之心发布日期：2025-09-10 12:00:02
机器之心原创编辑：吴昕一场关于未来金融智能的集体预演，见证了创业者们的冲刺，也折射出一个行业的进化。2025 年的 AI ，正在上演「双线长跑」。一端是大模型底层的持续进化，远未触顶；另一端是场景应用
阅读全文
AI胡说八道这事，终于有人管了？
作者：机器之心发布日期：2025-09-10 12:00:02
机器之心报道编辑：+0、张倩想象一下，如果 ChatGPT 等 AI 大模型在生成的时候，能把自己不确定的地方都标记出来，你会不会对它们生成的答案放心很多？上周末，OpenAI 发的一篇论文引爆了社区
阅读全文
人人都能炼专属Agent，上海交大开源端侧Agent全栈工具链，真实场景性能超GPT-5！
作者：机器之心发布日期：2025-09-10 12:00:02
打开手机，让 AI Agent 自动帮你完成订外卖、订酒店、网上购物的琐碎任务，这正成为智能手机交互的新范式。一个能自主处理大部分日常任务的个人专属智能体，正在从科幻走进现实。然而，通往 “解放双手”
阅读全文
文心新出的推理大模型，给了我们信心
作者：机器之心发布日期：2025-09-09 19:43:45
机器之心报道机器之心编辑部当下的大语言模型，不怕它搞不定，就怕它胡说八道：有「幻觉」存在，我们经常会下意识地不信任 AI 输出的结果。就在上周，OpenAI 的论文《Why Language Mode
阅读全文
SFT远不如RL？永不过时的剃刀原则打开「终身学习」大模型训练的大门
作者：机器之心发布日期：2025-09-09 19:43:45
机器之心报道编辑：冷猫我们已经进入了大模型时代，越来越多的应用依赖大模型的能力，可以说大模型已经成为智能化基础设施的核心组成部分，支撑着语言，视觉分析，智能驾驶，机器人等各种下游应用。在大模型的实际使
阅读全文
从第一性原理出发的RAG推理新范式来了，蚂蚁DIVER登顶权威基准
作者：机器之心发布日期：2025-09-09 19:43:45
在当前由大语言模型（LLM）驱动的技术范式中，检索增强生成（RAG）已成为提升模型知识能力与缓解「幻觉」的核心技术。然而，现有 RAG 系统在面对需多步逻辑推理任务时仍存在显著局限，具体挑战如下：表面
阅读全文
全球图生视频榜单第一，爱诗科技PixVerse V5如何改变一亿用户的视频创作
作者：机器之心发布日期：2025-09-08 14:19:27
机器之心原创作者：冷猫好玩好用的明星视频生成产品再更新，用户操作基础，模型技术就不基础。熟悉生成领域的读者们最近都被谷歌的一只纳米香蕉 nano-banana 刷了屏。在图像生成领域，纳米香蕉在短期内
阅读全文
扎克伯格的豪赌初见成效？Meta新方法让LLM长上下文处理提速30倍
作者：机器之心发布日期：2025-09-08 14:19:27
机器之心报道编辑：+0，冷猫经历了前段时间的鸡飞狗跳，扎克伯格的投资似乎终于初见成效。近期，Meta Superintelligence Labs 联合提出了一个名为 REFRAG 的高效解码框架，旨
阅读全文
具身VLA后训练：TeleAI提出潜空间引导的VLA跨本体泛化方法
作者：机器之心发布日期：2025-09-08 14:19:27
在多模态大模型的基座上，视觉 - 语言 - 动作（Visual-Language-Action, VLA）模型使用大量机器人操作数据进行预训练，有望实现通用的具身操作能力。然而，现有 VLA 基座模型
阅读全文
国内外AI大厂重押，初创梭哈，谁能凭「记忆」成为下一个「DeepSeek」？
作者：机器之心发布日期：2025-09-07 13:10:24
机器之心报道作者：Youli谁率先让模型拥有「记忆」，谁就掌握主动权。「记忆」会是引爆新一轮 AI 浪潮的最后一块拼图吗？如果时间往前推半年或四五个月，业界对于这一问题可能都是疑惑、不解：彼时 Dee
阅读全文
斯坦福：优化器「诸神之战」？AdamW 凭「稳定」胜出
作者：机器之心发布日期：2025-09-07 13:10:24
机器之心报道机器之心编辑部自 2014 年提出以来，Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位，帮助模型在海量数据下保持稳定并实现较快收敛。随着模型规模迅速扩大，预训练
阅读全文
字节跳动Seed推出「机器人大脑」Robix：让机器人学会思考、规划与灵活互动
作者：机器之心发布日期：2025-09-07 13:10:24
近日，字节跳动 Seed 团队发布了最新的机器人研究成果——Robix，一个旨在提升机器人思考、规划与灵活交互能力的「机器人大脑」。标题：Robix: A Unified Model for Robo
阅读全文
OpenAI罕见发论文：我们找到了AI幻觉的罪魁祸首
作者：机器之心发布日期：2025-09-06 11:11:15
机器之心报道编辑：PandaAI 最臭名昭著的 Bug 是什么？不是代码崩溃，而是「幻觉」—— 模型自信地编造事实，让你真假难辨。这个根本性挑战，是阻碍我们完全信任 AI 的关键障碍。大模型会有幻觉，
阅读全文
00后以1.1亿美金「掀桌」，硅谷AI将书写影视新传奇终结制片旧时代
作者：机器之心发布日期：2025-09-06 11:11:15
机器之心发布机器之心编辑部最年轻的工程师，和团队一起将产品卖给 Fortune 500 的客户，从 0 带到 10。她，22 岁，成立自己的公司 —— Cybever, 以「用 AI 生成高精度 3D
阅读全文
任意骨骼系统的模型都能驱动？AnimaX提出基于世界模型的3D动画生成新范式
作者：机器之心发布日期：2025-09-06 11:11:15
本文的主要作者来自北京航空航天大学、清华大学、香港大学和 VAST。本文的第一作者为北京航空航天大学硕士生黄泽桓。本文的通讯作者为北京航空航天大学盛律教授与 VAST 公司首席科学家曹炎培博士。在游戏
阅读全文
Nano Banana爆火之后，一个神秘的「胡萝卜」代码模型又上线了
作者：机器之心发布日期：2025-09-05 12:28:02
机器之心报道机器之心编辑部以前，每当上线一个新模型，大家总要绞尽脑汁想个响亮又不撞车的名字。不得不说，有时候名字起得太出彩，甚至能把模型本身给卷下去。别人还没搞懂它能干嘛，名字已经在朋友圈刷屏了。不过
阅读全文
沉寂一个月，openPangu性能飙升8%！华为1B开源模型来了
作者：机器之心发布日期：2025-09-05 12:28:02
机器之心发布机器之心编辑部在端侧 AI 这个热门赛道，华为盘古大模型扔下了一颗 “重磅炸弹” 。如今，云端大模型已经能侃侃而谈、答疑解惑。但如果这些 AI 大脑能被装进手机、摄像头甚至无人机，会带来怎
阅读全文
多模态大模型持续学习系列研究，综述+Benchmark+方法+Codebase一网打尽！
作者：机器之心发布日期：2025-09-05 12:28:02
本系列工作核心作者：郭海洋（自动化所博士生）、朱飞（中科院香港院AI中心AP）、曾繁虎（自动化所硕士生）、刘文卓（自动化所博士生）、赵宏博（自动化所博士生）。通讯作者为自动化所博士生
阅读全文
长视频AI数字人来了！字节×浙大推出商用级音频驱动数字人模型InfinityHuman
作者：机器之心发布日期：2025-09-04 12:07:43
机器之心发布机器之心编辑部随着内容创作智能化需求的爆发，长时长、高质量数字人视频生成始终是行业痛点。近日，字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型 ——In
阅读全文
全奖读AI！人工智能专业排名全球前10的MBZUAI启动本硕博项目招生
作者：机器之心发布日期：2025-09-04 12:07:43
机器之心发布机器之心编辑部在阿联酋 2031 国家人工智能战略的驱动下，穆罕默德・本・扎耶德人工智能大学（MBZUAI）正以 AI 专业学术全球排名前十的硬实力，重塑 AI 教育格局。这所由阿联酋总
阅读全文
SIGCOMM 2025｜重新定义个性化视频体验，快手与清华联合提出灵犀系统
作者：机器之心发布日期：2025-09-04 12:07:43
近日，快手与清华大学孙立峰团队联合发表论文《Towards User-level QoE: Large-scale Practice in Personalized Optimization of A
阅读全文
从复刻魔术开始，RoboMirage打开了机器人仿真的新世界
作者：机器之心发布日期：2025-09-03 12:30:00
机器之心发布RoboScience在具身智能的发展路径中，如何获得海量且高质量的数据是行业绕不开的核心问题。如果说大语言模型依赖于互联网规模的语料库，那么具身智能的成长同样需要规模化的交互经验。现实中
阅读全文
宇树科技官宣：年内提交IPO，或将冲刺科创板
作者：机器之心发布日期：2025-09-03 12:30:00
机器之心报道机器之心编辑部宇树的上市进程，终于又向前迈进了一步。9 月 2 日晚间，杭州宇树科技股份有限公司（简称「宇树科技」）发布声明说，预计于今年四季度向证券交易所提交上市申请文件，立即引来了大量
阅读全文
其实，扩散语言模型在最终解码之前很久，就已确定最终答案
作者：机器之心发布日期：2025-09-03 12:30:00
机器之心报道编辑：陈萍随着扩散语言模型（DLM）在各个领域的快速发展，其已成为自回归（AR）模型有力的替代方案。与 AR 模型相比，DLMs 的主要优势包括但不限于：高效的并行解码和灵活的生成顺序。尽
阅读全文
语音分离最全综述来了！清华等团队深度分析200+文章，系统解析「鸡尾酒会问题」研究
作者：机器之心发布日期：2025-09-03 12:30:00
语音分离领域针对具有挑战性的 “鸡尾酒会问题”，随着深度神经网络 (DNN) 的发展，该领域取得了革命性的进展。语音分离可以用于独立应用，在复杂的声学环境中提高语音清晰度。此外，它还可以作为其他语音处
阅读全文
冲上热搜！美团大模型，靠「快」火了
作者：机器之心发布日期：2025-09-02 11:41:23
机器之心原创编辑：张倩、陈陈国内外开发者：亲测，美团新开源的模型速度超快！当 AI 真的变得像水和电一样普及之后，模型强不强已经不是大家唯一关心的问题了。从年初的 Claude 3.7 Sonnet、
阅读全文
DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？
作者：机器之心发布日期：2025-09-02 11:41:23
机器之心报道编辑：杜伟、+0这几天，一篇关于向量嵌入（Vector Embeddings）局限性的论文在 AlphaXiv 上爆火，热度飙升到了近 9000。要理解这篇论文的重要性，我们先简单回顾一下
阅读全文
AI读网页，这次真不一样了，谷歌Gemini解锁「详解网页」新技能
作者：机器之心发布日期：2025-09-02 11:41:23
机器之心报道机器之心编辑部谷歌回归搜索老本行，这一次，它要让 AI 能像人一样「看见」网页。这是谷歌前不久在 Gemini API 全面上线的 URL Context 功能（5 月 28 日已在 Go
阅读全文
性能逼近闭源最强，通义实验室开源Mobile-Agent-v3刷新10项GUI基准SOTA
作者：机器之心发布日期：2025-09-02 11:41:23
覆盖桌面、移动和 Web，7B 模型超越同类开源选手，32B 模型挑战 GPT-4o 与 Claude 3.7，通义实验室全新 Mobile-Agent-v3 现已开源。一眼看到实力：关键成绩速览。备
阅读全文
首个为具身智能而生的大规模强化学习框架RLinf！清华、北京中关村学院、无问芯穹等重磅开源
作者：机器之心发布日期：2025-09-01 10:46:08
机器之心报道机器之心编辑部清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf：首个面向具身智能的“渲训推一体化”大规模强化学习框架。人工智能正在经历从 “感知” 到 “行动”
阅读全文