机器之心

不止于量化：最新综述用「时-空-构」三维视角解构KV Cache系统级优化
作者：机器之心发布日期：2026-01-16 13:06:21
随着 LLM 向 1M 上下文演进，KV cache（键值缓存）已成为制约推理服务效率的核心瓶颈。自回归生成的特性使得模型必须存储历史 token 的 key-value 状态（即 KV cache）
阅读全文
实测夸克「千问划词快捷指令」，这7个邪修Prompt，建议收藏
作者：机器之心发布日期：2026-01-15 11:48:46
编辑｜杨文新年第一天，DeepSeek 发布了一篇艰深晦涩的技术论文，不少网友直呼「看不懂」。于是，机器之心评论区出现了集体求助 AI 的一幕：有人让 AI 用八十岁老太太能听懂的方式解释，有人要求用
阅读全文
已证实！清华姚班陈立杰全职加入OpenAI，保留伯克利教职
作者：机器之心发布日期：2026-01-15 11:48:46
机器之心编辑部据机器之心求证，清华大学「姚班」校友、加州大学伯克利分校（UC Berkeley）助理教授陈立杰（Lijie Chen）已正式加入 OpenAI。知情人士透露，陈立杰此次是以全职身份加入
阅读全文
解锁任意步数文生图，港大&Adobe全新Self-E框架学会自我评估
作者：机器之心发布日期：2026-01-15 11:48:46
尽管扩散模型（Diffusion Model）与流匹配（Flow Matching）已经把文本到图像生成（Text-to-Image, T2I）推向了更高的视觉质量与可控性，但他们通常在推理时需要数十
阅读全文
继宇树后，唯一获得三家大厂押注的自变量：具身模型不是把DeepSeek塞进机器人
作者：机器之心发布日期：2026-01-14 14:25:17
编辑｜张倩国内具身智能，接下来可能是「大脑」的战场了。2026 开年，自变量机器人传出融资消息，字节、红杉出手，融资额达到 10 亿。虽然自变量是一家软硬一体的公司，但这场融资背后，真正说服投资人的可
阅读全文
Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起
作者：机器之心发布日期：2026-01-14 14:25:17
编辑｜+0站在 2026 年的开端回望，LLM 的架构之争似乎进入了一个新的微妙阶段。过去几年，Transformer 架构以绝对的统治力横扫了人工智能领域，但随着算力成本的博弈和对推理效率的极致追求
阅读全文
端到端智驾新SOTA | KnowVal：懂法律道德、有价值观的智能驾驶系统
作者：机器之心发布日期：2026-01-14 14:25:17
一个智能驾驶系统，在迈向高阶自动驾驶的过程中，应当具备何种能力？除了基础的感知、预测、规划、决策能力，如何对三维空间进行更深入的理解？如何具备包含法律法规、道德原则、防御性驾驶原则等知识？如何进行基本
阅读全文
不上云、不租卡，如何优雅地在本地微调Qwen-VL-30B？
作者：机器之心发布日期：2026-01-13 12:03:30
编辑｜Panda假如你是一个致力于将 AI 引入传统行业的工程团队。现在，你有一个问题：训练一个能看懂复杂机械图纸、设备维护手册或金融研报图表的多模态助手。这个助手不仅要能专业陪聊，更要能精准地识别图
阅读全文
OpenAI的首款硬件：是AI耳机，今年销量要冲5000万
作者：机器之心发布日期：2026-01-13 12:03:30
编辑 | 杜伟、泽南以人工智能技术闻名的 OpenAI，终于也要搞硬件了，而且一上来就是和苹果正面对标。最近，有关 OpenAI 硬件的消息越来越多。今天一早，数码博主 @智慧皮卡丘透露了关于 Ope
阅读全文
华为推出软工代码智能体SWE-Lego，解锁SFT训练极致性能
作者：机器之心发布日期：2026-01-13 12:03:30
“软工任务要改多文件、多轮工具调用，模型怎么学透？高质量训练数据稀缺，又怕轨迹含噪声作弊？复杂 RL 训练成本高，中小团队望而却步？”华为研究团队推出 SWE-Lego，仅基于监督微调（SFT）的软
阅读全文
2026年，大模型训练的下半场属于「强化学习云」
作者：机器之心发布日期：2026-01-12 12:58:19
编辑｜Panda2024 年底，硅谷和北京的茶水间里都在讨论同一个令人不安的话题：Scaling Law 似乎正在撞墙。那时候，尽管英伟达的股价还在狂飙，但多方信源显示，包括彼时备受期待的 Orion
阅读全文
顶尖AI竟输给三岁宝宝，BabyVision测试暴露多模态模型硬伤
作者：机器之心发布日期：2026-01-12 12:58:19
01｜“看懂世界” 这关，大模型还没上幼儿园过去一年，大模型在语言与文本推理上突飞猛进：论文能写、难题能解、甚至在顶级学术 / 竞赛类题目上屡屡刷新上限。但一个更关键的问题是：当问题不再能 “用语言说
阅读全文
AAAI 2026 Oral｜快手提出全新「检索数据引擎」CroPS，打破搜索信息茧房
作者：机器之心发布日期：2026-01-12 12:58:19
短视频搜索业务是向量检索在工业界最核心的应用场景之一。然而，当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据，导致系统陷入信息茧房，难以召回潜在相关的新鲜内容。针对这一问题，快手搜索团队提出了
阅读全文
不做人形、不跳舞：他家的具身智能凭什么在100+城市卖出400万杯咖啡？
作者：机器之心发布日期：2026-01-11 11:57:13
编辑｜吴昕新年刚开局，AI 行业就直接拉满强度。在 CES 这个全球科技风向标上，机器人 × AI 成了真正的主角。在拉斯维加斯的霓虹灯下，中国机器人军团走到舞台中央——不靠堆概念，而是带着订单和规模
阅读全文
挑战GRPO，英伟达提出GDPO，专攻多奖励优化
作者：机器之心发布日期：2026-01-11 11:57:13
机器之心编辑部GRPO 是促使 DeepSeek-R1 成功的基础技术之一。最近一两年，GRPO 及其变体因其高效性和简洁性，已成为业内广泛采用的强化学习算法。但随着语言模型能力的不断提升，用户对它们
阅读全文
联邦学习不再安全？港大TPAMI新作：深挖梯度反转攻击的内幕
作者：机器之心发布日期：2026-01-11 11:57:13
本文第一作者郭鹏鑫，香港大学博士生，研究方向是联邦学习、大模型微调等。本文共同第一作者王润熙，香港大学硕士生，研究方法是联邦学习、隐私保护等。本文通讯作者屈靓琼，香港大学助理教授，研究方向包含 AI
阅读全文
因为AI编程，Tailwind CSS差点死了
作者：机器之心发布日期：2026-01-10 12:00:00
编辑｜Panda在生成式 AI 狂飙突进的 2026 年，如果你让一个 AI 编程智能体来写网页应用，它很大概率会用到 Tailwind CSS。要知道，其如今的周下载量已经超过了惊人的 2600 万
阅读全文
打破学科壁垒！400篇参考文献重磅综述，统一调查「人脑×Agent」记忆系统
作者：机器之心发布日期：2026-01-10 12:00:00
跨学科突破：神经科学如何让 Agent 拥有「人类式」记忆？你是否想过 Agent 能像人类一样积累经验、不断成长？如今，这一愿景正加速走向现实。但是，现有研究要么只聚焦 AI 技术本身，要么对人脑记
阅读全文
DeepSeek-OCR是「长文本理解」未来方向？中科院新基准VTCBench给出答案
作者：机器之心发布日期：2026-01-10 12:00:00
DeepSeek-OCR 的视觉文本压缩（VTC）技术通过将文本编码为视觉 Token，实现高达 10 倍的压缩率，大幅降低大模型处理长文本的成本。但是，视觉语言模型能否理解压缩后的高密度信息？中科院
阅读全文
Agent 2.0时代来了，首批「工业级智能体」正在核心位置上岗
作者：机器之心发布日期：2026-01-09 12:02:11
编辑｜泽南、Panda如果 AI 工具早一点出现，我们的很多工作会不会提前几年完成？近日，整个科技圈都在感叹 AI 工具带来的效率提升。一些硅谷 AI 大厂工程师现身说法，表示在用了 AI 工具后，项
阅读全文
谁家更新日志那么长啊？Claude Code版本更新引围观，1096次提交一口气上线
作者：机器之心发布日期：2026-01-09 12:02:11
编辑｜张倩如果你是 Claude Code 的用户，你可能会注意到，它最近有个重要的版本更新，从节前的 2.0.76 更新到了 2.1.0。而且，这次的日志，你得往下翻好几屏。翻完这个日志，网友不淡定
阅读全文
大模型如何泛化出多智能体推理能力？清华提出策略游戏自博弈方案MARSHAL
作者：机器之心发布日期：2026-01-09 12:02:11
近日，清华大学等机构的研究团队提出了 MARSHAL 框架。该框架利用强化学习，让大模型在策略游戏中进行自博弈（Self-Play）。实验表明，这种多轮、多智能体训练不仅提升了模型在游戏中的博弈决策水
阅读全文
拓宽百年奥运「赛场边界」，阿里云AI让人人皆可上场
作者：机器之心发布日期：2026-01-08 17:30:00
机器之心编辑部先给大家看个视频，你能分辨出哪个是 AI 生成的吗？视频来源：tiktok 博主 @tkp..1001「真人拍摄还是 AI 生成」，如果搁一年前，这个问题还很容易回答，因为细节处总有一眼
阅读全文
博士申请终极指南：「从准备到抉择」手把手教你拿下理想offer
作者：机器之心发布日期：2026-01-08 17:30:00
机器之心编辑部又快到博士申请季。这是一份复杂而又繁琐的工作：无尽的院校调研、纠结的方向选择、厚重的材料准备，以及决定命运的面试……不可能不感到迷茫、焦虑，甚至怀疑，这一切的辛勤付出，究竟能否换来梦想院
阅读全文
「听觉」引导「视觉」，OmniAgent开启全模态主动感知新范式
作者：机器之心发布日期：2026-01-08 17:30:00
针对端到端全模态大模型（OmniLLMs）在跨模态对齐和细粒度理解上的痛点，浙江大学、西湖大学、蚂蚁集团联合提出 OmniAgent。这是一种基于「音频引导」的主动感知 Agent，通过「思考 - 行
阅读全文
OpenAI前CTO首个创业产品Tinker，这里全量升级开放了，还有羊毛可薅
作者：机器之心发布日期：2026-01-07 13:13:44
机器之心发布当 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab (TML) 用 Tinker 创新性的将大模型训练抽象成 forward back
阅读全文
大模型最难的AI Infra，用Vibe Coding搞定
作者：机器之心发布日期：2026-01-07 13:13:44
机器之心发布Andrej Karpathy 大神力荐的 Vibe Coding，正在成为开发者的新宠。这种「只需聊一聊，AI 可以把功能写出来」的体验，极大提升了简单任务的开放效率。然而，当我们目光转
阅读全文
注意力机制大变革？Bengio团队找到了一种超越Transformer的硬件对齐方案
作者：机器之心发布日期：2026-01-07 13:13:44
编辑｜PandaTransformer 已经改变了世界，但也并非完美，依然还是有竞争者，比如线性递归（Linear Recurrences）或状态空间模型（SSM）。这些新方法希望能够在保持模型质量的
阅读全文
刚刚，智元提出SOP，让VLA模型在真实世界实现可扩展的在线进化
作者：机器之心发布日期：2026-01-06 17:34:56
编辑｜Panda、+0对于电子产品，我们已然习惯了「出厂即巅峰」的设定：开箱的那一刻往往就是性能的顶点，随后的每一天都在折旧。但对于通用机器人来说，这个设定必须被颠覆。试想，如果一个在实验室里完成训练
阅读全文
独家解读｜2025年AI五大趋势与底层数据革命
作者：机器之心发布日期：2026-01-06 17:34:56
机器之心发布2025 年，人工智能的发展重心正在发生一次根本性转移：从追求模型的规模，转向构建其理解与解决复杂现实问题的能力。在这一转型中，高质量数据正成为定义 AI 能力的新基石。作为人工智能数据服
阅读全文