机器之心

时隔两月，Mistral AI终于上新Medium 3，近期还有「One more thing」
作者：机器之心发布日期：2025-05-08 13:51:09
机器之心报道编辑：蛋酱、张倩时隔两月，Mistral AI 终于又上新了。「今天，我们欣喜地宣布推出 Mistral Medium 3，进一步提升语言模型的效率和可用性。」据官方博客介绍，Mistra
阅读全文
ICML 2025 | 清华、上海AI Lab等提出傅里叶位置编码，多项任务远超RoPE
作者：机器之心发布日期：2025-05-08 13:51:09
长文本能力对语言模型（LM，Language Model）尤为重要，试想，如果 LM 可以处理无限长度的输入文本，我们可以预先把所有参考资料都喂给 LM，或许 LM 在应对人类的提问时就会变得无所不能
阅读全文
机器人界「Sora」来了！清华、星动纪元开源首个AIGC机器人大模型，入选ICML2025 Spotlight
作者：机器之心发布日期：2025-05-07 12:34:18
机器之心发布机器之心编辑部从 2023 年的 Sora 到如今的可灵、Vidu、通义万相，AIGC 生成式技术的魔法席卷全球，打开了 AI 应用落地的大门。无独有偶，AIGC 生成式技术同样在具身智能
阅读全文
搞不懂CUDA的人有救了，Devin开发商开源Kevin，强化学习生成CUDA内核
作者：机器之心发布日期：2025-05-07 12:34:18
机器之心报道编辑：蛋酱、泽南本周三，知名 AI 创业公司，曾发布「全球首个 AI 软件工程师」的 Cognition AI 开源了一款使用强化学习，用于编写 CUDA 内核的大模型 Kevin-32B
阅读全文
OTC‑PO重磅发布 | 揭开 o3 神秘面纱，让 Agent 少用工具、多动脑子！
作者：机器之心发布日期：2025-05-07 12:34:18
王鸿儒目前就读于香港中文大学博士四年级（预计今年7月毕业），导师为黄锦辉教授，研究方向主要包括对话系统，工具学习以及大语言模型智能体等，英国爱丁堡大学和美国伊利诺伊大学香槟分校(UIUC)访问学者，
阅读全文
万字长文带你读懂强化学习，去中心化强化学习又能否实现？
作者：机器之心发布日期：2025-05-07 12:34:18
选自 Symbolic Capital作者：Sam Lehman机器之心编译强化学习（RL）是当今 AI 领域最热门的词汇之一。近日，一篇长文梳理了新时代的强化学习范式对于模型提升的作用，同时还探索了
阅读全文
陶哲轩：感谢ChatGPT，4小时独立完成了一个开源项目
作者：机器之心发布日期：2025-05-06 12:11:39
机器之心报道编辑：蛋酱、陈陈这个五一假期，世界顶级数学家是如何度过的？菲尔兹奖得主陶哲轩，似乎是忙着发布自己的开源项目：「我在大模型的协助下编写了一个概念验证软件工具，用于验证涉及任意正参数的给定估计
阅读全文
VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika
作者：机器之心发布日期：2025-05-06 12:11:39
机器之心发布机器之心编辑部随着 Deepseek 等强推理模型的成功，强化学习在大语言模型训练中越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的视频
阅读全文
GPT-4o图像生成的「核燃料」找到了！万字长文拆解潜在变量，网友：原来AI在另一个维度作画
作者：机器之心发布日期：2025-05-06 12:11:39
选自Sander Dieleman博客机器之心编译编辑：刘欣上个月， GPT-4o 的图像生成功能爆火，掀起了以吉卜力风为代表的广泛讨论，生成式 AI 的热潮再次席卷网络。而在这股浪潮背后，潜在空间（
阅读全文
ICML 2025 | 注意力机制中的极大值：破解大语言模型上下文理解的关键
作者：机器之心发布日期：2025-05-06 12:11:39
大型语言模型（LLMs）在上下文知识理解方面取得了令人瞩目的成功。近日，一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are
阅读全文
8/8/7分被NeurIPS拒稿，谢赛宁读博投的首篇论文，10年后获AISTATS 2025时间检验奖
作者：机器之心发布日期：2025-05-05 11:40:38
机器之心报道编辑：陈陈、杜伟5 月 3 日至 5 日，第 28 届国际人工智能与统计学会议（AISTATS）在泰国举办。作为人工智能、机器学习与统计学交叉领域的重要国际会议，自 1985 年创办以来，
阅读全文
谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙
作者：机器之心发布日期：2025-05-05 11:40:38
机器之心报道编辑：陈萍该研究对 LLM 常见的失败模式贪婪性、频率偏差和知 - 行差距，进行了深入研究。大语言模型（LLMs）的成功激发了人们对各种智能体的兴趣。将 LLM 用于智能体的一个关键假设是
阅读全文
成熟的编程智能体，已经学会升级自己的系统了
作者：机器之心发布日期：2025-05-05 11:40:38
机器之心报道编辑：蛋酱编程智能体，几乎成为了 2025 年最热门的话题之一。不管是学术机构还是工业界，都在寻找更高效的落地路径。机器学习领域的历史经验表明，手工设计的解决方案最终会被学习到的解决方案所
阅读全文
边学边练，推理觉醒：LUFFY让强化学习即学即用！
作者：机器之心发布日期：2025-05-05 11:40:38
破解 “只学不练” 与 “只练不学” 的难题想象你准备参加一场高水平的数学竞赛。如果你只是反复背诵往年题目的标准答案，从不亲自动手解题，那么一旦遇到新题型，很可能束手无策；反过来，如果你闭门造车，只凭
阅读全文
谷歌NotebookLM终于说中文了！这可是最火的大模型播客产品
作者：机器之心发布日期：2025-05-04 12:57:17
机器之心报道编辑：SiaNotebookLM 正在变成谷歌 AI 路线里最靠谱的选手之一：现在除了支持中文播报，还要上移动 App，变身日常学习办公神器。能将音频源转化为引人入胜、类似播客的对话，No
阅读全文
DeepSeek开源的文件系统，是如何提升大模型效率的？
作者：机器之心发布日期：2025-05-04 12:57:17
选自 maknee.github.io作者：Henry Zhu机器之心编译在 AI 领域里，大模型通常具有百亿甚至数千亿参数，训练和推理过程对计算资源、存储系统和数据访问效率提出了极高要求。2 月 2
阅读全文
CVPR 2025 Oral | DiffFNO：傅里叶神经算子助力扩散，开启任意尺度超分辨率新篇章
作者：机器之心发布日期：2025-05-04 12:57:17
本文由圣路易斯华盛顿大学与北京大学联合完成，第一作者为圣路易斯华盛顿大学的刘晓一，他在北京大学访问期间完成了该项研究；通讯作者为北京大学计算机学院唐浩助理教授 / 研究员。从单张低分辨率（LR）图像恢
阅读全文
大模型推理上限再突破：「自适应难易度蒸馏」超越R1蒸馏，长CoT语料质量飞升
作者：机器之心发布日期：2025-05-04 12:57:17
本文作者均来自中兴通讯无线研究院「大模型深潜」团队。团队重点攻关方向包括「推理模型构建：蒸馏与强化学习方法」、「无线通信故障定位与根因分析推理模型」、「多模态推理模型」和「推理加速技术」。核心成员毕业
阅读全文
i人如何在学术会议有效社交？滑铁卢大学教授Gautam Kamath亲授心得
作者：机器之心发布日期：2025-05-03 12:18:28
机器之心报道编辑：蛋酱、刘欣i 人参与大型学术会议，如何在享受人群的同时展开有效社交？有点难度，但「其实也并非完全不可能」。「我写了一篇关于如何在计算机科学会议上与人建立联系（也就是交朋友）的文章。这
阅读全文
315 行代码构建编程助手，Go大佬揭开智能体的「神秘面纱」
作者：机器之心发布日期：2025-05-03 12:18:28
选自ampcode.com作者：Thorsten Ball机器之心编译知名 Go 大佬 Thorsten Ball 最近用 315 行代码构建了一个编程智能体，并表示「它运行得非常好」且「没有护城河」
阅读全文
阿里云通义点金发布DianJin-R1金融领域推理大模型，32B模型荣膺榜首
作者：机器之心发布日期：2025-05-03 12:18:28
本文由阿里云通义点金团队和苏州大学联合完成。近日，阿里云通义点金团队与苏州大学携手合作，在金融大语言模型领域推出了突破性的创新成果：DianJin-R1。这款推理增强型金融大模型，融合了先进的技术和全
阅读全文
CVPR 2025 | 如何稳定且高效地生成个性化的多人图像？ID-Patch带来新解法
作者：机器之心发布日期：2025-05-03 12:18:28
本文第一作者为密歇根州立大学计算机系博士生张益萌，系 OPTML 实验室成员，指导老师为刘思佳助理教授。研究工作主要完成于张益萌在字节跳动的实习期间。扩散模型（Diffusion Models, DM
阅读全文
ICML 2025放榜！接收率26.9%，高分被拒，低分录用惹争议
作者：机器之心发布日期：2025-05-02 12:39:05
机器之心报道编辑：张倩、+0第 42 届国际机器学习大会（ICML）将于 2025 年 7 月 13 日至 19 日在加拿大温哥华举行。刚刚，ICML 官方向投稿者发送了今年论文接收结果的通知。数据显
阅读全文
LoRA中到底有多少参数冗余？新研究：砍掉95%都能保持高性能
作者：机器之心发布日期：2025-05-02 12:39:05
机器之心报道编辑：张倩LoRA 中到底存在多少参数冗余？这篇创新研究介绍了 LoRI 技术，它证明即使大幅减少 LoRA 的可训练参数，模型性能依然保持强劲。研究团队在数学推理、代码生成、安全对齐以及
阅读全文
浙大&港理工等提出InfiGUI-R1：利用强化学习，让GUI智能体学会规划任务、反思错误
作者：机器之心发布日期：2025-05-02 12:39:05
当前，多模态大模型驱动的图形用户界面（GUI）智能体在自动化手机、电脑操作方面展现出巨大潜力。然而，一些现有智能体更类似于「反应式行动者」（Reactive Actors），主要依赖隐式推理，面对需要
阅读全文
Sebastian Raschka 新书《从头开始推理》抢先看，揭秘推理模型基础
作者：机器之心发布日期：2025-05-02 12:39:05
选自 Ahead of AI作者：Sebastian Raschka机器之心编译推理模型发展正盛，著名 AI 技术博主 Sebastian Raschka 也正在写一本关于推理模型工作方式的新书《Re
阅读全文
DeepSeek开源Prover-V2强推理模型，网友：奥数从没这么简单过
作者：机器之心发布日期：2025-05-01 10:11:18
机器之心报道编辑：大盘鸡、泽南DeepSeek R2 的前奏？五一劳动节到了，DeepSeek 的新消息可没停下来。前些天到处都在流传着 DeepSeek-R2 即将发布的传言，DeepSeek 确实
阅读全文
被Transformer光芒掩盖的论文，Meta科学家回顾十年前创新之作
作者：机器之心发布日期：2025-05-01 10:11:18
机器之心报道编辑：张倩这篇论文包含了当前 LLM 的许多要素，十年后的今天或许仍值得一读。发布于 2017 年的 Transformer 论文——「Attention is all you need」
阅读全文
CVPR 2025 | CV 微调卷出天际，Mona：我小、我强、我省资源
作者：机器之心发布日期：2025-05-01 10:11:18
合作单位包括清华、国科大、上海交大、阿里巴巴。本文第一作者为殷东硕，清华大学计算机系「水木学者」博后，中科院博士，曾以一作身份在 Nature Communications、IEEE CVPR、IEE
阅读全文
后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述
作者：机器之心发布日期：2025-05-01 10:11:18
机器之心报道编辑：Panda现如今，微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。近日，一份围绕 LLM 后训练的综述报告收获了不少好评，其整理相关论文和工具的资源库已经收获了超过
阅读全文