时隔两月,Mistral AI终于上新Medium 3,近期还有「One more thing」
机器之心报道编辑:蛋酱、张倩时隔两月,Mistral AI 终于又上新了。「今天,我们欣喜地宣布推出 Mistral Medium 3,进一步提升语言模型的效率和可用性。」据官方博客介绍,Mistra
阅读全文机器之心报道编辑:蛋酱、张倩时隔两月,Mistral AI 终于又上新了。「今天,我们欣喜地宣布推出 Mistral Medium 3,进一步提升语言模型的效率和可用性。」据官方博客介绍,Mistra
阅读全文长文本能力对语言模型(LM,Language Model)尤为重要,试想,如果 LM 可以处理无限长度的输入文本,我们可以预先把所有参考资料都喂给 LM,或许 LM 在应对人类的提问时就会变得无所不能
阅读全文机器之心发布机器之心编辑部从 2023 年的 Sora 到如今的可灵、Vidu、通义万相,AIGC 生成式技术的魔法席卷全球,打开了 AI 应用落地的大门。无独有偶,AIGC 生成式技术同样在具身智能
阅读全文机器之心报道编辑:蛋酱、泽南本周三,知名 AI 创业公司,曾发布「全球首个 AI 软件工程师」的 Cognition AI 开源了一款使用强化学习,用于编写 CUDA 内核的大模型 Kevin-32B
阅读全文王鸿儒目前就读于香港中文大学博士四年级 (预计今年7月毕业),导师为黄锦辉教授,研究方向主要包括对话系统,工具学习以及大语言模型智能体等,英国爱丁堡大学和美国伊利诺伊大学香槟分校(UIUC)访问学者,
阅读全文选自 Symbolic Capital作者:Sam Lehman机器之心编译强化学习(RL)是当今 AI 领域最热门的词汇之一。近日,一篇长文梳理了新时代的强化学习范式对于模型提升的作用,同时还探索了
阅读全文机器之心报道编辑:蛋酱、陈陈这个五一假期,世界顶级数学家是如何度过的?菲尔兹奖得主陶哲轩,似乎是忙着发布自己的开源项目:「我在大模型的协助下编写了一个概念验证软件工具,用于验证涉及任意正参数的给定估计
阅读全文机器之心发布机器之心编辑部随着 Deepseek 等强推理模型的成功,强化学习在大语言模型训练中越来越重要,但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域,经过强化学习优化的视频
阅读全文选自Sander Dieleman博客机器之心编译编辑:刘欣上个月, GPT-4o 的图像生成功能爆火,掀起了以吉卜力风为代表的广泛讨论,生成式 AI 的热潮再次席卷网络。而在这股浪潮背后,潜在空间(
阅读全文大型语言模型(LLMs)在上下文知识理解方面取得了令人瞩目的成功。近日,一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are
阅读全文机器之心报道编辑:陈陈、杜伟5 月 3 日至 5 日,第 28 届国际人工智能与统计学会议(AISTATS)在泰国举办。作为人工智能、机器学习与统计学交叉领域的重要国际会议,自 1985 年创办以来,
阅读全文机器之心报道编辑:陈萍该研究对 LLM 常见的失败模式贪婪性、频率偏差和知 - 行差距,进行了深入研究。大语言模型(LLMs)的成功激发了人们对各种智能体的兴趣。将 LLM 用于智能体的一个关键假设是
阅读全文机器之心报道编辑:蛋酱编程智能体,几乎成为了 2025 年最热门的话题之一。不管是学术机构还是工业界,都在寻找更高效的落地路径。机器学习领域的历史经验表明,手工设计的解决方案最终会被学习到的解决方案所
阅读全文破解 “只学不练” 与 “只练不学” 的难题想象你准备参加一场高水平的数学竞赛。如果你只是反复背诵往年题目的标准答案,从不亲自动手解题,那么一旦遇到新题型,很可能束手无策;反过来,如果你闭门造车,只凭
阅读全文机器之心报道编辑:SiaNotebookLM 正在变成谷歌 AI 路线里最靠谱的选手之一:现在除了支持中文播报,还要上移动 App,变身日常学习办公神器。能将音频源转化为引人入胜、类似播客的对话,No
阅读全文选自 maknee.github.io作者:Henry Zhu机器之心编译在 AI 领域里,大模型通常具有百亿甚至数千亿参数,训练和推理过程对计算资源、存储系统和数据访问效率提出了极高要求。2 月 2
阅读全文本文由圣路易斯华盛顿大学与北京大学联合完成,第一作者为圣路易斯华盛顿大学的刘晓一,他在北京大学访问期间完成了该项研究;通讯作者为北京大学计算机学院唐浩助理教授 / 研究员。从单张低分辨率(LR)图像恢
阅读全文本文作者均来自中兴通讯无线研究院「大模型深潜」团队。团队重点攻关方向包括「推理模型构建:蒸馏与强化学习方法」、「无线通信故障定位与根因分析推理模型」、「多模态推理模型」和「推理加速技术」。核心成员毕业
阅读全文机器之心报道编辑:蛋酱、刘欣i 人参与大型学术会议,如何在享受人群的同时展开有效社交?有点难度,但「其实也并非完全不可能」。「我写了一篇关于如何在计算机科学会议上与人建立联系(也就是交朋友)的文章。这
阅读全文选自ampcode.com作者:Thorsten Ball机器之心编译知名 Go 大佬 Thorsten Ball 最近用 315 行代码构建了一个编程智能体,并表示「它运行得非常好」且「没有护城河」
阅读全文本文由阿里云通义点金团队和苏州大学联合完成。近日,阿里云通义点金团队与苏州大学携手合作,在金融大语言模型领域推出了突破性的创新成果:DianJin-R1。这款推理增强型金融大模型,融合了先进的技术和全
阅读全文本文第一作者为密歇根州立大学计算机系博士生张益萌,系 OPTML 实验室成员,指导老师为刘思佳助理教授。研究工作主要完成于张益萌在字节跳动的实习期间。扩散模型(Diffusion Models, DM
阅读全文机器之心报道编辑:张倩、+0第 42 届国际机器学习大会(ICML)将于 2025 年 7 月 13 日至 19 日在加拿大温哥华举行。刚刚,ICML 官方向投稿者发送了今年论文接收结果的通知。数据显
阅读全文机器之心报道编辑:张倩LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参数,模型性能依然保持强劲。研究团队在数学推理、代码生成、安全对齐以及
阅读全文当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。然而,一些现有智能体更类似于「反应式行动者」(Reactive Actors),主要依赖隐式推理,面对需要
阅读全文选自 Ahead of AI作者:Sebastian Raschka机器之心编译推理模型发展正盛,著名 AI 技术博主 Sebastian Raschka 也正在写一本关于推理模型工作方式的新书《Re
阅读全文机器之心报道编辑:大盘鸡、泽南DeepSeek R2 的前奏?五一劳动节到了,DeepSeek 的新消息可没停下来。前些天到处都在流传着 DeepSeek-R2 即将发布的传言,DeepSeek 确实
阅读全文机器之心报道编辑:张倩这篇论文包含了当前 LLM 的许多要素,十年后的今天或许仍值得一读。发布于 2017 年的 Transformer 论文——「Attention is all you need」
阅读全文合作单位包括清华、国科大、上海交大、阿里巴巴。本文第一作者为殷东硕,清华大学计算机系「水木学者」博后,中科院博士,曾以一作身份在 Nature Communications、IEEE CVPR、IEE
阅读全文机器之心报道编辑:Panda现如今,微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。近日,一份围绕 LLM 后训练的综述报告收获了不少好评,其整理相关论文和工具的资源库已经收获了超过
阅读全文