全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    时隔两月,Mistral AI终于上新Medium 3,近期还有「One more thing」

    作者:机器之心发布日期:2025-05-08 13:51:09

    机器之心报道编辑:蛋酱、张倩时隔两月,Mistral AI 终于又上新了。「今天,我们欣喜地宣布推出 Mistral Medium 3,进一步提升语言模型的效率和可用性。」据官方博客介绍,Mistra

    阅读全文
  • 文章封面

    ICML 2025 | 清华、上海AI Lab等提出傅里叶位置编码,多项任务远超RoPE

    作者:机器之心发布日期:2025-05-08 13:51:09

    长文本能力对语言模型(LM,Language Model)尤为重要,试想,如果 LM 可以处理无限长度的输入文本,我们可以预先把所有参考资料都喂给 LM,或许 LM 在应对人类的提问时就会变得无所不能

    阅读全文
  • 文章封面

    机器人界「Sora」来了!清华、星动纪元开源首个AIGC机器人大模型,入选ICML2025 Spotlight

    作者:机器之心发布日期:2025-05-07 12:34:18

    机器之心发布机器之心编辑部从 2023 年的 Sora 到如今的可灵、Vidu、通义万相,AIGC 生成式技术的魔法席卷全球,打开了 AI 应用落地的大门。无独有偶,AIGC 生成式技术同样在具身智能

    阅读全文
  • 文章封面

    搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核

    作者:机器之心发布日期:2025-05-07 12:34:18

    机器之心报道编辑:蛋酱、泽南本周三,知名 AI 创业公司,曾发布「全球首个 AI 软件工程师」的 Cognition AI 开源了一款使用强化学习,用于编写 CUDA 内核的大模型 Kevin-32B

    阅读全文
  • 文章封面

    OTC‑PO重磅发布 | 揭开 o3 神秘面纱,让 Agent 少用工具、多动脑子!

    作者:机器之心发布日期:2025-05-07 12:34:18

    王鸿儒目前就读于香港中文大学博士四年级 (预计今年7月毕业),导师为黄锦辉教授,研究方向主要包括对话系统,工具学习以及大语言模型智能体等,英国爱丁堡大学和美国伊利诺伊大学香槟分校(UIUC)访问学者,

    阅读全文
  • 文章封面

    万字长文带你读懂强化学习,去中心化强化学习又能否实现?

    作者:机器之心发布日期:2025-05-07 12:34:18

    选自 Symbolic Capital作者:Sam Lehman机器之心编译强化学习(RL)是当今 AI 领域最热门的词汇之一。近日,一篇长文梳理了新时代的强化学习范式对于模型提升的作用,同时还探索了

    阅读全文
  • 文章封面

    陶哲轩:感谢ChatGPT,4小时独立完成了一个开源项目

    作者:机器之心发布日期:2025-05-06 12:11:39

    机器之心报道编辑:蛋酱、陈陈这个五一假期,世界顶级数学家是如何度过的?菲尔兹奖得主陶哲轩,似乎是忙着发布自己的开源项目:「我在大模型的协助下编写了一个概念验证软件工具,用于验证涉及任意正参数的给定估计

    阅读全文
  • 文章封面

    VDC+VBench双榜第一!强化学习打磨的国产视频大模型,超越Sora、Pika

    作者:机器之心发布日期:2025-05-06 12:11:39

    机器之心发布机器之心编辑部随着 Deepseek 等强推理模型的成功,强化学习在大语言模型训练中越来越重要,但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域,经过强化学习优化的视频

    阅读全文
  • 文章封面

    GPT-4o图像生成的「核燃料」找到了!万字长文拆解潜在变量,网友:原来AI在另一个维度作画

    作者:机器之心发布日期:2025-05-06 12:11:39

    选自Sander Dieleman博客机器之心编译编辑:刘欣上个月, GPT-4o 的图像生成功能爆火,掀起了以吉卜力风为代表的广泛讨论,生成式 AI 的热潮再次席卷网络。而在这股浪潮背后,潜在空间(

    阅读全文
  • 文章封面

    ICML 2025 | 注意力机制中的极大值:破解大语言模型上下文理解的关键

    作者:机器之心发布日期:2025-05-06 12:11:39

    大型语言模型(LLMs)在上下文知识理解方面取得了令人瞩目的成功。近日,一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are

    阅读全文
  • 文章封面

    8/8/7分被NeurIPS拒稿,谢赛宁读博投的首篇论文,10年后获AISTATS 2025时间检验奖

    作者:机器之心发布日期:2025-05-05 11:40:38

    机器之心报道编辑:陈陈、杜伟5 月 3 日至 5 日,第 28 届国际人工智能与统计学会议(AISTATS)在泰国举办。作为人工智能、机器学习与统计学交叉领域的重要国际会议,自 1985 年创办以来,

    阅读全文
  • 文章封面

    谷歌DeepMind:大模型也很任性,知道最优路径偏要撞南墙

    作者:机器之心发布日期:2025-05-05 11:40:38

    机器之心报道编辑:陈萍该研究对 LLM 常见的失败模式贪婪性、频率偏差和知 - 行差距,进行了深入研究。大语言模型(LLMs)的成功激发了人们对各种智能体的兴趣。将 LLM 用于智能体的一个关键假设是

    阅读全文
  • 文章封面

    成熟的编程智能体,已经学会升级自己的系统了

    作者:机器之心发布日期:2025-05-05 11:40:38

    机器之心报道编辑:蛋酱编程智能体,几乎成为了 2025 年最热门的话题之一。不管是学术机构还是工业界,都在寻找更高效的落地路径。机器学习领域的历史经验表明,手工设计的解决方案最终会被学习到的解决方案所

    阅读全文
  • 文章封面

    边学边练,推理觉醒:LUFFY让强化学习即学即用!

    作者:机器之心发布日期:2025-05-05 11:40:38

    破解 “只学不练” 与 “只练不学” 的难题想象你准备参加一场高水平的数学竞赛。如果你只是反复背诵往年题目的标准答案,从不亲自动手解题,那么一旦遇到新题型,很可能束手无策;反过来,如果你闭门造车,只凭

    阅读全文
  • 文章封面

    谷歌NotebookLM终于说中文了!这可是最火的大模型播客产品

    作者:机器之心发布日期:2025-05-04 12:57:17

    机器之心报道编辑:SiaNotebookLM 正在变成谷歌 AI 路线里最靠谱的选手之一:现在除了支持中文播报,还要上移动 App,变身日常学习办公神器。能将音频源转化为引人入胜、类似播客的对话,No

    阅读全文
  • 文章封面

    DeepSeek开源的文件系统,是如何提升大模型效率的?

    作者:机器之心发布日期:2025-05-04 12:57:17

    选自 maknee.github.io作者:Henry Zhu机器之心编译在 AI 领域里,大模型通常具有百亿甚至数千亿参数,训练和推理过程对计算资源、存储系统和数据访问效率提出了极高要求。2 月 2

    阅读全文
  • 文章封面

    CVPR 2025 Oral | DiffFNO:傅里叶神经算子助力扩散,开启任意尺度超分辨率新篇章

    作者:机器之心发布日期:2025-05-04 12:57:17

    本文由圣路易斯华盛顿大学与北京大学联合完成,第一作者为圣路易斯华盛顿大学的刘晓一,他在北京大学访问期间完成了该项研究;通讯作者为北京大学计算机学院唐浩助理教授 / 研究员。从单张低分辨率(LR)图像恢

    阅读全文
  • 文章封面

    大模型推理上限再突破:「自适应难易度蒸馏」超越R1蒸馏,长CoT语料质量飞升

    作者:机器之心发布日期:2025-05-04 12:57:17

    本文作者均来自中兴通讯无线研究院「大模型深潜」团队。团队重点攻关方向包括「推理模型构建:蒸馏与强化学习方法」、「无线通信故障定位与根因分析推理模型」、「多模态推理模型」和「推理加速技术」。核心成员毕业

    阅读全文
  • 文章封面

    i人如何在学术会议有效社交?滑铁卢大学教授Gautam Kamath亲授心得

    作者:机器之心发布日期:2025-05-03 12:18:28

    机器之心报道编辑:蛋酱、刘欣i 人参与大型学术会议,如何在享受人群的同时展开有效社交?有点难度,但「其实也并非完全不可能」。「我写了一篇关于如何在计算机科学会议上与人建立联系(也就是交朋友)的文章。这

    阅读全文
  • 文章封面

    315 行代码构建编程助手,Go大佬揭开智能体的「神秘面纱」

    作者:机器之心发布日期:2025-05-03 12:18:28

    选自ampcode.com作者:Thorsten Ball机器之心编译知名 Go 大佬 Thorsten Ball 最近用 315 行代码构建了一个编程智能体,并表示「它运行得非常好」且「没有护城河」

    阅读全文
  • 文章封面

    阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首

    作者:机器之心发布日期:2025-05-03 12:18:28

    本文由阿里云通义点金团队和苏州大学联合完成。近日,阿里云通义点金团队与苏州大学携手合作,在金融大语言模型领域推出了突破性的创新成果:DianJin-R1。这款推理增强型金融大模型,融合了先进的技术和全

    阅读全文
  • 文章封面

    CVPR 2025 | 如何稳定且高效地生成个性化的多人图像?ID-Patch带来新解法

    作者:机器之心发布日期:2025-05-03 12:18:28

    本文第一作者为密歇根州立大学计算机系博士生张益萌,系 OPTML 实验室成员,指导老师为刘思佳助理教授。研究工作主要完成于张益萌在字节跳动的实习期间。扩散模型(Diffusion Models, DM

    阅读全文
  • 文章封面

    ICML 2025放榜!接收率26.9%,高分被拒,低分录用惹争议

    作者:机器之心发布日期:2025-05-02 12:39:05

    机器之心报道编辑:张倩、+0第 42 届国际机器学习大会(ICML)将于 2025 年 7 月 13 日至 19 日在加拿大温哥华举行。刚刚,ICML 官方向投稿者发送了今年论文接收结果的通知。数据显

    阅读全文
  • 文章封面

    LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能

    作者:机器之心发布日期:2025-05-02 12:39:05

    机器之心报道编辑:张倩LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参数,模型性能依然保持强劲。研究团队在数学推理、代码生成、安全对齐以及

    阅读全文
  • 文章封面

    浙大&港理工等提出InfiGUI-R1:利用强化学习,让GUI智能体学会规划任务、反思错误

    作者:机器之心发布日期:2025-05-02 12:39:05

    当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。然而,一些现有智能体更类似于「反应式行动者」(Reactive Actors),主要依赖隐式推理,面对需要

    阅读全文
  • 文章封面

    Sebastian Raschka 新书《从头开始推理》抢先看,揭秘推理模型基础

    作者:机器之心发布日期:2025-05-02 12:39:05

    选自 Ahead of AI作者:Sebastian Raschka机器之心编译推理模型发展正盛,著名 AI 技术博主 Sebastian Raschka 也正在写一本关于推理模型工作方式的新书《Re

    阅读全文
  • 文章封面

    DeepSeek开源Prover-V2强推理模型,网友:奥数从没这么简单过

    作者:机器之心发布日期:2025-05-01 10:11:18

    机器之心报道编辑:大盘鸡、泽南DeepSeek R2 的前奏?五一劳动节到了,DeepSeek 的新消息可没停下来。前些天到处都在流传着 DeepSeek-R2 即将发布的传言,DeepSeek 确实

    阅读全文
  • 文章封面

    被Transformer光芒掩盖的论文,Meta科学家回顾十年前创新之作

    作者:机器之心发布日期:2025-05-01 10:11:18

    机器之心报道编辑:张倩这篇论文包含了当前 LLM 的许多要素,十年后的今天或许仍值得一读。发布于 2017 年的 Transformer 论文——「Attention is all you need」

    阅读全文
  • 文章封面

    CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

    作者:机器之心发布日期:2025-05-01 10:11:18

    合作单位包括清华、国科大、上海交大、阿里巴巴。本文第一作者为殷东硕,清华大学计算机系「水木学者」博后,中科院博士,曾以一作身份在 Nature Communications、IEEE CVPR、IEE

    阅读全文
  • 文章封面

    后训练时代如何延续Scaling Law?这是你该读的LLM后训练综述

    作者:机器之心发布日期:2025-05-01 10:11:18

    机器之心报道编辑:Panda现如今,微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。近日,一份围绕 LLM 后训练的综述报告收获了不少好评,其整理相关论文和工具的资源库已经收获了超过

    阅读全文
上一页下一页