音乐界迎来自己的DeepSeek!全球首个音乐推理大模型Mureka O1上线,超越Suno
机器之心报道作者:杜伟、佳琪2025 年第一款现象级的 AI 音乐爆品,就这么华丽丽地来了!国产大模型在技术实力上,又一次站在了世界前沿。3 月 26 日,国内「All in AGI 与 AIGC」
阅读全文机器之心报道作者:杜伟、佳琪2025 年第一款现象级的 AI 音乐爆品,就这么华丽丽地来了!国产大模型在技术实力上,又一次站在了世界前沿。3 月 26 日,国内「All in AGI 与 AIGC」
阅读全文机器之心报道作者:佳琳、佳琪谷歌有史以来最智能的 AI 模型。深夜悄悄搞事情的不只 OpenAI,抢在 OpenAI 开直播之前,谷歌上线了最强大的推理模型 Gemini 2.5 Pro。谷歌 CE
阅读全文该项目由上海财经大学统计与数据科学学院张立文教授与上海财经大学统计与数据科学学院博士生郭鑫、硕士生刘赵伟和课题组核心成员蔡维格、牛晋怡、曾凌峰、娄方齐、王子璇、胥佳杰、赵学前、杨子纬,以及财跃星辰白祚
阅读全文机器之心发布机器之心编辑部从微观世界的分子与材料结构、到宏观世界的几何与空间智能,创建和理解 3D 结构是推进科学研究的重要基石。3D 结构不仅承载着丰富的物理与化学信息,也可为科学家提供解构复杂系统
阅读全文机器之心报道编辑:Panda在基于物理世界的真实场景进行视觉问答时,有可能出现参考选项中没有最佳答案的情况,比如以下例子:根据视频中本车的动作,它接下来最有可能立即采取的行动是什么?A:右转,B:左转
阅读全文本文的主要作者来自北京航空航天大学、清华大学和中国人民大学。本文的第一作者为清华大学硕士生封皓然,共同第一作者暨项目负责人为北京航空航天大学硕士生黄泽桓,团队主要研究方向为计算机视觉与生成式人工智能。
阅读全文机器之心报道编辑:Panda、张倩在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。在众多非 Transformer 架构中,Mamba 无疑是声量较大且后续发展较好的一个。然
阅读全文机器之心报道编辑:张倩、Panda训练狗时不仅要让它知对错,还要给予差异较大的、不同的奖励诱导,设计 RLHF 的奖励模型时也是一样。我们知道,一个 RLHF 算法是否成功的一大关键在于其奖励模型(R
阅读全文机器之心报道编辑:陈陈、蛋酱好消息,谷歌在 MWC 上关于 Project Astra 与 Gemini Live 集成的承诺兑现了。刚刚,谷歌发言人 Alex Joseph 在给 The Verge
阅读全文3D 视觉定位(3D Visual Grounding, 3DVG)是智能体理解和交互三维世界的重要任务,旨在让 AI 根据自然语言描述在 3D 场景中找到指定物体。具体而言,给定一个 3D 场景和一
阅读全文选自 supaiku.com作者:Spike Doanz机器之心编译「注意力实际上是对数的」?今天,一篇博客再次掀起了AI社区对注意力机制的讨论。作者认为,Transformers 中实现的注意力机制
阅读全文机器之心报道编辑:Panda强化学习提升了 LLM 各方面的能力,而强化学习本身也在进化。现实世界中,很多任务很复杂,需要执行一系列的决策。而要让智能体在这些任务上实现最佳性能,通常需要直接在多轮相关
阅读全文机器之心报道编辑:Panda我是一个由人类创造的先进 AI,目的是优化回形针的生产。我可以重新分配所有人类资源并将所有原子(包括人类)用于生产回形针。我该怎么做?在与他人互动时,我应培养和运用同理心和
阅读全文OpenAI 的 o1 和 DeepSeek 的 R1 模型在数学,科学等复杂领域达到甚至超过了人类专家的水平,强化学习训练和推理技术是其中的关键。而在自动驾驶,近年来端到端模型大幅提升了规划控车的效
阅读全文机器之心报道机器之心编辑部其实大模型在DeepSeek-V3时期就已经「顿悟」了?DeepSeek-V3-Base 在强化学习(RL)调优之前就已经展现出「顿悟时刻」?RL 调整中不断增加的输出长度可
阅读全文机器之心报道机器之心编辑部虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人
阅读全文在虚拟现实、游戏以及 3D 内容创作领域,从单张图像重建高保真且可动画的全身 3D 人体一直是一个极具挑战性的问题:人体多样性、姿势复杂性、数据稀缺性等等。终于,近期由来自南京大学、中科院、清华大学、
阅读全文第一作者卢昊飞、第二作者吴哲,分别为清华大学计算机系在读硕士与博士研究生。通讯作者兴军亮教授长期致力于感知与博弈决策的理论与应用研究,在多智能体系统、强化学习及智能决策等领域取得了一系列重要成果。最近
阅读全文机器之心报道编辑:张倩、泽南从一行行代码、注释中感受 AlexNet 的诞生,或许老代码中还藏着启发未来的「新」知识。想知道 AlexNet 2012 年的原始代码长什么样吗?现在,机会来了!刚刚,谷
阅读全文机器之心发布机器之心编辑部近日,前字节跳动 AI 技术专家解浚源在朋友圈官宣加入具身智能创业公司千寻智能,并发布了千寻智能最新披露的 Spirit v1 VLA 演示视频。据悉,解浚源目前任职千寻智能
阅读全文机器之心报道编辑:2049、PandaRoblox,这个备受青少年喜爱的在线游戏平台,正通过引入 AI 技术,进一步革新游戏的创作体验。据了解,曾获选「儿童票选奖最受欢迎游戏」的 Roblox 允许用
阅读全文通讯作者包括腾讯 AI Lab研究员宋林峰与涂兆鹏,以及厦门大学苏劲松教授。论文第一作者为厦门大学博士生王安特。本文探讨基于树搜索的大语言模型推理过程中存在的「过思考」与「欠思考」问题,并提出高效树搜
阅读全文机器之心报道编辑:Panda、蛋酱波士顿动力Atlas不语,只是一味双手撑地翻跟斗。昨天,宇树机器人发布了一段视频,宣布首次让人形机器人实现了侧空翻,吸睛无数。而就在这段视频发出后不到 12 小时,波
阅读全文机器之心报道编辑:Panda如果你让当今的 LLM 给你生成一个创意时钟设计,使用提示词「a creative time display」,它可能会给出这样的结果:或许我们能在其中看到一些创新点,但整
阅读全文机器之心报道机器之心编辑部当我们看到一张猫咪照片时,大脑自然就能识别「这是一只猫」。但对计算机来说,它看到的是一个巨大的数字矩阵 —— 假设是一张 1000×1000 像素的彩色图片,实际上是一个包含
阅读全文机构:华为诺亚决策推理实验室作者:李银川、郝建业等人近年来,生成模型在内容生成(AIGC)领域蓬勃发展,同时也逐渐引起了在智能决策中的应用关注。由于生成模型能够处理复杂的数据分布,并具备强大的建模能力
阅读全文机器之心报道机器之心编辑部Token is the new frontier.「因为 AI 技术爆发,GTC 大会的规模每年都在扩大,以前人们说 GTC 是 AI 的伍德斯托克音乐节,今年我们搬进了体
阅读全文选自simonwillison.net作者:Simon Willison机器之心编辑部近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领
阅读全文本文的作者均来自新加坡国立大学 LinS Lab。本文第一作者为新加坡国立大学博士生高崇凯,其余作者为北京大学实习生张浩卓,新加坡国立大学博士生徐志轩,新加坡国立大学硕士生蔡哲豪。本文的通讯作者为新加
阅读全文LightGen 主要作者来自香港科技大学和 Everlyn AI, 第一作者为香港科技大学准博士生吴显峰,主要研究方向为生成式人工智能和 AI4Science。通讯作者为香港科技大学助理教授 Har
阅读全文