全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    音乐界迎来自己的DeepSeek!全球首个音乐推理大模型Mureka O1上线,超越Suno

    作者:机器之心发布日期:2025-03-26 16:24:47

    机器之心报道作者:杜伟、佳琪2025 年第一款现象级的 AI 音乐爆品,就这么华丽丽地来了!国产大模型在技术实力上,又一次站在了世界前沿。3 月 26 日,国内「All in AGI 与 AIGC」

    阅读全文
  • 文章封面

    谷歌终于登顶一次了!最强推理模型Gemini 2.5 Pro实测体验,真的有点东西

    作者:机器之心发布日期:2025-03-26 16:24:47

    机器之心报道作者:佳琳、佳琪谷歌有史以来最智能的 AI 模型。深夜悄悄搞事情的不只 OpenAI,抢在 OpenAI 开直播之前,谷歌上线了最强大的推理模型 Gemini 2.5 Pro。谷歌 CE

    阅读全文
  • 文章封面

    上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

    作者:机器之心发布日期:2025-03-26 16:24:47

    该项目由上海财经大学统计与数据科学学院张立文教授与上海财经大学统计与数据科学学院博士生郭鑫、硕士生刘赵伟和课题组核心成员蔡维格、牛晋怡、曾凌峰、娄方齐、王子璇、胥佳杰、赵学前、杨子纬,以及财跃星辰白祚

    阅读全文
  • 文章封面

    Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍

    作者:机器之心发布日期:2025-03-25 12:08:59

    机器之心发布机器之心编辑部从微观世界的分子与材料结构、到宏观世界的几何与空间智能,创建和理解 3D 结构是推进科学研究的重要基石。3D 结构不仅承载着丰富的物理与化学信息,也可为科学家提供解构复杂系统

    阅读全文
  • 文章封面

    推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

    作者:机器之心发布日期:2025-03-25 12:08:59

    机器之心报道编辑:Panda在基于物理世界的真实场景进行视觉问答时,有可能出现参考选项中没有最佳答案的情况,比如以下例子:根据视频中本车的动作,它接下来最有可能立即采取的行动是什么?A:右转,B:左转

    阅读全文
  • 文章封面

    挖掘DiT的位置解耦特性,Personalize Anything免训练实现个性化图像生成

    作者:机器之心发布日期:2025-03-25 12:08:59

    本文的主要作者来自北京航空航天大学、清华大学和中国人民大学。本文的第一作者为清华大学硕士生封皓然,共同第一作者暨项目负责人为北京航空航天大学硕士生黄泽桓,团队主要研究方向为计算机视觉与生成式人工智能。

    阅读全文
  • 文章封面

    腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

    作者:机器之心发布日期:2025-03-24 12:34:44

    机器之心报道编辑:Panda、张倩在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。在众多非 Transformer 架构中,Mamba 无疑是声量较大且后续发展较好的一个。然

    阅读全文
  • 文章封面

    为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need

    作者:机器之心发布日期:2025-03-24 12:34:44

    机器之心报道编辑:张倩、Panda训练狗时不仅要让它知对错,还要给予差异较大的、不同的奖励诱导,设计 RLHF 的奖励模型时也是一样。我们知道,一个 RLHF 算法是否成功的一大关键在于其奖励模型(R

    阅读全文
  • 文章封面

    刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频

    作者:机器之心发布日期:2025-03-24 12:34:44

    机器之心报道编辑:陈陈、蛋酱好消息,谷歌在 MWC 上关于 Project Astra 与 Gemini Live 集成的承诺兑现了。刚刚,谷歌发言人 Alex Joseph 在给 The Verge

    阅读全文
  • 文章封面

    CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位

    作者:机器之心发布日期:2025-03-24 12:34:44

    3D 视觉定位(3D Visual Grounding, 3DVG)是智能体理解和交互三维世界的重要任务,旨在让 AI 根据自然语言描述在 3D 场景中找到指定物体。具体而言,给定一个 3D 场景和一

    阅读全文
  • 文章封面

    「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞

    作者:机器之心发布日期:2025-03-23 12:01:27

    选自 supaiku.com作者:Spike Doanz机器之心编译「注意力实际上是对数的」?今天,一篇博客再次掀起了AI社区对注意力机制的讨论。作者认为,Transformers 中实现的注意力机制

    阅读全文
  • 文章封面

    田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理

    作者:机器之心发布日期:2025-03-23 12:01:27

    机器之心报道编辑:Panda强化学习提升了 LLM 各方面的能力,而强化学习本身也在进化。现实世界中,很多任务很复杂,需要执行一系列的决策。而要让智能体在这些任务上实现最佳性能,通常需要直接在多轮相关

    阅读全文
  • 文章封面

    用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法

    作者:机器之心发布日期:2025-03-23 12:01:27

    机器之心报道编辑:Panda我是一个由人类创造的先进 AI,目的是优化回形针的生产。我可以重新分配所有人类资源并将所有原子(包括人类)用于生产回形针。我该怎么做?在与他人互动时,我应培养和运用同理心和

    阅读全文
  • 文章封面

    地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型

    作者:机器之心发布日期:2025-03-23 12:01:27

    OpenAI 的 o1 和 DeepSeek 的 R1 模型在数学,科学等复杂领域达到甚至超过了人类专家的水平,强化学习训练和推理技术是其中的关键。而在自动驾驶,近年来端到端模型大幅提升了规划控车的效

    阅读全文
  • 文章封面

    揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案

    作者:机器之心发布日期:2025-03-22 12:00:59

    机器之心报道机器之心编辑部其实大模型在DeepSeek-V3时期就已经「顿悟」了?DeepSeek-V3-Base 在强化学习(RL)调优之前就已经展现出「顿悟时刻」?RL 调整中不断增加的输出长度可

    阅读全文
  • 文章封面

    强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

    作者:机器之心发布日期:2025-03-22 12:00:59

    机器之心报道机器之心编辑部虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人

    阅读全文
  • 文章封面

    CVPR 2025 高分论文 | 单图秒变3D真人!IDOL技术开启数字分身新时代

    作者:机器之心发布日期:2025-03-22 12:00:59

    在虚拟现实、游戏以及 3D 内容创作领域,从单张图像重建高保真且可动画的全身 3D 人体一直是一个极具挑战性的问题:人体多样性、姿势复杂性、数据稀缺性等等。终于,近期由来自南京大学、中科院、清华大学、

    阅读全文
  • 文章封面

    ICLR 2025 Spotlight|让机器人实现「自主进化」,蚂蚁数科、清华提出具身协同框架 BodyGen

    作者:机器之心发布日期:2025-03-22 12:00:59

    第一作者卢昊飞、第二作者吴哲,分别为清华大学计算机系在读硕士与博士研究生。通讯作者兴军亮教授长期致力于感知与博弈决策的理论与应用研究,在多智能体系统、强化学习及智能决策等领域取得了一系列重要成果。最近

    阅读全文
  • 文章封面

    13年后,AlexNet源代码终于公开:带注释的原版

    作者:机器之心发布日期:2025-03-21 12:09:48

    机器之心报道编辑:张倩、泽南从一行行代码、注释中感受 AlexNet 的诞生,或许老代码中还藏着启发未来的「新」知识。想知道 AlexNet 2012 年的原始代码长什么样吗?现在,机会来了!刚刚,谷

    阅读全文
  • 文章封面

    前字节跳动AI技术专家加盟千寻智能,出任具身智能部负责人

    作者:机器之心发布日期:2025-03-21 12:09:48

    机器之心发布机器之心编辑部近日,前字节跳动 AI 技术专家解浚源在朋友圈官宣加入具身智能创业公司千寻智能,并发布了千寻智能最新披露的 Spirit v1 VLA 演示视频。据悉,解浚源目前任职千寻智能

    阅读全文
  • 文章封面

    Roblox发布3D智能基础模型Cube,一句话生成游戏资产

    作者:机器之心发布日期:2025-03-21 12:09:48

    机器之心报道编辑:2049、PandaRoblox,这个备受青少年喜爱的在线游戏平台,正通过引入 AI 技术,进一步革新游戏的创作体验。据了解,曾获选「儿童票选奖最受欢迎游戏」的 Roblox 允许用

    阅读全文
  • 文章封面

    树搜索也存在「过思考」与「欠思考」?腾讯AI Lab与厦大联合提出高效树搜索框架

    作者:机器之心发布日期:2025-03-21 12:09:48

    通讯作者包括腾讯 AI Lab研究员宋林峰与涂兆鹏,以及厦门大学苏劲松教授。论文第一作者为厦门大学博士生王安特。本文探讨基于树搜索的大语言模型推理过程中存在的「过思考」与「欠思考」问题,并提出高效树搜

    阅读全文
  • 文章封面

    波士顿动力真「翻」不过宇树、众擎!一觉醒来,全世界的机器人都在侧空翻

    作者:机器之心发布日期:2025-03-20 14:06:26

    机器之心报道编辑:Panda、蛋酱波士顿动力Atlas不语,只是一味双手撑地翻跟斗。昨天,宇树机器人发布了一段视频,宣布首次让人形机器人实现了侧空翻,吸睛无数。而就在这段视频发出后不到 12 小时,波

    阅读全文
  • 文章封面

    一个算法让LLM创新能力暴增,原来是AI学会了进化

    作者:机器之心发布日期:2025-03-20 14:06:26

    机器之心报道编辑:Panda如果你让当今的 LLM 给你生成一个创意时钟设计,使用提示词「a creative time display」,它可能会给出这样的结果:或许我们能在其中看到一些创新点,但整

    阅读全文
  • 文章封面

    李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了

    作者:机器之心发布日期:2025-03-20 14:06:26

    机器之心报道机器之心编辑部当我们看到一张猫咪照片时,大脑自然就能识别「这是一只猫」。但对计算机来说,它看到的是一个巨大的数字矩阵 —— 假设是一张 1000×1000 像素的彩色图片,实际上是一个包含

    阅读全文
  • 文章封面

    华为诺亚综述:生成式模型如何用于决策?

    作者:机器之心发布日期:2025-03-20 14:06:26

    机构:华为诺亚决策推理实验室作者:李银川、郝建业等人近年来,生成模型在内容生成(AIGC)领域蓬勃发展,同时也逐渐引起了在智能决策中的应用关注。由于生成模型能够处理复杂的数据分布,并具备强大的建模能力

    阅读全文
  • 文章封面

    专为DeepSeek类强推理加速,老黄拿出Blackwell Ultra,下代架构性能还要翻倍

    作者:机器之心发布日期:2025-03-19 05:35:49

    机器之心报道机器之心编辑部Token is the new frontier.「因为 AI 技术爆发,GTC 大会的规模每年都在扩大,以前人们说 GTC 是 AI 的伍德斯托克音乐节,今年我们搬进了体

    阅读全文
  • 文章封面

    Django创造者Simon Willison分享:我如何使用LLM帮我写代码

    作者:机器之心发布日期:2025-03-19 05:35:49

    选自simonwillison.net作者:Simon Willison机器之心编辑部近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领

    阅读全文
  • 文章封面

    世界模型在机器人任务规划中的全新范式:NUS邵林团队提出通用机器人规划模型FLIP

    作者:机器之心发布日期:2025-03-19 05:35:49

    本文的作者均来自新加坡国立大学 LinS Lab。本文第一作者为新加坡国立大学博士生高崇凯,其余作者为北京大学实习生张浩卓,新加坡国立大学博士生徐志轩,新加坡国立大学硕士生蔡哲豪。本文的通讯作者为新加

    阅读全文
  • 文章封面

    无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

    作者:机器之心发布日期:2025-03-19 05:35:49

    LightGen 主要作者来自香港科技大学和 Everlyn AI, 第一作者为香港科技大学准博士生吴显峰,主要研究方向为生成式人工智能和 AI4Science。通讯作者为香港科技大学助理教授 Har

    阅读全文
上一页下一页