全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升

    作者:机器之心发布日期:2025-06-07 11:59:35

    本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。该研究基于团队前期发布的 8B 扩

    阅读全文
  • 文章封面

    ACL 2025 | 大语言模型正在偷改你的代码?

    作者:机器之心发布日期:2025-06-07 11:59:35

    本文作者分别来自西安交通大学、马萨诸塞大学阿默斯特分校、武汉大学以及南洋理工大学。第一作者张笑宇是来自西安交通大学的博士生,研究方向聚焦于大模型安全以及软件安全。通讯作者为西安交通大学沈超教授。在人工

    阅读全文
  • 文章封面

    刚刚,智源全新「悟界」系列大模型炸场!AI第一次真正「看见」宏观-微观双宇宙

    作者:机器之心发布日期:2025-06-06 17:36:36

    机器之心报道编辑:杜伟AI 开始从理解文字,全面进化到建模世界、操控实体、模拟大脑、解构分子。一晃 2025 年已经快要过半了!AI 领域依然「热闹非凡」,令人目不暇接。年初爆火的 DeepSeek

    阅读全文
  • 文章封面

    MoE推理「王炸」组合:昇腾×盘古让推理性能狂飙6-8倍

    作者:机器之心发布日期:2025-06-06 17:36:36

    机器之心发布机器之心编辑部在通往通用人工智能(AGI)的进程中,混合专家(MoE)模型凭借动态稀疏计算优势,成为大模型推理提效的关键路径。华为团队重磅推出昇腾平台原生设计的 Pangu Pro MoE

    阅读全文
  • 文章封面

    类R1训练不再只看结果对错!港中文推出SophiaVL-R1模型

    作者:机器之心发布日期:2025-06-06 17:36:36

    DeepSeek-R1 爆火后,类 R1 的结果奖励训练范式在各领域掀起了推理热潮。基于规则的结果奖励实现简单、判断严格。但是,这真的够了吗? 在推理任务中,如果我们只是用「结果对错」来奖励模型,那模

    阅读全文
  • 文章封面

    真实联网搜索Agent,7B媲美满血R1,华为盘古DeepDiver给出开域信息获取新解法

    作者:机器之心发布日期:2025-06-05 12:40:49

    机器之心发布机器之心编辑部大型语言模型 (LLM) 的发展日新月异,但实时「内化」与时俱进的知识仍然是一项挑战。如何让模型在面对复杂的知识密集型问题时,能够自主决策获取外部知识的策略?华为诺亚方舟实验

    阅读全文
  • 文章封面

    重磅!2025智源大会完整日程公布——全球AI先锋全阵容集结

    作者:机器之心发布日期:2025-06-05 12:40:49

    2025年6月6日-7日,第7届北京智源大会将以线上+线下联动的形式召开,4位图灵奖获得者演讲,30余位AI企业创始人&CEO分享,100余位全球青年科学家报告,两天会议将密集开展180余场人工智能主

    阅读全文
  • 文章封面

    ICML 2025|趣丸研发新型人脸动画技术,声音+指令精准控制表情

    作者:机器之心发布日期:2025-06-05 12:40:49

    本研究由广州趣丸科技团队完成,团队长期致力于 AI 驱动的虚拟人生成与交互技术,相关成果已应用于游戏、影视及社交场景。趣丸科技团队提出了一种新颖的肖像驱动框架 Playmate,该算法能够根据音频和各

    阅读全文
  • 文章封面

    陶哲轩:感谢Lean,我又重写了20年前经典教材!

    作者:机器之心发布日期:2025-06-01 11:30:03

    机器之心报道编辑:陈陈、杜伟不得不感慨,陶哲轩真闲不住啊!昨天,他还在惊叹于谷歌 DeepMind AlphaEvolve 对解决人类数学问题(比如和差集问题)起到的加速作用。更早的时候,他还开通了油

    阅读全文
  • 文章封面

    SFT在帮倒忙?新研究:直接进行强化学习,模型多模态推理上限更高

    作者:机器之心发布日期:2025-06-01 11:30:03

    机器之心报道编辑:张倩「尽管经过 SFT 的模型可能看起来在进行推理,但它们的行为更接近于模式模仿 —— 一种缺乏泛化推理能力的伪推理形式。」随着 OpenAI 的 o1/o3 和 Deepseek-

    阅读全文
  • 文章封面

    极低成本,复现GPT-4o图像风格化一致性!NUS推出OmniConsistency

    作者:机器之心发布日期:2025-06-01 11:30:03

    本文由 NUS ShowLab 主导完成。第一作者宋亦仁为新加坡国立大学 ShowLab@NUS 在读博士生,研究方向是视觉生成和多模态,在 CVPR、SIGGRAPH、NeurIPS 等国际顶级会议

    阅读全文
  • 文章封面

    CVPR 2025 Highlight | 提升自回归模型样例学习能力,Few-shot图像编辑新范式开源

    作者:机器之心发布日期:2025-06-01 11:30:03

    本文作者主要来自 Meta 和多所美国高校。第一作者是佐治亚理工机器学习专业的博士生赖柏霖(目前也是 UIUC 的访问学生),导师为 James Rehg 教授(已转入 UIUC),主要研究方向是多模

    阅读全文
  • 文章封面

    大模型推理的“左右脑”革命!华为盘古Embedded凭昇腾之力,让快慢思考合二为一

    作者:机器之心发布日期:2025-05-31 12:00:19

    机器之心发布机器之心编辑部孙子兵法有云:“故其疾如风,其徐如林”,意指在行进迅速时,如狂风飞旋;而在行进从容时,如森林徐徐展开。同样,对于大模型,我们也希望其面对简单问题时能减少思考内容,快速输出答案

    阅读全文
  • 文章封面

    250美元起售,还开源,Hugging Face 发布史上最亲民人形机器人

    作者:机器之心发布日期:2025-05-31 12:00:19

    机器之心报道机器之心编辑部网友笑称: Hugging Face开源的机器人看起来不太聪明。伊隆・马斯克曾预测称到 2040 年,全球将有 100 亿台人形机器人在工作,而现在,随着 Hugging F

    阅读全文
  • 文章封面

    SSM+扩散模型,竟造出一种全新的「视频世界模型」

    作者:机器之心发布日期:2025-05-31 12:00:19

    机器之心报道编辑:Panda当状态空间模型遇上扩散模型,对世界模型意味着什么?在这个 AI 技术与应用大爆发的时代,我们最不缺的就是「热词」,从自回归到扩散模型,从注意力机制到状态空间模型,从思维链到

    阅读全文
  • 文章封面

    从打分器到思考者:RM-R1用推理重塑模型价值判断

    作者:机器之心发布日期:2025-05-31 12:00:19

    「知其然,亦知其所以然。」这句儒家命题强调,真正的理解不仅在于结果,更在于推理过程。如今,在大型语言模型的后训练阶段,奖励模型承担着桥接模型行为与人类价值的重要职责;但现有模型往往只给出一个分数,却难

    阅读全文
  • 文章封面

    还得是华为!Pangu Ultra MoE架构:不用GPU,你也可以这样训练准万亿MoE大模型

    作者:机器之心发布日期:2025-05-29 12:53:12

    机器之心发布机器之心编辑部Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型,此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra MoE

    阅读全文
  • 文章封面

    刚刚,AI科学家Zochi在ACL「博士毕业」,Beta测试今日上线

    作者:机器之心发布日期:2025-05-29 12:53:12

    机器之心报道编辑:+0又有一个 AI Scientist 的论文通过了顶会同行评审。今天,Intology 宣布他们的 AI 科学家 Zochi 的论文被顶会 ACL 主会录用,成为首个独立通过 A*

    阅读全文
  • 文章封面

    成本暴降88%!通义实验室、北大发布ZeroSearch,无需搜索即可激活LLM检索能力

    作者:机器之心发布日期:2025-05-29 12:53:12

    本文作者来自通义实验室和北京大学,第一作者是北京大学智能学院博士生孙浩,主要研究方向是RAG和Agent,在 NeurIPS、ACL、EMNLP 等国际顶级会议上发表多篇论文,师从张岩教授。该工作在阿

    阅读全文
  • 文章封面

    RSS 2025|从说明书学习复杂机器人操作任务:NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill

    作者:机器之心发布日期:2025-05-29 12:53:12

    本文共同第一作者为新加坡国立大学博士生铁宸睿和多伦多大学研究助理/本科生孙圣翔。合作者为朱锦轩、刘益伟、郭京翔、胡越、陈浩楠、陈俊廷、吴睿海。通讯作者为新加坡国立大学计算机学院助理教授邵林,研究方向为

    阅读全文
  • 文章封面

    华为盘古首次露出,昇腾原生72B MoE架构,SuperCLUE千亿内模型并列国内第一

    作者:机器之心发布日期:2025-05-28 16:09:05

    机器之心发布机器之心编辑部当前,混合专家模型(Mixture of Experts, MoE)在大型语言模型中的兴起,使得以较小的计算开销换取更大能力成为可能。然而,传统 MoE 普遍存在专家激活频次

    阅读全文
  • 文章封面

    LLM加RL遭质疑:故意用错奖励,数学基准也显著提升,AI圈炸了

    作者:机器之心发布日期:2025-05-28 16:09:05

    机器之心报道编辑:泽南、+0我们训练了这么久,都在训练些什么?这是今年最「好笑」的一篇论文。本文一出,所有的大语言模型(LLM)+ 强化学习(RL)都要被质疑是否有意义了。这周二,一篇来自华盛顿大学、

    阅读全文
  • 文章封面

    SIGGRAPH 2025 | CLR-Wire:曲线框可生成?可交互?深大VCC带你见证魔法

    作者:机器之心发布日期:2025-05-28 16:09:05

    深圳大学黄惠团队独立推出 CLR-Wire:连续潜空间驱动的三维曲线框生成方法,首次实现了将复杂的三维曲线框结构统一编码到连续的潜空间中,解决了传统方法难以同时有效捕捉线框几何和拓扑信息的难题。这一创

    阅读全文
  • 文章封面

    传统云还在「卖铁」,下一代云已在「炼钢」:火山引擎xLLM如何一张卡榨出两张的性能!

    作者:机器之心发布日期:2025-05-27 12:11:06

    机器之心报道编辑:Panda大模型越来越聪明,企业却似乎越来越焦虑了。模型性能突飞猛进,从写文案到搭智能体(Agent),AI 掌握的技能也越来越多。但一到真正上线部署,问题就来了:为什么推理成本越来

    阅读全文
  • 文章封面

    One RL to See Them All?一个强化学习统一视觉-语言任务!

    作者:机器之心发布日期:2025-05-27 12:11:06

    机器之心报道编辑:+0、Panda强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。然而,RL 在推理任务之外的应用,尤其是在目标检测 和目标定位等感知密集型任务中的应用,仍有待深

    阅读全文
  • 文章封面

    让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力

    作者:机器之心发布日期:2025-05-27 12:11:06

    在大型推理模型(例如 OpenAI-o3)中,一个关键的发展趋势是让模型具备原生的智能体能力。具体来说,就是让模型能够调用外部工具(如网页浏览器)进行搜索,或编写/执行代码以操控图像,从而实现「图像中

    阅读全文
  • 文章封面

    北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强

    作者:机器之心发布日期:2025-05-27 12:11:06

    随着大语言模型(LLM)能力的快速迭代,传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征,例如价值观、性格和社交智能?如何建立更全面、更可靠的 AI 评估体系?北京大学宋国杰教授团队最

    阅读全文
  • 文章封面

    惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死

    作者:机器之心发布日期:2025-05-26 09:28:12

    机器之心原创编辑:杜伟国产智能体,这次真封神了。过去这段时间,「智能体」简直杀疯了。无论是初创公司还是互联网大厂,主流 AI 玩家们都开始围着它转,说它是大模型的下一站也毫不夸张。作为人工智能的一种高

    阅读全文
  • 文章封面

    微软副总裁X上「开课」,连更关于RL的一切,LLM从业者必读

    作者:机器之心发布日期:2025-05-26 09:28:12

    选自𝕏作者:Nando de Freitas机器之心编译别人都在用 X 发帖子,分享新鲜事物,微软副总裁 Nando de Freitas 却有自己的想法:他要在 X 上「开课」,发布一些关于人工智能

    阅读全文
  • 文章封面

    ACL 2025 高分接收 | 高感情语音技术:逻辑智能小语种TTS破局之道

    作者:机器之心发布日期:2025-05-26 09:28:12

    该工作由北京深度逻辑智能科技有限公司×宁波东方理工EIT-NLP实验室联合完成。语音合成(TTS)技术近十年来突飞猛进,从早期的拼接式合成和统计参数模型,发展到如今的深度神经网络与扩散、GAN 等先进

    阅读全文
上一页下一页