通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代
作者介绍: 本文作者来自通义实验室 RAG 团队,致力于面向下一代 RAG 技术进行基础研究。该团队 WebWalker 工作近期也被 ACL 2025 main conference 录用。论文:h
阅读全文作者介绍: 本文作者来自通义实验室 RAG 团队,致力于面向下一代 RAG 技术进行基础研究。该团队 WebWalker 工作近期也被 ACL 2025 main conference 录用。论文:h
阅读全文近日,抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上,使用 256 块 NPU,在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限
阅读全文机器之心报道编辑:张倩、陈陈谁说强化学习只能是蛋糕上的樱桃,说不定,它也可以是整个蛋糕呢?在 2016 年的一次演讲中,Yann LeCun 曾将强化学习比喻成蛋糕上的樱桃。他提到,「如果把智能比作一
阅读全文机器之心报道编辑:泽南强推理终于要卷速度了。大模型强推理赛道,又迎来一位重量级玩家。本周二,欧洲人工智能公司 Mistral AI 发布了 Magistral,这是一个全新的大语言模型(LLM)系列,
阅读全文本文将介绍 DeepMath-103K 数据集。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。本文的通讯作者为涂兆鹏,腾讯混元数字人专家研究员,研究方向为深度学习和大模型,在国际顶级期刊和会
阅读全文第一作者陈昌和是美国密歇根大学的研究生,师从 Nima Fazeli 教授,研究方向包括基础模型、机器人学习与具身人工智能,专注于机器人操控、物理交互与控制优化。第二作者徐晓豪是美国密歇根大学机器人学
阅读全文机器之心报道编辑:张倩、泽南为什么语言模型很成功,视频模型还是那么弱?「我一直很困惑,语言模型怎么能从下一个 token 预测中学到这么多,而视频模型从下一帧预测中学到的却那么少?难道是因为大模型(L
阅读全文机器之心报道编辑:杜伟、何欣东游戏直播等实时渲染门槛要被击穿了?Adobe 的一项新研究带来新的可能。近年来,视频合成技术已经取得了显著突破。其中,基于双向注意力机制的扩散 Transformer(D
阅读全文论文第一作者为何浩然,香港科技大学二年级博士,他的研究方向包括强化学习、生成流模型(GFlowNets)以及具身智能,通讯作者为香港科技大学电子与计算机工程系、计算机科学与工程系助理教授潘玲。测试时扩
阅读全文机器之心发布机器之心编辑部你是否注意到,现在的 AI 越来越 "聪明" 了?能写小说、做翻译、甚至帮医生看 CT 片,这些能力背后离不开一个默默工作的 "超级大脑工厂"——AI 算力集群。随着人工智能
阅读全文机器之心报道机器之心编辑部当前,AI 的「推理」能力已经在以 DeepSeek-R1、OpenAI o1/o3、Claude 3.7 Sonnet 为代表的推理大模型中得到了验证,它们显示出了非常类人
阅读全文本文第一作者为前阿里巴巴达摩院高级技术专家,现一年级博士研究生满远斌,研究方向为高效多模态大模型推理和生成系统。通信作者为第一作者的导师,UTA 计算机系助理教授尹淼。尹淼博士目前带领 7 人的研究团
阅读全文选自quantamagazine作者: Joseph Howlett机器之心编译三百多年前,数学家费马在书页边缘留下了一个看似简单却困扰了学者几个世纪的难题——费马大定理。1994 年,Andrew
阅读全文本文主要作者是吕昂和谢若冰。吕昂,中国人民大学博士生,研究方向为语言模型结构优化,导师为严睿教授;谢若冰,腾讯高级研究员,研究方向为大语言模型、推荐系统。最近的一篇论文中,来自人大和腾讯的研究者们的研
阅读全文该项目来自百家 AI,是北京邮电大学白婷副教授所指导的研究小组, 团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。大语言模型受限于固定上下文窗口,长期对话中「失忆」、记忆断裂等问题频发,北邮
阅读全文机器之心原创作者:张倩恭喜国内视频创作者!从此,大家又多了一个好用的 AI 视频生成工具。「你们的产品到底什么时候在国内上线?」 最近,爱诗科技也体验了一把小说作者的待遇 —— 打开后台,发现私信全是
阅读全文机器之心报道编辑:杨文迄今为止行业最大的开源力度。在大模型上向来低调的小红书,昨天开源了首个自研大模型。该模型名为 dots.llm1,是小红书 hi lab(Humane Intelligence
阅读全文本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。该研究基于团队前期发布的 8B 扩
阅读全文本文作者分别来自西安交通大学、马萨诸塞大学阿默斯特分校、武汉大学以及南洋理工大学。第一作者张笑宇是来自西安交通大学的博士生,研究方向聚焦于大模型安全以及软件安全。通讯作者为西安交通大学沈超教授。在人工
阅读全文机器之心报道编辑:杜伟AI 开始从理解文字,全面进化到建模世界、操控实体、模拟大脑、解构分子。一晃 2025 年已经快要过半了!AI 领域依然「热闹非凡」,令人目不暇接。年初爆火的 DeepSeek
阅读全文机器之心发布机器之心编辑部在通往通用人工智能(AGI)的进程中,混合专家(MoE)模型凭借动态稀疏计算优势,成为大模型推理提效的关键路径。华为团队重磅推出昇腾平台原生设计的 Pangu Pro MoE
阅读全文DeepSeek-R1 爆火后,类 R1 的结果奖励训练范式在各领域掀起了推理热潮。基于规则的结果奖励实现简单、判断严格。但是,这真的够了吗? 在推理任务中,如果我们只是用「结果对错」来奖励模型,那模
阅读全文机器之心发布机器之心编辑部大型语言模型 (LLM) 的发展日新月异,但实时「内化」与时俱进的知识仍然是一项挑战。如何让模型在面对复杂的知识密集型问题时,能够自主决策获取外部知识的策略?华为诺亚方舟实验
阅读全文2025年6月6日-7日,第7届北京智源大会将以线上+线下联动的形式召开,4位图灵奖获得者演讲,30余位AI企业创始人&CEO分享,100余位全球青年科学家报告,两天会议将密集开展180余场人工智能主
阅读全文本研究由广州趣丸科技团队完成,团队长期致力于 AI 驱动的虚拟人生成与交互技术,相关成果已应用于游戏、影视及社交场景。趣丸科技团队提出了一种新颖的肖像驱动框架 Playmate,该算法能够根据音频和各
阅读全文机器之心报道编辑:陈陈、杜伟不得不感慨,陶哲轩真闲不住啊!昨天,他还在惊叹于谷歌 DeepMind AlphaEvolve 对解决人类数学问题(比如和差集问题)起到的加速作用。更早的时候,他还开通了油
阅读全文机器之心报道编辑:张倩「尽管经过 SFT 的模型可能看起来在进行推理,但它们的行为更接近于模式模仿 —— 一种缺乏泛化推理能力的伪推理形式。」随着 OpenAI 的 o1/o3 和 Deepseek-
阅读全文本文由 NUS ShowLab 主导完成。第一作者宋亦仁为新加坡国立大学 ShowLab@NUS 在读博士生,研究方向是视觉生成和多模态,在 CVPR、SIGGRAPH、NeurIPS 等国际顶级会议
阅读全文本文作者主要来自 Meta 和多所美国高校。第一作者是佐治亚理工机器学习专业的博士生赖柏霖(目前也是 UIUC 的访问学生),导师为 James Rehg 教授(已转入 UIUC),主要研究方向是多模
阅读全文机器之心发布机器之心编辑部孙子兵法有云:“故其疾如风,其徐如林”,意指在行进迅速时,如狂风飞旋;而在行进从容时,如森林徐徐展开。同样,对于大模型,我们也希望其面对简单问题时能减少思考内容,快速输出答案
阅读全文