刚刚!OpenAI回滚了最新版本的GPT-4o,因ChatGPT「过于谄媚」
机器之心报道编辑:杨文、Panda昨晚,奥特曼在 X 上发了条帖子,大意是由于发现 GPT-4o 「过于谄媚」的问题,所以从周一晚上开始回滚 GPT-4o 的最新更新。免费 ChatGPT 用户已 1
阅读全文机器之心报道编辑:杨文、Panda昨晚,奥特曼在 X 上发了条帖子,大意是由于发现 GPT-4o 「过于谄媚」的问题,所以从周一晚上开始回滚 GPT-4o 的最新更新。免费 ChatGPT 用户已 1
阅读全文机器之心报道编辑:刘欣在人工智能领域,语言模型的发展日新月异,推理能力作为语言模型的核心竞争力之一,一直是研究的焦点,许多的 AI 前沿人才对 AI 推理的效率进行研究。高昂的计算成本和复杂的硬件需求
阅读全文论文作者包括来自上海交通大学的杨滢轩、柴化灿、宋源祎、齐思远、温睦宁、李宁、廖俊威、胡浩毅、林江浩、刘卫文、温颖、俞勇、张伟楠,以及 ANP 社区发起人常高伟。随着大语言模型 (LLM) 技术的迅猛发
阅读全文李武军教授为通讯作者,硕士生林昊(已毕业,现工作于阿里巴巴)、吴轲、李杰为共同第一作者,博士生李俊为参与作者。训练成本高昂已经成为大模型和人工智能可持续发展的主要障碍之一。大模型的训练往往采用多机多卡
阅读全文机器之心报道编辑:Panda、杜伟今天凌晨,从昨晚开始预热、备受全球 AI 圈关注的 Qwen3 系列模型终于正式亮相了!Qwen3 模型依旧采用宽松的 Apache2.0 协议开源,全球开发者、研究
阅读全文机器之心报道机器之心编辑部近日,ISCA Fellow 2025 入选结果揭晓!ISCA Fellow 是由国际语音通讯协会(International Speech Communication As
阅读全文本篇工作已被电子设计自动化领域顶级会议 DAC 2025 接收,由上海交大计算机学院蒋力教授与刘方鑫助理教授带领的 IMPACT 课题组完成,同时也获得了华为 2012 实验室和上海期智研究院的支持。
阅读全文机器之心报道机器之心编辑部聚是一团火,散是满天星。硅谷新势力已经崛起,这些创业者来自 OpenAI。作为 ChatGPT 的缔造者,OpenAI 堪称当今人工智能领域最耀眼的明星。这家公司正以惊人的速
阅读全文机器之心报道编辑:杜伟最近,DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展(length scaling),通过强化学习(比如 PPO、GPRO)训练模型
阅读全文钱成目前是伊利诺伊大学香槟分校 (UIUC) 一年级博士生,导师为季姮教授。本科就读于清华大学,导师为刘知远教授。其工作集中在大语言模型工具使用与推理以及人工智能体方向。曾在 ACL,EMNLP,CO
阅读全文机器之心报道编辑:陈萍、+0大型语言模型(LLMs)在广泛的自然语言处理(NLP)任务中展现出了卓越的能力。然而,它们迅速增长的规模给高效部署和推理带来了巨大障碍,特别是在计算或内存资源有限的环境中。
阅读全文机器之心报道编辑:Panda近些年,AI 领域的技术不断快速迭代,各种新名词层出不穷,MoE、强化学习、智能体、computer-use、A2A…… 对没有技术背景的普通用户来说,这些名词和技术概念无
阅读全文机器之心报道机器之心编辑部最近,独角兽 AI 公司 Cognition AI(Cognition Labs)推出了一个开源项目——DeepWiki,旨在为 GitHub 上的公共代码仓库生成 AI 驱
阅读全文论文有两位共同一作。郑凯文为清华大学计算机系三年级博士生,何冠德为德州大学奥斯汀分校(UT Austin)一年级博士生。扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展
阅读全文本文由上海人工智能实验室,悉尼大学,牛津大学联合完成。第一作者周恒为上海 ailab 实习生和 Independent Researcher 耿鹤嘉。通讯作者为上海人工智能实验室青年科学家白磊和牛津大
阅读全文机器之心报道编辑:Sia、杨文六边形战士来了。今天,kimi 又发布了新的开源项目 —— 一个全新的通用音频基础模型 Kimi-Audio,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在十
阅读全文机器之心报道机器之心编辑部在斯坦福,有一门专门讲 Transformer 的课程,名叫 CS 25。这门课曾经邀请过 Geoffrey Hinton、Andrej Karpathy 以及 OpenAI
阅读全文近日,上海交通大学航空航天学院李元祥教授团队,联合上海飞机设计研究院和东方航空技术有限公司 MCC,在国产大飞机核心系统的智能诊断方向取得重要突破。研究团队围绕引气系统的跨机型诊断难题,首次构建基于时
阅读全文OpenAI 的 o1 系列模型、Deepseek-R1 带起了推理模型的研究热潮,但这些推理模型大多关注数学、代码等专业领域。如何将这种深度推理模型扩展到智能体和具身领域,让机器人通过思考和推理来完
阅读全文机器之心原创作者:杜伟2025 年第一个「爆款预定」的智能体 App,就这么华丽丽地来了!无需邀请码,也不用申请内测,不玩任何套路。在备受关注的 AI 智能体赛道,百度抢先丢下了一颗「重磅炸弹」。 4
阅读全文机器之心报道机器之心编辑部你说不出来的话,大模型替你说了。图像描述(image captioning)生成一直是计算机视觉和自然语言处理领域面临的长期挑战,因为它涉及理解和用自然语言描述视觉内容。虽然
阅读全文当前,基于强化学习提升多模态模型的推理能力已经取得一定的进展。但大多研究者们选择 7B+ 的模型作为基座,这对于许多资源有限的科研人员而言仍存在显著的门槛。同时,在视频推理领域,由于高质量强推理性数据
阅读全文近年来,大语言模型(LLM)在人工智能领域取得了突破性进展,成为推动自然语言处理技术发展与通用人工智能实现的核心力量。上下文学习能力(In-Context Learning, ICL)是 LLM 最显
阅读全文机器之心转载作者:孙浩RL + LLM 升级之路的四层阶梯。2025 年伊始,RL 以一种破局归来的姿态在 LLM 的后训练时代证明了其巨大价值,Sutton 和 Barto 拿了图灵奖,David
阅读全文机器之心报道编辑:蛋酱、+0在大语言模型(LLMs)竞争日趋白热化的今天,「推理能力」已成为评判模型优劣的关键指标。OpenAI 的 o 系列、Anthropic 的 Claude 和 DeepSee
阅读全文研究团队由来自北京通用人工智能研究院(BIGAI)、清华大学和北京大学的跨专业研究者组成,致力于具身智能领域的前沿研究。团队成员在开发高效、智能的通用机器人技术,特别是机械灵巧手操作方面,拥有丰富的研
阅读全文机器之心发布机器之心编辑部OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明,大规模强化学习已成为一种极为有效的方法,能够激发大型语言模型(LLM) 的复杂推理行为并显著提升其能力
阅读全文机器之心报道机器之心编辑部AI 不再仅仅是一个工具,而是开始成为一个真正的队友。可以对标 Manus 的智能体 Suna 来了!(有没有发现它是 manus 倒过来写)这款智能体由 Kortix AI
阅读全文本文由清华黄高教授团队完成,第一作者王政是清华 MEM 工程管理硕士,SeamLessAI 创始人,曾任爱奇艺虚拟机云平台负责人,小红书商业化算法工程团队负责人。刚刚,清华大模型团队 LeapLab
阅读全文本文由 NUS ShowLab 主导完成。第一作者顾宇超为新加坡国立大学 ShowLab@NUS 在读博士生,研究方向是视觉生成,在 CVPR、ICCV、NeurIPS 等国际顶级会议与期刊上发表多篇
阅读全文