全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    刚刚!OpenAI回滚了最新版本的GPT-4o,因ChatGPT「过于谄媚」

    作者:机器之心发布日期:2025-04-30 12:23:28

    机器之心报道编辑:杨文、Panda昨晚,奥特曼在 X 上发了条帖子,大意是由于发现 GPT-4o 「过于谄媚」的问题,所以从周一晚上开始回滚 GPT-4o 的最新更新。免费 ChatGPT 用户已 1

    阅读全文
  • 文章封面

    只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍

    作者:机器之心发布日期:2025-04-30 12:23:28

    机器之心报道编辑:刘欣在人工智能领域,语言模型的发展日新月异,推理能力作为语言模型的核心竞争力之一,一直是研究的焦点,许多的 AI 前沿人才对 AI 推理的效率进行研究。高昂的计算成本和复杂的硬件需求

    阅读全文
  • 文章封面

    上交大推出首个AI智能体协议全面综述:从碎片化到互联互通的智能体网络

    作者:机器之心发布日期:2025-04-30 12:23:28

    论文作者包括来自上海交通大学的杨滢轩、柴化灿、宋源祎、齐思远、温睦宁、李宁、廖俊威、胡浩毅、林江浩、刘卫文、温颖、俞勇、张伟楠,以及 ANP 社区发起人常高伟。随着大语言模型 (LLM) 技术的迅猛发

    阅读全文
  • 文章封面

    CVPR Oral | 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍

    作者:机器之心发布日期:2025-04-30 12:23:28

    李武军教授为通讯作者,硕士生林昊(已毕业,现工作于阿里巴巴)、吴轲、李杰为共同第一作者,博士生李俊为参与作者。训练成本高昂已经成为大模型和人工智能可持续发展的主要障碍之一。大模型的训练往往采用多机多卡

    阅读全文
  • 文章封面

    猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型王座,深夜爆火

    作者:机器之心发布日期:2025-04-29 07:04:57

    机器之心报道编辑:Panda、杜伟今天凌晨,从昨晚开始预热、备受全球 AI 圈关注的 Qwen3 系列模型终于正式亮相了!Qwen3 模型依旧采用宽松的 Apache2.0 协议开源,全球开发者、研究

    阅读全文
  • 文章封面

    语音领域ISCA Fellow 2025公布:上海交大俞凯、台大李宏毅等三位华人入选

    作者:机器之心发布日期:2025-04-29 07:04:57

    机器之心报道机器之心编辑部近日,ISCA Fellow 2025 入选结果揭晓!ISCA Fellow 是由国际语音通讯协会(International Speech Communication As

    阅读全文
  • 文章封面

    上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

    作者:机器之心发布日期:2025-04-29 07:04:57

    本篇工作已被电子设计自动化领域顶级会议 DAC 2025 接收,由上海交大计算机学院蒋力教授与刘方鑫助理教授带领的 IMPACT 课题组完成,同时也获得了华为 2012 实验室和上海期智研究院的支持。

    阅读全文
  • 文章封面

    除了Ilya、Karpathy,离职OpenAI的大牛们,竟然创立了这么多公司

    作者:机器之心发布日期:2025-04-28 12:32:10

    机器之心报道机器之心编辑部聚是一团火,散是满天星。硅谷新势力已经崛起,这些创业者来自 OpenAI。作为 ChatGPT 的缔造者,OpenAI 堪称当今人工智能领域最耀眼的明星。这家公司正以惊人的速

    阅读全文
  • 文章封面

    字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题

    作者:机器之心发布日期:2025-04-28 12:32:10

    机器之心报道编辑:杜伟最近,DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展(length scaling),通过强化学习(比如 PPO、GPRO)训练模型

    阅读全文
  • 文章封面

    首个系统性工具使用奖励范式,ToolRL刷新大模型训练思路

    作者:机器之心发布日期:2025-04-28 12:32:10

    钱成目前是伊利诺伊大学香槟分校 (UIUC) 一年级博士生,导师为季姮教授。本科就读于清华大学,导师为刘知远教授。其工作集中在大语言模型工具使用与推理以及人工智能体方向。曾在 ACL,EMNLP,CO

    阅读全文
  • 文章封面

    模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了

    作者:机器之心发布日期:2025-04-28 12:32:10

    机器之心报道编辑:陈萍、+0大型语言模型(LLMs)在广泛的自然语言处理(NLP)任务中展现出了卓越的能力。然而,它们迅速增长的规模给高效部署和推理带来了巨大障碍,特别是在计算或内存资源有限的环境中。

    阅读全文
  • 文章封面

    纳米AI放大招!MCP万能工具箱,人人都能用上超级智能体

    作者:机器之心发布日期:2025-04-27 18:40:25

    机器之心报道编辑:Panda近些年,AI 领域的技术不断快速迭代,各种新名词层出不穷,MoE、强化学习、智能体、computer-use、A2A…… 对没有技术背景的普通用户来说,这些名词和技术概念无

    阅读全文
  • 文章封面

    Devin开发团队开源DeepWiki,助你快速读懂所有GitHub代码库

    作者:机器之心发布日期:2025-04-27 18:40:25

    机器之心报道机器之心编辑部最近,独角兽 AI 公司 Cognition AI(Cognition Labs)推出了一个开源项目——DeepWiki,旨在为 GitHub 上的公共代码仓库生成 AI 驱

    阅读全文
  • 文章封面

    ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

    作者:机器之心发布日期:2025-04-27 18:40:25

    论文有两位共同一作。郑凯文为清华大学计算机系三年级博士生,何冠德为德州大学奥斯汀分校(UT Austin)一年级博士生。扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展

    阅读全文
  • 文章封面

    基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作

    作者:机器之心发布日期:2025-04-27 18:40:25

    本文由上海人工智能实验室,悉尼大学,牛津大学联合完成。第一作者周恒为上海 ailab 实习生和 Independent Researcher 耿鹤嘉。通讯作者为上海人工智能实验室青年科学家白磊和牛津大

    阅读全文
  • 文章封面

    秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一

    作者:机器之心发布日期:2025-04-26 12:33:03

    机器之心报道编辑:Sia、杨文六边形战士来了。今天,kimi 又发布了新的开源项目 —— 一个全新的通用音频基础模型 Kimi-Audio,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在十

    阅读全文
  • 文章封面

    OpenAI、谷歌等一线大模型科学家公开课,斯坦福CS 25春季上新!

    作者:机器之心发布日期:2025-04-26 12:33:03

    机器之心报道机器之心编辑部在斯坦福,有一门专门讲 Transformer 的课程,名叫 CS 25。这门课曾经邀请过 Geoffrey Hinton、Andrej Karpathy 以及 OpenAI

    阅读全文
  • 文章封面

    跨机型诊断难题新突破:上交大、商飞、东航打造国产大飞机时序大模型智能诊断新路径

    作者:机器之心发布日期:2025-04-26 12:33:03

    近日,上海交通大学航空航天学院李元祥教授团队,联合上海飞机设计研究院和东方航空技术有限公司 MCC,在国产大飞机核心系统的智能诊断方向取得重要突破。研究团队围绕引气系统的跨机型诊断难题,首次构建基于时

    阅读全文
  • 文章封面

    具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

    作者:机器之心发布日期:2025-04-26 12:33:03

    OpenAI 的 o1 系列模型、Deepseek-R1 带起了推理模型的研究热潮,但这些推理模型大多关注数学、代码等专业领域。如何将这种深度推理模型扩展到智能体和具身领域,让机器人通过思考和推理来完

    阅读全文
  • 文章封面

    95后团队30天造出通用超级智能体!百度心响App全量上线、人人免费用,亲测效果惊艳

    作者:机器之心发布日期:2025-04-25 17:30:28

    机器之心原创作者:杜伟2025 年第一个「爆款预定」的智能体 App,就这么华丽丽地来了!无需邀请码,也不用申请内测,不玩任何套路。在备受关注的 AI 智能体赛道,百度抢先丢下了一颗「重磅炸弹」。 4

    阅读全文
  • 文章封面

    英伟达开源「描述一切」模型,拿下7个基准SOTA

    作者:机器之心发布日期:2025-04-25 17:30:28

    机器之心报道机器之心编辑部你说不出来的话,大模型替你说了。图像描述(image captioning)生成一直是计算机视觉和自然语言处理领域面临的长期挑战,因为它涉及理解和用自然语言描述视觉内容。虽然

    阅读全文
  • 文章封面

    北航推出全开源TinyLLaVA-Video-R1,小尺寸模型在通用视频问答数据上也能复现Aha Moment!

    作者:机器之心发布日期:2025-04-25 17:30:28

    当前,基于强化学习提升多模态模型的推理能力已经取得一定的进展。但大多研究者们选择 7B+ 的模型作为基座,这对于许多资源有限的科研人员而言仍存在显著的门槛。同时,在视频推理领域,由于高质量强推理性数据

    阅读全文
  • 文章封面

    大模型何以擅长小样本学习?ICLR 2025这项研究给出详细分析

    作者:机器之心发布日期:2025-04-25 17:30:28

    近年来,大语言模型(LLM)在人工智能领域取得了突破性进展,成为推动自然语言处理技术发展与通用人工智能实现的核心力量。上下文学习能力(In-Context Learning, ICL)是 LLM 最显

    阅读全文
  • 文章封面

    被《经验时代》刷屏之后,剑桥博士长文讲述RL破局之路

    作者:机器之心发布日期:2025-04-24 12:13:05

    机器之心转载作者:孙浩RL + LLM 升级之路的四层阶梯。2025 年伊始,RL 以一种破局归来的姿态在 LLM 的后训练时代证明了其巨大价值,Sutton 和 Barto 拿了图灵奖,David

    阅读全文
  • 文章封面

    TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨

    作者:机器之心发布日期:2025-04-24 12:13:05

    机器之心报道编辑:蛋酱、+0在大语言模型(LLMs)竞争日趋白热化的今天,「推理能力」已成为评判模型优劣的关键指标。OpenAI 的 o 系列、Anthropic 的 Claude 和 DeepSee

    阅读全文
  • 文章封面

    机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

    作者:机器之心发布日期:2025-04-24 12:13:05

    研究团队由来自北京通用人工智能研究院(BIGAI)、清华大学和北京大学的跨专业研究者组成,致力于具身智能领域的前沿研究。团队成员在开发高效、智能的通用机器人技术,特别是机械灵巧手操作方面,拥有丰富的研

    阅读全文
  • 文章封面

    业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

    作者:机器之心发布日期:2025-04-23 12:28:42

    机器之心发布机器之心编辑部OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明,大规模强化学习已成为一种极为有效的方法,能够激发大型语言模型(LLM) 的复杂推理行为并显著提升其能力

    阅读全文
  • 文章封面

    仅用3周时间,就打造出Manus开源平替!贡献源代码,免费用

    作者:机器之心发布日期:2025-04-23 12:28:42

    机器之心报道机器之心编辑部AI 不再仅仅是一个工具,而是开始成为一个真正的队友。可以对标 Manus 的智能体 Suna 来了!(有没有发现它是 manus 倒过来写)这款智能体由 Kortix AI

    阅读全文
  • 文章封面

    清华LeapLab开源cooragent框架:一句话构建您的本地智能体服务群

    作者:机器之心发布日期:2025-04-23 12:28:42

    本文由清华黄高教授团队完成,第一作者王政是清华 MEM 工程管理硕士,SeamLessAI 创始人,曾任爱奇艺虚拟机云平台负责人,小红书商业化算法工程团队负责人。刚刚,清华大模型团队 LeapLab

    阅读全文
  • 文章封面

    迈向长上下文视频生成!NUS团队新作FAR同时实现短视频和长视频预测SOTA,代码已开源

    作者:机器之心发布日期:2025-04-23 12:28:42

    本文由 NUS ShowLab 主导完成。第一作者顾宇超为新加坡国立大学 ShowLab@NUS 在读博士生,研究方向是视觉生成,在 CVPR、ICCV、NeurIPS 等国际顶级会议与期刊上发表多篇

    阅读全文
上一页下一页