在AI社会抓「内鬼」?上海AI Lab推出首个多智能体极端事件解释框架
序言:数字镜像中的极端涌现风起于青萍之末、不稳定的害群之马、羊群效应、毒瘤行为......—— 在数字镜像的背面,这群科学家凝视着 AI 社会的「黑天鹅」时刻。2023 年,斯坦福「模拟小镇」(Sma
阅读全文序言:数字镜像中的极端涌现风起于青萍之末、不稳定的害群之马、羊群效应、毒瘤行为......—— 在数字镜像的背面,这群科学家凝视着 AI 社会的「黑天鹅」时刻。2023 年,斯坦福「模拟小镇」(Sma
阅读全文编辑|杨文浏览器,正在成为 AI 落地最重要的战场。去年 10 月,OpenAI 推出 AI 浏览器 Atlas,奥特曼将其定义为「十年一遇的机会」,放言要「改变 30 亿人使用互联网的方式」。Goo
阅读全文机器之心编辑部近日,NVIDIA 发布的世界 - 动作模型 DreamZero,在两项颇具代表性的机器人基准测试 RoboArena 、MolmoSpaces 上双双登顶。DreamZero 核心思想
阅读全文本文第一作者为王赞毅,本科毕业于西安交通大学,现为加州大学圣迭戈分校(UCSD)ECE 系硕士一年级学生。其主要研究方向为:视频理解,生成式建模。本工作为作者在国家电网思极 AI 实验室(SGIT A
阅读全文机器之心报道近日,在运筹优化领域的顶级赛事 CVRPLib BKS 全球挑战赛中,由华为诺亚方舟实验室、华为云天筹 AI 求解器团队、华为云加拿大实验室和香港城市大学张青富教授团队联合而成的 “Opt
阅读全文编辑|+0任何在通风橱前熬过夜、被繁琐的湿实验折磨过的科研人,看到这一幕大概都会心跳加速。在星河启智科学智能开放平台推出全面升级版本的发布会现场,大屏幕上实时展示了这样一段流程:超级科研合伙人「大圣」
阅读全文一、引言从内容分发到商业转化,推荐系统早已成为互联网平台的关键基础设施。它在海量信息与有限注意力之间完成筛选和排序,直接影响内容曝光、商品成交以及流量变现效率。用户在电商平台上看到的商品列表、在信息流
阅读全文机器之心编辑部最近,复旦大学肖仰华教授的朋友圈引起了热议,其在研发测试的 AI 智能体通过自主学习学会了操作微信,在朋友圈发消息并与其好友在评论区自主互动。面对自然的互动,不少好友甚至开始要求 “证明
阅读全文编辑|PandaAlex Radford,出生于1993 年 4 月,即将 33 岁,但已经拥有超过 32 万的引用量。因为这位「独立研究员」不仅是 GPT、GPT-2 和 CLIP 的第一作者,同时
阅读全文当 AI Agent 逐渐走出对话框,真正的难点不再是 “回答得多聪明”,而是能否像人一样完成任务闭环:看懂屏幕、点击按钮、填写表单、整理文件、生成交付物,并把结果同步回团队协作系统。我们开源的 Op
阅读全文机器之心编辑部整个具身智能领域都在探索世界模型的实用化路径。这个被寄予厚望的「数字模拟器」,本应成为机器人训练的核心工具,却因物理保真度低等问题成为「空中楼阁」。去年年中,谷歌发布了 Genie-3
阅读全文本文第一作者朱子瑞为新加坡国立大学四年级博士生,本科毕业于清华大学,研究方向为多模态大模型和后训练优化。通讯作者为 TikTok 内容智能负责人 Kanchan Sarkar、Meta杨振恒博士(相关
阅读全文编辑|Panda我隐隐约约有种感觉,这封裁员信在历史上会被记上一笔的…… 它在后世有可能是以「人类正式进入 XXX 时代」的标志性事件而被铭记。今天凌晨,一封发布在 X 上的裁员信引发了讨论热潮,短短
阅读全文Prompt 作为一种接口,直接影响 LLM 与 agent system 的行为方式与性能表现。对 prompts 的理解与控制,本质上决定了系统能力能够被释放到什么程度。Prompt learni
阅读全文机器之心编辑部在全球具身智能领域的顶级权威评测 WorldArena 榜单中,清华陈建宇(星动纪元创始人)团队联合斯坦福 Chelsea Finn(PI 创始人) 团队研发的 Ctrl-World 世
阅读全文编辑|冷猫去年 7 月的 IMO 数学奥林匹克竞赛中,两大人工智能公司抢夺竞赛「金牌」成绩的闹剧搞得沸沸扬扬。当时 OpenAI 和 谷歌 同时声称取得竞赛金牌,而 OpenAI 因绕过官方竞赛规则提
阅读全文编辑|杨文IBM 成人工智能领域最新受害者。周一,IBM 股价单日暴跌 13.2%,收于 223.35 美元,创下该公司自 2000 年 10 月以来最惨烈的单日跌幅,且月内跌幅已达 25%。这场风波
阅读全文机器之心编辑部新年假期像水一样流走了。在这个刚过去的新年里,全民讨论的最大话题就是 AI 和机器人。尤其是在春晚舞台表演功夫杂技的机器人明星一哥宇树,全球首次展现了高动态、高协同的全自主集群控制技术。
阅读全文语音情感识别(Speech Emotion Recognition, SER)在过去基本遵循同一种范式:输入语音,输出情绪标签。这种设定在工程上有效,但在认知层面却过于简化。在人类交流中,情绪判断从来
阅读全文编辑|Sia这个春节,AI 圈最硬核的一场「真人秀」,悄然完成了阶段性收官。主角不是动漫人物,也不是舞枪弄棒的机器人,而是一位 7×24 小时从不疲倦的 AI 科学家 FARS( Fully Auto
阅读全文机器之心发布近日,具身智能头部企业千寻智能连续完成两轮融资近 20 亿元,为行业发展注入强劲动能。本轮融资阵容堪称行业资本的集中亮相:云锋基金、红杉中国、混沌投资(葛卫东)等超一线机构重磅入局;Syn
阅读全文机器之心编辑部在最近 AI 领域内,智能体(Agent)的研究和应用越来越多,原生多智能体工作的基础模型也已开始出现。作为一个能够推理、规划和行动的系统,智能体正逐渐成为现实世界人工智能应用的常见范式
阅读全文编辑|杨文这个春节,MiniMax 杀疯了。2 月 20 日,港股马年首个交易日,MiniMax 收盘股价报涨 14.52%,市值一度冲破 3042 亿港元。这轮上涨并非只是资本市场的情绪宣泄。过去两
阅读全文「首个公开的面向 Terminal-Bench 环境交互类任务的数据规模化生产管线正式发布!」开源完整自动化数据构建算法构建 1655 个高可靠 CLI 任务环境镜像通过 291 条轨迹数据带来 20
阅读全文编辑|张倩硅谷 AI 人才市场,正在经历前所未有的复杂周期:无论是招人还是找工作,想要双向匹配都比以前困难。站在招聘方这边,最常见的体验是:你想要的人根本招不到,甚至连对方愿不愿意聊一聊都很难说。站在
阅读全文近年来,大模型文本检索(LLM-based Text Retrieval)技术发展迅猛,SOTA 的 LLM Embedding Model 参数量普遍在 7B 以上,相关性搜索性能提升的同时,部署成
阅读全文机器之心编辑部当大多数的 AI 厂商都在忙着打造更多 AI 工具的时候,一家以制作 AI 视频著称的公司居然开始制作「第二个你」了。近日,Pika 推出 AI Selves 产品,宣称可以生成「AI
阅读全文在衡量大语言模型(LLM)代码生成能力的竞赛中,一个日益严峻的问题正浮出水面:当模型在 HumanEval、MBPP 等经典基准上纷纷取得近乎饱和的成绩时,我们究竟是在评估其真实的泛化推理能力,还是在
阅读全文机器之心编辑部上周,谷歌发布了 Gemini 3 Deep Think 的一次重大更新,以应对当今科学、研究和工程领域的复杂挑战。而就在刚刚,谷歌正式推出支撑这些突破的升级版核心智能:Gemini 3
阅读全文机器之心编译如果把人生看作一个开放式的大型多人在线游戏(MMO),那么游戏服务器在刚刚完成一次重大更新的时刻,规则改变了。自 2022 年 ChatGPT 惊艳亮相以来,世界已经发生了深刻变化。在短短
阅读全文