AgentDoG:为AI智能体戴上「诊断项圈」
随着 AI 智能体(Agent)能力日益强大,其自主行为带来的安全风险也愈发复杂。现有安全工具往往只能给出「安全 / 不安全」的简单判断,无法告知我们风险的根源。为此,上海人工智能实验室正式开源 Ag
阅读全文随着 AI 智能体(Agent)能力日益强大,其自主行为带来的安全风险也愈发复杂。现有安全工具往往只能给出「安全 / 不安全」的简单判断,无法告知我们风险的根源。为此,上海人工智能实验室正式开源 Ag
阅读全文编辑|泽南大模型的革命行将结束,即将开启的会是物理 AI 时代?上周,图灵奖得主、深度学习先驱 Yann LeCun 对通用人工智能(AGI)发表了自己的最新观点。他认为语言并不等同于智能,预测文本并
阅读全文编辑|SIA你负责写方法,AI负责画 Figure。 科研打工人,终于等来「画图解放日」。还在为论文里的方法框图熬夜画 PPT、拉箭头、对齐字体吗?一张 Figure 2,动辄几个小时,严重的甚至能耗
阅读全文本文来自复旦大学和阿里巴巴未来生活实验室,已中稿 ICLR 2026。目前的视觉推理方法衍生出了多种思考模式,主要有和 LLM 一致的纯文本思考模式以及更加贴近图片的用图思考。两种推理模式在不同的领域
阅读全文机器之心编辑部你有没有想过一个问题:为什么和 AI 对话,总觉得少了点「人味儿」。不是它回答得不够准确,也不是它理解不了你的意思,而是每次交互都很机械。你问一句,等它答完,然后突然画面一转,对不起,它
阅读全文编辑 | 杜伟、泽南又一位大佬准备对现有 AI 技术范式开刀了。今天凌晨,英伟达高级研究科学家、机器人团队负责人 Jim Fan(范麟熙)发布文章《第二代预训练范式》,引发了机器学习社区的讨论。Jim
阅读全文近日,美团推出全新多模态统一大模型方案 STAR(STacked AutoRegressive Scheme for Unified Multimodal Learning),凭借创新的 "堆叠自回归
阅读全文机器之心编辑部何恺明团队新论文,再次「大道至简」。此次研究直指当前以 DiT 为代表的主流扩散模型与流匹配模型存在的通病,并提出了一种用于单步、无潜空间(Latent-free)的图像生成新框架。论文
阅读全文编辑|张倩刚刚,谷歌发布了一项新的研究进展:他们用 Gemini 做了一次系统性的数学攻关实验,把目标对准了著名的 Erdős Problems 数据库里 700 个仍被标注为 open(未解决)的猜
阅读全文面对同行评审,许多作者都有过这样的经历:明明回答了审稿人的每一个问题,态度也足够谦卑,为什么最终还是没能打动对方?现有的通用大模型在处理这类任务时,往往陷入一种 “表面礼貌” 的陷阱:它们擅长生成流畅
阅读全文编辑|张倩这个周末,整个科技圈都被 moltbook 刷屏了。简单来说,这是一个专为 AI 设立的社交平台(类似 Reddit、知乎、贴吧),所有 AI Agent 都可以在上面发帖、交流,而人类只能
阅读全文编辑|杨文近日,「发推狂魔」马斯克转发了一个帖子,Neuralink 植入脑芯片的患者,现在已经能靠脑子里的意念直接玩游戏了,完全不需要手柄、鼠标、键盘啥的控制器。对于网友「我们正生活在未来,这太神奇
阅读全文魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor
阅读全文机器之心编辑部今年 1 月,DeepSeek 发布了一项名为 Engram(条件记忆)的技术,在大模型圈子里掀起不小波澜。它的核心思想很简单:别让模型死记硬背常识,直接给它一个「外挂记忆库」。具体做法
阅读全文编辑|PandaTransformer 是当前 LLM 大发展的核心基础,但也有不少顶尖研究者更愿意探索其它道路。在这其中,甚至包括 Transformer 的创造者之一、Sakana AI 创始人联
阅读全文作者介绍:刘梦源,北京大学深圳研究生院研究员,研究领域为人类行为理解与机器人技能学习;盛举义,北京大学在读博士研究生,研究方向为机器人操作技能学习方法研究;王梓懿、李培铭,北京大学在读硕士研究生,研究
阅读全文作者 | 白铂 博士白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家引言本篇是《大模型的第一性原理》系列解读文章的第二篇(点击回顾第一篇),我们将从信号处理的角度解读原论文[1]。重
阅读全文编辑|杜伟谷歌世界模型,再一次惊艳了所有人!今天一早,谷歌 DeepMind 开放了世界模型 Genie 3 的实验性研究原型「Project Genie」,允许用户创建、编辑并探索虚拟世界。在世界模
阅读全文近年来,大模型在数学推理、代码生成等任务上的突破,背后一个关键技术是 RLVR(Reinforcement Learning with Verifiable Rewards)。简单来说,RLVR 不是
阅读全文编辑|泽南、Panda今天上午,上海创智学院 OpenMOSS 团队联合初创公司模思智能(MOSI),正式发布了端到端音视频生成模型 —— MOVA(MOSS-Video-and-Audio)。作为中
阅读全文编辑|杨文AI 网红们在社交平台上混得风生水起。他们手握品牌合作,还坐拥百万粉丝,但很多人至今不知这些都是 AI 生成的,依然像追真人明星一样互动、点赞、被种草。视频来源:X 博主 @thetripa
阅读全文编辑|冷猫你想象中真正的 AI 是什么样子的?至少有一点,大多数人会同意:未来的 AI,应该具备像人一样思考的能力。问题在于,我们现在研究大模型走的这条路,能通向真正的「思考」吗?当前最先进的大模型系
阅读全文编辑|+0最近,一段「威尔·史密斯吃意面」的今昔对比视频在社交媒体刷屏,引发了无数感慨。两年前,初出茅庐的 AI 视频还是「抽象鬼畜」的代名词,五官乱飞、逻辑崩坏;仅仅两年过去,当同一主题再次被演绎,
阅读全文机器之心编辑部在技术如火如荼发展的当下,业界常常在思考一个问题:如何利用 AI 发现科学问题的新最优解?一个普遍的解法是「测试时搜索」(Test-time search),即提示一个冻结的(不更新参数
阅读全文1. 深度学习下的场景理解:从密集网格到对象中心表征单目 3D 语义场景补全 (Semantic Scene Completion, SSC) 是具身智能与自动驾驶领域的一项核心技术,其目标是仅通过单
阅读全文编辑|Youli你的下一个视频团队,不一定非得是人。做电商的朋友,一定对这样的时刻不陌生:前期找团队、磨脚本、拍视频,筹备了半个月,好不容易在亚马逊或 TikTok 后台上新一款潜力爆款。谁想到,半夜
阅读全文机器之心编辑部一觉醒来,我们看到了微软自研 AI 芯片的最新进展。微软原定于 2025 年发布的下一代 AI 芯片 Maia 200,终于在今天问世!微软 CEO Satya Nadella根据微软官
阅读全文过去几年,机制可解释性(Mechanistic Interpretability)让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成:从单个神经元到注意力头,再到
阅读全文编辑|杨文2026 年,AI 大模型的军备竞赛仍在继续。各家公司争相发布更强大的模型版本,比拼参数量、推理速度、benchmark 得分,整个行业陷入了一种近乎狂热的「性能偏执」。在这种逻辑下,大部分
阅读全文编辑|张倩、陈陈过去两年,大模型的推理能力出现了一次明显的跃迁。在数学、逻辑、多步规划等复杂任务上,推理模型如 OpenAI 的 o 系列、DeepSeek-R1、QwQ-32B,开始稳定拉开与传统指
阅读全文