arXiv变天:将脱离康奈尔大学独立,招聘CEO,网友:以后还能白嫖吗?
机器之心编辑部每次打开 arXiv 都能看到的那个「康奈尔大学」标识,很有可能将成为历史了。最近,arXiv 发布了一个官方信息,称「经过与康奈尔大学数十年富有成效的合作,并在西蒙斯基金会的支持下,a
阅读全文机器之心编辑部每次打开 arXiv 都能看到的那个「康奈尔大学」标识,很有可能将成为历史了。最近,arXiv 发布了一个官方信息,称「经过与康奈尔大学数十年富有成效的合作,并在西蒙斯基金会的支持下,a
阅读全文编辑|杜伟过去两天,全球爆火的 Agent 私人助手 OpenClaw,接连更新了两个版本,让人直呼「开发团队是不睡觉了吗?」之所以如此爆火,很大程度上归功于 OpenClaw 的长期记忆能力,它能够
阅读全文近年来,多模态大模型(Multimodal Large Language Models, MLLMs)正在迅速改变人工智能的能力边界。从图像理解到视频分析,从语音对话到复杂推理,大模型正在逐步具备类似
阅读全文机器之心编辑部Meta 的 AI 计划,突然踩了刹车。据《纽约时报》、路透社、彭博社等多家媒体报道,Meta 正在开发的新一代基础大模型 Avocado(牛油果),原本计划在本月发布,但由于性能未达预
阅读全文机器之心编辑部如果有一天,大模型不再依赖人类语言训练,会发生什么?过去几年,大模型能力的飞跃几乎都建立在一个前提之上:海量文本数据。互联网、书籍、代码、论文,几乎所有人类留下的语言痕迹,都被当作训练数
阅读全文本文主要完成单位为上海人工智能实验室,主要作者谢文轩、谭鑫、陆超超、胡侠等,通讯作者为实验室青年研究员汪旭鸿。当长上下文成为负担:我们是否真的需要「把一切都塞进推理模型」?当前,随着大家对大模型推理能
阅读全文编辑 | 泽南AI 视频赛道的竞争,已经跨过了比拼谁生成视频更长、更逼真的初级阶段,正在迈向实时交互、模拟真实物理规律的技术分水岭。在这个重要节点上,一家成立不到三年的中国创业公司率先抢跑,还顺势拿下
阅读全文编辑|杨文最近,谷歌 NotebookLM 又出了个好玩好用的小功能:Cinematic Video Overviews(电影级视频概览)。与普通模板不同,这项功能可以根据我们上传的资料,自动生成定制
阅读全文论文第一作者为魏彤,清华大学在读博士生,研究方向为大模型智能体和强化学习,导师为清华大学兴军亮、史元春;共同一作为腾讯杨一君;合作者为北京大学卢宗青;通讯作者为叶德珩。基于可验证奖励的强化学习(Rei
阅读全文机器之心编辑部速度、质量、管线可用性,是 AI 3D 生成领域公认的不可能三角。三件事,从来没有同时成立过。直到现在。VAST 最新发布的 Tripo P1.0,首次在原生三维空间中实现概率生成,2
阅读全文机器之心发布一个月前我们发布了基于华为 openJiuwen 开源社区构建的 DeepAgent 和 DeepSearch 两款智能体双双霸榜 [DeepAgent与DeepSearch双双霸榜!答案
阅读全文最近,一个叫OpenClaw(小龙虾)的开源项目突然爆火,甚至出现线下排队安装的场面。很多人第一次直观地看到,AI不只是chatbot,而是可以真正“动手”操作电脑、完成复杂任务和个性化工作流的智能体
阅读全文如今,Test-Time Scaling(测试时扩展)已成为提升模型推理能力的关键路径。而在这一浪潮中,块扩散语言模型(Block Diffusion Language Models, BDLMs)
阅读全文机器之心编辑部谁能想到,OpenClaw 火到了今天,甚至出现了排队等待安装的盛况。一些大厂也开始入局,选择接入 OpenClaw。龙虾热已经发展为现象级,但问题是:究竟有多少行业能够真正将其投入使用
阅读全文机器之心编辑部在「龙虾热」蔓延全国的此刻,大家把越来越多的工作交给 AI。从写代码到数据分析,很多人开始尝试让 AI 接管完整流程。人工智能能力的跃升似乎正逼迫着人们直面「自我价值」的拷问:「AI 会
阅读全文随着大语言模型 Agent 开始在对话、问答与复杂交互环境中长期运行,“记忆该如何设计” 正在成为一个绕不开的核心问题。 论文标题:PlugMem: A Task-Agnostic Plugin Me
阅读全文一、引言在生成式 AI 浪潮中,文生图技术已实现跨越式发展,在视觉呈现上达到了前所未有的高度。然而,在生成图像中准确合成拼写正确、结构规范且风格协调的文字 —— 视觉文本渲染(Visual Text
阅读全文编辑|Sia硅谷投资圈惊呼,科技研究领域的谷歌地图来了!几乎一夜间,海外社交平台上的科技投资人、科学家都在聊它!这就像是科学研究领域的谷歌地图时刻。硅谷科技投资人 David Keel 的这句评价,直
阅读全文编辑|杜伟最近,Karpathy 玩 Vibe Coding 真真地上瘾了!上周末刚开源了「autoresearch」项目:给 AI Agent 提供一个规模虽小但真实可用的 LLM 训练环境,然后让
阅读全文机器之心编辑部2026 年伊始,AI 的进化逻辑正从「单一工具赋能」转向「场景深度共生」,当大模型在各领域持续突破,前沿科研与新材料研发领域,正迎来一场由 Agentic AI 驱动的效率革命。从传统
阅读全文本文第一作者廖海旭为新泽西理工学院数据科学系在读博士生,师从Prof. Shuai Zhang。论文标题:Theoretical Analysis of Contrastive Learning un
阅读全文编辑|冷猫这两年,大模型大厂之间堪比军备竞赛。不论开源还是闭源阵营,为了在指标上领先对手,都在疯狂地卷 Scaling Law,卷算力,卷参数量,已经达到了近乎离谱的程度。过去,GPT-2 只有约 1
阅读全文本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。当前,LLM 评测的通用榜单和常用基准陆续暴露出区分度下降、评审口径波动与数据污染等问题,促使业界愈发重视 LLM 评测体
阅读全文在 AI 视觉生成领域,扩散模型(DM)凭借其强大的高保真数据生成能力,已成为图像合成、视频生成等多模态任务的核心框架。然而,预训练后的扩散模型如何高效适配下游应用需求,一直是行业面临的关键挑战。近日
阅读全文编辑|杜伟OpenClaw 火爆的盛况至今仍在持续,在国内甚至出现了排队在腾讯总部楼下等待安装 OpenClaw 的场景,让人感叹「一代人有一代人的领鸡蛋」。而就在几天前,谷歌发布了一个 CLI(命令
阅读全文编辑|冷猫前沿 AI 研究曾经是由「肉身计算机」完成的:人们在吃饭、睡觉、娱乐之间抽时间做研究,并且偶尔通过一种名为「组会」的仪式,用声波互联(也就是交谈)来同步信息。那个时代已经一去不复返了。如今,
阅读全文1. 真正的高级智能,在于认知自己的 “无知”如果把当下最强的大模型(如 GPT-5.2、Gemini-3 Pro)丢进一个从未去过的虚拟房间,让它自己探索并构建地图,它能做到吗?一直以来,我们评估多
阅读全文编辑|Sia、Panda春节期间, Seedance 2.0 爆火,堪称现象级,这也再次把视频生成推上风口。前两天,字节跳动又携手北大、安努智能和 Canva 共同开源了具备实时生成能力的视频模型 H
阅读全文机器之心编辑部近日,Anthropic 公布了一组惊人的数字,在与 Mozilla 公司进行合作,测试旗下模型 Claude Opus 4.6 发现漏洞能力的过程中,两周内,就找出 Mozilla 公
阅读全文机器之心编辑部电子游戏一直是 AI 领域发展的极大推动力之一。游戏本身就构建了一个相对完整的世界,并且具有相当易于理解的世界规则。不仅可以训练人工智能对物理世界的理解,训练智能体的交互,更是许多世界模
阅读全文