CVPR 2026 WorldArena挑战赛启动,高德开源高性能世界模型基线
机器之心发布过去两年,从 Sora 到 Veo,再到 Cosmos,视频生成模型在「视觉逼真」这条路上飞速狂奔,生成的画面已经足以以假乱真。但一个根本性的问题始终悬而未决:这些模型真的「理解」了物理世
阅读全文机器之心发布过去两年,从 Sora 到 Veo,再到 Cosmos,视频生成模型在「视觉逼真」这条路上飞速狂奔,生成的画面已经足以以假乱真。但一个根本性的问题始终悬而未决:这些模型真的「理解」了物理世
阅读全文机器之心编辑部名人风格的 AI 助手具备教学潜力吗?陶哲轩和几个朋友调教出了五个不同人设的聊天机器人,并问了它们同一个关于牛顿万有引力的问题,结果发现答案差异非常大。考虑到每个人的口味差异同样很大,五
阅读全文近日,哈尔滨工业大学(深圳)联合深圳河套学院、Independent Researcher提出了隐式思考模型 LRT(Latent Reasoning Tuning),通过一个轻量级的推理网络,将大模
阅读全文机器之心发布具身智能,正在进入一个新的叙事阶段。一个越来越清晰的现实正在浮现:只靠真机遥操作数据,未必能把机器人真正送进大规模场景。原因不难理解。数据贵,采得慢,节拍还往往不够真实。实验室里能跑通的
阅读全文机器之心编辑部还记得曾经喧嚣一时的 OpenAI 星际之门(Stargate)项目吗?现在,它不仅内部高层动荡,连 OpenAI 掌门人 Sam Altman 本人也遭遇了现实世界的暴力袭击。这似乎印
阅读全文在复杂、甚至是 GNSS(全球导航卫星系统)拒止的环境中,如何让仅搭载单目相机的无人机实现精准、无漂移的自我与目标定位?国防科技大学虚拟现实与视觉计算团队(SAW Lab)联合多所高校推出无人机实时地
阅读全文编辑|Panda前些天,Generalist AI 发布了 GEN-1 模型,引爆了具身智能领域。该公司 CEO Pete Florence 甚至认为,机器人技术正接近其「ChatGPT 时刻」。据
阅读全文机器之心编辑部在 iPhone 上跑 Gemma 4,相信很多人都尝试过了。从大家的反馈来看,模型的可玩性还是很强的,聊一些简单问题也很流畅,只是在上下文变长、开启深度思考时速度会变慢,而且会有手机发
阅读全文作者介绍:本文的共同第一作者为崔奔雷(阿里巴巴)和何少轩(阿里巴巴实习生、浙江大学)主要研究领域为多模态理解与生成,通讯作者洪海文(阿里巴巴)和赵洲(浙江大学)主要研究领域分别为多模态大语言模型、语音
阅读全文编辑|Youli「用一句话交代任务,然后什么都不用管,AI 自动执行。」这或许是大家最初对「AI 超级助手」的想象。比如,以常见的电商场景为例:如果你是负责运营的,当描述完「每周一早上 9 点,扫描
阅读全文机器之心编辑部问大家一个问题:当你接触一个陌生的代码库时,第一步是做什么?相信大多数人的做法是,打开 README,从目录开始,一行一行往下读。但现在,一些工程师开始采用一种完全不同的方法:在看代码之
阅读全文在人工智能研究中,许多研究者将大量时间投入到为那 1% 的性能提升反复调参与实验迭代之中。一个越来越值得重视的问题是:人类科学家最宝贵的直觉与创造力,是否正被困在无止境的「增量式优化」中?SOTA(S
阅读全文编辑|冷猫我确实对运行 OpenClaw 持相当怀疑的态度。…… 整个生态给人的感觉就像是一个彻底的狂野西部,在安全性上简直是一场噩梦。 —— Andrej KarpathyOpenClaw 这只龙虾
阅读全文编辑 | 泽南就在 OpenAI 都停了 Sora,所有人以为 Seedance 2.0 要一统天下的时候,没想到不知哪里冒出来一匹马。周二晚间,在知名 AI 评测分析平台 Artificial An
阅读全文编辑|Youli、杨文李飞飞的 World Labs 又更新模型了。这次一口气推出了两款模型,分别是 Marble 1.1 和 Marble 1.1-Plus。其中,Marble 1.1 在照明效果、
阅读全文编辑|Sia资本闪电战打响,雷军、马云罕见同场领投千寻智能又一次把融资节奏拉满。2026 年 4 月 7 日,千寻智能宣布完成新一轮 10 亿元融资。本轮融资由顺为资本、云锋基金联合领投,达晨财智、某
阅读全文机器之心编辑部OpenAI 加快了迈向下一 AI 阶段的进程。昨晚,在一场引人注目的 Axios 采访中,OpenAI CEO Sam Altman 表示,「超级人工智能的到来比大多数人预期的要快。这
阅读全文编辑|冷猫如果有人告诉你,你的比特币私钥可能在十分钟内被一台计算机破解,你大概会一笑置之。但谷歌没有笑。这家搜索巨头,在五天前把后量子密码迁移的内部截止日期提前到了 2029 年。新闻链接:https
阅读全文机器之心编辑部谷歌前几天开源的新模型 Gemma 4,给了业内一个大大的惊喜。它采用了与 Gemini 3 同源的技术架构,支持原生全模态,在 Arena AI 排行榜上拿到了全球第三,而且有多个型号
阅读全文编辑|泽南最近,飞书、钉钉、企业微信接连推出 CLI,智能体生态战役再次打响。飞书:https://github.com/larksuite/cli钉钉:https://github.com/Ding
阅读全文人形机器人全身灵巧操作是通向通用具身智能的核心目标之一。在这一愿景下,机器人不仅需要双臂与高自由度多指灵巧手的精细协调,还需要与全身位姿(如行走、弯腰)进行动态配合。尽管近年来机器人的硬件设计与控制算
阅读全文编辑|杨文又到了八卦时间。最近,著名记者、作家塞巴斯蒂安・马拉比出了本新书,名叫《无限机器:德米斯・哈萨比斯、DeepMind 与超级智能的探索》。书中,他披露了一段扎克伯格与 DeepMind 失之
阅读全文机器之心编辑部还记得前几天,AI 领域知名学者 Andrej Karpathy 做客一档节目时,半开玩笑地提到:token 用不完会让人焦虑,就像患上了某种「AI 精神病」。这句话当时听起来有点夸张,
阅读全文本文的主要作者来自上海交通大学自动化与感知学院 i-WiN 中心团队,团队负责人是上海交通大学讲席教授关新平。本文的通讯作者为 i-WiN 中心陈彩莲教授和关新平教授,指导老师还包括中心的许齐敏副研究
阅读全文机器之心编辑部Anthropic「封杀」OpenClaw 了?刚刚,不少 OpenClaw 用户收到一封来自 Anthropic 的邮件。邮件宣布,从太平洋时间 4 月 4 日中午 12 点起,Cla
阅读全文本文第一作者是来自香港科技大学的博士生李欣然,并由胡张广达、厦门大学沈思淇副教授、阿里集团陈庆国、徐昭、骆卫华、张凯夫和香港科技大学张军教授合作完成。自 2025 年以来,强化学习(RL)逐渐成为了大
阅读全文编辑|张倩这段时间,updream 的内测消息在创作者圈子里悄悄传开了。它是一款面向专业创作者的 AI 视频创作产品,在前几天的 B 站首届 AI 创作大赛颁奖活动现场首次公开亮相。消息扩散之后,各创
阅读全文机器之心发布近期,我们注意到 openJiuwen 社区持续获得国际关注,先后登上多家海外科技媒体。亚太头部科技媒体 Tech in Asia 专题报道了 openJiuwen 先进的架构设计理念 [
阅读全文这两年,视频生成模型进步很快。清晰度更高了,镜头更稳了,人物和场景看上去也越来越自然。很多时候,我们判断一个模型强不强,看的就是它 “像不像真的”。但这其实只回答了一半的问题:它看起来像真的,不代表它
阅读全文机器之心编辑部近日,美团发布了一项颇具分量的多模态研究成果 —— LongCat-Next。这是一款离散原生自回归多模态大模型,基于 LongCat-Flash-Lite MoE 架构构建,总参数量达
阅读全文