刚刚,高德ABot-Claw亦庄半马封神!具身智能的Harness来了
新智元报道 编辑:Aeneas 犀牛【新智元导读】一只四足机器狗,无需预设路线、无需人工遥控,在开放城市环境中自己认路、自己走、自己干活——这是高德「途途」正在上演的真实场景。背后的秘密,是一套
阅读全文新智元报道 编辑:Aeneas 犀牛【新智元导读】一只四足机器狗,无需预设路线、无需人工遥控,在开放城市环境中自己认路、自己走、自己干活——这是高德「途途」正在上演的真实场景。背后的秘密,是一套
阅读全文新智元报道 编辑:KingHZ【新智元导读】人才奇点先于AGI到来!Meta狂挖Mira Murati120亿估值公司,第5人正式就位。巨头不再买公司,而是直接买大脑——这场抢人大战,让所有AI
阅读全文新智元报道 编辑:倾倾【新智元导读】伯克利团队造了个专门作弊的AI,用10行Python代码拿下SWE-bench满分!500道题全过,0个bug修复。8大主流评测基准,全部沦陷。同一周,两份独
阅读全文新智元报道 编辑:好困 犀牛【新智元导读】跑分最高未必能赢,但最懂Harness的可以。如今,被Hermes、OpenClaw等全球爆火开源Agent项目「钦定」为默认的MiniMax,在Ope
阅读全文新智元报道 编辑:元宇【新智元导读】Opus 4.7发布48小时,口碑两极撕裂。官方榜单并列全球第一,逻辑推理公开测试却从94.7%暴跌到41.0%。token消耗涨了35%,旧接口直接报错,用
阅读全文新智元报道 编辑:LRST【新智元导读】大语言模型看似安全的对齐机制,实则仅在表层构建「安全区」。其预训练中内化的有害知识仍以「黑暗模式」潜藏于模型深处。当遭遇偏离训练数据的输入时,只需自然语言
阅读全文新智元报道 编辑:好困 桃子【新智元导读】今天,智元正式定义2026为「部署态」元年。机器人要在产线上7×24小时自主干活,正式开启万亿级生产力飞轮。具身智能,是整个科技圈最不缺「热搜」的赛道。
阅读全文新智元报道 编辑:好困 KingHZ【新智元导读】20天长流程、token严格控制在每单50k以内,AI审批预计能提速150%以上,单均成本预计可以降至人工五分之一。易鑫Harness不是简单套
阅读全文新智元报道 编辑:LRST【新智元导读】OpenClaw等AI智能体爆火的同时,安全隐患也日益凸显。当智能体的工作流被悄悄篡改,用户能否及时察觉?南洋理工大学、瑞典皇家理工学院(KTH)及威廉与
阅读全文新智元报道 编辑:犀牛【新智元导读】质量和成本只能二选一?通过大脑+小脑分层、场内+场外双轮驱动,数据堂给出了具身智能数据难题的解。为什么机器人还干不好家务?不是因为它不够「聪明」,而是因为——
阅读全文新智元报道 编辑:KingHZ【新智元导读】别再为背公式发愁了!一个算子eml(x,y)就能搞定一切。指数函数?y=1即可。对数?三层嵌套。π?五层。这项发现不仅改变数学观,还启发我们:宇宙底层
阅读全文新智元报道 编辑:LRST【新智元导读】最新研究提出合成数据的全新分类框架,突破「生成模型=合成数据」的传统认知,涵盖反演、仿真与数据增强等方法,并按应用层次划分为数据中心AI、模型中心AI、可
阅读全文新智元报道 编辑:好困 桃子【新智元导读】40克AI眼镜变身Agent之眼,数字分身定制分身。当Agent爬出屏幕走进物理世界,这场关于生产力的降维打击,真的不只是说说而已。这几个月,硅谷和中文
阅读全文新智元报道 编辑:艾伦【新智元导读】让龙虾扛 24 小时以上的长程任务,十次有九次翻车。这个困扰整个养虾人群体的问题,行业里正浮现出一个新答案,Harness 群体多智能体。小冰之父李笛带着原班
阅读全文新智元报道 编辑:LRST【新智元导读】MCP协议正推动AI Agent自主执行任务,但安全风险飙升。研究发现,攻击者可借工具名称混淆、虚假错误等12类手法诱骗Agent执行恶意操作,连顶级模型
阅读全文新智元报道 编辑:桃子 KingHZ【新智元导读】Vidu Q3带着「全家桶」重磅回归,视觉、听觉、场景能力全面进化。AI视频的生产级交付时代,真的来了。这个月初,谷歌一纸公告,把Veo 3.1
阅读全文新智元报道 编辑:桃子 好困【新智元导读】四页纸,三颗炸弹!OpenAI内部备忘录直指Anthropic命门:Claude狂热如宗教、算力到2027年才7-8GW远落后OpenAI的30GW、3
阅读全文新智元报道 编辑:LRST【新智元导读】南洋理工大学MMLab团队推出Hand2World,让AI世界模型真正「伸手」互动。只需在空中比划手势,模型就能生成逼真第一人称交互视频,实时响应调整。它
阅读全文新智元报道 编辑:YHluck【新智元导读】现有大模型评测分数日趋饱和,但与真实体验差距显著。南京大学傅朝友团队牵头,在Google Gemini评测团队邀约下推出视频理解新基准Video-MM
阅读全文新智元报道 编辑:倾倾【新智元导读】Google DeepMind调查了一万个人,结果让整个AI安全评估体系汗颜:AI做了三倍多的「坏事」,但造成的实际伤害几乎一样。这意味着,我们现在用来证明A
阅读全文新智元报道 编辑:LRST【新智元导读】当前具身智能的VLA(Vision-Language-Action)赛道正陷入典型的「碎片化」泥潭:不同团队采用异构的动作解码范式、强耦合的数据管线、互不
阅读全文新智元报道 编辑:犀牛【新智元导读】10万小时人类数据、不搞对齐只靠规模,灵初Psi-R2登顶MolmoSpaces。具身智能领域最近有一个心照不宣的焦虑:真机遥操作数据这条路,可能走不下去了。
阅读全文新智元报道 编辑:艾伦【新智元导读】OpenAI 工程师因严重精神透支辞职回国,撕开了硅谷 AI 圈残酷的内卷真相。在「0-0-2」极限压榨与道德焦虑双重折磨下,xAI、OpenAI 等巨头的核
阅读全文新智元报道 编辑:LRST【新智元导读】开源框架Deep Researcher Agent帮你全天候自动跑深度学习实验,节省大量重复劳动。它通过自主循环完成想方案、执行、监控与反思,仅需每天五毛
阅读全文新智元报道 编辑:KingHZ 犀牛【新智元导读】当多数图像AI还停留在「会生成、不会懂空间」的阶段,京东开源JoyAI-Image-Edit,把图像编辑从平面修图推向空间智能,也让外界第一次看
阅读全文新智元报道 编辑:KingHZ【新智元导读】世界正在剧变。AI不再只是工具,它正在变成一面镜子——照出人类最深处的恐惧与渴望。而镜子里,站着一个穿黑袍的神父,和一个名叫Claude的AI。深夜,
阅读全文新智元报道 编辑:LRST【新智元导读】南洋理工、北航与合工大联合提出CARE Transformer,以非对称解耦方式并行建模局部细节与全局依赖,通过通道拆分与双交互机制,显著降低线性注意力计
阅读全文新智元报道 编辑:桃子 好困【新智元导读】太震撼了!一位北大文科博士,带着17个Agent,爆肝49天30万行代码,手搓了一个「AI开放世界」Elseland。当技术被AI飞轮碾碎,一人就是一个
阅读全文新智元报道 编辑:桃子 好困【新智元导读】Anthropic深夜发布Claude「顾问策略」,让Opus 4.6退居幕后当军师,Sonnet/Haiku当苦力。实测性能翻倍,成本暴降85%,全网
阅读全文新智元报道 编辑:LRST【新智元导读】多模态大推理模型的幻觉,很多时候并非「没看见」,而是在最不确定的推理阶段想偏了。最新研究发现,模型在生成because、however、wait等tran
阅读全文