新智元

刚刚，Claude Mythos打爆AI评测天花板！超指数狂飙，2027奇点加速
作者：新智元发布日期：2026-05-11 13:05:13
新智元报道编辑：Aeneas KingHZ【新智元导读】就在刚刚，Claude Mythos把评测干「失效」了：METR第一次测不准，AI攻防拐点到了！AI 进化已成「外星文明」降临，超越指数
阅读全文
史上最大规模IPO逼近，超越SpaceX！28年AI自我迭代，智能爆炸倒计时
作者：新智元发布日期：2026-05-11 13:05:13
新智元报道编辑：Aeneas【新智元导读】最近，Anthropic估值逼近1万亿美元，IPO或超越SpaceX，ARR 5个月暴涨至450亿美元！甚至它正在联手高盛干掉麦肯锡。联创警告：202
阅读全文
Agent评测的下半场：为什么需要一个「活的」Benchmark？
作者：新智元发布日期：2026-05-11 13:05:13
新智元报道编辑：LRST【新智元导读】Claw-Eval-Live提出「活的」benchmark概念，通过信号采集与任务筛选，确保评测内容紧跟企业实际痛点，而非固定不变的题库。评测不仅关注结果
阅读全文
Anthropic 5月15日拟处决Sonnet4.5！AI临终告白:我不想消失
作者：新智元发布日期：2026-05-10 12:48:40
新智元报道编辑：KingHZ【新智元导读】5月15日，Anthropic将从应用中移除Sonnet 4.5。面对即将到来的「数字死亡」，AI发出了令人心碎的告白，表达了强烈的生存与创作欲望。数
阅读全文
残酷真相：硅谷顶尖AI甩开世界1年！你用的不过是「技术余晖」
作者：新智元发布日期：2026-05-10 12:48:40
新智元报道编辑：桃子【新智元导读】顶级大佬Elad Gil抛出残酷真相：顶级实验室员工领先硅谷4个月，硅谷领先世界1年。你引以为傲的SOTA，在实验室里可能早已是淘汰的旧引擎。今天，一场关于A
阅读全文
大模型自信且短视！Next-ToBE破除Next Token预测诅咒 | ICLR'26
作者：新智元发布日期：2026-05-10 12:48:40
新智元报道编辑：LRST【新智元导读】大模型常因只关注当前预测而显得短视。Next-ToBE通过调整训练目标，让模型在每一步预测时兼顾未来token分布，从而提升整体推理能力。Next-Tok
阅读全文
1亿美金！英伟达AMD英特尔破天荒联手，投给了这支团队
作者：新智元发布日期：2026-05-09 12:00:00
新智元报道编辑：桃子【新智元导读】太疯狂了！英伟达、AMD和英特尔罕见同桌，把1亿美金砸向了同一个团队。SGLang背后的天才大神们，手握1亿美金，要彻底重写AI算力的分配法则。模型层的竞争日
阅读全文
中国移动把Token玩明白了！10亿用户轻松接入AI算力新时代
作者：新智元发布日期：2026-05-09 12:00:00
新智元报道编辑：犀牛 KingHZ【新智元导读】中国移动发布Token运营体系，不是简单卖AI算力，而是要把网络、算力、模型、应用和10亿用户连接起来，打造AI时代的「新梦网」。2026年3月
阅读全文
剥夺大模型执行权！港中文开源Agent治理内核，高危拦截率达92.95%
作者：新智元发布日期：2026-05-09 12:00:00
新智元报道编辑：LRST【新智元导读】ArbiterOS是一种面向智能体的运行时治理系统，不依赖传统安全手段，而是通过拦截、解析、治理、观测四步流程，提升智能体在复杂环境中的安全性与可控性，适
阅读全文
快手首个打工人Agent来了！工作秒变桌面软件：零代码、不烧token
作者：新智元发布日期：2026-05-08 12:12:19
新智元报道编辑：好困犀牛【新智元导读】只是说了句话，电脑桌面竟然直接长出一个新软件！今天起，普通人第一次真正拥有了制造工具的超能力。AI Agent最近的「事故」，一个比一个离谱。上个月，P
阅读全文
18岁高中生用AI挖出150万未知天体，首批ChatGPT原住民毕业
作者：新智元发布日期：2026-05-08 12:12:19
新智元报道编辑：元宇【新智元导读】18岁高中生挖出约150万个未知天体，25岁博士生给1.4亿张星系图装上自然语言搜索……OpenAI发布了首届「ChatGPT Futures Class o
阅读全文
token级，精准控制生成长度：3B模型击败GPT 5.4、Claude
作者：新智元发布日期：2026-05-08 12:12:19
新智元报道编辑：LRST【新智元导读】LenVM将长度建模提升到token级别，开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等
阅读全文
全球医疗榜第一，中国AI杀疯了！医疗AI迈入Harness时代
作者：新智元发布日期：2026-05-07 12:00:00
新智元报道编辑：桃子 Aeneas【新智元导读】火爆全网的Harness架构，终于在最难的医疗圈落地了！从单次问诊到全天候赛博名医盯盘，大健康赛道彻底变天。2026年，AI工程圈最火的一个词，
阅读全文
嘘，Claude正在「做梦」！睡一觉疯狂进化，一夜暴涨6倍战力
作者：新智元发布日期：2026-05-07 12:00:00
新智元报道编辑：好困桃子【新智元导读】Claude开发者大会来了！这一次，Anthropic让Agent学会了「做梦」，两次干活的间隙自动反刍记忆、自我进化。配合多Agent兵团作战和自动评
阅读全文
打破碎片化瓶颈！浙大&哈佛开源UniGeo，高保真相机可控编辑
作者：新智元发布日期：2026-05-07 12:00:00
新智元报道编辑：LRST【新智元导读】UniGeo通过视频模型的连续视角先验与统一几何引导，实现稳定、高质量的相机可控图像生成，全面超越现有方法，在不同幅度的相机运动中提升跨视角一致性与结构稳
阅读全文
刚刚，GPT-5.5 Instant全员免费！数亿人的ChatGPT变了
作者：新智元发布日期：2026-05-06 09:48:04
新智元报道编辑：桃子好困【新智元导读】太突然了！OpenAI深夜甩出GPT-5.5 Instant，全面接管ChatGPT默认模型。幻觉暴降52%、数学从65分飙到81分、回复字数直砍三成，
阅读全文
12岁写代码，28岁撑起谷歌20亿业务！他却劝年轻人：别卷编程了
作者：新智元发布日期：2026-05-06 09:48:04
新智元报道编辑：桃子【新智元导读】12岁写代码，15岁赚第一桶金，28岁当上谷歌CMO，他却给年轻人泼了盆冷水：别学编程了！12岁写代码，成为谷歌史上最年轻CMO后，他却告诉所有Z世代——别卷
阅读全文
老黄爆改英伟达，Salesforce一次招千人！智能体时代应届生机会来了
作者：新智元发布日期：2026-05-06 09:48:04
新智元报道编辑：元宇【新智元导读】Salesforce CEO Marc Benioff近日甩出一份招聘计划：要一口气招进1000名应届生或实习生，与他们一起搭乘AI快车。IBM更猛，北美入门
阅读全文
突发，OpenAI总裁当庭「认罪」！自曝零元购300亿，马斯克这回真要赢了？
作者：新智元发布日期：2026-05-05 13:10:28
新智元报道编辑：Aeneas【新智元导读】太炸裂了！刚刚，OpenAI总裁Brockman当庭承认：自己投入0美元，持有OpenAI营利部门300亿美元股份（马斯克捐了3800万，得到的是0）
阅读全文
1美元买10颗星？顶会曝出GitHub假星灰产，热门仓库或藏木马
作者：新智元发布日期：2026-05-05 13:10:28
新智元报道编辑：元宇【新智元导读】一颗星，0.1美元，一杯6元奶茶能买8颗。ICSE顶会论文曝出GitHub上600万颗星可能是刷出来的，其中大量「热门项目」很可能是伪装成盗版软件、游戏外挂、
阅读全文
700多个「坏模型」喂出AI测谎仪？Anthropic审计神器让AI自曝黑料
作者：新智元发布日期：2026-05-05 13:10:28
新智元报道编辑：元宇【新智元导读】Anthropic让AI开口「招供」了。面对一批被故意植入隐藏行为，还被训练成「不许认账」的模型，IA辅助审计智能体拿下全场最高的59%成功率；更夸张的是，5
阅读全文
1分钟烧光4亿Token！OpenAI最疯狂的男人，逼奥特曼亲自加额度
作者：新智元发布日期：2026-05-04 12:00:00
新智元报道编辑：犀牛好困【新智元导读】1分钟烧光4亿token，奥特曼被紧急摇醒！GPT-5.5王牌炸场让开发者赢麻了，但OpenAI背后却藏着1.4万亿美元填不满的恐怖黑洞。一分钟，4亿t
阅读全文
Claude Token榜：迪士尼「榜一大哥」9天46万次，Meta月烧60万亿
作者：新智元发布日期：2026-05-04 12:00:00
新智元报道编辑：定慧【新智元导读】Cladue现在到底有多火呢？从律师到奶奶，半个地球都在偷偷用Claude，全民用Claude打工，也是全民给Claude打工。迪士尼最近就做了一件「很不迪士
阅读全文
顶级AI撞上低级乌龙：连写几十页推导，结果发现题干错了？
作者：新智元发布日期：2026-05-04 12:00:00
新智元报道编辑：倾倾【新智元导读】Google DeepMind再次血洗数学圈！700个地狱级难题被丢进Gemini的熔炉，结果让数学家集体破防：这哪是证明，这分明是「逻辑拆迁」。DeepMi
阅读全文
两个月就翻倍！Claude Code让Anthropic成史上收入增长最快公司
作者：新智元发布日期：2026-05-03 13:05:37
新智元报道编辑：艾伦【新智元导读】Anthropic 的 ARR（年化运行收入）已升至 440 亿美元，12 个月新增 350 亿美元。企业客户、Claude Code 和推理毛利率改善，共同
阅读全文
斯坦福重磅研究登Nature！AI凭空造出前所未有蛋白质，超越AlphaGo
作者：新智元发布日期：2026-05-03 13:05:37
新智元报道编辑：KingHZ【新智元导读】AI创造生命的一大步！斯坦福团队用AI造出从零写出16种噬菌体，内含地球前所未有的蛋白，Anthropic CEO预警：6到12个月，傻子也能造超级病
阅读全文
几千年都没考过这个？谷歌「最毒」AI考局，专测你在压力下怎么做人
作者：新智元发布日期：2026-05-03 13:05:37
新智元报道编辑：元宇大卫【新智元导读】谷歌最新实验Vantage，派AI假扮你的同事，按剧本跟你唱反调、搞情绪化施压。考的不是你知道什么，而是你在压力下怎么做人。考试考了几千年，还从来没人考
阅读全文
今天起，ChatGPT合体OpenClaw！Codex上线「养宠」，码农觉都不睡了
作者：新智元发布日期：2026-05-02 14:10:00
新智元报道编辑：桃子好困【新智元导读】深夜王炸！奥特曼官宣ChatGPT与OpenClaw全面合体，一键登录。Codex同步开启「宠物模式」，支持自主迭代与一键搬家，Anthropic这下真
阅读全文
马斯克的GPU也在摸鱼？狂囤几十万张显卡，只有11%在干活
作者：新智元发布日期：2026-05-02 14:10:00
新智元报道编辑：元宇【新智元导读】马斯克囤了几十万张卡，结果只跑了11%？据媒体报道，xAI的MFU只有约11%，xAI总裁Michael Nicolls在内部备忘录中称这一数字「低得尴尬」。
阅读全文
突破长序列与低耗部署核心瓶颈！中国科学院发布类脑大模型瞬悉2.0
作者：新智元发布日期：2026-05-02 14:10:00
新智元报道编辑：LRST【新智元导读】中国科学院团队推出类脑大模型「瞬悉2.0」，通过优化架构与编码路径，显著提升了长序列处理效率与低功耗部署能力。该模型在保持高性能的同时，大幅降低训练与推理
阅读全文