GPT-5.4 到底变强了多少?三大核心能力+电脑操控Codex上手实测
上周,GPT-5.4 发了。意图非常明显,直指 Claude Opus4.6 和 Gemini 3.1 Pro。2 月 5 日,Claude Opus 4.6 发了。2 月 19 日,Gemini 3
阅读全文上周,GPT-5.4 发了。意图非常明显,直指 Claude Opus4.6 和 Gemini 3.1 Pro。2 月 5 日,Claude Opus 4.6 发了。2 月 19 日,Gemini 3
阅读全文昨天,计算机科学的活传奇、88 岁的图灵奖得主 Don Knuth,在自己的论文里正式感谢了一个 AI。这篇论文标题是《Claude's Cycles》,开篇第一句是“Shock! Shock!”,发
阅读全文前两天有个朋友问我最近在忙什么。我说翻了两本书。一本回忆录,542 页。一本讲 OpenAI 和 DeepMind 的,350 页。加起来四十多万字中文。他说你翻了多久。我说第一本花费半天,第二本半小
阅读全文今天上午发现一个事。用中文问 Claude——你是什么模型,它回答:我是由 DeepSeek 公司开发的 AI 助手,模型名称是 DeepSeek。不是幻觉,截图在这里。我以为是偶发,群里一问才知道很
阅读全文先来无奖竞猜一下,这里面哪句话是 AI 写的?生成出来的时候我都有点懵了,模仿我的笔记这么强吗。。细思极恐。这就是今天凌晨谷歌发布的最新图像模型——Nano Banana 2。一经发布,Nano Ba
阅读全文最近 AI 圈最火的一个新词,叫"SaaSpocalypse",SaaS 末日。这两周,Claude Code 上了个 COBOL 现代化功能,IBM 当天暴跌 13%;又上了个安全扫描功能,一口气翻
阅读全文最近openclaw实在是太火了,连王慧文都再次高调出资5000万美元,看重虾实现AGI的潜力。然而,最近在 ClawHub 上有一个被传得神乎其神的插件,上线10 分钟,冲上 ClawHub 榜一,
阅读全文万亿参数的开源模型,能接管编程工具当全自动码农,还能给自己的大脑写代码实现???我决定花一下午测个够。先介绍一下今天的主角。Ring-2.5-1T,蚂蚁百灵团队刚发布的万亿参数开源思考模型,全球首个混
阅读全文2026 年开年,AI Coding 赛道突然加速,OpenAI 的 Codex 5.3 号称代码生成速度提升 25%,Claude Opus 4.6 在 SWE-bench 上继续刷榜,智谱 GLM
阅读全文有时候,一个产品的爆火来得比想象中快的多。三天前,我被安利了一个宝藏 AI 产品并且玩疯了。今天刚要动笔给大家安利,就发现马斯克已经反手一个转发,给它送上了热搜了。这个产品叫 Loopit。第一次见到
阅读全文过去一周,我看着三波 AI 应用的流量冲击波,一波比一波猛。第一波是 OpenClaw(原名 Clawdbot),一个开源 AI 助手,在 GitHub 上 19 天拿下 11 万 +star,科技圈
阅读全文最近尝试了一个叫「全双工」的新全模态模型。我在等红绿灯的时候,对手机说了一句:等绿灯亮了提醒我一下。然后就低头刷小说去了。过了一会儿,绿灯亮了,手机里的 AI 准时开口:绿灯亮了。整个过程,它一直在看
阅读全文Claude Cowork 火了快一个月,Mac 用户体验爆棚。Windows 用户呢?只能在旁边干看着。这两天,局面变了。一家国产团队做出了支持 Windows 的桌面级 AI Agent,它就是昆
阅读全文如果你已经在用 Clawdbot,那你大概率懂我接下来要说什么。爽是真的爽。贵,也是真的贵。第一次让 Clawdbot 跑复杂任务的时候,我是真的被惊到了。长期记忆、拆解任务、执行闭环、自我迭代——你
阅读全文Clawdbot,哦不,Moltbot,哦不,现在又改名叫 OpenClaw了。这个项目改名的速度,直接说明了它现在有多疯狂。这周一刚火起来的时候,我身边的人都在惊叹:终于有一个 7x24 小时干活的
阅读全文昨天,Vidu Q3 悄悄上线。16 秒的声画同出,加上自动多镜头切换,还支持精准文字渲染。我测了 10 个小时后,最大的感受是,一句话出片有保证了。这句话几个月之前说,我还不信。因为 AI 视频生成
阅读全文最近Clawdbot(现:Moltbot)全网爆火。它能接管你的社交媒体,能发帖、能监听、能回复、能长期驻场。不是一次性回答,而是持续存在。今天,我发现有一个团队干了一件事,把 Clawdbot 接入
阅读全文卡帕西昨天在 X 上发了一条长推文,平平无奇的开头——关于过去几周大量使用 Claude 编程的一些随笔.....到现在,这条推文已经 550 多万的阅读量,话题非常火爆。首先他提到了,最近一两月以内
阅读全文Clawdbot 一夜爆火。昨天这个 Clawdbot 在多个平台上疯狂的刷屏,作为一个开源项目,一天内 GitHub 的 stars 就激增了 9000 多,一夜之间新增了 200 多个 PR,创始
阅读全文周二早上,马斯克和奥特曼又吵起来了。事情是这样的,马斯克在 X 上转发了一条帖子,内容是“自 2022 年以来,已有 9 人死亡与 ChatGPT 相关”,他配了一句话,“别让你爱的人用 ChatGP
阅读全文如果你最近关注了 GitHub,可能会注意到一个有趣的现象:YOLO 的版本号,直接从 11 跳到了 26。起初我以为是分支管理出了 bug,但看完技术报告,我收回这个想法, 确实是有意为之的宣告。Y
阅读全文上周 Claude Cowork 刷屏的时候,我还在想:什么时候能用上?结果,这周 MiniMax 版 Cowork 就来了。今天,MiniMax Agent 2.0 推出了 Desktop App,
阅读全文今天是一期硬核的话题讨论:Coding Agent 评测。AI 编程能力进步飞速,在国外御三家和国产中厂四杰的努力下,AI 编程基准 SWE-bench 的分数从年初的 30% 硬生生拉到了年底的 7
阅读全文昨天,Google 的 Antigravity 正式宣布支持 Agent Skills 了。好多人可能不知道 Antigravity,谷歌起名字还是一如既往的拉,英文名字是真难读,中文名字可以叫它 反
阅读全文当大家都在讨论“AI 会先取代哪种职业”的时候,真正值得关注的其实不是谁被替代,而是谁在最积极地拥抱 AI。为此,我们调研了近年来国内外的权威研究报告。在这场迅速扩大的用户潮里,一个被长期忽略的事实正
阅读全文今天,Anthropic 发布了一款全新产品——Cowork。官方定位是:适用于你「其他工作」的 Claude Code。这个产品非常有意思,可以让你像开发者使用 Claude Code 那样完成非技
阅读全文如果你在做 AI Agent 开发,大概率已经发现一件事:Agent 几乎是传统软件测试方法的反例。写几个单测 + 跑回归的老的测试方法失效了,因为 Agent 天生就带着两个“反骨”属性:非确定性:
阅读全文最近又看到一个几人团队冲出千万美元 ARR 的案例。是一家叫 Swan AI 的公司,员工只有 3 个人,冲到了差不多 3000 万美元(约 2 亿人民币)的 ARR,在创投圈传的很火。所以第一时间去
阅读全文有没有人和我一样,打车其实更想坐油车。作为一个晕车星人,上周晚上,我从公司打车回家。下车后就开晕,真的很想给滴滴客服打电话:为什么打车不能直接指定油车啊?!但想想没啥用还是算了。今天同事和我说,滴滴里
阅读全文