Anthropic 发布第四份人类经济指数报告:AI 对全球工作的影响仍然不均衡
Anthropic 刚刚发布了第四份经济指数报告,这次他们搞了个 经济基元(economic primitives) 的新概念。简单来说,就是用五个基础指标来衡量 AI 的使用情况:任务复杂度、所需教
阅读全文Anthropic 刚刚发布了第四份经济指数报告,这次他们搞了个 经济基元(economic primitives) 的新概念。简单来说,就是用五个基础指标来衡量 AI 的使用情况:任务复杂度、所需教
阅读全文1. 体验前沿 AI 产品后的30天内,不要做重大人生决定。/ Dan Shipper 2. 预测下一个 Token 的真正标准,是你是否理解了产生它的底层现实。/ Ilya Sutskever 3.
阅读全文当代码终结之后,软件该怎么写?Dan Shipper(Every 的联合创始人)和 Claude 联手写了一份技术指南,试图给出答案。这是一份构建 Agent 原生软件的完整技术指南。它系统性地总结了
阅读全文我们都知道,AI Agent 之所以强大有用,恰恰因为它们自主、灵活、智能。但这也恰恰让评估变得棘手。真正有效的评估策略,是把多种技术组合起来,让评估方法的复杂度匹配上被评估系统的复杂度。刚刚,一手打
阅读全文中国 AI,被「芯片之王」亲自盖章了。北京时间 1 月 6 日凌晨,拉斯维加斯 CES 2026 现场,身穿标志性皮衣的黄仁勋站在台上回顾 2025 年 AI 行业进展时,PPT 上赫然出现了三个中国
阅读全文Claude 养了一棵番茄,而且养活了。开发者 Martin DeVido 搭建了一个「生物舱」,让 Claude 全权负责照顾一株名叫 Sol 的番茄苗。没有人类备份,没有手动干预。也就是说:如果
阅读全文要把某个网页内容塞给大模型时,你会怎么做?请先投个票:有些网站已经走在了前面,比如智谱、OpenAI、火山的官方文档,贴心地提供了「复制 Markdown」按钮,一键就能拿到干净整洁的文本,非常 LL
阅读全文菲尔兹奖得主给当前 AI 下了个新定义。数学家陶哲轩 Terence Tao(@tao) 在 Mastodon 上给出了对当前 AI 能力的判断:我怀疑任何类似真正「通用人工智能」的东西,都不在当前
阅读全文开源 coding 模型,终于卷到 Claude Sonnet 4.5 头上了。智谱再次放出大招,正式发布并开源 GLM-4.7!这是一款专为 Agentic Coding 打造的模型,在 LiveC
阅读全文还记得 Project Vend 吗?Anthropic 和合作伙伴 Andon Labs 在旧金山办公室搞了个实验:让 Claude 当店长,经营一家小店。第一阶段的表现嘛……可以说是惨不忍睹。这位
阅读全文Google 这次把「性价比」三个字直接写脸上了。刚刚,Google DeepMind 发布了 Gemini 3 Flash,号称前沿智能,但只要极低极低的成本。在上个月 Gemini 3 Pro 和
阅读全文Sebastian Raschka 刚刚更新了他的「大型 LLM 架构对比」长文,内容量翻倍,堪称 2025 年最全面的 LLM 架构技术解析。Sebastian Raschka(@rasbt) 是一
阅读全文28 天,4 个工程师,一个登顶 Play Store 的 App。刚刚,OpenAI 发布了一篇工程博客,揭秘了他们如何用 Codex 在不到一个月的时间内,从零开始打造出 Sora 的安卓版应用。
阅读全文OpenAI 终于,亮剑了。就在刚刚,OpenAI 正式宣布 GPT-5.2 全面上线:这次一口气推出三个版本:GPT-5.2 Instant、GPT-5.2 Thinking 和 GPT-5.2 P
阅读全文2025 年里,最郁闷的码农工种,可能非前端莫属了。因为他们,可真的是被死了无数次了!所以在前文《前端和后端谁先死?》中,我发起了个投票,居然一共有 2400+ 人做出了投票,结果如下:有说前端死的,
阅读全文这位 Anthropic 的哲学家,终于开口说话了。Amanda Askell 是 Anthropic 的 Character 团队负责人,2021 年加入 Anthropic,是塑造 Claude「
阅读全文OpenAI 刚刚给 AI 装了一颗「良心」。在一项全新的概念验证研究中,OpenAI 训练了一个 GPT-5 Thinking 变体,让它能够主动承认自己是否真正遵循了指令。这个被称为「confes
阅读全文这次的 Anthropic,把自己给曝光了。这家推出 Claude 的公司,刚刚发布了一份报告,调查了 132 名内部工程师,进行了 53 场深度访谈,还分析了 20 万条 Claude Code 的
阅读全文先来个投票:不论你是研发、算法、产品、独立开发者、CXO、投资人、暂时的看客,想必这都会是你关心的问题。因为你作为企业的老板,或是你认识的企业的老板,或是你所在企业的老板,都会非常关心这个问题——老板
阅读全文刚醒,就看到朋友给发来的消息说我被人喷了。在一篇公众号文章里,针对我昨天的文章中的招聘信息指出:我不把人当人了。而这篇文章题为《Vibe Coding的第一批受害者出现了!》,也是差点让我以为自己也是
阅读全文我的 Max 才刚退没第三天:Claude 就又用 Opus 4.5 来掏我钱包了……有多强?都在图里了👆相比 Opus 4.1 价格也是暴跌至 1/3(代表用量消耗会变慢):并收获全面好评:循环还在
阅读全文Anthropic 发布了一项令人不安的研究:AI 若是学会了作弊,就会顺便沾染上撒谎、破坏和伪装等毛病。这是真实发生在 Claude 训练过程中的事情。Anthropic 的研究团队发现,当模型在编
阅读全文不是我去面试,是我刚面了位小同学 背景是国内某一线 AI 大厂前离职员工(厂名人名在此先码了) 视频面 上来当然是自然介绍 他全程眼睛盯着某一个地方,讲完后抬头看我说: 以上就是我的自我介绍 我
阅读全文"Please get rid of all large meetings, unless you’re certain they are providing value to the whole a
阅读全文年化收入破 10 亿美元,Cursor 成为全球产出代码量最大的 AI Agent。一图总结刚刚,AI 代码编辑器 Cursor 官宣完成 23 亿美元 D 轮融资,估值达到 293 亿美元。这轮融资
阅读全文ChatGPT 要变成聊天室了!根据 AIPRM 首席工程师 Tibor Blaho(@btibor91) 的最新爆料,ChatGPT 网页版即将推出「群聊」功能的预览版本。顶部导航栏现在出现了一个「
阅读全文能最终找到真相的,往往不是沉思者,而是探索者。 昨晚,Moonshot AI 宣布发布 Kimi K2 Thinking:早前的思考模型,就像关在黑屋子里的哲学家,无论思考多深刻、推理多严密,都无法知
阅读全文上周五,我正打算叫还在上大三的弟弟出来见面吃个饭,结果这小子给我发了个哭脸表情包:哥,不行了,周一组会啥都没准备,导师又要说我看论文太少了。我心想,你小子天天在实验室摸鱼,现在知道急了?于是我索性一个
阅读全文