OpenAI 爆火实验:3 名工程师用 AI 代理,5 个月零人工写代码,造出 100 万行生产级系统!程序员的角色,正在被彻底重塑。
最近 OpenAI 放出一篇重磅文章《Harness Engineering》,直接把行业震了:他们一个内部团队,用 Codex 从零搭建了一个真实内部产品,没有一行代码是人工手写的,5 个月积累约
阅读全文最近 OpenAI 放出一篇重磅文章《Harness Engineering》,直接把行业震了:他们一个内部团队,用 Codex 从零搭建了一个真实内部产品,没有一行代码是人工手写的,5 个月积累约
阅读全文你知道在 AI 输出中,HTML 比 Markdown 更好吗?如果你对此存疑,一位 Anthropic 工程师的新指南可能会改变你的看法。Anthropic 的 Claude Code 工程负责人
阅读全文最近在 GitHub 上刷到一个真·宝藏开源项目,直接让我眼前一亮!它叫 12-Factor Agents,由 HumanLayer 团队推出,目前已经斩获 11k+ Star。 如果你正在开发 Ag
阅读全文大多数工程师以为自己在把 Claude Code 当作一个编程助手在用。实际上,他们脚下是一个更庞大的 agent 运行时,而他们很少真正审视它。Anthropic 自家的文档已经清楚表明,Claud
阅读全文2026年,无数人陷入AI学习的死循环:斥资购买高价课程、疯狂囤积证书、刷完上百小时教程,却依然不知道如何动手搭建一个能解决实际问题的AI系统。他们不是不够努力,而是踩了两个致命误区:一是忽略了互联网
阅读全文AI圈的军备竞赛,已经卷到了一个全新岗位上。最近半个月,三大AI巨头集体动作,目标直指同一个职位——Forward Deployed Engineer(FDE)。谷歌急到压缩面试:从过去数周4-6轮,
阅读全文2024 年,我们做了演示。2025 年,我们做了编码代理。2026 年,我们要把通用型知识工作者真正投入生产环境。Anthropic 的 David Soria Parra 称,Model Cont
阅读全文1. 核心认知:搞工程化,而非只玩Prompt这是最基础,也最容易被忽略的一点。Prompt Engineering(提示词工程)是入门捷径,但绝不是终点。很多人沉迷于调参式Prompt,却忘了AI落
阅读全文从Hermes Agent等前沿智能体框架的强势崛起,到OpenAI、微软等科技巨头相继推出Workspace Agents等AI智能体产品,产业界的密集动作标志着AI已正式完成从“对话式”向“执行式
阅读全文刷到这篇文章的你,是不是也被近期的AI失业潮搞得焦虑?“ChatGPT写文案比我快10倍,我要被裁了”“AI能自动编程,程序员要失业了”“连设计师、行政的活,AI都能搞定,普通人没出路了”……打开手机
阅读全文大多数 AI 书单满足的是“好奇心”,不是“造东西”。做 agents 的后端工程师和想理解 AI stack 的产品经理需要的书不一样;专注 evaluation 的 ML 工程师读的东西也和为时延
阅读全文就在我们还在消化Anthropic工程师Thariq的实操干货、忙着用HTML解锁AI输出新姿势时,更炸裂的消息来了——AI教父Andrej Karpathy(卡帕西)直接公开站台,彻底把HTML替代
阅读全文你的第一个 agent 也许只带着一个 500 个 token 的 system prompt 和两个工具上线,但这些数字通常会很快膨胀。举个例子,泄露的 Claude system prompt 大
阅读全文你有没有过这样的经历?用LLM搭了个聊天机器人,跑Demo时顺风顺水,能推理、会调用工具,怎么看都像个“全能智能体”。可一旦部署到生产环境,瞬间翻车:模型转头就忘三步前说的话,工具调用悄悄报错,上下文
阅读全文你可以把一个 GitHub issue 分配给 Codex,离开电脑,20 分钟后回来时,已经有带测试和文档的完整 pull request(PR)在等你审核。不是一段代码片段,而是一套可运行、可评审
阅读全文我所在公司的高层手里,攥着一份8000 人的裁员名单。我有10% 的概率在这份名单上。5 月 20 日,也就是十几天后,我就会知道最终结果。看到 Coinbase 刚刚发布的「AI 驱动裁员」公告,我
阅读全文OpenAI Codex 在 4 月 30 日发布后,下载量迅速大幅超越 Claude Code。鉴于开发者对这款工具的采用速度正在快速分化,现在是时候评估是否应当从 Claude Code 切换到
阅读全文每天和AI打交道的打工人,大概都有过这样的崩溃时刻:让AI生成一份复杂方案,结果收到几百行Markdown,密密麻麻的文字堆在一起,别说仔细看,光扫一眼就头大;想让AI做个简单的图表、对比表格,它只能
阅读全文你是否在 AI 辅助编程中陷入这样的困境:简单任务得心应手,一遇大型项目就频频翻车;Claude 频繁 “失忆”,上下文混乱、任务冲突不断;零散教程学了一堆,始终无法搭建稳定可复用的工作流;想落地团队
阅读全文智谱AI(Z.ai)正式发布了GLM-5V-Turbo的技术报告。这不是一次普通的模型更新,而是他们首款原生多模态编码基础模型,专为视觉编程、长时序规划和智能体(Agent)工作流而生。一句话总结:A
阅读全文5月6日,旧金山Code with Claude现场,Anthropic的灵魂人物——Amodei兄妹(Dario & Daniela)罕见同框,一场半小时的对话,炸出了AI圈半壁江山的秘密。同一天,
阅读全文在实际构建 Agentic Systems 时,AI 模型本身很少再是瓶颈。真正的瓶颈在于包裹它们的“harness”。Anthropic 用了两年时间为 Claude 打造这层 harness——它
阅读全文现在做AI Agent开发的人越来越多,但绝大多数人都卡在同一个问题上:单一大模型prompt简单好用,稍微落地复杂场景就全面翻车。上下文窗口不够用、长文档处理幻觉频发、复杂任务出错无法自查、系统没有
阅读全文MCP servers 正在成为生产级 agentic systems 的核心,因为所有棘手问题都在这里落地:multi-tenant isolation(多租户隔离)、auth(身份认证与授权)、r
阅读全文你有没有发现,现在 AI 圈的术语已经卷到离谱了?今天有人聊 Agentic Workflow,明天有人讲 Agent Harness,后天又冒出个 Multi-Agent Orchestrator,
阅读全文改进代码质量的最佳方式是做好两件事:在开发之前_规划解决方案_,并且_定期进行代码评审_。之前我已经演示过,如何使用 Claude Code 的 /ultraplan 命令来简化规划阶段:用 Clau
阅读全文你有没有发现,最近身边悄悄出现了一批反卷程序员?他们不再对着 IDE 疯狂敲字,也不再为了一段语法反复调试,甚至连 Ctrl+C/V 的频率都在变低。取而代之的,是对着 AI 清晰地描述目标、划定边界
阅读全文在 2026 年 4 月的一周内,Anthropic 发布了 Claude Opus 4.7,上线了名为 Claude Design 的新产品,并新增了即便你的笔记本合上也能运行的 Routines。
阅读全文你可能不知道:在 2026 年的 AI 面试里,只会说 “我会用 LangChain 写个 Agent” 的人,已经被筛掉了。真正能拿到 offer 的那 1% 工程师,聊的是:如何设计一套让 AI
阅读全文Anthropic 最近关于“functional emotions”的研究https://arxiv.org/pdf/2604.07729提醒我们:agentic 方案不只是工程问题,更是上下文(c
阅读全文