探索AGI

玩转Harness后，我终于知道哪些是必须，哪里会翻车，加什么能救命了！
作者：探索AGI发布日期：2026-05-11 16:00:00
Claude Code之父Boris在红杉 2026 AI Ascent 上说：一年后，Claude Code 可能只剩 100 行代码。模型足够聪明时，你不需要那么多脚手架。OpenAI 前不久的博
阅读全文
OpenAI说，硅谷top5公司在这样用大模型，人均日烧10亿token！
作者：探索AGI发布日期：2026-05-08 13:59:00
OpenAI昨天发了一份报告，说top5%的企业，人均token消耗是中位数企业的3.5倍。而且这个差距还在持续增长。假期的时候，codex 推出了 /goal的功能，不达目标誓不罢休。玩法多样。
阅读全文
Karpathy、Claude Code之父Boris，最新访谈，把整个程序员圈炸了！
作者：探索AGI发布日期：2026-05-06 11:49:23
假期的时候，红衫AI Ascent 2026 上有两场值得认真看的演讲。一场是 Boris Cherny 的，Claude Code 之父。一场是 Karpathy 的。两个人从不同角度把同一件事讲清
阅读全文
Anthropic发布Opus 4.7黑客松获奖作品，前几名被医生、老师、木匠学徒拿下了。。。。
作者：探索AGI发布日期：2026-05-03 17:30:00
Anthropic 的 Opus 4.7 黑客松结束了。500人参赛，10万美元奖池，一周时间，最多两人组队。获奖名单出来，我愣住了。。。金奖：土耳其的一个医生。银奖：法国的老哥做了一个电路板维修工
阅读全文
Google开源DESIGN.md。玩AI，今年最该知道的Markdown！
作者：探索AGI发布日期：2026-04-30 11:30:00
Google开源了一个新的格式规范： DESIGN.md。对于所有在用AI coding的人来说，这可能是今年最实用的东西之一。这是一个把产品UI设计定死的一个文件约束。避免模型自己去搞一些AI味儿，
阅读全文
Anthropic最新博客：MCP没有死，我们又救活了。
作者：探索AGI发布日期：2026-04-29 11:30:00
MCP is Dead. Long Live the CLI.2个月前，Eric Holmes给MCP定义了结局。因为LLM本来就很会用命令行，搞一层协议纯属多此一举。因为，MCP本身就有，Token
阅读全文
K2.6、GPT 5.5、DS v4 扎堆上线了。评测看完也白看，群聊里倒是吵翻了。
作者：探索AGI发布日期：2026-04-28 11:30:00
上周 kimi k2.6、GPT 5.5、DeepSeek v4 扎堆上线了。全网都在疯狂推送各种新闻稿，通稿。每一篇都在讲 ds v4 多猛、gpt 5.5 多强。可能看很多篇，内容大差不差。这个场
阅读全文
陪5岁小朋友玩到黔驴技穷，我用一张照片给他做了个汪汪队手办。
作者：探索AGI发布日期：2026-04-27 19:45:59
这2个月，家里有一个小朋友。5岁，皮起来整栋楼都能听见他声音。。。。这几周，被迫。各种花式陪娃，用 Nano Banana Pro 搓绘本，用Seedance 跑视频。。。还买了一堆拼图，但是我发
阅读全文
说实话，Cursor和Claude Code用了大半年，有个问题我一直在忍
作者：探索AGI发布日期：2026-04-24 13:59:00
我觉得现在有一件特别荒诞的事儿。团队里边，每个人都有自己的Agent，可能是Cursor、Claude Code 或者 Codex之类的。单看每个人的产出，其实都挺高的，AI工具确实让所有人的效率提高
阅读全文
说实话，Image 2最让我震撼的，不是生图！
作者：探索AGI发布日期：2026-04-22 22:34:00
今天被 Image 2 刷了一整天的屏。朋友圈、公众号、x、群聊，全是各种AI图。信息图、假报纸、漫画、杂志封面、直播截图。说真的，质量确实离谱。连这种图都可以做。。。。我也手痒了。但是作为一个普通玩
阅读全文
不吹不黑，在Agent任务上，kimi 2.6确实让我忘了Claude。
作者：探索AGI发布日期：2026-04-21 16:30:00
Kimi K2.6发布并开源了，代码、Agent能力大幅提升。龙虾又可以换更好的国产模型替代了。Claude Code的源码前不久泄露了，这事儿大家应该都知道了。因为还缺了一些东西，所以想在本地把这东
阅读全文
我玩了2天「自进化」龙虾，然后它开始自己调教自己了。真的回不去了！
作者：探索AGI发布日期：2026-04-20 14:31:49
Hermes Agent 太火了。自进化真的太好玩了，用久了回不去。最近为了快速看一些开源项目，我搓了一个小工具。类似于deepwiki、zread那种，完整拆解一个github项目。但是Mermai
阅读全文
我发现，飞书的Agent生态，完整到离谱了。普通人养虾、爱马仕的最好时机。
作者：探索AGI发布日期：2026-04-17 13:58:00
最近在折腾Hermes Agent的时候，在官网看到了一个东西。飞书，竟然是对龙虾输出支持最好的平台。我有点懵，因为飞书我平时很少在用。所以，我特地去搜了一下，发现最近飞书在打通龙虾、爱马仕圈的评价真
阅读全文
Anthropic说：Session Management 是最好用的 Harness Engineering！
作者：探索AGI发布日期：2026-04-16 11:50:00
Anthropic小课堂又开课了。全网一天到晚的讲Harness工程概念，看的都麻木了。A社说，先从这一步来把，管理Session、Context、Compaction、Branching，这些都实打
阅读全文
RAG已死，但Agent记忆永生！
作者：探索AGI发布日期：2026-04-15 11:50:00
Claude-Mem、LLM Wiki、mem_base、Claude + Obsidian、AI Knowledge Layer ...各种新名词、开源工具，又一次让持久记忆、第二大脑、知识层，成为
阅读全文
最新！万字综述Harness革命！
作者：探索AGI发布日期：2026-04-14 11:50:00
模型智力已经在线了。无论中国还是外国的模型都OK。我不需要模型再进步了，它已经超过一般人的智商水平一大块了。我就希望它能真正帮我把事儿做好。昨晚听了一场关于Harness Engineering的直播
阅读全文
Karpathy的编程经验Skills，开源了，Star涨疯了。
作者：探索AGI发布日期：2026-04-13 11:50:00
周末，Karpathy大佬的编程经验开源skills项目火了。它做的事情特别简单，就是把 Karpathy 吐槽大模型写代码的那些问题，编译成大模型可以理解的约束，周末星星疯涨。Karpathy 原话
阅读全文
Karpathy用「harness」彻底终结了RAG。
作者：探索AGI发布日期：2026-04-10 11:50:00
假期的时候，Karpathy 大神发了一个llm.wiki的想法。这条推文火爆了。在LLM Agent时代，分享具体代码或应用的意义正在变弱，现在只需要分享想法，然后把它交给 Claude、Grok
阅读全文
Anthropic试图彻底杀死Harness Engineering。
作者：探索AGI发布日期：2026-04-09 11:57:16
Anthropic今天发了一个新的产品。定位是：你不用做Harness了，我帮你做。模型的局限性我最清楚，我来按模型特性设计 Harness，打包卖给你。而这个包，就是 Managed Agents
阅读全文
装完Hermes Agent玩了一圈，我觉得龙虾已死！
作者：探索AGI发布日期：2026-04-08 11:50:13
Hermes Agent 势头很猛，这几天推荐的人很多。被很多大佬认为这是，龙虾以来，第一个真正意义上的竞争对手了。img我自己装了玩了下，我感觉这个设计思路蛮有意思。看完它的架构，第一反应是：这个东
阅读全文
NanoCoder：我把50万行的claude code核心机制浓缩成1000行，不可能学不会了吧！
作者：探索AGI发布日期：2026-04-06 11:50:00
前几天 Claude Code 源码泄露之后，50万的源码。相信大家最大的问题是， Claude Code 的核心到底怎么实现的？有没有 Python 版的参考实现？我想在其基础上做自己的 Codin
阅读全文
Anthropic说：网传的Harness思路过时了，做这3件事就够！
作者：探索AGI发布日期：2026-04-03 11:55:04
上周写Harness Engineering的时候 Anthropic说：不要在等下一代模型了，立刻马上做Harness！，Anthropic极力想传达的结论是：真正稀缺的能力不在模型里面，在模型外面
阅读全文
13万人排队的Seedance 2.0，LibTV上不排队。附N合1 Skills（免费）
作者：探索AGI发布日期：2026-04-02 11:50:00
我做了一件挺蠢的事。最近在调试一个N合一的视频生成的skills，天天去官方排队用Seedance 2.0跑视频。每天13万人排队，中下午排队2小时起步，凌晨十几分钟一个视频。直到有个朋友给我说：你是
阅读全文
十个顶级 Claude Code Skills，搭配泄露源码食用最佳。
作者：探索AGI发布日期：2026-04-01 11:50:06
Claude Code 昨天被“被动开源”了。预计国产Coding工具，近一个月会迎来一波史诗级加强。今天不聊源码，聊 Skill。当大家都可以安装部署自己的Claude Code，（源码缺失了一些东
阅读全文
215项SOTA + 自然涌现Vibe Coding，Qwen3.5 Omini实测！
作者：探索AGI发布日期：2026-03-31 11:50:00
Qwen3.5-Omni发布了。昨晚看到官方推送，千问终于更新了一波Omni这个全模态系列。不过，早上看群友发的截图。Qwen 3.6 似乎也要来了。上午试玩了一波。依旧，输入测支持图、视频、文本。
阅读全文
25亿美元，Sora死了！5分钟，我一个人拍了条AI短剧，行业彻底变天
作者：探索AGI发布日期：2026-03-30 17:00:00
OpenAI 宣布关停 Sora，25 个月便黯然退场，只为腾算力备战 IPO，连迪士尼巨额合作也告吹。反而国内 AI 视频发展迅猛，多款产品年收入可观，创作者与生成视频数量庞大。核心差异在于国内工具
阅读全文
Anthropic 产品负责人：PRD 已死，原型万岁
作者：探索AGI发布日期：2026-03-27 11:50:00
Anthropic Claude Code 产品负责人 Cat Wu ，最近聊了聊他们团队的产品经理现在到底怎么干活的。说实话，整个看下来，这其实就是一套产品的 Harness Engineering
阅读全文
全民养虾，百虾大战，但2026年了，99%的企业用AI还是没赚到钱。
作者：探索AGI发布日期：2026-03-26 11:50:00
最近几周，从全面养虾，到百虾大战WorkBuddy、jvs claw、ArkClaw... 这些大厂疯狂推出自己的消费级Agent产品。试图重新定义的个人效率？但有一个事实，很少有人提：2026年了，
阅读全文
Anthropic说：不要在等下一代模型了，立刻马上做Harness！
作者：探索AGI发布日期：2026-03-25 11:50:00
同一个模型，什么都没换。数据没换，提示词没换，只换了模型外面包的那层运行环境，编程基准的成功率从 42% 跳到了 78%。这个数据来自 Nate B Jones 的一项研究。变量只有一个：模型外面的壳
阅读全文
裁员40%，股价暴涨23%。老板用过AI之后，对一个人的期望已经按十个人在定了。
作者：探索AGI发布日期：2026-03-24 11:50:00
B站、讯飞、Meta、亚马逊、甲骨文、讯飞....随便搜一下 “裁员”，话题根本翻不完。我觉得已经没必要争论AI裁员会不会发生了。它正在发生。Block裁了40%的人。股价涨了23%。这样对比，答案太
阅读全文