45秒 → 45分钟:Anthropic实测,用户对AI Agent的信任已悄然翻倍
Anthropic昨天(2026年2月18日)发布了《Measuring AI Agent Autonomy in Practice》,我一口气读完,觉得这绝对是今年开年最务实的AI安全报告之一。An
阅读全文Anthropic昨天(2026年2月18日)发布了《Measuring AI Agent Autonomy in Practice》,我一口气读完,觉得这绝对是今年开年最务实的AI安全报告之一。An
阅读全文Claude Code、Cursor、Gemini CLI、Copilot、Codex CLI 等其实都支持一种叫 Agentic Skills 的玩法:Agentic Skills 本质上就是一套预
阅读全文港大又整活了,ClawWork把原本的 openclaw/nanobot AI 框架升级成了一个能“赚钱”的 AI 同事(AI Coworker)。核心玩法是这样的:使用 GDPVal 数据集 中的
阅读全文先祝大家春节快乐、阖家安康、马年行大运!昨晚我准备在爆竹声中入睡迎接马年时,刷到阿里突然开源Qwen3.5(以Qwen3.5-397B-A17B为首发)。官方评测数据显示,它在知识、推理、编码、多模态
阅读全文2月9号启动,现在近10k Star的 PicoClaw灵感来源于 NanoBot / OpenClaw 项目,用 Go 语言从头重构而成。你可以参考阅读:3天3.4k Star的nanobot:Op
阅读全文Anthropic低调扔出一份30+页的PDF:《The Complete Guide to Building Skills for Claude》。如果你2026年还想认真玩AI Agent,这东西
阅读全文我一直在找这样一套东西——一套不默认你通过 API 调用专有 LLMs 的 agentic framework。Virginia Tech 的研究者刚发布了 EffGen,这是一套从零为 small
阅读全文MiniMax 刚刚发布的 M2.5:在编码能力上优于 Claude Opus 4.6速度比 Claude Sonnet 更快工具调用(tool calling)达到当前最强水平它在编码基准测试上的得
阅读全文近期,Anthropic 对外发布了 Claude 最新版本所使用的“宪法”(Constitution)。这并不是一份法律文件,而是一套用于约束和引导大模型行为的价值与原则体系。在当前大模型能力快速提
阅读全文港大月初开源的OpenClaw轻量版:Nanobot又双叒叕更新了!这次是DeepCode最新 v1.2.0 版本直接把 nanobot 深度整合进去,让你可以用手机在飞书、Telegram 等聊天软
阅读全文面向长时程任务的 agentic 系统需要具备规划(planning)、正确的工具使用(tool use)以及逐步执行(step-by-step execution)的能力。多数现代 agentic
阅读全文GLM-5是智谱最新的MoE模型,总参数744B(活跃40B),从GLM-4.5的355B大幅升级,预训练数据增至28.5T tokens。专为复杂系统工程、长时序代理任务设计,在编码、Agentic
阅读全文亲手踩坑后仍然信任的东西,让你少走弯路我不是从一篇博客里学会 MCP servers 的。我是靠“管道胶带工程学”学会的:把 Python 脚本、cron jobs、半截文档的 APIs 东拼西凑,直
阅读全文Retrieval-Augmented Generation(检索增强生成,简称 RAG)是当前构建知识密集型 AI 应用的核心技术之一。但很多开发者对 Indexing(索引) 的理解存在一个普遍误
阅读全文当 AI 编程工具不再只是“补代码”,而是开始调用技能、执行任务、产出真实工件,它就已经迈入了 Agent 时代。最近不少开发者在使用字节跳动推出的 AI 编程工具 Trae 时,发现它已经不仅是一个
阅读全文“一个模型同时输出极致真实感 + 像素级完美排版”。复杂排版 & 专业 infographic 直接商用一张完整的 “A/B 测试结果汇报” 信息图:三栏布局、数据表格、流程图、柱状图、绿色进度条、中
阅读全文不少文章和讨论给人的感觉是:GraphRAG = Vector RAG + Graph DB,好像只要把向量数据库换成图数据库,就能解决所有“复杂推理”的问题。这其实是一个相当常见、也相当危险的误解。
阅读全文来自中国人民大学高瓴人工智能学院的作者团队,系统梳理了LLM如何将自主智能体从实验室玩具变成可能落地的生产级智能系统。这是目前最全面、最结构化的综述之一。自主智能体(AutoGPT、BabyAGI、V
阅读全文Claude Skills 的价值仍然被严重低估。一个设计良好的 Skill,所带来的智能能力足以匹敌,甚至超越完整的 AI 产品。更关键的是:任何人都能自己开发 Skill,不需要技术背景。以我的
阅读全文nanobot 是由香港大学 Chao Huang(@huang_chao4969)团队开发的一个极轻量级、个人化、可本地运行的 AI 智能体框架:极致轻量:完整核心代码只有大约 4000 行 Pyt
阅读全文到了 2026 年,围绕 AI 的讨论已经改变。我们不再停留在“聊天机器人演示期”。如今,严肃的公司都在构建自己的内部解决方案。他们意识到,虽然外部 API 很方便,但他们的公司数据才是最宝贵的资产,
阅读全文1. 带真实评估的RAG应用一句话描述:做出一个企业能真正上线的RAG系统,包含评估、监控、反馈闭环核心技术栈:OpenAI/Claude + 向量数据库(Pinecone/Weaviate等) +
阅读全文在深度学习领域,Ilya Sutskever 曾有一个广为流传的判断:如果真正读懂并理解 30 篇奠基性论文,基本可以掌握人工智能 90% 的核心思想。这不是指记住公式或复现 benchmark,而是
阅读全文2026年了,中国的AI大模型们还在玩2022年的互联网老套路:发红包、送奶茶。 千问请你喝奶茶,元宝给你塞微信红包,豆包直接上春晚发5亿现金。 用户们喜笑颜开,DAU(Daily Active Us
阅读全文几天前,有个人介绍了如何将 Claude Code 图像生成器插件与 Claude Code Playground 插件结合使用,以此改进图像生成效果。Claude Code 可以通过 image g
阅读全文发光的神经网络“大脑”连接到悬浮的文档图标,代表包含 bugs、decisions、configuration files 的项目记忆,便于 qucik recall一个不到 300 行的 skill
阅读全文来源 | 智合标准化建设作者 | 智合标准中心2025年12月29—30日,全国数据工作会议在北京召开。会议明确将“推动数据‘供得出、流得动、用得好、保安全’”列为2026年核心目标,并强调“强化数据
阅读全文如果你想学习 OpenClaw 的 Agent 实现逻辑,那我包你会被 430000 行代码劝退。那么香港大学(HKU)Data Intelligence Lab开源的 nanobot 绝对再合适不过
阅读全文把非结构化会议记录转化为可查询的知识图谱,并支持增量更新——无需每次全量重处理。会议记录是组织智能的金矿。它们记录了决策、行动项、参与者信息,以及人与任务之间的关系。但多数组织仍将其当作静态文档,仅能
阅读全文在 AI Agent世界中,“Agent Loop”指的是它们自主完成任务的核心迭代过程:感知环境(用户输入或当前状态)→ 推理下一步该做什么 → 规划行动(调用工具、API 等)→ 执行 → 观察结
阅读全文