全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    45秒 → 45分钟:Anthropic实测,用户对AI Agent的信任已悄然翻倍

    作者:PyTorch研习社发布日期:2026-02-20 08:40:20

    Anthropic昨天(2026年2月18日)发布了《Measuring AI Agent Autonomy in Practice》,我一口气读完,觉得这绝对是今年开年最务实的AI安全报告之一。An

    阅读全文
  • 文章封面

    12K Star,一键解锁864个Skill,支持Claude、Codex、Copliot等

    作者:PyTorch研习社发布日期:2026-02-19 08:29:44

    Claude Code、Cursor、Gemini CLI、Copilot、Codex CLI 等其实都支持一种叫 Agentic Skills 的玩法:Agentic Skills 本质上就是一套预

    阅读全文
  • 文章封面

    开局10美元的ClawWork:7小时赚10000美元,让AI给你打工

    作者:PyTorch研习社发布日期:2026-02-18 09:05:44

    港大又整活了,ClawWork把原本的 openclaw/nanobot AI 框架升级成了一个能“赚钱”的 AI 同事(AI Coworker)。核心玩法是这样的:使用 GDPVal 数据集 中的

    阅读全文
  • 文章封面

    来免费体验Qwen3.5:开启马年原生多模态智能体时代

    作者:PyTorch研习社发布日期:2026-02-17 08:20:00

    先祝大家春节快乐、阖家安康、马年行大运!昨晚我准备在爆竹声中入睡迎接马年时,刷到阿里突然开源Qwen3.5(以Qwen3.5-397B-A17B为首发)。官方评测数据显示,它在知识、推理、编码、多模态

    阅读全文
  • 文章封面

    1秒启动,比OpenClaw节省99%内存,降低98%成本!支持QQ!

    作者:PyTorch研习社发布日期:2026-02-16 07:52:59

    2月9号启动,现在近10k Star的 PicoClaw灵感来源于 NanoBot / OpenClaw 项目,用 Go 语言从头重构而成。你可以参考阅读:3天3.4k Star的nanobot:Op

    阅读全文
  • 文章封面

    Anthropic免费Skills指南宣告提示工程过时?

    作者:PyTorch研习社发布日期:2026-02-15 20:09:31

    Anthropic低调扔出一份30+页的PDF:《The Complete Guide to Building Skills for Claude》。如果你2026年还想认真玩AI Agent,这东西

    阅读全文
  • 文章封面

    终于等到一款原生面向 SLMs 的 Agentic Framework

    作者:PyTorch研习社发布日期:2026-02-15 20:09:31

    我一直在找这样一套东西——一套不默认你通过 API 调用专有 LLMs 的 agentic framework。Virginia Tech 的研究者刚发布了 EffGen,这是一套从零为 small

    阅读全文
  • 文章封面

    最新的MiniMax性能直逼Claude Opus 4.6,成本直降95%!

    作者:PyTorch研习社发布日期:2026-02-14 21:54:00

    MiniMax 刚刚发布的 M2.5:在编码能力上优于 Claude Opus 4.6速度比 Claude Sonnet 更快工具调用(tool calling)达到当前最强水平它在编码基准测试上的得

    阅读全文
  • 文章封面

    Claude 新“宪法”:Anthropic 如何重新定义 AI 的行为底层

    作者:PyTorch研习社发布日期:2026-02-14 21:54:00

    近期,Anthropic 对外发布了 Claude 最新版本所使用的“宪法”(Constitution)。这并不是一份法律文件,而是一套用于约束和引导大模型行为的价值与原则体系。在当前大模型能力快速提

    阅读全文
  • 文章封面

    科研党有福了,手机聊天APP里论文直接变代码,港大DeepCode绝了!

    作者:PyTorch研习社发布日期:2026-02-13 18:29:40

    港大月初开源的OpenClaw轻量版:Nanobot又双叒叕更新了!这次是DeepCode最新 v1.2.0 版本直接把 nanobot 深度整合进去,让你可以用手机在飞书、Telegram 等聊天软

    阅读全文
  • 文章封面

    使用 GRPO 算法训练 Multi-Agentic(多智能体)系统以完成复杂任务规划

    作者:PyTorch研习社发布日期:2026-02-13 18:29:40

    面向长时程任务的 agentic 系统需要具备规划(planning)、正确的工具使用(tool use)以及逐步执行(step-by-step execution)的能力。多数现代 agentic

    阅读全文
  • 文章封面

    免费的GLM5配上Claude/Codex 技能构建指南,太香了!

    作者:PyTorch研习社发布日期:2026-02-12 21:39:26

    GLM-5是智谱最新的MoE模型,总参数744B(活跃40B),从GLM-4.5的355B大幅升级,预训练数据增至28.5T tokens。专为复杂系统工程、长时序代理任务设计,在编码、Agentic

    阅读全文
  • 文章封面

    必看的 6 款 MCP 服务器与工具

    作者:PyTorch研习社发布日期:2026-02-12 21:39:26

    亲手踩坑后仍然信任的东西,让你少走弯路我不是从一篇博客里学会 MCP servers 的。我是靠“管道胶带工程学”学会的:把 Python 脚本、cron jobs、半截文档的 APIs 东拼西凑,直

    阅读全文
  • 文章封面

    RAG幻觉别怪模型,4种核心索引神技少一个都亏惨!

    作者:PyTorch研习社发布日期:2026-02-11 21:23:46

    Retrieval-Augmented Generation(检索增强生成,简称 RAG)是当前构建知识密集型 AI 应用的核心技术之一。但很多开发者对 Indexing(索引) 的理解存在一个普遍误

    阅读全文
  • 文章封面

    在字节跳动 Trae 里直接调用 Agent Skills:AI 编程工具的「真正完全体」来了?

    作者:PyTorch研习社发布日期:2026-02-11 21:23:46

    当 AI 编程工具不再只是“补代码”,而是开始调用技能、执行任务、产出真实工件,它就已经迈入了 Agent 时代。最近不少开发者在使用字节跳动推出的 AI 编程工具 Trae 时,发现它已经不仅是一个

    阅读全文
  • 文章封面

    Qwen-Image-2.0炸场了,像素级完美排版

    作者:PyTorch研习社发布日期:2026-02-10 22:19:25

    “一个模型同时输出极致真实感 + 像素级完美排版”。复杂排版 & 专业 infographic 直接商用一张完整的 “A/B 测试结果汇报” 信息图:三栏布局、数据表格、流程图、柱状图、绿色进度条、中

    阅读全文
  • 文章封面

    别再误解 GraphRAG:它不是“把向量库换成图数据库”那么简单

    作者:PyTorch研习社发布日期:2026-02-10 22:19:25

    不少文章和讨论给人的感觉是:GraphRAG = Vector RAG + Graph DB,好像只要把向量数据库换成图数据库,就能解决所有“复杂推理”的问题。这其实是一个相当常见、也相当危险的误解。

    阅读全文
  • 文章封面

    人大高瓴团队38页干货:LLM驱动的自主智能体终极指南

    作者:PyTorch研习社发布日期:2026-02-09 22:18:51

    来自中国人民大学高瓴人工智能学院的作者团队,系统梳理了LLM如何将自主智能体从实验室玩具变成可能落地的生产级智能系统。这是目前最全面、最结构化的综述之一。自主智能体(AutoGPT、BabyAGI、V

    阅读全文
  • 文章封面

    Agent Skills 终极指南:从零到精通

    作者:PyTorch研习社发布日期:2026-02-09 22:18:51

    Claude Skills 的价值仍然被严重低估。一个设计良好的 Skill,所带来的智能能力足以匹敌,甚至超越完整的 AI 产品。更关键的是:任何人都能自己开发 Skill,不需要技术背景。以我的

    阅读全文
  • 文章封面

    8天13K Star的nanobot进化到了MoChat:AI 智能体开始“组团社交”了

    作者:PyTorch研习社发布日期:2026-02-08 19:47:53

    nanobot 是由香港大学 Chao Huang(@huang_chao4969)团队开发的一个极轻量级、个人化、可本地运行的 AI 智能体框架:极致轻量:完整核心代码只有大约 4000 行 Pyt

    阅读全文
  • 文章封面

    2026 年如何选择合适的开源 LLM

    作者:PyTorch研习社发布日期:2026-02-08 19:47:53

    到了 2026 年,围绕 AI 的讨论已经改变。我们不再停留在“聊天机器人演示期”。如今,严肃的公司都在构建自己的内部解决方案。他们意识到,虽然外部 API 很方便,但他们的公司数据才是最宝贵的资产,

    阅读全文
  • 文章封面

    2026年春招必备AI项目,实打实的项目锤炼!

    作者:PyTorch研习社发布日期:2026-02-07 16:54:50

    1. 带真实评估的RAG应用一句话描述:做出一个企业能真正上线的RAG系统,包含评估、监控、反馈闭环核心技术栈:OpenAI/Claude + 向量数据库(Pinecone/Weaviate等) +

    阅读全文
  • 文章封面

    真正理解深度学习的人,都绕不开这 30 篇论文

    作者:PyTorch研习社发布日期:2026-02-07 16:54:50

    在深度学习领域,Ilya Sutskever 曾有一个广为流传的判断:如果真正读懂并理解 30 篇奠基性论文,基本可以掌握人工智能 90% 的核心思想。这不是指记住公式或复现 benchmark,而是

    阅读全文
  • 文章封面

    当AI变成奶茶券:“撒币获客”正在把中国AI带进劣币驱逐良币的死循环

    作者:PyTorch研习社发布日期:2026-02-06 21:42:36

    2026年了,中国的AI大模型们还在玩2022年的互联网老套路:发红包、送奶茶。 千问请你喝奶茶,元宝给你塞微信红包,豆包直接上春晚发5亿现金。 用户们喜笑颜开,DAU(Daily Active Us

    阅读全文
  • 文章封面

    不止写代码,Claude Code一键自动迭代出专业级视觉资产

    作者:PyTorch研习社发布日期:2026-02-05 21:21:41

    几天前,有个人介绍了如何将 Claude Code 图像生成器插件与 Claude Code Playground 插件结合使用,以此改进图像生成效果。Claude Code 可以通过 image g

    阅读全文
  • 文章封面

    构建你的第一个 Claude Code Agent 技能:一个能省下数小时的项目记忆系统

    作者:PyTorch研习社发布日期:2026-02-05 21:21:41

    发光的神经网络“大脑”连接到悬浮的文档图标,代表包含 bugs、decisions、configuration files 的项目记忆,便于 qucik recall一个不到 300 行的 skill

    阅读全文
  • 文章封面

    全国首部面向AI大模型的数据流通协作安全合规标准来了!

    作者:PyTorch研习社发布日期:2026-02-04 08:00:00

    来源 | 智合标准化建设作者 | 智合标准中心2025年12月29—30日,全国数据工作会议在北京召开。会议明确将“推动数据‘供得出、流得动、用得好、保安全’”列为2026年核心目标,并强调“强化数据

    阅读全文
  • 文章封面

    3天3.4k Star的nanobot:OpenClaw过于臃肿。

    作者:PyTorch研习社发布日期:2026-02-03 21:29:39

    如果你想学习 OpenClaw 的 Agent 实现逻辑,那我包你会被 430000 行代码劝退。那么香港大学(HKU)Data Intelligence Lab开源的 nanobot 绝对再合适不过

    阅读全文
  • 文章封面

    基于 LLM 抽取与 Neo4j,从会议纪要构建自更新知识图谱

    作者:PyTorch研习社发布日期:2026-02-03 21:29:39

    把非结构化会议记录转化为可查询的知识图谱,并支持增量更新——无需每次全量重处理。会议记录是组织智能的金矿。它们记录了决策、行动项、参与者信息,以及人与任务之间的关系。但多数组织仍将其当作静态文档,仅能

    阅读全文
  • 文章封面

    12.4 k Star,微软开源了Agent自我进化解决方案

    作者:PyTorch研习社发布日期:2026-01-31 21:39:48

    在 AI Agent世界中,“Agent Loop”指的是它们自主完成任务的核心迭代过程:感知环境(用户输入或当前状态)→ 推理下一步该做什么 → 规划行动(调用工具、API 等)→ 执行 → 观察结

    阅读全文
下一页