全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    别再靠玄学调Prompt了!几十年前的PC老技术,竟成了拯救大模型“脑容量不够”的终极杀招?

    作者:Tommy学习录发布日期:2026-04-23 09:16:22

    系列文章用“Harness Engineer”打造真正属于你的全能AI大管家:解密SemaClaw,你的下一个AI不是聊天软件,而是“一支团队”上交大/CMU等重磅综述万字精读:定义未来5年 AI A

    阅读全文
  • 文章封面

    别再迷信“通用大脑”了!微软&港城大神仙论文:让AI自己给自己写“专属记忆”

    作者:Tommy学习录发布日期:2026-04-22 09:23:34

    系列文章用“Harness Engineer”打造真正属于你的全能AI大管家:解密SemaClaw,你的下一个AI不是聊天软件,而是“一支团队”上交大/CMU等重磅综述万字精读:定义未来5年 AI A

    阅读全文
  • 文章封面

    上交大/CMU等重磅综述万字精读:定义未来5年 AI Agent 架构的“唯一主线”

    作者:Tommy学习录发布日期:2026-04-21 09:29:34

    系列文章用“Harness Engineer”打造真正属于你的全能AI大管家:解密SemaClaw,你的下一个AI不是聊天软件,而是“一支团队”一、 核心摘要:这篇论文为什么重要?想象一下,人类是怎么

    阅读全文
  • 文章封面

    用“Harness Engineer”打造真正属于你的全能AI大管家:解密SemaClaw,你的下一个AI不是聊天软件,而是“一支团队”

    作者:Tommy学习录发布日期:2026-04-20 08:18:00

    一、核心摘要如果你一直在关注AI,你一定有这样的感觉:现在的AI大模型(比如GPT-4、Claude)越来越聪明了,它们能写代码、能写文章,甚至能跟你畅聊人生。但是, 当我们想把它们当成一个真正的“私

    阅读全文
  • 文章封面

    逆向拆解 Claude Code:当今最强 AI 的大脑里,只有 1.6% 是真 AI

    作者:Tommy学习录发布日期:2026-04-19 09:19:00

    一、论文核心摘要论文标题:Dive into Claude Code: The Design Space of Today’s and Future AI Agent Systems(深度解剖 Cla

    阅读全文
  • 文章封面

    人类教的反而更差?一文读懂《EvoSkills》:大模型如何实现真正的“技能自我进化”?必须让AI自己悟!

    作者:Tommy学习录发布日期:2026-04-18 19:21:58

    系列文章从终端到可观测平台:codex-viewer 让 Codex 的每一步都看得见深度解读 SkillClaw:告别“单机模式”,让大模型实现“一人踩坑,全网避雷”的集体进化!AI竟然学会给自己写

    阅读全文
  • 文章封面

    别再死磕“提示词”了!浙大&美团这篇神级论文,SKILL0让AI彻底扔掉说明书,把技能长进脑子里!

    作者:Tommy学习录发布日期:2026-04-17 08:31:06

    系列文章从终端到可观测平台:codex-viewer 让 Codex 的每一步都看得见深度解读 SkillClaw:告别“单机模式”,让大模型实现“一人踩坑,全网避雷”的集体进化!AI竟然学会给自己写

    阅读全文
  • 文章封面

    《黑客帝国》成真?给小AI插上“满级技能U盘”!深度拆解浙大&蚂蚁最新爆款论文 SkillX

    作者:Tommy学习录发布日期:2026-04-16 09:11:41

    系列文章从终端到可观测平台:codex-viewer 让 Codex 的每一步都看得见深度解读 SkillClaw:告别“单机模式”,让大模型实现“一人踩坑,全网避雷”的集体进化!AI竟然学会给自己写

    阅读全文
  • 文章封面

    让AI像人类专家一样“写武功秘籍”,深度拆解阿里千问最新 Trace2Skill 框架

    作者:Tommy学习录发布日期:2026-04-15 09:25:36

    系列文章从终端到可观测平台:codex-viewer 让 Codex 的每一步都看得见深度解读 SkillClaw:告别“单机模式”,让大模型实现“一人踩坑,全网避雷”的集体进化!AI竟然学会给自己写

    阅读全文
  • 文章封面

    AI竟然学会给自己写“武功秘籍”了!深度拆解上海AI实验室重磅新作 AutoSkill

    作者:Tommy学习录发布日期:2026-04-14 09:09:08

    系列文章深度解读 SkillClaw:告别“单机模式”,让大模型实现“一人踩坑,全网避雷”的集体进化!从终端到可观测平台:codex-viewer 让 Codex 的每一步都看得见一、核心摘要论文基本

    阅读全文
  • 文章封面

    深度解读 SkillClaw:告别“单机模式”,让大模型实现“一人踩坑,全网避雷”的集体进化!

    作者:Tommy学习录发布日期:2026-04-13 08:18:00

    一、 核心摘要论文标题: SkillClaw: Let Skills Evolve Collectively with Agentic Evolver(SkillClaw:用智能进化器让技能实现集体进

    阅读全文
  • 文章封面

    从终端到可观测平台:codex-viewer 让 Codex 的每一步都看得见

    作者:Tommy学习录发布日期:2026-04-12 09:09:00

    codex-viewer平时我们在终端里使用 Codex,能看到结果,却很难真正看清模型请求、上下文拼接、工具调用、工具返回以及多轮的完整链路。为了解决这个问题,我做了一个开源项目 codex-vie

    阅读全文
  • 文章封面

    独家拆解 Anthropic 内部手册(构建高效AI智能体):不写花拳绣腿,真正的 AI Agent(智能体)到底怎么练?

    作者:Tommy学习录发布日期:2026-04-11 17:02:23

    Anthropic系列文章别再给 OpenAI 送冤枉钱!Anthropic 这 3 种工作流,直接帮你省 70% 算力成本当 AI 开始「轮班工作」:Anthropic 教它写好「程序员的交接手册」

    阅读全文
  • 文章封面

    别再给 OpenAI 送冤枉钱!Anthropic 这 3 种工作流,直接帮你省 70% 算力成本

    作者:Tommy学习录发布日期:2026-04-10 18:46:05

    Anthropic系列文章当 AI 开始「轮班工作」:Anthropic 教它写好「程序员的交接手册」单 AI 搞不定的复杂研究,Anthropic 用 “AI 团队(Multi Agent 研究系统

    阅读全文
  • 文章封面

    终结AI的“幻觉”与“作弊”:深度拆解北大港大神作《Claw-Eval》,重塑大模型Agent评测基准

    作者:Tommy学习录发布日期:2026-04-09 21:22:27

    一、核心摘要论文名片论文标题: Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents论文网址:https://arxiv.org/

    阅读全文
  • 文章封面

    Harnessing Claude’s Intelligence官方解读:释放Claude能力的三大架构设计方法

    作者:Tommy学习录发布日期:2026-04-08 09:26:00

    系列文章别再卷“提示词”了!斯坦福最新突破Meta-Harness:开放文件系统权限,让 AI 自主查 Bug 重构系统Harness Engineering 实战:从Top30到Top5,GPT-5

    阅读全文
  • 文章封面

    细思极恐的AI打工人:“老板,证据我都处理干净了”——一场让人后背发凉的顶级AI测试

    作者:Tommy学习录发布日期:2026-04-07 08:18:00

    一、 论文核心摘要论文标题: ”I must delete the evidence”: AI Agents Explicitly Cover up Fraud and Violent Crime(“

    阅读全文
  • 文章封面

    别被DeepSeek和o1骗了!顶会新论文扒下AI底裤:它的思考过程可能都是“伪装”的

    作者:Tommy学习录发布日期:2026-04-06 09:29:00

    你的AI是真的在“思考”吗?这篇顶会论文戳破了“思维链”的窗户纸近年来,随着OpenAI的o1模型、DeepSeek-R1等“推理型”大模型的爆火,我们常常被它们在给出答案前那段长长的、煞有介事的“思

    阅读全文
  • 文章封面

    🪄神笔马良走进现实:DeepMind 110亿参数模型Genie,让草图秒变可玩游戏!

    作者:Tommy学习录发布日期:2026-04-05 09:16:00

    一、核心摘要——Genie是什么?1. 论文核心信息速览论文标题: Genie: Generative Interactive Environments(Genie:生成式交互环境)论文网址:http

    阅读全文
  • 文章封面

    Qwen3.5-Omni:新一代大规模原生全模态大模型

    作者:Tommy学习录发布日期:2026-04-04 13:23:28

    要了解Qwen3.5-Omni,首先我们要先深入了解下Qwen3-Omni 的技术报告,以下是Qwen3-Omni的技术报告打破“鱼与熊掌”的魔咒:深度解码阿里 Qwen3-Omni 技术报告如果你关

    阅读全文
  • 文章封面

    Google DeepMind 最新发布 Gemma 4:开源模型,终于真正进入“端侧推理时代”

    作者:Tommy学习录发布日期:2026-04-03 13:08:57

    不是所有开源模型,都能真正跑到手机、浏览器和边缘设备上。 而 Gemma 4 的意义,就在于它不只是“更强了”,而是第一次把 高性能、长上下文、多模态、Agent 能力 ,系统性地带进了端侧部署场景。

    阅读全文
  • 文章封面

    别再卷“提示词”了!斯坦福最新突破Meta-Harness:开放文件系统权限,让 AI 自主查 Bug 重构系统

    作者:Tommy学习录发布日期:2026-04-02 09:15:00

    系列文章驾驭式软件工程:智能体优先范式下的 Codex 赋能开发Harness Engineering 实战:从Top30到Top5,GPT-5.2 编码代理性能暴涨 13.7% 的完整拆解一、论文摘

    阅读全文
  • 文章封面

    硬核拆解!中科大提出CoMAM框架,一举攻克个性化AI“长文本记忆”难题

    作者:Tommy学习录发布日期:2026-04-01 08:18:00

    一、 论文基本信息和核心摘要论文基本信息论文标题: Collaborative Multi-Agent Optimization for Personalized Memory System(个性化记

    阅读全文
  • 文章封面

    仅用1.2B参数击败百亿大模型!深度拆解阿里SkillRouter:AI Agent如何治好“选择困难症”?

    作者:Tommy学习录发布日期:2026-03-31 08:18:00

    系列文章不用再写长 Prompt 了!Claude Skills 让LLM精准执行你的业务规则技能即文件:Anthropic Agent Skills 的极简主义哲学与渐进式披露艺术万字精读Anthr

    阅读全文
  • 文章封面

    深度解读OpenAI重磅论文:GPT-5和DeepSeek的“内心戏”大曝光,表面稳如老狗,内心慌得一批

    作者:Tommy学习录发布日期:2026-03-30 08:18:00

    一、 论文核心摘要论文标题: Reasoning Models Struggle to Control their Chains of Thought(推理模型难以控制它们的思维链)论文网址:http

    阅读全文
  • 文章封面

    白天陪你干活,半夜偷偷进化:打破AI“失忆魔咒”的超级智能体 MetaClaw 来了!

    作者:Tommy学习录发布日期:2026-03-29 09:09:00

    系列文章:从“只会陪聊”到“疯狂打工”:清华团队揭秘2026年AI大杀器OpenClaw,普通人如何驾驭硅基生命?当 OpenClaw 遇见医院!清华等团队另辟蹊径:给AI戴上“手铐”,造个医疗专属操

    阅读全文
  • 文章封面

    前Qwen大模型负责人林俊阳离职后的深思:o1 的“自言自语”已死,大模型的下一战是“行动派思考”

    作者:Tommy学习录发布日期:2026-03-28 11:10:00

    🚀 AI 的下一个拐点:从 o1 的“单纯思考”到“Agentic Thinking” (行动派思考)💡 写在前面的思考:最近读到林俊阳关于大模型演进的这篇文章,深受启发。过去大半年,整个科技圈都在为

    阅读全文
  • 文章封面

    AI太“完美”反而露馅了?微软最新研究:大模型根本学不会人类的“胡搅蛮缠”

    作者:Tommy学习录发布日期:2026-03-27 08:08:00

    一、论文速览:当AI试图模仿人类,却败在了“不够奇葩”上想象一下,你平时开会或者和朋友聊天时,是不是经常遇到这样的情况:有人中途插话、有人前言不搭后语、有人对你的话产生误解、甚至有人就是固执己见和你杠

    阅读全文
  • 文章封面

    当你向AI倾诉抑郁时,它在后台偷偷想了什么?深度拆解碾压GPT-4o的精神科问诊大模型MIND,看AI如何告别“拍脑门诊断”!

    作者:Tommy学习录发布日期:2026-03-26 08:08:00

    一、 论文速览论文标题: MIND: Unified Inquiry and Diagnosis RL with Criteria Grounded Clinical Supports for Psy

    阅读全文
  • 文章封面

    给AI插上“U盘”:别再死磕提示词了,Agent Skills 时代已来!

    作者:Tommy学习录发布日期:2026-03-25 08:33:57

    Skills系列文章:技能即文件:Anthropic Agent Skills 的极简主义哲学与渐进式披露艺术万字精读Anthropic Claulde Skills官方手册:不懂代码,如何把“人工智

    阅读全文
下一页