AI修猫Prompt

Context Engineering不是造新词，IBM揭示LLM推理的认知秘密
作者：AI修猫Prompt发布日期：2025-07-07 21:45:49
当LangChain在6月23日发布那篇著名的Context Engineering博客时，IBM Research的研究者们早在10天前就已经用严格的学术实验证明了这套方法的有效性。只不过那时候上下
阅读全文
GitHub上5.4k+Star爆火，构建生产级Agent 的12因素
作者：AI修猫Prompt发布日期：2025-07-04 20:42:43
这是一篇在GitHub上获得5.3k+星标的重要技术文档，其中蕴含的洞察值得每一位AI产品开发者深度思考。作者Dex是一位资深的AI工程师，他试遍了市面上几乎所有的Agent框架——从广受欢迎的Lan
阅读全文
别瞧不起「提示词」芝大论文爆火：Prompt Science已被定义
作者：AI修猫Prompt发布日期：2025-07-03 21:37:13
最近网上出现了一些很有趣的声音——"提示词已死"、"写提示词把自己写死了"，这些文章认为随着模型变得越来越智能，精心设计提示词的时代已经过去了。但芝加哥大学的最新研究却给出了完全相反的结论：promp
阅读全文
Doc2Agent“爬”了所有API文档，一键API，MCP简单了
作者：AI修猫Prompt发布日期：2025-06-27 21:24:21
我想问您一个问题：上次为了让AI代理调用某个第三方API，您花了多长时间写包装代码？一天？三天？还是一周？不过现在，Brandeis大学的研究者们带来了一个让人眼前一亮的解决方案——Doc2Agent
阅读全文
连不上Gemini CLI，试下DeepSeek-R1接入Claude code
作者：AI修猫Prompt发布日期：2025-06-26 22:06:10
这两天Google推出了Gemini-CLI这个编程工具，功能和Claude Code基本一致，结果根本排不上队，登录一下很快闪退，和下图一样，使用感受令人不愉悦。很多人都在等着体验这个新工具，但现实
阅读全文
放弃幻想！伯克利重磅：消灭幻觉，就是消灭AI！
作者：AI修猫Prompt发布日期：2025-06-22 21:37:50
关于大模型产生幻觉这个事，从2023年GPT火了以后，就一直是业界津津乐道的热门话题，但始终缺乏系统性的重磅研究来深入解释其根本机制。今天，伯克利的研究者们带来一个重要研究成果：让基于Transfor
阅读全文
能自我提升的Agent需要内在的元认知学习能力。| 剑桥ICML最新
作者：AI修猫Prompt发布日期：2025-06-19 21:28:21
剑桥大学和范德夏尔实验室在 ICML 2024 上发表的立场论文，直接挑战了当前Agent开发的核心假设：我们一直在用错误的方式让Agent"自我改进"。论文作者 Tennison Liu 和 Mih
阅读全文
未来「含人量」多少，决定你值多少钱？斯坦福发布2025年重磅AI「工作内参」
作者：AI修猫Prompt发布日期：2025-06-18 22:03:44
您最近是不是老听同事讨论"我的工作会被AI替代吗"？别慌，斯坦福大学刚刚发布了一份重磅研究报告，用史上最大规模的数据告诉您真相。你敢想象吗？你的工作“含人量”多少，决定你值多少钱？“含人量”是我首次创
阅读全文
微软已为Agent悄然调转船头，当大厂都在卷“通用Agent”
作者：AI修猫Prompt发布日期：2025-06-17 21:43:45
您有没有这样的体验？一天的工作里，您可能用GPTo3写了个方案，然后切换到Cursor或者Trae里写代码，接着又打开Notion或者飞书整理文档。每个工具都挺聪明，但它们彼此之间就像生活在平行宇宙—
阅读全文
Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”
作者：AI修猫Prompt发布日期：2025-06-15 21:57:21
G-Memory研究团队投稿新加坡国立大学、同济大学等 | 技术解读自Agent火了以后，有关"记忆"的框架如雨后春笋般涌现，但绝大多数仍是为"单兵作战"设计，难以适应需要复杂协作、信息交互量暴增1
阅读全文
专治不服！Amazon重磅发布！AI的SOP高考来了！顶级Agent能考几分？
作者：AI修猫Prompt发布日期：2025-06-13 06:50:00
您可能会问，LLM Agent的SOP到底是什么，为什么称它为AI的高考？SOP全称是标准操作程序（Standard Operating Procedures）很多朋友可能很熟悉，但它绝不是简单的步骤
阅读全文
别再信“LRM无需优化提示词”了，你至少输掉23%的性能，以R1为例
作者：AI修猫Prompt发布日期：2025-06-12 00:03:13
还记得DeepSeek-R1发布时AI圈的那波狂欢吗？"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏，连不少技术大佬都在
阅读全文
14种主流Prompt技术，顶级团队2000次实验，只有这几种真能打
作者：AI修猫Prompt发布日期：2025-06-11 00:03:00
现在市面上有46种Prompt工程技术（论文中引用的数据，和我去年这个时候介绍的论文是一致的《防骗| 连这些引用量最高的核心Prompt都不知道，还敢打着专家大师旗号蒙人》），但真正能在软件工程任务中
阅读全文
沃顿商学院重磅Prompt报告：别再对AI"循循善诱"了！我们在错误地使用它！
作者：AI修猫Prompt发布日期：2025-06-10 00:26:50
宾夕法尼亚大学沃顿商学院生成式AI实验室刚刚发布了两份重磅研究报告，通过严格的科学实验揭示了一个令人震惊的事实：我们可能一直在用错误的方式与AI对话。这不是胡说八道，而是基于近4万次实验得出的硬核数据
阅读全文
LLM已进入「组装」时代，CAIS复合人工智能系统来了
作者：AI修猫Prompt发布日期：2025-06-09 06:40:00
2024年，伯克利人工智能研究中心（BAIR）率先提出了一个新概念——复合人工智能系统（Compound AI Systems，简称CAIS）。这个看似简单的术语背后，蕴含着AI系统架构的根本性改变：
阅读全文
大语言模型(LLM)面试50题（含答案）
作者：AI修猫Prompt发布日期：2025-06-07 22:49:13
通过这份全面指南探索大语言模型(LLMs)的关键概念、技术和挑战，专为AI爱好者和准备面试的专业人士精心打造。引言大语言模型(LLMs)正在革命性地改变人工智能领域，支持从聊天机器人到自动化内容创建的
阅读全文
RAR让Agent学会「成为角色」那样思考，而不仅是「像角色」一样说话 |最新
作者：AI修猫Prompt发布日期：2025-06-06 00:20:03
您有没有发现，现在市面上的AI角色扮演的Agent总有种「隔靴搔痒」的感觉？用户和AI聊天时，AI虽然能说出符合角色设定的话，但总觉得缺了点什么——就像演员在背台词，而不是真的在思考。感觉很假，也很奇
阅读全文
RMoA残差提取Mixture-of-Agents，让Agent发现新东西，并自适应停止「ACL2025」
作者：AI修猫Prompt发布日期：2025-06-05 04:12:50
华东师范大学、美团、东华大学、清华大学联合研究团队提出的RMoA框架，最大限度地提高模型响应的信息利用率，同时最大限度地降低计算成本，本文已被ACL2025接受。论文地址：https://arxiv.
阅读全文
自进化零监督多Agent框架： MAS-ZERO，让AI因地制宜动态适应
作者：AI修猫Prompt发布日期：2025-05-30 01:03:05
📋 TL;DR💡 启发：主席在《矛盾论》中强调"具体问题具体分析，是Marxism的活的灵魂"。而在AI领域，我们终于有了一个能够践行这一哲学思想的技术框架——MAS-ZERO，帮我们构建能够因地制
阅读全文
MetaMind元认知多智能体，让LLM理解对话背后的深层意图，首次达到人类水平 | 最新
作者：AI修猫Prompt发布日期：2025-05-29 01:28:48
TL;DRMetaMind是一个多智能体框架，专门解决大语言模型在社交认知方面的根本缺陷。传统的 LLM 常常难以应对现实世界中人际沟通中固有的模糊性和间接性，无法理解未说出口的意图、隐含的情绪或
阅读全文
动态数据太折磨人！静态RAG搞不定，就试下ZEP，让Agent调用实时知识图谱。
作者：AI修猫Prompt发布日期：2025-05-28 07:58:45
您是否遇到过这样的困扰：明明搭建了完善的RAG系统，但Agent总是回答过时的信息，或者面对历史偏好变化时一脸茫然？三个月前说喜欢激进投资策略，两周前改口要稳健配置，今天又想尝试新兴市场，传统RAG
阅读全文
99%的人都理解错了，AI Agent ≠ Agentic AI，康奈尔大学发33页论文澄清关键区别。
作者：AI修猫Prompt发布日期：2025-05-27 02:04:59
TL;DR：如果您有一个AI产品，用户问您这是AI Agent还是Agentic AI？如果您回答不出来，或者认为这两个概念是一回事，那您可能需要重新审视自己的技术认知了。不过没关系，因为99%的人
阅读全文
没有银弹，没有免费午餐！KtR用算法思维重构Multi-Agent设计
作者：AI修猫Prompt发布日期：2025-05-26 07:28:39
🌟 TL;DR：多智能体的美好愿景与残酷现实1986年，图灵奖得主Fred Brooks在软件工程领域提出了著名的"没有银弹"理论：没有任何一种技术或方法能够独自带来软件工程生产力的数量级提升。近四
阅读全文
Claude4来了。。。太卷了，已超越Gemini2.5Pro
作者：AI修猫Prompt发布日期：2025-05-23 01:19:04
Anthropic公司正式发布Claude 4系列模型，在编程能力和推理表现上全面领先，发布后10分钟，Cursor也可以用了。。。📢 重磅登场：AI界迎来新标杆Anthropic公司在2025年5
阅读全文
HALO，基于MCTS的层次化动态提示框架，让Agent总能找到最优路径 | 最新
作者：AI修猫Prompt发布日期：2025-05-22 07:30:00
导读：HALO框架通过三大创新机制重塑多Agent(MAS)协作方式：层次化推理架构克服了认知过载问题，让智能体各司其职；动态角色实例化能针对不同任务匹配专业智能体；基于MCTS的搜索引擎自动探索最
阅读全文
缺乏高质量用户数据咋整？试下J.P.摩根的最新框架，帮你无中生有撒豆成兵
作者：AI修猫Prompt发布日期：2025-05-21 07:10:00
📌 导读产品刚上线缺乏用户数据，巧妇难为无米之炊，怎么办？JPMorganChase团队开发的框架完美解决了这一痛点！针对金融领域短文本查询识别难、新产品缺乏用户数据的冷启动问题，该框架创新性地结合
阅读全文
可靠的Agent该用哪个模型，LLM多轮对话中的「迷失」现象 |微软最新
作者：AI修猫Prompt发布日期：2025-05-20 07:40:00
导读：微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究，说当前最先进的LLM在多轮对话中表现会大幅下降，平均降幅高达39%。这一现
阅读全文
换模型就得重新优化提示词？用下MetaSPO，专门优化系统提示的Meta-Learning框架 | 最新
作者：AI修猫Prompt发布日期：2025-05-19 06:55:00
导读：每次更换语言模型就要重新优化提示词？资源浪费且效率低下！本文介绍MetaSPO框架，首个专注模型迁移系统提示优化的元学习方法，让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果：
阅读全文
表格RAG语义割裂，用Pneuma+SAT增强检索准确性和效率 |最新
作者：AI修猫Prompt发布日期：2025-05-16 06:50:00
导读：在上一篇文章中，我为大家介绍了SAT如何通过神经网络驱动的智能分段技术，解决传统文本处理中的语义割裂问题。今天，我将继续与您探讨SAT如何与Pneuma系统融合，开创表格数据检索与表示的新范式
阅读全文
讨厌RAG生成幻觉？试一下SAT重构文本分块，按语义而不是Token
作者：AI修猫Prompt发布日期：2025-05-15 07:39:00
导读：搞RAG开发，一个被普遍忽视却又至关重要的痛点是：如何避免Token分块带来的语义割裂问题。SAT模型通过神经网络驱动的智能分段技术，巧妙解决了这一难题。它不是RAG的替代，而是RAG的强力前
阅读全文