全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    微软已为Agent悄然调转船头,当大厂都在卷“通用Agent”

    作者:AI修猫Prompt发布日期:2025-06-17 21:43:45

    您有没有这样的体验?一天的工作里,您可能用GPTo3写了个方案,然后切换到Cursor或者Trae里写代码,接着又打开Notion或者飞书整理文档。每个工具都挺聪明,但它们彼此之间就像生活在平行宇宙—

    阅读全文
  • 文章封面

    Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”

    作者:AI修猫Prompt发布日期:2025-06-15 21:57:21

    G-Memory研究团队 投稿新加坡国立大学、同济大学等 | 技术解读自Agent火了以后,有关"记忆"的框架如雨后春笋般涌现,但绝大多数仍是为"单兵作战"设计,难以适应需要复杂协作、信息交互量暴增1

    阅读全文
  • 文章封面

    专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

    作者:AI修猫Prompt发布日期:2025-06-13 06:50:00

    您可能会问,LLM Agent的SOP到底是什么,为什么称它为AI的高考?SOP全称是标准操作程序(Standard Operating Procedures)很多朋友可能很熟悉,但它绝不是简单的步骤

    阅读全文
  • 文章封面

    别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

    作者:AI修猫Prompt发布日期:2025-06-12 00:03:13

    还记得DeepSeek-R1发布时AI圈的那波狂欢吗?"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏,连不少技术大佬都在

    阅读全文
  • 文章封面

    14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

    作者:AI修猫Prompt发布日期:2025-06-11 00:03:00

    现在市面上有46种Prompt工程技术(论文中引用的数据,和我去年这个时候介绍的论文是一致的《防骗| 连这些引用量最高的核心Prompt都不知道,还敢打着专家大师旗号蒙人》),但真正能在软件工程任务中

    阅读全文
  • 文章封面

    沃顿商学院重磅Prompt报告:别再对AI"循循善诱"了!我们在错误地使用它!

    作者:AI修猫Prompt发布日期:2025-06-10 00:26:50

    宾夕法尼亚大学沃顿商学院生成式AI实验室刚刚发布了两份重磅研究报告,通过严格的科学实验揭示了一个令人震惊的事实:我们可能一直在用错误的方式与AI对话。这不是胡说八道,而是基于近4万次实验得出的硬核数据

    阅读全文
  • 文章封面

    LLM已进入「组装」时代,CAIS复合人工智能系统来了

    作者:AI修猫Prompt发布日期:2025-06-09 06:40:00

    2024年,伯克利人工智能研究中心(BAIR)率先提出了一个新概念——复合人工智能系统(Compound AI Systems,简称CAIS)。这个看似简单的术语背后,蕴含着AI系统架构的根本性改变:

    阅读全文
  • 文章封面

    大语言模型(LLM)面试50题(含答案)

    作者:AI修猫Prompt发布日期:2025-06-07 22:49:13

    通过这份全面指南探索大语言模型(LLMs)的关键概念、技术和挑战,专为AI爱好者和准备面试的专业人士精心打造。引言大语言模型(LLMs)正在革命性地改变人工智能领域,支持从聊天机器人到自动化内容创建的

    阅读全文
  • 文章封面

    RAR让Agent学会「成为角色」那样思考,而不仅是「像角色」一样说话 |最新

    作者:AI修猫Prompt发布日期:2025-06-06 00:20:03

    您有没有发现,现在市面上的AI角色扮演的Agent总有种「隔靴搔痒」的感觉?用户和AI聊天时,AI虽然能说出符合角色设定的话,但总觉得缺了点什么——就像演员在背台词,而不是真的在思考。感觉很假,也很奇

    阅读全文
  • 文章封面

    RMoA残差提取Mixture-of-Agents,让Agent发现新东西,并自适应停止「ACL2025」

    作者:AI修猫Prompt发布日期:2025-06-05 04:12:50

    华东师范大学、美团、东华大学、清华大学联合研究团队提出的RMoA框架,最大限度地提高模型响应的信息利用率,同时最大限度地降低计算成本,本文已被ACL2025接受。论文地址:https://arxiv.

    阅读全文
  • 文章封面

    自进化零监督多Agent框架: MAS-ZERO,让AI因地制宜动态适应

    作者:AI修猫Prompt发布日期:2025-05-30 01:03:05

    📋 TL;DR💡 启发:主席在《矛盾论》中强调"具体问题具体分析,是Marxism的活的灵魂"。而在AI领域,我们终于有了一个能够践行这一哲学思想的技术框架——MAS-ZERO,帮我们构建能够因地制

    阅读全文
  • 文章封面

    MetaMind元认知多智能体,让LLM理解对话背后的深层意图,首次达到人类水平 | 最新

    作者:AI修猫Prompt发布日期:2025-05-29 01:28:48

    TL;DRMetaMind是一个多智能体框架,专门解决大语言模型在社交认知方面的根本缺陷。传统的 LLM 常常难以应对现实世界中人际沟通中固有的模糊性和间接性,无法理解未说出口的意图、隐含的情绪或

    阅读全文
  • 文章封面

    动态数据太折磨人!静态RAG搞不定,就试下ZEP,让Agent调用实时知识图谱。

    作者:AI修猫Prompt发布日期:2025-05-28 07:58:45

    您是否遇到过这样的困扰:明明搭建了完善的RAG系统,但Agent总是回答过时的信息,或者面对历史偏好变化时一脸茫然?三个月前说喜欢激进投资策略,两周前改口要稳健配置,今天又想尝试新兴市场,传统RAG

    阅读全文
  • 文章封面

    99%的人都理解错了,AI Agent ≠ Agentic AI,康奈尔大学发33页论文澄清关键区别。

    作者:AI修猫Prompt发布日期:2025-05-27 02:04:59

    TL;DR:如果您有一个AI产品,用户问您这是AI Agent还是Agentic AI?如果您回答不出来,或者认为这两个概念是一回事,那您可能需要重新审视自己的技术认知了。不过没关系,因为99%的人

    阅读全文
  • 文章封面

    没有银弹,没有免费午餐!KtR用算法思维重构Multi-Agent设计

    作者:AI修猫Prompt发布日期:2025-05-26 07:28:39

    🌟 TL;DR:多智能体的美好愿景与残酷现实1986年,图灵奖得主Fred Brooks在软件工程领域提出了著名的"没有银弹"理论:没有任何一种技术或方法能够独自带来软件工程生产力的数量级提升。近四

    阅读全文
  • 文章封面

    Claude4来了。。。太卷了,已超越Gemini2.5Pro

    作者:AI修猫Prompt发布日期:2025-05-23 01:19:04

    Anthropic公司正式发布Claude 4系列模型,在编程能力和推理表现上全面领先,发布后10分钟,Cursor也可以用了。。。📢 重磅登场:AI界迎来新标杆Anthropic公司在2025年5

    阅读全文
  • 文章封面

    HALO,基于MCTS的层次化动态提示框架,让Agent总能找到最优路径 | 最新

    作者:AI修猫Prompt发布日期:2025-05-22 07:30:00

    导读:HALO框架通过三大创新机制重塑多Agent(MAS)协作方式:层次化推理架构克服了认知过载问题,让智能体各司其职;动态角色实例化能针对不同任务匹配专业智能体;基于MCTS的搜索引擎自动探索最

    阅读全文
  • 文章封面

    缺乏高质量用户数据咋整?试下J.P.摩根的最新框架,帮你无中生有撒豆成兵

    作者:AI修猫Prompt发布日期:2025-05-21 07:10:00

    📌 导读产品刚上线缺乏用户数据,巧妇难为无米之炊,怎么办?JPMorganChase团队开发的框架完美解决了这一痛点!针对金融领域短文本查询识别难、新产品缺乏用户数据的冷启动问题,该框架创新性地结合

    阅读全文
  • 文章封面

    可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

    作者:AI修猫Prompt发布日期:2025-05-20 07:40:00

    导读:微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现

    阅读全文
  • 文章封面

    换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

    作者:AI修猫Prompt发布日期:2025-05-19 06:55:00

    导读: 每次更换语言模型就要重新优化提示词?资源浪费且效率低下!本文介绍MetaSPO框架,首个专注模型迁移系统提示优化的元学习方法,让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果:

    阅读全文
  • 文章封面

    表格RAG语义割裂,用Pneuma+SAT增强检索准确性和效率 |最新

    作者:AI修猫Prompt发布日期:2025-05-16 06:50:00

    导读:在上一篇文章中,我为大家介绍了SAT如何通过神经网络驱动的智能分段技术,解决传统文本处理中的语义割裂问题。今天,我将继续与您探讨SAT如何与Pneuma系统融合,开创表格数据检索与表示的新范式

    阅读全文
  • 文章封面

    讨厌RAG生成幻觉?试一下SAT重构文本分块,按语义而不是Token

    作者:AI修猫Prompt发布日期:2025-05-15 07:39:00

    导读:搞RAG开发,一个被普遍忽视却又至关重要的痛点是:如何避免Token分块带来的语义割裂问题。SAT模型通过神经网络驱动的智能分段技术,巧妙解决了这一难题。它不是RAG的替代,而是RAG的强力前

    阅读全文
  • 文章封面

    精准提取数据太折磨人,试下pip install -U contextgem,自动生成提示 | 痛快

    作者:AI修猫Prompt发布日期:2025-05-14 06:55:50

    导读:最近ContextGem很火。它既不是RAG也不是Agent,而是专注于"结构化提取"的框架,它像一个"文档理解层",通过文档中心设计和神经网络技术(SAT)将非结构化文档转化为精确的结构化数

    阅读全文
  • 文章封面

    忘掉那个「4+4」吧!Agent开发你至少看过这4个PDF+4个开源项目。 | 万字长文

    作者:AI修猫Prompt发布日期:2025-05-13 06:50:00

    2025年已过近半,当很多朋友还在为社交媒体上的4+4新闻激动时,不少默默钻研技术的开发者已经在Agent开发热潮中抢占先机。如今,Agent技术已成为AI领域的制高点,不论是微软、Google还是

    阅读全文
  • 文章封面

    斯坦福的以弱驭强W4S,用Meta-Agent驾驭更强的LLM,准确率提升至95.4% | 最新

    作者:AI修猫Prompt发布日期:2025-05-12 07:54:35

    [读者导读]本文详细介绍了斯坦福大学最新提出的"以弱驭强"(W4S)范式,这一创新方法通过训练轻量级的弱模型来优化强大语言模型的工作流。核心亮点包括:1. 通过马尔可夫决策过程和强化学习实现弱模型自

    阅读全文
  • 文章封面

    谷歌DeepMind&CMU:过去引导LLM规划的方法是错的? 用GRASE-DC改进。ICLR2025

    作者:AI修猫Prompt发布日期:2025-05-08 23:59:06

    当您的Agent需要规划多步骤操作以达成目标时,比如游戏策略制定或旅行安排优化等等,传统规划方法往往需要复杂的搜索算法和多轮提示,计算成本高昂且效率不佳。来自Google DeepMind和CMU的研

    阅读全文
  • 文章封面

    南加州大学和苹果重磅:用「心理支架」PB&J提升AI角色扮演能力,让Agent更懂用户

    作者:AI修猫Prompt发布日期:2025-05-07 06:50:00

    文章导读照这个发展速度,不远的将来AI不仅能模仿你的行为,还能理解你为何做出这些选择。PB&J框架正是这一突破性技术的代表,它通过引入心理学中的"支架"概念,使AI能够构建合理化解释,深入理解人类决

    阅读全文
  • 文章封面

    最新发现:大规模值,注意力机制的关键密码。ICML2025

    作者:AI修猫Prompt发布日期:2025-05-06 07:30:00

    当我们惊叹于大语言模型强大的上下文理解能力时,你是否好奇它们是如何做到这一点的?本文详解罗格斯大学张永峰团队的突破性发现——注意力机制中的"大规模值"现象,这一被ICML顶会收录的研究揭示了LLM处

    阅读全文
  • 文章封面

    如何在LLM「排行榜幻象」中导航?2025AI界震撼大瓜,披露学术造假

    作者:AI修猫Prompt发布日期:2025-05-02 01:49:02

    编者按:你信任的AI排行榜,可能只是一场精心策划的骗局!震惊业界的Cohere Labs最新研究彻底撕破了Chatbot Arena这一所谓"黄金标准"的华丽面纱,揭露了科技巨头们如何肆无忌惮地操控评

    阅读全文
  • 文章封面

    Agent评估「必知」的核心方法论和8个工具,揭示如何评估Agent?

    作者:AI修猫Prompt发布日期:2025-04-30 13:30:01

    编者按:随着基于大语言模型的智能代理(LLM-based Agents)迅速走向实际应用,一个关键问题日益凸显:我们如何有效评估这些系统的真实能力?表面上的流畅对话或单一任务完成率已不足以判断Agen

    阅读全文
上一页下一页