别瞧不起「提示词」芝大论文爆火:Prompt Science已被定义
最近网上出现了一些很有趣的声音——"提示词已死"、"写提示词把自己写死了",这些文章认为随着模型变得越来越智能,精心设计提示词的时代已经过去了。但芝加哥大学的最新研究却给出了完全相反的结论:promp
阅读全文最近网上出现了一些很有趣的声音——"提示词已死"、"写提示词把自己写死了",这些文章认为随着模型变得越来越智能,精心设计提示词的时代已经过去了。但芝加哥大学的最新研究却给出了完全相反的结论:promp
阅读全文我想问您一个问题:上次为了让AI代理调用某个第三方API,您花了多长时间写包装代码?一天?三天?还是一周?不过现在,Brandeis大学的研究者们带来了一个让人眼前一亮的解决方案——Doc2Agent
阅读全文这两天Google推出了Gemini-CLI这个编程工具,功能和Claude Code基本一致,结果根本排不上队,登录一下很快闪退,和下图一样,使用感受令人不愉悦。很多人都在等着体验这个新工具,但现实
阅读全文关于大模型产生幻觉这个事,从2023年GPT火了以后,就一直是业界津津乐道的热门话题,但始终缺乏系统性的重磅研究来深入解释其根本机制。今天,伯克利的研究者们带来一个重要研究成果:让基于Transfor
阅读全文剑桥大学和范德夏尔实验室在 ICML 2024 上发表的立场论文,直接挑战了当前Agent开发的核心假设:我们一直在用错误的方式让Agent"自我改进"。论文作者 Tennison Liu 和 Mih
阅读全文您最近是不是老听同事讨论"我的工作会被AI替代吗"?别慌,斯坦福大学刚刚发布了一份重磅研究报告,用史上最大规模的数据告诉您真相。你敢想象吗?你的工作“含人量”多少,决定你值多少钱?“含人量”是我首次创
阅读全文您有没有这样的体验?一天的工作里,您可能用GPTo3写了个方案,然后切换到Cursor或者Trae里写代码,接着又打开Notion或者飞书整理文档。每个工具都挺聪明,但它们彼此之间就像生活在平行宇宙—
阅读全文G-Memory研究团队 投稿新加坡国立大学、同济大学等 | 技术解读自Agent火了以后,有关"记忆"的框架如雨后春笋般涌现,但绝大多数仍是为"单兵作战"设计,难以适应需要复杂协作、信息交互量暴增1
阅读全文您可能会问,LLM Agent的SOP到底是什么,为什么称它为AI的高考?SOP全称是标准操作程序(Standard Operating Procedures)很多朋友可能很熟悉,但它绝不是简单的步骤
阅读全文还记得DeepSeek-R1发布时AI圈的那波狂欢吗?"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏,连不少技术大佬都在
阅读全文现在市面上有46种Prompt工程技术(论文中引用的数据,和我去年这个时候介绍的论文是一致的《防骗| 连这些引用量最高的核心Prompt都不知道,还敢打着专家大师旗号蒙人》),但真正能在软件工程任务中
阅读全文宾夕法尼亚大学沃顿商学院生成式AI实验室刚刚发布了两份重磅研究报告,通过严格的科学实验揭示了一个令人震惊的事实:我们可能一直在用错误的方式与AI对话。这不是胡说八道,而是基于近4万次实验得出的硬核数据
阅读全文2024年,伯克利人工智能研究中心(BAIR)率先提出了一个新概念——复合人工智能系统(Compound AI Systems,简称CAIS)。这个看似简单的术语背后,蕴含着AI系统架构的根本性改变:
阅读全文通过这份全面指南探索大语言模型(LLMs)的关键概念、技术和挑战,专为AI爱好者和准备面试的专业人士精心打造。引言大语言模型(LLMs)正在革命性地改变人工智能领域,支持从聊天机器人到自动化内容创建的
阅读全文您有没有发现,现在市面上的AI角色扮演的Agent总有种「隔靴搔痒」的感觉?用户和AI聊天时,AI虽然能说出符合角色设定的话,但总觉得缺了点什么——就像演员在背台词,而不是真的在思考。感觉很假,也很奇
阅读全文华东师范大学、美团、东华大学、清华大学联合研究团队提出的RMoA框架,最大限度地提高模型响应的信息利用率,同时最大限度地降低计算成本,本文已被ACL2025接受。论文地址:https://arxiv.
阅读全文📋 TL;DR💡 启发:主席在《矛盾论》中强调"具体问题具体分析,是Marxism的活的灵魂"。而在AI领域,我们终于有了一个能够践行这一哲学思想的技术框架——MAS-ZERO,帮我们构建能够因地制
阅读全文TL;DRMetaMind是一个多智能体框架,专门解决大语言模型在社交认知方面的根本缺陷。传统的 LLM 常常难以应对现实世界中人际沟通中固有的模糊性和间接性,无法理解未说出口的意图、隐含的情绪或
阅读全文您是否遇到过这样的困扰:明明搭建了完善的RAG系统,但Agent总是回答过时的信息,或者面对历史偏好变化时一脸茫然?三个月前说喜欢激进投资策略,两周前改口要稳健配置,今天又想尝试新兴市场,传统RAG
阅读全文TL;DR:如果您有一个AI产品,用户问您这是AI Agent还是Agentic AI?如果您回答不出来,或者认为这两个概念是一回事,那您可能需要重新审视自己的技术认知了。不过没关系,因为99%的人
阅读全文🌟 TL;DR:多智能体的美好愿景与残酷现实1986年,图灵奖得主Fred Brooks在软件工程领域提出了著名的"没有银弹"理论:没有任何一种技术或方法能够独自带来软件工程生产力的数量级提升。近四
阅读全文Anthropic公司正式发布Claude 4系列模型,在编程能力和推理表现上全面领先,发布后10分钟,Cursor也可以用了。。。📢 重磅登场:AI界迎来新标杆Anthropic公司在2025年5
阅读全文导读:HALO框架通过三大创新机制重塑多Agent(MAS)协作方式:层次化推理架构克服了认知过载问题,让智能体各司其职;动态角色实例化能针对不同任务匹配专业智能体;基于MCTS的搜索引擎自动探索最
阅读全文📌 导读产品刚上线缺乏用户数据,巧妇难为无米之炊,怎么办?JPMorganChase团队开发的框架完美解决了这一痛点!针对金融领域短文本查询识别难、新产品缺乏用户数据的冷启动问题,该框架创新性地结合
阅读全文导读:微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现
阅读全文导读: 每次更换语言模型就要重新优化提示词?资源浪费且效率低下!本文介绍MetaSPO框架,首个专注模型迁移系统提示优化的元学习方法,让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果:
阅读全文导读:在上一篇文章中,我为大家介绍了SAT如何通过神经网络驱动的智能分段技术,解决传统文本处理中的语义割裂问题。今天,我将继续与您探讨SAT如何与Pneuma系统融合,开创表格数据检索与表示的新范式
阅读全文导读:搞RAG开发,一个被普遍忽视却又至关重要的痛点是:如何避免Token分块带来的语义割裂问题。SAT模型通过神经网络驱动的智能分段技术,巧妙解决了这一难题。它不是RAG的替代,而是RAG的强力前
阅读全文导读:最近ContextGem很火。它既不是RAG也不是Agent,而是专注于"结构化提取"的框架,它像一个"文档理解层",通过文档中心设计和神经网络技术(SAT)将非结构化文档转化为精确的结构化数
阅读全文2025年已过近半,当很多朋友还在为社交媒体上的4+4新闻激动时,不少默默钻研技术的开发者已经在Agent开发热潮中抢占先机。如今,Agent技术已成为AI领域的制高点,不论是微软、Google还是
阅读全文