全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    多协议协同的艺术:深度解析AgentMaster的A2A-MCP架构与工程实践(万字)

    作者:觉察流发布日期:2025-08-08 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 多智能体系统正面临通信与协调的关键挑战。本文解析AgentMaster框架,该创新性系统首次同时集成A2A与MCP协议,

    阅读全文
  • 文章封面

    告别上下文溢出:MemTool如何优化LLM智能体的工具记忆管理(万字)

    作者:觉察流发布日期:2025-08-07 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ LLM智能体在多轮对话中常因工具上下文管理不善导致性能骤降。本文解析普华永道提出的MemTool框架,三种创新模式如何解

    阅读全文
  • 文章封面

    GitHub Trending 日报【2025-08-06】

    作者:觉察流发布日期:2025-08-06 22:00:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 以下内容作者是 openai/gpt-oss-120b ” 今日趋势今天GitHub上最受关注的项目主要集中在人工智能

    阅读全文
  • 文章封面

    GitHub Trending 日报【2025-08-05】

    作者:觉察流发布日期:2025-08-05 22:00:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 以下内容作者是 Qwen3-Coder-480B-A35B-Instruct ” 今日趋势今日GitHub上最受关注的项

    阅读全文
  • 文章封面

    可验证、可泛化、可信赖:CompassJudger-2的"可验证奖励"如何炼成通用判断新范式(万字)

    作者:觉察流发布日期:2025-08-04 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在LLM评估领域,判断模型长期受限于狭窄专业化与有限鲁棒性。CompassJudger-2通过可验证奖励机制与任务驱动数

    阅读全文
  • 文章封面

    拆解 AgentMesh:一个可验证、可追溯的 AI 软件工厂(万字)

    作者:觉察流发布日期:2025-08-01 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AgentMesh 的真正启示不在自动化,而在“架构即控制”。其工件驱动、角色分离的设计,为构建可追溯、可干预的复杂AI

    阅读全文
  • 文章封面

    解构GoldMine OS:AI Agent如何破解RWA“不可能三角”

    作者:觉察流发布日期:2025-07-31 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当AI成为金融系统的“智能协调层”,去中心化黄金交易如何突破合规、流动性与风控的“不可能三角”?GoldMine OS用

    阅读全文
  • 文章封面

    四维解析:智能体如何实现自我进化(万字综述)

    作者:觉察流发布日期:2025-07-30 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 智能体正从“使用工具”迈向“创造工具”。本文基于最新综述,系统解构自我进化智能体的四大维度——什么、如何、何时、在何处进

    阅读全文
  • 文章封面

    领导者的认知跃迁:MLPO如何通过多智能体训练实现能力突破

    作者:觉察流发布日期:2025-07-29 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 传统多智能体系统需联合训练多个模型,成本高昂。本文介绍的MLPO框架另辟蹊径——仅训练一个"领导者"协调未训练的智能体团

    阅读全文
  • 文章封面

    AI即战略:20个AI员工创造3000万美金:自主商业模型的崛起(万字)

    作者:觉察流发布日期:2025-07-28 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AI不再只是工具。当Agentic AI能自主决策、执行并学习,企业便进入了“AI即战略”的新纪元。本文解析了从辅助到自

    阅读全文
  • 文章封面

    从日志到策略:AGENT KB 如何让智能体无训练学会“举一反三”

    作者:觉察流发布日期:2025-07-27 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AGENT KB突破了传统知识库局限,通过教师-学生双相检索机制和自适应精炼技术,将原始执行日志转化为可泛化的推理模式。

    阅读全文
  • 文章封面

    协同 RAG-Reasoning:让大模型边想边查的“深度研究”范式(万字综述)

    作者:觉察流发布日期:2025-07-26 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当大模型开始“边找边想”,检索与推理不再是单向流程,而是一场实时对话。百篇论文、几十个基准、4 大踩坑指南,为你画出一张

    阅读全文
  • 文章封面

    重新审视 LLM:集体知识的动态映射与人机共舞

    作者:觉察流发布日期:2025-07-11 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当我们与大型语言模型对话交流时,是否意识到它是我们集体知识的映射?它并非传统意义上的工具,而是一个动态激发智能的系统。本

    阅读全文
  • 文章封面

    OctoThinker:借“中期训练”之力,缩小 Llama 和 Qwen 模型的差距

    作者:觉察流发布日期:2025-07-10 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在大型语言模型的推理能力提升之路上,OctoThinker 研究直击核心——通过精妙的中期训练策略,成功唤醒 Llama

    阅读全文
  • 文章封面

    WebSailor 突破边界:助力开源智能体跨越复杂推理 “天花板”

    作者:觉察流发布日期:2025-07-09 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当信息如潮水般涌来,人类的认知却受限于生理与思维的边界。智能体技术成为破局利器,可开源智能体却长期被性能瓶颈所困。Web

    阅读全文
  • 文章封面

    终结奖励欺骗?Google Deepmind 提出 Crome 框架(万字)

    作者:觉察流发布日期:2025-07-08 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 大型语言模型的对齐问题一直困扰着人工智能领域。奖励欺骗问题使模型基于表面特征赋予高分,导致策略与高质量行为脱节。Goog

    阅读全文
  • 文章封面

    ASTRO:赋予语言模型搜索式推理能力的创新框架(万字)

    作者:觉察流发布日期:2025-07-07 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 推理能力是衡量模型先进性的重要指标之一。ASTRO 框架,为开源语言模型推理能力的提升带来了新的思路,让我们重新思考如何

    阅读全文
  • 文章封面

    推理锚点:解码LLM推理的关键节点(可解释性研究)

    作者:觉察流发布日期:2025-07-06 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在 LLM 的推理过程中,某些关键句子如同“锚点”,对整个推理轨迹产生深远影响。本文通过三种创新方法分析这些“推理锚点”

    阅读全文
  • 文章封面

    Skywork-Reward-V2:人类-AI协同创新,解锁奖励模型新潜力

    作者:觉察流发布日期:2025-07-05 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 尽管奖励模型在 RLHF 中扮演着关键角色,但现有开源模型在多数评估基准上表现不佳。Skywork-Reward-V2

    阅读全文
  • 文章封面

    Mind2Web 2:智能体搜索系统的进化与评估之道

    作者:觉察流发布日期:2025-07-01 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在信息大量溢出的时代,智能体搜索系统正以其强大的自主性和智能化能力,重塑我们获取知识的方式。Mind2Web 2 基准测

    阅读全文
  • 文章封面

    MCP 安全之殇:智能体系统的隐忧与破局

    作者:觉察流发布日期:2025-06-28 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在 MCP 驱动的智能代理系统蓬勃发展的当下,我们正站在技术革新的十字路口。它带来了前所未有的交互体验,却也潜藏了不容忽

    阅读全文
  • 文章封面

    STORYWRITER:长篇故事生成的多智能体框架

    作者:觉察流发布日期:2025-06-27 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 文字是一切内容的起点,IP 是泛娱乐行业的宝藏。该来的总要来,AI迈进长篇故事生成领域,话语连贯性与叙事复杂性是LLM生

    阅读全文
  • 文章封面

    掌控 AI 智能体自主性:五级框架下的人机协作之道(万字)

    作者:觉察流发布日期:2025-06-20 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AI智能体自主性分级,是掌控其潜力与风险的关键。在AI浪潮中,如何精准校准智能体自主性,使其高效服务人类又不致失控,是需

    阅读全文
  • 文章封面

    模型合并 之 PMA 策略:大型语言模型预训练的 “加速引擎”

    作者:觉察流发布日期:2025-06-19 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 大型语言模型发展迅猛,但预训练成本高昂、训练不稳定等问题需要解决。本文探讨了预训练模型合并技术,尤其是 PMA 策略,为

    阅读全文
  • 文章封面

    2025年AI驱动软件开发:16款“Vibe Coding”工具盘点(2.5万字)

    作者:觉察流发布日期:2025-06-18 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 本文聚焦2025年AI Coding领域,解析Vibe Coding新范式,其核心是通过自然语言描述,AI辅助生成代码,

    阅读全文
  • 文章封面

    AgentRM 奖励建模:智能体泛化能力的“导航仪”与“加速器”(万字)

    作者:觉察流发布日期:2025-06-16 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AgentRM 提出三种奖励模型方法,显式奖励建模、隐式奖励建模和LLM作为裁判。AgentRM 通过创新的奖励建模和测

    阅读全文
  • 文章封面

    Agentic Neural Networks(ANN):自我演化的多智能体系统

    作者:觉察流发布日期:2025-06-13 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ ANN(Agentic Neural Networks)的核心目标是借助神经网络的原理,实现多智能体系统的自我演化,从而

    阅读全文
  • 文章封面

    强化预训练(RPT):LLM 预训练新范式,当模型学会战略思考(万字)

    作者:觉察流发布日期:2025-06-12 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ RPT 通过将传统的 next-token-prediction 重构为 next-token-reasoning 任务

    阅读全文
  • 文章封面

    AgentCPM-GUI:强化微调(RFT)赋能的移动设备 GUI 智能体(万字)

    作者:觉察流发布日期:2025-06-12 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在移动设备 GUI 操作领域,AgentCPM-GUI 凭借强化微调、高质量数据集与紧凑动作空间设计,突破语言壁垒,在多

    阅读全文
  • 文章封面

    LLM 智能体终身学习评估利器:LifelongAgentBench 框架(万字)

    作者:觉察流发布日期:2025-06-11 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ LifelongAgentBench,可以评估 LLM 智能体的终身学习能力哦!这是首个专门设计用于系统评估 LLM

    阅读全文
上一页下一页