全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    当AI评估遇见"专家委员会":MAJ-EVAL如何让自动化评估真正理解人类价值?

    作者:觉察流发布日期:2025-08-26 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 传统自动评估指标为何总与人类判断"脱节"?MAJ-EVAL框架通过"基于证据的角色构建"和"多智能体辩论机制",让自动化

    阅读全文
  • 文章封面

    MCP的60%成功率瓶颈:LiveMCP-101揭示AI智能体在真实场景中的失败根源

    作者:觉察流发布日期:2025-08-25 08:14:26

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ LiveMCP-101基准测试揭示:即使最前沿AI智能体在真实动态场景中的任务成功率也不足60%。本文解析该研究的双轨评

    阅读全文
  • 文章封面

    OS Agents全景解析:从MLLM基础模型到个性化智能体的演进之路

    作者:觉察流发布日期:2025-08-24 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当AI能直接操作系统,人机交互的边界将被彻底重塑。本文系统梳理MLLM驱动的OS Agents技术全栈,从基础模型、框架

    阅读全文
  • 文章封面

    记忆增强型Transformer:从神经科学原理到技术解决方案的三维解析(1.5w字)

    作者:觉察流发布日期:2025-08-23 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 本文基于最新系统性综述,以神经科学为镜,全面解析记忆增强Transformer的演进路径,揭示其从智能缓存到类脑认知架构

    阅读全文
  • 文章封面

    微软 Agent Lightning:零代码接入RL,“解耦”任何AI Agent学会“在实践中学习”

    作者:觉察流发布日期:2025-08-22 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当AI Agent的复杂性与强化学习的工程难度碰撞,开发者陷入了重写逻辑的泥潭。微软研究团队提出的Agent Light

    阅读全文
  • 文章封面

    GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类(万字)

    作者:觉察流发布日期:2025-08-21 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 一项覆盖31K图像的实证研究,为GPT-5的空间智能能力画出精确坐标。它在简单任务上遥遥领先,却在复杂挑战前与开源模型并

    阅读全文
  • 文章封面

    记忆即推理:ComoRAG的认知循环如何重塑长文本理解

    作者:觉察流发布日期:2025-08-20 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在长篇叙事的迷宫中,AI如何像人类一样“记住”线索、更新认知?ComoRAG通过模拟大脑前额叶的元认知循环,以动态记忆破

    阅读全文
  • 文章封面

    经验即代码:SWE-Exp框架如何将过往修复转化为可执行的智能资产(万字)

    作者:觉察流发布日期:2025-08-19 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在AI驱动的软件维护中,真正的突破不在于更强大的模型,而在于构建能够从历史中学习的"记忆"。SWE-Exp通过四阶段经验

    阅读全文
  • 文章封面

    透明即生产力:COPILOTLENS如何通过事后解释层实现可信AI编码

    作者:觉察流发布日期:2025-08-18 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当AI编码助手成为开发者的日常伙伴,透明度缺失却悄然埋下隐患。本文深入探讨COPILOTLENS如何通过创新的双层解释框

    阅读全文
  • 文章封面

    目标驱动而非任务序列:Agentic AI重塑业务流程自动化范式

    作者:觉察流发布日期:2025-08-17 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 业务流程自动化正经历从任务序列到目标驱动的根本性范式转变。本文基于最新研究成果,深度解析Agentic AI如何通过目标

    阅读全文
  • 文章封面

    三大核心见解驱动:AgentTTS重塑多阶段LLM任务的计算资源分配范式

    作者:觉察流发布日期:2025-08-16 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 阶段复杂任务中的计算资源分配一直是AI工程化的关键瓶颈。AgentTTS通过三大核心见解,构建LLM代理智能分配系统,在

    阅读全文
  • 文章封面

    MiroMind-M1:如何用CAMPO算法打造高效且可复现的全栈开源推理模型(万字)

    作者:觉察流发布日期:2025-08-15 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ MiroMind-M1项目解决了开源推理模型领域的核心痛点:数据不透明、训练不可复现,真正实现了全栈开源。本文解析其创新

    阅读全文
  • 文章封面

    智能体“模态之战”:谁将主宰云基础设施管理“AIOps”的未来?

    作者:觉察流发布日期:2025-08-14 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 云管理正站在智能化的临界点。本文深入剖析AI智能体在SDK、CLI、IaC与ClickOps四大模态中的实战表现,揭示其

    阅读全文
  • 文章封面

    CoT 的边界:模式匹配还是逻辑推理?数据分布如何决定CoT的成败

    作者:觉察流发布日期:2025-08-13 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 本文揭示了一个“模型推理”的真相:LLM的思维链推理,本质是数据分布内的模式匹配。一旦任务、长度或格式超出训练范围,这看

    阅读全文
  • 文章封面

    无需微调,仅靠架构:Nexus Architect 的自动化工作流实现推理跃迁

    作者:觉察流发布日期:2025-08-12 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当顶尖AI在"数字表指针"这类常识问题上频频失误,我们是否该反思:真正的推理能力究竟来自更大模型,还是更优架构?Nexu

    阅读全文
  • 文章封面

    当100个AI节点组成团队:AGENTSNET 一个揭示多智能体协作的评估框架

    作者:觉察流发布日期:2025-08-11 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AGENTSNET首次将分布式计算理论引入多智能体评估,构建可扩展至100+智能体的科学测试框架。研究显示:当前最佳AI

    阅读全文
  • 文章封面

    GasAgent:多智能体协同打破智能合约Gas优化的“不可能三角”

    作者:觉察流发布日期:2025-08-10 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Gas优化是智能合约开发的关键挑战。本文深度解析香港科技大学最新研究成果GasAgent——首个多智能体Gas优化框架。

    阅读全文
  • 文章封面

    GPT-5 不止于性能:System Card 中的专业评估新范式(万字)

    作者:觉察流发布日期:2025-08-09 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ OpenAI最新发布的GPT-5系统卡,不仅展示了AI能力的边界,更重塑了专业AI评估的范式。本文深入解析这份技术文档,

    阅读全文
  • 文章封面

    多协议协同的艺术:深度解析AgentMaster的A2A-MCP架构与工程实践(万字)

    作者:觉察流发布日期:2025-08-08 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 多智能体系统正面临通信与协调的关键挑战。本文解析AgentMaster框架,该创新性系统首次同时集成A2A与MCP协议,

    阅读全文
  • 文章封面

    告别上下文溢出:MemTool如何优化LLM智能体的工具记忆管理(万字)

    作者:觉察流发布日期:2025-08-07 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ LLM智能体在多轮对话中常因工具上下文管理不善导致性能骤降。本文解析普华永道提出的MemTool框架,三种创新模式如何解

    阅读全文
  • 文章封面

    GitHub Trending 日报【2025-08-06】

    作者:觉察流发布日期:2025-08-06 22:00:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 以下内容作者是 openai/gpt-oss-120b ” 今日趋势今天GitHub上最受关注的项目主要集中在人工智能

    阅读全文
  • 文章封面

    GitHub Trending 日报【2025-08-05】

    作者:觉察流发布日期:2025-08-05 22:00:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 以下内容作者是 Qwen3-Coder-480B-A35B-Instruct ” 今日趋势今日GitHub上最受关注的项

    阅读全文
  • 文章封面

    可验证、可泛化、可信赖:CompassJudger-2的"可验证奖励"如何炼成通用判断新范式(万字)

    作者:觉察流发布日期:2025-08-04 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在LLM评估领域,判断模型长期受限于狭窄专业化与有限鲁棒性。CompassJudger-2通过可验证奖励机制与任务驱动数

    阅读全文
  • 文章封面

    拆解 AgentMesh:一个可验证、可追溯的 AI 软件工厂(万字)

    作者:觉察流发布日期:2025-08-01 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AgentMesh 的真正启示不在自动化,而在“架构即控制”。其工件驱动、角色分离的设计,为构建可追溯、可干预的复杂AI

    阅读全文
  • 文章封面

    解构GoldMine OS:AI Agent如何破解RWA“不可能三角”

    作者:觉察流发布日期:2025-07-31 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当AI成为金融系统的“智能协调层”,去中心化黄金交易如何突破合规、流动性与风控的“不可能三角”?GoldMine OS用

    阅读全文
  • 文章封面

    四维解析:智能体如何实现自我进化(万字综述)

    作者:觉察流发布日期:2025-07-30 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 智能体正从“使用工具”迈向“创造工具”。本文基于最新综述,系统解构自我进化智能体的四大维度——什么、如何、何时、在何处进

    阅读全文
  • 文章封面

    领导者的认知跃迁:MLPO如何通过多智能体训练实现能力突破

    作者:觉察流发布日期:2025-07-29 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 传统多智能体系统需联合训练多个模型,成本高昂。本文介绍的MLPO框架另辟蹊径——仅训练一个"领导者"协调未训练的智能体团

    阅读全文
  • 文章封面

    AI即战略:20个AI员工创造3000万美金:自主商业模型的崛起(万字)

    作者:觉察流发布日期:2025-07-28 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AI不再只是工具。当Agentic AI能自主决策、执行并学习,企业便进入了“AI即战略”的新纪元。本文解析了从辅助到自

    阅读全文
  • 文章封面

    从日志到策略:AGENT KB 如何让智能体无训练学会“举一反三”

    作者:觉察流发布日期:2025-07-27 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AGENT KB突破了传统知识库局限,通过教师-学生双相检索机制和自适应精炼技术,将原始执行日志转化为可泛化的推理模式。

    阅读全文
  • 文章封面

    协同 RAG-Reasoning:让大模型边想边查的“深度研究”范式(万字综述)

    作者:觉察流发布日期:2025-07-26 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当大模型开始“边找边想”,检索与推理不再是单向流程,而是一场实时对话。百篇论文、几十个基准、4 大踩坑指南,为你画出一张

    阅读全文
下一页