机智流

大模型到底怎么选？别再光盯着榜单看评分了！
作者：机智流发布日期：2026-02-15 19:34:21
> 本文转载自「中国电信人工智能研究院」明明榜单分数不相上下实际部署后却状况百出改个系统提示就掉性能换个输出格式就出错智能体工作流里的小问题直接引发连锁失效......大模型“高分低能” 问题到底出在
阅读全文
不被雇佣就不会被裁：AI 一人公司 OPC 爆发，附实战手册
作者：机智流发布日期：2026-02-14 23:59:54
本文由机智流AI研报基于公开信息采集与交叉验证撰写。所有事实性论断均标注信源引用（共 22 篇），但部分数据可能因时效性而有变化——请读者仔细甄别，以原始信源为准。一人公
阅读全文
蚂蚁开源 UI-Venus-1.5：一个能“看屏幕做事”的 GUI Agent，为什么又进了一步？
作者：机智流发布日期：2026-02-13 23:19:01
一句话总结：蚂蚁 Venus Team 开源 UI-Venus-1.5 ，用"四阶段闭环训练 + 真实设备在线强化学习"把 GUI Agent 从"单步能做对"推向"整条任务能做完" ，在 Groun
阅读全文
万字长文！LangGraph Router 工程实战：多来源知识问答系统搭建
作者：机智流发布日期：2026-02-12 20:10:01
> 作者：李剑锋简介架构简介在多智能体的系统中，Router 算是比较特殊的一类，因为所谓的 Router 其实并不像 Subagents 一样能够去指挥着下面的子智能体完成各式各样的任务，而只是一个
阅读全文
创新Transformer！面壁基于稀疏-线性混合架构SALA训练9B模型，端侧跑通百万上下文
作者：机智流发布日期：2026-02-12 20:10:01
> 本文转载自面壁智能众所周知，Transformer 及其核心的全注意力机制（Full Attention）虽长期占据大模型架构的核心地位，但平方级计算复杂度、高额显存占用的瓶颈，早已成为实现超长上
阅读全文
🧧机智流马年红包封面来了🧧
作者：机智流发布日期：2026-02-11 16:05:28
提前祝大家新春快乐祝大家心想事成、财源滚滚欢迎评论区留言——2026 Flag、想了解的知识...评论区点赞前五名🧧将获得6.6元红包一份🧧- 点击下图领取机智流马年红包封面 -最近我们也在挑战——春
阅读全文
聊聊大模型推理系统之vLLM-Omni：专治各种“复杂”多模态大模型，推理速度最高提升11倍
作者：机智流发布日期：2026-02-10 20:36:45
图片由 AI 生成近年来，人工智能领域正经历一场深刻的“多模态”革命。从只能处理文本的传统大语言模型（LLM），到如今能够理解并生成图像、音频、视频的“任意到任意”（Any-to-Any）多模态大模型
阅读全文
白嫖党狂喜！3万+免费 Skills让你秒变全能选手
作者：机智流发布日期：2026-02-09 23:24:22
Agent Skills真是越来越火了，上一期文章结尾我还说想找个好用的 Skills 管理工具。结果，Vercel 直接放大招——不仅开源了通用安装工具，还上线了 Skills 专属"应用商店" s
阅读全文
抢到了奶茶免单？再来尝尝 AI 圈的‘电子年货’【2 月大模型快报】
作者：机智流发布日期：2026-02-08 21:46:09
> 作者：yanbo近日，不少群被「千问 30 亿免单」的消息直接点燃：奶茶店门口排起长队，红包口令甚至都被微信禁止复制。这种级别的热闹，大概只有亲自赶上了才会有实感。而就在大家还在纠结「这杯要不要再
阅读全文
解析Flash Attention 4（FA4）：Blackwell 核心实现与架构优化
作者：机智流发布日期：2026-02-07 23:35:27
> 本文由 Intern-S1 等 AI 生成，机智流编辑部校对一个月前的Hot Chips大会上，Tri Dao发布了Flash Attention 4（下称FA4）的初步研究成果。作为Flash
阅读全文
Kimi Agent Swarm如何实现100个AI 智能体同时工作？揭秘最强开源多模态模型K2.5的并行执行革命
作者：机智流发布日期：2026-02-06 21:29:16
一句话总结：月之暗面发布Kimi K2.5，其核心创新是Agent Swarm技术，支持最多100个子智能体自主编排并行执行，执行时间最多可缩短4.5倍，实现了从单智能体到智能体集群的范式转变。原文
阅读全文
LangGraph实战：用“流程图”思维构建可控的AI Agent系统
作者：机智流发布日期：2026-02-05 20:21:45
> 作者：李剑锋简介随着 Agent 概念的普及，以 Coze、Dify 为代表的低代码 / 无代码平台迅速兴起。这类平台通过可视化配置和模块化编排，大幅降低了智能体应用的使用门槛，使非技术用户也能快
阅读全文
突破机器人操控 “最后一公里”！北大等机构提出 TC-IDM，让视觉规划精准落地物理执行，零样本操控成功率大幅提升
作者：机智流发布日期：2026-02-04 23:37:31
图片由AI生成在机器人操控领域，如何让机器精准理解视觉信息，并转化为流畅的物理动作，一直是困扰科研人员的核心问题。传统的视觉-语言-动作（VLA）模型，虽然凭借大规模数据集的加持展现出一定能力，但在面
阅读全文
聊聊大模型推理系统之 Laser：从“整块执行”到“按需分层”，看Laser如何重新定义LLM调度单元
作者：机智流发布日期：2026-02-03 22:00:00
图片由AI生成在大模型推理服务日益成为 AI 基础设施的今天，如何高效支撑多 SLO（Service-Level Objective，服务等级目标）混合负载，已成为工业界和学术界共同关注的核心挑战。最
阅读全文
北京创业 | HICOOL 2026全球创业者峰会暨创业大赛项目征集
作者：机智流发布日期：2026-02-03 22:00:00
HICOOL 2026全球创业大赛HICOOL全球创业者峰会暨创业大赛——专为创业者而生，致力于打造多层级、多维度、多元化的国际创业模式，面向全球寻找优质项目，助力其在北京快速发展。大赛将邀请顶级投资
阅读全文
Mini-sglang-3: 从模型到kernel的详细解读
作者：机智流发布日期：2026-01-31 20:00:00
> 作者：企鹅火烈鸟🦩前言这是我们mini-sglang的最后一篇文章，在这篇文章中我们来聊一些轻松的内容。让我们来聊聊mini-sglang的modeling代码和一些JIT编译的kernels。模
阅读全文
还在为数据发愁？清华上交等联合综述：详解LLM如何让数据准备“自动化、智能化”
作者：机智流发布日期：2026-01-30 22:40:50
一句话总结：上海交通大学、清华大学、微软研究院等机构联合发布综述论文，系统梳理了LLM在数据准备（清洗、集成、丰富化）三大核心任务中的应用现状、技术路线与未来挑战。原文链接： https://hug
阅读全文
LangChain版“Claude Skills”实战详解：为智能体赋予动态工具调度与复杂上下文治理能力
作者：机智流发布日期：2026-01-29 21:35:37
> 作者：李剑锋简介在前面的课程中，我们已经系统讲解了智能体在执行任务过程中对工具的使用方式。对于大模型而言，其如何理解并使用工具，通常主要依赖以下三个方面：大模型自身在预训练阶段所获得的通用知识与能
阅读全文
聊聊大模型推理系统之 RAPID-Serve：告别KV缓存搬运！AMD新架构让LLM推理更高效
作者：机智流发布日期：2026-01-28 20:51:50
图片由AI生成大语言模型（LLM）正快速融入聊天机器人、代码助手等实时交互场景，但现有推理系统却陷入“高吞吐”与“低延迟”不可兼得的两难困境。近期，AMD 研究团队提出 RAPID-Serve——一种
阅读全文
通用AI Agent天花板！腾讯开源「云雀智能体」，从审核提效、谣言识别到财报分析，回答个有理有据
作者：机智流发布日期：2026-01-27 20:21:30
> 作者北辰，机智流编辑部校对大模型、工作流、AI Agent……这些去年还是新鲜热点的词汇，现在已经是我们生活中最常用的工具了。过去一年我们尝试了很多新的AI产品，也为自己的工作搭建了不少 Agen
阅读全文
智能体推理能力新标杆！美团开源560B MOE模型LongCat-Flash-Thinking-2601
作者：机智流发布日期：2026-01-26 22:56:00
图片由AI生成在人工智能的浪潮中，大型语言模型（LLM）已经从单纯的“知识库”进化为能够进行复杂推理的“思考者”。然而，真正的智能不仅在于内部的思辨，更在于与外部世界的有效互动。当模型能够像一个智能代
阅读全文
上周 HF 论文 TOP 20｜Agent 推理综述, EvoCUA, Being-H0.5 等
作者：机智流发布日期：2026-01-26 22:56:00
(1) Agentic Reasoning for Large Language Models论文 ID：2601.12538论文简介：由伊利诺伊大学厄巴纳-香槟分校等机构提出了Agentic Rea
阅读全文
MXFP4 是什么精度？赋能 OpenAI GPT-OSS 模型在普通硬件运行的 4Bit 精度秘密
作者：机智流发布日期：2026-01-25 21:45:12
> 本文由 Intern-S1 等 AI 生成，机智流编辑部校对借助原生MXFP4精度，GPT-OSS-120B可在单块H100 GPU上运行，而GPT-OSS-20B仅需16GB内存即可容纳。MXF
阅读全文
八百篇参考文献的智能体系统指南！Meta、Deepmind等联合万字综述，详解Agentic Reasoning的三层进化路线图——基础、自演化与集体智能
作者：机智流发布日期：2026-01-23 22:54:18
一句话总结：这篇综述将大模型智能体的“推理—行动—学习”统一为 Agentic Reasoning 框架，并用“基础能力→自进化→多智能体协作”三层环境动态与“in-context 编排 vs pos
阅读全文
万字详解Langchain多智能体系统之Handoffs模式：状态驱动的角色切换架构与实践指南
作者：机智流发布日期：2026-01-22 23:03:39
> 作者：李剑锋前言01 handoffs 简介在前面介绍多智能体（Multi-Agent）时，我们已经提到过：多智能体系统并不存在唯一的实现方式，而是可以根据任务复杂度与协作需求，采用不同的架构模式
阅读全文
人形机器人终于可以精准射门？港大ARCLab团队用STOFT算法让踢球也能有自然“回摆动作”
作者：机智流发布日期：2026-01-21 22:00:00
图片由AI生成在机器人研究领域，足球一直被视为检验机器人综合能力的“试金石”。从1997年首届RoboCup开始，无数科研团队致力于让机器人在绿茵场上驰骋。然而，尽管技术在不断进步，我们看到的机器人踢
阅读全文
离“AI 程序员”还有多远？拆解 170+ 篇文献，中大团队理清了 LLM 解决真实 Issue 的技术版图
作者：机智流发布日期：2026-01-21 22:00:00
> 本文由中山大学DeepSoftwareAnalytics组投稿论文标题：Advances and Frontiers of LLM-based Issue Resolution in Softwa
阅读全文
聊聊大模型推理系统之 MixServe：用“通信重叠”榨干集群带宽，MoE推理效率再上新台阶
作者：机智流发布日期：2026-01-20 21:30:00
图片由 AI 生成在大模型推理日益成为 AI 基础设施核心能力的今天，Mixture of Experts（MoE，混合专家）模型凭借其“稀疏激活”机制，在万亿参数规模下仍能维持可控的计算开销，正迅
阅读全文
直播预告｜迈向通用持续学习：基于记忆强化的智能体自进化框架
作者：机智流发布日期：2026-01-20 21:30:00
2025 年 12 月 29 日，记忆张量MemTensor 凭借项目《基于记忆强化的 CANN 算子持续进化方案（MemRL）》，获得昇腾 AI 创新大赛 · 全国总决赛 · 初创赛道金奖。在大模
阅读全文
是时候好好测测你的智能体了——Anthropic 解密智能体评估
作者：机智流发布日期：2026-01-19 20:46:00
一句话总结：Anthropic 分享了一套涵盖核心定义、框架选型、三类评分器及八步实操路线的 AI 智能体评估体系构建指南，旨在通过评估驱动开发帮助团队摆脱盲目迭代困境，实现智能体的系统性性能提升与持
阅读全文