机智流

H-Neurons：大语言模型中幻觉相关神经元的存在、作用及其起源
作者：机智流发布日期：2025-12-24 23:39:28
> 本文转载自「OpenBMB」近年来，大语言模型（LLMs）在问答、推理与生成任务中展现出卓越能力，但其幻觉（Hallucination）问题仍然是制约实际应用的核心挑战之一。模型有时会在缺乏事实依
阅读全文
端到端自动驾驶现在都有哪些研究方向？
作者：机智流发布日期：2025-12-23 21:06:10
一句话总结：上海交通大学与滴滴联合团队的自动驾驶综述提出 “通用端到端自动驾驶（GE2E）” 统一分析框架，系统梳理三大技术范式的技术脉络、共性挑战与性能差异，并展望了融合基础模型、智能体架构、世界模
阅读全文
活动报名｜不卷算力卷效率｜HAMi Meetup 北京站
作者：机智流发布日期：2025-12-23 21:06:10
刚结束 11 月上海首场的圆满相聚，现场留下了许多精彩的瞬间！综合众多社区伙伴的建议，现开启不卷算力卷效率！HAMi Meetup 北京站报名。北京——这座聚合科研引擎、产业集群与前沿技术思潮的城
阅读全文
聊聊大模型推理系统之 Cornserve：当 Qwen Omni 遇上智能拆装，吞吐提升近 4 倍的秘密
作者：机智流发布日期：2025-12-22 20:01:30
图片由AI生成在大模型迈向“全能”的时代，Any-to-Any 多模态模型正迅速崛起——它们不仅能理解文本、图像、视频、音频等多种输入，还能生成文本、图像、语音等任意组合的输出。然而，这类模型的复杂异
阅读全文
沐曦GPU计算架构MXMACA-3.3.0.X简要技术报告
作者：机智流发布日期：2025-12-22 20:01:30
> 本文转载自「沐曦股份MetaX」1前言01版本概述与核心定位近期，沐曦股份发布了MXMACA软件栈（以下简称“MACA”）的3.3.0.X版本，MACA套件是面向沐曦曦云C系列、曦思N系列GPU研
阅读全文
万字长文 | 2025最新「AI智能体记忆」综述：来自北大、复旦、新国立等的联合研究
作者：机智流发布日期：2025-12-21 22:48:00
一句话总结：这篇由多所顶尖研究机构联合发布的综述，明晰了智能体记忆与LLM记忆、RAG、上下文工程的边界与联系，提出了“形态-功能-动态”三维框架，系统解构了AI智能体记忆系统的完整蓝图，为构建真正具
阅读全文
PyTorch社区2025年12月全景动态：生态爆发、盛会出圈、全球社群共振
作者：机智流发布日期：2025-12-20 23:27:55
2025年的最后一个月，AI领域的目光再次聚焦PyTorch社区。作为全球最具活力的开源AI框架生态之一，PyTorch在12月交出了一份含金量十足的答卷：核心工具链完成里程碑式整合、国际顶级会议大放
阅读全文
大会议程发布，精彩不容错过！| 昇思人工智能框架峰会
作者：机智流发布日期：2025-12-20 23:27:55
-- 完 --机智流推荐阅读：1. 95%越狱成功率！佐治亚理工与清华联手发布新型攻击框架，最强大模型无一幸免‍2. 2025最新rag综述（2）——RAG技术发展流程、最新技术挑战与系统级优化3.
阅读全文
豆包手机、AutoGLM之后，阶跃星辰GELab团队让AI操作手机电脑又有了新解法 | Step-GUI 技术报告解读
作者：机智流发布日期：2025-12-19 22:48:15
在AI助手日益融入我们数字生活的今天，你是否想过，未来的AI不仅能与你对话，还能像真人一样操作你的手机或电脑，替你完成从点外卖、订机票到处理文档等一系列任务？前段时间，字节旗下、和中兴合作的豆包AI手
阅读全文
硬件日招募！「对话式 AI+硬件」系列活动@深圳丨RTE Meetup+TEN Workshop
作者：机智流发布日期：2025-12-19 22:48:15
一同探索语音驱动的下一代人机交互界面。2025 年 RTE 开发者社区的收官活动，将再次落地硬件之都深圳，一起畅想 2026！聚焦「对话式 AI+硬件」主题，来自通义百聆 Fun-CosyVoice
阅读全文
万字长文！一文搞懂 LangSmith Tracing：如何看清大模型应用的每一步
作者：机智流发布日期：2025-12-18 21:00:04
> 作者：李剑锋前言在构建大模型应用的过程中，模型通常不是简单地一问一答，而是会经历：多轮 LLM 调用工具调用（Tool Calling）RAG 检索、数据库查询中间提示词生成、结构化输出处理这些复
阅读全文
打造懂专业、会指导的AI金牌体育教练，中科院自动化所&北体大提出SportsGPT
作者：机智流发布日期：2025-12-18 21:00:04
> 本文来自社区投稿在AI席卷各行各业的今天，体育圈的“智能化”走到哪一步了？现有的智能体育系统，大多还停留在“打分+可视化”的阶段。屏幕上画出的骨骼线很酷，但对于运动员和教练来说，往往面临一个尴尬的
阅读全文
突破2D-3D鸿沟！北大、人大、BeingBeyond提出VIPA-VLA，用人类视频解锁机器人精准操控
作者：机智流发布日期：2025-12-17 23:29:48
当我们用手机拍摄一段 "拿起杯子放进抽屉" 的视频时，大脑能瞬间从 2D 画面中捕捉到杯子的位置、距离、手的运动轨迹等 3D 空间信息。但对于依赖视觉-语言-动作（VLA）模型的机器人来说，这却是一个
阅读全文
大模型评测基准技术解析丨AI Insight Talk 直播预告
作者：机智流发布日期：2025-12-17 23:29:48
在大模型快速演进的过程中，评测成为衡量模型能力不可或缺的“标尺”。模型究竟具备哪些能力、存在哪些短板，以及在复杂场景下是否足够稳定，仅凭参数规模或模型结构难以给出明确答案，仍需依托系统化的评测基准与多
阅读全文
聊聊大模型推理系统之 XY-Serve：华为&清华团队如何在昇腾NPU上实现95%吞吐提升？
作者：机智流发布日期：2025-12-16 19:58:02
图片由AI生成在大模型推理系统中，输入/输出长度高度动态、注意力掩码结构复杂多变、Prefill/Decode/Verify 阶段混合调度等问题，正严重制约 AI 加速器（尤其是华为昇腾 NPU等基于
阅读全文
10万奖金池！书生公式识别 SFT/RL 打榜赛等你来
作者：机智流发布日期：2025-12-15 20:36:49
自 2023 年底书生大模型实战营推出以来，已有五期学员共同进行了学习和开发实践，吸引超过 25 万人次在线学习，孵化出近 1500 个创意项目。书生大模型实战营第 6 期全面升级，本次课程将在 A
阅读全文
95%越狱成功率！佐治亚理工与清华联手发布新型攻击框架，最强大模型无一幸免
作者：机智流发布日期：2025-12-15 20:36:49
警告：本文包含可能具有冒犯性和有害性的内容！近日，来自佐治亚理工学院、伊利诺伊大学厄巴纳-香槟分校（UIUC）、清华大学、IBM研究院等多家顶尖机构的研究团队，联合发布了一种名为 CKA-Agent[
阅读全文
2025最新rag综述（2）——RAG技术发展流程、最新技术挑战与系统级优化
作者：机智流发布日期：2025-12-14 22:32:37
一句话总结：该综述系统梳理了 RAG 技术的发展脉络，从早期开放域问答任务中的原型，到近年来多领域大规模应用的系统化演化，进行了全面而深入的总结。前文速览：RAG 是当前提升大语言模型回答质量与准确性
阅读全文
Transformers v5 重磅升级：简洁设计 + 无缝兼容，让 AI 开发更高效
作者：机智流发布日期：2025-12-13 20:19:27
2020 年 11 月 19 日，Hugging Face 发布了 Transformers v4 的首个候选版本，彼时这个 AI 模型定义库的日安装量仅 2 万次，支持的模型架构不过 40 种，社区
阅读全文
对抗谷歌Gemini 3的王牌来了？GPT-5.2实测结果全公开，考公、编程、图片标注、大海捞针不在话下！
作者：机智流发布日期：2025-12-12 22:55:24
昨晚我们刚说到Cursor提前泄露GPT-5.2，今天（当地时间12月11号）OpenAI就正式放出了这款被定位为“迄今最强专业知识工作模型”的新系统GPT-5.2[1]，已全面向ChatGPT订阅用
阅读全文
从黑箱到透明：用 LangSmith Studio 全面可视化 LangGraph/LangChain Agent 的运行逻辑
作者：机智流发布日期：2025-12-11 21:10:41
> 作者：李剑锋前言LangSmith Studio 是一个用于本地开发 LangChain / LangGraph Agent 的免费可视化调试界面。它不是云服务，而是你的本地 Agent 与可视化
阅读全文
NeurIPS 2025｜西交等VideoVLA首次将视频生成模型转化为机器人操作器，开创机器人操作新范式，跨物体跨设备都能打
作者：机智流发布日期：2025-12-10 23:28:54
前言：VideoVLA的思路和我们之前解读过的 RynnVLA-002 比较相似。两者都是同时赋予模型动作和图像生成的能力，RynnVLA-002 是将 VLA 模型和世界模型统一在一个框架中，VLA
阅读全文
嬛嬛类卿？现在哪个AI才是最适合你的？来测>>
作者：机智流发布日期：2025-12-10 23:28:54
> 本文转载自「GMI Cloud 黑板报」哈喽，朋友们～跟大家分享一件💡开心💡的事 —— 用 GMI Cloud 推理引擎平台的 API 开发的微信小程序「测测你适合啥 AI」正式
阅读全文
聊聊大模型推理系统之 SageServe：基于微软 Office 365 真实流量，统一调度池减少 25% GPU 消耗
作者：机智流发布日期：2025-12-09 20:30:00
在如今大模型（Large Language Models, LLMs）推理需求爆炸式增长的背景下，如何在保障服务质量的同时控制高昂的 GPU 资源成本，已成为云服务商的核心难题。近期，由微软联合多所高
阅读全文
数学+GUI推理双突破！小米&清华提出CAPO，通过优势信号让大模型像孩子一样“先学对的，再纠错的”
作者：机智流发布日期：2025-12-08 22:29:13
图片由AI生成在当前大语言模型（LLM）迅猛发展的浪潮中，强化学习（Reinforcement Learning, RL）已成为提升模型推理能力的关键技术。无论是 DeepSeek-R1 还是 Kim
阅读全文
活动报名丨全球首款 AI 主题桌游《Talk With》线下开玩！上海 GDPS 2025 见！
作者：机智流发布日期：2025-12-08 22:29:13
睡不着？想恋爱？开车犯困？…… 都是聊天能解决的事儿！玩家在《Talk With》里会面临抽到的随机场景，每个场景都潜含着困难和危机。你需要竞拍和挑选合适的对话式 AI 和语音技术，并给出有表现力的解
阅读全文
检索增强生成（RAG）2025最新综述深度解读（1）：架构、评估与发展趋势
作者：机智流发布日期：2025-12-07 22:55:08
一句话总结：该综述系统梳理了 RAG 技术的发展脉络，从早期开放域问答任务中的原型，到近年来多领域大规模应用的系统化演化，进行了全面而深入的总结。论文地址：https://arxiv.org/abs/
阅读全文
聊聊Agentic Inference的崛起：100 万亿 token 定义 2025 AI 新范式
作者：机智流发布日期：2025-12-06 22:47:44
2024年底，OpenAI o1模型的发布成为大型语言模型（LLM）发展的关键转折点。这款首个被广泛采用的推理模型，将行业从单一的文本模式生成推向多步骤审慎推理的新阶段，彻底改变了LLM的应用格局。而
阅读全文
大模型真能替代数据工程师和分析师吗？字节、中科院联合发布 DAComp：首个覆盖企业级数据智能全生命周期的 LLM 评测基准
作者：机智流发布日期：2025-12-05 23:27:26
内容概览（图片由AI生成）在人工智能技术突飞猛进的今天，大语言模型（LLM）被寄予厚望——不仅能写代码、回答问题，甚至有望成为企业中“自主数据智能体”，自动完成从原始数据清洗、建模到商业洞察生成的全套
阅读全文
第八届GAIR全球人工智能与机器人大会，议程正式公布
作者：机智流发布日期：2025-12-05 23:27:26
“教育被重塑，产业范式被改写，世界模型浮出水面，算力体系重新洗牌……” 作者丨杨依婷编辑丨包永刚在AI技术奔涌向前的时间洪流里，那些深刻的变革，往往以微弱的火光开场，最终点燃时代的烈焰。九年前
阅读全文