小米MiMo-Embodied开源:自动驾驶+具身AI二合一,17个具身基准、12个驾驶基准均达最优
提及小米在AI领域的布局,「MiMo」系列绝对是绕不开的关键方向。业内已经逐渐意识到:这是小米在 AI × 终端 × 机器人 × 智能汽车 四条线交汇处的核心战略资产。小米MiMo系列此前推出的MiM
阅读全文提及小米在AI领域的布局,「MiMo」系列绝对是绕不开的关键方向。业内已经逐渐意识到:这是小米在 AI × 终端 × 机器人 × 智能汽车 四条线交汇处的核心战略资产。小米MiMo系列此前推出的MiM
阅读全文在大模型(Large Language Model, LLM)智能体的研发浪潮中,一个长期存在的瓶颈始终挥之不去:对人类标注数据的依赖。无论是基于人类反馈的强化学习(RLHF),还是基于可验证奖励的强
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对原文链接:https://pytorch.org/blog/kernelfalcon-autonomous-gpu-kern
阅读全文(1) V-ReasonBench: Toward Unified Reasoning Benchmark Suite for Video Generation Models论文 ID:2511.16
阅读全文本文精选了美团技术团队在国际顶会NeurIPS 2025中发表的10篇论文,研究方向覆盖了大模型、多模态、自然语音处理、计算机视觉、基础技术、因果推断等技术领域,希望相关研究能给同学们带来一些帮助或启
阅读全文> 作者:李剑锋简介在上一节内容中(一个人太忙?那就让智能体组个团队!零基础入门LangChain V1.0多智能体系统),我们已经成功地搭建了一个由 Supervisor 统一协调 Calendar
阅读全文(1) Kandinsky 5.0: A Family of Foundation Models for Image and Video Generation论文 ID:2511.14993论文简介
阅读全文在机器人领域,“通用化”和“稳健性”一直是两座难攀的高峰。过去,大多数视觉-语言-动作(VLA)模型都像“温室里的花朵”——只能在预设的演示数据里“照猫画虎”,一旦遇到真实世界的变数,比如褶皱的衬衫、
阅读全文不卷算力卷效率,HAMi Meetup 上海站来啦!作为一个活跃的 CNCF 开源项目,HAMi 是目前行业内唯一专注于异构 GPU 资源共享的开源项目,通过灵活、可靠、按需、弹性的 GPU 虚拟化来
阅读全文你是否曾好奇,为何大模型对话有时“秒回”,有时却“卡顿”?这背后的关键在于LLM 服务系统如何平衡两个截然不同的推理阶段——快速但计算密集的预填充(Prefill)和缓慢但内存受限的解码(Decode
阅读全文(1) P1: Mastering Physics Olympiads with Reinforcement Learning论文 ID:2511.13612论文简介:由上海人工智能实验室等机构提出了
阅读全文由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第五场 - Omni全模态大模型专场就在明
阅读全文(1) Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds论文 ID:2511.08892论文简介:由Byt
阅读全文一句话速读:卡内基梅隆大学研究者提出 AI 伴侣四象限分类法,以 “情感型 vs 功能型”“虚拟型 vs 实体型” 为核心维度,系统梳理了从虚拟偶像、职场助手到实体护理机器人的全场景形态,揭秘了不同类
阅读全文在AI时代,我们常常幻想一个智能助手,能像人类一样熟练操作电脑:打开软件、点击按钮、编辑文档,甚至处理复杂的设计任务。然而,这个愿景的实现往往卡在“眼力”上——AI如何准确地将自然语言指令映射到屏幕上
阅读全文10 月 31 日,我们受 RTE 开发者社区邀请参加了 RTE2025 大会。这不是寻常的科技展会,没有冰冷的技术参数展示,取而代之的是AI与人类自然交流的场景。今年大会以「AI 有声」为主题,这巧
阅读全文在人工智能迅猛发展的当下,构建能够自主感知、推理并行动的通用智能体,已成为通往通用人工智能(AGI)的关键路径。然而,传统的AI智能体往往局限于封闭环境,难以应对开放世界的复杂性和不确定性。近日,字节
阅读全文> 作者:李剑锋简介在上一节课中(进阶实战!掌握 LangChain V1.0 八大中间件:从调用限制到上下文优化的全流程实战),我们学习了智能体(Agent)中间件的概念及其在任务执行过程中的作用。
阅读全文新闻资讯OpenAI 正式发布 GPT-5.1 系列双版本,ChatGPT 情商迎来大幅升级OpenAI 推出全新 GPT-5.1 系列,重点不再是参数堆叠,而是显著提升对话质量与情感交互能力。新系列
阅读全文在工业流水线的精密装配、医疗手术的辅助操作、仓储物流的货物分拣中,机械臂早已从“单一工具”升级为“协作团队”。但多机械臂协作一直面临一个核心矛盾:中心化控制虽精准,却怕故障、难扩展;去中心化虽灵活,却
阅读全文作为第八届CCF开源创新大赛的常规赛的赛题之一,第八届CCF开源创新大赛专项赛题 —— “开源GPU创新生态赛(常规赛)”第一期报名火热进行中。本届大赛由中国计算机学会(CCF)主办,开源发展技术委员
阅读全文在大模型(LLM)服务日益普及的今天,高昂的算力成本已成为企业落地应用的一大瓶颈。如何在保证服务质量的前提下,最大化利用异构 GPU 集群的性能差异,实现极致的成本效益?来自北航与快手的研究团队给出了
阅读全文从“会回答”到“会办事”的角色转变如果你熟悉 2024~2025 年的开源大模型脉络,会发现一条越来越清晰的趋势:基础大模型不再把“工具调用”当作加分项,而是把“思考—调用—再思考”的长链路执行变成默
阅读全文大家好我是 「PaperScope.ai| P 站站长」闻星,EMNLP 2025 在苏州闭幕我们来看看 4000+ 论文中的 7 篇杰出论文有哪些,论文解读由 Intern-S1 生成。(1) Li
阅读全文引言:VLA 模型的 “速度困局” 与行业痛点在机器人操控领域,视觉-语言-动作(VLA)模型凭借百亿级参数的强大泛化能力,成为推动通用机器人技术发展的核心力量。从工业场景的精密装配到家庭场景的服务交
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对引言人工智能训练和推理的快速发展中,多 GPU 分布式系统已成为高性能计算的核心架构。NVIDIA 的 NVLink 技术为
阅读全文> 作者:北辰> 编辑:羰汤羰MaaS,All Model in One API上周我们发布了实测MiniMax M2的文章,和一起AI Coding的小伙伴交流后发现,最常被问题到的两类问题——一个
阅读全文> 作者:北辰> 编辑:羰汤羰MaaS,All Model in One API上周我们发布了实测MiniMax M2的文章,和一起AI Coding的小伙伴交流后发现,最常被问题到的两类问题——一个
阅读全文> 作者:李剑锋前言在上节课中(万字长文!深度解析 LangChain V1.0 Middleware:打造可控可审的智能体架构)我们已经介绍了中间件的基本概念以及插入点位置,并且还介绍了Summar
阅读全文在人工智能飞速发展的今天,大语言模型(Large Language Models, LLMs)正逐渐成为自然语言处理乃至通用人工智能的核心引擎。从 ChatGPT 到 Claude,再到国产的通义千问
阅读全文