全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    小米MiMo-Embodied开源:自动驾驶+具身AI二合一,17个具身基准、12个驾驶基准均达最优

    作者:机智流发布日期:2025-11-24 23:42:27

    提及小米在AI领域的布局,「MiMo」系列绝对是绕不开的关键方向。业内已经逐渐意识到:这是小米在 AI × 终端 × 机器人 × 智能汽车 四条线交汇处的核心战略资产。小米MiMo系列此前推出的MiM

    阅读全文
  • 文章封面

    斯坦福等华人团队提出Agent0:双智能体协同进化+工具集成,推理能力提升24%,实现零人类数据下的大模型自我演进

    作者:机智流发布日期:2025-11-23 23:06:16

    在大模型(Large Language Model, LLM)智能体的研发浪潮中,一个长期存在的瓶颈始终挥之不去:对人类标注数据的依赖。无论是基于人类反馈的强化学习(RLHF),还是基于可验证奖励的强

    阅读全文
  • 文章封面

    KernelFalcon:通过Agent实现自动 GPU Kernel生成

    作者:机智流发布日期:2025-11-22 22:52:59

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对原文链接:https://pytorch.org/blog/kernelfalcon-autonomous-gpu-kern

    阅读全文
  • 文章封面

    HF今日热门论文|Meta SAM 3D、小米具身智能模型、阶跃星辰音频推理模型、商汤多模态空间智能、视频推理能力评估框架发布

    作者:机智流发布日期:2025-11-21 22:42:39

    (1) V-ReasonBench: Toward Unified Reasoning Benchmark Suite for Video Generation Models论文 ID:2511.16

    阅读全文
  • 文章封面

    NeurIPS 2025美团论文精选及分享会,覆盖了大模型、多模态、自然语音处理、计算机视觉、基础技术、因果推断

    作者:机智流发布日期:2025-11-21 22:42:39

    本文精选了美团技术团队在国际顶会NeurIPS 2025中发表的10篇论文,研究方向覆盖了大模型、多模态、自然语音处理、计算机视觉、基础技术、因果推断等技术领域,希望相关研究能给同学们带来一些帮助或启

    阅读全文
  • 文章封面

    零基础入门 LangChain 多智能体系统(进阶篇):加入人工审查与信息流控制

    作者:机智流发布日期:2025-11-20 21:20:26

    > 作者:李剑锋简介在上一节内容中(一个人太忙?那就让智能体组个团队!零基础入门LangChain V1.0多智能体系统),我们已经成功地搭建了一个由 Supervisor 统一协调 Calendar

    阅读全文
  • 文章封面

    HF 近日热门论文|Kandinsky 5.0革新图像视频生成,VR-Bench评估视频推理,VisPlay实现模型自进化

    作者:机智流发布日期:2025-11-20 21:20:26

    (1) Kandinsky 5.0: A Family of Foundation Models for Image and Video Generation论文 ID:2511.14993论文简介

    阅读全文
  • 文章封面

    Physical Intelligence发布π₀.₆*!告别 “演示依赖”,借RECAP框架让机器人从实战中学会自主进化

    作者:机智流发布日期:2025-11-19 22:58:22

    在机器人领域,“通用化”和“稳健性”一直是两座难攀的高峰。过去,大多数视觉-语言-动作(VLA)模型都像“温室里的花朵”——只能在预设的演示数据里“照猫画虎”,一旦遇到真实世界的变数,比如褶皱的衬衫、

    阅读全文
  • 文章封面

    活动开启|11 月 30 日首场 HAMi Meetup 强势来袭,不卷算力卷效率!

    作者:机智流发布日期:2025-11-19 22:58:22

    不卷算力卷效率,HAMi Meetup 上海站来啦!作为一个活跃的 CNCF 开源项目,HAMi 是目前行业内唯一专注于异构 GPU 资源共享的开源项目,通过灵活、可靠、按需、弹性的 GPU 虚拟化来

    阅读全文
  • 文章封面

    聊聊大模型推理系统之 DuetServe:告别双卡拆分,南加大&UCR新方案让单卡性能翻倍

    作者:机智流发布日期:2025-11-18 21:49:36

    你是否曾好奇,为何大模型对话有时“秒回”,有时却“卡顿”?这背后的关键在于LLM 服务系统如何平衡两个截然不同的推理阶段——快速但计算密集的预填充(Prefill)和缓慢但内存受限的解码(Decode

    阅读全文
  • 文章封面

    HF今日热门论文|上海AI实验室P1强化学习模型斩获物理奥赛金牌,哈工大Uni-MoE-2.0-Omni打造26B开源多模态模型

    作者:机智流发布日期:2025-11-18 21:49:36

    (1) P1: Mastering Physics Olympiads with Reinforcement Learning论文 ID:2511.13612论文简介:由上海人工智能实验室等机构提出了

    阅读全文
  • 文章封面

    Omni模型如何统一理解文字、图像与音视频?一次听够美团LongCat、英伟达OmniVinci、蚂蚁Ming的技术实践

    作者:机智流发布日期:2025-11-17 20:58:36

    由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第五场 - Omni全模态大模型专场就在明

    阅读全文
  • 文章封面

    HF上周热门论文TOP20|字节跳动Lumine打造3D开放世界通用智能体,英伟达TiDAR融合扩散与自回归实现5.9倍加速

    作者:机智流发布日期:2025-11-17 20:58:36

    (1) Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds论文 ID:2511.08892论文简介:由Byt

    阅读全文
  • 文章封面

    未来的个性化陪伴?卡内基梅隆大学提出AI伴侣四象限

    作者:机智流发布日期:2025-11-16 20:00:00

    一句话速读:卡内基梅隆大学研究者提出 AI 伴侣四象限分类法,以 “情感型 vs 功能型”“虚拟型 vs 实体型” 为核心维度,系统梳理了从虚拟偶像、职场助手到实体护理机器人的全场景形态,揭秘了不同类

    阅读全文
  • 文章封面

    新加坡国立大学等联合发布!首个大规模专家标注桌面数据集GROUNDCUA,3.56M标注推动AI精准操控电脑

    作者:机智流发布日期:2025-11-15 23:38:36

    在AI时代,我们常常幻想一个智能助手,能像人类一样熟练操作电脑:打开软件、点击按钮、编辑文档,甚至处理复杂的设计任务。然而,这个愿景的实现往往卡在“眼力”上——AI如何准确地将自然语言指令映射到屏幕上

    阅读全文
  • 文章封面

    在RTE2025大会,我看到了AI语音如何让机器学会“与人相处”

    作者:机智流发布日期:2025-11-15 23:38:36

    10 月 31 日,我们受 RTE 开发者社区邀请参加了 RTE2025 大会。这不是寻常的科技展会,没有冰冷的技术参数展示,取而代之的是AI与人类自然交流的场景。今年大会以「AI 有声」为主题,这巧

    阅读全文
  • 文章封面

    原神启动!字节Seed团队开源Lumine:能在3D开放世界自主探索数小时的通用AI智能体

    作者:机智流发布日期:2025-11-14 21:06:25

    在人工智能迅猛发展的当下,构建能够自主感知、推理并行动的通用智能体,已成为通往通用人工智能(AGI)的关键路径。然而,传统的AI智能体往往局限于封闭环境,难以应对开放世界的复杂性和不确定性。近日,字节

    阅读全文
  • 文章封面

    一个人太忙?那就让智能体组个团队!零基础入门LangChain V1.0多智能体系统

    作者:机智流发布日期:2025-11-13 21:45:00

    > 作者:李剑锋简介在上一节课中(进阶实战!掌握 LangChain V1.0 八大中间件:从调用限制到上下文优化的全流程实战),我们学习了智能体(Agent)中间件的概念及其在任务执行过程中的作用。

    阅读全文
  • 文章封面

    OpenAI 正式发布 GPT-5.1 系列双版本,ChatGPT 情商迎来大幅升级|腾讯开源千亿级语义能力

    作者:机智流发布日期:2025-11-13 21:45:00

    新闻资讯OpenAI 正式发布 GPT-5.1 系列双版本,ChatGPT 情商迎来大幅升级OpenAI 推出全新 GPT-5.1 系列,重点不再是参数堆叠,而是显著提升对话质量与情感交互能力。新系列

    阅读全文
  • 文章封面

    斯坦福+NUS联合突破!LatentToM让多机械臂“无沟通也默契”,去中心化扩散架构破解协作难题

    作者:机智流发布日期:2025-11-12 23:06:47

    在工业流水线的精密装配、医疗手术的辅助操作、仓储物流的货物分拣中,机械臂早已从“单一工具”升级为“协作团队”。但多机械臂协作一直面临一个核心矛盾:中心化控制虽精准,却怕故障、难扩展;去中心化虽灵活,却

    阅读全文
  • 文章封面

    开源GPU创新生态赛赛题二 | vLLM助力大模型推理性能革新

    作者:机智流发布日期:2025-11-12 23:06:47

    作为第八届CCF开源创新大赛的常规赛的赛题之一,第八届CCF开源创新大赛专项赛题 —— “开源GPU创新生态赛(常规赛)”第一期报名火热进行中。本届大赛由中国计算机学会(CCF)主办,开源发展技术委员

    阅读全文
  • 文章封面

    聊聊大模型推理系统之 Cauchy:告别同质化集群,看北航&快手如何榨干异构GPU性能

    作者:机智流发布日期:2025-11-11 20:30:00

    在大模型(LLM)服务日益普及的今天,高昂的算力成本已成为企业落地应用的一大瓶颈。如何在保证服务质量的前提下,最大化利用异构 GPU 集群的性能差异,实现极致的成本效益?来自北航与快手的研究团队给出了

    阅读全文
  • 文章封面

    Agentic Coding 战场再添猛将,月之暗面 K2 Thinking 解密

    作者:机智流发布日期:2025-11-10 23:26:54

    从“会回答”到“会办事”的角色转变如果你熟悉 2024~2025 年的开源大模型脉络,会发现一条越来越清晰的趋势:基础大模型不再把“工具调用”当作加分项,而是把“思考—调用—再思考”的长链路执行变成默

    阅读全文
  • 文章封面

    EMNLP 2025 杰出论文出炉(7/4167)|LingGym、DiscoSG、MiCRo 等

    作者:机智流发布日期:2025-11-10 23:26:54

    大家好我是 「PaperScope.ai| P 站站长」闻星,EMNLP 2025 在苏州闭幕我们来看看 4000+ 论文中的 7 篇杰出论文有哪些,论文解读由 Intern-S1 生成。(1) Li

    阅读全文
  • 文章封面

    告别延迟!Dexmal&StepFun 联合研发,单 RTX 4090 让 VLA 模型实现 30FPS 实时机器人操控

    作者:机智流发布日期:2025-11-09 23:35:57

    引言:VLA 模型的 “速度困局” 与行业痛点在机器人操控领域,视觉-语言-动作(VLA)模型凭借百亿级参数的强大泛化能力,成为推动通用机器人技术发展的核心力量。从工业场景的精密装配到家庭场景的服务交

    阅读全文
  • 文章封面

    PyTorch Symmetric Memory:解锁 NVLink 可编程性的新型分布式计算范式

    作者:机智流发布日期:2025-11-08 22:44:29

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对引言人工智能训练和推理的快速发展中,多 GPU 分布式系统已成为高性能计算的核心架构。NVIDIA 的 NVLink 技术为

    阅读全文
  • 文章封面

    给我60分钟!手把手教你用一个API搞定"热梗表情包生成器"

    作者:机智流发布日期:2025-11-08 22:44:29

    > 作者:北辰> 编辑:羰汤羰MaaS,All Model in One API上周我们发布了实测MiniMax M2的文章,和一起AI Coding的小伙伴交流后发现,最常被问题到的两类问题——一个

    阅读全文
  • 文章封面

    给我60分钟!手把手教你用一个API搞定"热梗表情包生成器"

    作者:机智流发布日期:2025-11-07 12:17:35

    > 作者:北辰> 编辑:羰汤羰MaaS,All Model in One API上周我们发布了实测MiniMax M2的文章,和一起AI Coding的小伙伴交流后发现,最常被问题到的两类问题——一个

    阅读全文
  • 文章封面

    进阶实战!掌握 LangChain V1.0 八大中间件:从调用限制到上下文优化的全流程实战

    作者:机智流发布日期:2025-11-06 22:14:10

    > 作者:李剑锋前言在上节课中(万字长文!深度解析 LangChain V1.0 Middleware:打造可控可审的智能体架构)我们已经介绍了中间件的基本概念以及插入点位置,并且还介绍了Summar

    阅读全文
  • 文章封面

    微信AI与清华大学联手提出“连续自回归语言模型”CALM,重塑大模型效率边界!

    作者:机智流发布日期:2025-11-05 22:56:23

    在人工智能飞速发展的今天,大语言模型(Large Language Models, LLMs)正逐渐成为自然语言处理乃至通用人工智能的核心引擎。从 ChatGPT 到 Claude,再到国产的通义千问

    阅读全文
上一页下一页