机器之心

NeurIPS 2025 Spotlight | 中国联通以全局优化重塑扩散模型加速
作者：机器之心发布日期：2025-11-26 09:32:57
作者和团队介绍：本文一作是高焕霖和陈平，通讯作者为赵放和廉士国，其他作者还包括石芙源、谭超、刘兆祥、王恺，所有作者均来自联通数据智能有限公司（联通数据科学与人工智能研究院）元景大模型研发团队。当前，视
阅读全文
Gemini 3，是谢尔盖・布林「骂」出来的？
作者：机器之心发布日期：2025-11-25 12:05:57
机器之心报道机器之心编辑部当 ChatGPT 在 2022 年底横空出世时，整个科技行业都被这股突如其来的对话式 AI 浪潮震得措手不及。而彼时的谷歌，这家在 AI 领域深耕十余年的巨头，却显得格外沉
阅读全文
与Banana Pro过过招，国产Libcom图像合成工作台开启Labubu漫游记
作者：机器之心发布日期：2025-11-25 12:05:57
机器之心发布机器之心编辑部2025 年，AIGC 热度再冲新高：从社交头像、电商海报到影视分镜，AI 生成内容已全面渗透日常创作。在这股浪潮中，Nano Banana、Qwen Edit 等通用图像编
阅读全文
吴恩达发布论文自动审阅器，ICLR上达到接近人类水平
作者：机器之心发布日期：2025-11-25 12:05:57
机器之心报道机器之心编辑部AI 能否被学术会议、期刊的审稿人用于论文评审？目前，即使是在 AI 领域也尚未形成统一规范。目前全球的几大顶级会议里，ICLR 的规则是使用大模型必须进行披露，CVPR 则
阅读全文
AAAI 2026 Oral | 悉尼科技大学联合港理工打破「一刀切」，联邦推荐如何实现「千人千面」的图文融合？
作者：机器之心发布日期：2025-11-25 12:05:57
在推荐系统迈向多模态的今天，如何兼顾数据隐私与个性化图文理解？悉尼科技大学龙国栋教授团队联合香港理工大学杨强教授、张成奇教授团队，提出全新框架 FedVLR。该工作解决了联邦环境下多模态融合的异质性难
阅读全文
人形机器人的落地难题，竟被一顿「九宫格」火锅解开？
作者：机器之心发布日期：2025-11-24 15:24:11
机器之心原创作者:Sia具身智能要想往大规模应用走，像英特尔这样的头部芯片公司必须突破算力架构。当俄罗斯首个 AI 人形机器人「艾多尔」伴着电影《洛奇》的主题曲蹒跚登场时，所有人都以为某个高光时刻即将
阅读全文
OpenAI与Anthropic联手力推：MCP Apps提案发布，告别纯文本交互
作者：机器之心发布日期：2025-11-24 15:24:11
机器之心报道编辑：Panda作为连接 AI 模型与广阔数字生态的「神经中枢」，MCP 协议已然成为智能体（AI Agent）不可或缺的基础设施。然而，长期以来，MCP 的交互仅限于文本和结构化数据，这
阅读全文
AAAI 2026 Oral | 通过视觉安全提示与深度对齐实现大型视觉语言模型的安全对齐
作者：机器之心发布日期：2025-11-24 15:24:11
随着大型视觉语言模型在多个下游任务的广泛应用，其潜在的安全风险也开始快速显露。研究表明，即便是最先进的大型视觉语言模型，也可能在面对带有隐蔽的恶意意图的图像 — 文本输入时给出违规甚至有害的响应，而现
阅读全文
Karpathy组建大模型「议会」，GPT-5.1、Gemini 3 Pro等化身最强智囊团
作者：机器之心发布日期：2025-11-23 12:00:00
机器之心报道编辑：冷猫从短视频到 AI 模型，人们消费内容的习惯又一次向追求效率改变。在阅读长文、论文或海量信息时，越来越多人不再耐心从头到尾浏览，而是倾向于直接获取高密度、快速可吸收的知识。让大模型
阅读全文
十分钟出结果，陶哲轩用Gemini Deepthink帮人类数学家完成Erdős问题论证
作者：机器之心发布日期：2025-11-23 12:00:00
机器之心报道机器之心编辑部有这样一个网站，它专注于数学研究和问题解答，特别是与著名数学家保罗・厄尔德什（Paul Erdős）相关的问题。它就是 Erdős 问题网站。该网站收录了厄尔德什提出的各类数
阅读全文
通用的dLLM开发框架，让BERT掌握扩散式对话
作者：机器之心发布日期：2025-11-23 12:00:00
周展辉（https://zhziszz.github.io/）：加州大学伯克利分校计算机博士生；陈凌杰（https://lingjiechen2.github.io/）：伊利诺伊大学厄巴纳香槟分校计算
阅读全文
Meta再推WorldGen，简单一句话，竟「盖」出50×50米一座城
作者：机器之心发布日期：2025-11-22 12:08:58
机器之心报道机器之心编辑部Meta 用一段文本构建可探索的 3D 世界。谷歌、OpenAI 那边一个接一个上新，整个 AI 圈都卷得飞起。与此同时，Meta 也没闲着，先是 SAM 3、接着 SAM
阅读全文
华为开源突破性技术Flex:ai，AI算力效率直升30%，GPU、NPU一起用
作者：机器之心发布日期：2025-11-22 12:08:58
机器之心报道编辑：泽南一举解决算力资源浪费。不论是英伟达 GPU 还是昇腾的 NPU，都可以「融为一体」，动态切分了。11 月 21 日，华为正式发布了 AI 容器技术 ——Flex:ai，同时，华为
阅读全文
腾讯混元数字人团队发布Moral RolePlay基准，揭秘大模型的「道德困境」
作者：机器之心发布日期：2025-11-22 12:08:58
在小说、影视与游戏中，复杂的角色塑造往往是打动人心的关键，而真正出彩的反派往往造就传奇。你是否好奇：当 AI 成为故事的主导者，它能否同样演好这些「坏角色」？腾讯混元数字人团队和中山大学最新推出的「M
阅读全文
别问树模型了！死磕结构化数据，清华团队把大模型表格理解推到极限
作者：机器之心发布日期：2025-11-21 11:55:32
机器之心原创作者：张倩、Panda科幻作家刘慈欣在小说《超新星纪元》中描述了一个令人难忘的场景——几个十几岁的孩子被带到一个小山环绕的地方，他们的面前是一条单轨铁路，上面停着十一列载货火车，每列车有二
阅读全文
Meta超级智能实验室又发论文，模型混一混，性能直接SOTA
作者：机器之心发布日期：2025-11-21 11:55:32
机器之心报道编辑：陈陈模型也要学会取长补短。大语言模型（LLM）在众多领域展现出卓越的能力，但它们的训练依然高度依赖算力和时间，需要庞大的计算资源以及精细的训练流程设计。模型 Souping（Mode
阅读全文
超越 VTM-RA！快手双向智能视频编码器BRHVC亮相NeurIPS2025
作者：机器之心发布日期：2025-11-21 11:55:32
在视频编码领域，双向编码（RA 模式）一直是高效压缩的「秘密武器」，长期以来被广泛应用于点播、视频存储等场景。然而，在基于深度学习的智能视频编码中，这项技术也面临新的挑战：双向编码采用复杂的大跨度分层
阅读全文
刚刚，Yann LeCun官宣离职创业，瞄准高级机器智能AMI
作者：机器之心发布日期：2025-11-20 10:01:24
机器之心报道机器之心编辑部就在刚刚，即将离职 Meta 的图灵奖得主 Yann LeCun 在 Threads、领英等社交平台上宣布已经开启事业的下一阶段：创业。这家新公司的研发核心将是所谓的 Adv
阅读全文
分割一切并不够，还要3D重建一切，SAM 3D来了
作者：机器之心发布日期：2025-11-20 10:01:24
机器之心报道机器之心编辑部沉默后爆发？深夜，Meta 有了重大更新，接连上线 SAM 3D、SAM 3（Segment Anything Model，SAM）。其中，SAM 3D 是 SAM 系列的最
阅读全文
黄仁勋GTC开场：「AI-XR Scientist」来了！
作者：机器之心发布日期：2025-11-20 10:01:24
AI 读了那么多 paper，会做实验么？LabOS: 当 AI 不仅会思考，更能 “看见”、“指导” 并“操作”真实实验，一个人类与机器智能共同进化的科学发现新时代，正悄然开启。在一个看似常规的生物
阅读全文
通往通用人工智能的关键一步？DeepMind放大招，3D世界最强AI智能体SIMA 2
作者：机器之心发布日期：2025-11-20 10:01:24
机器之心报道机器之心编辑部您的 AI 伙伴「游戏陪玩」版已上线。今天，Google DeepMind 发布了 SIMA 2，一个在虚拟 3D 世界中能自主游戏、推理并持续学习的通用 AI 智能体。De
阅读全文
如视发布空间大模型Argus1.0，支持全景图等多元输入，行业首创！
作者：机器之心发布日期：2025-11-19 12:00:48
机器之心报道编辑：Panda近来，世界模型（World Model）很火。多个 AI 实验室纷纷展示出令人惊艳的 Demo：仅凭一张图片甚至一段文字，就能生成一个可交互、可探索的 3D 世界。这些演示
阅读全文
登顶开源SOTA！上交大&小红书LoopTool实现工具调用任务的「数据进化」
作者：机器之心发布日期：2025-11-19 12:00:48
机器之心发布机器之心编辑部在过去两年，大语言模型 (LLM) + 外部工具的能力，已成为推动 AI 从 “会说” 走向 “会做” 的关键机制 —— 尤其在 API 调用、多轮任务规划、知识检索、代码执
阅读全文
NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法
作者：机器之心发布日期：2025-11-19 12:00:48
本文共同第一作者为陈寅杰、颜子鹏，相关研究工作于香港大学科研实习期间完成；通讯作者 Andrew F. Luo 为香港大学助理教授。该工作已经被 NeurIPS 2025 会议接受为 Spotligh
阅读全文
NeurIPS 2025 | 上下文元学习实现不微调跨被试脑活动预测
作者：机器之心发布日期：2025-11-19 12:00:48
本文作者来自香港大学、香港中文大学、卡内基梅隆大学、哈佛大学、哥伦比亚大学等多所顶尖高校。其中论文第一作者是喻牧泉，来自香港中文大学，主要研究方向为计算神经科学与脑机接口。通讯作者为罗逸飞（Andre
阅读全文
中国AI Agent产业化参考范本：斑马口语攻克的四大技术难关
作者：机器之心发布日期：2025-11-18 13:06:02
机器之心报道编辑：杨文2025 年，AI 产业正在经历一场关键转折。当 OpenAI、Google 等 AI 巨头们还在展示多模态大模型的各种可能性时，真正决定 AI 商业价值的战役已经在教育、医疗、
阅读全文
韩松等提出FlashMoBA，比MoBA快7.4倍，序列扩到512K也不会溢出
作者：机器之心发布日期：2025-11-18 13:06:02
机器之心报道机器之心编辑部今年 2 月，月之暗面提出了一种名为 MoBA 的注意力机制，即 Mixture of Block Attention，可以直译为「块注意力混合」。据介绍，MoBA 是「一种
阅读全文
视频生成Prompt何须仅是文字！字节&港中文发布Video-As-Prompt
作者：机器之心发布日期：2025-11-18 13:06:02
本工作由第一作者在字节跳动智创北美团队实习期间完成。第一作者卞宇轩目前为香港中文大学计算机科学与工程系博士二年级学生，研究方向为可控视频生成，师从徐强教授，并曾在字节跳动、腾讯等公司实习。个人主页：h
阅读全文
告别「一条路走到黑」：通过自我纠错，打造更聪明的Search Agent
作者：机器之心发布日期：2025-11-18 13:06:02
为了同时解决知识的实时性和推理的复杂性这两大挑战，搜索智能体（Search Agent）应运而生。它与 RAG 的核心区别在于，Search Agent 能够通过与实时搜索引擎进行多轮交互来分解并执行
阅读全文
真情实感体验了阿里「千问APP」后，为什么说它是「中国的ChatGPT」？
作者：机器之心发布日期：2025-11-17 12:20:00
机器之心报道编辑：Youli、杨文近日，外媒一篇关于阿里 AI 全面入局 C 端之战，秘密启动「千问」项目的报道，在坊间引起各种猜测，甚至连相关的「阿里食堂烧鸭饭」都上了好几次热搜。没办法，大家太好奇
阅读全文