机器之心

CVPR 25 |全面提升视觉感知鲁棒性，生成模型快速赋能三维检测
作者：机器之心发布日期：2025-05-23 12:17:41
论文第一作者林宏彬来自香港中文大学(深圳)理工学院的Deep Bit 实验室、深圳市未来智联网络研究院，导师为李镇老师。目前实验室的研究方向包括：自动驾驶、医学成像和分子理解的多模态数据分析和生成等。
阅读全文
一场文心大模型的「AI马拉松」
作者：机器之心发布日期：2025-05-22 18:25:25
机器之心原创作者：张倩对于百度而言，既要保持长期主义的战略定力，也要在技术路径上灵活应变，这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。2025 年，模型能力的重要性依然无需多言。从预训
阅读全文
帮大模型提速80%，华为拿出昇腾推理杀手锏FlashComm，三招搞定通算瓶颈
作者：机器之心发布日期：2025-05-22 18:25:25
机器之心发布机器之心编辑部在今年 2 月的 DeepSeek 开源周中，大模型推理过程中并行策略和通信效率的深度优化成为重点之一。近日，华为数学家出手，祭出 FlashComm，三箭齐发，解决大模型推
阅读全文
性能碾压GPT-4.1-mini！Mistral开源Devstral，还能在笔记本上跑
作者：机器之心发布日期：2025-05-22 18:25:25
机器之心报道编辑：陈陈Devstral 是本地部署和设备端使用的理想之选。法国 AI 初创公司 Mistral 强势回归，再次大力投身开源 AI 社区。先前，其因未开源 Medium 3 大模型而受到
阅读全文
字节跳动&清华大学开源多模态时序大模型ChatTS，可实现时序数据对话与推理
作者：机器之心发布日期：2025-05-22 18:25:25
该工作由字节跳动 ByteBrain 团队 × 清华大学合作完成。第一作者为清华大学三年级博士生谢哲，主要研究方向为时序多模态 LLM、异常检测和根因定位。第二作者和第三作者分别为李则言和何晓，均来自
阅读全文
飞书一个聊天框，激活了机器之心编辑部的知识资产
作者：机器之心发布日期：2025-05-21 12:00:31
机器之心原创编辑：Panda、杨文你是否也有这样的经历：企业知识库像一座「屎山」，总是找不到想要的资料；找一份上周会议纪要像考古；忘了哪个群里发过一份超重要的文件；每次写汇报都像重新发明轮子……归根结
阅读全文
何恺明团队又发新作： MeanFlow单步图像生成SOTA，提升达50%
作者：机器之心发布日期：2025-05-21 12:00:31
机器之心报道编辑：陈萍这段时间，大神何恺明真是接连不断地发布新研究。这不，5 月 19 日，他又放出一篇新作！作者团队来自 CMU 以及 MIT。论文标题：Mean Flows for One-ste
阅读全文
策略学习助力LLM推理效率：MIT与谷歌团队提出异步并行生成新范式
作者：机器之心发布日期：2025-05-21 12:00:31
金天，麻省理工学院（MIT）计算机科学与人工智能实验室（CSAIL）博士五年级学生，师从 Michael Carbin 和 Jonathan Ragan-Kelley。他主要研究机器学习与编程系统的结
阅读全文
75万元奖金池+心动offer，启元实验室2025重磅赛事来袭，三大赛道，等你来战！
作者：机器之心发布日期：2025-05-20 12:58:06
机器之心发布机器之心编辑部为推动智能算法从理论创新走向实际落地，启元实验室正式启动「启智杯」算法大赛。本届大赛聚焦「卫星遥感图像鲁棒实例分割」、「面向嵌入式平台的无人机对地目标检测」以及「面向多模态大
阅读全文
代码、多模态检索全面登顶SOTA！智源BGE向量模型三连击，并全面开放
作者：机器之心发布日期：2025-05-20 12:58:06
机器之心发布机器之心编辑部检索增强技术在代码及多模态场景中的发挥着重要作用，而向量模型是检索增强体系中的重要组成部分。针对这一需求，近日，智源研究院联合多所高校研发了三款向量模型，包括代码向量模型 B
阅读全文
ICML 2025 Spotlight | 多模态大模型暴露短板？EMMA基准深度揭秘多模态推理能力
作者：机器之心发布日期：2025-05-20 12:58:06
「三个点电荷 + Q、-2Q 和 + 3Q 等距放置，哪个向量最能描述作用在 + Q 电荷上的净电力方向？」在解这道题时，我们可以通过绘制受力分析草图轻松解决。但即使是先进的多模态大语言模型，如 GP
阅读全文
ICRA 2025｜通用多机器人长时任务规划框架破解任务分配难题，成功率+105%、效率+36%
作者：机器之心发布日期：2025-05-20 12:58:06
2025 年 5 月，美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布
阅读全文
AI大厦需要新的地基！
作者：机器之心发布日期：2025-05-19 12:03:19
机器之心报道编辑：Panda「Scaling Law 即将撞墙。」这一论断的一大主要依据是高质量数据不够用了，正如前 OpenAI 首席科学家 Ilya Sutskever 在 NeurIPS 202
阅读全文
Index-AniSora：B站开源动画生成模型，斩获多项SOTA入选IJCAI25
作者：机器之心发布日期：2025-05-19 12:03:19
B 站开源动画视频生成模型 Index-AniSora，支持番剧、国创、漫改动画、VTuber、动画 PV、鬼畜动画等多种二次元风格视频镜头一键生成！论文标题：AniSora: Exploring t
阅读全文
AI生成视频总不符合物理规律？匹兹堡大学团队新作PhyT2V：不重训练模型也能让物理真实度狂飙2.3倍！
作者：机器之心发布日期：2025-05-19 12:03:19
本文由匹兹堡大学智能系统实验室（Intelligent Systems Laboratory）的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。当前文本生成视频（T2V）技术正在从注重视觉质量
阅读全文
刚刚！北大校友Lilian Weng最新博客来了：Why We Think
作者：机器之心发布日期：2025-05-18 12:25:23
选自 Lil'Log作者： Lilian Weng 机器之心编译学习大模型的优质博客又更新了！最近，北大校友、前 OpenAI 应用 AI 研究负责人 Lilian Weng 更新了一篇长长长长长长长
阅读全文
ICML 2025 Spotlight | 用傅里叶分解探讨图像对抗扰动，代码已开源
作者：机器之心发布日期：2025-05-18 12:25:23
本文作者分别来自中国科学院大学和中国科学院计算技术研究所。第一作者裴高政为中国科学院大学博士二年级学生，本工作共同通讯作者是中国科学院大学马坷副教授和黄庆明教授。对抗净化旨在测试阶段将对抗图像还原为其
阅读全文
ICML 2025｜如何凭「自动补全」实现100K生成3×加速？
作者：机器之心发布日期：2025-05-18 12:25:23
在当前大模型推理愈发复杂的时代，如何快速、高效地产生超长文本，成为了模型部署与优化中的一大核心挑战。随着 GPT-o3, DeepSeek R1 等具备「超级上下文窗口」能力的大模型持续刷新业界记
阅读全文
刚刚，OpenAI最强编程智能体上线ChatGPT
作者：机器之心发布日期：2025-05-17 00:31:13
机器之心报道机器之心编辑部从编程开始，今年智能体要卷飞了！！！昨天，OpenAI CEO 奥特曼预告了一项新研究，吊足了所有人的胃口。就在刚刚，谜底揭晓！OpenAI 宣布，在 ChatGPT 中引入
阅读全文
85倍速度碾压：苹果开源FastVLM，能在iphone直接运行的视觉语言模型
作者：机器之心发布日期：2025-05-17 00:31:13
机器之心报道作者：+0、刘欣FastVLM—— 让苹果手机拥有极速视觉理解能力当你用苹果手机随手拍图问 AI：「这是什么？」，背后的 FastVLM 模型正在默默解码。最近，苹果开源了一个能在 iPh
阅读全文
ICML 2025 Spotlight｜南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架，准确率提高20%
作者：机器之心发布日期：2025-05-17 00:31:13
该工作由南洋理工大学陶大程教授团队与武汉大学罗勇教授、杜博教授团队等合作完成。近些年，多模态大语言模型（MLLMs）在视觉问答、推理以及 OCR 等任务上取得了显著的成功。然而，早期的 MLLMs 通
阅读全文
刚刚，Manus生图功能强势登场！从设计到搭建网站一站式搞定，1000积分免费薅
作者：机器之心发布日期：2025-05-16 12:39:15
机器之心报道编辑：陈陈、杜伟那个曾经一码难求的 Manus 已经可以全面注册了。从此以后，到处求购邀请码的时代一去不复回。首次注册就送「1000 积分」让你尝尝鲜！不得不说，Manus 这次真是豪气了
阅读全文
一键开关灯！谷歌用扩散模型，将电影级光影控制玩到极致
作者：机器之心发布日期：2025-05-16 12:39:15
机器之心报道编辑：刘欣、+0最近，Google 推出了一个可以精准控制画面中光影的项目 —— LightLab。它让用户能够从单张图像实现对光源的细粒度参数化控制，可以改变可见光源的强度和颜色、环
阅读全文
泛化性暴涨47%！首个意图检测奖励范式，AI工具爆炸时代意图识别新解法
作者：机器之心发布日期：2025-05-16 12:39:15
随着大模型（LLMs）的快速发展和可集成工具的爆炸增长，AI 智能助手在日常生活中可提供的便利越来越多，不仅包括传统任务型对话中订机票、查询天气等助理能力，还增加了无以计数的 AI 能力，如 AI 画
阅读全文
超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了
作者：机器之心发布日期：2025-05-15 14:04:07
机器之心报道编辑：杜伟、陈陈国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火，以超低的成本实现了部分超越 OpenAI o1 的表现，一定程度上让人不再过度「迷信」国外
阅读全文
刚刚，DeepMind通用科学智能体AlphaEvolve突破数学极限，陶哲轩合作参与
作者：机器之心发布日期：2025-05-15 14:04:07
机器之心报道编辑：+0、刘欣今天，DeepMind 正式发布了 AlphaEvolve —— 一个由 LLMs 驱动的革命性进化编码智能体。它不仅仅是一个代码生成工具，更是一个能够演化整个代码库，用于
阅读全文
ICML 2025 | 大模型深度思考新范式：交替「推理-擦除」解决所有可计算问题
作者：机器之心发布日期：2025-05-15 14:04:07
作者介绍：本文第一作者是丰田工业大学芝加哥 PhD 学生杨晨晓，研究兴趣是机器学习理论和大模型推理，在 ICML，NeurIPS，ICLR 等顶级会议上发表过论文。本文提出一个交替「推理 - 擦除」的
阅读全文
字节最强多模态模型登陆火山引擎！Seed1.5-VL靠20B激活参数狂揽38项SOTA
作者：机器之心发布日期：2025-05-14 12:36:17
机器之心报道编辑：杨文字节拿出了国际顶尖水平的视觉–语言多模态大模型。5 月 13 日，火山引擎在上海搞了场 FORCE LINK AI 创新巡展，一股脑发布了 5 款模型和产品，包括豆包・视频生成模
阅读全文
叶子豪、陈天奇等人开源项目FlashInfer入选，MLSys2025最佳论文奖公布
作者：机器之心发布日期：2025-05-14 12:36:17
机器之心报道编辑：泽南、+0今年的两篇最佳论文一作均为华人。近日，国际系统领域顶会 MLSys 2025 公布了最佳论文奖。今年的大奖颁发给了来自华盛顿大学、英伟达、Perplexity AI、卡耐基
阅读全文
ICML 2025 | 如何在合成文本数据时避免模型崩溃？
作者：机器之心发布日期：2025-05-14 12:36:17
随着生成式人工智能技术的飞速发展，合成数据正日益成为大模型训练的重要组成部分。未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。然而，这一趋势也带来了严峻挑战：合
阅读全文