用两个简单模块实现分割理解双重SOTA!华科大白翔团队等推出多模态新框架
LIRA团队 投稿量子位 | 公众号 QbitAI多模态大模型需要干的活,已经从最初的文生图,扩展到了像素级任务(图像分割)。不过,无论是OMG-LLaVA,还是提出了embedding-as-mas
阅读全文LIRA团队 投稿量子位 | 公众号 QbitAI多模态大模型需要干的活,已经从最初的文生图,扩展到了像素级任务(图像分割)。不过,无论是OMG-LLaVA,还是提出了embedding-as-mas
阅读全文组委会 发自 凹非寺量子位|公众号 QbitAI为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动「2025人工智能年度榜单」评选报名。这是量子位人工智能年度榜单的
阅读全文梦晨 发自 凹非寺量子位 | 公众号 QbitAIThinking Machines Lab发布首个产品:Thinker,让模型微调变得像改Python代码一样简单。也算是终于摘掉了“0产品0收入估值
阅读全文梦晨 发自 凹非寺量子位 | 公众号 QbitAI英伟达在机器人学习大会(CoRL)上一口气发布了多项开源技术,其中最引人注目的是联合Google DeepMind和迪士尼研究院开发的物理引擎Newt
阅读全文西风 鹭羽 发自 凹非寺量子位 | 公众号 QbitAISora 1是AI生成视频,那Sora 2呢?就在刚刚,OpenAI重磅上新,直接带来了依托Sora 2的一个AI版的“抖音”。是的,就是一个完
阅读全文Jay 发自 凹非寺量子位 | 公众号 QbitAIPython依然是最好的语言。在刚刚出炉的IEEE Spectrum 2025编程语言排行榜上,Python再次斩获最受欢迎的编程语言。不仅是冠军,
阅读全文闻乐 发自 凹非寺量子位 | 公众号 QbitAIAI生成第三视角视频已经驾轻就熟,但第一视角生成却仍然“不熟”。为此,新加坡国立大学、南洋理工大学、香港科技大学与上海人工智能实验室联合发布EgoTw
阅读全文一凡 杰西卡 发自 凹非寺量子位 | 公众号 QbitAI我的国庆出游,要被AI重塑了。这是我最近实测小滴后发出的由衷感慨。小滴是滴滴最新上线的智能体,它完全改变了打车逻辑,不再是人被动地匹配车,而是
阅读全文允中 发自 凹非寺量子位 | 公众号 QbitAI腾讯混元最新发布并开源原生多模态生图模型——混元图像3.0(HunyuanImage 3.0)!模型参数规模高达80B,是目前参数量最大的开源生图模型
阅读全文闻乐 发自 凹非寺量子位 | 公众号 QbitAI距第二篇研究仅过去三天,Thingking Machines发布了第三篇研究博客。核心作者是OpenAI联创之一John Schulman。Thing
阅读全文闻乐 发自 凹非寺量子位 | 公众号 QbitAIAI生成第三视角视频已经驾轻就熟,但第一视角生成却仍然“不熟”。为此,新加坡国立大学、南洋理工大学、香港科技大学与上海人工智能实验室联合发布EgoTw
阅读全文金磊 发自 凹非寺量子位 | 公众号 QbitAI高手如云,高手如云,但华为依旧“杀”出了一片天。就在最新一期的SuperCLUE中文大模型通用基准测评中,各个AI大模型玩家的成绩新鲜出炉。从大家最为
阅读全文克雷西 henry 发自 凹非寺量子位 | 公众号 QbitAI一百万Token的输出推理成本,只要一块钱了。今年的人工智能计算大会上,浪潮信息发布了超扩展AI服务器元脑HC1000,把AI推理成本狠
阅读全文henry 发自 凹非寺量子位 | 公众号 QbitAI英伟达还能“猖狂”多久?——不出三年!实现AGI需要新的架构吗?——不用,Transformer足矣!“近几年推理成本下降了100倍,未来还有望
阅读全文VolSplat团队 投稿量子位 | 公众号 QbitAI在三维重建不断走向工程化的今天,前馈式3D Gaussian Splatting(Feed-Forward 3DGS)正火速走向产业化。然而,
阅读全文Jay 发自 凹非寺量子位 | 公众号 QbitAI聚是「天才少年」,散是满天星。说「天才少年」不可谓不贴切。这个在华为最艰难时期被推出的人才计划,一度备受瞩目,一度千金市骨,一度吸引了最具才华和实力
阅读全文鹭羽 发自 凹非寺量子位 | 公众号 QbitAI开源框架实现样本效率提升数十倍!同样的任务,以前要上千次的评估,现在150个样本就能完成。Transformer作者Llion Jones带着自己的初
阅读全文Eigen-1团队 投稿量子位 | 公众号 QbitAI在HLE(“人类最后考试”)的专家校验子集上,首次有系统突破60分大关!就在最近,由耶鲁大学唐相儒、王昱婕,上海交通大学徐望瀚,UCLA万冠呈,
阅读全文Evo-0团队 投稿量子位 | 公众号 QbitAI在机器人学习领域,如何让AI真正“看懂”三维世界一直是个难题。VLA模型通常建立在预训练视觉语言模型(VLM)之上,仅基于2D图像-文本数据训练,缺
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAI明星创业公司Thinking Machines,第二篇研究论文热乎出炉!公司创始人、OpenAI前CTO Mira Murati依旧亲自站台,翁荔等一
阅读全文衡宇 发自 凹非寺量子位 | 公众号 QbitAI全球首个具备模拟推理能力的具身模型来了!谷歌DeepMind正式发布新一代通用机器人基座模型——Gemini Robotics 1.5系列。它不止于对
阅读全文腾讯混元3D团队 投稿量子位 | 公众号 QbitAI业界首个高质量原生3D组件生成模型来了!来自腾讯混元3D团队。现有的3D生成算法通常会生成一体化的3D模型,而下游应用通常需要语义可分解的3D形状
阅读全文TAE团队 发自 凹非寺量子位 | 公众号 QbitAI提升大模型对齐能力新方法,在TruthfulQA任务上真实性指标提升25.8%,刷新当前最优性能!方法名为Token-Aware Editing
阅读全文金磊 发自 凹非寺量子位 | 公众号 QbitAI正所谓“得数据者得天下”,这家央企算是把高质量数据集给玩明白了——超过10万亿tokens的通用大模型语料数据,以及覆盖14个关键行业的专业数据集,总
阅读全文时令 发自 凹非寺量子位 | 公众号 QbitAIChatGPT新功能闪亮登场!ChatGPT Pulse(随时随地脉动回来)。号称无需提问就可以在你睡觉时带来个性化更新,并在每天早上为你送上一份精心
阅读全文SimpleVLA-RL团队 投稿量子位 | 公众号 QbitAI视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。然而,现有训练范式存在一些核心瓶颈,比如数据采集成本高、泛化能力不足等
阅读全文ViSpec团队 投稿量子位 | 公众号 QbitAI不牺牲任何生成质量,将多模态大模型推理最高加速3.2倍!华为诺亚方舟实验室最新研究已入选NeurIPS 2025。截至目前,投机推理(Specul
阅读全文清华大学自动化系索津莉课题组 投稿量子位 | 公众号 QbitAI医学研究迎来“零人工”时代了?!清华大学自动化系索津莉课题组,发布首个专为医疗信息学设计的全自主AI研究框架——OpenLens AI
阅读全文西风 一水 发自 凹非寺量子位 | 公众号 QbitAI超越DeepMind的Langfun、抱抱脸的Smolagent等,国产智能体位列全球智能体第一梯队!GitHub明星开源项目、行业首个100%
阅读全文克雷西 发自 凹非寺量子位 | 公众号 QbitAI飞在太空中的卫星,已经成为算力中枢给地面交通设施充当大脑了?在一场视觉算法挑战中,一组参赛团队将道路识别模型部署至在轨卫星,完成了从图像采集、模型推
阅读全文