PaperWeekly

180万小时数据训练，VoxCPM 1.5开源：支持全量微调，精准复刻真人声
作者：PaperWeekly发布日期：2025-12-12 13:31:09
180 万小时、44k 高保真、支持全量微调——刚刚开源的 VoxCPM 1.5，技术细节全解密。最近，面壁技术团队发布了 VoxCPM 1.5 版本，在持续优化开发者开发体验的同时，也带来了多项核心
阅读全文
AAAI 2026 | System 1 & 2协同！快慢思考赋能VLM，重塑细粒度识别范式
作者：PaperWeekly发布日期：2025-12-12 13:31:09
以 CLIP 为代表的视觉语言模型（VLM）在大规模图文数据上进行了预训练，具备强大的通用视觉识别能力。然而，在细粒度识别任务上，VLM 往往难以区分相近类别之间的细微差异，识别能力显著下降。以 CL
阅读全文
Google Scholar被玩坏：10篇“水文”刷出600+引用，H-index还能信吗？
作者：PaperWeekly发布日期：2025-12-11 13:35:32
现在的 Google Scholar，漏洞大得像个筛子。大家每天都在用 Google Scholar 查文献，但可能没几个人意识到，这个我们用来背书学术影响力的工具，其实非常容易被攻破。这两天有人挖出
阅读全文
EMNLP 2025 | 视频理解Token压缩新范式：VidCom²减少70.8%推理延迟
作者：PaperWeekly发布日期：2025-12-11 13:35:32
在大语言模型的浪潮中，视频大语言模型（VideoLLMs）正以惊人的速度进化，生成的响应越来越精细。然而，“慢”与计算量大依然是制约其大规模应用的最大痛点。视频序列中海量视觉 token 导致的二次方
阅读全文
终于把汉字写对了！实测美团LongCat-Image：6B模型挑战开源天花板
作者：PaperWeekly发布日期：2025-12-10 13:16:51
6B 小模型也能挑战 SOTA？文生图赛道又卷起来了。美团 LongCat 团队刚刚发布并开源了 LongCat-Image 图像生成模型。长期以来，中文生成和精准编辑一直是开源模型的隐痛。现有方案往
阅读全文
告别碎片化！VecCity首次统一地图实体表征学习：一套体系打通POI/道路/地块
作者：PaperWeekly发布日期：2025-12-10 13:16:51
北京航空航天大学联合澳门大学，共同开发了跨 POI、道路、地块的统一地图要素表征学习工具库：VecCity。该工具库通过统一数据、统一流程、统一测评，集成了 9 座城市数据、复现 21 种主流的时空要
阅读全文
NeurIPS 2025大洗牌：清华390篇险胜Google，一张图看懂全球AI权力迁徙
作者：PaperWeekly发布日期：2025-12-09 19:41:24
揭秘 5825 篇论文背后的新秩序。NeurIPS 2025 刚刚在圣地亚哥落下帷幕。作为全球 AI 领域的风向标，今年的 OpenReview 数据比往年更具冲击力。5825 篇接收论文刷新了历史记
阅读全文
从贝叶斯视角缓解多模态幻觉：北航 × 腾讯提出EVRB，让LVLM忠于所见
作者：PaperWeekly发布日期：2025-12-09 19:41:24
开篇：多模态大模型的幻觉顽疾要如何缓解？当你让视觉语言大模型（LVLM）描述一张“猫咪与酒瓶”的图片时，它却生成“猫咪旁边放着一杯咖啡”——这种无中生有的幻觉，早已成为 LVLM 落地的最大绊脚石。
阅读全文
统一多模态理解与生成综述：83页长文梳理进展和挑战
作者：PaperWeekly发布日期：2025-12-08 13:05:30
从 GPT-4o 的惊艳亮相到 Gemini 的持续迭代，AI不仅能理解文本，更能看懂图像、听辨声音、创作视频，实现跨模态的联合理解与生成。这一前沿领域的核心，正是统一多模态基础模型（Unified
阅读全文
生成剪辑全都要！UniVA重磅开源：首个全能视频Agent，一站式搞定长视频
作者：PaperWeekly发布日期：2025-12-08 13:05:30
近日，来自新加坡管理大学（SMU）、罗切斯特大学（UR）、伦敦大学学院（UCL）、新加坡国立大学（NUS）、香港中文大学（CUHK）、斯坦福大学（Stanford）等顶尖科研机构的研究团队联袂发布了最
阅读全文
侮辱性极强！50+篇ICLR投稿被抓包：满纸假文献，竟获均分8.0好评？
作者：PaperWeekly发布日期：2025-12-07 19:16:22
ICLR 2026 的瓜田，真是一波未平一波又起，根本吃不完。原本以为前两集的审稿连续剧已经够离谱了，大家也就是看几个投机取巧的团队在浑水摸鱼，被发现后撤稿也就剧终了。但现在的局势，似乎远比我们想象的
阅读全文
AAAI 2026 | LLM终身学习新范式：不仅要改得准，还要改得稳
作者：PaperWeekly发布日期：2025-12-07 19:16:22
大型语言模型在预训练阶段习得了海量知识，常常被当作知识库使用。但是，模型更新速度远远跟不上世界更新的速度，导致用户常常被过时或虚假的信息欺骗。在更新模型知识时，传统的微调类方法成本高昂且容易导致灾难性
阅读全文
建议NeurIPS改名漫展：全员二次元整活，搞科研哪有不疯的？
作者：PaperWeekly发布日期：2025-12-06 12:34:23
Nano Banana 的风，还是吹到了 NeurIPS 现场。经历了全年的 Peer Review 毒打，这届 NeurIPS 终于确诊了。大家不再执着于把 Poster 做成严谨工整的学术汇报，而
阅读全文
ICML 2025 | 为什么神经网络可以被低秩压缩？来自函数逼近论的解释
作者：PaperWeekly发布日期：2025-12-06 12:34:23
“低秩（Low-rank）压缩”已经成为大模型压缩和参数高效微调的主要工具，但一个长期悬而未决的问题是：低秩压缩的普遍有效性是否有坚实的数学理论保障？这项由北京航空航天大学联合清华大学完成的理论研究，
阅读全文
Adv. Robot. Res 复旦大学崔继斋课题组：光波导致动器研究综述
作者：PaperWeekly发布日期：2025-12-06 12:34:23
光波导致动器研究综述Waveguide Photoactuators: Materials, Fabrication, and Applications扫描二维码阅读原文https://doi.org
阅读全文
扒开DeepSeek V3.2的技术报告，我竟然看到了MiniMax的影子
作者：PaperWeekly发布日期：2025-12-05 13:06:06
DeepSeek V3.2 的隐藏彩蛋，怎么和 MiniMax 撞脸了？最近几天持续被 DeepSeek V3.2 刷屏。不过，在看热闹之余，我在翻看 OpenRouter 文档时，发现了一个更有意思
阅读全文
北大/南大/港理工顶尖学者联手，告别冯·诺依曼计算瓶颈 | Cell Press直播预告
作者：PaperWeekly发布日期：2025-12-05 13:06:06
随着全球多国政府纷纷设定净零排放目标，能源密集型的信息与通信技术（ICT）行业转型已成为关键议题之一。在此背景下，发展高能效计算技术显得尤为重要，具有显著的现实意义与紧迫性。目前，产业界与学术界正携手
阅读全文
无惧遮挡！无限时长！快手可灵提出无Mask唇形同步新范式OmniSync
作者：PaperWeekly发布日期：2025-12-04 13:05:52
快手可灵团队再出杀手锏！抛弃传统「抠图修补」的老路，OmniSync 用 DiT 重构口型生成：无惧遮挡、支持无限时长，彻底终结 AI 视频的“面瘫”时代。在视频生成模型快速迭代的当下，从 Sora
阅读全文
AAAI 2026 | 教大模型玩「谁是卧底」，竟然治好了它"睁眼说瞎话"的毛病？
作者：PaperWeekly发布日期：2025-12-04 13:05:52
论文标题：Multi-agent Undercover Gaming: Hallucination Removal through Counterfactual Test for Multimodal
阅读全文
投稿前必看：文献综述、图表、引用都交给 AI？这些关键细节你不能忽略
作者：PaperWeekly发布日期：2025-12-03 12:11:08
人工智能正在改变科学发现的方式。随着科研出版行业加速对人工智能技术的应用，“如何负责任地使用AI”已成为全行业关注的焦点及亟待解决的问题。根据威立于今年10月发布的AI调研报告ExplanAItion
阅读全文
一步也能SOTA！何恺明团队新作iMF：无需蒸馏，直达ImageNet FID 1.72
作者：PaperWeekly发布日期：2025-12-03 12:11:08
清华姚班大二本科生搭档何恺明！新作 iMF 彻底抛弃蒸馏，参数锐减 1/3，从零训练刷新 ImageNet 一步生成 SOTA (FID 1.72) 。在生成式 AI 的前沿赛道中，如何让扩散模型实现
阅读全文
悟空杀进NeurIPS！把七十二变写成数学公式，这才是我们想看的“东方魔法”
作者：PaperWeekly发布日期：2025-12-02 13:05:23
继《黑神话》之后，悟空再次震惊世界——这次不是在游戏里，而是在 NeurIPS 2025 上。当《黑神话：悟空》还在让全球玩家查阅“Destiny”的含义时，来自香港大学与南洋理工大学的研究团队，已经
阅读全文
差分隐私失效！揭秘GNN拓扑推断攻击：PGR用「零重叠」合成图破解危局
作者：PaperWeekly发布日期：2025-12-02 13:05:23
随着图神经网络（GNN）在社交网络、生物信息学和推荐系统等领域的广泛应用，数据隐私问题日益成为关注焦点。近期，Stevens Institute of Technology 等团队发表了题为《Safe
阅读全文
陈丹琦团队反直觉发现：打破正向反馈迷信，「以罚代奖」才是推理Scaling真相
作者：PaperWeekly发布日期：2025-12-01 18:05:54
只要模型做对了就给糖吃？这可能是我们对 RLVR 最大的误解。在 DeepSeek-R1 确立了 GRPO 这一训练范式后，学术界和工业界在提升大模型推理能力时，普遍遵循正向反馈优先的原则，即通过强化
阅读全文
超越DeepSeek-OCR光学压缩：C3重构纯文本压缩，40倍压缩精度仍达93%
作者：PaperWeekly发布日期：2025-12-01 18:05:54
还记得 DeepSeek OCR 刚发布时引发的轰动吗？通过将文本转换为图像再进行压缩，实现了 10 倍的 token 压缩率，同时保持 97% 的 OCR 准确率。这一创新让整个 AI 圈为之振奋，
阅读全文
首篇即登Nature正刊！复旦博二生独立一作：突破裸眼3D显示难题
作者：PaperWeekly发布日期：2025-11-30 23:08:48
博一全年蛰伏零产出，首篇论文即登 Nature 正刊。复旦博士生用深度学习“强解”裸眼 3D 数十年难题，展示了计算如何重构物理世界的底层逻辑。在现在的学术圈，如果一个博士生整整一年没有任何会议投稿、
阅读全文
NeurIPS 2025 | 幻觉越少，幻觉越多？北邮团队新作揭示幻觉耦合陷阱
作者：PaperWeekly发布日期：2025-11-30 23:08:48
大语言模型（LLM）的智能浪潮席卷全球，它们凭借卓越的上下文理解和文本生成能力，正重塑我们的信息获取方式。然而，其强大的能力背后却隐藏着可靠性的系统性风险——幻觉（hallucination）。简而言
阅读全文
离大谱！Apple连夜删库：ICLR投稿代码没读图，模型全靠闭眼瞎蒙
作者：PaperWeekly发布日期：2025-11-29 23:43:30
这是一次充满黑色幽默的“回旋镖”，也是学术圈今年最响亮的一记耳光。Apple 研究团队投给 ICLR 2026 的一篇论文，标题起得很有哲学意味：《推理究竟哪里出错了？》（Where Did the
阅读全文
AAAI 2026 | 首个多球拍运动分析基准：RacketVision揭示多模态融合陷阱
作者：PaperWeekly发布日期：2025-11-29 23:43:30
本文提出了 RacketVision，涵盖乒乓球、网球、羽毛球的大规模多运动基准，旨在统一球体与球拍的视觉分析。RacketVision 首次提供了大规模高精度的球拍关键点标注。论文标题：Racket
阅读全文
史诗级Bug！OpenReview全员裸奔，匿名评审秒变「实名大逃杀」
作者：PaperWeekly发布日期：2025-11-28 01:38:33
别猜是谁给你打 0 分了，OpenReview 刚才把审稿人的户口本都泄露了——不仅知道他是谁，连他导师是谁都看得一清二楚。如果说之前的投稿是一场“蒙面大逃杀”，那么今天，OpenReview 的程序
阅读全文