PaperWeekly

AID | 清华刘静×南航陈森：存储器正在“变软”，开启人机融合新路径
作者：PaperWeekly发布日期：2026-06-08 22:09:14
当存储器“变软”：从结绳记事到液态金属，柔性存储开启人机融合新路径Flexible Memory: Progress, Challenges, and Opportunities扫描二维码阅读原文ht
阅读全文
Opus 才敢接的科研任务，国产大模型也能扛住吗？
作者：PaperWeekly发布日期：2026-06-05 18:06:04
如果一个模型能读论文、跑实验、做 Poster、处理报告视频，它离“科研助手”还有多远？现在很多自动化科研项目里，默认选择仍然是 Opus、GPT 这类闭源旗舰模型。倒不是大家迷信海外模型，而是科研任
阅读全文
浙大×阿里云首发Token经济学综述：重估LLM Agent的Token世界
作者：PaperWeekly发布日期：2026-06-05 18:06:04
近日，浙江大学计算机学院、经济学院、区块链与数据安全国家重点实验室联合阿里云发布综述论文《Token Economics for LLM Agents: A Dual-View Study from
阅读全文
AI科研绘图终于开窍了：出图就是可编辑SVG
作者：PaperWeekly发布日期：2026-06-04 13:46:05
AI 画图终于不只停在 PNG 了：生成之后，还能继续变成可编辑 SVG。现在让 AI 先画一版论文配图，已经不算难事。方法图、架构图、poster 配图，给模型一段说明文本，往往能出一张看起来不错的
阅读全文
连播5场！美团四大顶会32篇论文，拆解大模型与Agent前沿
作者：PaperWeekly发布日期：2026-06-04 13:46:05
点亮👆“☆”星标，不错过推送内容~2026年，美团技术团队数十篇论文被 ACL、SIGIR、ICML、KDD 等顶会收录，我们近期将精选 32 篇文章，分成 5 大专场进行解读。内容涵盖大模型推理、智
阅读全文
Anthropic参与新论文：大模型为何学得更多？答案藏在Scaling里
作者：PaperWeekly发布日期：2026-06-03 19:19:11
这篇论文给出一个数据中心视角：大模型更强，不只因为能表示更多，也因为更能保留长尾任务。大模型为什么比小模型强？参数更多、数据更多、算力更多，模型能力也随之提高，似乎已经成了过去几年大模型发展的稳定经验
阅读全文
不要再卷同源蒸馏了！简单微调分词方式，轻松实现跨架构OPD
作者：PaperWeekly发布日期：2026-06-03 19:19:11
不动损失函数、不加参数、不做最优传输，仅仅换掉一个集合的定义，跨分词器蒸馏在 12 个评测格子上全部刷新——中科大团队提出 SimCT，把跨分词器蒸馏的天花板抬到了新的位置。On-Policy Dis
阅读全文
8个Agent也能稳定收敛，信任域约束重塑多Agentic工作流 | ICML 2026
作者：PaperWeekly发布日期：2026-06-02 21:31:11
多 Agentic 工作流正在从推理时协作走向统一训练，TeamTR 用信任域约束给出了稳定微调方案。多智能体 LLM 系统正在从多智能体辩论（Multi-Agent Debate）走向“智能体工作流
阅读全文
超越TurboQuant！KV Cache压到真2-bit，长上下文推理又快又稳
作者：PaperWeekly发布日期：2026-06-02 21:31:11
超越 TurboQuant, 内存有救了！最新论文 OSCAR：Offline Spectral Covariance-Aware Rotation for 2-bit KV Cache Quanti
阅读全文
Agent团队开始自我进化，MetaAgent-X把协作训进基座模型
作者：PaperWeekly发布日期：2026-05-30 09:59:51
把 Designer 与 Executor 放进同一个训练闭环，让基座模型真正学会何时协作、如何协作。本文介绍的研究是 MetaAgent-X，作者团队来自 Oregon State Universi
阅读全文
直播预告 | UCLA田园教授：大语言模型智能体框架中的安全挑战
作者：PaperWeekly发布日期：2026-05-30 09:59:51
PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座直播主题大语言模型智能体框架中的安全：让从模型级控制到生态系统治理直播嘉宾田园加州大学洛杉矶分校（UCLA）副教授直播时间
阅读全文
国内首次！千万级深思考SFT开源，MiniCPM5-1B核心数据公开
作者：PaperWeekly发布日期：2026-05-29 12:20:31
5 月 25 日至 29 日，面壁智能与 OpenBMB 联合举办「端侧大模型开源周」，每天解锁一个端侧大模型的杀手锏。端侧大模型的顶峰，不只在冰山一角，而在整座冰山。今天是开源周的第五弹：Ultra
阅读全文
Agent一定要训练吗？4层Harness让性能平均提升88.5%
作者：PaperWeekly发布日期：2026-05-29 12:20:31
只用 Qwen3-4B-Instruct 的训练轨迹演化 Harness，最终还能迁移到另外 17 个模型上。最近我们在思考一个问题：提升 LLM Agent 的能力，一定要重新训练模型吗？现在很多
阅读全文
会生成世界，不等于理解世界：20个世界模型大考来了
作者：PaperWeekly发布日期：2026-05-28 14:10:22
如果让模型连续前进、转向、跳跃、改变天气再切换视角，它还能记住自己身处哪个世界吗？视频模型正在从生成一段视频，走向模拟一个可交互的世界。雪山、城市、古堡、篮球场，角色奔跑，镜头穿梭，前沿视频模型已经能
阅读全文
ICLR 2026 | 从POD到互信息：PDE求解迎来神经正交分解新框架
作者：PaperWeekly发布日期：2026-05-28 14:10:22
偏微分方程（Partial Differential Equations，PDEs）是描述流体、扩散、反应、传热等物理过程的基础语言。然而，在真实科学计算和工程仿真中，高保真数值求解往往需要巨大的计算
阅读全文
发不了Nature？没关系，你投的Rubbish被它翻牌了
作者：PaperWeekly发布日期：2026-05-27 14:33:23
影响因子为 0 的 Rubbish，被 Nature 推到了聚光灯下。一张失败的生物实验图，最近把中国科研人的精神状态送上了 Nature。主角不是新技术，也不是重磅论文，而是一本影响因子为 0 的
阅读全文
Cell Press直播来了：顶刊大牛齐聚，解密自主导航前沿技术
作者：PaperWeekly发布日期：2026-05-27 14:33:23
自主导航技术的应用涵盖自驾汽车、无人机、航天、甚至于药物递送等多个交叉领域。这些应用均需要硬件与软件技术的同时发展去实现，例如传感技术、数据传输和自适应人工智能等。自主导航系统必须针对个别场景带来的挑
阅读全文
无问芯穹RLinf加持DreamZero世界动作模型，实现4倍训练提速
作者：PaperWeekly发布日期：2026-05-26 12:07:11
过去要等一个月的世界模型训练，如今有机会压进一周完成。在通往 AGI 的道路上，世界模型（World Model）被视为让 AI 真正理解并预测物理世界的关键拼图。英伟达近期重磅发布的世界动作模型（W
阅读全文
ACL 2026 | 7000种语言怎么教？清华阿里找准语义瓶颈，通关多语言安全
作者：PaperWeekly发布日期：2026-05-26 12:07:11
英语固若金汤，小语种一攻就破？清华与阿里提出基于“语义瓶颈层”的对齐范式，实现安全能力的跨语言泛化。研究背景与摘要近年来，大语言模型在多语言场景中的安全表现呈现出明显的“偏科”现象，英语等高频语言固若
阅读全文
为什么语音大模型一开口，还是像客服？
作者：PaperWeekly发布日期：2026-05-25 12:20:44
问题可能不在语言能力本身，而在那些更难被建模的东西：语气、情绪、停顿、潜台词，以及人与人交流时微妙的“社交感”。而最近，一篇来自南京大学与小米的论文，开始系统地评测这些副语言能力。论文标题：Speec
阅读全文
ICML 2026 | 大模型为何越改越稳？中科大揭开终身归一化黑箱
作者：PaperWeekly发布日期：2026-05-25 12:20:44
当序列编辑走向百万次量级，如何避免参数崩塌？中科大团队详细解析终身归一化机制，并提出 StableEdit 实现长程正向累积。近年来模型编辑为更新大语言模型中过时、错误的知识提供了更精准与低成本的途径
阅读全文
10M参数也能跑ARC与数独，Bengio团队押注「多轨迹推理」
作者：PaperWeekly发布日期：2026-05-22 13:34:56
10M 参数跑到数独 97%，GRAM 把递归推理改成多轨迹采样。10M 参数，在大模型时代显得有些微不足道。但 Yoshua Bengio 团队与 KAIST、Mila、NYU 研究人员提出的 GR
阅读全文
智能体也要有App Store？上交大 × OPPO构建海量智能体生态
作者：PaperWeekly发布日期：2026-05-22 13:34:56
当 AI 从单个助手进化为成千上万个智能体协作的生态，未来的智能体服务会是什么样的？论文标题：ColorEcosystem: Powering Personalized, Standardized,
阅读全文
CVPR 2026丹佛见！蚂蚁这场“AGI攀登者之夜”可以先码住
作者：PaperWeekly发布日期：2026-05-21 18:18:37
🌟点击「阅读原文」，一键报名！
阅读全文
OPD为何如此高效？中科大揭开参数动力学密码，后训练提速3倍
作者：PaperWeekly发布日期：2026-05-21 18:18:37
只跑到约 10% 训练进度，OPD 已能恢复约 80% 的最终推理性能，EffOPD 顺势把后训练提速到约 3 倍。虽然 LLMs 的推理能力依靠强化学习（RL）得到了大幅提升，但 RL 训练过程往往
阅读全文
第十一届信也科技杯全球AI算法大赛重磅开赛，超30万奖金池等你来！
作者：PaperWeekly发布日期：2026-05-20 13:06:41
阅读全文
ICLR 2026 | 800条数据治愈“过度思考”，大模型CoT减半还更准
作者：PaperWeekly发布日期：2026-05-20 13:06:41
你有没有遇到过，问大模型一个简单数学题，它却洋洋洒洒写了 5000 多字才出答案？这种“过度思考”不仅烧钱费时，还容易把对的改成错的。现在，中科大研究团队提出了 LCPO（Length Control
阅读全文
首篇Agent Harness综述：模型之外，Agent拼什么？
作者：PaperWeekly发布日期：2026-05-19 15:09:43
当模型能力不再是唯一变量，Agent 的胜负开始落到执行环境、工具接口、上下文、验证与治理这一整套 Harness 上。很多 Agent 系统进入真实任务后暴露出的不稳定，已经很难只用模型能力不足来解
阅读全文
美团CVPR 2026中稿精选：视觉生成遇上慢思考，解码多模态推理新范式
作者：PaperWeekly发布日期：2026-05-19 15:09:43
点亮👆“☆”星标，不错过推送内容~CVPR（IEEE/CVF Conference on Computer Vision and Pattern Recognition）是计算机视觉和模式识别领域中顶
阅读全文
从 P(y|x) 到 P(y)：将RL引入预训练空间，激发大模型内生推理
作者：PaperWeekly发布日期：2026-05-18 12:36:08
大模型的强化学习必须依赖具体问题吗？中科院自动化所最新证实：去掉输入条件，直接对推理轨迹本身做边缘分布优化，配合负样本强化，仅 20 步即可大幅激发内生推理。现有大模型的推理强化学习，大多是在给定问题
阅读全文