PaperWeekly

V4底座浮现？DeepSeek唤醒闲置网卡，「双路径」破解长上下文I/O瓶颈
作者：PaperWeekly发布日期：2026-02-27 07:10:12
告别算力苦等 KV 缓存，DeepSeek 全面重构底层链路，令多轮推理吞吐量翻倍。随着大模型全面向 Agent 智能体演进，系统推理的瓶颈已实质性转移至 KV-Cache 的存储 I/O 环节。面对
阅读全文
WWW 2026 | 大模型推荐真懂你吗？首次揭示微调中的上下文偏差
作者：PaperWeekly发布日期：2026-02-27 07:10:12
论文标题：Does LLM Focus on the Right Words? Mitigating Context Bias in LLM-based Recommenders论文作者：王博浩、陈佳
阅读全文
让Claude和Kimi接管真实系统，跑个实验差点把服务器干崩了
作者：PaperWeekly发布日期：2026-02-26 18:19:47
把最高权限交给跑分无敌的基座模型，换来的不是自主智能体，而是删库与死循环的灾难。平时看各大模型在 Benchmark 上疯狂刷榜，似乎离真正可用的自主 Agent 只差临门一脚。但真把底层工具调用权限
阅读全文
揭开具身智能黑盒！清华等团队破译隐藏动力学密码：极限环编码行为
作者：PaperWeekly发布日期：2026-02-26 18:19:47
Sapient Intelligence 与清华大学近日在 arXiv 的一项横跨两类训练方法、3 种网络架构、7 大任务的系统性研究发现：元强化学习训练出的具身智能体，会通过神经状态空间中稳定区域的
阅读全文
仅用121个参数通关10位数加法！全网狂卷Transformer参数底线
作者：PaperWeekly发布日期：2026-02-25 19:37:09
Transformer 到底能有多小？这场全网狂卷的加法挑战，把极限压到了 121。构建一个能完美完成 10 位数字加法的 Transformer，最少需要多少参数？这个问题源于微软研究院研究员 Di
阅读全文
CVPR 2026 | 数据越多越分不清真假？中科院新作破解AIGC检测悖论
作者：PaperWeekly发布日期：2026-02-25 19:37:09
数据翻倍性能腰斩？GAPL 用原型学习以 90.4% 准确率实现破局。在AIGC 技术快速演进的背景下，图像生成模型已经从早期的 GAN，发展到 Diffusion，再到近年来兴起的 Flow Mat
阅读全文
GitHub 2K星！Edit Banana一键解剖AI像素图，变身可编辑PPT/Drawio
作者：PaperWeekly发布日期：2026-02-24 22:04:56
打通 Vibe Researching 闭环，AI 图秒转可编辑 LaTeX 与 PPT。AIGC 生成流程图、架构图只要几秒，但微调一个错别字却要半天？当用户还在拼运气重绘和手动重画之间反复横跳时，
阅读全文
还在盲目堆数据？用SAE特征空间指导合成，2K样本轻松追平300K SOTA
作者：PaperWeekly发布日期：2026-02-24 22:04:56
在大模型后训练阶段，训练数据的多样性直接决定了下游任务的最终表现。为了覆盖尽可能多的长尾场景，当前主流的做法往往是不断扩大合成数据的规模。然而，构建后训练数据时，现有方法大多依赖基于文本层面的指标（如
阅读全文
藏在海量参数背后的系统工程：7家顶尖实验室大模型训练内参
作者：PaperWeekly发布日期：2026-02-23 18:10:26
比起算力规模，那些在工程一线沉淀的系统决策，才是模型性能的胜负手。大模型的演进往往给外界一种算力即一切的错觉。但对于真正的一线研发团队而言，决定模型最终性能的，往往是那些隐藏在海量参数背后的系统工程决
阅读全文
Adam如何魔改Muon？融合正交与自适应，NAMO刷新LLM训练上限
作者：PaperWeekly发布日期：2026-02-23 18:10:26
高效的随机优化器需要平衡两个核心目标，在确定性区域保持良好的更新方向，以及具备适应随机梯度扰动的机制。长期以来，Adam 及其变体 AdamW 利用坐标级别的自适应矩估计提升了训练稳定性，是大型语言模
阅读全文
无限上下文的尽头是线性回归？MIT提出注意力匹配，KV压缩提速百倍
作者：PaperWeekly发布日期：2026-02-22 17:03:12
突破大模型无限上下文瓶颈的核心解法是什么？MIT 团队给出的答案出乎意料的朴素：线性回归。尽管挑选核心键（Key）仍需依赖启发式或贪心搜索，但最耗时的特征拟合已被 MIT 的最新研究彻底转化为经典的线
阅读全文
304个中文大模型实测出炉！首个动态诊断系统ReLE发布，评测降本70%
作者：PaperWeekly发布日期：2026-02-22 17:03:12
当 C-Eval、CLUE 等传统榜单逐渐饱和，单纯的“高分”是否还能代表“高能”？近日，来自非线智能、中山大学、港科大、华为、NSFOCUS、中国平安等机构的研究团队提出了一种全新的评估范式—— R
阅读全文
零开销超越Adam/Muon！Google新型优化器Magma：丢弃一半梯度反夺SOTA
作者：PaperWeekly发布日期：2026-02-21 13:45:10
随机丢弃一半梯度，大模型训练困惑度反降 19%。在当前的训练主流中，Adam 等密集型优化器占据着绝对统治地位。业界习惯了尽可能利用所有可用的梯度信息来更新参数。然而，西北大学与 Google 的一项
阅读全文
AI也会“吃瓜”？首个声誉系统RepuNet来了，破解大模型合作崩塌难题
作者：PaperWeekly发布日期：2026-02-21 13:45:10
在日常生活中，无论是团队协作完成项目、商业伙伴间的交易往来，还是邻里间的互帮互助，合作都是社会高效稳定运转的基石。然而，合作并非总是稳定的。想象这样一个场景：公司里几个部门共同推进一个重要项目，起初大
阅读全文
除夕夜搞大事！Qwen3.5-Plus开源：NeurIPS最佳论文落地，部署显存降60%
作者：PaperWeekly发布日期：2026-02-16 18:13:16
今夜不看春晚看代码！阿里开源 Qwen3.5-Plus，性能硬刚闭源顶流。当全网都在集五福、晒年夜饭时，阿里“源神”在除夕夜悄悄放了个大招。千问 3.5 系列旗舰模型 Qwen3.5-Plus 正式开
阅读全文
当审稿人遇上“钓鱼执法”：看ICML 2026如何用提示词注入反向抓包
作者：PaperWeekly发布日期：2026-02-15 23:34:58
藏在 PDF 里的隐形指令，专治 AI 代写审稿意见。近日，Reddit 上关于 ICML 2026 审稿的讨论引发了不小的关注。多位审稿人注意到，分配给他们的论文 PDF 文件中存在异常。只要将文档
阅读全文
MiniMax M2.5生产力实测：10B的“小”身板里，藏着一位全栈架构师
作者：PaperWeekly发布日期：2026-02-14 18:04:40
谁能想到，把旗舰级代码能力塞进 10B 的小模型里，只要 1 美刀？就在昨天，MiniMax M2.5 正式开源。在旗舰模型动辄 70B+ 的当下，这个体量显得相当另类。但就是这区区 10B 激活参数
阅读全文
不调参，只写代码！Jeff Clune团队新作：Meta Agent自动演化记忆模块
作者：PaperWeekly发布日期：2026-02-13 23:55:38
通往 Software 3.0，AI 开始自己写 Python 代码进化大脑了。在 Agent 开发的深水区，记忆（Memory）始终是一个无法绕开的痛点。尽管基础模型的能力日益强大，但在推理过程中本
阅读全文
Transformer范式变了？稀疏线性混合架构SALA发布，单卡5090跑通百万长文
作者：PaperWeekly发布日期：2026-02-12 13:50:14
众所周知，Transformer 及其核心的全注意力机制（Full Attention）虽长期占据大模型架构的核心地位，但平方级计算复杂度、高额显存占用的瓶颈，早已成为实现超长上下文处理与模型规模化应
阅读全文
CVPR 2026 LoViF大赛启动！邀你攻克真实场景视频去雨雪难题
作者：PaperWeekly发布日期：2026-02-12 13:50:14
研讨会简介第一届 “生成式 AI、偏好优化与智能体系统驱动的低层视觉前沿（LoViF）” 研讨会将于 2026 年 6 月与 CVPR 2026 同期举办。底层视觉正经历一场范式转变，传统的图像复原方
阅读全文
霸榜HF第一！UltraData开源2.4T优质数据，含全球最大L3数学库
作者：PaperWeekly发布日期：2026-02-10 20:17:07
纵观人工智能的发展历程，本质上是一部“数据驱动策略与利用方式”的演进史。每一次范式跃迁，既延伸和重构了前一阶段的数据驱动策略，又演进出新的数据利用方式，从而推动模型能力的跃升与涌现。〓数据驱动策略与
阅读全文
从“事后检测”到“过程引导”，北大联合上海AI Lab重塑智能体工具调用安全
作者：PaperWeekly发布日期：2026-02-10 20:17:07
在大语言模型不断走向智能体化、并通过工具调用直接作用于真实世界的今天，安全问题已经不再停留在“说什么”，而是转向“会做什么”。当模型能够调用代码执行器、数据库和真实 API 时，一次看似合理的工具调用
阅读全文
LeCun团队连发三文：从稀疏表征到梯度规划，世界模型技术栈再进阶
作者：PaperWeekly发布日期：2026-02-09 23:58:41
针对世界模型落地难题，LeCun 团队连发三文，给出从算法到工程的全栈最优解。近期，Yann LeCun 团队连发三文，重点攻关非生成式世界模型（World Models）当前面临的三大技术痛点。非生
阅读全文
比二维码还小！Meta发布TinyLoRA：13个参数媲美全量，RL完胜SFT
作者：PaperWeekly发布日期：2026-02-06 21:19:24
26 字节，13 个参数。这是让 7B 模型数学能力逼近全量微调的全部数据。下面这张看似普通的二维码，实则包含了一个名为 TinyLoRA 的微调适配器的全部参数。〓图1. TinyLoRA 权重二
阅读全文
CVPR 2026 A2A-MML开启征稿，邀您共探任意模态新范式
作者：PaperWeekly发布日期：2026-02-06 21:19:24
随着多模态大模型的飞速发展，我们正处于从“固定模态对”向“任意模态转换”跨越的关键节点。我们诚邀您参加 CVPR 2026 A2A-MML Workshop！本次研讨会旨在汇聚视觉、语言、音频、3D、
阅读全文
学术特供版Nano Banana来了！Google亲自下场，直接对齐NeurIPS审美
作者：PaperWeekly发布日期：2026-02-05 10:05:43
懂代码、懂审美的 AI 绘图天团，专治科研人的画图焦虑。赶论文时最让人头大的，不是算力，也不是数据，而是画图。虽然 AI 早就学会了补全代码、甚至自动设计实验，但在赶 deadline 的时候，绝大多
阅读全文
从“选择”迈向“生成”！华科团队最新综述：定义多模态推荐系统新范式
作者：PaperWeekly发布日期：2026-02-05 10:05:43
多模态生成技术突飞猛进，成为目前人工智能领域的热点。Midjourney 和 Sora 等产品获得惊艳的效果，并给我们获取信息的主要途径之一——推荐系统——带来深远的影响，甚至一场底层范式的根本性变革
阅读全文
Wiley高层访问中国市场：加速AI布局，助力人工智能驱动型研究的发展
作者：PaperWeekly发布日期：2026-02-04 13:46:41
近期，威立执行副总裁兼总经理Jay Flynn，威立高级副总裁兼学术出版全球负责人Liz Ferguson及威立高级副总裁兼首席营销官Anna Reeves到访中国市场，在威立北京办公室与威立全球副总
阅读全文
ICLR 2026 | GPT-5竟给废图打高分？首个图表“信达雅”评测基准发布
作者：PaperWeekly发布日期：2026-02-04 13:46:41
🪄 你的 Dashboard 好看又精准吗？也许，是时候让 AI 来严肃地打一次分了。引言：当 AI 开始 “看图思考”在这个“数据驱动决策”的时代，图表早已不是“锦上添花”的装饰——它是传递复杂信
阅读全文
代码直接变论文！MSRA同款Agent库开源，读Repo一键生成初稿
作者：PaperWeekly发布日期：2026-02-03 14:55:30
当你还在反复调试 Prompt 时，隔壁组已经用 Agent 把代码直接变成了顶会论文。科研中最绝望的时刻往往不是没有 idea，而是实验跑通后，对着丑陋的 Visio 架构图调配色，或者对着空白的
阅读全文