全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    养只龙虾做科研?一句话自动跑实验写LaTeX,同行评审都包了

    作者:PaperWeekly发布日期:2026-03-15 23:58:59

    一行指令,全自动查文献、跑实验并交付论文初稿。前两天分享的 ARIS 让大家看到了让 AI 自动调代码跑实验的潜力,效果确实惊艳。今天来看个更进阶的:发一条消息,收一篇完整论文。相较于单纯依赖大模型生

    阅读全文
  • 文章封面

    睡前定方向,醒来收初稿:全自动跑实验改论文的工作流开源了

    作者:PaperWeekly发布日期:2026-03-13 23:49:13

    与其在实验室通宵,不如让 Claude 替你卷。如果你还在熬夜手搓代码、调参跑实验,那这个刚刚开源的科研工作流绝对会让你眼前一亮。它就是 ARIS(Auto-Research-In-Sleep),一款

    阅读全文
  • 文章封面

    ICLR 2026 | 无需训练跨界泛化,UniOD用单一模型打通全领域异常检测

    作者:PaperWeekly发布日期:2026-03-13 23:49:13

    TL;DR:本研究提出了一种可跨不同领域、适用于特征维度各异且特征空间异构的数据集的异常检测通用模型。论文标题:UniOD: A Universal Model for Outlier Detecti

    阅读全文
  • 文章封面

    顶会门槛又被刷新?17岁高中生唯一一作中稿CVPR

    作者:PaperWeekly发布日期:2026-03-12 17:13:45

    如今的计算机视觉顶会,正在迎来更加年轻的参与者。卷。太卷了。逾三万人参与投稿,16092 篇有效文章进入评审,最终接收率仅 25.42%。在刚刚放榜的 CVPR 2026 中,合肥安生学校的 17 岁

    阅读全文
  • 文章封面

    当因果机制不再"跳变":连续机制演化下的因果表征学习

    作者:PaperWeekly发布日期:2026-03-12 17:13:45

    论文标题:TRACE: Trajectory Recovery for Continuous Mechanism Evolution in Causal Representation Learning

    阅读全文
  • 文章封面

    含「AI」量超 70%!蚂蚁集团 2026 春招全面启动

    作者:PaperWeekly发布日期:2026-03-11 13:08:19

    蚂蚁集团 2026 届春招现已全面开启本次释放超 70% AI 相关岗位聚焦大模型、多模态、智能体AI Infra 及具身智能等前沿方向想在春招投递中抢占先机?点击关注「蚂蚁集团招聘」公众号后台回复「

    阅读全文
  • 文章封面

    ICLR 2026 | 告别单一记忆粒度!MemGAS 让智能体不再“转头就忘”

    作者:PaperWeekly发布日期:2026-03-11 13:08:19

    今天跟大家分享一篇来自中国科学技术大学、香港城市大学、华为诺亚方舟实验室、大连理工大学的论文,已被 ICLR 2026 接收。针对传统单粒度记忆建模难以建立跨会话、多层次关联,且容易出现关键信息检索不

    阅读全文
  • 文章封面

    林俊旸千问收官之作?告别偏科,用Token强化学习统一大模型能力

    作者:PaperWeekly发布日期:2026-03-10 18:33:26

    近期,林俊旸离开千问团队的消息在全网引发了广泛关注。而这篇近期上线 arXiv 的论文,或许是他在千问交出的最后一份答卷。当前,大型推理模型(LRMs,如 Qwen3-Thinking 系列)在复杂数

    阅读全文
  • 文章封面

    AIME近翻倍!北航团队提出「弱驱动学习」,弱智能体反向带飞强模型

    作者:PaperWeekly发布日期:2026-03-10 18:33:26

    该工作提出了一种名为 WMSS(Weak Agents Can Make Strong Agents Stronger)的新型后训练范式,旨在解决大语言模型在监督微调(SFT)后期普遍面临的优化饱和问

    阅读全文
  • 文章封面

    首个Token为何沦为数值垃圾桶?LeCun团队解构大模型底层机制

    作者:PaperWeekly发布日期:2026-03-09 18:32:30

    学术界长期以为大值激活与 Attention Sink 强绑定,LeCun 团队打破了这一常识。在 Transformer 架构中,长期存在两个如影随形的内部计算现象:大值激活(Massive Act

    阅读全文
  • 文章封面

    人大 × 字节团队破解muP理论分歧:用谱条件统一宽深Scaling

    作者:PaperWeekly发布日期:2026-03-09 18:32:30

    ©作者 | 郑晨宇单位 | 中国人民大学研究方向 | 机器学习理论概要muP 由于其能够保持模型特征学习稳定、解锁超参迁移能力的优良特性,已经被广泛应用于大模型的宽度 scaling 之中。然而,相较

    阅读全文
  • 文章封面

    普林斯顿陈丹琦团队:免微调破解长文本衰退,推理性能提升25%

    作者:PaperWeekly发布日期:2026-03-06 21:41:39

    128K 长文本频频失忆?陈丹琦团队提出纯解码算法 DYSCO,免微调让推理性能提升 25%。当前各大模型厂商在技术报告中都宣称支持 128K 甚至更长的上下文窗口。然而,实际测试表明,随着输入长度的

    阅读全文
  • 文章封面

    ICLR 2026 | 图模型也能合并?多任务融合框架G-Merging,仅5%参数反超微调

    作者:PaperWeekly发布日期:2026-03-06 21:41:39

    研究背景不同行业的图数据具有天然的差异化特性,使得图模型的学习面临着更严峻的多域多任务泛化挑战。在图学习领域,基础模型范式——“预训练 + 下游微调”的范式成为主流。研究者通常先在大规模图数据上进行自

    阅读全文
  • 文章封面

    Mamba作者再发神作:套娃式加速解码SSD,突破vLLM/SGLang极限

    作者:PaperWeekly发布日期:2026-03-05 18:05:51

    当大模型还在验证,小模型已算好下一步。全异步架构彻底终结解码串行等待。大模型推理的核心瓶颈长期在于自回归解码的串行本质。投机解码(Speculative Decoding, SD)通过引入一个轻量级的

    阅读全文
  • 文章封面

    NeurIPS 2025 | 当系统算法遇上机器学习:GUARD开启学习增强缓存新范式

    作者:PaperWeekly发布日期:2026-03-05 18:05:51

    过去几年,机器学习在系统领域的“下沉”非常明显:它不再只做单纯的推荐、内容分类、搜索排序,还开始直接参与系统里的底层决策,例如基于 ML 模型的调度算法、缓存算法、负载均衡算法等。同时,ML for

    阅读全文
  • 文章封面

    一句话生成LoRA、长文档瞬间内化:大模型更新成本还能这样摊销?

    作者:PaperWeekly发布日期:2026-03-04 18:31:13

    显存暴降至 50MB!Sakana AI 提出更新成本摊销,打破长文本 KV-Cache 瓶颈。面对十万乃至百万级别的超长序列输入,Transformer 架构中呈二次方增长的注意力计算与 KV-Ca

    阅读全文
  • 文章封面

    直播预告 | 约翰斯·霍普金斯大学肖超玮教授:迈向安全可靠的AI智能体

    作者:PaperWeekly发布日期:2026-03-04 18:31:13

    PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 迈向安全可靠的 AI 智能体 直播嘉宾 肖超玮JHU 助理教授、NVIDIA Research 研究员 直播时间 202

    阅读全文
  • 文章封面

    Mac变身AI超算!用Claude逆向M4芯片,纯推理引擎跑通Transformer

    作者:PaperWeekly发布日期:2026-03-03 18:14:58

    你的 Mac 桌面,刚刚变成了一台超高能效的 AI 超算。苹果 M4 芯片内置的神经网络引擎(ANE)原本有着严格的官方定位:仅限推理,其底层权限被彻底封锁。但在近期,一项系统级开源项目硬是砸开了这个

    阅读全文
  • 文章封面

    通义开源Mobile-Agent-v3.5:面向多端自动化操作,20+榜单实现SOTA

    作者:PaperWeekly发布日期:2026-03-03 18:14:58

    拒绝原地打转!通义实验室开源多端 GUI 基座,会反思、能调用工具,让 Agent 真正把活干完。说起 GUI Agent,最尴尬的时刻大概不是它点错按钮,而是它一本正经地操作了半天,最后把你带回了原

    阅读全文
  • 文章封面

    150B tokens实测反转!你的DeepSeek mHC可能根本不需要“m”约束

    作者:PaperWeekly发布日期:2026-03-02 19:08:43

    我们每天都在跟进最新的顶会和明星模型,但纸面上的精妙公式在实际训练中总是无懈可击吗?©作者 | 谢天单位 | 微软亚洲研究院研究员研究方向 | 大模型预训练算法最近几周在学习 DeepSeek mHC

    阅读全文
  • 文章封面

    63万指令微调!LEADS登Nature子刊,重塑医学文献挖掘工作流

    作者:PaperWeekly发布日期:2026-03-02 19:08:43

    前不久 Nature 主刊上的 OpenScholar 把「用 AI 做科学文献综述」又推了一把:检索增强、4500 万篇开放获取论文、引用准确度媲美人类专家,而通用大模型在引用上动辄 78%–90%

    阅读全文
  • 文章封面

    单刊年赚超2亿!中科院不再报销Nature Communications巨额版面费

    作者:PaperWeekly发布日期:2026-02-28 13:12:04

    《Science》近日证实,中科院拟停止支付高昂 OA 版面费,《Nature Communications》、《Science Advances》等 30 多种期刊在列。2026 年春节前夕,有多位

    阅读全文
  • 文章封面

    多目标强化学习新突破!给GRPO加上运筹外挂,7B模型硬刚GPT-4

    作者:PaperWeekly发布日期:2026-02-28 13:12:04

    弃用 SFT!Li Auto 团队发布多目标强化学习新框架,文本摘要直接媲美GPT-4。文本摘要作为自然语言处理(NLP)的核心任务,其质量评估通常需要兼顾一致性(Consistency)、连贯性(C

    阅读全文
  • 文章封面

    V4底座浮现?DeepSeek唤醒闲置网卡,「双路径」破解长上下文I/O瓶颈

    作者:PaperWeekly发布日期:2026-02-27 07:10:12

    告别算力苦等 KV 缓存,DeepSeek 全面重构底层链路,令多轮推理吞吐量翻倍。随着大模型全面向 Agent 智能体演进,系统推理的瓶颈已实质性转移至 KV-Cache 的存储 I/O 环节。面对

    阅读全文
  • 文章封面

    WWW 2026 | 大模型推荐真懂你吗?首次揭示微调中的上下文偏差

    作者:PaperWeekly发布日期:2026-02-27 07:10:12

    论文标题:Does LLM Focus on the Right Words? Mitigating Context Bias in LLM-based Recommenders论文作者:王博浩、陈佳

    阅读全文
  • 文章封面

    让Claude和Kimi接管真实系统,跑个实验差点把服务器干崩了

    作者:PaperWeekly发布日期:2026-02-26 18:19:47

    把最高权限交给跑分无敌的基座模型,换来的不是自主智能体,而是删库与死循环的灾难。平时看各大模型在 Benchmark 上疯狂刷榜,似乎离真正可用的自主 Agent 只差临门一脚。但真把底层工具调用权限

    阅读全文
  • 文章封面

    揭开具身智能黑盒!清华等团队破译隐藏动力学密码:极限环编码行为

    作者:PaperWeekly发布日期:2026-02-26 18:19:47

    Sapient Intelligence 与清华大学近日在 arXiv 的一项横跨两类训练方法、3 种网络架构、7 大任务的系统性研究发现:元强化学习训练出的具身智能体,会通过神经状态空间中稳定区域的

    阅读全文
  • 文章封面

    仅用121个参数通关10位数加法!全网狂卷Transformer参数底线

    作者:PaperWeekly发布日期:2026-02-25 19:37:09

    Transformer 到底能有多小?这场全网狂卷的加法挑战,把极限压到了 121。构建一个能完美完成 10 位数字加法的 Transformer,最少需要多少参数?这个问题源于微软研究院研究员 Di

    阅读全文
  • 文章封面

    CVPR 2026 | 数据越多越分不清真假?中科院新作破解AIGC检测悖论

    作者:PaperWeekly发布日期:2026-02-25 19:37:09

    数据翻倍性能腰斩?GAPL 用原型学习以 90.4% 准确率实现破局。在AIGC 技术快速演进的背景下,图像生成模型已经从早期的 GAN,发展到 Diffusion,再到近年来兴起的 Flow Mat

    阅读全文
  • 文章封面

    GitHub 2K星!Edit Banana一键解剖AI像素图,变身可编辑PPT/Drawio

    作者:PaperWeekly发布日期:2026-02-24 22:04:56

    打通 Vibe Researching 闭环,AI 图秒转可编辑 LaTeX 与 PPT。AIGC 生成流程图、架构图只要几秒,但微调一个错别字却要半天?当用户还在拼运气重绘和手动重画之间反复横跳时,

    阅读全文
下一页