PaperWeekly

不要ViT也不要扩散！OneCAT甩掉编码器，统一多模态自回归模型来了
作者：PaperWeekly发布日期：2025-09-19 22:35:04
©PaperWeekly 原创· 作者 | 李涵单位 | 上海交通大学博士生研究方向 | 多模态理解生成一体化动机近年来，多模态领域的主流做法是将不同功能的模型“组合”起来使用。一个模型负责理解图像，
阅读全文
ICML 2025 | 乱写Prompt更给力？删几个Token，上下文学习立刻“反向觉醒”
作者：PaperWeekly发布日期：2025-09-19 22:35:04
©PaperWeekly 原创· 作者｜王剑羽单位 | 阿里达摩院算法工程师或许你会觉得 LLMs 进步这么快，各种 SFT、RLHF 技术飞速迭代，大模型知道如何使用自然语言进行沟通，花时间调一个详
阅读全文
北京内推 | 腾讯混元大模型X团队招聘大模型/强化学习方向“青云计划”实习生
作者：PaperWeekly发布日期：2025-09-19 22:35:04
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！腾讯我们正在寻找优秀青云实习生与我们携手，共同探索迈向通用人工智能 (AGI)
阅读全文
扩散大语言模型也能飞？DPad免训练加速61倍，全局规划照样稳
作者：PaperWeekly发布日期：2025-09-19 22:35:04
扩散大语言模型（dLLMs）凭借并行解码与独特的全局规划能力，有望解决自回归（AR）大模型的效率瓶瓶颈和规划能力缺陷。但其「全局规划」能力依赖于其双向注意力对所有后文的关注，这带来了严重的计算冗余，从
阅读全文
谁在拖慢你的RL？别怪显卡，错的可能是你的PG-loss
作者：PaperWeekly发布日期：2025-09-18 14:22:37
©作者 | 皓天研究方向 | AI安全、推理&规划训练跑得慢、收敛不稳，很多人第一反应是算力不足、参数没调好。但问题往往更隐蔽：pg-loss 的期望计算本身可能就错了。当 rollout≠polic
阅读全文
ICCV 2025 | Gap即力量！挖掘模态间隔潜力，MG-CLIP实现持续学习SOTA
作者：PaperWeekly发布日期：2025-09-18 14:22:37
在类增量学习（Class-Incremental Learning, CIL）中，模型需要在不断学习新任务的同时保留旧知识，避免灾难性遗忘。近期，大规模预训练模型（如 CLIP）展现了强大的泛化与零样
阅读全文
少样本不够看？给LLM装上“学习引擎”，上下文学习迈入千样本时代
作者：PaperWeekly发布日期：2025-09-18 14:22:37
尽管大型语言模型（LLM）拥有广泛的世界知识和强大的推理能力，被广泛视为优秀的少样本学习者，但在处理需要大量示例的上下文学习（ICL）时仍存在明显局限。已有工作表明，即使提供多达上百甚至上千条示例，L
阅读全文
北京内推 | 字节跳动国际电商团队招聘大模型方向算法实习生
作者：PaperWeekly发布日期：2025-09-18 14:22:37
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！字节跳动国际电商是以国际化短视频产品为载体的内容电商业务，致力于成为用户发现并
阅读全文
不改参数不重训！CARVE一招纠偏，对比注意力让视觉模型精准聚焦
作者：PaperWeekly发布日期：2025-09-17 23:19:25
你是否曾经在书架前寻找一本书，却因为密密麻麻的书脊而眼花缭乱？或者在超市货架前，面对琳琅满目的商品标签而一时找不到目标？其实，视觉语言模型（VLMs）也面临着同样的困扰。最近，来自中科院计算所的研究团
阅读全文
ICML 2025 | AI福尔摩斯来了！LLaVA-ReID多轮发问，行人重识别一步步锁定
作者：PaperWeekly发布日期：2025-09-17 23:19:25
今年 ICML Outstanding Paper “COLLABLLM: From Passive Responders to Active Collaborators” 把从被动到主动的人机协作推
阅读全文
博士申请 | 新加坡国立大学CoSTA Lab招收人工智能全奖博士/RA/实习生
作者：PaperWeekly发布日期：2025-09-17 23:19:25
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！新加坡国立大学新加坡国立大学（National University of S
阅读全文
清华新作颠覆CoT！ParaThinker并行思考，终结单链推理天花板
作者：PaperWeekly发布日期：2025-09-17 23:19:25
近年来，大语言模型（LLMs）在复杂推理任务上的能力突飞猛进，这在很大程度上得益于深度思考的策略，即通过增加测试时（test-time）的计算量，让模型生成更长的思维链（Chain-of-Though
阅读全文
一招打破瓶颈！HyperTree超树规划：AI掌握层级化推理，复杂任务全面突破
作者：PaperWeekly发布日期：2025-09-16 23:55:51
©PaperWeekly 原创· 作者 | 桂润泉学校 | 中国科学技术大学硕士生研究方向 | 大语言模型复杂推理、复杂规划在大语言模型（LLMs）飞速发展的今天，它们在数学计算、逻辑推理等领域已展现
阅读全文
EMNLP 2025 | 跨风格不误判！MoSEs用职业写作风格建模，检测AI文本更稳更准
作者：PaperWeekly发布日期：2025-09-16 23:55:51
随着大语言模型（LLMs）在新闻创作、学术研究、评论生成等领域的广泛应用，其潜在滥用风险引发了公众对内容真实性的担忧，如 AI 生成假新闻误导舆论、AI 代写学术内容引发学术不端等问题。在此背景下，构
阅读全文
北京内推 | 微软Copilot算法团队招聘大模型推理方向研究型实习生
作者：PaperWeekly发布日期：2025-09-16 23:55:51
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！微软M365 Copilot 团队是微软在智能办公领域的核心研发力量，致力于打
阅读全文
从Muon到AdaMuon：下一代优化器能否真正取代Adam？
作者：PaperWeekly发布日期：2025-09-15 23:36:37
©作者 | Chong Jie单位 | 上海交通大学研究方向 | 参数高效微调放在开头：这篇文章会比较零碎，是由我之前做过的一次分享记录而成。我没有特意去梳理文章，直接把讲稿拿来主义，属于知识比较密集
阅读全文
EMNLP 2025 | LLM也会“装成人”？对比重写CoPA挑战AI文本检测可信度
作者：PaperWeekly发布日期：2025-09-15 23:36:37
大语言模型（LLM）的滥用（如学术抄袭、虚假信息生成）推动了 LLM 文本检测器的发展，用于判别由模型生成的文本。为规避这些检测器，研究人员提出了重写攻击，即有意重写文本以逃避检测。尽管已有一定成效，
阅读全文
博士申请 | 南京大学范琦老师课题组招收26级/27级视频生成/世界模型方向博士生
作者：PaperWeekly发布日期：2025-09-15 23:36:37
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！南京大学南京大学智能科学与技术学院是南京大学在苏州校区首批建设的学院之一。在人
阅读全文
北京/杭州/西雅图内推 | 阿里通义实验室LLM Research团队招聘大模型研究科学家
作者：PaperWeekly发布日期：2025-09-15 23:36:37
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！阿里巴巴LLM research 团队是隶属于阿里巴巴通义实验室的前沿研究团队
阅读全文
Adam的Update RMS为何总是0.2？噪声模拟到理论近似全讲透
作者：PaperWeekly发布日期：2025-09-12 20:37:02
©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络众所周知，我们很早就开始尝试将 Muon 用于大规模 LLM 的训练。特别地，在QK-Clip巧解M
阅读全文
KDD 2025最佳论文亚军：参数不同还能共训？异构知识迁移框架HtFLlib全面开源
作者：PaperWeekly发布日期：2025-09-12 20:37:02
©PaperWeekly 原创· 作者 | 张剑清单位 | 上海交通大学我们在 GitHub 上开源了一个异构模型间知识迁移框架 HtFLlib，中稿 KDD 并获评 Best Paper Runne
阅读全文
「做笔记」的RAG来了！告别噪声与骨牌效应，EviNote-RAG稳住长链推理
作者：PaperWeekly发布日期：2025-09-12 20:37:02
在检索增强生成（RAG）飞速发展的当下，研究者们面临的最大困境并非「生成」，而是「稳定」。低信噪比让关键信息淹没在冗余文档里，错误累计则让推理链像骨牌一样层层坍塌。这两大顽疾，使得现有 RAG 系统
阅读全文
北京/上海内推 | 小红书智能审核算法团队招聘NLP/多模态内容理解算法工程师/实习生
作者：PaperWeekly发布日期：2025-09-12 20:37:02
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！小红书小红书智能审核算法团队，致力于通过多模态、大模型、Agent等算法能力，
阅读全文
别再狂刷CoT了！港科广DIGAI Lab发布隐式推理全景综述，静默思考开启新范式
作者：PaperWeekly发布日期：2025-09-11 23:44:57
大语言模型（LLMs）的“聪明与否”，很大程度上表现在它们能否真正完成复杂推理。过去，研究者常依赖显式链式推理（Chain-of-Thought，CoT），让模型逐步写出思考过程，虽然可解释，但输出冗
阅读全文
博士申请 | 新加坡国立大学计算机系卞亚涛老师招收2026 Fall人工智能全奖博士/博后
作者：PaperWeekly发布日期：2025-09-11 23:44:57
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！新加坡国立大学新加坡国立大学（National University of S
阅读全文
DeepSeek、Gemini都不行？AgenTracer锁定多智能体“背锅侠”，8B小模型反超闭源巨模
作者：PaperWeekly发布日期：2025-09-10 13:40:28
在大模型的持续进化过程中，我们见证了单体模型（monolithic LLM/agents）逐渐让位于更复杂、更灵活的多智能体（multi-agent）系统。后者往往通过多个大模型协同运作，再配合工具调
阅读全文
院士领衔！从智能算网到司法AI：顶尖学者直播解读AI与工程前沿趋势
作者：PaperWeekly发布日期：2025-09-10 13:40:28
人工智能正在深刻改变人类社会，同时带来技术与伦理的新挑战。为推动跨学科交流与高水平研究，英国工程技术学会（IET）与上海交通大学联合推出AI新刊 Artificial Intelligence for
阅读全文
SFT真不如RL？MIT团队抛出“RL的剃刀”，砍掉遗忘直通终身学习
作者：PaperWeekly发布日期：2025-09-10 13:40:28
©来源 | 机器之心我们已经进入了大模型时代，越来越多的应用依赖大模型的能力，可以说大模型已经成为智能化基础设施的核心组成部分，支撑着语言，视觉分析，智能驾驶，机器人等各种下游应用。在大模型的实际使用
阅读全文
北京内推 | AMD北京AI算法团队招聘模型量化/剪枝算法实习生（可远程）
作者：PaperWeekly发布日期：2025-09-10 13:40:28
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！AMDAMD 是高性能与自适应计算领域的领先企业，致力于提供优质的产品和服务，
阅读全文
报名启动！西湖大学云谷青年学者论坛·人工智能分论坛诚邀全球英才
作者：PaperWeekly发布日期：2025-09-09 13:40:57
云谷青年学者论坛云谷青年学者论坛是西湖大学工学院打造的品牌引才活动。第六届云谷青年学者论坛将以线上方式举办，秉承往届云谷青年学者论坛的办会宗旨，为海内外优秀青年学者搭建起合作与交流的平台。01人工智能
阅读全文