PaperWeekly

CVPR 2025 | 打破壁垒！多模态统一学习新范式来了，数据、模型、代码全开源
作者：PaperWeekly发布日期：2025-08-19 13:48:50
我们人类生活在一个充满视觉和音频信息的世界中，近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力，衍生出了多种不同类型的任务，它们分别要求模型具备不同层面的能力。过去大量的工作主要
阅读全文
重温经典！十年前的视觉MoE雏形：HD-CNN用分层路由预演大模型逻辑
作者：PaperWeekly发布日期：2025-08-19 13:48:50
在 2015 年的计算机视觉领域顶会 ICCV 中，HD-CNN（Hierarchical Deep Convolutional Neural Networks）模型横空出世，在当时极具挑战性的 Im
阅读全文
博后招募 | 清华大学信息国家研究中心招收大模型/多模态/CV等方向博后/实习生
作者：PaperWeekly发布日期：2025-08-19 13:48:50
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！清华大学信息国家研究中心清华大学北京信息科学与技术国家研究中心（简称：清华大学
阅读全文
LLM为什么能看懂图？秘密不在Projector，残差结构才是跨模态理解的关键
作者：PaperWeekly发布日期：2025-08-18 13:37:13
©作者 | 张定坤单位 | 哈尔滨工业大学（深圳）研究方向 | 多模态大模型近年来，多模态大语言模型（Multimodal Large Language Models，MLLMs）在处理视觉-语言任务
阅读全文
ICCV 2025 | 告别“高分低能”！奖励模型新突破：ICT-HP让文生图更懂人类审美
作者：PaperWeekly发布日期：2025-08-18 13:37:13
在文本到图像生成的革命性浪潮中，我们见证了从模糊到高清，从单一到细节丰富的飞跃。然而，一个令人困惑的挑战也随之浮现：当我们生成越来越精美的图像时，现有的评估模型，例如那些基于 CLIP 或 BLIP
阅读全文
教会7B模型“自我思考”！腾讯RLVMR刷新智能体认知，长程任务表现直追GPT-4o
作者：PaperWeekly发布日期：2025-08-18 13:37:13
自主智能体（Agents）正朝着能够处理复杂长程任务（Long-Horizon Tasks）的通用智能（AGI）迈进，但许多研究者发现了一个尴尬的现实：很多智能体虽然能完成任务，却像个「只会蒙答案的学
阅读全文
上海/北京内推 | 上海人工智能实验室数据平台中心招聘大模型算法工程师/实习生
作者：PaperWeekly发布日期：2025-08-18 13:37:13
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！上海人工智能实验室OpenDataLab（数据平台中心）专注于以数据为中心的A
阅读全文
论文速递 | 国防科技创新研究院-Nature子刊《自然-机器智能》：融合重建模型与传感器布局优化的双层可微学习框架
作者：PaperWeekly发布日期：2025-08-17 22:12:36
国防科技创新研究院姚雯研究员团队在 Nature 子刊《Nature Machine Intelligence》（自然-机器智能）发表题为“Enhancing deep learning-based
阅读全文
ICCV 2025 | 北大开源AR-VRM：第一人称视频驱动关键点迁移，实现机器人类比学习
作者：PaperWeekly发布日期：2025-08-17 22:12:36
©PaperWeekly 原创 · 作者 | 杨德杰单位 | 北京大学王选所博士生研究方向 | Multi-Modal/VLA该论文的所有作者均来自北京大学王选计算机研究所，第一作者为博士生杨德杰，通
阅读全文
博士申请 | 香港中文大学（深圳）刘圳老师课题组招收大模型/机器学习全奖博士/硕士
作者：PaperWeekly发布日期：2025-08-17 22:12:36
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港中文大学（深圳）香港中文大学（深圳）数据科学学院专注于数据科学方向的人才培
阅读全文
北京内推 | 阿里高德多模态团队多模态/大模型/Agent方向研究型实习生
作者：PaperWeekly发布日期：2025-08-17 22:12:36
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！阿里巴巴团队来自阿里巴巴高德多模态团队，在NeurIPS/ICLR/CVPR/
阅读全文
ICML 2025 | 模型不开口也能配合？贝叶斯纳什均衡重塑多智能体LLM协作
作者：PaperWeekly发布日期：2025-08-14 23:52:53
当前，通过 prompt 引导多个大语言模型（LLM）进行协作，如多智能体辩论（Multi-agent Debate），已被证明能显著增强模型的复杂推理能力。然而，基于“显式多轮信息交互“的多模型框架
阅读全文
别再二选一了！一文看懂On-Policy与Off-Policy的本质分歧（含GRPO深度拆解）
作者：PaperWeekly发布日期：2025-08-14 23:52:53
©作者 | 吴宇斌单位 | 摩尔线程研究方向 | GUI agent在强化学习（Reinforcement Learning，RL）中，on-policy 和 off-policy 是两种核心的学习策
阅读全文
告别Transformer？上海交大「原生类脑」BriLLM首秀：信号流重塑大模型范式
作者：PaperWeekly发布日期：2025-08-14 23:52:53
当前 GPT 类大语言模型的表征和处理机制，仅在输入和输出接口层面对语言元素保持可解释的语义映射。相比之下，人类大脑直接在分布式的皮层区域中编码语义，如果将其视为一个语言处理系统，它本身就是一个在全局
阅读全文
博士申请 | 新加坡国立大学计算机系刘安吉老师招收生成模型/LLM方向全奖博士/博后/实习生
作者：PaperWeekly发布日期：2025-08-14 23:52:53
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！新加坡国立大学新加坡国立大学（National University of S
阅读全文
Kimi K2背后的冷门绝招：海量语料“重写”如何榨干每个token？
作者：PaperWeekly发布日期：2025-08-13 23:35:31
©作者 | 李嘉诚研究方向 | 大模型预训练和对齐前段时间 K2 作为国际一线模型发布，优秀的效果、开源权重和新技术验证赢得海内外一片掌声，其技术报告中罕见地提到了部分数据构成的细节，例如对于信息密度
阅读全文
ICML 2025 | 奖励模型还用人标？APEC用对抗模仿生成偏好，泛化能力直线上升
作者：PaperWeekly发布日期：2025-08-13 23:35:31
©作者 | 张智龙单位 | 南京大学研究方向 | 强化学习和世界模型非常高兴我们的工作《Improving Reward Model Generalization from Adversarial P
阅读全文
Attention Sink的起源找到了？清华×美团首次锁定MoE中的「超级专家」
作者：PaperWeekly发布日期：2025-08-13 23:35:31
稀疏激活的混合专家模型（MoE）通过动态路由和稀疏激活机制，极大提升了大语言模型（LLM）的学习能力，展现出显著的潜力。基于这一架构，涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。
阅读全文
博士申请 | 休斯敦大学计算机系刘锦阳老师招收高性能计算/数据压缩方向博士生
作者：PaperWeekly发布日期：2025-08-13 23:35:31
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！休斯敦大学休斯敦大学的计算机系非常具有学术竞争力。于2024年，CSRanki
阅读全文
后训练轻量「小枝」强势出击！极限剪裁视觉token，推理加速154%
作者：PaperWeekly发布日期：2025-08-12 12:33:43
近年来，GPT-4V 等视觉语言大模型（large vision-language model，LVLM）表现出卓越的多模态理解能力和通用性，尤其是在文档分析、GUI 自动化、机械臂控制等领域展现出令
阅读全文
实验室抢显卡抢破头？A800/H800骨折价来袭，超值返券助你轻松冲DDL！
作者：PaperWeekly发布日期：2025-08-12 12:33:43
过去几年，做模型训练、推理、微调的人都有同一个痛点：显卡要么排不到，要么价格被炒到天上。而今年，显卡资源紧张问题愈发严峻——SFT、RLHF、MoE 以及多模态训练纷纷上阵，显存需求骤增，钱包压力也随
阅读全文
ICCV 2025 | Scaffold反噬联邦学习？NTU联手0G Labs揭示中心化训练安全漏洞
作者：PaperWeekly发布日期：2025-08-12 12:33:43
通过使用控制变元（control variate）来校准每个客户端的本地梯度，Scaffold 已被广泛认为是缓解联邦学习中数据异质性影响的一种强大方案。但尽管 Scaffold 实现了显著的性能提升
阅读全文
北京内推 | 度小满金融视觉和多模态团队招聘视觉多模态算法实习生
作者：PaperWeekly发布日期：2025-08-12 12:33:43
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！度小满金融DXM ITDD 视觉和多模态团队：我们专注于图像、视频、文本信息的
阅读全文
建议所有博士都去学一遍，这次真的赢麻了！
作者：PaperWeekly发布日期：2025-08-11 12:32:13
无论你是博士，还是硕士，肯定都因为发不出sci而自我怀疑过！是自己天资不够？不适合科研？还是努力还不够？其实都不是！无论是选题没有头绪，实验漏洞百出，还是论文改来改去依旧被拒。这都是因为你没有遇到一个
阅读全文
ICCV 2025 | 终结灾难性遗忘！南大提出外部知识注入机制，刷新CLIP持续学习SOTA
作者：PaperWeekly发布日期：2025-08-11 12:32:13
持续学习旨在使学习系统不断学习流式数据中的知识。随着预训练技术的发展，预训练视觉-语言模型（如 CLIP）通过引入预训练知识促进了持续学习的发展。然而，CLIP 通过将视觉表征与类别名称匹配来进行判别
阅读全文
超越样本级RL！人大×快手提出ARPO：熵驱动Agent探索，多轮推理性能飙升
作者：PaperWeekly发布日期：2025-08-11 12:32:13
在可验证强化学习（RLVR）的推动下，大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中，LLM 往往需要结合外部工具进行多轮交互，现有 RL 算法在平衡模型的长程推理与多轮工具交互能力
阅读全文
北京/上海内推 | 盛大集团AI创新中心招聘大模型/Agent方向算法实习生
作者：PaperWeekly发布日期：2025-08-11 12:32:13
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！盛大集团盛大是一家全球性的私人投资控股集团，由中国网络互动娱乐先锋陈天桥及其家
阅读全文
向量检索造数据全链路揭秘：Qwen3打样，Gemini精炼，Seed1.5推理升级
作者：PaperWeekly发布日期：2025-08-10 22:02:04
©作者 | 李嘉诚单位 | 字节跳动研究方向 | Retrieva & LLM近期，Google，字节跳动，阿里相继发布了他们最新的检索模型——gemini-embedding，seed1.5-emb
阅读全文
Dijkstra非最优解！清华团队突破最短路径排序瓶颈，STOC 2025最佳论文详解
作者：PaperWeekly发布日期：2025-08-10 22:02:04
©作者 | 机器之心每次打开导航的，导航软件在一秒内给出一个最速路线的时候，你有没有好奇过它是怎么找到这条路的？假如不考虑堵车、红绿灯等交通影响因素，仅找到一条最短最快的路线，那不论如何也逃不掉 Di
阅读全文
博士申请 | 香港大学陈城老师招收医疗AI方向全奖博士/研究助理/访问学生
作者：PaperWeekly发布日期：2025-08-10 22:02:04
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港大学香港大学创立于1911年，坐落于繁华的香港岛西部，是香港的首间大学，发
阅读全文