全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    PPO为何稳赢Policy Gradient?答案藏在这刀“黄金剪裁”

    作者:PaperWeekly发布日期:2025-08-26 18:49:26

    ©作者 | Cheney训练老是翻车,调参像在碰运气?多数时候问题出在策略更新的“步子”迈得太大。Policy Gradient 简单直接却极易不稳,TRPO 在稳定性上更有保障,却因复杂实现难以普及

    阅读全文
  • 文章封面

    清华科技园硬核闭门局!九坤技术圆桌派:大模型Infra、训练与应用全景深聊

    作者:PaperWeekly发布日期:2025-08-26 18:49:26

    —end—

    阅读全文
  • 文章封面

    Chain-of-Agents重磅登场!通用智能体新范式横扫SOTA,模型代码数据全开源

    作者:PaperWeekly发布日期:2025-08-26 18:49:26

    近年来,以多智能体系统(MAS)为代表的研究取得了显著进展,在深度研究、编程辅助等复杂问题求解任务中展现出强大的能力。现有的多智能体框架通过多个角色明确、工具多样的智能体协作完成复杂任务,展现出明显的

    阅读全文
  • 文章封面

    深圳内推 | 腾讯WXG微信支付团队招聘大模型算法应用实习生

    作者:PaperWeekly发布日期:2025-08-26 18:49:26

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯微信事业群负责搭建和运营微信生态体系,为全球超过13亿用户提供便捷的社交生

    阅读全文
  • 文章封面

    AI岗位全面加码!蚂蚁集团2026届秋招正式启动,11城同步开放

    作者:PaperWeekly发布日期:2025-08-25 18:11:30

    蚂蚁集团 2026 届秋季校招已经启动:技术岗位占 86%,AI 方向覆盖大模型、多模态、具身智能、AI 安全等一线课题。杭州、北京、上海、深圳等 11 城同步开放。如果你正好在权衡继续深造还是进工业

    阅读全文
  • 文章封面

    挑战AR霸权!MBZUAI发布扩散语言模型全面综述:解析语言建模新范式

    作者:PaperWeekly发布日期:2025-08-25 18:11:30

    虽然以 GPT 为代表的自回归 AR 模型在文本生成领域已经占据主导地位,但 AR 模型天然存在并行度低,推理速度慢的瓶颈。近来,受到扩散模型在图像和其他连续数据上的应用的启发,扩散语言模型正在迅速发

    阅读全文
  • 文章封面

    打破15秒魔咒!StableAvatar来了:首个无限时长音频驱动人像视频生成框架

    作者:PaperWeekly发布日期:2025-08-25 18:11:30

    扩散模型的兴起极大地推动了语音驱动人类视频生成的研究。具体而言,语音驱动人类视频生成旨在基于参考图像与音频,合成面部表情与身体动作与音频高度同步的自然人像视频,在电影制作、游戏制作、虚拟现实、直播带货

    阅读全文
  • 文章封面

    博士申请 | 新加坡国立大学FoodAI组张大川教授招收人工智能全奖博士/博后/RA

    作者:PaperWeekly发布日期:2025-08-25 18:11:30

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡国立大学新加坡国立大学(National University of S

    阅读全文
  • 文章封面

    别再分开训!SFT+RL融合范式全解析:统一视角下的六大方法

    作者:PaperWeekly发布日期:2025-08-22 14:26:31

    ©作者 | 白强伟单位 | 熵基科技研究方向 | 强化学习为什么要融合SFT和RLRL 虽然能够有效提升模型的推理能力,但一个重要的前提是基础模型本身具备了一定的相关能力。在 RL 训练中,通过多次

    阅读全文
  • 文章封面

    ICCV 2025 | 换脸迈入“电影级”!小红书发布DynamicFace,统一图像视频换脸基线

    作者:PaperWeekly发布日期:2025-08-22 14:26:31

    近年来,扩散模型在图像与视频合成领域展现出前所未有的生成能力,为人脸生成与编辑技术按下了加速键。特别是一张静态人脸驱动任意表情、姿态乃至光照的梦想,正在走向大众工具箱,并在三大场景展现巨大潜力:影视行

    阅读全文
  • 文章封面

    考场高分≠临床可靠!全球首个医疗动态红队测试框架,破解医疗AI落地危机

    作者:PaperWeekly发布日期:2025-08-22 14:26:31

    导语:医疗人工智能的“双刃剑” 近年来,以大型语言模型(LLMs)为代表的人工智能技术正以前所未有的速度发展,并在医疗健康领域展现出巨大的潜力。从辅助疾病诊断到优化临床决策,LLMs 似乎正为我们描绘

    阅读全文
  • 文章封面

    北京内推 | 快手商业化算法部内循环电商模型组招聘推荐大语言模型算法实习生

    作者:PaperWeekly发布日期:2025-08-22 14:26:31

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!快手快手-商业化算法部-内循环电商模型组:基于快手的海量用户和商家数据,探索使

    阅读全文
  • 文章封面

    提分不提参!遥感图像四大SOTA trick:多模态融合、统一框架、轻量化与新范式

    作者:PaperWeekly发布日期:2025-08-21 13:36:39

    遥感图像方向的研究2025年的工作成果,太亮眼!看了60+篇论文,总结了今年下半年到明年大家发论文可以挖一挖的4个方面的创新点:多模态融合与统一框架武大港中文的多篇论文都致力于将不同类型的遥感数据(如

    阅读全文
  • 文章封面

    训练减半反超GRPO!Shuffle-R1引入动态洗牌术,突破多模态RL效率瓶颈

    作者:PaperWeekly发布日期:2025-08-21 13:36:39

    ©作者 | 朱泠皞单位 | 华中科技大学/小米公司研究方向 | 多模态大模型太长不看:我们提出了 Shuffle-R1,一个简单而高效的多模态大语言模型(MLLM)强化学习后训练框架,它通过“动态数据

    阅读全文
  • 文章封面

    ICLR 2025 | 大模型为何会“举一反三”?揭开「上下文学习」的小样本学习密码

    作者:PaperWeekly发布日期:2025-08-21 13:36:39

    近年来,大语言模型(LLM)在人工智能领域取得了突破性进展,成为推动自然语言处理技术发展与通用人工智能实现的核心力量。上下文学习能力(In-Context Learning, ICL)是 LLM 最显

    阅读全文
  • 文章封面

    博士申请 | 香港理工大学Ajay Kumar教授(IEEE Fellow)招收计算机视觉全奖博士生

    作者:PaperWeekly发布日期:2025-08-21 13:36:39

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港理工大学香港理工大学 (The Hong Kong Polytechnic

    阅读全文
  • 文章封面

    类PPO强化学习三部曲:GRPO简化→DAPO修正→GSPO全面进化

    作者:PaperWeekly发布日期:2025-08-20 13:32:00

    ©作者 | 晓研究方向 | 强化学习/智能体训练本文虽然标题中提到“类 PPO 算法”,但更准确地说,DAPO 和 GSPO 都可以视作在 GRPO 框架下,针对不同任务场景的一系列演进方案。它们并非

    阅读全文
  • 文章封面

    90.5%准确率登顶8B模型榜首,快手Klear-Reasoner破解RL训练裁剪难题

    作者:PaperWeekly发布日期:2025-08-20 13:32:00

    在大语言模型的竞争中,数学与代码推理能力已经成为最硬核的“分水岭”。从 OpenAI 最早将 RLHF 引入大模型训练,到 DeepSeek 提出 GRPO 算法,我们见证了强化学习在推理模型领域的巨

    阅读全文
  • 文章封面

    ICCV 2025满分论文!空间理解与主动探索大统一,MTU3D重塑AI具身导航范式

    作者:PaperWeekly发布日期:2025-08-20 13:32:00

    近年来,人工智能正逐步从虚拟的互联网空间(Cyber Space)迈向真实的物理世界(Physical Space)[1]。这一转变的核心挑战之一,是如何赋予智能体对三维空间的理解能力 [2],实现自

    阅读全文
  • 文章封面

    北京内推 | 清华×生数科技联合招聘音视频生成方向研究型实习生

    作者:PaperWeekly发布日期:2025-08-20 13:32:00

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!生数科技随着生成式人工智能的快速发展,多模态生成模型正引领 AI 研究与应用的

    阅读全文
  • 文章封面

    FlashCommunication V2登场!突破「任意比特」通信瓶颈,加速大模型分布式训练与部署

    作者:PaperWeekly发布日期:2025-08-19 13:48:50

    在大语言模型(LLMs)向万亿参数级演进的过程中,分布式训练与部署中的通信瓶颈已成为制约效率的核心挑战。尤其是混合专家模型(MoE)的兴起 —— 如 DeepSeekV3(671B 参数)、Kimi

    阅读全文
  • 文章封面

    CVPR 2025 | 打破壁垒!多模态统一学习新范式来了,数据、模型、代码全开源

    作者:PaperWeekly发布日期:2025-08-19 13:48:50

    我们人类生活在一个充满视觉和音频信息的世界中,近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力,衍生出了多种不同类型的任务,它们分别要求模型具备不同层面的能力。过去大量的工作主要

    阅读全文
  • 文章封面

    重温经典!十年前的视觉MoE雏形:HD-CNN用分层路由预演大模型逻辑

    作者:PaperWeekly发布日期:2025-08-19 13:48:50

    在 2015 年的计算机视觉领域顶会 ICCV 中,HD-CNN(Hierarchical Deep Convolutional Neural Networks)模型横空出世,在当时极具挑战性的 Im

    阅读全文
  • 文章封面

    博后招募 | 清华大学信息国家研究中心招收大模型/多模态/CV等方向博后/实习生

    作者:PaperWeekly发布日期:2025-08-19 13:48:50

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!清华大学信息国家研究中心清华大学北京信息科学与技术国家研究中心(简称:清华大学

    阅读全文
  • 文章封面

    LLM为什么能看懂图?秘密不在Projector,残差结构才是跨模态理解的关键

    作者:PaperWeekly发布日期:2025-08-18 13:37:13

    ©作者 | 张定坤单位 | 哈尔滨工业大学(深圳)研究方向 | 多模态大模型近年来,多模态大语言模型(Multimodal Large Language Models,MLLMs)在处理视觉-语言任务

    阅读全文
  • 文章封面

    ICCV 2025 | 告别“高分低能”!奖励模型新突破:ICT-HP让文生图更懂人类审美

    作者:PaperWeekly发布日期:2025-08-18 13:37:13

    在文本到图像生成的革命性浪潮中,我们见证了从模糊到高清,从单一到细节丰富的飞跃。然而,一个令人困惑的挑战也随之浮现:当我们生成越来越精美的图像时,现有的评估模型,例如那些基于 CLIP 或 BLIP

    阅读全文
  • 文章封面

    教会7B模型“自我思考”!腾讯RLVMR刷新智能体认知,长程任务表现直追GPT-4o

    作者:PaperWeekly发布日期:2025-08-18 13:37:13

    自主智能体(Agents)正朝着能够处理复杂长程任务(Long-Horizon Tasks)的通用智能(AGI)迈进,但许多研究者发现了一个尴尬的现实:很多智能体虽然能完成任务,却像个「只会蒙答案的学

    阅读全文
  • 文章封面

    上海/北京内推 | 上海人工智能实验室数据平台中心招聘大模型算法工程师/实习生

    作者:PaperWeekly发布日期:2025-08-18 13:37:13

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海人工智能实验室OpenDataLab(数据平台中心)专注于以数据为中心的A

    阅读全文
  • 文章封面

    论文速递 | 国防科技创新研究院-Nature子刊《自然-机器智能》:融合重建模型与传感器布局优化的双层可微学习框架

    作者:PaperWeekly发布日期:2025-08-17 22:12:36

    国防科技创新研究院姚雯研究员团队在 Nature 子刊《Nature Machine Intelligence》(自然-机器智能)发表题为“Enhancing deep learning-based

    阅读全文
  • 文章封面

    ICCV 2025 | 北大开源AR-VRM:第一人称视频驱动关键点迁移,实现机器人类比学习

    作者:PaperWeekly发布日期:2025-08-17 22:12:36

    ©PaperWeekly 原创 · 作者 | 杨德杰单位 | 北京大学王选所博士生研究方向 | Multi-Modal/VLA该论文的所有作者均来自北京大学王选计算机研究所,第一作者为博士生杨德杰,通

    阅读全文
下一页