全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    大模型推理上半场收官:单实例优化见顶,迈向低时延×长上下文

    作者:PaperWeekly发布日期:2025-08-28 22:08:34

    ©作者 | 王磊过去两年,大模型的焦点几乎都落在“如何更快、更大地训练”,而随着 Llama2、Qwen、Mistral 等开源模型的接连登场,推理优化的战场骤然升温。2023 下半年起,从算子融合、

    阅读全文
  • 文章封面

    绕过Softmax!「语义能量」替代语义熵,大模型幻觉检测迎来新突破

    作者:PaperWeekly发布日期:2025-08-28 22:08:34

    大模型饱受“幻觉”困扰。大模型有时会给出错误答案却不自知,甚至“一本正经地胡说八道”,将错误隐藏的更深。如何刻画模型回答的可靠性,成为解决大模型“幻觉”的关键。牛津大学发表在 Nature 上的语义熵

    阅读全文
  • 文章封面

    ICML 2025 | 会做题≠会思考?首个反例驱动推理基准:揭穿大模型“刷题式假象”

    作者:PaperWeekly发布日期:2025-08-28 22:08:34

    “大模型能解高数题了,但它是真的理解了数学概念,还是只背会了题库套路?”随着大语言模型(LLMs)在数学领域的应用越来越广,“模型是否真的具备数学推理能力” 成了学界热议的焦点。现在的训练模式大多让模

    阅读全文
  • 文章封面

    博士申请 | 新加坡管理大学(SMU)何盛烽团队招收计算机视觉全奖博士/博后

    作者:PaperWeekly发布日期:2025-08-28 22:08:34

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡管理大学新加坡管理大学(Singapore Management Uni

    阅读全文
  • 文章封面

    横扫GUI十大榜单!通义重磅开源Mobile-Agent-v3,多智能体协作神器登场

    作者:PaperWeekly发布日期:2025-08-27 13:07:47

    近日,通义实验室发布了 GUI-Owl 和基于 GUI-Owl 的强大多智能体协同框架 Mobile-Agent-v3。它不仅能独立完成复杂的 GUI 任务,同时可以单独负责不同的角色,如问答、描述、

    阅读全文
  • 文章封面

    直播预告 | 人大高瓴赵鑫教授:AI慢思考与大模型复杂推理

    作者:PaperWeekly发布日期:2025-08-27 13:07:47

    随着人工智能技术的不断演进,大语言模型正逐步从简单的“快思考”模式,转向更注重推理深度与逻辑连贯性的“慢思考”范式。以 DeepSeek-R1 为代表的新型大模型,通过引入强化学习机制强化长思维链推理

    阅读全文
  • 文章封面

    唯快不破!400+篇文献精炼:从Flash到MoE,大模型高效架构全景解析

    作者:PaperWeekly发布日期:2025-08-27 13:07:47

    ©作者 | 孙伟高单位 | 上海人工智能实验室近年来,大语言模型(LLMs)展现出强大的语言理解与生成能力,推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gem

    阅读全文
  • 文章封面

    北京内推 | 百度自然语言处理部招聘文心一言大模型算法实习生

    作者:PaperWeekly发布日期:2025-08-27 13:07:47

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!百度百度文心(ERNIE)团队致力于预训练大模型基础技术的研究和应用,在预训练

    阅读全文
  • 文章封面

    PPO为何稳赢Policy Gradient?答案藏在这刀“黄金剪裁”

    作者:PaperWeekly发布日期:2025-08-26 18:49:26

    ©作者 | Cheney训练老是翻车,调参像在碰运气?多数时候问题出在策略更新的“步子”迈得太大。Policy Gradient 简单直接却极易不稳,TRPO 在稳定性上更有保障,却因复杂实现难以普及

    阅读全文
  • 文章封面

    清华科技园硬核闭门局!九坤技术圆桌派:大模型Infra、训练与应用全景深聊

    作者:PaperWeekly发布日期:2025-08-26 18:49:26

    —end—

    阅读全文
  • 文章封面

    Chain-of-Agents重磅登场!通用智能体新范式横扫SOTA,模型代码数据全开源

    作者:PaperWeekly发布日期:2025-08-26 18:49:26

    近年来,以多智能体系统(MAS)为代表的研究取得了显著进展,在深度研究、编程辅助等复杂问题求解任务中展现出强大的能力。现有的多智能体框架通过多个角色明确、工具多样的智能体协作完成复杂任务,展现出明显的

    阅读全文
  • 文章封面

    深圳内推 | 腾讯WXG微信支付团队招聘大模型算法应用实习生

    作者:PaperWeekly发布日期:2025-08-26 18:49:26

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯微信事业群负责搭建和运营微信生态体系,为全球超过13亿用户提供便捷的社交生

    阅读全文
  • 文章封面

    AI岗位全面加码!蚂蚁集团2026届秋招正式启动,11城同步开放

    作者:PaperWeekly发布日期:2025-08-25 18:11:30

    蚂蚁集团 2026 届秋季校招已经启动:技术岗位占 86%,AI 方向覆盖大模型、多模态、具身智能、AI 安全等一线课题。杭州、北京、上海、深圳等 11 城同步开放。如果你正好在权衡继续深造还是进工业

    阅读全文
  • 文章封面

    挑战AR霸权!MBZUAI发布扩散语言模型全面综述:解析语言建模新范式

    作者:PaperWeekly发布日期:2025-08-25 18:11:30

    虽然以 GPT 为代表的自回归 AR 模型在文本生成领域已经占据主导地位,但 AR 模型天然存在并行度低,推理速度慢的瓶颈。近来,受到扩散模型在图像和其他连续数据上的应用的启发,扩散语言模型正在迅速发

    阅读全文
  • 文章封面

    打破15秒魔咒!StableAvatar来了:首个无限时长音频驱动人像视频生成框架

    作者:PaperWeekly发布日期:2025-08-25 18:11:30

    扩散模型的兴起极大地推动了语音驱动人类视频生成的研究。具体而言,语音驱动人类视频生成旨在基于参考图像与音频,合成面部表情与身体动作与音频高度同步的自然人像视频,在电影制作、游戏制作、虚拟现实、直播带货

    阅读全文
  • 文章封面

    博士申请 | 新加坡国立大学FoodAI组张大川教授招收人工智能全奖博士/博后/RA

    作者:PaperWeekly发布日期:2025-08-25 18:11:30

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡国立大学新加坡国立大学(National University of S

    阅读全文
  • 文章封面

    别再分开训!SFT+RL融合范式全解析:统一视角下的六大方法

    作者:PaperWeekly发布日期:2025-08-22 14:26:31

    ©作者 | 白强伟单位 | 熵基科技研究方向 | 强化学习为什么要融合SFT和RLRL 虽然能够有效提升模型的推理能力,但一个重要的前提是基础模型本身具备了一定的相关能力。在 RL 训练中,通过多次

    阅读全文
  • 文章封面

    ICCV 2025 | 换脸迈入“电影级”!小红书发布DynamicFace,统一图像视频换脸基线

    作者:PaperWeekly发布日期:2025-08-22 14:26:31

    近年来,扩散模型在图像与视频合成领域展现出前所未有的生成能力,为人脸生成与编辑技术按下了加速键。特别是一张静态人脸驱动任意表情、姿态乃至光照的梦想,正在走向大众工具箱,并在三大场景展现巨大潜力:影视行

    阅读全文
  • 文章封面

    考场高分≠临床可靠!全球首个医疗动态红队测试框架,破解医疗AI落地危机

    作者:PaperWeekly发布日期:2025-08-22 14:26:31

    导语:医疗人工智能的“双刃剑” 近年来,以大型语言模型(LLMs)为代表的人工智能技术正以前所未有的速度发展,并在医疗健康领域展现出巨大的潜力。从辅助疾病诊断到优化临床决策,LLMs 似乎正为我们描绘

    阅读全文
  • 文章封面

    北京内推 | 快手商业化算法部内循环电商模型组招聘推荐大语言模型算法实习生

    作者:PaperWeekly发布日期:2025-08-22 14:26:31

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!快手快手-商业化算法部-内循环电商模型组:基于快手的海量用户和商家数据,探索使

    阅读全文
  • 文章封面

    提分不提参!遥感图像四大SOTA trick:多模态融合、统一框架、轻量化与新范式

    作者:PaperWeekly发布日期:2025-08-21 13:36:39

    遥感图像方向的研究2025年的工作成果,太亮眼!看了60+篇论文,总结了今年下半年到明年大家发论文可以挖一挖的4个方面的创新点:多模态融合与统一框架武大港中文的多篇论文都致力于将不同类型的遥感数据(如

    阅读全文
  • 文章封面

    训练减半反超GRPO!Shuffle-R1引入动态洗牌术,突破多模态RL效率瓶颈

    作者:PaperWeekly发布日期:2025-08-21 13:36:39

    ©作者 | 朱泠皞单位 | 华中科技大学/小米公司研究方向 | 多模态大模型太长不看:我们提出了 Shuffle-R1,一个简单而高效的多模态大语言模型(MLLM)强化学习后训练框架,它通过“动态数据

    阅读全文
  • 文章封面

    ICLR 2025 | 大模型为何会“举一反三”?揭开「上下文学习」的小样本学习密码

    作者:PaperWeekly发布日期:2025-08-21 13:36:39

    近年来,大语言模型(LLM)在人工智能领域取得了突破性进展,成为推动自然语言处理技术发展与通用人工智能实现的核心力量。上下文学习能力(In-Context Learning, ICL)是 LLM 最显

    阅读全文
  • 文章封面

    博士申请 | 香港理工大学Ajay Kumar教授(IEEE Fellow)招收计算机视觉全奖博士生

    作者:PaperWeekly发布日期:2025-08-21 13:36:39

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港理工大学香港理工大学 (The Hong Kong Polytechnic

    阅读全文
  • 文章封面

    类PPO强化学习三部曲:GRPO简化→DAPO修正→GSPO全面进化

    作者:PaperWeekly发布日期:2025-08-20 13:32:00

    ©作者 | 晓研究方向 | 强化学习/智能体训练本文虽然标题中提到“类 PPO 算法”,但更准确地说,DAPO 和 GSPO 都可以视作在 GRPO 框架下,针对不同任务场景的一系列演进方案。它们并非

    阅读全文
  • 文章封面

    90.5%准确率登顶8B模型榜首,快手Klear-Reasoner破解RL训练裁剪难题

    作者:PaperWeekly发布日期:2025-08-20 13:32:00

    在大语言模型的竞争中,数学与代码推理能力已经成为最硬核的“分水岭”。从 OpenAI 最早将 RLHF 引入大模型训练,到 DeepSeek 提出 GRPO 算法,我们见证了强化学习在推理模型领域的巨

    阅读全文
  • 文章封面

    ICCV 2025满分论文!空间理解与主动探索大统一,MTU3D重塑AI具身导航范式

    作者:PaperWeekly发布日期:2025-08-20 13:32:00

    近年来,人工智能正逐步从虚拟的互联网空间(Cyber Space)迈向真实的物理世界(Physical Space)[1]。这一转变的核心挑战之一,是如何赋予智能体对三维空间的理解能力 [2],实现自

    阅读全文
  • 文章封面

    北京内推 | 清华×生数科技联合招聘音视频生成方向研究型实习生

    作者:PaperWeekly发布日期:2025-08-20 13:32:00

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!生数科技随着生成式人工智能的快速发展,多模态生成模型正引领 AI 研究与应用的

    阅读全文
  • 文章封面

    FlashCommunication V2登场!突破「任意比特」通信瓶颈,加速大模型分布式训练与部署

    作者:PaperWeekly发布日期:2025-08-19 13:48:50

    在大语言模型(LLMs)向万亿参数级演进的过程中,分布式训练与部署中的通信瓶颈已成为制约效率的核心挑战。尤其是混合专家模型(MoE)的兴起 —— 如 DeepSeekV3(671B 参数)、Kimi

    阅读全文
  • 文章封面

    CVPR 2025 | 打破壁垒!多模态统一学习新范式来了,数据、模型、代码全开源

    作者:PaperWeekly发布日期:2025-08-19 13:48:50

    我们人类生活在一个充满视觉和音频信息的世界中,近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力,衍生出了多种不同类型的任务,它们分别要求模型具备不同层面的能力。过去大量的工作主要

    阅读全文
上一页下一页