全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    ICML 2025 | 别再只拼CoT了!不完备信息下的主动推理,LLM普遍掉线

    作者:PaperWeekly发布日期:2025-09-09 13:40:57

    大语言模型(Large Language Model, LLM)在复杂推理任务中表现卓越。借助链式思维(Chain-of-Thought, CoT),LLM 能够将复杂问题分解为简单步骤,充分探索解题

    阅读全文
  • 文章封面

    科研实习 | 北京大学计算机学院潘亮铭老师课题组招收NLP/大模型方向科研实习生

    作者:PaperWeekly发布日期:2025-09-09 13:40:57

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!北京大学北京大学计算机学院潘亮铭老师课题组招收自然语言处理/大模型方向科研实习

    阅读全文
  • 文章封面

    导师放养真的会毁掉一个人……

    作者:PaperWeekly发布日期:2025-09-08 13:31:37

    最近经常收到读者的留言 : 抱怨科研真是太难了,竞争压力大,导师不给指导、不开组会,一年见不到导师几次,对于论文初稿、毕业论文毫无建议!无论什么专业的研究生,面对这样的灵魂拷问,很有可能都要陷入沉思。

    阅读全文
  • 文章封面

    Focal Loss也能无监督?北大×港中文团队用“双重不确定性优化”提升鲁棒3D感知

    作者:PaperWeekly发布日期:2025-09-08 13:31:37

    还认为 Focal Loss 只能在有监督场景使用?还在为 3D 检测模型在分布外泛化的不稳定性焦虑?来自北京大学,香港中文大学和鹏城实验室的最新研究提出了 DUO 框架(Dual Uncertain

    阅读全文
  • 文章封面

    给RL装上“防抖器”!GRPO稳化版来了:更高熵、更低KL、更稳更新

    作者:PaperWeekly发布日期:2025-09-08 13:31:37

    近年来,强化学习(RL)在大型语言模型(LLM)的微调过程中,尤其是在推理能力提升方面,取得了显著的成效。传统的强化学习方法,如近端策略优化(Proximal Policy Optimization,

    阅读全文
  • 文章封面

    深圳内推 | 腾讯音乐天琴实验室招聘音乐生成算法研究员(社招/校招)

    作者:PaperWeekly发布日期:2025-09-08 13:31:37

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯音乐腾讯音乐天琴实验室致力于对音视频相关AI方向研究,持续推出创新技术,提

    阅读全文
  • 文章封面

    透明度罕见!百川公开M2完整技术报告,强化学习新范式引发行业关注

    作者:PaperWeekly发布日期:2025-09-05 13:05:22

    近日,百川公开 1 万 6000 字的 M2 完整技术报告,几乎每一个训练过程、创新方法,以及背后的思考都毫不保留的详细阐述,这让关注大模型、后训练最前沿技术探索的从业者获得感满满。 接下来,本文将带

    阅读全文
  • 文章封面

    KDD 2025 | 图异常基础模型来了:跨域零样本、少样本微调,原型残差全拿下

    作者:PaperWeekly发布日期:2025-09-05 13:05:22

    介绍图异常检测(Graph Anomaly Detection,GAD)旨在识别与图中大多数节点不同的异常节点,近年来已受到广泛关注。现有的一般化图模型虽然在多种图任务中取得了显著成功,但在推广到 G

    阅读全文
  • 文章封面

    推理加持的排序SOTA!把“召回+相似度”写进RL,文档排序更稳更准

    作者:PaperWeekly发布日期:2025-09-05 13:05:22

    推理大模型(Large Reasoning Model)极大的促进了自然语言处理领域的发展,而信息检索领域的核心问题之一是文档排序,如何利用强大的推理大模型通过主动推理来判断文档的相关性,进而再对文档

    阅读全文
  • 文章封面

    博士申请 | 香港中文大学(深圳)游宇宁老师招收人工智能+生物医药全奖博士/实习生

    作者:PaperWeekly发布日期:2025-09-05 13:05:22

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)是一所经教育部批准,参照中外合作办学条

    阅读全文
  • 文章封面

    拜读了某大佬发表的N篇顶会,原来论文“灌水”是这么玩的

    作者:PaperWeekly发布日期:2025-09-04 12:31:56

    发不出顶会顶刊,不是因为你不够努力,而是因为你仍在沿用那套低效、耗时的传统科研模式!传统模式要求你“从0到1”搞出一个极具创新的idea,然后花大量时间去验证、实现。这种模式对于科研新手来说,失败概率

    阅读全文
  • 文章封面

    多模态大模型,真的“懂”世界吗?ICML 2025高分论文实锤核心认知盲区

    作者:PaperWeekly发布日期:2025-09-04 12:31:56

    多模态大模型(MLLM)在高层次视觉理解与推理任务上展现出惊艳能力。然而,如果你仔细观察,就会发现一个的事实:它们在一些看似简单、直观、人类幼儿都能轻松完成的任务中,却频频「翻车」。比如,「一个玩具被

    阅读全文
  • 文章封面

    听见空间!ASAudio全景综述:空间音频表示→理解→生成全链路

    作者:PaperWeekly发布日期:2025-09-04 12:31:56

    近几年,空间音频从“更高质量到音频”走向“可被理解与生成的三维声场”。它不只是把声音变“立体”,而是让系统理解声源的方位、距离、运动,并能按需生成。在 AR/VR、影视、游戏与交互内容的牵引下,研究重

    阅读全文
  • 文章封面

    北京内推 | 阿里夸克教育团队招聘推荐大模型数据算法实习生

    作者:PaperWeekly发布日期:2025-09-04 12:31:56

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队负责夸克教育多模态大模型的建设工作,有机会接触到前沿的多模态大模型

    阅读全文
  • 文章封面

    Benchmark新试炼场!从棋盘到德扑全覆盖,GAMEBoT虐测大模型推理力

    作者:PaperWeekly发布日期:2025-09-03 13:11:54

    前段时间由谷歌 Deepmind 组织的 AI 象棋大战万众瞩目,最终由出自 OpenAI 的 O3 夺冠。事实上,用策略游戏的对战来评测大模型并不是第一次被提出,被 ACL 2025 接收的论文 G

    阅读全文
  • 文章封面

    【9月9日直播】大模型复杂推理技术:如何重塑AI推理逻辑

    作者:PaperWeekly发布日期:2025-09-03 13:11:54

    随着人工智能技术的不断演进,大语言模型正逐步从简单的“快思考”模式,转向更注重推理深度与逻辑连贯性的“慢思考”范式。以 DeepSeek-R1 为代表的新型大模型,通过引入强化学习机制强化长思维链推理

    阅读全文
  • 文章封面

    原子思维上线!Agentic Deep Research再进化:推理更深、答案更准

    作者:PaperWeekly发布日期:2025-09-03 13:11:54

    尽管 LLM 的能力与日俱增,但其在复杂任务上的表现仍受限于静态的内部知识。为从根本上解决这一限制,突破 AI 能力界限,业界研究者们提出了 Agentic Deep Research 系统,在该系统

    阅读全文
  • 文章封面

    北京/苏州内推 | 微软亚太研发集团招聘AI智能预测实习生

    作者:PaperWeekly发布日期:2025-09-03 13:11:54

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软微软亚太研发集团成立于2006年1月18日,是微软在美国之外职能最完备的研

    阅读全文
  • 文章封面

    ICML 2025 | 从联合空间到文本空间:测试时增强跨模态检索新范式

    作者:PaperWeekly发布日期:2025-09-02 14:17:04

    本文第一作者为丁国峰,四川大学计算机学院 2024 级硕士研究生。研究方向为多模态检索、多模态理解,指导老师为彭玺教授。论文标题:Visual Abstraction: A Plug-and-Play

    阅读全文
  • 文章封面

    经典机械物理模型 × 深度学习:揭开神经网络特征学习的秘密

    作者:PaperWeekly发布日期:2025-09-02 14:17:04

    深度神经网络之所以卓越,在于它能逐层提炼数据特征,把复杂的高维信息逐渐“压缩”为规整的低维几何结构。但这种学习过程究竟如何由非线性、噪声、学习率等多重因素共同涌现,长期缺乏直观统一的解释。近日,巴塞尔

    阅读全文
  • 文章封面

    ACM MM Asia火热征稿中!低年级PhD友好,不卷SOTA只看新意

    作者:PaperWeekly发布日期:2025-09-02 14:17:04

    还在为跑不过别人的模型而头疼吗?ACM MM Asia(CCF-C)的 #BraveNewIdeas (BNI) Track 就是为你准备的! 会议时间:2025 年 12月 9 日到 12 月 12

    阅读全文
  • 文章封面

    博士申请 | 北京大学计算机学院-中国电信招收计算机视觉方向联培博士生

    作者:PaperWeekly发布日期:2025-09-02 14:17:04

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!北京大学北京大学计算机学院涵盖了国内计算机专业最全面的研究方向。在计算机理论、

    阅读全文
  • 文章封面

    GRPO偷偷优化Pass@K?从0-1奖励到无偏策略,DeepMind揭示全面解法

    作者:PaperWeekly发布日期:2025-09-01 23:10:18

    ©作者 | 白强伟单位 | 熵基科技研究方向 | 强化学习在大语言模型推理与强化学习研究中,如何直接优化 Pass@K 指标一直是核心挑战。来自 Google DeepMind 的作者团队在他们的最新

    阅读全文
  • 文章封面

    让图像会说话!视觉Token注入CLIP语义,TokLIP重塑多模态理解与生成

    作者:PaperWeekly发布日期:2025-09-01 23:10:18

    腾讯 ARC Lab 联合中科院自动化所、香港城市大学、浙江大学等机构提出 TokLIP,在视觉 token 与统一多模态理解生成之间,架起了一座语义桥梁,训练数据量仅需同类方法的 20%,还可以在图

    阅读全文
  • 文章封面

    EMNLP 2025|人声解耦×伴奏对齐!浙大VersBand打造提示可控的歌曲生成框架

    作者:PaperWeekly发布日期:2025-09-01 23:10:18

    ©作者 | 张彧单位 | 浙江大学研究方向 | 音乐/空间音频歌曲生成的核心是基于各种提示生成可控的高质量歌曲。然而,现有方法难以生成具有提示控制的人声和伴奏,且不能实现两者间很好的对齐。此外,它们在

    阅读全文
  • 文章封面

    北京内推 | 联想研究院AI Lab招聘大模型算法实习生

    作者:PaperWeekly发布日期:2025-09-01 23:10:18

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!联想研究院团队专注于自研时序预测基础模型、预测智能体、时序推理模型与因果分析等

    阅读全文
  • 文章封面

    性能超越GPT-5,成本减30%!大模型装上智能路由,Avengers-Pro刷新性价比极限

    作者:PaperWeekly发布日期:2025-08-31 23:55:07

    近期,OpenAI 通过推出 GPT-5 打响了大模型降本增效的第一枪:在多个挑战性数据集上创下新高的同时,相比 Gemini 和 Claude 大幅降低了使用成本。为此,GPT-5 首次引入多模型路

    阅读全文
  • 文章封面

    EMNLP 2025 | 看图就越狱!视觉上下文攻击:“图像语境”一招撬开多模态大模型

    作者:PaperWeekly发布日期:2025-08-31 23:55:07

    论文题目:Visual Contextual Attack: Jailbreaking MLLMs with Image-Driven Context Injection论文机构:Shanghai A

    阅读全文
  • 文章封面

    动态压缩CoT!浙大×蚂蚁发布LightThinker,让模型推理“轻起来”

    作者:PaperWeekly发布日期:2025-08-31 23:55:07

    随着 AI 技术的飞速发展,从「快思考」到 「慢思考」,大语言模型(LLMs)在处理复杂推理任务上展现出惊人的能力。无论是我们熟知的思维链(CoT),还是更复杂的深度思考模式(Thinking),都让

    阅读全文
  • 文章封面

    北京内推 | 微软DKI大模型团队招聘大模型/Agent/广告推荐方向研究型实习生

    作者:PaperWeekly发布日期:2025-08-31 23:55:07

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软微软DKI (data knowledge intelligence) 大

    阅读全文
上一页下一页