全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    北京/上海内推 | 阶跃星辰招聘RL for AIGC方向算法研究员/实习生

    作者:PaperWeekly发布日期:2025-10-10 13:16:59

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阶跃星辰阶跃星辰是行业领先的通用大模型创业公司,坚定探索实现通用人工智能的道路

    阅读全文
  • 文章封面

    马毅团队重磅发布新书:从MCR²到白盒Transformer,重构深度学习的第一性原理

    作者:PaperWeekly发布日期:2025-10-09 23:48:39

    在神经网络无处不在的今天,我们似乎已经习惯了“深度学习就是堆结构、调参数”的经验主义时代。但在这一切的背后,一个根本问题始终没有被系统回答——深度网络究竟在学什么?为什么它们能从数据中生长出强大的表征

    阅读全文
  • 文章封面

    腾讯推出TRM:让大模型像人类一样批判性思考,从文本依赖到事实正确

    作者:PaperWeekly发布日期:2025-10-09 23:48:39

    最近,腾讯 WXG 推出了思维监督奖励模型Thinking-supervised Reward Model (TRM),旨在提升大语言模型(LLM)在开放域问答任务中的事实正确性。TRM 通过引入忠实

    阅读全文
  • 文章封面

    稳住训练、跑出泛化:STAGE重写「自回归图像生成」的强化学习范式

    作者:PaperWeekly发布日期:2025-10-09 23:48:39

    在扩散模型一家独大的时代,自回归文生图的潜力正被重新挖掘——它拥有更强的离散表征能力,却也更容易在强化学习阶段“失稳”。STAGE 在自回归(Autoregressive, AR)文生图模型上首次实现

    阅读全文
  • 文章封面

    无RLHF,7M小模型反超DeepSeek-R1:三星团队用递归思考取代规模堆叠

    作者:PaperWeekly发布日期:2025-10-08 23:34:27

    在所有人都以为智能等同于规模的时代,三星研究团队用一个仅 7M 参数的微型神经网络,递归式地“先提答案、再反思改进”,在复杂推理基准 ARC-AGI 上击败了包括 DeepSeek-R1、Gemini

    阅读全文
  • 文章封面

    告别梯度!Evolution Strategies全参微调挑战PPO/GRPO:更稳、更省、更好复现

    作者:PaperWeekly发布日期:2025-10-07 19:03:35

    过去两年里,“后训练=RL”的观念几乎成了行业默认。很多团队把 PPO、GRPO 写进了自己的 Pipeline,并习惯性地在动作空间里做探索与优化。这篇论文则把镜头拉回到参数空间:作者将 Evolu

    阅读全文
  • 文章封面

    NeurIPS 2025 | 北邮用“图+文”把人物检索拉满:自动合成数据 × 细粒度特征对齐

    作者:PaperWeekly发布日期:2025-10-07 19:03:35

    在智能安防、失踪人口查找、公共场所人员溯源等实际场景中,我们往往需要结合「目标人物参考照片」和「文字描述」定位具体个体——比如用失踪者过往生活照,搭配“近期穿灰色连帽卫衣、戴黑色边框眼镜”的实时描述展

    阅读全文
  • 文章封面

    自进化Agent的第三种可能:隐式记忆,不动模型参数,胜过GRPO

    作者:PaperWeekly发布日期:2025-10-06 20:04:18

    当前,由大型语言模型(LLM)驱动的智能体(Agent)正引领着人工智能领域的变革。然而,智能体的记忆机制——无论是强制调整模型参数的“参数化记忆(Parametric Memory)”,还是将经验外

    阅读全文
  • 文章封面

    真实数据、全链路、可复核:GenoMAS打造更可信的基因分析智能体

    作者:PaperWeekly发布日期:2025-10-06 20:04:18

    在科学研究越来越依靠标准化精密计算手段的今天,用智能体技术来自动化加速科研的潜力让人心潮澎湃。但在现实使用中,无论是 Cursor 还是 Codex,这类智能体多作为辅助工具存在:每推进几步,仍需人工

    阅读全文
  • 文章封面

    LSTM之父再出手!xLSTM挑战Transformer:一场关于Scaling Laws的正面交锋

    作者:PaperWeekly发布日期:2025-10-05 20:11:50

    近三十年前,Sepp Hochreiter 与 Jürgen Schmidhuber 提出 LSTM,彻底改变了序列建模的走向。如今,Hochreiter 团队将目光投向大模型时代最关键的问题——Sc

    阅读全文
  • 文章封面

    NeurIPS 2025 | AI也能做数学建模?本科生携手MM-Agent勇夺美赛全球前2%

    作者:PaperWeekly发布日期:2025-10-05 20:11:50

    数学建模,是科学问题从“复杂现实”走向“可计算抽象”的桥梁。它需要严密的逻辑、深厚的知识与大量的推理——这正是人类智慧的堡垒。而如今,来自香港科技大学(广州)的研究团队用 MM-Agent 敲开了这道

    阅读全文
  • 文章封面

    “移步换景”一试,大模型全乱了:OST-Bench揭示MLLM时空推理短板

    作者:PaperWeekly发布日期:2025-10-05 20:11:50

    多模态大语言模型(MLLMs)已在视觉与语言模态融合的感知与推理任务中展现出强大能力。而上海人工智能实验室提出的的 OST-Bench,则是从智能体探索场景的动态在线视角出发,为大模型的能力提出了新的

    阅读全文
  • 文章封面

    LoRA到底能否媲美全参?Thinking Machines用实验曲线划出「无悔区」

    作者:PaperWeekly发布日期:2025-09-30 14:02:59

    打平全参,还是效率掉队?这是围绕 LoRA 最大的争议。Thinking Machines 团队通过系统化实验与工程级配方,首次证明:在后训练的典型规模下,LoRA 并不是玄学调参,而是能被科学刻画、

    阅读全文
  • 文章封面

    把“俄罗斯方块”搬进设计室:物竞天择让振动微型机器人进化得越跑越快

    作者:PaperWeekly发布日期:2025-09-30 14:02:59

    “玛娜生态,末日废土,跑得最快的噬极兽。”在《灵笼》的世界里,谁更适应环境,谁就活下来——“跑得最快”的物种在废土中率先突围。现在,科学家把这条自然法则搬进现实的设计室:把俄罗斯方块当作可拼接的“器官

    阅读全文
  • 文章封面

    榜一换人!OCRBench v2九月新榜:揭示多模态大模型文档智能真实水平

    作者:PaperWeekly发布日期:2025-09-30 14:02:59

    现有多模态大模型(LMMs)在复杂多样的 OCR 任务中表现如何?华中科技大学、华南理工大学、阿德莱德大学和字节跳动联合推出新一代 OCR 评测基准 OCRBench v2,并发布最新私有数据榜单(2

    阅读全文
  • 文章封面

    4B逼近DeepSeek-R1!Bengio团队「递归聚合」刷新小模型上限

    作者:PaperWeekly发布日期:2025-09-29 14:30:49

    当“并行分叉”和“逐步自省”不再互斥,Recursive Self-Aggregation(RSA)像一台“思维基因重组机”,把多条推理链里的正确片段拼成更强的解题方案——甚至让 Qwen3-4B 这

    阅读全文
  • 文章封面

    KDD 2025 | 看不见也能控:用“基混杂向量”打穿分布移位,交通预测稳了

    作者:PaperWeekly发布日期:2025-09-29 14:30:49

    北京航空航天大学联合香港大学提出了基于因果建模的时空基向量表征模型,首次将后门调整原理扩展到连续与未知混杂因子,通过构建基混杂库、自监督任务增强表示,并结合因果解耦机制,实现了在复杂城市场景下更准确、

    阅读全文
  • 文章封面

    北京内推 | 快手可灵AI技术部招聘视频生成/数字人方向算法实习生

    作者:PaperWeekly发布日期:2025-09-29 14:30:49

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!快手可灵AI技术部负责生成式AI模型的研发和应用,构建超大规模 AI 基础设施

    阅读全文
  • 文章封面

    8GB显卡的逆袭!SSD换显存,3060 Ti硬跑100k长上下文

    作者:PaperWeekly发布日期:2025-09-28 13:34:35

    在大模型推理的世界里,有一个残酷的现实:上下文越长,钱包越痛。你想在 10 万 tokens 的文档里挖掘知识?对不起,先准备一张几十 GB 显存的高端 GPU,再外加一台服务器的预算。长上下文能力明

    阅读全文
  • 文章封面

    NeurIPS 2025 | 我奶奶都能复现?条件表征学习:矩阵一乘,表征立马“对齐”!

    作者:PaperWeekly发布日期:2025-09-28 13:34:35

    还在为表征学习只看见“表面信息”而头疼吗?在电商、搜索、检索等实际场景中,我们往往需要的不仅仅是“这是大象”,而是包括环境、颜色、材质、场合在内的多维信息。但传统方法往往只能给出单一标签。本文提出的条

    阅读全文
  • 文章封面

    北京/杭州内推 | 阿里通义实验室招聘多模态大模型与智能体方向算法实习生

    作者:PaperWeekly发布日期:2025-09-28 13:34:35

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴通义实验室致力于AIGC、大模型基础研究和行业应用探索,在视觉、语音、

    阅读全文
  • 文章封面

    普林斯顿陈丹琦组新作:RLHF难支撑,RLVR有边界?RLMT开辟第三条路

    作者:PaperWeekly发布日期:2025-09-26 17:34:56

    在大语言模型的进化史上,RLHF(Reinforcement Learning with Human Feedback)无疑是最具里程碑意义的范式之一:它让模型从“机械对话机”蜕变为“人类偏好的镜子”

    阅读全文
  • 文章封面

    128k死穴被击穿!Amazon爆改长上下文:段内压缩快4×,推理不掉点还更准

    作者:PaperWeekly发布日期:2025-09-26 17:34:56

    在大模型的发展历史上,「上下文长度」一直是横亘在研究和应用之间的最大鸿沟之一。无论是百万行代码的全局理解,还是上百页文档的精确问答,当输入序列超过数万 token,现有 LLM 都会遭遇同样的困境:计

    阅读全文
  • 文章封面

    博士申请 | 香港中文大学(深圳)冀晓强老师课题组招收人工智能全奖博士/硕士

    作者:PaperWeekly发布日期:2025-09-26 17:34:56

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)理工学院成立于2015年,秉承香港中文

    阅读全文
  • 文章封面

    KV缓存不再爆!清华姚期智团队重写注意力维度,长上下文更省更强 | NeurIPS 2025 Spotlight

    作者:PaperWeekly发布日期:2025-09-25 22:20:44

    在大模型的世界里,人们早就习惯了“硬件思维”:显存不够就多加卡,推理太慢就多堆 GPU。长上下文问题因此被视为一场“军备竞赛”——谁能烧更多算力,谁就能撑更长的输入。 但清华大学姚期智团队给出的答案却

    阅读全文
  • 文章封面

    78条打穿1万条!上交大新范式告诉你:智能体训练靠“质”,不是靠“量”

    作者:PaperWeekly发布日期:2025-09-25 22:20:44

    在大模型圈,有一个几乎铁律般的直觉:更多数据,就意味着更强的能力。无论是预训练还是指令微调,大家的共识都是“量就是一切”。但这次,来自上海交大等机构的一篇论文却把这条规律颠覆了。 研究团队提出了一个名

    阅读全文
  • 文章封面

    北京内推 | 中科院软件所数据科学研究中心招聘大语言模型算法实习生

    作者:PaperWeekly发布日期:2025-09-25 22:20:44

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!中科院软件所中国科学院软件研究所是一所致力于计算机科学理论和软件高新技术的研究

    阅读全文
  • 文章封面

    RL不再撒胡椒面!港科大 × 清华新作:只盯“规划token”,大模型推理力狂飙

    作者:PaperWeekly发布日期:2025-09-24 23:12:32

    在大模型推理力的进化史上,总有一些让人百思不得其解的“谜之现象”:模型为何会突然迎来 Aha 时刻,像是顿悟般智力飞升?为什么思维链越长,准确率反而更高?为什么训练中的熵曲线与性能关系如此扑朔迷离?港

    阅读全文
  • 文章封面

    NeurIPS 2025 | 甩掉文本CoT!FSDrive开启时空思维链,自动驾驶迈入视觉推理时代

    作者:PaperWeekly发布日期:2025-09-24 23:12:32

    引言视觉语言动作模型(VLA)凭借其强大的通用知识与推理能力,正成为推动自动驾驶技术发展的关键力量。然而,当前主流方法在进行决策时,大多依赖于一种“文本式”的思维链(Chain-of-Thought,

    阅读全文
  • 文章封面

    博士申请 | 加拿大麦吉尔大学智能自动化实验室招收大模型/强化学习方向全奖博士生

    作者:PaperWeekly发布日期:2025-09-24 23:12:32

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!麦吉尔大学麦吉尔大学始建于1821年,为加拿大第一所大学,坐落于加拿大魁北克省

    阅读全文
上一页下一页