PaperWeekly

双十一算力真敢卷！RTX 5090低至0.69元/时，同预算跑更多实验
作者：PaperWeekly发布日期：2025-11-12 18:11:14
十一月了，大家的论文实验跑得怎么样？模型、数据、参数调了一轮又一轮，最怕的还是算力不够用——卡难抢、节点不稳、训练一断就得重跑。过去一年，GPU 租赁价格的下行速度几乎和模型迭代一样快。A800 的租
阅读全文
AAAI 2026 | 悉尼科技大学 × 港理工推出 FedVLR：让联邦推荐也能“懂图文”
作者：PaperWeekly发布日期：2025-11-12 18:11:14
在推荐系统中，同时利用图像和文本信息来理解物品早已不是新鲜事。但如果场景换成联邦学习，即所有用户数据都必须保留在本地设备上，我们该如何高效地融合这些多模态信息，并为每个用户提供个性化的服务呢？这是一个
阅读全文
北京内推 | 阿里高德地图团队招聘大模型方向算法实习生（可长期/转正）
作者：PaperWeekly发布日期：2025-11-12 18:11:14
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！阿里巴巴团队聚焦大模型与高德核心业务的深度融合。围绕用户出行、搜索、导航、PO
阅读全文
全模态到底是不是“1+1＞2”？美团UNO-Bench揭示单模态与全模态能力的组合规律
作者：PaperWeekly发布日期：2025-11-11 13:33:22
全模态协同究竟是确实存在的能力交互，还是一种看上去更像自然叠加的错觉？UNO-Bench 的意义不在于新增一个榜单，而是第一次把这个争论多年的问题，转成了可以被量化检验的对象。过去两年，多模态模型的对
阅读全文
通往AGI的歧路：上海AI Lab重磅发现，自进化智能体可能“错误进化
作者：PaperWeekly发布日期：2025-11-11 13:33:22
我们正处在一个激动人心的时代：能够自我学习、自我迭代的“自进化智能体”（Self-evolving Agent）正从科幻走向现实。它们能自主总结经验、迭代工具、优化工作流，展现出通往通用人工智能（AG
阅读全文
北京内推 | 百度文心一言基座团队模型组招聘大模型方向研究型实习生
作者：PaperWeekly发布日期：2025-11-11 13:33:22
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！百度百度文心（ERNIE）团队致力于预训练大模型基础技术的研究和应用，在预训练
阅读全文
过去五年，BERT都在被“过度训练”？LeCun团队给出Encoder算力最优范式
作者：PaperWeekly发布日期：2025-11-10 17:33:37
这篇来自 Yann LeCun 团队（FAIR × NYU）的 EMNLP 2025 论文做了一件简单但惊人到颠覆经验的事：Encoder 的最佳训练规律，和我们过去五年默认采用的经验——根本不是一回
阅读全文
EMNLP 2025 | 别再只看KV了！LLM越深越稀疏：UNCOMP用矩阵熵给出答案
作者：PaperWeekly发布日期：2025-11-10 17:33:37
©作者 | 熊璟单位 | 香港大学博士生研究方向 | 大语言模型推理我们都知道 LLM 中存在结构化稀疏性，但其底层机制一直缺乏统一的理论解释。为什么模型越深，稀疏性越明显？为什么会出现所谓的“检索头
阅读全文
北京内推 | 腾讯AI Lab招聘大模型/多模态大模型方向研究型实习生
作者：PaperWeekly发布日期：2025-11-10 17:33:37
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！腾讯AI Lab我们正在探索下一代大型语言模型（LLM）与全模态模型的未来，致
阅读全文
上交大刘鹏飞团队：Context Engineering进入2.0，上下文成为可操作对象
作者：PaperWeekly发布日期：2025-11-07 14:01:26
我们早已习惯在提示词、记忆窗口、外部检索器之间调参，以期让模型理解更多上下文。可在上海交大刘鹏飞团队的最新论文中，上下文工程不再是工程师堆 token 的技巧，而是一个可被形式化的科学对象。他们称之为
阅读全文
工程&计算机领域前沿洞察 | Synthesis技术前沿报告合集
作者：PaperWeekly发布日期：2025-11-07 14:01:26
随着技术与计算机科学等领域的迅猛发展，新研究层出不穷，在快速出版与内容深度之间取得平衡，成为学术图书面临的新挑战。数字化出版加快了修订节奏，使新成果得以及时纳入，而“小型图书”则提供了另一种解决方案，
阅读全文
自回归不必按token算了：微信AI × 清华用CALM直接「整段」预测
作者：PaperWeekly发布日期：2025-11-06 14:12:38
我们默认了两件事很久：语言模型应该逐 token 生成；加速只能靠算力。CALM 的关键在于——它质疑的是这两件事本身。在当前主流语言模型里，时间成本的基本单位是下一 token。这是一个我们长期习以
阅读全文
达摩院联合浙大、港理工推出PixelRefer：多模态大模型迈向像素级视觉理解
作者：PaperWeekly发布日期：2025-11-06 14:12:38
当前 MLLM 擅长全局场景级理解与推理，在像素级细粒度视觉理解任务上仍表现薄弱。视觉语言理解已从整体场景级认知，迈向更细粒度的像素级目标级推理。然而，当下的研究工作多局限于单个物体的描述，难以深入理
阅读全文
北京内推 | 美团招聘大模型算法实习生（IM全渠道）
作者：PaperWeekly发布日期：2025-11-06 14:12:38
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！美团美团的使命是“帮大家吃得更好，生活更好”，公司聚焦“零售 + 科技”战略，
阅读全文
别被一堆Strong Accept吓住：德州农工×康奈尔实锤论文晒分“系统性虚高”
作者：PaperWeekly发布日期：2025-11-05 20:33:17
知乎/小红书上动不动就是 Strong Accept，但这并不是“学术界真实分布”。德州农工×康奈尔用跨平台数据实证：网上晒出来的分数，是被幸存者、抱怨者、边缘者三重力量系统性抬高的。别被那些截图刺到
阅读全文
记忆让机器人更聪明：原力灵机提出MemoryVLA化解长时程任务操作难题
作者：PaperWeekly发布日期：2025-11-05 20:33:17
让机器人拥有“记忆”，是实现长时程任务的关键突破。然而，现有视觉-语言-动作（VLA）模型普遍存在“金鱼记忆”的局限——仅依赖当前瞬间的感知，缺乏对历史状态的建模，导致在需要判断“按钮是否已按下”这类
阅读全文
博士申请 | 南洋理工大学王琦琛老师课题组招收数据库方向全奖博士/博后
作者：PaperWeekly发布日期：2025-11-05 20:33:17
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！南洋理工大学新加坡南洋理工大学是一所科研密集型大学，凭借科学与工程领域的坚实基
阅读全文
全注意力、复杂推理不掉速：MiniMax M2把Agent做成了「可执行能力」
作者：PaperWeekly发布日期：2025-11-04 13:20:55
MiniMax M2 发布这几天，最被聚焦的讨论并不在榜单截图，而是那个更关键的问题：Full Attention 到底能不能撑得住多跳 reasoning？M2 给出的结果，是“撑住了”。这一细节点
阅读全文
NeurIPS 2025 | 用蛋白质动态词表“搭积木”，ProDVa高效组装可折叠新蛋白
作者：PaperWeekly发布日期：2025-11-04 13:20:55
基于功能的蛋白质设计任务（function-guided protein design）旨在根据功能描述或关键词，生成符合的蛋白质序列。其核心挑战在于，如何确保从蛋白质序列庞大空间中设计的序列既满足给
阅读全文
北京内推 | 阿里通义实验室对话智能团队招聘大模型方向研究型实习生
作者：PaperWeekly发布日期：2025-11-04 13:20:55
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！阿里巴巴阿里巴巴通义实验室，主要负责通义系列大模型研究与产品落地。其中对话智能
阅读全文
Karpathy点赞NUS新研究：RL微调不稳定的关键根源，指向BF16精度本身
作者：PaperWeekly发布日期：2025-11-03 21:31:49
RL 微调训练时一切正常，为什么一上线就像换了个模型？这篇被 Andrej Karpathy 点赞的 NUS 研究给出一个极其反直觉的答案：不是模型退化，是你用的 BF16 在悄悄放大误差。这个现象不
阅读全文
ICCV 2025 | 高德提出SeqGrowGraph：以序列化图扩展革新车道拓扑生成
作者：PaperWeekly发布日期：2025-11-03 21:31:49
©作者 | 曾爽单位 | 西安交通大学硕士研究方向 | 具身智能、自动驾驶摘要精确的车道级拓扑图是高级别自动驾驶系统的关键基石，它为车辆的全局路径规划和决策提供了结构化信息。然而，现有方法在处理现实世
阅读全文
当强化学习学会“跳步骤”：Sergey Levine团队重写值函数的递归逻辑
作者：PaperWeekly发布日期：2025-11-01 23:30:28
强化学习似乎注定要沿时间一层层回传。但 Sergey Levine 团队发现，值函数并不需要回到过去——它可以被“对半合成”。Transitive RL 让强化学习第一次跳出了时间的诅咒。在强化学习中
阅读全文
不用教它撒谎，LLM也会“心口不一”：上海AI Lab揭露高风险下的模型欺骗行为
作者：PaperWeekly发布日期：2025-11-01 23:30:28
引言当你向 AI 咨询健康问题或寻求建议时，是否想过——它可能正在“违背本心”地欺骗你？最近一项由上海人工智能实验，复旦大学，中科大和上海交通大学联合发布的一项新研究揭示了一个隐蔽而危险的真相：一个看
阅读全文
北京内推 | 快手模型与应用部增长模型团队招聘大模型/推荐方向算法实习生
作者：PaperWeekly发布日期：2025-11-01 23:30:28
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！快手我们是「快手模型与应用部-营收模型中心-增长模型团队」，致力于通过前沿算法
阅读全文
让机器人靠想象变强！清华陈建宇×斯坦福Chelsea团队破解世界模型难题，推出Ctrl-World
作者：PaperWeekly发布日期：2025-10-31 14:01:26
当世界模型不再只是“预测视频”，而能真正理解并控制物理世界，机器人就能在虚拟空间中完成评估、优化与自我迭代。清华陈建宇团队 × 斯坦福 Chelsea Finn 课题组联合推出 Ctrl-World，
阅读全文
不用重训，不丢语义！UniLIP无损升级CLIP：一键通关重建、生成与编辑
作者：PaperWeekly发布日期：2025-10-31 14:01:26
©作者 | 汤昊单位 | 北京大学博士研究方向 | 统一多模态理解和生成研究动机统一的多模态模型需要视觉表征同时具备用于理解的丰富语义和用于生成/编辑的精细细节。像 VAE 这样的早期方法，因其特征缺
阅读全文
北京内推 | AMD大模型压缩团队招聘LLM压缩算法/推理加速算法实习生
作者：PaperWeekly发布日期：2025-10-31 14:01:26
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！AMDAMD 是高性能与自适应计算领域的领先企业，致力于提供优质的产品和服务，
阅读全文
你的输入，LLM一字未忘：Transformer被证明“几乎处处可逆”
作者：PaperWeekly发布日期：2025-10-30 13:55:40
人们一直以为，大模型的隐藏状态是抽象的“语义压缩”。但这篇论文发现，Transformer 并没有丢掉任何输入信息——它能凭隐藏状态精确反演出你说的每一个字。我们一直以为，语言模型的隐藏状态是对输入的
阅读全文
想去的地方、想同框的人，都能“在一起”：WithAnyone多人可控合照来了
作者：PaperWeekly发布日期：2025-10-30 13:55:40
AI 合照终于不再像贴纸了 🔥 这次，它真的能“在一起”了。过去的人脸参考生成，要么“不像”，要么“太像”。一张图里的人物，表情僵硬、眼神复制、姿势割裂—— 明明是“合照”，却像几张贴纸凑在一起
阅读全文