PaperWeekly

真实数据、全链路、可复核：GenoMAS打造更可信的基因分析智能体
作者：PaperWeekly发布日期：2025-10-06 20:04:18
在科学研究越来越依靠标准化精密计算手段的今天，用智能体技术来自动化加速科研的潜力让人心潮澎湃。但在现实使用中，无论是 Cursor 还是 Codex，这类智能体多作为辅助工具存在：每推进几步，仍需人工
阅读全文
LSTM之父再出手！xLSTM挑战Transformer：一场关于Scaling Laws的正面交锋
作者：PaperWeekly发布日期：2025-10-05 20:11:50
近三十年前，Sepp Hochreiter 与 Jürgen Schmidhuber 提出 LSTM，彻底改变了序列建模的走向。如今，Hochreiter 团队将目光投向大模型时代最关键的问题——Sc
阅读全文
NeurIPS 2025 | AI也能做数学建模？本科生携手MM-Agent勇夺美赛全球前2%
作者：PaperWeekly发布日期：2025-10-05 20:11:50
数学建模，是科学问题从“复杂现实”走向“可计算抽象”的桥梁。它需要严密的逻辑、深厚的知识与大量的推理——这正是人类智慧的堡垒。而如今，来自香港科技大学（广州）的研究团队用 MM-Agent 敲开了这道
阅读全文
“移步换景”一试，大模型全乱了：OST-Bench揭示MLLM时空推理短板
作者：PaperWeekly发布日期：2025-10-05 20:11:50
多模态大语言模型（MLLMs）已在视觉与语言模态融合的感知与推理任务中展现出强大能力。而上海人工智能实验室提出的的 OST-Bench，则是从智能体探索场景的动态在线视角出发，为大模型的能力提出了新的
阅读全文
LoRA到底能否媲美全参？Thinking Machines用实验曲线划出「无悔区」
作者：PaperWeekly发布日期：2025-09-30 14:02:59
打平全参，还是效率掉队？这是围绕 LoRA 最大的争议。Thinking Machines 团队通过系统化实验与工程级配方，首次证明：在后训练的典型规模下，LoRA 并不是玄学调参，而是能被科学刻画、
阅读全文
把“俄罗斯方块”搬进设计室：物竞天择让振动微型机器人进化得越跑越快
作者：PaperWeekly发布日期：2025-09-30 14:02:59
“玛娜生态，末日废土，跑得最快的噬极兽。”在《灵笼》的世界里，谁更适应环境，谁就活下来——“跑得最快”的物种在废土中率先突围。现在，科学家把这条自然法则搬进现实的设计室：把俄罗斯方块当作可拼接的“器官
阅读全文
榜一换人！OCRBench v2九月新榜：揭示多模态大模型文档智能真实水平
作者：PaperWeekly发布日期：2025-09-30 14:02:59
现有多模态大模型（LMMs）在复杂多样的 OCR 任务中表现如何？华中科技大学、华南理工大学、阿德莱德大学和字节跳动联合推出新一代 OCR 评测基准 OCRBench v2，并发布最新私有数据榜单（2
阅读全文
4B逼近DeepSeek-R1！Bengio团队「递归聚合」刷新小模型上限
作者：PaperWeekly发布日期：2025-09-29 14:30:49
当“并行分叉”和“逐步自省”不再互斥，Recursive Self-Aggregation（RSA）像一台“思维基因重组机”，把多条推理链里的正确片段拼成更强的解题方案——甚至让 Qwen3-4B 这
阅读全文
KDD 2025 | 看不见也能控：用“基混杂向量”打穿分布移位，交通预测稳了
作者：PaperWeekly发布日期：2025-09-29 14:30:49
北京航空航天大学联合香港大学提出了基于因果建模的时空基向量表征模型，首次将后门调整原理扩展到连续与未知混杂因子，通过构建基混杂库、自监督任务增强表示，并结合因果解耦机制，实现了在复杂城市场景下更准确、
阅读全文
北京内推 | 快手可灵AI技术部招聘视频生成/数字人方向算法实习生
作者：PaperWeekly发布日期：2025-09-29 14:30:49
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！快手可灵AI技术部负责生成式AI模型的研发和应用，构建超大规模 AI 基础设施
阅读全文
8GB显卡的逆袭！SSD换显存，3060 Ti硬跑100k长上下文
作者：PaperWeekly发布日期：2025-09-28 13:34:35
在大模型推理的世界里，有一个残酷的现实：上下文越长，钱包越痛。你想在 10 万 tokens 的文档里挖掘知识？对不起，先准备一张几十 GB 显存的高端 GPU，再外加一台服务器的预算。长上下文能力明
阅读全文
NeurIPS 2025 | 我奶奶都能复现？条件表征学习：矩阵一乘，表征立马“对齐”！
作者：PaperWeekly发布日期：2025-09-28 13:34:35
还在为表征学习只看见“表面信息”而头疼吗？在电商、搜索、检索等实际场景中，我们往往需要的不仅仅是“这是大象”，而是包括环境、颜色、材质、场合在内的多维信息。但传统方法往往只能给出单一标签。本文提出的条
阅读全文
北京/杭州内推 | 阿里通义实验室招聘多模态大模型与智能体方向算法实习生
作者：PaperWeekly发布日期：2025-09-28 13:34:35
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！阿里巴巴通义实验室致力于AIGC、大模型基础研究和行业应用探索，在视觉、语音、
阅读全文
普林斯顿陈丹琦组新作：RLHF难支撑，RLVR有边界？RLMT开辟第三条路
作者：PaperWeekly发布日期：2025-09-26 17:34:56
在大语言模型的进化史上，RLHF（Reinforcement Learning with Human Feedback）无疑是最具里程碑意义的范式之一：它让模型从“机械对话机”蜕变为“人类偏好的镜子”
阅读全文
128k死穴被击穿！Amazon爆改长上下文：段内压缩快4×，推理不掉点还更准
作者：PaperWeekly发布日期：2025-09-26 17:34:56
在大模型的发展历史上，「上下文长度」一直是横亘在研究和应用之间的最大鸿沟之一。无论是百万行代码的全局理解，还是上百页文档的精确问答，当输入序列超过数万 token，现有 LLM 都会遭遇同样的困境：计
阅读全文
博士申请 | 香港中文大学（深圳）冀晓强老师课题组招收人工智能全奖博士/硕士
作者：PaperWeekly发布日期：2025-09-26 17:34:56
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港中文大学（深圳）香港中文大学（深圳）理工学院成立于2015年，秉承香港中文
阅读全文
KV缓存不再爆！清华姚期智团队重写注意力维度，长上下文更省更强 | NeurIPS 2025 Spotlight
作者：PaperWeekly发布日期：2025-09-25 22:20:44
在大模型的世界里，人们早就习惯了“硬件思维”：显存不够就多加卡，推理太慢就多堆 GPU。长上下文问题因此被视为一场“军备竞赛”——谁能烧更多算力，谁就能撑更长的输入。但清华大学姚期智团队给出的答案却
阅读全文
78条打穿1万条！上交大新范式告诉你：智能体训练靠“质”，不是靠“量”
作者：PaperWeekly发布日期：2025-09-25 22:20:44
在大模型圈，有一个几乎铁律般的直觉：更多数据，就意味着更强的能力。无论是预训练还是指令微调，大家的共识都是“量就是一切”。但这次，来自上海交大等机构的一篇论文却把这条规律颠覆了。研究团队提出了一个名
阅读全文
北京内推 | 中科院软件所数据科学研究中心招聘大语言模型算法实习生
作者：PaperWeekly发布日期：2025-09-25 22:20:44
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！中科院软件所中国科学院软件研究所是一所致力于计算机科学理论和软件高新技术的研究
阅读全文
RL不再撒胡椒面！港科大 × 清华新作：只盯“规划token”，大模型推理力狂飙
作者：PaperWeekly发布日期：2025-09-24 23:12:32
在大模型推理力的进化史上，总有一些让人百思不得其解的“谜之现象”：模型为何会突然迎来 Aha 时刻，像是顿悟般智力飞升？为什么思维链越长，准确率反而更高？为什么训练中的熵曲线与性能关系如此扑朔迷离？港
阅读全文
NeurIPS 2025 | 甩掉文本CoT！FSDrive开启时空思维链，自动驾驶迈入视觉推理时代
作者：PaperWeekly发布日期：2025-09-24 23:12:32
引言视觉语言动作模型（VLA）凭借其强大的通用知识与推理能力，正成为推动自动驾驶技术发展的关键力量。然而，当前主流方法在进行决策时，大多依赖于一种“文本式”的思维链（Chain-of-Thought，
阅读全文
博士申请 | 加拿大麦吉尔大学智能自动化实验室招收大模型/强化学习方向全奖博士生
作者：PaperWeekly发布日期：2025-09-24 23:12:32
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！麦吉尔大学麦吉尔大学始建于1821年，为加拿大第一所大学，坐落于加拿大魁北克省
阅读全文
MiniCPM-V 4.5技术报告正式出炉！首个高刷视频理解多模态模型全解析
作者：PaperWeekly发布日期：2025-09-23 18:11:39
自 OpenAI 发布 GPT-4 以来，多模态大模型深刻地改变了人工智能研究和产业的基本范式，在理解和推理图文语义信息方面展现出革命性能力，但其庞大的参数量和高昂的计算成本，使其严重依赖云端高性能服
阅读全文
KDD 2025 | 从个股偏离到市场共振：UMI挖出股市非理性因子，显著提升预测精度
作者：PaperWeekly发布日期：2025-09-23 18:11:39
在刚刚结束的第 31 届 ACM SIGKDD 知识发现与数据挖掘国际会议（KDD2025）上，北京航空航天大学计算机学院 BIGSCITY 实验室发布了名为 UMI（Universal multi-
阅读全文
一套框架搞定图像定制！IC-Custom统一「位置相关/无关」，万物迁移真落地
作者：PaperWeekly发布日期：2025-09-23 18:11:39
图像定制（Image Customization）是工业级媒体生产中的核心需求——无论是虚拟试衣、商品植入，还是创意 IP 衍生，都需要让生成的图像与参考保持身份一致。传统方法通常分为两类：位置相关（
阅读全文
北京内推 | Apple中国招聘机器学习/AI方向研究型实习生
作者：PaperWeekly发布日期：2025-09-23 18:11:39
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！AppleApple is a place where extraordina
阅读全文
RLHF要下岗？Meta × 牛津搞出新套路：用算力教算力，大模型训练新范式来了！
作者：PaperWeekly发布日期：2025-09-22 14:16:52
在没有标准答案的任务里，大模型该向谁学习？长期以来，我们依赖人类标注、LLM 判官或多数投票来为模型提供监督，但这些方式要么成本高昂，要么偏好明显，要么只能在候选里“挑最不差的”。但如果——算力本身就
阅读全文
Lumos-1登场！自回归 + 离散扩散合体：让大模型真正“构造”动态世界！
作者：PaperWeekly发布日期：2025-09-22 14:16:52
摘要当大语言模型（LLM）在文本世界大放异彩时，我们不禁要问：能否用同样简洁、统一的自回归架构，来驾驭更加复杂的视频生成任务？现有的自回归视频生成方法，或多或少都面临着架构不统一、依赖笨重外部文本编码
阅读全文
博士申请 | 复旦大学魏龙老师课题组招收AI4Science方向博士/硕士/RA/实习生
作者：PaperWeekly发布日期：2025-09-22 14:16:52
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！复旦大学复旦大学人工智能创新与产业研究院成立于2021年11月，由漆远教授领衔
阅读全文
北京内推 | 智源研究院多模态交互研究中心招聘多模态/具身智能方向研究型实习生
作者：PaperWeekly发布日期：2025-09-22 14:16:52
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！智源研究院北京智源研究院多模态交互研究中心旨在探索最前沿研究/应用场景，构建赋
阅读全文