全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    北京内推 | 京东物流技术与数据智能部招聘具身智能方向算法实习生

    作者:PaperWeekly发布日期:2025-08-10 22:02:04

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!京东我们是京东物流-X科技部-具身智能研发团队,目前正在搭建团队,对于想从事具

    阅读全文
  • 文章封面

    「极简三角法」TriangleMix上线:LLM Prefill加速拉满,性能几乎无损!

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    ©作者 | 何之源单位 | 微软亚洲研究院研究方向 | LLM efficiency我们近期提出了一项新工作 TriangleMix:一种可以在几乎不损失性能的前提下,大幅加速 LLM Prefill

    阅读全文
  • 文章封面

    函数能跑但写法离谱?北航IFEvalCode出手,专治多语言代码生成“不讲武德”

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    近日北航和 MAP 联合提出并开源了一个面向大模型(LLM)能力的新评测基准——IFEvalCode,聚焦于“可控代码生成”任务,支持多语言、跨编程语种、多维能力测评,并进一步提出了提升大模型可控性的

    阅读全文
  • 文章封面

    ICML 2025 | 千倍泛化不涨显存!蚂蚁推出新注意力机制,实现16M上下文精准检索

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    ©作者 | 胡翔、武威单位 | 蚂蚁技术研究院在大语言模型如火如荼的当下,长文本建模仍然是一个极具挑战的问题。纠其根源,一方面在于主流 LLMs 的架构 Transformers 中平方复杂度及随序列

    阅读全文
  • 文章封面

    北京内推 | 微软MAI广告部门招聘分布式训练框架研发实习生

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软Microsoft AI是微软公司于2016年成立的专注于人工智能研究与开

    阅读全文
  • 文章封面

    生成不用“扩散”了?MeanFlow换轨平均速度,一步生成刷新加速上限

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    ©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络众所周知,生成速度慢是扩散模型一直以来的痛点,而为了解决这个问题,大家可谓“八仙过海,各显神通”,提

    阅读全文
  • 文章封面

    中英双语一起破防!北大×腾讯发布“地狱级”测试基准,直击语音对话模型软肋

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    为什么你的语音助手总翻车?当用户说“苹果/不大好吃”和“苹果不大/好吃”,这个苹果到底大不大、好不好吃?当用户说“夏天能穿多少穿多少”和“冬天能穿多少穿多少”,指的到底是少穿一些还是多穿一些?这些人类

    阅读全文
  • 文章封面

    ICML 2025 | 撬开上下文理解黑盒:注意力机制中的极大值浮出水面

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    大型语言模型(LLMs)在上下文知识理解方面取得了令人瞩目的成功。近日,一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are

    阅读全文
  • 文章封面

    北京内推 | 阿里夸克大模型团队招聘多模态大模型算法工程师/实习生

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里夸克大模型团队在智能科技浪潮中迅速崛起,我们拥有处于上升阶段的核心

    阅读全文
  • 文章封面

    Attention Sink现象揭秘:Transformer为何偏爱首Token?

    作者:PaperWeekly发布日期:2025-08-06 19:10:26

    作者 | 郑明悟研究方向 | 大语言模型来源 | https://zhuanlan.zhihu.com/p/1932066570714215838Attention Sink 来源于 Transfor

    阅读全文
  • 文章封面

    ICCV 2025|视角差、遮挡多?无人机视频融合BEV,定位稳了!

    作者:PaperWeekly发布日期:2025-08-06 19:10:26

    在现代无人机视觉精细地理定位任务(Drone-based Visual Geo-localization)中,传统基于图像的方法范式依赖于从无人机拍摄的单张图片进行匹配,但这种方式存在两个显著问题:视

    阅读全文
  • 文章封面

    从离散token到多模态统一:Discrete Tokenization全景综述重磅上线

    作者:PaperWeekly发布日期:2025-08-06 19:10:26

    近年来,大语言模型(LLM)在语言理解、生成和泛化方面取得了突破性进展,并广泛应用于各种文本任务。随着研究的深入,人们开始关注将 LLM 的能力扩展至非文本模态,例如图像、音频、视频、图结构、推荐系统

    阅读全文
  • 文章封面

    北京内推 | 腾讯混元大模型团队招聘大语言模型算法实习生

    作者:PaperWeekly发布日期:2025-08-06 19:10:26

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯混元大模型是腾讯公司的通用大模型技术团队,致力于开发业界先进的 AI 大模

    阅读全文
  • 文章封面

    Attention总跑偏?人大×清华联合提出LeaF:剪掉干扰Token,让模型学会主动聚焦

    作者:PaperWeekly发布日期:2025-08-05 20:05:50

    本文提出 LeaF 框架,在知识蒸馏过程中融入基于因果分析的干扰识别机制,引导学生模型推理过程中聚焦因果关键特征,从而提升推理准确性与泛化能力。论文标题:Learning to Focus: Caus

    阅读全文
  • 文章封面

    KDD 2025 | 图也能变token!STAG首提“软量化”,打通GNN与LLM鸿沟

    作者:PaperWeekly发布日期:2025-08-05 20:05:50

    TL;DR我们提出了 STAG(Soft Tokenization for Text-attributed Graphs),一个创新的自监督框架,通过量化技术将图的结构信息直接转换为离散 token,

    阅读全文
  • 文章封面

    模型真能“反思代码”吗?北航发布仓库级理解生成基准,刷新LLM理解评估范式

    作者:PaperWeekly发布日期:2025-08-05 20:05:50

    大型语言模型(LLMs)在代码理解和生成领域取得了长足进步,能够跨越多种编程语言提供智能反馈、检测潜在 bug 并基于人类指令更新代码片段。代码反思(Code Reflection)作为 LLM 检查

    阅读全文
  • 文章封面

    博士申请 | 香港科技大学(广州)段凌杰教授招收人工智能方向2026春季全奖博士生

    作者:PaperWeekly发布日期:2025-08-05 20:05:50

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)香港科技大学(简称港科大)自1991年在清水湾校区成立以来

    阅读全文
  • 文章封面

    RoPE是长度外推之光,还是频谱灾难?真相埋在傅里叶里

    作者:PaperWeekly发布日期:2025-08-04 18:39:49

    作者|边路腰刀单位|清华大学博士生来源|https://zhuanlan.zhihu.com/p/14369935885现在开源社区对 RoPE 的评价是两种一边倒,要么只褒,要么只贬。更加遗憾的是,

    阅读全文
  • 文章封面

    推荐系统不再瞎猜!IEDR首创多情境对比解耦学习,精准拆解用户偏好动因

    作者:PaperWeekly发布日期:2025-08-04 18:39:49

    在推荐系统中,用户的行为(如购买、点击)在不同的 context 环境(如时间和位置)下可能有很大的差异。这是因为用户行为由两类因素共同决定:内在因素(intrinsic factors),反映用户一

    阅读全文
  • 文章封面

    ICCV 2025 | 扩散采样不用慢慢来了!EPD-Solver三招合一跑赢SOTA

    作者:PaperWeekly发布日期:2025-08-04 18:39:49

    ©作者 | 朱贝尔、王若禹单位 | NTU、西湖大学研究方向 | 机器学习、扩散模型近年来,扩散模型(Diffusion Models)凭借出色的生成质量,迅速成为图像、视频、语音、3D 内容等生成任

    阅读全文
  • 文章封面

    北京/杭州/上海内推 | 阿里通义千问Post-training团队招聘大模型方向算法实习生

    作者:PaperWeekly发布日期:2025-08-04 18:39:49

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴我们致力于利用强大的预训练模型,运用前沿的 post-training

    阅读全文
  • 文章封面

    一次中稿10篇ACL 2025,通义实验室代码智能&对话智能团队在研究什么?

    作者:PaperWeekly发布日期:2025-08-01 14:06:53

    ©PaperWeekly 原创 · 作者 | 李永彬单位 | 阿里巴巴通义实验室研究方向 | 代码智能、对话智能近日,自然语言处理领域的国际顶级会议 ACL 2025 正在召开,通义实验室代码智能&对

    阅读全文
  • 文章封面

    别错过!2025年投稿“最后冲刺”:10大国际会议截稿时间全掌握

    作者:PaperWeekly发布日期:2025-08-01 14:06:53

    组委会尊敬的学术界同仁:AC学术平台谨此发布2025年下半年重要学术会议信息公告。经审核,在AC学术平台发布的所有会议均将邀请全球知名学者莅临现场,分享最新学术研究成果,且会议论文均将提交EI数据库。

    阅读全文
  • 文章封面

    ICCV 2025 | UV-CoT登场!无监督也能搞图像级思维链,偏好优化助力CoT跃迁

    作者:PaperWeekly发布日期:2025-08-01 14:06:53

    ©作者 | 赵克森单位 | 南洋理工大学博士生研究方向 | 强化多模态大语言模型 随着文本领域中思维链(Chain-of-Thought,CoT)推理机制的成功应用,研究者开始将该方法引入视觉理解任务

    阅读全文
  • 文章封面

    博士申请 | 香港中文大学(深圳)AI Compiler实验室招收智能计算全奖博士/硕士/博后

    作者:PaperWeekly发布日期:2025-08-01 14:06:53

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)数据科学学院专注于数据科学方向的人才培

    阅读全文
  • 文章封面

    RL推理的尽头,是熵坍缩?统一SFT与强化学习的新视角

    作者:PaperWeekly发布日期:2025-07-31 18:32:48

    在 LLM 的预训练及微调阶段,Scaling Law 告诉了我们所能达到效果范围,其中蕴含了深刻的信息论原理,感兴趣的可以回看笔者之前的文章 [15]。在此原理的支配下,开发者则可以将精力主要关注于

    阅读全文
  • 文章封面

    TNNLS 2025 | 双重引导的锚点学习:信息瓶颈助力高效不完备多视图聚类

    作者:PaperWeekly发布日期:2025-07-31 18:32:48

    不完备多视图聚类(Incomplete Multi-view Clustering,IMC)旨在在不利用标注信息的情况下对有缺失的多视图数据进行表征学习和类别划分,在增强同类样本相似性的同时增加类间差

    阅读全文
  • 文章封面

    RL Scaling大时代来临!siiRL首创全分布式框架,千卡强化学习训练轻松跑通

    作者:PaperWeekly发布日期:2025-07-31 18:32:48

    还在为强化学习(RL)框架的扩展性瓶颈和效率低下而烦恼吗?当模型和集群规模达到上千块 GPU 时,传统的中心化控制器架构难免会遇到性能瓶颈、内存溢出甚至系统崩溃。事实上,当前最顶尖的基础模型,从 De

    阅读全文
  • 文章封面

    北京/上海内推 | 上海人工智能实验室招收大模型/智能体方向算法研究员/实习生

    作者:PaperWeekly发布日期:2025-07-31 18:32:48

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海人工智能实验室上海人工智能实验室安全可信团队致力于大模型、智能体及多智能体

    阅读全文
  • 文章封面

    开源模型也能卷出SOTA!MiroMind-M1高效推理压缩token,训练数据与代码全透明

    作者:PaperWeekly发布日期:2025-07-29 14:11:14

    近日,MiroMind(集智进化) 推出 MiroMind‑M1 系列数学推理语言模型(RLMs),训练数据、代码、模型配方、测试等全流程全部开源,覆盖监督微调(SFT)和强化学习(RL)两大部分。M

    阅读全文
上一页下一页