全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    北京内推 | 度小满金融视觉和多模态团队招聘视觉多模态算法实习生

    作者:PaperWeekly发布日期:2025-08-12 12:33:43

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!度小满金融DXM ITDD 视觉和多模态团队:我们专注于图像、视频、文本信息的

    阅读全文
  • 文章封面

    建议所有博士都去学一遍,这次真的赢麻了!

    作者:PaperWeekly发布日期:2025-08-11 12:32:13

    无论你是博士,还是硕士,肯定都因为发不出sci而自我怀疑过!是自己天资不够?不适合科研?还是努力还不够?其实都不是!无论是选题没有头绪,实验漏洞百出,还是论文改来改去依旧被拒。这都是因为你没有遇到一个

    阅读全文
  • 文章封面

    ICCV 2025 | 终结灾难性遗忘!南大提出外部知识注入机制,刷新CLIP持续学习SOTA

    作者:PaperWeekly发布日期:2025-08-11 12:32:13

    持续学习旨在使学习系统不断学习流式数据中的知识。随着预训练技术的发展,预训练视觉-语言模型(如 CLIP)通过引入预训练知识促进了持续学习的发展。然而,CLIP 通过将视觉表征与类别名称匹配来进行判别

    阅读全文
  • 文章封面

    超越样本级RL!人大×快手提出ARPO:熵驱动Agent探索,多轮推理性能飙升

    作者:PaperWeekly发布日期:2025-08-11 12:32:13

    在可验证强化学习(RLVR)的推动下,大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中,LLM 往往需要结合外部工具进行多轮交互,现有 RL 算法在平衡模型的长程推理与多轮工具交互能力

    阅读全文
  • 文章封面

    北京/上海内推 | 盛大集团AI创新中心招聘大模型/Agent方向算法实习生

    作者:PaperWeekly发布日期:2025-08-11 12:32:13

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!盛大集团盛大是一家全球性的私人投资控股集团,由中国网络互动娱乐先锋陈天桥及其家

    阅读全文
  • 文章封面

    向量检索造数据全链路揭秘:Qwen3打样,Gemini精炼,Seed1.5推理升级

    作者:PaperWeekly发布日期:2025-08-10 22:02:04

    ©作者 | 李嘉诚单位 | 字节跳动研究方向 | Retrieva & LLM近期,Google,字节跳动,阿里相继发布了他们最新的检索模型——gemini-embedding,seed1.5-emb

    阅读全文
  • 文章封面

    Dijkstra非最优解!清华团队突破最短路径排序瓶颈,STOC 2025最佳论文详解

    作者:PaperWeekly发布日期:2025-08-10 22:02:04

    ©作者 | 机器之心每次打开导航的,导航软件在一秒内给出一个最速路线的时候,你有没有好奇过它是怎么找到这条路的?假如不考虑堵车、红绿灯等交通影响因素,仅找到一条最短最快的路线,那不论如何也逃不掉 Di

    阅读全文
  • 文章封面

    博士申请 | 香港大学陈城老师招收医疗AI方向全奖博士/研究助理/访问学生

    作者:PaperWeekly发布日期:2025-08-10 22:02:04

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港大学香港大学创立于1911年,坐落于繁华的香港岛西部,是香港的首间大学,发

    阅读全文
  • 文章封面

    北京内推 | 京东物流技术与数据智能部招聘具身智能方向算法实习生

    作者:PaperWeekly发布日期:2025-08-10 22:02:04

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!京东我们是京东物流-X科技部-具身智能研发团队,目前正在搭建团队,对于想从事具

    阅读全文
  • 文章封面

    「极简三角法」TriangleMix上线:LLM Prefill加速拉满,性能几乎无损!

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    ©作者 | 何之源单位 | 微软亚洲研究院研究方向 | LLM efficiency我们近期提出了一项新工作 TriangleMix:一种可以在几乎不损失性能的前提下,大幅加速 LLM Prefill

    阅读全文
  • 文章封面

    函数能跑但写法离谱?北航IFEvalCode出手,专治多语言代码生成“不讲武德”

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    近日北航和 MAP 联合提出并开源了一个面向大模型(LLM)能力的新评测基准——IFEvalCode,聚焦于“可控代码生成”任务,支持多语言、跨编程语种、多维能力测评,并进一步提出了提升大模型可控性的

    阅读全文
  • 文章封面

    ICML 2025 | 千倍泛化不涨显存!蚂蚁推出新注意力机制,实现16M上下文精准检索

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    ©作者 | 胡翔、武威单位 | 蚂蚁技术研究院在大语言模型如火如荼的当下,长文本建模仍然是一个极具挑战的问题。纠其根源,一方面在于主流 LLMs 的架构 Transformers 中平方复杂度及随序列

    阅读全文
  • 文章封面

    北京内推 | 微软MAI广告部门招聘分布式训练框架研发实习生

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软Microsoft AI是微软公司于2016年成立的专注于人工智能研究与开

    阅读全文
  • 文章封面

    生成不用“扩散”了?MeanFlow换轨平均速度,一步生成刷新加速上限

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    ©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络众所周知,生成速度慢是扩散模型一直以来的痛点,而为了解决这个问题,大家可谓“八仙过海,各显神通”,提

    阅读全文
  • 文章封面

    中英双语一起破防!北大×腾讯发布“地狱级”测试基准,直击语音对话模型软肋

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    为什么你的语音助手总翻车?当用户说“苹果/不大好吃”和“苹果不大/好吃”,这个苹果到底大不大、好不好吃?当用户说“夏天能穿多少穿多少”和“冬天能穿多少穿多少”,指的到底是少穿一些还是多穿一些?这些人类

    阅读全文
  • 文章封面

    ICML 2025 | 撬开上下文理解黑盒:注意力机制中的极大值浮出水面

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    大型语言模型(LLMs)在上下文知识理解方面取得了令人瞩目的成功。近日,一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are

    阅读全文
  • 文章封面

    北京内推 | 阿里夸克大模型团队招聘多模态大模型算法工程师/实习生

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里夸克大模型团队在智能科技浪潮中迅速崛起,我们拥有处于上升阶段的核心

    阅读全文
  • 文章封面

    Attention Sink现象揭秘:Transformer为何偏爱首Token?

    作者:PaperWeekly发布日期:2025-08-06 19:10:26

    作者 | 郑明悟研究方向 | 大语言模型来源 | https://zhuanlan.zhihu.com/p/1932066570714215838Attention Sink 来源于 Transfor

    阅读全文
  • 文章封面

    ICCV 2025|视角差、遮挡多?无人机视频融合BEV,定位稳了!

    作者:PaperWeekly发布日期:2025-08-06 19:10:26

    在现代无人机视觉精细地理定位任务(Drone-based Visual Geo-localization)中,传统基于图像的方法范式依赖于从无人机拍摄的单张图片进行匹配,但这种方式存在两个显著问题:视

    阅读全文
  • 文章封面

    从离散token到多模态统一:Discrete Tokenization全景综述重磅上线

    作者:PaperWeekly发布日期:2025-08-06 19:10:26

    近年来,大语言模型(LLM)在语言理解、生成和泛化方面取得了突破性进展,并广泛应用于各种文本任务。随着研究的深入,人们开始关注将 LLM 的能力扩展至非文本模态,例如图像、音频、视频、图结构、推荐系统

    阅读全文
  • 文章封面

    北京内推 | 腾讯混元大模型团队招聘大语言模型算法实习生

    作者:PaperWeekly发布日期:2025-08-06 19:10:26

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯混元大模型是腾讯公司的通用大模型技术团队,致力于开发业界先进的 AI 大模

    阅读全文
  • 文章封面

    Attention总跑偏?人大×清华联合提出LeaF:剪掉干扰Token,让模型学会主动聚焦

    作者:PaperWeekly发布日期:2025-08-05 20:05:50

    本文提出 LeaF 框架,在知识蒸馏过程中融入基于因果分析的干扰识别机制,引导学生模型推理过程中聚焦因果关键特征,从而提升推理准确性与泛化能力。论文标题:Learning to Focus: Caus

    阅读全文
  • 文章封面

    KDD 2025 | 图也能变token!STAG首提“软量化”,打通GNN与LLM鸿沟

    作者:PaperWeekly发布日期:2025-08-05 20:05:50

    TL;DR我们提出了 STAG(Soft Tokenization for Text-attributed Graphs),一个创新的自监督框架,通过量化技术将图的结构信息直接转换为离散 token,

    阅读全文
  • 文章封面

    模型真能“反思代码”吗?北航发布仓库级理解生成基准,刷新LLM理解评估范式

    作者:PaperWeekly发布日期:2025-08-05 20:05:50

    大型语言模型(LLMs)在代码理解和生成领域取得了长足进步,能够跨越多种编程语言提供智能反馈、检测潜在 bug 并基于人类指令更新代码片段。代码反思(Code Reflection)作为 LLM 检查

    阅读全文
  • 文章封面

    博士申请 | 香港科技大学(广州)段凌杰教授招收人工智能方向2026春季全奖博士生

    作者:PaperWeekly发布日期:2025-08-05 20:05:50

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)香港科技大学(简称港科大)自1991年在清水湾校区成立以来

    阅读全文
  • 文章封面

    RoPE是长度外推之光,还是频谱灾难?真相埋在傅里叶里

    作者:PaperWeekly发布日期:2025-08-04 18:39:49

    作者|边路腰刀单位|清华大学博士生来源|https://zhuanlan.zhihu.com/p/14369935885现在开源社区对 RoPE 的评价是两种一边倒,要么只褒,要么只贬。更加遗憾的是,

    阅读全文
  • 文章封面

    推荐系统不再瞎猜!IEDR首创多情境对比解耦学习,精准拆解用户偏好动因

    作者:PaperWeekly发布日期:2025-08-04 18:39:49

    在推荐系统中,用户的行为(如购买、点击)在不同的 context 环境(如时间和位置)下可能有很大的差异。这是因为用户行为由两类因素共同决定:内在因素(intrinsic factors),反映用户一

    阅读全文
  • 文章封面

    ICCV 2025 | 扩散采样不用慢慢来了!EPD-Solver三招合一跑赢SOTA

    作者:PaperWeekly发布日期:2025-08-04 18:39:49

    ©作者 | 朱贝尔、王若禹单位 | NTU、西湖大学研究方向 | 机器学习、扩散模型近年来,扩散模型(Diffusion Models)凭借出色的生成质量,迅速成为图像、视频、语音、3D 内容等生成任

    阅读全文
  • 文章封面

    北京/杭州/上海内推 | 阿里通义千问Post-training团队招聘大模型方向算法实习生

    作者:PaperWeekly发布日期:2025-08-04 18:39:49

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴我们致力于利用强大的预训练模型,运用前沿的 post-training

    阅读全文
  • 文章封面

    一次中稿10篇ACL 2025,通义实验室代码智能&对话智能团队在研究什么?

    作者:PaperWeekly发布日期:2025-08-01 14:06:53

    ©PaperWeekly 原创 · 作者 | 李永彬单位 | 阿里巴巴通义实验室研究方向 | 代码智能、对话智能近日,自然语言处理领域的国际顶级会议 ACL 2025 正在召开,通义实验室代码智能&对

    阅读全文
上一页下一页