全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    博士申请 | 香港中文大学(深圳)刘圳老师课题组招收大模型/机器学习全奖博士/硕士

    作者:PaperWeekly发布日期:2025-08-17 22:12:36

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)数据科学学院专注于数据科学方向的人才培

    阅读全文
  • 文章封面

    北京内推 | 阿里高德多模态团队多模态/大模型/Agent方向研究型实习生

    作者:PaperWeekly发布日期:2025-08-17 22:12:36

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队来自阿里巴巴高德多模态团队,在NeurIPS/ICLR/CVPR/

    阅读全文
  • 文章封面

    ICML 2025 | 模型不开口也能配合?贝叶斯纳什均衡重塑多智能体LLM协作

    作者:PaperWeekly发布日期:2025-08-14 23:52:53

    当前,通过 prompt 引导多个大语言模型(LLM)进行协作,如多智能体辩论(Multi-agent Debate),已被证明能显著增强模型的复杂推理能力。然而,基于“显式多轮信息交互“的多模型框架

    阅读全文
  • 文章封面

    别再二选一了!一文看懂On-Policy与Off-Policy的本质分歧(含GRPO深度拆解)

    作者:PaperWeekly发布日期:2025-08-14 23:52:53

    ©作者 | 吴宇斌单位 | 摩尔线程研究方向 | GUI agent在强化学习(Reinforcement Learning,RL)中,on-policy 和 off-policy 是两种核心的学习策

    阅读全文
  • 文章封面

    告别Transformer?上海交大「原生类脑」BriLLM首秀:信号流重塑大模型范式

    作者:PaperWeekly发布日期:2025-08-14 23:52:53

    当前 GPT 类大语言模型的表征和处理机制,仅在输入和输出接口层面对语言元素保持可解释的语义映射。相比之下,人类大脑直接在分布式的皮层区域中编码语义,如果将其视为一个语言处理系统,它本身就是一个在全局

    阅读全文
  • 文章封面

    博士申请 | 新加坡国立大学计算机系刘安吉老师招收生成模型/LLM方向全奖博士/博后/实习生

    作者:PaperWeekly发布日期:2025-08-14 23:52:53

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡国立大学新加坡国立大学(National University of S

    阅读全文
  • 文章封面

    Kimi K2背后的冷门绝招:海量语料“重写”如何榨干每个token?

    作者:PaperWeekly发布日期:2025-08-13 23:35:31

    ©作者 | 李嘉诚研究方向 | 大模型预训练和对齐前段时间 K2 作为国际一线模型发布,优秀的效果、开源权重和新技术验证赢得海内外一片掌声,其技术报告中罕见地提到了部分数据构成的细节,例如对于信息密度

    阅读全文
  • 文章封面

    ICML 2025 | 奖励模型还用人标?APEC用对抗模仿生成偏好,泛化能力直线上升

    作者:PaperWeekly发布日期:2025-08-13 23:35:31

    ©作者 | 张智龙单位 | 南京大学研究方向 | 强化学习和世界模型非常高兴我们的工作《Improving Reward Model Generalization from Adversarial P

    阅读全文
  • 文章封面

    Attention Sink的起源找到了?清华×美团首次锁定MoE中的「超级专家」

    作者:PaperWeekly发布日期:2025-08-13 23:35:31

    稀疏激活的混合专家模型(MoE)通过动态路由和稀疏激活机制,极大提升了大语言模型(LLM)的学习能力,展现出显著的潜力。基于这一架构,涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。

    阅读全文
  • 文章封面

    博士申请 | 休斯敦大学计算机系刘锦阳老师招收高性能计算/数据压缩方向博士生

    作者:PaperWeekly发布日期:2025-08-13 23:35:31

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!休斯敦大学休斯敦大学的计算机系非常具有学术竞争力。于2024年,CSRanki

    阅读全文
  • 文章封面

    后训练轻量「小枝」强势出击!极限剪裁视觉token,推理加速154%

    作者:PaperWeekly发布日期:2025-08-12 12:33:43

    近年来,GPT-4V 等视觉语言大模型(large vision-language model,LVLM)表现出卓越的多模态理解能力和通用性,尤其是在文档分析、GUI 自动化、机械臂控制等领域展现出令

    阅读全文
  • 文章封面

    实验室抢显卡抢破头?A800/H800骨折价来袭,超值返券助你轻松冲DDL!

    作者:PaperWeekly发布日期:2025-08-12 12:33:43

    过去几年,做模型训练、推理、微调的人都有同一个痛点:显卡要么排不到,要么价格被炒到天上。而今年,显卡资源紧张问题愈发严峻——SFT、RLHF、MoE 以及多模态训练纷纷上阵,显存需求骤增,钱包压力也随

    阅读全文
  • 文章封面

    ICCV 2025 | Scaffold反噬联邦学习?NTU联手0G Labs揭示中心化训练安全漏洞

    作者:PaperWeekly发布日期:2025-08-12 12:33:43

    通过使用控制变元(control variate)来校准每个客户端的本地梯度,Scaffold 已被广泛认为是缓解联邦学习中数据异质性影响的一种强大方案。但尽管 Scaffold 实现了显著的性能提升

    阅读全文
  • 文章封面

    北京内推 | 度小满金融视觉和多模态团队招聘视觉多模态算法实习生

    作者:PaperWeekly发布日期:2025-08-12 12:33:43

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!度小满金融DXM ITDD 视觉和多模态团队:我们专注于图像、视频、文本信息的

    阅读全文
  • 文章封面

    建议所有博士都去学一遍,这次真的赢麻了!

    作者:PaperWeekly发布日期:2025-08-11 12:32:13

    无论你是博士,还是硕士,肯定都因为发不出sci而自我怀疑过!是自己天资不够?不适合科研?还是努力还不够?其实都不是!无论是选题没有头绪,实验漏洞百出,还是论文改来改去依旧被拒。这都是因为你没有遇到一个

    阅读全文
  • 文章封面

    ICCV 2025 | 终结灾难性遗忘!南大提出外部知识注入机制,刷新CLIP持续学习SOTA

    作者:PaperWeekly发布日期:2025-08-11 12:32:13

    持续学习旨在使学习系统不断学习流式数据中的知识。随着预训练技术的发展,预训练视觉-语言模型(如 CLIP)通过引入预训练知识促进了持续学习的发展。然而,CLIP 通过将视觉表征与类别名称匹配来进行判别

    阅读全文
  • 文章封面

    超越样本级RL!人大×快手提出ARPO:熵驱动Agent探索,多轮推理性能飙升

    作者:PaperWeekly发布日期:2025-08-11 12:32:13

    在可验证强化学习(RLVR)的推动下,大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中,LLM 往往需要结合外部工具进行多轮交互,现有 RL 算法在平衡模型的长程推理与多轮工具交互能力

    阅读全文
  • 文章封面

    北京/上海内推 | 盛大集团AI创新中心招聘大模型/Agent方向算法实习生

    作者:PaperWeekly发布日期:2025-08-11 12:32:13

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!盛大集团盛大是一家全球性的私人投资控股集团,由中国网络互动娱乐先锋陈天桥及其家

    阅读全文
  • 文章封面

    向量检索造数据全链路揭秘:Qwen3打样,Gemini精炼,Seed1.5推理升级

    作者:PaperWeekly发布日期:2025-08-10 22:02:04

    ©作者 | 李嘉诚单位 | 字节跳动研究方向 | Retrieva & LLM近期,Google,字节跳动,阿里相继发布了他们最新的检索模型——gemini-embedding,seed1.5-emb

    阅读全文
  • 文章封面

    Dijkstra非最优解!清华团队突破最短路径排序瓶颈,STOC 2025最佳论文详解

    作者:PaperWeekly发布日期:2025-08-10 22:02:04

    ©作者 | 机器之心每次打开导航的,导航软件在一秒内给出一个最速路线的时候,你有没有好奇过它是怎么找到这条路的?假如不考虑堵车、红绿灯等交通影响因素,仅找到一条最短最快的路线,那不论如何也逃不掉 Di

    阅读全文
  • 文章封面

    博士申请 | 香港大学陈城老师招收医疗AI方向全奖博士/研究助理/访问学生

    作者:PaperWeekly发布日期:2025-08-10 22:02:04

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港大学香港大学创立于1911年,坐落于繁华的香港岛西部,是香港的首间大学,发

    阅读全文
  • 文章封面

    北京内推 | 京东物流技术与数据智能部招聘具身智能方向算法实习生

    作者:PaperWeekly发布日期:2025-08-10 22:02:04

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!京东我们是京东物流-X科技部-具身智能研发团队,目前正在搭建团队,对于想从事具

    阅读全文
  • 文章封面

    「极简三角法」TriangleMix上线:LLM Prefill加速拉满,性能几乎无损!

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    ©作者 | 何之源单位 | 微软亚洲研究院研究方向 | LLM efficiency我们近期提出了一项新工作 TriangleMix:一种可以在几乎不损失性能的前提下,大幅加速 LLM Prefill

    阅读全文
  • 文章封面

    函数能跑但写法离谱?北航IFEvalCode出手,专治多语言代码生成“不讲武德”

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    近日北航和 MAP 联合提出并开源了一个面向大模型(LLM)能力的新评测基准——IFEvalCode,聚焦于“可控代码生成”任务,支持多语言、跨编程语种、多维能力测评,并进一步提出了提升大模型可控性的

    阅读全文
  • 文章封面

    ICML 2025 | 千倍泛化不涨显存!蚂蚁推出新注意力机制,实现16M上下文精准检索

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    ©作者 | 胡翔、武威单位 | 蚂蚁技术研究院在大语言模型如火如荼的当下,长文本建模仍然是一个极具挑战的问题。纠其根源,一方面在于主流 LLMs 的架构 Transformers 中平方复杂度及随序列

    阅读全文
  • 文章封面

    北京内推 | 微软MAI广告部门招聘分布式训练框架研发实习生

    作者:PaperWeekly发布日期:2025-08-08 23:14:27

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软Microsoft AI是微软公司于2016年成立的专注于人工智能研究与开

    阅读全文
  • 文章封面

    生成不用“扩散”了?MeanFlow换轨平均速度,一步生成刷新加速上限

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    ©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络众所周知,生成速度慢是扩散模型一直以来的痛点,而为了解决这个问题,大家可谓“八仙过海,各显神通”,提

    阅读全文
  • 文章封面

    中英双语一起破防!北大×腾讯发布“地狱级”测试基准,直击语音对话模型软肋

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    为什么你的语音助手总翻车?当用户说“苹果/不大好吃”和“苹果不大/好吃”,这个苹果到底大不大、好不好吃?当用户说“夏天能穿多少穿多少”和“冬天能穿多少穿多少”,指的到底是少穿一些还是多穿一些?这些人类

    阅读全文
  • 文章封面

    ICML 2025 | 撬开上下文理解黑盒:注意力机制中的极大值浮出水面

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    大型语言模型(LLMs)在上下文知识理解方面取得了令人瞩目的成功。近日,一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are

    阅读全文
  • 文章封面

    北京内推 | 阿里夸克大模型团队招聘多模态大模型算法工程师/实习生

    作者:PaperWeekly发布日期:2025-08-07 23:21:52

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里夸克大模型团队在智能科技浪潮中迅速崛起,我们拥有处于上升阶段的核心

    阅读全文
上一页下一页