全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    SIGIR 2025 | Debug你的AI搜索!NExT-Search双模式反馈让模型学会自我纠错

    作者:PaperWeekly发布日期:2025-06-05 13:32:33

    以大语言模型(LLMs)为基础的生成式AI搜索正在重塑信息获取的方式,为用户提供了端到端的答案,极大地降低了用户手动浏览与总结多个网页的繁琐时间成本。然而,虽然这种新范式提升了便捷性,却也破坏了传统网

    阅读全文
  • 文章封面

    北京内推 | 京东广告部招聘NLP/大模型算法实习生

    作者:PaperWeekly发布日期:2025-06-05 13:32:33

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!京东京东广告部是京东的核心技术和业务部门,承担全站流量变现、收入提升的重要职责

    阅读全文
  • 文章封面

    告别「烧显卡」训练!上交大团队发布AutoGnothi:黑盒Transformer实现自我解释

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    ©PaperWeekly 原创 · 作者 | 张林峰单位 | 上海交通大学人工智能学院背景随着人工智能的广泛应用,尤其在视觉和语言处理领域,模型的可解释性变得至关重要。在高风险场景(如医疗和金融)中,

    阅读全文
  • 文章封面

    ACL 2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    跨规模参数知识迁移PKT的全面分析人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。人类的知识传递长期依赖符号语言:从文字、数学公式到编程代码,我们通过符号系统将知识编码、解码。

    阅读全文
  • 文章封面

    无需外部组件!DiT自表征对齐黑科技:扩散模型的高效进化密码

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    论文标题:Representation Alignment for Diffusion Transformers without External Components论文链接:https://arx

    阅读全文
  • 文章封面

    北京内推 | 快手可灵AI技术部招聘视频生成方向暑期算法实习生

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!快手可灵AI技术部负责可灵生成式AI大模型的研发和应用,构建超大规模 AI 基

    阅读全文
  • 文章封面

    ICML 2025 | 又快又强的狮虎兽!仅20M词元微调,Transformer秒切线性RNN

    作者:PaperWeekly发布日期:2025-05-27 13:41:52

    近日上海 AI Lab 联合华南理工大学、香港科技大学(广州)、南京大学和香港中文大学发布了他们的一项研究成果:Liger(狮虎兽),即 Linearizing LLMs to gated recur

    阅读全文
  • 文章封面

    ICML 2025 | 用“人类考试法”戳破AI泡沫:构建能力导向的自适应测评新范式

    作者:PaperWeekly发布日期:2025-05-27 13:41:52

    随着大模型能力持续增强,仅通过观测各个 Benchmark 上的得分来判断一个模型是否真的聪明、值得信赖,可能远远不够。你是否知道:评估一个大模型完整跑完一套标准测试(如 HELM),可能耗时超过 4

    阅读全文
  • 文章封面

    长推理≠高精度!自适应切换“秒答”与“深思”:省Token与提精度的双赢哲学

    作者:PaperWeekly发布日期:2025-05-27 13:41:52

    引言推理能力的进步极大提升了大语言模型(LLMs)和多模态大语言模型(MLLMs)在各类任务中的表现。但过度依赖思维链(CoT)推理会降低模型性能,产生冗长输出,影响效率。研究发现,长 CoT 推理并

    阅读全文
  • 文章封面

    博后招募 | 南方科技大学-新加坡国立大学联合招收图像处理和深度学习方向博士后

    作者:PaperWeekly发布日期:2025-05-27 13:41:52

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南方科技大学南方科技大学统计与数据科学系成立于2019年4月,以建设国际一流的

    阅读全文
  • 文章封面

    社交直男逆袭!通义AMPO炼成“多面脑回路”智能体,自适应推理秒切4种人格

    作者:PaperWeekly发布日期:2025-05-26 13:38:11

    AI 智能体终于学会"灵活变通,察言观色"了!从直觉派到谋略家,让 GPT-4o 甘拜下风的社交高手是如何炼成的?最近,通义实验室的最新研究工作让 AI 智能体掌握了人类高深的社交艺术:四种思考模式的

    阅读全文
  • 文章封面

    告别刷榜内卷!清华×百度提出Feedbacker,开启LLM深度洞察新评估时代

    作者:PaperWeekly发布日期:2025-05-26 13:38:11

    论文标题:From Rankings to Insights: Evaluation Should Shift Focus from Leaderboard to Feedback论文地址:https

    阅读全文
  • 文章封面

    ICML 2025 | 无需训练!清华团队「一行代码」突破视频生成时长“魔咒”

    作者:PaperWeekly发布日期:2025-05-26 13:38:11

    自 OpenAI 发布 Sora 以来,视频生成领域迎来爆发式增长,AI 赋能内容创作的时代已然来临。去年 4 月,生数科技联合清华大学基于团队提出的首个扩散 Transformer 融合架构 U-V

    阅读全文
  • 文章封面

    北京/杭州/上海内推 | 阿里通义实验室招聘强化学习/Agent方向研究型实习生

    作者:PaperWeekly发布日期:2025-05-26 13:38:11

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队致力于强化学习和agent相关方向的关键技术研究。现招聘研究型实习

    阅读全文
  • 文章封面

    Transformer升级之路:多头潜在注意力机制(MLA)究竟好在哪里?

    作者:PaperWeekly发布日期:2025-05-22 14:07:00

    ©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络自从 DeepSeek 爆火后,它所提的 Attention 变体 MLA(Multi-head L

    阅读全文
  • 文章封面

    ACL 2025 | 大模型遗忘之后患上失语症?通过学习新知识实现旧知识遗忘

    作者:PaperWeekly发布日期:2025-05-22 14:07:00

    针对现有大模型知识遗忘方法可能损害生成能力的问题,本文基于“以新知覆盖旧知”的理念,提出了 ReLearn —— 一种将数据增强与模型微调相结合的高效知识遗忘框架。论文题目:ReLearn: Unle

    阅读全文
  • 文章封面

    ICML 2025|自回归OUT!TokenSwift实现无损3倍加速,超长文本也能飞起来

    作者:PaperWeekly发布日期:2025-05-22 14:07:00

    在当前大模型推理愈发复杂的时代,如何快速、高效地产生超长文本,成为了模型部署与优化中的一大核心挑战。随着 GPT-o3,DeepSeek R1 等具备 「超级上下文窗口」 能力的大模型持续刷新业界记录

    阅读全文
  • 文章封面

    北京内推 | 微软亚洲研究院机器学习组-工业创新中心招聘具身智能实习生

    作者:PaperWeekly发布日期:2025-05-22 14:07:00

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲研究院微软亚洲研究院机器学习组从理论、算法、应用等不同层面推动机器学习

    阅读全文
  • 文章封面

    多模态通才「段位战」开卷:General-Level评级出炉,你的模型能冲上铂金吗?

    作者:PaperWeekly发布日期:2025-05-21 13:13:38

    从“单科专家”到“全能通才”:多模态统一的挑战与必要性在人工智能领域,当前许多多模态大模型(MLLM)涌现,成为 AI 社区最重要的研究领域之一。我们见证着 MLLM 从“单科专家”向“全能通才”的演

    阅读全文
  • 文章封面

    ICML 2025 | RLHF太贵太慢?TPO即时对齐新方案,一句话指令搞定偏好优化

    作者:PaperWeekly发布日期:2025-05-21 13:13:38

    TPO:推理时即时偏好对齐的新方案为了让大模型(LLM)的行为更符合人类预期,一系列训练时对齐方法(例如 RLHF 和 DPO)通过微调模型参数来实现偏好优化。然而,这种“训练时对齐”模式不仅耗时耗力

    阅读全文
  • 文章封面

    告别生成偏差!快手Any2Caption智能解耦意图理解,实现可控视频生成

    作者:PaperWeekly发布日期:2025-05-21 13:13:38

    你是否曾幻想过,只需要给 AI 一张草图、一段动作序列,甚至一个相机运动轨迹,它就能生成符合所有条件的视频?这个梦想,已经成为现实!快手与新加坡国立大学联合推出的 Any2Caption,打破了多模态

    阅读全文
  • 文章封面

    北京内推 | 百度文心一言算法团队招聘大模型对齐策略算法工程师/实习生

    作者:PaperWeekly发布日期:2025-05-21 13:13:38

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!百度百度文心(ERNIE)团队致力于预训练大模型基础技术的研究和应用,在预训练

    阅读全文
  • 文章封面

    GRPO=高级版拒绝采样?强化学习祛魅时刻:负样本“去芜存菁”才是关键!

    作者:PaperWeekly发布日期:2025-05-20 12:36:03

    现在大家都用强化学习(RL)来训练大语言模型(LLM)做比较复杂的推理任务,比如数学题。其中,像 PPO 这样的算法虽然主流,但它需要额外的网络(critic network),搞得比较复杂和麻烦。同

    阅读全文
  • 文章封面

    多模态大模型集体翻车,GPT-4o仅50%安全通过率:SIUO揭示跨模态安全盲区

    作者:PaperWeekly发布日期:2025-05-20 12:36:03

    随着通用人工智能(AGI)日益融入人类生活的各个方面,确保多模态大模型的安全对齐已成为亟需解决的重要问题。现有研究大多聚焦于单模态风险(如有害文本或图像),却往往忽视跨模态组合所潜藏的安全隐患——即便

    阅读全文
  • 文章封面

    ICML 2025 | 长文本救星!清华等提出傅里叶位置编码,多项任务全面超越RoPE

    作者:PaperWeekly发布日期:2025-05-20 12:36:03

    ©作者 | 华尔默单位 | 清华大学博士生长文本能力对语言模型(LM,Language Model)尤为重要,试想,如果 LM 可以处理无限长度的输入文本,我们可以预先把所有参考资料都喂给 LM,或许

    阅读全文
  • 文章封面

    科研实习 | 罗格斯大学计算机系唐瑞祥老师招收VLA/LLM等方向暑期科研实习生

    作者:PaperWeekly发布日期:2025-05-20 12:36:03

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!罗格斯大学罗格斯大学,简称RU或Rutgers,全名为新泽西州立罗格斯大学,(

    阅读全文
  • 文章封面

    博士第六年,还没有毕业?

    作者:PaperWeekly发布日期:2025-05-19 13:31:38

    写论文之初最难的是找到一个不错的idea,这是非常重要的。因为如果你有idea的话写起来其实挺快的。主要是多看领域内顶刊文章,模仿别人文献的框架和写作思路,找几篇文献一段一段的模仿写作各个部分!但是说

    阅读全文
  • 文章封面

    ICML 2025 | 360°视频配空间音频:OmniAudio如何重新定义沉浸式体验?

    作者:PaperWeekly发布日期:2025-05-19 13:31:38

    当置身于一场音乐会,闭上眼睛,我们仍能凭借声音判断乐器的位置;在电影院,环绕音效让我们仿佛置身于电影场景之中。空间音频,作为一种能够模拟真实听觉环境的技术,正逐渐成为提升沉浸式体验的关键。然而,现有的

    阅读全文
  • 文章封面

    图像分词器造反了!华为Selftok自回归内核完美统一扩散模型,触发像素自主推理

    作者:PaperWeekly发布日期:2025-05-19 13:31:38

    ©来源 | 机器之心自回归(AR)范式凭借将语言转化为离散 token 的核心技术,在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o,「next-token prediction」以简

    阅读全文
  • 文章封面

    北京内推 | 滴滴出行MPT部门品类交易团队招聘机器学习算法实习生

    作者:PaperWeekly发布日期:2025-05-19 13:31:38

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!滴滴出行我们是滴滴网约车MPT部门的品类交易团队,致力于打造世界顶尖的智能交易

    阅读全文
上一页下一页