SIGIR 2025 | Debug你的AI搜索!NExT-Search双模式反馈让模型学会自我纠错
以大语言模型(LLMs)为基础的生成式AI搜索正在重塑信息获取的方式,为用户提供了端到端的答案,极大地降低了用户手动浏览与总结多个网页的繁琐时间成本。然而,虽然这种新范式提升了便捷性,却也破坏了传统网
阅读全文以大语言模型(LLMs)为基础的生成式AI搜索正在重塑信息获取的方式,为用户提供了端到端的答案,极大地降低了用户手动浏览与总结多个网页的繁琐时间成本。然而,虽然这种新范式提升了便捷性,却也破坏了传统网
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!京东京东广告部是京东的核心技术和业务部门,承担全站流量变现、收入提升的重要职责
阅读全文©PaperWeekly 原创 · 作者 | 张林峰单位 | 上海交通大学人工智能学院背景随着人工智能的广泛应用,尤其在视觉和语言处理领域,模型的可解释性变得至关重要。在高风险场景(如医疗和金融)中,
阅读全文跨规模参数知识迁移PKT的全面分析人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。人类的知识传递长期依赖符号语言:从文字、数学公式到编程代码,我们通过符号系统将知识编码、解码。
阅读全文论文标题:Representation Alignment for Diffusion Transformers without External Components论文链接:https://arx
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!快手可灵AI技术部负责可灵生成式AI大模型的研发和应用,构建超大规模 AI 基
阅读全文近日上海 AI Lab 联合华南理工大学、香港科技大学(广州)、南京大学和香港中文大学发布了他们的一项研究成果:Liger(狮虎兽),即 Linearizing LLMs to gated recur
阅读全文随着大模型能力持续增强,仅通过观测各个 Benchmark 上的得分来判断一个模型是否真的聪明、值得信赖,可能远远不够。你是否知道:评估一个大模型完整跑完一套标准测试(如 HELM),可能耗时超过 4
阅读全文引言推理能力的进步极大提升了大语言模型(LLMs)和多模态大语言模型(MLLMs)在各类任务中的表现。但过度依赖思维链(CoT)推理会降低模型性能,产生冗长输出,影响效率。研究发现,长 CoT 推理并
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南方科技大学南方科技大学统计与数据科学系成立于2019年4月,以建设国际一流的
阅读全文AI 智能体终于学会"灵活变通,察言观色"了!从直觉派到谋略家,让 GPT-4o 甘拜下风的社交高手是如何炼成的?最近,通义实验室的最新研究工作让 AI 智能体掌握了人类高深的社交艺术:四种思考模式的
阅读全文论文标题:From Rankings to Insights: Evaluation Should Shift Focus from Leaderboard to Feedback论文地址:https
阅读全文自 OpenAI 发布 Sora 以来,视频生成领域迎来爆发式增长,AI 赋能内容创作的时代已然来临。去年 4 月,生数科技联合清华大学基于团队提出的首个扩散 Transformer 融合架构 U-V
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队致力于强化学习和agent相关方向的关键技术研究。现招聘研究型实习
阅读全文©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络自从 DeepSeek 爆火后,它所提的 Attention 变体 MLA(Multi-head L
阅读全文针对现有大模型知识遗忘方法可能损害生成能力的问题,本文基于“以新知覆盖旧知”的理念,提出了 ReLearn —— 一种将数据增强与模型微调相结合的高效知识遗忘框架。论文题目:ReLearn: Unle
阅读全文在当前大模型推理愈发复杂的时代,如何快速、高效地产生超长文本,成为了模型部署与优化中的一大核心挑战。随着 GPT-o3,DeepSeek R1 等具备 「超级上下文窗口」 能力的大模型持续刷新业界记录
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲研究院微软亚洲研究院机器学习组从理论、算法、应用等不同层面推动机器学习
阅读全文从“单科专家”到“全能通才”:多模态统一的挑战与必要性在人工智能领域,当前许多多模态大模型(MLLM)涌现,成为 AI 社区最重要的研究领域之一。我们见证着 MLLM 从“单科专家”向“全能通才”的演
阅读全文TPO:推理时即时偏好对齐的新方案为了让大模型(LLM)的行为更符合人类预期,一系列训练时对齐方法(例如 RLHF 和 DPO)通过微调模型参数来实现偏好优化。然而,这种“训练时对齐”模式不仅耗时耗力
阅读全文你是否曾幻想过,只需要给 AI 一张草图、一段动作序列,甚至一个相机运动轨迹,它就能生成符合所有条件的视频?这个梦想,已经成为现实!快手与新加坡国立大学联合推出的 Any2Caption,打破了多模态
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!百度百度文心(ERNIE)团队致力于预训练大模型基础技术的研究和应用,在预训练
阅读全文现在大家都用强化学习(RL)来训练大语言模型(LLM)做比较复杂的推理任务,比如数学题。其中,像 PPO 这样的算法虽然主流,但它需要额外的网络(critic network),搞得比较复杂和麻烦。同
阅读全文随着通用人工智能(AGI)日益融入人类生活的各个方面,确保多模态大模型的安全对齐已成为亟需解决的重要问题。现有研究大多聚焦于单模态风险(如有害文本或图像),却往往忽视跨模态组合所潜藏的安全隐患——即便
阅读全文©作者 | 华尔默单位 | 清华大学博士生长文本能力对语言模型(LM,Language Model)尤为重要,试想,如果 LM 可以处理无限长度的输入文本,我们可以预先把所有参考资料都喂给 LM,或许
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!罗格斯大学罗格斯大学,简称RU或Rutgers,全名为新泽西州立罗格斯大学,(
阅读全文写论文之初最难的是找到一个不错的idea,这是非常重要的。因为如果你有idea的话写起来其实挺快的。主要是多看领域内顶刊文章,模仿别人文献的框架和写作思路,找几篇文献一段一段的模仿写作各个部分!但是说
阅读全文当置身于一场音乐会,闭上眼睛,我们仍能凭借声音判断乐器的位置;在电影院,环绕音效让我们仿佛置身于电影场景之中。空间音频,作为一种能够模拟真实听觉环境的技术,正逐渐成为提升沉浸式体验的关键。然而,现有的
阅读全文©来源 | 机器之心自回归(AR)范式凭借将语言转化为离散 token 的核心技术,在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o,「next-token prediction」以简
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!滴滴出行我们是滴滴网约车MPT部门的品类交易团队,致力于打造世界顶尖的智能交易
阅读全文