长推理≠高精度!自适应切换“秒答”与“深思”:省Token与提精度的双赢哲学
引言推理能力的进步极大提升了大语言模型(LLMs)和多模态大语言模型(MLLMs)在各类任务中的表现。但过度依赖思维链(CoT)推理会降低模型性能,产生冗长输出,影响效率。研究发现,长 CoT 推理并
阅读全文引言推理能力的进步极大提升了大语言模型(LLMs)和多模态大语言模型(MLLMs)在各类任务中的表现。但过度依赖思维链(CoT)推理会降低模型性能,产生冗长输出,影响效率。研究发现,长 CoT 推理并
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南方科技大学南方科技大学统计与数据科学系成立于2019年4月,以建设国际一流的
阅读全文AI 智能体终于学会"灵活变通,察言观色"了!从直觉派到谋略家,让 GPT-4o 甘拜下风的社交高手是如何炼成的?最近,通义实验室的最新研究工作让 AI 智能体掌握了人类高深的社交艺术:四种思考模式的
阅读全文论文标题:From Rankings to Insights: Evaluation Should Shift Focus from Leaderboard to Feedback论文地址:https
阅读全文自 OpenAI 发布 Sora 以来,视频生成领域迎来爆发式增长,AI 赋能内容创作的时代已然来临。去年 4 月,生数科技联合清华大学基于团队提出的首个扩散 Transformer 融合架构 U-V
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队致力于强化学习和agent相关方向的关键技术研究。现招聘研究型实习
阅读全文©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络自从 DeepSeek 爆火后,它所提的 Attention 变体 MLA(Multi-head L
阅读全文针对现有大模型知识遗忘方法可能损害生成能力的问题,本文基于“以新知覆盖旧知”的理念,提出了 ReLearn —— 一种将数据增强与模型微调相结合的高效知识遗忘框架。论文题目:ReLearn: Unle
阅读全文在当前大模型推理愈发复杂的时代,如何快速、高效地产生超长文本,成为了模型部署与优化中的一大核心挑战。随着 GPT-o3,DeepSeek R1 等具备 「超级上下文窗口」 能力的大模型持续刷新业界记录
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲研究院微软亚洲研究院机器学习组从理论、算法、应用等不同层面推动机器学习
阅读全文从“单科专家”到“全能通才”:多模态统一的挑战与必要性在人工智能领域,当前许多多模态大模型(MLLM)涌现,成为 AI 社区最重要的研究领域之一。我们见证着 MLLM 从“单科专家”向“全能通才”的演
阅读全文TPO:推理时即时偏好对齐的新方案为了让大模型(LLM)的行为更符合人类预期,一系列训练时对齐方法(例如 RLHF 和 DPO)通过微调模型参数来实现偏好优化。然而,这种“训练时对齐”模式不仅耗时耗力
阅读全文你是否曾幻想过,只需要给 AI 一张草图、一段动作序列,甚至一个相机运动轨迹,它就能生成符合所有条件的视频?这个梦想,已经成为现实!快手与新加坡国立大学联合推出的 Any2Caption,打破了多模态
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!百度百度文心(ERNIE)团队致力于预训练大模型基础技术的研究和应用,在预训练
阅读全文现在大家都用强化学习(RL)来训练大语言模型(LLM)做比较复杂的推理任务,比如数学题。其中,像 PPO 这样的算法虽然主流,但它需要额外的网络(critic network),搞得比较复杂和麻烦。同
阅读全文随着通用人工智能(AGI)日益融入人类生活的各个方面,确保多模态大模型的安全对齐已成为亟需解决的重要问题。现有研究大多聚焦于单模态风险(如有害文本或图像),却往往忽视跨模态组合所潜藏的安全隐患——即便
阅读全文©作者 | 华尔默单位 | 清华大学博士生长文本能力对语言模型(LM,Language Model)尤为重要,试想,如果 LM 可以处理无限长度的输入文本,我们可以预先把所有参考资料都喂给 LM,或许
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!罗格斯大学罗格斯大学,简称RU或Rutgers,全名为新泽西州立罗格斯大学,(
阅读全文写论文之初最难的是找到一个不错的idea,这是非常重要的。因为如果你有idea的话写起来其实挺快的。主要是多看领域内顶刊文章,模仿别人文献的框架和写作思路,找几篇文献一段一段的模仿写作各个部分!但是说
阅读全文当置身于一场音乐会,闭上眼睛,我们仍能凭借声音判断乐器的位置;在电影院,环绕音效让我们仿佛置身于电影场景之中。空间音频,作为一种能够模拟真实听觉环境的技术,正逐渐成为提升沉浸式体验的关键。然而,现有的
阅读全文©来源 | 机器之心自回归(AR)范式凭借将语言转化为离散 token 的核心技术,在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o,「next-token prediction」以简
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!滴滴出行我们是滴滴网约车MPT部门的品类交易团队,致力于打造世界顶尖的智能交易
阅读全文搞科研,创新点的重要性怎么强调都不为过!找创新点,更是科研过程中难度非常大的核心问题。创新点找的好,实验、写作,投稿、中稿都会非常顺利。绝大部分研究生要发表论文,并不需要搞那种颠覆式的理论创新。实际上
阅读全文研究背景 & 方法亮点推荐系统(Recommendation System,RS)的核心目标是为用户生成个性化排序列表,但现有推荐模型的架构设计往往忽视了排序属性,导致推荐效果受限。以 LightGC
阅读全文©作者 | 谢春宇,王斌单位 | 360人工智能研究院做为多模态+大模型研究的重要开创性工作,自 20 年 OpenAI 发布第一代图文跨模态模型 CLIP 以来已经过去了 5 年的时间。第一代 CL
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!京东我们是京东集团级核心项目智能体平台和应用(如智能AI面试和培训、数字员工等
阅读全文数创无限 智驭未来2025厦门国际银行数创金融杯大模型应用挑战赛2025年第五届数创金融杯大模型应用挑战赛是由厦门国际银行、厦门大学数据挖掘研究中心联合主办,旨在搭建可落地的金融知识管理与解决方案,为
阅读全文MLLMs “幻觉” 困境:“记忆” 不可靠当前,多模态大语言模型(MLLMs) 能处理视觉、听觉和文本等多种数据,在计算机视觉和自然语言处理等领域大显身手。然而,“幻觉” 问题却成了 MLLMs 的
阅读全文©作者 | 牛子涵单位 | 中国科学技术大学硕士生研究方向 | 情感陪伴大模型虚拟情感陪聊机器人已经成为日常场景中不可或缺的智能伴侣,然而,传统的聊天机器人通常依赖被动响应机制,需用户主动发起话题或维
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡国立大学新加坡国立大学(National University of S
阅读全文