ICML 2025 | 别再只拼CoT了!不完备信息下的主动推理,LLM普遍掉线
大语言模型(Large Language Model, LLM)在复杂推理任务中表现卓越。借助链式思维(Chain-of-Thought, CoT),LLM 能够将复杂问题分解为简单步骤,充分探索解题
阅读全文大语言模型(Large Language Model, LLM)在复杂推理任务中表现卓越。借助链式思维(Chain-of-Thought, CoT),LLM 能够将复杂问题分解为简单步骤,充分探索解题
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!北京大学北京大学计算机学院潘亮铭老师课题组招收自然语言处理/大模型方向科研实习
阅读全文最近经常收到读者的留言 : 抱怨科研真是太难了,竞争压力大,导师不给指导、不开组会,一年见不到导师几次,对于论文初稿、毕业论文毫无建议!无论什么专业的研究生,面对这样的灵魂拷问,很有可能都要陷入沉思。
阅读全文还认为 Focal Loss 只能在有监督场景使用?还在为 3D 检测模型在分布外泛化的不稳定性焦虑?来自北京大学,香港中文大学和鹏城实验室的最新研究提出了 DUO 框架(Dual Uncertain
阅读全文近年来,强化学习(RL)在大型语言模型(LLM)的微调过程中,尤其是在推理能力提升方面,取得了显著的成效。传统的强化学习方法,如近端策略优化(Proximal Policy Optimization,
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯音乐腾讯音乐天琴实验室致力于对音视频相关AI方向研究,持续推出创新技术,提
阅读全文近日,百川公开 1 万 6000 字的 M2 完整技术报告,几乎每一个训练过程、创新方法,以及背后的思考都毫不保留的详细阐述,这让关注大模型、后训练最前沿技术探索的从业者获得感满满。 接下来,本文将带
阅读全文介绍图异常检测(Graph Anomaly Detection,GAD)旨在识别与图中大多数节点不同的异常节点,近年来已受到广泛关注。现有的一般化图模型虽然在多种图任务中取得了显著成功,但在推广到 G
阅读全文推理大模型(Large Reasoning Model)极大的促进了自然语言处理领域的发展,而信息检索领域的核心问题之一是文档排序,如何利用强大的推理大模型通过主动推理来判断文档的相关性,进而再对文档
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)是一所经教育部批准,参照中外合作办学条
阅读全文发不出顶会顶刊,不是因为你不够努力,而是因为你仍在沿用那套低效、耗时的传统科研模式!传统模式要求你“从0到1”搞出一个极具创新的idea,然后花大量时间去验证、实现。这种模式对于科研新手来说,失败概率
阅读全文多模态大模型(MLLM)在高层次视觉理解与推理任务上展现出惊艳能力。然而,如果你仔细观察,就会发现一个的事实:它们在一些看似简单、直观、人类幼儿都能轻松完成的任务中,却频频「翻车」。比如,「一个玩具被
阅读全文近几年,空间音频从“更高质量到音频”走向“可被理解与生成的三维声场”。它不只是把声音变“立体”,而是让系统理解声源的方位、距离、运动,并能按需生成。在 AR/VR、影视、游戏与交互内容的牵引下,研究重
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队负责夸克教育多模态大模型的建设工作,有机会接触到前沿的多模态大模型
阅读全文前段时间由谷歌 Deepmind 组织的 AI 象棋大战万众瞩目,最终由出自 OpenAI 的 O3 夺冠。事实上,用策略游戏的对战来评测大模型并不是第一次被提出,被 ACL 2025 接收的论文 G
阅读全文随着人工智能技术的不断演进,大语言模型正逐步从简单的“快思考”模式,转向更注重推理深度与逻辑连贯性的“慢思考”范式。以 DeepSeek-R1 为代表的新型大模型,通过引入强化学习机制强化长思维链推理
阅读全文尽管 LLM 的能力与日俱增,但其在复杂任务上的表现仍受限于静态的内部知识。为从根本上解决这一限制,突破 AI 能力界限,业界研究者们提出了 Agentic Deep Research 系统,在该系统
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软微软亚太研发集团成立于2006年1月18日,是微软在美国之外职能最完备的研
阅读全文本文第一作者为丁国峰,四川大学计算机学院 2024 级硕士研究生。研究方向为多模态检索、多模态理解,指导老师为彭玺教授。论文标题:Visual Abstraction: A Plug-and-Play
阅读全文深度神经网络之所以卓越,在于它能逐层提炼数据特征,把复杂的高维信息逐渐“压缩”为规整的低维几何结构。但这种学习过程究竟如何由非线性、噪声、学习率等多重因素共同涌现,长期缺乏直观统一的解释。近日,巴塞尔
阅读全文还在为跑不过别人的模型而头疼吗?ACM MM Asia(CCF-C)的 #BraveNewIdeas (BNI) Track 就是为你准备的! 会议时间:2025 年 12月 9 日到 12 月 12
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!北京大学北京大学计算机学院涵盖了国内计算机专业最全面的研究方向。在计算机理论、
阅读全文©作者 | 白强伟单位 | 熵基科技研究方向 | 强化学习在大语言模型推理与强化学习研究中,如何直接优化 Pass@K 指标一直是核心挑战。来自 Google DeepMind 的作者团队在他们的最新
阅读全文腾讯 ARC Lab 联合中科院自动化所、香港城市大学、浙江大学等机构提出 TokLIP,在视觉 token 与统一多模态理解生成之间,架起了一座语义桥梁,训练数据量仅需同类方法的 20%,还可以在图
阅读全文©作者 | 张彧单位 | 浙江大学研究方向 | 音乐/空间音频歌曲生成的核心是基于各种提示生成可控的高质量歌曲。然而,现有方法难以生成具有提示控制的人声和伴奏,且不能实现两者间很好的对齐。此外,它们在
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!联想研究院团队专注于自研时序预测基础模型、预测智能体、时序推理模型与因果分析等
阅读全文近期,OpenAI 通过推出 GPT-5 打响了大模型降本增效的第一枪:在多个挑战性数据集上创下新高的同时,相比 Gemini 和 Claude 大幅降低了使用成本。为此,GPT-5 首次引入多模型路
阅读全文论文题目:Visual Contextual Attack: Jailbreaking MLLMs with Image-Driven Context Injection论文机构:Shanghai A
阅读全文随着 AI 技术的飞速发展,从「快思考」到 「慢思考」,大语言模型(LLMs)在处理复杂推理任务上展现出惊人的能力。无论是我们熟知的思维链(CoT),还是更复杂的深度思考模式(Thinking),都让
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软微软DKI (data knowledge intelligence) 大
阅读全文