ICML 2026官方“外挂”上线:谷歌Gemini免费润色,但仅限顶会作者使用
ICML 2026 联手 Google 推出论文辅助工具,仅限往届作者使用引发争议。就在今天,ICML 2026 组委会正式公布了一项极具争议的实验计划:与 Google 合作推出“Paper Ass
阅读全文ICML 2026 联手 Google 推出论文辅助工具,仅限往届作者使用引发争议。就在今天,ICML 2026 组委会正式公布了一项极具争议的实验计划:与 Google 合作推出“Paper Ass
阅读全文近年来,大模型的应用正从对话与创意写作,走向更加开放、复杂的研究型问题。尽管以检索增强生成(RAG)为代表的方法缓解了知识获取瓶颈,但其静态的 “一次检索 + 一次生成” 范式,难以支撑多步推理与长期
阅读全文4043 张物理重拍样本,打破信贷 AI 的数据死锁。在多模态大模型不断刷新各种通用榜单的今天,金融信贷却始终是一个让 SOTA 模型感到力不从心的隐秘角落。这并非因为模型不够聪明,而是整个行业长期陷
阅读全文Text-to-SQL(又称 NL2SQL)是一项将用户的自然语言问题自动转换为 SQL 查询的任务,其目标是让不懂 SQL 的用户,也能直接通过自然语言访问数据库。例如,用户只需问一句:“近三年每个
阅读全文Gemma 3n 的技术黑盒,被 DeepSeek 的两篇新论文解开了。Google 在 2025 年 6 月发布 Gemma 3n 的时候,业界的反应分化极其严重。工程界惊叹于它在端侧设备上的极致压
阅读全文TL;DR:本研究提出了一种基于选择的弱监督对齐强模型方法,探索了强模型自主选择利用弱标签的解决超级对齐问题新范式。论文标题:Selective Weak-to-Strong Generalizati
阅读全文单纯拉长上下文并不能自动涌现强化学习能力,引入显式贝叶斯推断才是破局关键。在 In-Context RL 的研究热潮中,往往存在一种惯性思维,认为只要把 Transformer 做大,把上下文窗口拉长
阅读全文当前,大模型+强化学习成为 AI 领域极为热门的研究。现有的强化学习(RL)方法通常将大语言模型(LLM)视为一个单一的整体策略进行优化,主要的算法优化集中在表层的奖励设计等方面,却忽略了模型内部复杂
阅读全文WSD 时代旧经验失效?复旦团队重塑 Scaling Law,让超参设置有章可循。在大模型预训练这项高昂的系统工程中,Batch Size (BS) 和 Learning Rate (LR) 是两个至
阅读全文Insta360 Research 团队提出 DA360 模型,成功解决了全景深度估计在真实开放世界中的两大核心难题:零样本泛化能力不足与尺度不一致性。该模型通过创新的平移参数学习与环形填充技术,并延
阅读全文刚肝完 ACL 别急着投 ICML,先读完这份避坑指南。就在昨天,ICML 2026 的投稿系统已正式对外开放。对于刚结束前两天 ACL 投稿的同学来说,现在或许正准备一鼓作气,将手头剩下的工作,或者
阅读全文AAAI 是人工智能领域顶级的国际学术会议,本文精选了【美团技术团队】被收录的8篇学术论文(附下载链接),覆盖大模型推理、 退火策略、过程奖励模型、强化学习、视觉文本渲染等多个技术领域,欢迎一起交流学
阅读全文首创「反思抑制」机制,让大模型学会在答对的那一刻果断停下。过去一年,大模型推理能力的进化几乎沿着一条单向路径前进:更复杂的推理过程、更长的思维链、更“像人类”的自我反思。在数学和科学推理等 bench
阅读全文多采样 = 更强推理? 在 Inference-time Scaling 成为大模型“最后一公里”标配之后,这几乎成了一条默认公理。从 Self-Consistency、Best-of-N,到 De
阅读全文Scaling 的黄金十年已过,我们正重新踏入一片充满“惊奇与未知”(Wonder and Discovery)的探索之地。这是 OpenAI 前首席科学家 Ilya Sutskever 在 2025
阅读全文摘要香港大学计算和数据科学学院俞益洲教授(https://i.cs.hku.hk/~yzyu/index.html)及其研究团队提出新型语义分割框架 SegMAN,包含全球首个融合动态状态空间模型(M
阅读全文硬核拆解 Transformer 梯度黑盒,从 Softmax 守恒律到 LoRA 微分实战。在深度学习框架高度封装的今天, loss.backward() 是一行魔法代码,它掩盖了计算图中数以亿计参
阅读全文项目主页:https://mico-150k.github.io/GitHub:https://github.com/A113N-W3I/MICo-150KOnline Demo:https://hu
阅读全文别只盯着 Vibe Coding 了,Vibe Researching 才是对传统科研的降维打击。当 Vibe Coding 正在改变代码生成的范式时,斯坦福政治经济学教授 Andrew B. Hal
阅读全文随着大语言模型(LLM)的快速发展,我们正进入一个“模型选择”本身变得越来越复杂的时代。一方面,大模型数量不断增加,不同模型在性能、推理成本以及回答风格上差异显著。另一方面,在真实应用场景中,用户之间
阅读全文全网都在卷 RLVR,但 Bengio 团队刚泼了盆冷水。DeepSeek-R1 的爆火让 RLVR 成为当下大模型后训练的绝对主流。无论是 PPO 还是近期大热的 GRPO,核心逻辑都是一致的:在最
阅读全文©PaperWeekly 原创· 作者 | 钱云航单位 | 新加坡国立大学医学智能体面临着数据隐私和安全、系统的互操作性、临床决策的透明性,准确性和可靠性等关键问题,对患者的健康安全构成严重威胁。针对
阅读全文2026 年的 AI 范式,或许已悄然剧变。在过去的一年里,我们目睹了上下文窗口(Context Window)的疯狂内卷,从 128k 到 1M 再到 10M。然而,这种基于 Transformer
阅读全文随着大语言模型(Large Language Models,LLMs)在问答、推理和决策支持等任务中的广泛应用,越来越多的系统开始引入外部知识以缓解幻觉问题并提升推理能力。这些外部知识通常以多种异构格
阅读全文当字节的 idea 遇上 DeepSeek 的数学洁癖。DeepSeek 似乎养成了一个习惯,专挑节假日给大家上强度。当大家正忙着庆祝新年时,他们悄然在 arXiv 上发布了一篇硬核论文。论文标题:m
阅读全文不是设计,而是进化。当交叉熵遇见 SGD,贝叶斯推理成了唯一的数学必然。长期以来,LLM 的推理能力被视为一种难以解释的“涌现”。我们目睹了 Loss 的下降,却难以透视参数空间内部发生了什么。近日,
阅读全文重磅更新还记得在 CVPR 2025 上首次让多类别异常检测(MUAD)达到单类 UAD 模型水平的 Dinomaly 吗?现在,Dinomaly 进一步进化为了 Dinomaly2 —— 一个真正实
阅读全文比 Transformer 快 24%,无损 SOTA。在长序列建模领域,Transformer 架构凭借其捕捉全局依赖的能力占据主导地位,但其 的计算复杂度始终是扩展上下文长度的主要瓶颈。为了突破
阅读全文在大模型 Scaling Law 依然奏效的今天,为了追求高性能,模型参数量动辄千亿甚至万亿。然而,随之而来的显存墙成为了阻碍模型落地的最大拦路虎。现有的剪枝、量化技术虽然能压缩模型,但往往以牺牲模型
阅读全文今天这篇文章大家一定要仔细看看,说不定不仅能帮你省下不少钱,还能让科研论文写作事半功倍!本周末,在忙于项目的间隙,朋友突然给我分享了一个新发现。他说,PaddleOCR 最近推出了一个新模型——Pad
阅读全文