Who is Adam热梗成真?SGD在RLVR里重回C位,0.01%参数吊打LoRA
那个被我们遗忘在角落的最原始算法,竟然才是真正的版本答案。NeurIPS 2025 审稿期间,一张截图被传疯了。审稿人那句 “Who is Adam?” 的神回复,瞬间被大家玩成了梗。毕竟在 Tran
阅读全文那个被我们遗忘在角落的最原始算法,竟然才是真正的版本答案。NeurIPS 2025 审稿期间,一张截图被传疯了。审稿人那句 “Who is Adam?” 的神回复,瞬间被大家玩成了梗。毕竟在 Tran
阅读全文©作者 | 简伟健,冷大炜单位 | 360人工智能研究院研究方向 | 多模态理解在大语言模型技术加速渗透各行各业的今天,如何让 AI 在企业级场景中实现精准高效的知识服务,成为行业落地的核心挑战。检索
阅读全文180 万小时、44k 高保真、支持全量微调——刚刚开源的 VoxCPM 1.5,技术细节全解密。最近,面壁技术团队发布了 VoxCPM 1.5 版本,在持续优化开发者开发体验的同时,也带来了多项核心
阅读全文以 CLIP 为代表的视觉语言模型(VLM)在大规模图文数据上进行了预训练,具备强大的通用视觉识别能力。然而,在细粒度识别任务上,VLM 往往难以区分相近类别之间的细微差异,识别能力显著下降。以 CL
阅读全文现在的 Google Scholar,漏洞大得像个筛子。大家每天都在用 Google Scholar 查文献,但可能没几个人意识到,这个我们用来背书学术影响力的工具,其实非常容易被攻破。这两天有人挖出
阅读全文在大语言模型的浪潮中,视频大语言模型(VideoLLMs)正以惊人的速度进化,生成的响应越来越精细。然而,“慢”与计算量大依然是制约其大规模应用的最大痛点。视频序列中海量视觉 token 导致的二次方
阅读全文6B 小模型也能挑战 SOTA?文生图赛道又卷起来了。美团 LongCat 团队刚刚发布并开源了 LongCat-Image 图像生成模型。长期以来,中文生成和精准编辑一直是开源模型的隐痛。现有方案往
阅读全文北京航空航天大学联合澳门大学,共同开发了跨 POI、道路、地块的统一地图要素表征学习工具库:VecCity。该工具库通过统一数据、统一流程、统一测评,集成了 9 座城市数据、复现 21 种主流的时空要
阅读全文揭秘 5825 篇论文背后的新秩序。NeurIPS 2025 刚刚在圣地亚哥落下帷幕。作为全球 AI 领域的风向标,今年的 OpenReview 数据比往年更具冲击力。5825 篇接收论文刷新了历史记
阅读全文开篇:多模态大模型的幻觉顽疾要如何缓解?当你让视觉语言大模型(LVLM)描述一张“猫咪与酒瓶”的图片时,它却生成“猫咪旁边放着一杯咖啡”——这种无中生有的幻觉,早已成为 LVLM 落地的最大绊脚石。
阅读全文从 GPT-4o 的惊艳亮相到 Gemini 的持续迭代,AI不仅能理解文本,更能看懂图像、听辨声音、创作视频,实现跨模态的联合理解与生成。这一前沿领域的核心,正是统一多模态基础模型(Unified
阅读全文近日,来自新加坡管理大学(SMU)、罗切斯特大学(UR)、伦敦大学学院(UCL)、新加坡国立大学(NUS)、香港中文大学(CUHK)、斯坦福大学(Stanford)等顶尖科研机构的研究团队联袂发布了最
阅读全文ICLR 2026 的瓜田,真是一波未平一波又起,根本吃不完。原本以为前两集的审稿连续剧已经够离谱了,大家也就是看几个投机取巧的团队在浑水摸鱼,被发现后撤稿也就剧终了。但现在的局势,似乎远比我们想象的
阅读全文大型语言模型在预训练阶段习得了海量知识,常常被当作知识库使用。但是,模型更新速度远远跟不上世界更新的速度,导致用户常常被过时或虚假的信息欺骗。在更新模型知识时,传统的微调类方法成本高昂且容易导致灾难性
阅读全文Nano Banana 的风,还是吹到了 NeurIPS 现场。经历了全年的 Peer Review 毒打,这届 NeurIPS 终于确诊了。大家不再执着于把 Poster 做成严谨工整的学术汇报,而
阅读全文“低秩(Low-rank)压缩”已经成为大模型压缩和参数高效微调的主要工具,但一个长期悬而未决的问题是:低秩压缩的普遍有效性是否有坚实的数学理论保障?这项由北京航空航天大学联合清华大学完成的理论研究,
阅读全文光波导致动器研究综述Waveguide Photoactuators: Materials, Fabrication, and Applications扫描二维码阅读原文https://doi.org
阅读全文DeepSeek V3.2 的隐藏彩蛋,怎么和 MiniMax 撞脸了?最近几天持续被 DeepSeek V3.2 刷屏。不过,在看热闹之余,我在翻看 OpenRouter 文档时,发现了一个更有意思
阅读全文随着全球多国政府纷纷设定净零排放目标,能源密集型的信息与通信技术(ICT)行业转型已成为关键议题之一。在此背景下,发展高能效计算技术显得尤为重要,具有显著的现实意义与紧迫性。目前,产业界与学术界正携手
阅读全文快手可灵团队再出杀手锏!抛弃传统「抠图修补」的老路,OmniSync 用 DiT 重构口型生成:无惧遮挡、支持无限时长,彻底终结 AI 视频的“面瘫”时代。在视频生成模型快速迭代的当下,从 Sora
阅读全文论文标题:Multi-agent Undercover Gaming: Hallucination Removal through Counterfactual Test for Multimodal
阅读全文人工智能正在改变科学发现的方式。随着科研出版行业加速对人工智能技术的应用,“如何负责任地使用AI”已成为全行业关注的焦点及亟待解决的问题。根据威立于今年10月发布的AI调研报告ExplanAItion
阅读全文清华姚班大二本科生搭档何恺明!新作 iMF 彻底抛弃蒸馏,参数锐减 1/3,从零训练刷新 ImageNet 一步生成 SOTA (FID 1.72) 。在生成式 AI 的前沿赛道中,如何让扩散模型实现
阅读全文继《黑神话》之后,悟空再次震惊世界——这次不是在游戏里,而是在 NeurIPS 2025 上。当《黑神话:悟空》还在让全球玩家查阅“Destiny”的含义时,来自香港大学与南洋理工大学的研究团队,已经
阅读全文随着图神经网络(GNN)在社交网络、生物信息学和推荐系统等领域的广泛应用,数据隐私问题日益成为关注焦点。近期,Stevens Institute of Technology 等团队发表了题为《Safe
阅读全文只要模型做对了就给糖吃?这可能是我们对 RLVR 最大的误解。在 DeepSeek-R1 确立了 GRPO 这一训练范式后,学术界和工业界在提升大模型推理能力时,普遍遵循正向反馈优先的原则,即通过强化
阅读全文还记得 DeepSeek OCR 刚发布时引发的轰动吗?通过将文本转换为图像再进行压缩,实现了 10 倍的 token 压缩率,同时保持 97% 的 OCR 准确率。这一创新让整个 AI 圈为之振奋,
阅读全文博一全年蛰伏零产出,首篇论文即登 Nature 正刊。复旦博士生用深度学习“强解”裸眼 3D 数十年难题,展示了计算如何重构物理世界的底层逻辑。在现在的学术圈,如果一个博士生整整一年没有任何会议投稿、
阅读全文大语言模型(LLM)的智能浪潮席卷全球,它们凭借卓越的上下文理解和文本生成能力,正重塑我们的信息获取方式。然而,其强大的能力背后却隐藏着可靠性的系统性风险——幻觉(hallucination)。简而言
阅读全文这是一次充满黑色幽默的“回旋镖”,也是学术圈今年最响亮的一记耳光。Apple 研究团队投给 ICLR 2026 的一篇论文,标题起得很有哲学意味:《推理究竟哪里出错了?》(Where Did the
阅读全文