ACL 2026 | 大模型为何“视而不思”?浙大×阿里揭秘MoE分心机制
Mixture-of-Experts(MoE)架构已成为当前大规模视觉-语言模型的主流范式。通过稀疏激活机制,MoE 模型在保持计算效率的同时,能够处理视觉与文本信息之间复杂的交互关系。然而,研究团队
阅读全文Mixture-of-Experts(MoE)架构已成为当前大规模视觉-语言模型的主流范式。通过稀疏激活机制,MoE 模型在保持计算效率的同时,能够处理视觉与文本信息之间复杂的交互关系。然而,研究团队
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯优图实验室腾讯优图实验室成立于 2012 年,是腾讯旗下先进的 AI 实验
阅读全文面壁 9B 端到端模型首发 Omni-Flow 框架,单卡 RTX 5070 直接跑通全模态全双工交互。你有没有想过,不用联网、仅用一张消费级显卡,就能在个人电脑上拥有一个「边看、边听、边说、还能主动
阅读全文LLM 在后训练结束时,参数就固定了。无论之后做多少推理,模型本身不会有任何变化。测试时训练(TTT)希望让模型在推理阶段也能从遇到的问题中持续学习。然而现有的 TTT 方法(如 TTRL、EMPO)
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!蚂蚁集团我们是致力于构建世界级通用人工智能基座——百灵的核心技术团队。在这里,
阅读全文如果我们只花 200 美金,用最简单的架构跑一遍大模型,让它们从头到尾独立搞一次科研,真实结果会怎样?©PaperWeekly 原创 · 作者 | Demons单位 | 康奈尔大学计算机博士生研究方向
阅读全文从自动化系统、人工智能到复杂系统研究,一个共同趋势日益显现:研究对象正由结构清晰、边界明确的单体系统,转向高度耦合、动态演化的系统整体,“系统行为如何在不确定环境中被理解、预测与约束”逐渐成为跨学科关
阅读全文只靠公开论文,就能蒸馏学术大牛。在学术圈,想真正摸清一位资深学者的思考方式,通常需要花上好几年去精读文献。但最近,有团队选择直接把大牛给“蒸馏”了。具体做法是,梳理学者过往著作中的推理逻辑,再把这些原
阅读全文Advanced Science 青年科学家创新奖 (Advanced Science Young Innovator Award) 面向全球青年科学家开放,旨在表彰在材料科学与化学、物理和工程、生命
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里通义实验室阿里巴巴通义实验室-对话智能团队以大模型对话技术为核心,研究及应
阅读全文顶会越来越卷,与其在天坑里盲目死磕,不如用这五年的两万份真实投稿数据,给自己的选题算一卦。ICLR 2026 官方公布的数据显示,今年的整体录用率仅为 27.4%。在顶会命中率持续走低的大环境下,前期
阅读全文随着大语言模型(LLM)驱动的多智能体系统快速发展,越来越多的系统被用于软件工程、科学分析、网页自动化、组织协作和社会模拟等任务。但一个核心问题始终没有被系统回答:为什么有些智能体架构可以支持长链条、
阅读全文过去两年,大模型的能力突飞猛进。从文本生成到多模态理解,它们已经逐渐成为很多人日常使用的工具。但随着使用深入,一个问题也变得越来越明显:这些模型虽然强大,却并不真正“懂你”。在与模型的互动中,我们不断
阅读全文大模型的设计正迎来新的范式:从人类可读的离散显式符号空间,转向机器原生的连续潜在空间。近期,新加坡国立大学、复旦大学、清华大学等国内外顶尖高校与科研机构,联合发布了大模型潜在空间领域首个统一系统性全景
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!美团LongCat——美团基础大模型,不只聪明,更懂生活。从语言理解到全模态感
阅读全文机器人在现实中总“翻车”?只因跨不过那道模态鸿沟。今天,具身智能真正的 ImageNet 时刻终于到来。从 2025 年春晚的《秧 BOT》,到 2026 年春晚里走进武术、小品等不同节目,机器人已经
阅读全文TL;DR:本研究提出首个面向角色扮演模型泛化能力的信息论理解框架:通过 R-EMID 度量分布偏移下的性能退化,并形式化揭示用户、角色与对话组合偏移的影响机制。 论文标题:Understanding
阅读全文挑高光、对节拍、梳理剧情,这些繁琐的剪辑细活,CutClaw 现在一句话就能接过去。颠覆体验!AI 不止会拼接素材,更能听指令、卡节奏过去的视频自动剪辑方法,核心能力往往局限于文本对齐或画面高光提取。
阅读全文大模型写代码这件事,越来越像「既能写片段,又离真实工程差一截」。HumanEval、SWE-Bench、ClassEval……榜单很多,但多数仍在考函数、类,或在既有仓库里打补丁。真正让人头疼的 0
阅读全文PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 从机器遗忘到更广泛的模型调控 直播嘉宾 刘思佳密歇根州立大学杰出副教授MIT-IBM Watson AI Lab客座教授
阅读全文当 AI 智能体(Agent)从实验室走向现实,我们该如何确信它们在复杂场景下依然听话?近日,复旦大学、上海创智学院与牛津大学联合研究团队发表研究论文 AutoControl Arena,提出“逻辑-
阅读全文ClawKeeper 把技能、插件和 Watcher 接到一起,把 OpenClaw 安全从零散防护做成完整体系。近日,由北京邮电大学、北京智源人工智能研究院、中国信息通信研究院联合推出 ClawKe
阅读全文大模型其实“心里有数”,天生具备高效推理的潜能。论文标题:Does Your Reasoning Model Implicitly Know When to Stop Thinking?研究团队:北航
阅读全文现有大模型评测分数日趋饱和,但与真实体验差距显著。南京大学傅朝友团队牵头,在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。凭借创新的分层能力体系与组级非线性
阅读全文Advanced Computing 是一本聚焦计算机科学全领域的开放获取期刊,从理论基础、软件工程到人工智能、计算机视觉及新兴技术等方向,都属于其发表范畴。内容范围包括但不限于以下领域: 理论计算机
阅读全文LLM 长程(Long-horizon)Agent 在进行环境多轮交互时,容易陷入“越用越慢、越用越不稳”的困境:历史轨迹不断累积,Context 线性膨胀,Token 成本飙升,还会触发 “Lost
阅读全文随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」,各种各样如 OpenClaw 的 agentic applications 正在成为当前研究与产业共同关注的核心方向。无论是在网页环境中进
阅读全文我们开始期待机器本身学会运行。若你也曾想过:“AI 最终会成为一种计算机”,那本文就是写给你的。过去几十年,计算机逐渐成为人类完成任务的重要媒介。最近几年,AI 也开始进入这个位置:它不再只回答问题,
阅读全文近年来,通用图像编辑模型已经能够在一定程度上完成表情修改。从“微笑”到“愤怒”,这些高层语义的编辑已经不再困难。但当我们希望进一步控制表情时,一个更本质的问题会逐渐显现:表情可以被改变,但仍然难以被精
阅读全文