从CoT到MCoT!NUS、港中文等发布「多模态思维链」重磅综述,280篇文献深度解析
随着人工智能(AI)向通用智能(AGI)迈进,单一模态的链式思维(Chain-of-Thought,CoT)已难以应对现实世界中多源异构数据的复杂推理需求。这篇综述全面梳理了 MCoT 的理论框架、技
阅读全文随着人工智能(AI)向通用智能(AGI)迈进,单一模态的链式思维(Chain-of-Thought,CoT)已难以应对现实世界中多源异构数据的复杂推理需求。这篇综述全面梳理了 MCoT 的理论框架、技
阅读全文引言在当前的 CAD 参数化任务中,主流方案往往仅聚焦于工程图纸的几何图层,而忽视了标注图层的重要性。上述这一局限性导致许多学术上的解决方案难以直接应用于实际工业设计流程中。为了填补学术社区中这一类数
阅读全文©作者 | 陈晓栋单位 | 中国人民大学硕士生来源 | AI Time模型剪枝是一类重要而且应用广泛的模型压缩方法,其通过移除神经网络中的冗余的结构或权重,在尽量保持模型准确度的前提下减少模型的大小,
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!字节跳动字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 A
阅读全文惨了,中科院分区表出了后,博士一区top秒变二区。。。那些期刊、会议潜规则是需要经验才能把握的。对于刚接触科研的小白来说,搞科研真的不是看看课就会搞的,有人手把手带你搞科研,比你花费大量的时间去听课有
阅读全文背景与挑战随着 ChatGPT 掀起自回归建模革命后,近年来研究者们开始探索自回归建模在视觉生成任务的应用,将视觉和文本数据统一在 “next-token prediction” 框架下。实现自回归图
阅读全文最近,全球 AI 和机器学习顶会 ICLR 2025 公布了论文录取结果:由 IDEA、清华大学、北京大学、香港科技大学(广州)联合团队提出的 ChartMoE 成功入选 Oral (口头报告) 论文
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯微信事业群负责搭建和运营微信生态体系,为全球超过13亿用户提供便捷的社交生
阅读全文“物联网学域介绍INTERNET OF THINGS香港科技大学(广州)下设的信息枢纽所建立的物联网学域,依托于香港科技大学在无线通信与网络领域世界领先的教学和科研优势,将进一步推动中国成为物联网领域
阅读全文3月29日,在2025中关村论坛青年科学主题论坛上,深势科技联合北京科学智能研究院( AISI )正式发布了全新版本的玻尔( Bohrium )科研空间站。这一以量子力学先驱尼尔斯·玻尔命名的 AI
阅读全文在 3D 场景重建与表示领域,三维高斯(3D-GS)因为其快速的渲染速度,灵活的显式表示,易于编辑的特性,已成为了当前的主流技术。三维高斯在各种下游任务,如动态场景重建,三维语义分割,数字人等都得到了
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海人工智能实验室上海人工智能实验室安全团队专注于研究大语言模型、多模态大模型
阅读全文©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络众所周知,完整训练一次大型 LLM 的成本是昂贵的,这就决定了我们不可能直接在大型 LLM 上反复测
阅读全文研究背景研究问题:这篇文章要解决的问题是如何在统一框架下对基于图的检索增强生成(RAG)方法进行系统的比较和分析。具体来说,现有的基于图的 RAG 方法没有在同一实验设置下进行系统的比较。研究难点:该
阅读全文©作者 | 吴旻烨、戴海钊等单位 | 鲁汶大学、上海科技大学来源 | 机器之心三维高斯泼溅(3D Gaussian Splatting, 3DGS)技术基于高斯分布的概率模型叠加来表征场景,但其重建结
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!中国电信人工智能研究院中国电信人工智能研究院(简称TeleAI)由中国电信集团
阅读全文2025开年,AI技术打得火热,正在改变程序员的职业命运:阿里云核心业务全部接入Agent体系;字节跳动30%后端岗位要求大模型开发能力;腾讯、京东、百度开放招聘技术岗,80%与AI相关……大模型正在
阅读全文检索增强生成(RAG)通过巧妙结合先进的检索与生成技术,特别适用于法律、医疗、金融等对事实准确性要求极高的关键领域,能显著提升 LLMs 的专业应用能力。但 RAG 真的安全吗?显然,攻击者可以操纵
阅读全文近年来,深度学习在偏微分方程(PDEs)求解中展现出前所未有的潜力。从气象模拟到材料科学,基于数据驱动的神经网络模型正不断重塑科学计算的边界。尤其是神经场(Implicit Neural Repres
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!北京大学北京大学计算机学院涵盖了国内计算机专业最全面的研究方向。在计算机理论、
阅读全文在当下 AI 竞争白热化的战场中,算法研发小伙伴们正面临着前所未有的挑战。模型训练速度哪怕再加快一点,复杂算法运行再流畅一些,都可能成为开发之路上的重大突破点。A5000 显卡以“性价比之高”一跃成为
阅读全文在持续学习问题中,域增量学习(Domain-Incremental Learning, DIL)是一个重要的研究方向。它要求模型能够逐步适应不同领域的新概念,同时避免遗忘之前学到的知识。然而,现有的预
阅读全文在当今各类大语言模型以及视频模型中,长序列场景越来越普遍,而 Attention 的计算复杂度随着序列长度呈平方增长,成为长序列任务下的主要计算瓶颈。此前,清华大学陈键飞团队提出的即插即用量化的 Sa
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软AIMicrosoft AI DKI (Data, Knowledge &
阅读全文本文由香港城市大学联合华为诺亚方舟实验室,香港科技大学(广州)等机构合作完成。该工作录用于 ICLR 2025,并且入选 Spotlight(8886)。论文背景大型语言模型(LLMs)近年来在多个领
阅读全文NeurIPS 24 论文 “Interactive Deep Clustering via Value Mining” 提出在聚类过程中引入用户交互,通过询问少量高价值样本的类别从属关系,有效缓解了
阅读全文扩散模型已经在 2D、视频乃至 3D 内容生成方面取得了巨大成功,而现在,研究人员的目光已转向 4D 生成,通过多样化的控制条件生成时空一致性 4D 资产。让用户可以身临其境创造、操控自己的 4D 世
阅读全文无人驾驶飞行器 (UAV),也称为无人机,由于能够从空中捕获高质量的多媒体数据,近年来变得越来越流行。 随着航空摄影、电影摄影和测绘等多媒体应用的兴起,无人机已成为收集丰富多样的多媒体内容的强大工具。
阅读全文类别增量学习(CIL)或持续学习是智能系统在现实场景中亟需的关键能力,要求模型在持续学习新任务的同时保持原有知识的完整性。传统 CIL 方法主要依赖视觉信息进行特征提取,而近年来兴起的视觉-语言模型(
阅读全文大型语言模型(LLMs)在生成信息时通常存在知识滞后和信息准确性不足的问题,这使得开发高效且精准的知识更新技术成为一项关键需求。然而,现有的模型编辑方法仅限于编辑特定类型的知识,如三元组知识,无法满足
阅读全文