7倍推理加速!清华团队发布稀疏Attention,无需训练加速一切模型
在当今各类大语言模型以及视频模型中,长序列场景越来越普遍,而 Attention 的计算复杂度随着序列长度呈平方增长,成为长序列任务下的主要计算瓶颈。此前,清华大学陈键飞团队提出的即插即用量化的 Sa
阅读全文在当今各类大语言模型以及视频模型中,长序列场景越来越普遍,而 Attention 的计算复杂度随着序列长度呈平方增长,成为长序列任务下的主要计算瓶颈。此前,清华大学陈键飞团队提出的即插即用量化的 Sa
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软AIMicrosoft AI DKI (Data, Knowledge &
阅读全文本文由香港城市大学联合华为诺亚方舟实验室,香港科技大学(广州)等机构合作完成。该工作录用于 ICLR 2025,并且入选 Spotlight(8886)。论文背景大型语言模型(LLMs)近年来在多个领
阅读全文NeurIPS 24 论文 “Interactive Deep Clustering via Value Mining” 提出在聚类过程中引入用户交互,通过询问少量高价值样本的类别从属关系,有效缓解了
阅读全文扩散模型已经在 2D、视频乃至 3D 内容生成方面取得了巨大成功,而现在,研究人员的目光已转向 4D 生成,通过多样化的控制条件生成时空一致性 4D 资产。让用户可以身临其境创造、操控自己的 4D 世
阅读全文无人驾驶飞行器 (UAV),也称为无人机,由于能够从空中捕获高质量的多媒体数据,近年来变得越来越流行。 随着航空摄影、电影摄影和测绘等多媒体应用的兴起,无人机已成为收集丰富多样的多媒体内容的强大工具。
阅读全文类别增量学习(CIL)或持续学习是智能系统在现实场景中亟需的关键能力,要求模型在持续学习新任务的同时保持原有知识的完整性。传统 CIL 方法主要依赖视觉信息进行特征提取,而近年来兴起的视觉-语言模型(
阅读全文大型语言模型(LLMs)在生成信息时通常存在知识滞后和信息准确性不足的问题,这使得开发高效且精准的知识更新技术成为一项关键需求。然而,现有的模型编辑方法仅限于编辑特定类型的知识,如三元组知识,无法满足
阅读全文本篇分享阿里-高德的动态视频评估新作 VMBench: ABenchmark for Perception-Aligned Video Motion Generation。本文提出了一个面向感知对齐的
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!360人工智能研究院360人工智能研究院是360集团在AI方向的核心技术团队,
阅读全文如何准确且高效地构建 3D 模型、理解和生成 3D 世界正在成为 AGI、AI for Science、具身智能三大 AI 热门领域共同关注的焦点。而随着 AI 技术的发展,大型语言模型(LLM)与大
阅读全文当 GPT-4o 流畅解析量子力学、Gemini 2.0 精准推导热力学公式、o3 以接近人类的准确率攻克 ARC-AGI 挑战、DeepSeek 在数学推理中展现惊人效率时,一个根本问题始终悬而未决
阅读全文在人工智能领域,大型语言模型(LLMs)如 GPT 系列已经在文本生成和理解任务中展现了强大的能力。然而,当涉及到空间推理任务时,LLMs 的表现却显得力不从心。空间推理不仅要求模型理解复杂的空间关系
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!BOSS直聘我们是BOSS直聘大模型研发团队,团队核心成员均为北大毕业,从零自
阅读全文在人工智能领域中,大型视觉-语言模型(LVLM)正以前所未有的速度快速发展,诸如 GPT-4.5、GPT-4o、Claude 和 Gemini 系列模型相继涌现,在图像理解、视觉问答和跨模态推理任务中
阅读全文论文题目:A Survey on Image Quality Assessment: Insights, Analysis, and Future Outlook作者单位:北京大学、厦门大学论文地址:
阅读全文©作者 | 庄义昱单位 | 南京大学博士生研究方向 | 三维生成与重建▲ 图1 IDOL 速览在虚拟现实、游戏和 3D 内容创作领域,从单张图像高保真重建可动画的 3D 人体一直是一项极具挑战性的任务
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海算法创新研究院我们是来自上海算法创新研究院大模型中心的算法团队,团队成员来
阅读全文近期,随着大型自回归模型在自然语言处理、图像生成和语音合成等领域的广泛应用,实时性和效率问题逐渐成为制约其发展的关键瓶颈。在这一背景下,如何在保持高质量输出的同时,显著提升模型的推理速度,以满足实时应
阅读全文引言在知识密集型场景中,让智能系统生成与事实一致的响应一直以来都是研究人员的目标。尽管现在大语言模型(LLMs)在其参数记忆中内化了大量的世界知识,但仍然受限于虚构事实。引入非参数(即基于检索的)知识
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里巴巴通义实验室招聘研究型实习生,面向下一代RAG技术如Deep R
阅读全文上周,CVPR 2025的论文接收结果正式公布!今年的竞争异常激烈,共收到13008份投稿,最终仅有2878篇被录用,录取率仅为22.1%。作为计算机视觉领域的顶级盛会,CVPR堪称论文界的“奥斯卡”
阅读全文如何有效评估大型视觉语言模型(LVLMs)的事实问答能力?传统的端到端评估基准是否是最佳方案?如何有效标注具有挑战性的多模态事实问答基准?VisualSimpleQA 提供了一套解决方案。有效评估 L
阅读全文概述随着大型语言模型(LLMs)驱动的 Agent 和多 Agent 系统(MAS)的快速发展,Agent 的安全问题日益受到关注。然而,现有研究在系统性方面仍有提升空间。为应对这一挑战,来自南洋理工
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡科技设计大学新加坡科技设计大学(Singapore University
阅读全文©PaperWeekly原创 · 作者 | 高世平单位 | 中山大学硕士生研究方向 | 语言模型偏好对齐背景在 AI 的世界里,大型语言模型(LLMs)凭借强大的参数量和计算能力,已经能够生成与人类偏
阅读全文近年来,随着 o1 或 Deepseek-r1 等推理模型在复杂决策和推理任务中的迅速发展,强化学习(Reinforcement Learning, RL)在模型训练与推理优化中的价值越发凸显。通过对
阅读全文视频异常检测(VAD)系统广泛应用于监控、安防、交通管理等领域,能够自动识别异常事件,如暴力行为、交通事故等,从而减少人工干预、提高效率。在大模型时代,随着大规模预训练模型,尤其是视觉语言模型(VLM
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯AI Lab腾讯AI Lab是腾讯的企业级AI实验室,于2016年4月在深
阅读全文