CVPR 2025高分论文!单图1秒变3D真人,全新方法IDOL解决数字人重建问题
©作者 | 庄义昱单位 | 南京大学博士生研究方向 | 三维生成与重建▲ 图1 IDOL 速览在虚拟现实、游戏和 3D 内容创作领域,从单张图像高保真重建可动画的 3D 人体一直是一项极具挑战性的任务
阅读全文©作者 | 庄义昱单位 | 南京大学博士生研究方向 | 三维生成与重建▲ 图1 IDOL 速览在虚拟现实、游戏和 3D 内容创作领域,从单张图像高保真重建可动画的 3D 人体一直是一项极具挑战性的任务
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海算法创新研究院我们是来自上海算法创新研究院大模型中心的算法团队,团队成员来
阅读全文近期,随着大型自回归模型在自然语言处理、图像生成和语音合成等领域的广泛应用,实时性和效率问题逐渐成为制约其发展的关键瓶颈。在这一背景下,如何在保持高质量输出的同时,显著提升模型的推理速度,以满足实时应
阅读全文引言在知识密集型场景中,让智能系统生成与事实一致的响应一直以来都是研究人员的目标。尽管现在大语言模型(LLMs)在其参数记忆中内化了大量的世界知识,但仍然受限于虚构事实。引入非参数(即基于检索的)知识
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里巴巴通义实验室招聘研究型实习生,面向下一代RAG技术如Deep R
阅读全文上周,CVPR 2025的论文接收结果正式公布!今年的竞争异常激烈,共收到13008份投稿,最终仅有2878篇被录用,录取率仅为22.1%。作为计算机视觉领域的顶级盛会,CVPR堪称论文界的“奥斯卡”
阅读全文如何有效评估大型视觉语言模型(LVLMs)的事实问答能力?传统的端到端评估基准是否是最佳方案?如何有效标注具有挑战性的多模态事实问答基准?VisualSimpleQA 提供了一套解决方案。有效评估 L
阅读全文概述随着大型语言模型(LLMs)驱动的 Agent 和多 Agent 系统(MAS)的快速发展,Agent 的安全问题日益受到关注。然而,现有研究在系统性方面仍有提升空间。为应对这一挑战,来自南洋理工
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡科技设计大学新加坡科技设计大学(Singapore University
阅读全文©PaperWeekly原创 · 作者 | 高世平单位 | 中山大学硕士生研究方向 | 语言模型偏好对齐背景在 AI 的世界里,大型语言模型(LLMs)凭借强大的参数量和计算能力,已经能够生成与人类偏
阅读全文近年来,随着 o1 或 Deepseek-r1 等推理模型在复杂决策和推理任务中的迅速发展,强化学习(Reinforcement Learning, RL)在模型训练与推理优化中的价值越发凸显。通过对
阅读全文视频异常检测(VAD)系统广泛应用于监控、安防、交通管理等领域,能够自动识别异常事件,如暴力行为、交通事故等,从而减少人工干预、提高效率。在大模型时代,随着大规模预训练模型,尤其是视觉语言模型(VLM
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯AI Lab腾讯AI Lab是腾讯的企业级AI实验室,于2016年4月在深
阅读全文Sparrow 仅使用 30K 混合数据,性能超越 100K 视频数据达 1.7%;同时,Sparrow 在数据规模 scaling 上去后这一差距更加明显,在同样达到 100K 数据量时领先达到了
阅读全文当 GPT-4o 在高考考场游刃有余,当 DeepSeek 对千年历史人物如数家珍,一个震撼人心的猜想正冲击着整个 AI 界:这些大语言模型是否已悄然孕育出超越人类的“超级智能”?在认知科学的定义里,
阅读全文©作者 | 孟繁青单位 | 上海交通大学研究方向 | 多模态大模型论文标题:MM-EUREKA: Exploring Visual Aha Moment with Rule-based Large-s
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)2022年6月29日,国家教育部宣布依法批准正式设立香港科
阅读全文大家是不是都感觉写学术论文真是无从下手啊!写文章之初最难的是找到一个不错的idea,这是非常重要的。这个比写作难的不止一点,如果你有idea的话写起来其实挺快的。主要是多看领域内顶刊文章,模仿别人文献
阅读全文在 NLP 领域,大模型(LLMs)凭借其强大的理解和推理能力,正在重塑行业格局。另一方面,多模态大模型,尤其是以语音交互为核心的模型也开始崛起,技术发展迅猛,前景广阔。以 GPT-4o 为例,语音与
阅读全文©作者 | 刘强、楚梦渝单位 | 慕尼黑工业大学、北京大学研究方向 | 深度学习在深度学习的多个应用场景中,联合优化多个损失项是一个普遍的问题。典型的例子包括物理信息神经网络(Physics-Info
阅读全文作为信息检索领域的顶级盛会,SIGIR每年汇聚全球学术与产业精英,分享前沿技术与研究突破。2025年7月17日,第二届AgentIR研讨会将在意大利帕多瓦与SIGIR 2025同期举行,聚焦Agent
阅读全文来自中科院、MBZUAI、港科广、港城、华东师大、小红书等 8 家机构的研究人员总结超过 300 篇文献,系统地回顾了大模型推理能力发展的主要脉络,经典技术,热点问题。其中,第一作者李忠志、张笃振来自
阅读全文导读随着人工智能的迅猛发展,统一理解与生成的大模型技术已广泛应用于多个领域,为解决复杂问题提供了全新的视角与工具。在众多应用场景中,医学领域对人工智能的需求尤为迫切,将先进的 AI 技术与医学深度结合
阅读全文©PaperWeekly 原创 · 作者 | 李永奇单位 | 武汉大学研究方向 | 自然语言处理Background在开始介绍我们的论文前,先简要介绍一下:1)什么是 super-alignment?
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!vivovivo影像算法研究部主要负责研发和优化vivo手机的影像算法及芯片化
阅读全文©PaperWeekly 原创 · 作者 | 王琦、李佳键单位 | 上海交大、宁波东方理工大学研究方向 | 强化学习、世界模型LS-Imagine 通过纯视觉观测来玩 Minecraft,仿照人类玩家
阅读全文©PaperWeekly 原创 · 作者 | 郭文祥单位 | 浙江大学研究方向 | 音乐生成歌声合成任务旨在通过输入的歌词和乐谱生成高质量的歌声。随着深度学习技术的发展,现有方法在生成自然且高质量的音
阅读全文©作者 | 胡逸凡单位 | 同济大学研究方向 | 时序预测背景介绍▲ 图1 现有金融时间序列预测方法分类金融时间序列预测在量化投资领域中占据着核心地位。由于市场价格变化受到多种因素的影响,如宏观经济数
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南京大学-NTU南京大学智能科学与技术学院长期招收博士生、硕士生、研究助理及实
阅读全文