为啥越“水”的创新点,越经常爆顶会顶刊?
搞科研,创新点的重要性怎么强调都不为过!找创新点,更是科研过程中难度非常大的核心问题。创新点找的好,实验、写作,投稿、中稿都会非常顺利。绝大部分研究生要发表论文,并不需要搞那种颠覆式的理论创新。实际上
阅读全文搞科研,创新点的重要性怎么强调都不为过!找创新点,更是科研过程中难度非常大的核心问题。创新点找的好,实验、写作,投稿、中稿都会非常顺利。绝大部分研究生要发表论文,并不需要搞那种颠覆式的理论创新。实际上
阅读全文研究背景 & 方法亮点推荐系统(Recommendation System,RS)的核心目标是为用户生成个性化排序列表,但现有推荐模型的架构设计往往忽视了排序属性,导致推荐效果受限。以 LightGC
阅读全文©作者 | 谢春宇,王斌单位 | 360人工智能研究院做为多模态+大模型研究的重要开创性工作,自 20 年 OpenAI 发布第一代图文跨模态模型 CLIP 以来已经过去了 5 年的时间。第一代 CL
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!京东我们是京东集团级核心项目智能体平台和应用(如智能AI面试和培训、数字员工等
阅读全文数创无限 智驭未来2025厦门国际银行数创金融杯大模型应用挑战赛2025年第五届数创金融杯大模型应用挑战赛是由厦门国际银行、厦门大学数据挖掘研究中心联合主办,旨在搭建可落地的金融知识管理与解决方案,为
阅读全文MLLMs “幻觉” 困境:“记忆” 不可靠当前,多模态大语言模型(MLLMs) 能处理视觉、听觉和文本等多种数据,在计算机视觉和自然语言处理等领域大显身手。然而,“幻觉” 问题却成了 MLLMs 的
阅读全文©作者 | 牛子涵单位 | 中国科学技术大学硕士生研究方向 | 情感陪伴大模型虚拟情感陪聊机器人已经成为日常场景中不可或缺的智能伴侣,然而,传统的聊天机器人通常依赖被动响应机制,需用户主动发起话题或维
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡国立大学新加坡国立大学(National University of S
阅读全文对大多数研究生来说,组会无疑是科研路上的“修罗场”。比如,导师深夜发来一篇英文论文,语气轻松:“这个不错,明天你讲讲。”又比如,你整个假期都在摸鱼,直到最后一天晚上才想起明天要汇报,凌晨点灯熬油突击补
阅读全文©PaperWeekly 原创· 作者 | 王群中单位 | 香港中文大学本科生研究方向 | 数据挖掘导读近年来,随着图神经网络(Graph Neural Networks, GNN)在推荐系统、生物信
阅读全文论文地址:https://arxiv.org/pdf/2505.00703代码地址:https://github.com/CaraJ7/T2I-R1最近的大语言模型(LLMs)如 OpenAI o1
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海算法创新研究院上海算法创新研究院&上海交大人工智能学院,诚邀各类精英人才加
阅读全文时间序列分析是数据科学的一个重要分支,目前时间序列分析已经广泛应用于各行各业,从金融市场的预测、工业生产的优化,到医疗健康的监测和智能运维的支持。NeurIPS 2024会议不仅发布了时序的新数据集和
阅读全文近年来,大语言模型(LLMs)展现了在文档问答、长对话、复杂指令遵循等场景下的强大能力。然而,随着上下文长度的增长,一个关键的瓶颈日益凸显——KV Cache(键值缓存)带来的巨大 GPU 显存开销。
阅读全文当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。然而,一些现有智能体更类似于“反应式行动者”(Reactive Actors),主要依赖隐式推理,面对需要
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!北京大学北京大学于2002年创办了我国第一个智能科学系,2003年在国内率先设
阅读全文在人机交互日益普及的背景下,语音以其自然、便捷的优势正成为主流交互方式。虽然已有多款语音模型支持流式音频输出,有效降低了体感延迟,但在生成首个音频片段时仍存在较高的等待时间,成为制约实时部署的关键瓶颈
阅读全文论文标题:MICAS: Multi-grained In-Context Adaptive Sampling for 3D Point Cloud Processing论文链接:https://arx
阅读全文当前大模型研究正逐步从依赖扩展定律(Scaling Law)的预训练,转向聚焦推理能力的后训练。鉴于符号逻辑推理的有效性与普遍性,提升大模型的逻辑推理能力成为解决幻觉问题的关键途径。为推进大语言模型的
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软微软Data Knowledge Intelligence团队,前身为微软
阅读全文研究背景机器学习模型在诸多领域已经取得了显著的成功,例如图像识别、自然语言处理和自动驾驶等。然而,许多机器学习算法依赖于一个限制性极强的假设,即训练数据和测试数据的分布是相似的。这一假设在现实场景中往
阅读全文多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,甚至单独作为 evalua
阅读全文从一张照片重建出逼真的带纹理的人体 3D 模型一直是计算机视觉领域的难题。港科广团队提出的 MultiGO 创新方案,通过分层建模思路破解了这一挑战——将人体分解为不同精度层级,从基础体型到衣物褶皱逐
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!复旦大学探索以人为中心的智能——加入复旦大学计算机科学技术学院 - 智能人机交
阅读全文引言近年来,基于规则的强化学习(RFT)在多模态大语言模型(MLLMs)中的应用取得了显著进展,并且在一些模型上取得了优于监督微调(SFT)的成果。RFT 利用可验证的奖励进行训练,鼓励模型在回答之前
阅读全文任务背景以及 Motivation随着深度视觉-语言预训练的飞速发展,文本驱动的行人检索(Text-based Person Search)已成为公共安全与智能监控领域的热门方向。然而,现有方法为了解
阅读全文©作者 | 周培林单位 | 香港科技大学(广州)随着大语言模型(LLMs)日渐“拟人化”,能写报告、能画图、还能“冲浪查资料”,不少人以为它们已能应对各种任务。但这次,一项由港科大(广州)、北大、浙大
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!字节跳动Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动
阅读全文临近毕业季,不管是硕士生还是博士生,毕业前最大的一关就是盲审。通过了,就基本可以宣告毕业在即;没过,则要面对可能“延毕”的深渊。实话, 论文盲审没过,一度陷入了自我怀疑中,觉得自己干啥都不行,能力不行
阅读全文当前,多模态大语言模型(MLLMs)在视觉-语言理解任务中取得了令人瞩目的进展,其中视觉分词(vision tokenization)作为视觉与语言语义对齐的关键环节,发挥着至关重要的作用。然而,现有
阅读全文