PaperWeekly

AAAI 2025 | 北航、港城大提出POI-Enhancer：基于大模型的POI表征学习增强框架
作者：PaperWeekly发布日期：2025-03-11 13:17:33
本篇分享 AAAI 2025 论文 POI-Enhancer: An LLM-based Semantic Enhancement Framework for POI Representation L
阅读全文
阿里通义、港科大等提出RAG与长文本对比新框架，助力智能路由决策机制设计
作者：PaperWeekly发布日期：2025-03-11 13:17:33
背景：RAG与长文本语言模型的权衡随着大型语言模型（LLMs）的快速发展，输入长度限制从最初的 4K token 到如今普遍支持的 128K 甚至百万级 token 输入，“长文本”（Long Con
阅读全文
博士申请 | 香港科技大学（广州）许人镜老师招收强化学习/机器人方向博士/硕士
作者：PaperWeekly发布日期：2025-03-11 13:17:33
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港科技大学（广州）香港科技大学是亚洲乃至全球领先的研究学府之一，并被认为是世
阅读全文
DualPipe深入浅出：没有分布式训练基础也能看懂的DualPipe全方位讲解
作者：PaperWeekly发布日期：2025-03-09 21:31:05
©PaperWeekly 原创 · 作者 | 张逸骅单位 | 密歇根州立大学博士生研究方向 | 可信人工智能过去的两周里，DeepSeek 在社交媒体上宣告这是他们的开源周（OpenSourceWee
阅读全文
一句话全自动创建AI智能体，港大AutoAgent打造开源最强Deep Research
作者：PaperWeekly发布日期：2025-03-09 21:31:05
香港大学近期重磅发布开源项目 AutoAgent，这是由黄超教授实验室开发的创新 AI 框架。它最大的特点是：只要用自然语言就能创建 AI 助手，让人工智能应用开发变得特别简单。项目开源仅三周就在 G
阅读全文
ICLR 2025 | 清华、蚂蚁提出大模型推理新范式！将代码形式规划引入推理过程
作者：PaperWeekly发布日期：2025-03-09 21:31:05
©作者 | 温佳鑫单位 | 清华大学硕士生大模型应该以什么形式进行推理？自然语言是表示推理路径的最佳方案吗？2024 年 9 月，OpenAI 携 o1 模型吹响推理革命的号角，以惊人的思维链长度刷新
阅读全文
北京/上海/杭州内推 | 小红书交易算法团队招聘多模态大模型/NLP算法工程师
作者：PaperWeekly发布日期：2025-03-09 21:31:05
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！小红书小红书交易算法团队，主要负责小红书电商、直播侧的算法研发，涵盖交易搜索、
阅读全文
从刷题到搬砖，通用多模态大模型离具身智能还有多远？
作者：PaperWeekly发布日期：2025-03-08 22:32:38
©PaperWeekly 原创 · 作者 | 陈翰扬单位 | 伊利诺伊大学香槟分校研究方向 | 多模态大语言模型▲ EmbodiedBench | 从刷题到搬砖，通用多模态大模型离具身智能还有多远？多
阅读全文
ICLR 2025 | 英伟达提出FP8训练新范式：减少40%显存占用，训练加速1.43倍
作者：PaperWeekly发布日期：2025-03-08 22:32:38
©作者 | 席浩诚单位 | UC伯克利博士生来源 | 机器之心近期DeepSeek V3 引爆国内外的社交媒体，他们在训练中成功应用了 FP8 精度，显著降低了 GPU 内存使用和计算开销。这表明，F
阅读全文
CVPR 2025｜零训练成本！中科大创新扩散模型概念擦除方法，先验保护较SOTA提升10倍
作者：PaperWeekly发布日期：2025-03-08 22:32:38
©PaperWeekly 原创 · 作者 | 汪远单位 | 中国科学技术大学研究方向 | 图像生成当前，AI 图像生成技术迅猛发展，各类图文生成模型让用户能凭借简单文字描述创作出精美的图像。然而，这也
阅读全文
博士申请 | 香港大学刘希慧老师招收多模态AI/生成模型方向全奖博士/实习生
作者：PaperWeekly发布日期：2025-03-08 22:32:38
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港大学香港大学创立于1911年，坐落于繁华的香港岛西部，是香港的首间大学，发
阅读全文
26届算法应届生，别等秋招了，实习转正才是出路！
作者：PaperWeekly发布日期：2025-03-07 12:39:37
最近打开某乎、牛客等互联网论坛，“2025 届春招算法岗”相关话题热度居高不下。“2025 春招算法岗已经卷麻了”“算法岗竞争太激烈，感觉上岸无望”等帖子层出不穷，点进去一看，满是求职者们的焦虑与无奈
阅读全文
ICLR 2025 | 阿里等提出LLaVA-MoD，用MoE+蒸馏训练轻量化多模态大模型
作者：PaperWeekly发布日期：2025-03-07 12:39:37
简介本文提出轻量化多模态大模型 LLaVA-MoD，通过集成稀疏的专家混合（MoE）架构，优化小模型的网络结构，并提出 Dense-to-Sparse 蒸馏框架，结合两阶段蒸馏策略（模仿蒸馏+偏好蒸馏
阅读全文
复旦NLP团队提出MHA2MLA框架，将任意大模型迁移至DeepSeek MLA
作者：PaperWeekly发布日期：2025-03-07 12:39:37
©作者 | 纪焘单位 | 复旦NLP实验室博士后研究方向| 大模型高效推理DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界，特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头
阅读全文
速来！人工智能未来设计大赛·大模型专项竞技赛正式启动报名
作者：PaperWeekly发布日期：2025-03-07 12:39:37
技术革新临界点已至，大模型生态迎来爆发期当前，全球人工智能产业正经历从“暴力美学”到“精巧工程”的范式跃迁。DeepSeek 引领超强大模型的开源开放与普惠化浪潮之下，大模型技术已突破边界逐步渗透至千
阅读全文
投稿一天接收！还是1区Top期刊，DeepSeek算是被这个课题组玩明白了
作者：PaperWeekly发布日期：2025-03-06 13:10:37
DeepSeek可谓是开年的AI界大明星，从论文方面来说，开年后就有意大利老铁已经用国产AI把顶刊SCI玩成了"消消乐"——投稿一天接收，中科院一区6.5分期刊直接盖章认证，这效率比外卖小哥抢单还离谱
阅读全文
ICLR 2025 | 南洋理工等提出I-GCG：基于优化方法的大模型越狱改进技术
作者：PaperWeekly发布日期：2025-03-06 13:10:37
导读近年来，大语言模型（LLMs）在自然语言处理等多个领域展现了卓越的性能。随着这些模型的广泛应用，确保其安全性和对齐性已成为重中之重。然而，LLMs 仍面临越狱攻击的严峻挑战，现有的越狱攻击方法可大
阅读全文
让RAG更聪明！通义实验室ViDoRAG开启视觉文档检索增强生成新范式
作者：PaperWeekly发布日期：2025-03-06 13:10:37
在数字化浪潮席卷而来的今天，视觉文档已然成为信息传递的重要载体。从学术报告中的复杂图表，到商业计划书里的精妙布局，再到医疗档案中的多维数据展示，这些富含视觉元素的文档，不仅仅是简单的文字堆砌，而是融合
阅读全文
科研实习 | 达特茅斯学院计算机系杨耀青老师招收机器学习科研实习生
作者：PaperWeekly发布日期：2025-03-06 13:10:37
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！达特茅斯学院达特茅斯学院（Dartmouth College），创建于1769
阅读全文
DeepSeek R1加千万级学术数据库，科研狗直呼：我论文有救了！
作者：PaperWeekly发布日期：2025-03-05 13:02:12
很多科研人，现在都会借助AI工具进行学术创作/科研工作，无论是文献检索整理、内容修改润色，还是拓展创新维度，AI都能提升研究效率。但在使用DeepSeek、ChatGPT这类AI的过程中，总会遇到生成
阅读全文
WWW 2025 | TAMU、UIUC等提出全新因素链框架，用于论文-评审人匹配
作者：PaperWeekly发布日期：2025-03-05 13:02:12
©PaperWeekly 原创 · 作者 | 张彧单位 | 德州农工大学助理教授随着学术会议论文提交数量的迅速增加，我们越来越依赖有效的论文-评审人匹配模型。此前在这一领域的研究考虑了多种因素来评估评
阅读全文
无编码器架构潜力或被低估，首个无编码器3D多模态LLM大模型来了
作者：PaperWeekly发布日期：2025-03-05 13:02:12
©作者 | 汤轶文单位 | 上海科技大学、上海AI Lab研究方向 | 3D视觉，大模型高效迁移许多近期的研究致力于开发大型多模态模型（LMMs），使 LLMs 能够解读多模态信息，如
阅读全文
CCL 2025赛事开启报名！面向中文语音的实体关系三元组抽取评测
作者：PaperWeekly发布日期：2025-03-05 13:02:12
第二十四届中国计算语言学大会（The 24th China National Conference on Computational Linguistics, CCL 2025）将于2025年8月11
阅读全文
CVPR 2025录用结果出炉！这些方向杀疯了！
作者：PaperWeekly发布日期：2025-03-04 13:30:13
CVPR 2025录用结果出炉！！！一年一度的计算机视觉和模式识别会议（CVPR）一直是 CV 界前沿研究的灯塔。今年，共有13008份有效投稿并进入评审流程，其中2878篇被录用，最终录用率为22.
阅读全文
代码六边形战士！微软原WizardLM团队推出WarriorCoder，全新SOTA代码大模型
作者：PaperWeekly发布日期：2025-03-04 13:30:13
背景近年来，大型语言模型（LLMs）在代码相关的任务上展现了惊人的表现，各种代码大模型层出不穷。这些成功的案例表明，在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。除了预训练外，一些通过
阅读全文
DeepSeek R1也会大脑过载？UC伯克利等新作揭示：少琢磨让计算成本直降43％
作者：PaperWeekly发布日期：2025-03-04 13:30:13
©来源 | 机器之心原来，大型推理模型（Large Reasoning Model，LRM）像人一样，在「用脑过度」也会崩溃，进而行动能力下降。近日，加州大学伯克利分校、UIUC、ETH Zurich
阅读全文
北京/深圳内推 | 腾讯混元应用模型中心招聘大语言模型应用研究员/实习生
作者：PaperWeekly发布日期：2025-03-04 13:30:13
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！腾讯腾讯混元大模型团队有着充沛的算力资源、丰富的训练数据，以及腾讯业务生态下多
阅读全文
多模态大模型人类偏好对齐新范式MM-RLHF！10个评估维度全面提升
作者：PaperWeekly发布日期：2025-03-03 13:22:36
尽管多模态大语言模型（MLLMs）取得了显著的进展，但现有的先进模型仍然缺乏与人类偏好的充分对齐。这一差距的存在主要是因为现有的对齐研究多集中于某些特定领域（例如减少幻觉问题），是否与人类偏好对齐可以
阅读全文
ICLR 2025 | 无需训练！大幅增强多模态大模型对微小视觉细节的感知
作者：PaperWeekly发布日期：2025-03-03 13:22:36
简介在本研究中，我们针对多模态大语言模型（MLLM）在辨识微小视觉信息时的局限性，提出了一套无需额外训练的“可视化干预”方法，巧妙地挖掘并利用模型自身的内部知识（注意力与梯度信息），从而提升模型对小尺
阅读全文
Springer知识蒸馏专著解读：面向图像识别的知识蒸馏综述
作者：PaperWeekly发布日期：2025-03-03 13:22:36
本次文章介绍我们发表于由 Springer 出版的专著《Advancements in Knowledge Distillation: Towards New Horizons of Intellig
阅读全文