全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    AAAI 2025 | 北航、港城大提出POI-Enhancer:基于大模型的POI表征学习增强框架

    作者:PaperWeekly发布日期:2025-03-11 13:17:33

    本篇分享 AAAI 2025 论文 POI-Enhancer: An LLM-based Semantic Enhancement Framework for POI Representation L

    阅读全文
  • 文章封面

    阿里通义、港科大等提出RAG与长文本对比新框架,助力智能路由决策机制设计

    作者:PaperWeekly发布日期:2025-03-11 13:17:33

    背景:RAG与长文本语言模型的权衡随着大型语言模型(LLMs)的快速发展,输入长度限制从最初的 4K token 到如今普遍支持的 128K 甚至百万级 token 输入,“长文本”(Long Con

    阅读全文
  • 文章封面

    博士申请 | 香港科技大学(广州)许人镜老师招收强化学习/机器人方向博士/硕士

    作者:PaperWeekly发布日期:2025-03-11 13:17:33

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)香港科技大学是亚洲乃至全球领先的研究学府之一,并被认为是世

    阅读全文
  • 文章封面

    DualPipe深入浅出:没有分布式训练基础也能看懂的DualPipe全方位讲解

    作者:PaperWeekly发布日期:2025-03-09 21:31:05

    ©PaperWeekly 原创 · 作者 | 张逸骅单位 | 密歇根州立大学博士生研究方向 | 可信人工智能过去的两周里,DeepSeek 在社交媒体上宣告这是他们的开源周(OpenSourceWee

    阅读全文
  • 文章封面

    一句话全自动创建AI智能体,港大AutoAgent打造开源最强Deep Research

    作者:PaperWeekly发布日期:2025-03-09 21:31:05

    香港大学近期重磅发布开源项目 AutoAgent,这是由黄超教授实验室开发的创新 AI 框架。它最大的特点是:只要用自然语言就能创建 AI 助手,让人工智能应用开发变得特别简单。项目开源仅三周就在 G

    阅读全文
  • 文章封面

    ICLR 2025 | 清华、蚂蚁提出大模型推理新范式!将代码形式规划引入推理过程

    作者:PaperWeekly发布日期:2025-03-09 21:31:05

    ©作者 | 温佳鑫单位 | 清华大学硕士生大模型应该以什么形式进行推理?自然语言是表示推理路径的最佳方案吗?2024 年 9 月,OpenAI 携 o1 模型吹响推理革命的号角,以惊人的思维链长度刷新

    阅读全文
  • 文章封面

    北京/上海/杭州内推 | 小红书交易算法团队招聘多模态大模型/NLP算法工程师

    作者:PaperWeekly发布日期:2025-03-09 21:31:05

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!小红书小红书交易算法团队,主要负责小红书电商、直播侧的算法研发,涵盖交易搜索、

    阅读全文
  • 文章封面

    从刷题到搬砖,通用多模态大模型离具身智能还有多远?

    作者:PaperWeekly发布日期:2025-03-08 22:32:38

    ©PaperWeekly 原创 · 作者 | 陈翰扬单位 | 伊利诺伊大学香槟分校研究方向 | 多模态大语言模型▲ EmbodiedBench | 从刷题到搬砖,通用多模态大模型离具身智能还有多远?多

    阅读全文
  • 文章封面

    ICLR 2025 | 英伟达提出FP8训练新范式:减少40%显存占用,训练加速1.43倍

    作者:PaperWeekly发布日期:2025-03-08 22:32:38

    ©作者 | 席浩诚单位 | UC伯克利博士生来源 | 机器之心近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。这表明,F

    阅读全文
  • 文章封面

    CVPR 2025|零训练成本!中科大创新扩散模型概念擦除方法,先验保护较SOTA提升10倍

    作者:PaperWeekly发布日期:2025-03-08 22:32:38

    ©PaperWeekly 原创 · 作者 | 汪远单位 | 中国科学技术大学研究方向 | 图像生成当前,AI 图像生成技术迅猛发展,各类图文生成模型让用户能凭借简单文字描述创作出精美的图像。然而,这也

    阅读全文
  • 文章封面

    博士申请 | 香港大学刘希慧老师招收多模态AI/生成模型方向全奖博士/实习生

    作者:PaperWeekly发布日期:2025-03-08 22:32:38

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港大学香港大学创立于1911年,坐落于繁华的香港岛西部,是香港的首间大学,发

    阅读全文
  • 文章封面

    26届算法应届生,别等秋招了,实习转正才是出路!

    作者:PaperWeekly发布日期:2025-03-07 12:39:37

    最近打开某乎、牛客等互联网论坛,“2025 届春招算法岗”相关话题热度居高不下。“2025 春招算法岗已经卷麻了”“算法岗竞争太激烈,感觉上岸无望”等帖子层出不穷,点进去一看,满是求职者们的焦虑与无奈

    阅读全文
  • 文章封面

    ICLR 2025 | 阿里等提出LLaVA-MoD,用MoE+蒸馏训练轻量化多模态大模型

    作者:PaperWeekly发布日期:2025-03-07 12:39:37

    简介本文提出轻量化多模态大模型 LLaVA-MoD,通过集成稀疏的专家混合(MoE)架构,优化小模型的网络结构,并提出 Dense-to-Sparse 蒸馏框架,结合两阶段蒸馏策略(模仿蒸馏+偏好蒸馏

    阅读全文
  • 文章封面

    复旦NLP团队提出MHA2MLA框架,将任意大模型迁移至DeepSeek MLA

    作者:PaperWeekly发布日期:2025-03-07 12:39:37

    ©作者 | 纪焘单位 | 复旦NLP实验室博士后研究方向| 大模型高效推理DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头

    阅读全文
  • 文章封面

    速来!人工智能未来设计大赛·大模型专项竞技赛正式启动报名

    作者:PaperWeekly发布日期:2025-03-07 12:39:37

    技术革新临界点已至,大模型生态迎来爆发期当前,全球人工智能产业正经历从“暴力美学”到“精巧工程”的范式跃迁。DeepSeek 引领超强大模型的开源开放与普惠化浪潮之下,大模型技术已突破边界逐步渗透至千

    阅读全文
  • 文章封面

    投稿一天接收!还是1区Top期刊,DeepSeek算是被这个课题组玩明白了

    作者:PaperWeekly发布日期:2025-03-06 13:10:37

    DeepSeek可谓是开年的AI界大明星,从论文方面来说,开年后就有意大利老铁已经用国产AI把顶刊SCI玩成了"消消乐"——投稿一天接收,中科院一区6.5分期刊直接盖章认证,这效率比外卖小哥抢单还离谱

    阅读全文
  • 文章封面

    ICLR 2025 | 南洋理工等提出I-GCG:基于优化方法的大模型越狱改进技术

    作者:PaperWeekly发布日期:2025-03-06 13:10:37

    导读近年来,大语言模型(LLMs)在自然语言处理等多个领域展现了卓越的性能。随着这些模型的广泛应用,确保其安全性和对齐性已成为重中之重。然而,LLMs 仍面临越狱攻击的严峻挑战,现有的越狱攻击方法可大

    阅读全文
  • 文章封面

    让RAG更聪明!通义实验室ViDoRAG开启视觉文档检索增强生成新范式

    作者:PaperWeekly发布日期:2025-03-06 13:10:37

    在数字化浪潮席卷而来的今天,视觉文档已然成为信息传递的重要载体。从学术报告中的复杂图表,到商业计划书里的精妙布局,再到医疗档案中的多维数据展示,这些富含视觉元素的文档,不仅仅是简单的文字堆砌,而是融合

    阅读全文
  • 文章封面

    科研实习 | 达特茅斯学院计算机系杨耀青老师招收机器学习科研实习生

    作者:PaperWeekly发布日期:2025-03-06 13:10:37

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!达特茅斯学院达特茅斯学院(Dartmouth College),创建于1769

    阅读全文
  • 文章封面

    DeepSeek R1加千万级学术数据库,科研狗直呼:我论文有救了!

    作者:PaperWeekly发布日期:2025-03-05 13:02:12

    很多科研人,现在都会借助AI工具进行学术创作/科研工作,无论是文献检索整理、内容修改润色,还是拓展创新维度,AI都能提升研究效率。但在使用DeepSeek、ChatGPT这类AI的过程中,总会遇到生成

    阅读全文
  • 文章封面

    WWW 2025 | TAMU、UIUC等提出全新因素链框架,用于论文-评审人匹配

    作者:PaperWeekly发布日期:2025-03-05 13:02:12

    ©PaperWeekly 原创 · 作者 | 张彧单位 | 德州农工大学助理教授随着学术会议论文提交数量的迅速增加,我们越来越依赖有效的论文-评审人匹配模型。此前在这一领域的研究考虑了多种因素来评估评

    阅读全文
  • 文章封面

    无编码器架构潜力或被低估,首个无编码器3D多模态LLM大模型来了

    作者:PaperWeekly发布日期:2025-03-05 13:02:12

    ©作者 | 汤轶文单位 | 上海科技大学、上海AI Lab研究方向 | 3D视觉,大模型高效迁移 许多近期的研究致力于开发大型多模态模型(LMMs),使 LLMs 能够解读多模态信息,如

    阅读全文
  • 文章封面

    CCL 2025赛事开启报名!面向中文语音的实体关系三元组抽取评测

    作者:PaperWeekly发布日期:2025-03-05 13:02:12

    第二十四届中国计算语言学大会(The 24th China National Conference on Computational Linguistics, CCL 2025)将于2025年8月11

    阅读全文
  • 文章封面

    CVPR 2025录用结果出炉!这些方向杀疯了!

    作者:PaperWeekly发布日期:2025-03-04 13:30:13

    CVPR 2025录用结果出炉!!!一年一度的计算机视觉和模式识别会议(CVPR)一直是 CV 界前沿研究的灯塔。今年,共有13008份有效投稿并进入评审流程,其中2878篇被录用,最终录用率为22.

    阅读全文
  • 文章封面

    代码六边形战士!微软原WizardLM团队推出WarriorCoder,全新SOTA代码大模型

    作者:PaperWeekly发布日期:2025-03-04 13:30:13

    背景近年来,大型语言模型(LLMs)在代码相关的任务上展现了惊人的表现,各种代码大模型层出不穷。这些成功的案例表明,在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。除了预训练外,一些通过

    阅读全文
  • 文章封面

    DeepSeek R1也会大脑过载?UC伯克利等新作揭示:少琢磨让计算成本直降43%

    作者:PaperWeekly发布日期:2025-03-04 13:30:13

    ©来源 | 机器之心原来,大型推理模型(Large Reasoning Model,LRM)像人一样,在「用脑过度」也会崩溃,进而行动能力下降。近日,加州大学伯克利分校、UIUC、ETH Zurich

    阅读全文
  • 文章封面

    北京/深圳内推 | 腾讯混元应用模型中心招聘大语言模型应用研究员/实习生

    作者:PaperWeekly发布日期:2025-03-04 13:30:13

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯腾讯混元大模型团队有着充沛的算力资源、丰富的训练数据,以及腾讯业务生态下多

    阅读全文
  • 文章封面

    多模态大模型人类偏好对齐新范式MM-RLHF!10个评估维度全面提升

    作者:PaperWeekly发布日期:2025-03-03 13:22:36

    尽管多模态大语言模型(MLLMs)取得了显著的进展,但现有的先进模型仍然缺乏与人类偏好的充分对齐。这一差距的存在主要是因为现有的对齐研究多集中于某些特定领域(例如减少幻觉问题),是否与人类偏好对齐可以

    阅读全文
  • 文章封面

    ​ICLR 2025 | 无需训练!大幅增强多模态大模型对微小视觉细节的感知

    作者:PaperWeekly发布日期:2025-03-03 13:22:36

    简介在本研究中,我们针对多模态大语言模型(MLLM)在辨识微小视觉信息时的局限性,提出了一套无需额外训练的“可视化干预”方法,巧妙地挖掘并利用模型自身的内部知识(注意力与梯度信息),从而提升模型对小尺

    阅读全文
  • 文章封面

    Springer知识蒸馏专著解读:面向图像识别的知识蒸馏综述

    作者:PaperWeekly发布日期:2025-03-03 13:22:36

    本次文章介绍我们发表于由 Springer 出版的专著《Advancements in Knowledge Distillation: Towards New Horizons of Intellig

    阅读全文
上一页下一页