全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    ICLR 2025 | 英伟达提出FP8训练新范式:减少40%显存占用,训练加速1.43倍

    作者:PaperWeekly发布日期:2025-03-08 22:32:38

    ©作者 | 席浩诚单位 | UC伯克利博士生来源 | 机器之心近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。这表明,F

    阅读全文
  • 文章封面

    CVPR 2025|零训练成本!中科大创新扩散模型概念擦除方法,先验保护较SOTA提升10倍

    作者:PaperWeekly发布日期:2025-03-08 22:32:38

    ©PaperWeekly 原创 · 作者 | 汪远单位 | 中国科学技术大学研究方向 | 图像生成当前,AI 图像生成技术迅猛发展,各类图文生成模型让用户能凭借简单文字描述创作出精美的图像。然而,这也

    阅读全文
  • 文章封面

    博士申请 | 香港大学刘希慧老师招收多模态AI/生成模型方向全奖博士/实习生

    作者:PaperWeekly发布日期:2025-03-08 22:32:38

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港大学香港大学创立于1911年,坐落于繁华的香港岛西部,是香港的首间大学,发

    阅读全文
  • 文章封面

    26届算法应届生,别等秋招了,实习转正才是出路!

    作者:PaperWeekly发布日期:2025-03-07 12:39:37

    最近打开某乎、牛客等互联网论坛,“2025 届春招算法岗”相关话题热度居高不下。“2025 春招算法岗已经卷麻了”“算法岗竞争太激烈,感觉上岸无望”等帖子层出不穷,点进去一看,满是求职者们的焦虑与无奈

    阅读全文
  • 文章封面

    ICLR 2025 | 阿里等提出LLaVA-MoD,用MoE+蒸馏训练轻量化多模态大模型

    作者:PaperWeekly发布日期:2025-03-07 12:39:37

    简介本文提出轻量化多模态大模型 LLaVA-MoD,通过集成稀疏的专家混合(MoE)架构,优化小模型的网络结构,并提出 Dense-to-Sparse 蒸馏框架,结合两阶段蒸馏策略(模仿蒸馏+偏好蒸馏

    阅读全文
  • 文章封面

    复旦NLP团队提出MHA2MLA框架,将任意大模型迁移至DeepSeek MLA

    作者:PaperWeekly发布日期:2025-03-07 12:39:37

    ©作者 | 纪焘单位 | 复旦NLP实验室博士后研究方向| 大模型高效推理DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头

    阅读全文
  • 文章封面

    速来!人工智能未来设计大赛·大模型专项竞技赛正式启动报名

    作者:PaperWeekly发布日期:2025-03-07 12:39:37

    技术革新临界点已至,大模型生态迎来爆发期当前,全球人工智能产业正经历从“暴力美学”到“精巧工程”的范式跃迁。DeepSeek 引领超强大模型的开源开放与普惠化浪潮之下,大模型技术已突破边界逐步渗透至千

    阅读全文
  • 文章封面

    投稿一天接收!还是1区Top期刊,DeepSeek算是被这个课题组玩明白了

    作者:PaperWeekly发布日期:2025-03-06 13:10:37

    DeepSeek可谓是开年的AI界大明星,从论文方面来说,开年后就有意大利老铁已经用国产AI把顶刊SCI玩成了"消消乐"——投稿一天接收,中科院一区6.5分期刊直接盖章认证,这效率比外卖小哥抢单还离谱

    阅读全文
  • 文章封面

    ICLR 2025 | 南洋理工等提出I-GCG:基于优化方法的大模型越狱改进技术

    作者:PaperWeekly发布日期:2025-03-06 13:10:37

    导读近年来,大语言模型(LLMs)在自然语言处理等多个领域展现了卓越的性能。随着这些模型的广泛应用,确保其安全性和对齐性已成为重中之重。然而,LLMs 仍面临越狱攻击的严峻挑战,现有的越狱攻击方法可大

    阅读全文
  • 文章封面

    让RAG更聪明!通义实验室ViDoRAG开启视觉文档检索增强生成新范式

    作者:PaperWeekly发布日期:2025-03-06 13:10:37

    在数字化浪潮席卷而来的今天,视觉文档已然成为信息传递的重要载体。从学术报告中的复杂图表,到商业计划书里的精妙布局,再到医疗档案中的多维数据展示,这些富含视觉元素的文档,不仅仅是简单的文字堆砌,而是融合

    阅读全文
  • 文章封面

    科研实习 | 达特茅斯学院计算机系杨耀青老师招收机器学习科研实习生

    作者:PaperWeekly发布日期:2025-03-06 13:10:37

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!达特茅斯学院达特茅斯学院(Dartmouth College),创建于1769

    阅读全文
  • 文章封面

    DeepSeek R1加千万级学术数据库,科研狗直呼:我论文有救了!

    作者:PaperWeekly发布日期:2025-03-05 13:02:12

    很多科研人,现在都会借助AI工具进行学术创作/科研工作,无论是文献检索整理、内容修改润色,还是拓展创新维度,AI都能提升研究效率。但在使用DeepSeek、ChatGPT这类AI的过程中,总会遇到生成

    阅读全文
  • 文章封面

    WWW 2025 | TAMU、UIUC等提出全新因素链框架,用于论文-评审人匹配

    作者:PaperWeekly发布日期:2025-03-05 13:02:12

    ©PaperWeekly 原创 · 作者 | 张彧单位 | 德州农工大学助理教授随着学术会议论文提交数量的迅速增加,我们越来越依赖有效的论文-评审人匹配模型。此前在这一领域的研究考虑了多种因素来评估评

    阅读全文
  • 文章封面

    无编码器架构潜力或被低估,首个无编码器3D多模态LLM大模型来了

    作者:PaperWeekly发布日期:2025-03-05 13:02:12

    ©作者 | 汤轶文单位 | 上海科技大学、上海AI Lab研究方向 | 3D视觉,大模型高效迁移 许多近期的研究致力于开发大型多模态模型(LMMs),使 LLMs 能够解读多模态信息,如

    阅读全文
  • 文章封面

    CCL 2025赛事开启报名!面向中文语音的实体关系三元组抽取评测

    作者:PaperWeekly发布日期:2025-03-05 13:02:12

    第二十四届中国计算语言学大会(The 24th China National Conference on Computational Linguistics, CCL 2025)将于2025年8月11

    阅读全文
  • 文章封面

    CVPR 2025录用结果出炉!这些方向杀疯了!

    作者:PaperWeekly发布日期:2025-03-04 13:30:13

    CVPR 2025录用结果出炉!!!一年一度的计算机视觉和模式识别会议(CVPR)一直是 CV 界前沿研究的灯塔。今年,共有13008份有效投稿并进入评审流程,其中2878篇被录用,最终录用率为22.

    阅读全文
  • 文章封面

    代码六边形战士!微软原WizardLM团队推出WarriorCoder,全新SOTA代码大模型

    作者:PaperWeekly发布日期:2025-03-04 13:30:13

    背景近年来,大型语言模型(LLMs)在代码相关的任务上展现了惊人的表现,各种代码大模型层出不穷。这些成功的案例表明,在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。除了预训练外,一些通过

    阅读全文
  • 文章封面

    DeepSeek R1也会大脑过载?UC伯克利等新作揭示:少琢磨让计算成本直降43%

    作者:PaperWeekly发布日期:2025-03-04 13:30:13

    ©来源 | 机器之心原来,大型推理模型(Large Reasoning Model,LRM)像人一样,在「用脑过度」也会崩溃,进而行动能力下降。近日,加州大学伯克利分校、UIUC、ETH Zurich

    阅读全文
  • 文章封面

    北京/深圳内推 | 腾讯混元应用模型中心招聘大语言模型应用研究员/实习生

    作者:PaperWeekly发布日期:2025-03-04 13:30:13

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯腾讯混元大模型团队有着充沛的算力资源、丰富的训练数据,以及腾讯业务生态下多

    阅读全文
  • 文章封面

    多模态大模型人类偏好对齐新范式MM-RLHF!10个评估维度全面提升

    作者:PaperWeekly发布日期:2025-03-03 13:22:36

    尽管多模态大语言模型(MLLMs)取得了显著的进展,但现有的先进模型仍然缺乏与人类偏好的充分对齐。这一差距的存在主要是因为现有的对齐研究多集中于某些特定领域(例如减少幻觉问题),是否与人类偏好对齐可以

    阅读全文
  • 文章封面

    ​ICLR 2025 | 无需训练!大幅增强多模态大模型对微小视觉细节的感知

    作者:PaperWeekly发布日期:2025-03-03 13:22:36

    简介在本研究中,我们针对多模态大语言模型(MLLM)在辨识微小视觉信息时的局限性,提出了一套无需额外训练的“可视化干预”方法,巧妙地挖掘并利用模型自身的内部知识(注意力与梯度信息),从而提升模型对小尺

    阅读全文
  • 文章封面

    Springer知识蒸馏专著解读:面向图像识别的知识蒸馏综述

    作者:PaperWeekly发布日期:2025-03-03 13:22:36

    本次文章介绍我们发表于由 Springer 出版的专著《Advancements in Knowledge Distillation: Towards New Horizons of Intellig

    阅读全文
  • 文章封面

    北京/上海内推 | 美团点评技术部招聘大模型生成式内容理解算法专家/实习生

    作者:PaperWeekly发布日期:2025-03-03 13:22:36

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!美团点评技术部-搜索与内容智能成立与2024年7月1日,是大众点评技术部的一个

    阅读全文
  • 文章封面

    大模型多智能体辩论不敌单智能体CoT?上海AI Lab等重新审视多智能体辩论的有效性

    作者:PaperWeekly发布日期:2025-03-02 22:41:27

    “三个臭皮匠,顶个诸葛亮”——这句古老的谚语似乎在大模型领域遇到了挑战。在大模型领域,多智能体辩论(Multi-Agent Debate, MAD)方法持续引发学界关注,并频繁亮相于顶级学术会议。该方

    阅读全文
  • 文章封面

    ICLR 2025 | 北航、港理工等提出全新Node IDs框架,学习超短离散节点表示

    作者:PaperWeekly发布日期:2025-03-02 22:41:27

    ▲ Node ID 示意图我们简要介绍了一种名为 Node Identifiers(Node IDs)的新型节点离散表示学习框架。该框架利用向量量化(Vector Quantization,VQ)技术

    阅读全文
  • 文章封面

    博士申请 | 伊利诺伊理工大学王韧老师招收可信人工智能全奖博士/实习生

    作者:PaperWeekly发布日期:2025-03-02 22:41:27

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!伊利诺伊理工大学伊利诺伊理工是美国著名的研究性私立大学,QS排名全美前80。该

    阅读全文
  • 文章封面

    北京内推 | 美团核心本地商业团队招聘大语言模型算法实习生

    作者:PaperWeekly发布日期:2025-03-02 22:41:27

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!美团核心本地商业(Core Local Commerce)是美团“零售+科技”

    阅读全文
  • 文章封面

    Long-VITA:突破百万Tokens限制!开源多模态大模型新标杆

    作者:PaperWeekly发布日期:2025-03-01 13:55:47

    近期,多模态大模型(MLLMs)发展迅速,但开源模型在长上下文场景(如长视频或高分辨率图像)中仍显著落后于闭源模型。部分专注于长上下文场景的开源模型在短上下文场景(如短视频或静态图像)中又表现不佳。为

    阅读全文
  • 文章封面

    探索跳跃式思维链:DeepSeek创造力垫底,Qwen系列接近人类顶尖水平

    作者:PaperWeekly发布日期:2025-03-01 13:55:47

    ©来源 | 机器之心在大语言模型 (LLM) 的研究中,与以 Chain-of-Thought 为代表的逻辑思维能力相比,LLM 中同等重要的 Leap-of-Thought 能力,也称为创造力,目前

    阅读全文
  • 文章封面

    AAAI 2025 | 西交、港城大等提出LLMEmb,基于LLM的序列推荐嵌入生成器

    作者:PaperWeekly发布日期:2025-03-01 13:55:47

    今天跟大家分享一篇来自西安交通大学、香港城市大学、腾讯优图实验室天衍研究中心、南方科技大学和西湖大学的论文,该论文已被 AAAI 2025 接收。这篇文章提出了一种新颖的基于 LLM 的序列推荐推荐嵌

    阅读全文
上一页下一页