全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    建议所有博士都去学一遍,赢麻了!

    作者:PaperWeekly发布日期:2025-06-11 12:31:52

    搞科研,最怕的就是每天“眼睛读文献,脑袋想方案”。以为只要文献读的够多,准备就足够充分,就能找到好选题,写出好文章。实际上是在用“勤奋读文献”掩盖“不敢开始干”的焦虑。过来人都知道:科研成果是干出来的

    阅读全文
  • 文章封面

    ACL 2025 | 多维阅卷,智识觉醒:打开多模态大模型看图写作评估的认知之门

    作者:PaperWeekly发布日期:2025-06-11 12:31:52

    研究背景:线上文章评分与MLLM的新机遇自动作文评分(AES)是教育评估中的重要技术工具,能实现对大规模写作的高效、稳定评分。然而,传统 AES 实现存在三大缺陷:依赖手工特征,通用性差难以评估细粒度

    阅读全文
  • 文章封面

    视觉感知驱动的多模态推理:阿里通义提出VRAG-RL,定义下一代检索增强生成

    作者:PaperWeekly发布日期:2025-06-11 12:31:52

    在数字化时代,视觉信息在知识传递和决策支持中的重要性日益凸显。然而,传统的检索增强型生成(RAG)方法在处理视觉丰富信息时面临着诸多挑战。一方面,传统的基于文本的方法无法处理视觉相关数据;另一方面,现

    阅读全文
  • 文章封面

    北京内推 | 字节跳动Data-电商团队招聘大模型算法实习生

    作者:PaperWeekly发布日期:2025-06-11 12:31:52

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!字节跳动Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动

    阅读全文
  • 文章封面

    端侧模型卷王诞生!MiniCPM4长文本推理提速5倍,0.5B模型屠榜同级

    作者:PaperWeekly发布日期:2025-06-10 13:45:13

    2025 智源大会,新一代「面壁小钢炮」 MiniCPM4.0 端侧模型发布。一款 8B 稀疏闪电版,带来端侧性能创新式大跃升;一款 0.5B 实力演绎以小博大,适配广泛终端场景。MiniCPM4.0

    阅读全文
  • 文章封面

    ICML 2025 | 不靠复杂架构,经典GNN再证图级任务强基线地位

    作者:PaperWeekly发布日期:2025-06-10 13:45:13

    继作者团队此前对经典图神经网络(GNNs)在节点分类任务中的研究 [1],本研究进一步探讨了经典 GNNs 在图分类与图回归任务中的潜力。为此,本文通过提出 GNN+ 框架,将六项常用超参数技术(边特

    阅读全文
  • 文章封面

    地铁换乘都搞不定?ReasonMap基准揭示多模态大模型细粒度视觉推理短板

    作者:PaperWeekly发布日期:2025-06-10 13:45:13

    近年来,大语言模型(LLMs)以及多模态大模型(MLLMs)在多种场景理解和复杂推理任务中取得突破性进展。然而,一个关键问题仍然值得追问:多模态大模型(MLLMs),真的能“看懂图”了吗?特别是在面对

    阅读全文
  • 文章封面

    博士申请 | 纽约大学(上海)计算机系谭桥宇老师招收LLM/MLLM方向全奖博士生

    作者:PaperWeekly发布日期:2025-06-10 13:45:13

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!纽约大学(上海)上海纽约大学(New York University Shan

    阅读全文
  • 文章封面

    导师放养,偷偷发了顶会……

    作者:PaperWeekly发布日期:2025-06-09 13:33:58

    万物皆卷的时代,升学、就业的竞争越来越激烈,想要保研、申博、进大厂,没有高质量论文在手就相当于“裸奔”!尤其是这个人人惶恐又内卷的时代,想要抓住点什么来增强安全感。有一份拿得出手的成绩——发论文的数量

    阅读全文
  • 文章封面

    ICML 2025 | 抛弃全量微调!北大提出VGP范式,语义低秩分解解锁ViG高效迁移

    作者:PaperWeekly发布日期:2025-06-09 13:33:58

    近日,北京大学在图神经网络(GNN)视觉建模方向提出全新方法 VGP(Vision Graph Prompting),通过语义低秩分解(Semantic Low-Rank Decomposition)

    阅读全文
  • 文章封面

    推理能力飙升,指令遵循暴跌?MathIF基准揭示大模型“服从性漏洞”

    作者:PaperWeekly发布日期:2025-06-09 13:33:58

    如果面前有两个 AI 助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选?最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing

    阅读全文
  • 文章封面

    CogMAEC@ACM MM 2025火热征稿中!探索多模态共情智能的认知密码

    作者:PaperWeekly发布日期:2025-06-09 13:33:58

    当情感计算从“识别情绪”迈向“理解情绪背后的认知机制”,认知智能正成为下一代情感计算的重要突破口。CogMAEC(Cognition-oriented Multimodal Affective and

    阅读全文
  • 文章封面

    SFT+RL双阶训练突破LLM自我监督!人大DeepCritic实现AI批判自主进化

    作者:PaperWeekly发布日期:2025-06-07 23:55:13

    论文标题DeepCritic: Deliberate Critique with Large Language Models论文链接:https://arxiv.org/abs/2505.00662代

    阅读全文
  • 文章封面

    既ZeroSearch之后,通义最新力作MaskSearch提出推理搜索预训练新框架

    作者:PaperWeekly发布日期:2025-06-07 23:55:13

    引言当下,推理与搜索深度融合的模型范式成为 AI 研究的前沿热点。大模型通过在推理过程中灵活调用搜索工具,精准获取关键信息并驱动后续推理,为攻克复杂任务开辟了新路径。通义实验室搜索团队此前的 Zero

    阅读全文
  • 文章封面

    35%准确率蒸发!字节&华科WildDoc揭示多模态文档理解鲁棒性短板

    作者:PaperWeekly发布日期:2025-06-07 23:55:13

    在文档理解领域,多模态大模型(MLLMs)正以惊人的速度进化。从基础文档图像识别到复杂文档理解,它们在扫描或数字文档基准测试(如 DocVQA、ChartQA)中表现出色,这似乎表明 MLLMs 已很

    阅读全文
  • 文章封面

    博士申请 | 香港教育大学徐贯东教授招收LLM Agent/多模态大模型方向博士/博后/RA

    作者:PaperWeekly发布日期:2025-06-07 23:55:13

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港教育大学香港教育大学是香港大学资助委员会(UGC)下属的八所公立大学之一,

    阅读全文
  • 文章封面

    近千篇文献淬炼!哈工大领衔发布首篇长思维链综述:重构大模型推理能力边界

    作者:PaperWeekly发布日期:2025-06-06 13:42:55

    从语言理解到逻辑推理:AI 正驶入“深入思考”的拐点近年来,大语言模型(LLMs)在自然语言处理任务中屡创佳绩,但真正推动它们迈入智能进化新阶段的,是一种更具层次性的推理方式:长思维链(Long Ch

    阅读全文
  • 文章封面

    ICML 2025 | 北大团队提出GAPrompt:仅用2%参数,点云模型精度媲美全量微调

    作者:PaperWeekly发布日期:2025-06-06 13:42:55

    近日北京大学联合浙江大学、华中科技大学发布了一项最新研究成果:GAPrompt(Geometry-Aware Point Cloud Prompt),即一种面向三维视觉预训练模型的几何感知高效微调方法

    阅读全文
  • 文章封面

    告别O(n²)!上海AI Lab开源Linear-MoE:线性注意力+MoE的终极缝合术

    作者:PaperWeekly发布日期:2025-06-06 13:42:55

    近年来随着大语言模型的爆火,旨在取代 Transformer 的高效模型架构及其预训练成为大模型领域的研究热点,主要包括线性序列建模(如 Linear Attention、SSM、Linear RNN

    阅读全文
  • 文章封面

    北京/上海/深圳内推 | 英伟达解决方案架构师高校科研团队招聘AI4Science方向实习生

    作者:PaperWeekly发布日期:2025-06-06 13:42:55

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!NVIDIANVIDIA is widely considered to be

    阅读全文
  • 文章封面

    强得离谱!CNN顶流回归,真·杀疯了

    作者:PaperWeekly发布日期:2025-06-05 13:32:33

    ❓当传统CNN遭遇算力瓶颈,神经压缩技术如何将模型缩小50倍❓液态网络如何模仿人脑实现毫秒级动态响应❓边界注意力怎样突破医疗影像的亚毫米级分割极限如果你对深度学习感兴趣,尤其是卷积神经网络(CNN)和

    阅读全文
  • 文章封面

    让AI也会“权衡利弊”?DecisionFlow让大模型更懂高风险决策!

    作者:PaperWeekly发布日期:2025-06-05 13:32:33

    在大模型的时代,我们早已习惯了它们在聊天、写作、编程等方面的强大能力。但你有没有想过:如果让大模型做“决策”,特别是对于普通人来说两难的决定——比如选哪个病人先抢救、种哪种水果最赚钱、买哪只股票更稳妥

    阅读全文
  • 文章封面

    SIGIR 2025 | Debug你的AI搜索!NExT-Search双模式反馈让模型学会自我纠错

    作者:PaperWeekly发布日期:2025-06-05 13:32:33

    以大语言模型(LLMs)为基础的生成式AI搜索正在重塑信息获取的方式,为用户提供了端到端的答案,极大地降低了用户手动浏览与总结多个网页的繁琐时间成本。然而,虽然这种新范式提升了便捷性,却也破坏了传统网

    阅读全文
  • 文章封面

    北京内推 | 京东广告部招聘NLP/大模型算法实习生

    作者:PaperWeekly发布日期:2025-06-05 13:32:33

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!京东京东广告部是京东的核心技术和业务部门,承担全站流量变现、收入提升的重要职责

    阅读全文
  • 文章封面

    告别「烧显卡」训练!上交大团队发布AutoGnothi:黑盒Transformer实现自我解释

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    ©PaperWeekly 原创 · 作者 | 张林峰单位 | 上海交通大学人工智能学院背景随着人工智能的广泛应用,尤其在视觉和语言处理领域,模型的可解释性变得至关重要。在高风险场景(如医疗和金融)中,

    阅读全文
  • 文章封面

    ACL 2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    跨规模参数知识迁移PKT的全面分析人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。人类的知识传递长期依赖符号语言:从文字、数学公式到编程代码,我们通过符号系统将知识编码、解码。

    阅读全文
  • 文章封面

    无需外部组件!DiT自表征对齐黑科技:扩散模型的高效进化密码

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    论文标题:Representation Alignment for Diffusion Transformers without External Components论文链接:https://arx

    阅读全文
  • 文章封面

    北京内推 | 快手可灵AI技术部招聘视频生成方向暑期算法实习生

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!快手可灵AI技术部负责可灵生成式AI大模型的研发和应用,构建超大规模 AI 基

    阅读全文
  • 文章封面

    ICML 2025 | 又快又强的狮虎兽!仅20M词元微调,Transformer秒切线性RNN

    作者:PaperWeekly发布日期:2025-05-27 13:41:52

    近日上海 AI Lab 联合华南理工大学、香港科技大学(广州)、南京大学和香港中文大学发布了他们的一项研究成果:Liger(狮虎兽),即 Linearizing LLMs to gated recur

    阅读全文
  • 文章封面

    ICML 2025 | 用“人类考试法”戳破AI泡沫:构建能力导向的自适应测评新范式

    作者:PaperWeekly发布日期:2025-05-27 13:41:52

    随着大模型能力持续增强,仅通过观测各个 Benchmark 上的得分来判断一个模型是否真的聪明、值得信赖,可能远远不够。你是否知道:评估一个大模型完整跑完一套标准测试(如 HELM),可能耗时超过 4

    阅读全文
上一页下一页