全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    别错过!2025年投稿“最后冲刺”:10大国际会议截稿时间全掌握

    作者:PaperWeekly发布日期:2025-08-01 14:06:53

    组委会尊敬的学术界同仁:AC学术平台谨此发布2025年下半年重要学术会议信息公告。经审核,在AC学术平台发布的所有会议均将邀请全球知名学者莅临现场,分享最新学术研究成果,且会议论文均将提交EI数据库。

    阅读全文
  • 文章封面

    ICCV 2025 | UV-CoT登场!无监督也能搞图像级思维链,偏好优化助力CoT跃迁

    作者:PaperWeekly发布日期:2025-08-01 14:06:53

    ©作者 | 赵克森单位 | 南洋理工大学博士生研究方向 | 强化多模态大语言模型 随着文本领域中思维链(Chain-of-Thought,CoT)推理机制的成功应用,研究者开始将该方法引入视觉理解任务

    阅读全文
  • 文章封面

    博士申请 | 香港中文大学(深圳)AI Compiler实验室招收智能计算全奖博士/硕士/博后

    作者:PaperWeekly发布日期:2025-08-01 14:06:53

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)数据科学学院专注于数据科学方向的人才培

    阅读全文
  • 文章封面

    RL推理的尽头,是熵坍缩?统一SFT与强化学习的新视角

    作者:PaperWeekly发布日期:2025-07-31 18:32:48

    在 LLM 的预训练及微调阶段,Scaling Law 告诉了我们所能达到效果范围,其中蕴含了深刻的信息论原理,感兴趣的可以回看笔者之前的文章 [15]。在此原理的支配下,开发者则可以将精力主要关注于

    阅读全文
  • 文章封面

    TNNLS 2025 | 双重引导的锚点学习:信息瓶颈助力高效不完备多视图聚类

    作者:PaperWeekly发布日期:2025-07-31 18:32:48

    不完备多视图聚类(Incomplete Multi-view Clustering,IMC)旨在在不利用标注信息的情况下对有缺失的多视图数据进行表征学习和类别划分,在增强同类样本相似性的同时增加类间差

    阅读全文
  • 文章封面

    RL Scaling大时代来临!siiRL首创全分布式框架,千卡强化学习训练轻松跑通

    作者:PaperWeekly发布日期:2025-07-31 18:32:48

    还在为强化学习(RL)框架的扩展性瓶颈和效率低下而烦恼吗?当模型和集群规模达到上千块 GPU 时,传统的中心化控制器架构难免会遇到性能瓶颈、内存溢出甚至系统崩溃。事实上,当前最顶尖的基础模型,从 De

    阅读全文
  • 文章封面

    北京/上海内推 | 上海人工智能实验室招收大模型/智能体方向算法研究员/实习生

    作者:PaperWeekly发布日期:2025-07-31 18:32:48

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海人工智能实验室上海人工智能实验室安全可信团队致力于大模型、智能体及多智能体

    阅读全文
  • 文章封面

    开源模型也能卷出SOTA!MiroMind-M1高效推理压缩token,训练数据与代码全透明

    作者:PaperWeekly发布日期:2025-07-29 14:11:14

    近日,MiroMind(集智进化) 推出 MiroMind‑M1 系列数学推理语言模型(RLMs),训练数据、代码、模型配方、测试等全流程全部开源,覆盖监督微调(SFT)和强化学习(RL)两大部分。M

    阅读全文
  • 文章封面

    ICCV 2025 | 三维重建和仿真,一步到位!浙大MaGS开辟Mesh+3DGS新范式

    作者:PaperWeekly发布日期:2025-07-29 14:11:14

    ▲ 图0:项目主页如何仅通过单目视频实现对动态三维物体的高质量重建与物理仿真,一直是计算机视觉与图形学领域一个极具挑战性的问题。近期,来自浙江大学等机构的研究者们提出了名为 MaGS(Mesh-ads

    阅读全文
  • 文章封面

    博士申请 | 香港理工大学MIND Lab招收大模型/进化计算等方向全奖博士/博后

    作者:PaperWeekly发布日期:2025-07-29 14:11:14

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港理工大学香港理工大学 (The Hong Kong Polytechnic

    阅读全文
  • 文章封面

    ICML 2025 | 还在裸跑LoRA?CoTo用渐进激活杀出新路,融合剪枝全起飞

    作者:PaperWeekly发布日期:2025-07-29 14:11:14

    还在为 LoRA 训练不稳定、模型融合效果差、剪枝后性能大降而烦恼吗?来自香港城市大学、南方科技大学、浙江大学等机构的研究者们提出了一种简单的渐进式训练策略——CoTo,通过在训练早期随机失活一部分适

    阅读全文
  • 文章封面

    【每个人的AI科学助手】上交、深势科技联合发布全球首个「通用科研智能体」SciMaster

    作者:PaperWeekly发布日期:2025-07-28 13:31:55

    2025 年 7 月 26 日,站在人类智慧探索的前沿,上海交通大学-深势科技-上海算法创新院共同发布真正通用意义的科学基座大模型 Innovator,并依托 Innovator 推出全球首个「通用科

    阅读全文
  • 文章封面

    ACL 2025 | 推理不靠堆参数!CRFT打破CoT瓶颈,0.016%参数撬动18.2%性能

    作者:PaperWeekly发布日期:2025-07-28 13:31:55

    期刊/会议:ACL 2025论文地址:https://arxiv.org/abs/2507.10085作者机构:阿里云智能-飞天实验室论文关键词:LLM reasoning,Chain-of-Thou

    阅读全文
  • 文章封面

    GAIA新王者诞生!Pass@1飙升6.66%,Agent KB靠一招经验池跨模型通吃

    作者:PaperWeekly发布日期:2025-07-28 13:31:55

    近日,来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实

    阅读全文
  • 文章封面

    杭州/北京内推 | 阿里夸克基础大模型团队招收强化学习方向算法工程师/实习生

    作者:PaperWeekly发布日期:2025-07-28 13:31:55

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里巴巴夸克大模型团队致力于全栈自研千亿级参数大模型,聚焦搜索、医疗、

    阅读全文
  • 文章封面

    Transformer升级之路:从计算瓶颈出发,MLA如何实现理论上的“双优”?

    作者:PaperWeekly发布日期:2025-07-25 18:16:31

    ©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络在文章《Transformer升级之路:MLA好在哪里?(上)》中,我们对 MLA 相比常见 MHA

    阅读全文
  • 文章封面

    CVPR 2025 | 一行Dropout干翻多类异常检测?Dinomaly用“极简主义”刷出SOTA

    作者:PaperWeekly发布日期:2025-07-25 18:16:31

    太长不看版:最简单的 trick 刷最高的点,让多类异常检测性能首次逼近甚至超越单类模型水平!现已加入 Intel Open Edge 异常检测工具库 Anomalib。论文标题:Dinomaly:

    阅读全文
  • 文章封面

    ACM MM 2025 | ISDrama让剧本“动”起来!多模态生成沉浸式空间戏剧

    作者:PaperWeekly发布日期:2025-07-25 18:16:31

    © 作者 | 张彧单位 | 浙江大学研究方向 | 音乐/空间音频多模态沉浸式空间戏剧生成旨在基于多模态提示,创建具有戏剧韵律的连续多说话人双耳语音,在增强现实(AR)、虚拟现实(VR)等领域具有潜在应

    阅读全文
  • 文章封面

    博士申请 | 香港科技大学邵琪佳老师招收移动计算和AI方向全奖博士/博后/访问学生

    作者:PaperWeekly发布日期:2025-07-25 18:16:31

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学香港科技大学(The Hong Kong University o

    阅读全文
  • 文章封面

    建议所有博士都去学一遍,真的赢麻了

    作者:PaperWeekly发布日期:2025-07-10 12:31:12

    搞科研,最怕的就是每天“眼睛读文献,脑袋想方案”。以为只要文献读的够多,准备就足够充分,就能找到好选题,写出好文章。实际上是在用“勤奋读文献”掩盖“不敢开始干”的焦虑。过来人都知道:科研成果是干出来的

    阅读全文
  • 文章封面

    ICCV 2025 | 视觉Token跳起来!上交大×蚂蚁联手推出多模态通用加速框架

    作者:PaperWeekly发布日期:2025-07-10 12:31:12

    近日,上海交通大学人工智能研究院晏轶超副教授联合蚂蚁集团的研究团队创新性地提出一种通用的视觉-语言模型加速框架 Skip-Vision。该框架不需要额外的预训练,也不需要重新训练大模型,只需在现有 S

    阅读全文
  • 文章封面

    大模型不再“自由发挥”?KAG-Thinker引入结构化思维,重塑大模型复杂推理范式

    作者:PaperWeekly发布日期:2025-07-10 12:31:12

    近日, 蚂蚁集团知识引擎团队协同浙江大学、同济大学正式发布了其在结构化推理领域的最新成果 —— KAG-Thinker 模型,该模型是 KAG 框架的重要迭代升级,聚焦于为通用或专业领域复杂推理任务构

    阅读全文
  • 文章封面

    博士申请 | 香港科技大学(广州)钟秉灼老师招收具身智能安全全奖博士/博后/RA

    作者:PaperWeekly发布日期:2025-07-10 12:31:12

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)香港科技大学(简称港科大)自1991年成立以来,凭借其锐意

    阅读全文
  • 文章封面

    人物设定一秒入魂!RAIDEN-R1提出可验证奖励新范式,让CoT推理更“人格一致”

    作者:PaperWeekly发布日期:2025-07-08 23:20:34

    背景近年来,随着大语言模型(LLM)的突破性进展,角色扮演对话代理(RPCAs)已成为人工智能领域的前沿研究方向。这类代理旨在模拟虚构角色或公众人物等特定人设,同时保持对预设角色特征的认知能力。工业界

    阅读全文
  • 文章封面

    ACL 2025 | 知道≠会说!UAlign用不确定性纠偏大模型幻觉,事实性对齐更进一步

    作者:PaperWeekly发布日期:2025-07-08 23:20:34

    本系列 blog 是有关大模型幻觉、知识、不确定性等方向的学习笔记分享,我会持续更新相关基础工作和最新研究,相关文献也整理在以下 GitHub 项目中,欢迎关注。https://github.com/

    阅读全文
  • 文章封面

    单个只有7B,组队打穿GPT-4.5!Avengers框架让小模型“组团作战”

    作者:PaperWeekly发布日期:2025-07-08 23:20:34

    本文由上海人工智能实验室,东北大学,西北工业大学联合完成。近年来,大语言模型(如 Gemini-2.5-Pro,GPT-4.1)逐渐被谷歌、OpenAI 等科技巨头垄断,训练成本数百万甚至数千万美元。

    阅读全文
  • 文章封面

    北京内推 | 微软亚洲互联网工程院搜索广告算法团队招聘广告算法实习生

    作者:PaperWeekly发布日期:2025-07-08 23:20:34

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲互联网工程院微软搜索广告算法团队隶属微软亚洲互联网工程院,我们与来自全

    阅读全文
  • 文章封面

    直到毕业我才知道,原来读博延毕是常态

    作者:PaperWeekly发布日期:2025-07-07 13:37:17

    最近经常收到读者的留言 : 抱怨科研真是太难了,竞争压力大,导师不给指导、不开组会,一年见不到导师几次,对于论文初稿、毕业毫无建议! 其实他不是个例,大家也会有这样的烦恼:前沿顶会、期刊论文、综述文献

    阅读全文
  • 文章封面

    ICML 2025 | 会刷题≠懂数学!CogMath打造“认知显微镜”,深扒大模型的数学能力

    作者:PaperWeekly发布日期:2025-07-07 13:37:17

    随着大语言模型(LLMs)在各类推理应用上效果的持续提升,特别是数学基准测试(benchmark)上频繁刷榜,关于它们“是否真正理解数学”的讨论也日益增多。针对这一问题,中国科学技术大学认知智能全国重

    阅读全文
  • 文章封面

    模型顿悟真的存在?推理黑箱中的「Aha Moment」首次被精准捕捉

    作者:PaperWeekly发布日期:2025-07-07 13:37:17

    你肯定见过大模型在解题时「装模作样」地输出:「Hmm…」、「Wait, let me think」、「Therefore…」这些看似「人类化」的思考词。但一个灵魂拷问始终存在:这些词真的代表模型在「思

    阅读全文
上一页下一页