ICML 2025 | 乱写Prompt更给力?删几个Token,上下文学习立刻“反向觉醒”
©PaperWeekly 原创· 作者|王剑羽单位 | 阿里达摩院算法工程师或许你会觉得 LLMs 进步这么快,各种 SFT、RLHF 技术飞速迭代,大模型知道如何使用自然语言进行沟通,花时间调一个详
阅读全文©PaperWeekly 原创· 作者|王剑羽单位 | 阿里达摩院算法工程师或许你会觉得 LLMs 进步这么快,各种 SFT、RLHF 技术飞速迭代,大模型知道如何使用自然语言进行沟通,花时间调一个详
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯我们正在寻找优秀青云实习生与我们携手,共同探索迈向通用人工智能 (AGI)
阅读全文扩散大语言模型(dLLMs)凭借并行解码与独特的全局规划能力,有望解决自回归(AR)大模型的效率瓶瓶颈和规划能力缺陷。但其「全局规划」能力依赖于其双向注意力对所有后文的关注,这带来了严重的计算冗余,从
阅读全文©作者 | 皓天研究方向 | AI安全、推理&规划训练跑得慢、收敛不稳,很多人第一反应是算力不足、参数没调好。但问题往往更隐蔽:pg-loss 的期望计算本身可能就错了。当 rollout≠polic
阅读全文在类增量学习(Class-Incremental Learning, CIL)中,模型需要在不断学习新任务的同时保留旧知识,避免灾难性遗忘。近期,大规模预训练模型(如 CLIP)展现了强大的泛化与零样
阅读全文尽管大型语言模型(LLM)拥有广泛的世界知识和强大的推理能力,被广泛视为优秀的少样本学习者,但在处理需要大量示例的上下文学习(ICL)时仍存在明显局限。已有工作表明,即使提供多达上百甚至上千条示例,L
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!字节跳动国际电商是以国际化短视频产品为载体的内容电商业务,致力于成为用户发现并
阅读全文你是否曾经在书架前寻找一本书,却因为密密麻麻的书脊而眼花缭乱?或者在超市货架前,面对琳琅满目的商品标签而一时找不到目标?其实,视觉语言模型(VLMs)也面临着同样的困扰。最近,来自中科院计算所的研究团
阅读全文今年 ICML Outstanding Paper “COLLABLLM: From Passive Responders to Active Collaborators” 把从被动到主动的人机协作推
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡国立大学新加坡国立大学(National University of S
阅读全文近年来,大语言模型(LLMs)在复杂推理任务上的能力突飞猛进,这在很大程度上得益于深度思考的策略,即通过增加测试时(test-time)的计算量,让模型生成更长的思维链(Chain-of-Though
阅读全文©PaperWeekly 原创· 作者 | 桂润泉学校 | 中国科学技术大学硕士生研究方向 | 大语言模型复杂推理、复杂规划在大语言模型(LLMs)飞速发展的今天,它们在数学计算、逻辑推理等领域已展现
阅读全文随着大语言模型(LLMs)在新闻创作、学术研究、评论生成等领域的广泛应用,其潜在滥用风险引发了公众对内容真实性的担忧,如 AI 生成假新闻误导舆论、AI 代写学术内容引发学术不端等问题。在此背景下,构
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软M365 Copilot 团队是微软在智能办公领域的核心研发力量,致力于打
阅读全文©作者 | Chong Jie单位 | 上海交通大学研究方向 | 参数高效微调放在开头:这篇文章会比较零碎,是由我之前做过的一次分享记录而成。我没有特意去梳理文章,直接把讲稿拿来主义,属于知识比较密集
阅读全文大语言模型(LLM)的滥用(如学术抄袭、虚假信息生成)推动了 LLM 文本检测器的发展,用于判别由模型生成的文本。为规避这些检测器,研究人员提出了重写攻击,即有意重写文本以逃避检测。尽管已有一定成效,
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南京大学南京大学智能科学与技术学院是南京大学在苏州校区首批建设的学院之一。在人
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴LLM research 团队是隶属于阿里巴巴通义实验室的前沿研究团队
阅读全文©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络众所周知,我们很早就开始尝试将 Muon 用于大规模 LLM 的训练。特别地,在QK-Clip巧解M
阅读全文©PaperWeekly 原创· 作者 | 张剑清单位 | 上海交通大学我们在 GitHub 上开源了一个异构模型间知识迁移框架 HtFLlib,中稿 KDD 并获评 Best Paper Runne
阅读全文在检索增强生成(RAG)飞速发展的当下,研究者们面临的最大困境并非「生成」,而是「稳定」。 低信噪比让关键信息淹没在冗余文档里,错误累计则让推理链像骨牌一样层层坍塌。这两大顽疾,使得现有 RAG 系统
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!小红书小红书智能审核算法团队,致力于通过多模态、大模型、Agent等算法能力,
阅读全文大语言模型(LLMs)的“聪明与否”,很大程度上表现在它们能否真正完成复杂推理。过去,研究者常依赖显式链式推理(Chain-of-Thought,CoT),让模型逐步写出思考过程,虽然可解释,但输出冗
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡国立大学新加坡国立大学(National University of S
阅读全文在大模型的持续进化过程中,我们见证了单体模型(monolithic LLM/agents)逐渐让位于更复杂、更灵活的多智能体(multi-agent)系统。后者往往通过多个大模型协同运作,再配合工具调
阅读全文人工智能正在深刻改变人类社会,同时带来技术与伦理的新挑战。为推动跨学科交流与高水平研究,英国工程技术学会(IET)与上海交通大学联合推出AI新刊 Artificial Intelligence for
阅读全文©来源 | 机器之心我们已经进入了大模型时代,越来越多的应用依赖大模型的能力,可以说大模型已经成为智能化基础设施的核心组成部分,支撑着语言,视觉分析,智能驾驶,机器人等各种下游应用。在大模型的实际使用
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!AMDAMD 是高性能与自适应计算领域的领先企业,致力于提供优质的产品和服务,
阅读全文云谷青年学者论坛云谷青年学者论坛是西湖大学工学院打造的品牌引才活动。第六届云谷青年学者论坛将以线上方式举办,秉承往届云谷青年学者论坛的办会宗旨,为海内外优秀青年学者搭建起合作与交流的平台。01人工智能
阅读全文近年来,生成式 AI 和多模态大模型(MLLMs)在各领域取得了令人瞩目的进展。然而,在现实世界应用中,动态环境下的数据分布和任务需求不断变化,大模型如何在此背景下实现持续学习(Continual L
阅读全文