DeepSpeed的ZeRO技术具体是如何实现显存优化的?
DeepSpeed的ZeRO(Zero Redundancy Optimizer)技术通过分片(Sharding)策略消除分布式训练中的显存冗余,实现显存占用的线性降低。其核心是将模型状态(参数、梯
阅读全文DeepSpeed的ZeRO(Zero Redundancy Optimizer)技术通过分片(Sharding)策略消除分布式训练中的显存冗余,实现显存占用的线性降低。其核心是将模型状态(参数、梯
阅读全文单纯拉长上下文并不能自动涌现强化学习能力,引入显式贝叶斯推断才是破局关键。在 In-Context RL 的研究热潮中,往往存在一种惯性思维,认为只要把 Transformer 做大,把上下文窗口拉长
阅读全文当前,大模型+强化学习成为 AI 领域极为热门的研究。现有的强化学习(RL)方法通常将大语言模型(LLM)视为一个单一的整体策略进行优化,主要的算法优化集中在表层的奖励设计等方面,却忽略了模型内部复杂
阅读全文如果你在做 AI Agent 开发,大概率已经发现一件事:Agent 几乎是传统软件测试方法的反例。写几个单测 + 跑回归的老的测试方法失效了,因为 Agent 天生就带着两个“反骨”属性:非确定性:
阅读全文图片来源:unsplash▎“别用我的Token养大你的Agent!”3500亿估值后,Anthropic打响了“防白嫖”保卫战。文|飞向TAI空作者|胡珈萌编辑|李程程本文首发于钛媒体APP围绕商业
阅读全文作者 | 木子、允毅程序员中的超级“保守派”、Linux 之父Linus Torvalds,现在也用起了 AI 编程。图源:GitHub最近,Linus 在 GitHub 上悄悄上传了一个小项目。项目
阅读全文^_^作者 | 蔡芳芳、褚杏娟 本文为《2025 年度盘点与趋势洞察》系列内容之一,由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与
阅读全文当代花钱上班的形式有很多:买咖啡提神、怕迟到打专车、下午来两杯奶茶、还有买各种会员和订阅服务。现在,还包括了自掏腰包买最先进的 AI 工具——MIT 最新出炉的 AI 商业报告揭露了一个令人意外的情况
阅读全文编辑|Panda2024 年底,硅谷和北京的茶水间里都在讨论同一个令人不安的话题:Scaling Law 似乎正在撞墙。那时候,尽管英伟达的股价还在狂飙,但多方信源显示,包括彼时备受期待的 Orion
阅读全文01|“看懂世界” 这关,大模型还没上幼儿园过去一年,大模型在语言与文本推理上突飞猛进:论文能写、难题能解、甚至在顶级学术 / 竞赛类题目上屡屡刷新上限。但一个更关键的问题是:当问题不再能 “用语言说
阅读全文短视频搜索业务是向量检索在工业界最核心的应用场景之一。然而,当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据,导致系统陷入信息茧房,难以召回潜在相关的新鲜内容。针对这一问题,快手搜索团队提出了
阅读全文新智元报道 编辑:好困 桃子【新智元导读】昔日霸主CMU跌落神坛,清华上交联手登顶世界第一,中国高校以「屠榜」之势宣告CS新时代的到来!就在刚刚,2026 CSRankings全球计算机科学排名
阅读全文新智元报道 编辑:定慧【新智元导读】Linux之父「叛变」了!曾怒怼AI的Linus Torvalds 承认AI写代码是真香!2026年1月的一个普通下午,一条推文在程序员圈子里炸开了锅。有人发
阅读全文新智元报道 编辑:元宇【新智元导读】一边踩油门冲刺AGI,一边按喇叭预警:小心前面悬崖!Anthropic创始人Dario Amodei曾因预言「未来5年内AI可能消灭近一半初级白领岗位」而被贴
阅读全文衡宇 发自 凹非寺量子位 | 公众号 QbitAI现在,一部手机,加一个“夹爪”,就能随时随地完成具身智能数据采集了!采出来的数据不脏也不废,已经在实际模型训练中跑出了效果。模型在多步连续任务中动作衔
阅读全文Jay 发自 凹非寺量子位 | 公众号 QbitAI又一家初创公司,差点被AI干没了。由于AI对我们业务的冲击,昨天,75%的工程师失去了工作。明星开源项目Tailwind CSS创造者Adam Wa
阅读全文杰西卡 发自 凹非寺量子位 | 公众号 QbitAI全球最大智能手机ODM,冲刺港股“消费电子ODM第一股”。来自上海的龙旗科技,已成功通过港股聆讯,离敲钟只差一步。而更早之前,这家公司已于2024年
阅读全文2025年,国内在AI产品领域出现了太多关键词——深度思考、Agentic AI、多智能体协作、多模态生成、端侧AI……每个关键词背后,都有一款或数款颠覆性的AI产品。DeepSeek凭借强推理能力和
阅读全文DeepSpeedDeepSpeed 是一个由 Microsoft 开源大模型训练优化库,它提供了多种优化技术,包括:3D 并行策略、梯度累积、动态精度缩放、本地模式混合精度等。还提供了一系列辅助工具
阅读全文Anthropic万字长文,把很多Agent没法落地的真正原因说明白了。 他们分享了内部踩坑无数后,总结的一套Eval方法论,讲透了4件事情。 所有的Agent系统,在交付之前,一定要把Eval体
阅读全文图片来源:HumanifyZP近日获悉,AI 初创公司 Humanify(人格智能)宣布完成数千万元种子轮融资。本轮融资由五源资本领投,奇绩创坛(陆奇博士)跟投。本轮资金将主要用于模型和操作系统研发、
阅读全文Andrew Dai,Elorian的联合创始人 图片来源:YouTubeAndrew Dai 表示, 这位拥有 14 年经验的资深 AI 研究者,在近期离开谷歌 DeepMind 后,正在创办一家专
阅读全文红杉中国 xbench 和 UniPat AI 发了一个新的多模态评测集,叫 BabyVision,在这里:多模态大模型输给三岁宝宝?xbench x UniPat联合发布新评测集BabyVisio
阅读全文在文章开始前,请您先打开Claude code,输入/skill,检查一下您的Claude code有多少个skills?是20个?50个?还是已经突破了100个?自从Anthropic推广Agent
阅读全文作者|黄小艺邮箱|huangxiaoyi@pingwest.com如果三年前有人告诉你,一个没有周杰伦等专属大牌、没有热门综艺OST的音乐APP,能在月活上逼近网易云音乐,你会觉得这是天方夜谭。在线音
阅读全文2026年1月7日,a16z(Andreessen Horowitz)联合创始人马克·安德森(Marc Andreessen)在自家播客The a16z Show上做了一场长达81分钟的深度对谈。作为
阅读全文文章转载于新智元你可能刷到过这种极具煽动性的新闻标题:「AI完全自主解决了人类五十年未解的数学难题!数学家要失业了!」对于渴望见证AGI诞生的人来说,这无疑又是一剂强心针。而对于坚守人类智力尊严的数学
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!2026年将是人工智能从喧嚣的布道
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!三年前,为了将AI助手连接到内部客
阅读全文