大模型分布式训练框架 Megatron-LM 技术解析与实践
Megatron-LMMegatron-LM 最初于 2019 年发布,是由 NVIDIA 开发的 Transformer 大模型高效训练框架。它专为数千亿甚至数万亿参数的模型二设计,具有高度可扩展性
阅读全文Megatron-LMMegatron-LM 最初于 2019 年发布,是由 NVIDIA 开发的 Transformer 大模型高效训练框架。它专为数千亿甚至数万亿参数的模型二设计,具有高度可扩展性
阅读全文🎉AIDONE 第二期定档 1 月 24 日,来手搓一个属于你的 AI 工具💬携程回应涉嫌垄断被立案调查:将积极配合4️⃣「死了么」App 启动征集新中文名💳国区 Apple Pay 今天起可绑定 V
阅读全文梁文锋又亲自署名了。上次是 mHC,这次是 Engram。DeepSeek 与北大合作的 Engram 论文,梁文锋署名。大家都觉得,大模型要更强就得更深。DeepSeek 说,不对。你的前几层可能都
阅读全文「钢铁侠」里,托尼·斯塔克有个 AI 管家叫贾维斯。问一句话,贾维斯就能调取他所有的数据,给出完整答案。不用告诉它去哪找。刚刚,谷歌把这个功能上线了。叫「个人智能」(Personal Intellig
阅读全文图片由 AI 生成在多模态大模型飞速发展的今天,我们似乎已经习惯了 AI 能“看懂”视频。但是,真正实用的智能体(Agent)仅仅能复述视频内容是远远不够的。想象一下,当你看到一个旅游博主的 Vlog
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......2026年才开始没多久,一则“噩耗”就传来:苹果的vision Pro,似乎真的要凉了。此前彭博
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......今年的 CES 2026 依旧热闹。在拉斯维加斯的展馆里,AI 无处不在:更激进的算力、更夸张的
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......美国当地时间1月10日,CES 2026落下帷幕。雷科技派出由创始人兼总编辑罗超带队的报道团,对
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......工信部最新一批申报图刚一公布,车圈的火药味就已经溢出屏幕。新一代小米SU7、极氪8X、零跑A10
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......很多普通家庭对待电器的态度,往往都是只要还能用,那就没必要换。比如空调还能制冷,哪怕偶尔会发出一
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......1月14日消息,据台媒报道,OPPO旗下一加手机创始人、CEO刘作虎被台湾省台北市士林地检署给通
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......大家好!不知道大家还记不记得,小时候在电脑上疯狂种向日葵、摆豌豆射手的日子?说起《植物大战僵尸》
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......1 月 14 日消息,最近刷遍社交圈的「死了么」APP,官宣要改名了。昨天晚上,这个靠每日签到报
阅读全文AI 不再仅仅是操作和交互的对象,它开始成为 Coworker。👦🏻 作者: 镜山🧑🎨 排版: NCon在 AI 领域,其实有一种大家都心照不宣的恐惧,叫 「被 Sherlocked」。这个词最早来
阅读全文如果人类的大脑像现在的LLM Agent一样工作,记住每一句今天明天的废话,我们在五岁时就会因为内存溢出而宕机。真正的智能,核心不在于“存储”,而在于高效的“遗忘”与“重组”。这一仿生学理念正是Sim
阅读全文Benchmark for Python Runtime这份文档详细说明了如何在单个 GPU、单个节点配备多块 GPU 或多个节点配备多块 GPU 的环境中对 TensorRT-LLM 所支持的模型
阅读全文上个月你刚花 20 美元订阅了 ChatGPT Plus,转头这个月朋友圈就被「Claude 秒杀一切」刷屏,再过一个月可能又换成「Gemini 吊打一切」。看着每月的账单,你难免开始怀疑人生:这 A
阅读全文Siri → ChatGPT → ???回顾过去十几年,市场对“AI助手”的想象经历过三次大规模的预期校准。第一次是 Siri 诞生时,语音控制带来了交互的新鲜感,人们以为电影里的智能管家 Jarvi
阅读全文DA-DPO 不依赖额外标注,通过难度感知训练提升模型可靠性。作者丨郑佳美编辑丨岑峰多模态模型在感知、理解与生成等方面的能力持续提升,但其输出中仍普遍存在与客观事实不一致的内容,即多模态幻觉现象。当模
阅读全文当创业的成本从几百万降到零,会发生什么?过去两年,AI 生产力的重心正在发生一次关键迁移:从“帮人写代码”(Coding Assistant)到“帮人建业务”(Business Builder)。当
阅读全文4043 张物理重拍样本,打破信贷 AI 的数据死锁。在多模态大模型不断刷新各种通用榜单的今天,金融信贷却始终是一个让 SOTA 模型感到力不从心的隐秘角落。这并非因为模型不够聪明,而是整个行业长期陷
阅读全文Text-to-SQL(又称 NL2SQL)是一项将用户的自然语言问题自动转换为 SQL 查询的任务,其目标是让不懂 SQL 的用户,也能直接通过自然语言访问数据库。例如,用户只需问一句:“近三年每个
阅读全文大家好,分享一个好消息。不久之前,豆包正式成为了上海浦东美术馆最近两场国际艺术展的“官方AI讲解员”。“图案的奇迹:卢浮宫印度、伊朗与奥斯曼的艺术杰作”是卢浮宫上海首展,也是该馆在中国举办的所有展览中
阅读全文过去一年,AI 的进化速度几乎以「周」为单位刷新认知。当你在睡梦中醒来,常常就会发现 APPSO 出现在你的信息列表里,一个新的模型或者 AI 产品成为新的榜一。● APPSO 是爱范儿旗下全网 C
阅读全文金磊 发自 凹非寺量子位 | 公众号 QbitAI感谢AI!原生1个G的视频,现在只需要传200K数据就能看了——视频数据的压缩率干到了0.02%,但依旧能保持画面的高清、连贯和画面细节。或许你会问,
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAI谷歌Veo 3.1又双叒升级了!除了全方位提升视频生成质量,这一次还有两个关键词:竖屏和4K。没错,谷歌也紧随Sora步伐,正式吹响了进军短视频的号角
阅读全文2025年,国内在AI产品领域出现了太多关键词——深度思考、Agentic AI、多智能体协作、多模态生成、端侧AI……每个关键词背后,都有一款或数款颠覆性的AI产品。DeepSeek凭借强推理能力和
阅读全文整理 | 华卫昨晚,上了热搜、又在苹果付费软件排行榜的榜首上挂了多日的"死了么"APP,突然宣布更名为 Demumu。据其称,“经团队审慎决策,‘死了么’APP 将于即将发布的新版本中,正式启用全球化
阅读全文