大模型预训练分布式并行技术(DP/PP/TP/EP/SP)基本原理详解
Scaling Laws 第一定律OpenAI 在 2020 年的论文中提出了 Scaling Laws(扩展定律),证明了 LLM 的性能(以交叉熵损失衡量)遵循一定的数学幂律关系(Power-la
阅读全文Scaling Laws 第一定律OpenAI 在 2020 年的论文中提出了 Scaling Laws(扩展定律),证明了 LLM 的性能(以交叉熵损失衡量)遵循一定的数学幂律关系(Power-la
阅读全文🌐Google 翻译推出新 AI「同声传译」功能👁️苹果「眼球追踪」新专利曝光🔬豆包手机助手辟谣「侵犯用户隐私」🎓OpenAI 奥特曼:GPT-5.2 API 上线首日调用量破万亿🚗多家车企支持《汽车
阅读全文在人工智能飞速发展的今天,有一本书早在2006年就已问世,却始终屹立不倒,被全球学者奉为经典,称为机器学习的“圣经”。它就是克里斯托弗·毕晓普(Christopher M. Bishop)的《模式识别
阅读全文亲爱的AI开发者们,你们好!LangChain作为当下最热门的AI Agent构建框架,已经正式迈入1.0时代,并迅速推出1.1版本,带来了更可靠、更结构化、更上下文感知的Agent开发体验。无论是生
阅读全文打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://ke-xing.github.io/StereoWorld/论文链接-https://arxi
阅读全文卧槽!3 分钟,364 行代码,我用 GLM-4.6V 复刻了一个 B站首页!上图。GLM-4.6V 复刻的 B站首页。导航栏、分类标签、视频卡片,都有。按钮、布局、配色,几乎是像素级还原。如果我不说
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......2011 年,前诺基亚 MeeGo 项目组核心团队成员,取用芬兰语中「敏捷的小船」之意,成立了
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......就在前几天,小米 17 系列推送了一版面向背屏的新固件,让用户可以在背屏上饲养一只专属的电子宠物
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......今天要给大家分享一个超实用的格式转换技能平台,它宛如一个文件格式的“奇幻转换屋”,支持多种格式的
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......2026年的中国车市,或将迎来一场由科技巨头主导的“全面战争”。在12月9日的鸿蒙智行年度直播中
阅读全文一句话总结:该综述系统梳理了 RAG 技术的发展脉络,从早期开放域问答任务中的原型,到近年来多领域大规模应用的系统化演化,进行了全面而深入的总结。前文速览:RAG 是当前提升大语言模型回答质量与准确性
阅读全文我们很好地添加了“Next Stage”显示,即在我们按下“n”按钮后继续进行下一阶段。我们这么做的原因当然是为了给下一阶段的进展添加一些视觉指示。但我们仍然缺少一个视觉指标。在这篇Pygame RP
阅读全文手里只有几张消费级显卡时,怎么练模型才最划算?面对手里仅有的 8 张 4090,如果只有两周时间,目标是训练一个数学能力超越基座的垂直模型。你是该把算力全部投入 SFT 题海战术,还是咬牙上 PPO
阅读全文近年来,大语言模型(LLM)的发展仿佛陷入了一场“参数军备竞赛”:参数规模从百亿、千亿,一路飙升至万亿级别。模型规模不断膨胀,效果虽有所提升,但推理成本与微调训练成本也水涨船高,让众多企业与开发者望而
阅读全文作者|骆轶航邮箱|tluo@pingwest.com12月1日,豆包手机助手上线。它偷了蚂蚁森林能量,成功了;它在 B 站答题领会员,全程自动操作;有人让它“把昨天拍的照片在微信上发给我妈”,搞定了。
阅读全文Yoky|yokyliu@pingwest.com黄小艺|huangxiaoyi@pingwest.comAIGC 工具跑完“提效”阶段后,用户考核标准变成“能不能直接变成收入”。本周入选的项目有一个
阅读全文「这是一项革命性的工作」、「不是……而是……」、「首先……其次……」;在一篇文章里读到这些词,你是不是本能地开始觉得,有点不对劲了。三年前,这些用法还都是正常的表达,它们出现在各种经典文学作品的段落里
阅读全文金磊 发自 凹非寺量子位 | 公众号 QbitAI不鸣则已,一鸣惊人。没想到一个低调霸榜了全球最权威SQL榜单超过两个月的国产AI,这一次选择了高调开源。如此反差剧情的主角正是蚂蚁数科,在第二届CCF
阅读全文允中 整理自 凹非寺量子位 | 公众号 QbitAI不仅能“听懂”物体的颜色纹理,还能“理解”深度图、人体姿态、运动轨迹……统一多模态多任务的视频生成模型来了。来自港科大、港中文、清华大学和快手可灵的
阅读全文OpenAI 办了一场内部分享,主题是 Vibe Engineering,这里区别于「Vibe Coding」,具体为啥,容我细细道来Developer Experience 负责人 Romain
阅读全文整理 | 傅宇琪、褚杏娟 消息称 MiniMax 和智谱计划很快进行香港 IPO;知情人士回应豆包手机被曝被约谈:消息不实;OpenAI 被曝使用 Claude 的 Agent Skills、 GPT
阅读全文编译 | TinaVS Code、Cursor 打得火热,JetBrains 扛不住了?本周,JetBrains 宣布停止开发 Fleet 这款 IDE。该产品自 2021 年推出以来一直停留在公开预
阅读全文新智元报道 编辑:桃子 KingHZ【新智元导读】年终AI大戏,OpenAI败给了谷歌?GPT-5.2上线48小时,全网吐槽一大片。第三方数据实证,Gemini 3 Pro才是真正的王者。Ope
阅读全文新智元报道 编辑:元宇【新智元导读】据不完全统计,在刚刚出炉的185位美国国家发明家科学院新增院士中,华人约37人,占比20%,平均每5位NAI院士中就有一名是华人学者。刚刚,美国国家发明家科学
阅读全文新智元报道 编辑:元宇【新智元导读】6位前DeepMind成员以元系统重塑大模型调用方式,该系统推出的Gemini 3 Pro优化技术在ARC-AGI-2上以54%的成绩夺得榜首,而成本仅为此前
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元十周年!十年求索,奇点共盟。值此,新智元在上地AI家邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。
阅读全文机器之心报道机器之心编辑部现在的大学生该选什么专业?未来一百年的大学会是什么样子?业界 AI 如此强势,学界还能做什么?谷歌在过去二十多年里做对了什么,又有哪些遗憾?在斯坦福大学工程学院百年庆典的收官
阅读全文机器之心报道编辑:张倩模型架构的重要性可能远超我们之前的认知。最近,约翰斯・霍普金斯大学的一项研究发现:1100 多个不同的神经网络,即使在完全不同的数据集上训练、用不同的初始化和超参数,最终学到的权
阅读全文本文第一作者陈羽田,香港中文大学 MMLab 博士二年级在读,研究方向为三维重建与生成,导师为薛天帆教授。个人主页:https://yutian10.github.io当古装剧中的长袍在武林高手凌空翻
阅读全文