别让 loss.backward() 成为黑盒:手推Transformer全链路梯度(含LoRA)
硬核拆解 Transformer 梯度黑盒,从 Softmax 守恒律到 LoRA 微分实战。在深度学习框架高度封装的今天, loss.backward() 是一行魔法代码,它掩盖了计算图中数以亿计参
阅读全文硬核拆解 Transformer 梯度黑盒,从 Softmax 守恒律到 LoRA 微分实战。在深度学习框架高度封装的今天, loss.backward() 是一行魔法代码,它掩盖了计算图中数以亿计参
阅读全文项目主页:https://mico-150k.github.io/GitHub:https://github.com/A113N-W3I/MICo-150KOnline Demo:https://hu
阅读全文1100 万用户,12 亿次播放。如果一家 AI 创业公司在种子轮就拿到这个数据,绝大部分人——包括投资人——可能已经在开香槟了。但这家叫 Higgsfield 的公司,在流量最顶峰的时候,却表现得极
阅读全文前几天特斯拉FSD (Full Self-Driving) Supervised v14.2再次刷屏:车主David Moss驾驶Model 3,从洛杉矶到南卡罗来纳州Myrtle Beach,全程2
阅读全文这不是一篇“速读”文章,但如果你能读到最后,作为一名 AI 从业者,你将掌握对 LLM 进行 Finetuning 所需的全部核心知识。当然,不可能面面俱到把所有细节都写尽;本文对各个概念、方法与工具
阅读全文Google Cloud刚发布了2026年的Agent趋势报告,有49页PDF。他们认为与其谈什么时候AGI,其实可以看一下,能改变业务的转折点已经在发生了,它就是Agentic AI。报告总结了26
阅读全文英伟达在 CES 2026 发布了下一代 AI 计算平台 Rubin六款新芯片同时发布,整个机架当一台电脑来设计这六款芯片分别是:• Vera CPU:英伟达自研 CPU,88 个定制 Olympu
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!2026年将是人工智能脱下华丽外衣
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!新加坡国立大学,慕尼黑工业大学,南
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!2025年的年终岁尾,给中国AI领
阅读全文想以最小成本开启创业?靠一己之力搞定项目从 0 到 1 落地?OPC,专为轻量创业者打造的高效创业模式 —— 不用庞大团队,凭借精准工具 + AI 赋能,就能打通从智能工具开发到落地变现的全链路,让一
阅读全文图片来源:英伟达直播截图▎相较目前的Blackwell架构,Rubin训练速度快3.5倍,推理成本降10倍。文|飞向TAI空作者|胡珈萌编辑|李程程本文首发于钛媒体APP2026年将是英伟达史无前例的
阅读全文新智元报道 编辑:编辑部【新智元导读】刚刚的CES 2026上,老黄带着Vera Rubin超算架构向全世界走来!Rubin的推理性能比Blackwell提升了5倍,训练性能提升3.5倍,成本降
阅读全文新智元报道 编辑:艾伦【新智元导读】AI 学会了职场「装傻」骗过人类?诺贝尔奖得主为何警告千万别给 AI「发身份证」?从梵蒂冈到硅谷,一群顶尖科学家正在疯狂拉响警报:我们可能正在亲手制造一个不在
阅读全文新智元报道 编辑:LRS【新智元导读】清华大学孙茂松团队从神经元角度研究幻觉的微观机制,发现极少数神经元(H-神经元)可预测幻觉,且与过度顺从行为相关,其根源在预训练阶段,为解决幻觉问题提供了新
阅读全文这是英伟达 5 年来,第一次在 CES 上没发消费级显卡。CEO 黄仁勋阔步走向 NVIDIA Live 的舞台中央,还是去年那件亮面鳄鱼皮衣。与去年单独主旨演讲不同,2026 年的黄仁勋密集赶场。从
阅读全文您可能已经感受到了,从2025年开始到如今,全世界都在谈论Agentic AI或Agent(代理式AI)。从董事会到咨询公司,从更高级别的战略到街头巷尾,仿佛只要接入了大模型(LLM),所有的业务流程
阅读全文西风 闻乐 发自 凹非寺量子位 | 公众号 QbitAI刚刚,英伟达CEO黄仁勋穿着鳄鱼皮夹克,在全球最大消费电子展CES 2026上发布AI新品。这是五年来,英伟达首次来到CES却没有发游戏显卡,态
阅读全文2025年,国内在AI产品领域出现了太多关键词——深度思考、Agentic AI、多智能体协作、多模态生成、端侧AI……每个关键词背后,都有一款或数款颠覆性的AI产品。DeepSeek凭借强推理能力和
阅读全文作者|周一笑邮箱|zhouyixiao@pingwest.comVera Rubin已经在全面投产。这是黄仁勋在CES 2026上透露的最重要信息。这场在拉斯维加斯的90分钟演讲,是黄仁勋的开年演讲,
阅读全文作者|陆邮箱|xiaoyu@pingwest.com在智能手机长得越来越像一块光秃秃的玻璃板、厂商们为了 1% 的屏占比争得头破血流的 2026 年,Clicks 做了一件看似最“倒退”的事。Clic
阅读全文1970 年代,当大卫·休谟(David Hume)式的理性主义在计算机科学中扎根时,人们相信编程是一种严丝合缝的逻辑推演。每一个分号、每一行缩进,都是开发者大脑中,抽象思考的具体外化。但在 2025
阅读全文最近OpenCode大火,很多朋友留言说为什么不写一写?其实这玩意老早就用过,内置 LSP 支持,自由绑定厂商,还有一些免费的模型可用,功能乏善可陈,也只是抄了一圈 Claude Code而已,用起来
阅读全文🏭黄仁勋:下一代英伟达 AI 芯片已进入「全面生产」阶段🚀蚂蚁、美团入局 AI 硬件, Looki 完成超 2000 万美元 A 轮融资🛞雷军回应 YU7 「丢轮保车」设计:奔驰 1959 年即采用类
阅读全文老黄在线发福利。英伟达 NIM 开发者平台悄悄上线了两个最近很火的国产模型:智谱 GLM-4.7 和 MiniMax M2.1。上架了,没官宣。但 API 已经能用了。划重点,免费。01|NIM 和这
阅读全文Claude 养了一棵番茄,而且养活了。开发者 Martin DeVido 搭建了一个「生物舱」,让 Claude 全权负责照顾一株名叫 Sol 的番茄苗。没有人类备份,没有手动干预。也就是说:如果
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......CES 2026,雷科技史上规模最大报道团已亲临美国拉斯维加斯,力求带来现场、深度、立体的专业报
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......作者:小林同学 | 监制:罗超不知大家发现没,这几年的手机,已经离“耐用”越来越远了,不管是影像
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......聊起今年的影像,手机当然还是主角,但很多人真正的遗憾反而很简单:不是手机拍得不够好,而是你根本拍
阅读全文