一文详解:DeepSeek 第四天开源的模型设计套件
第四天,DeepSeek 带来了一套专为大规模 AI 模型设计的并行计算策略优化工具。 这次发布包括三个主要项目:DualPipe- 一种用于 V3/R1 训练的双向流水线并行算法,实现计算和通信完
阅读全文第四天,DeepSeek 带来了一套专为大规模 AI 模型设计的并行计算策略优化工具。 这次发布包括三个主要项目:DualPipe- 一种用于 V3/R1 训练的双向流水线并行算法,实现计算和通信完
阅读全文它来了,我们的源神 DeepSeek 它又来了DeepSeek 开源周的第三天,带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型(
阅读全文前几天,朋友跟我报了个猛料:而另一位朋友,则带来了更为准确的消息:M2 Ultra 版本的 Mac Studio,已原生适配阶跃星辰模型全家桶,这应该是第一个全面适配苹果 Mac 设备的中国大模型厂商
阅读全文其实很多 AI 行业的名词我最一开始也读错了...于是就有了这篇AI 常见名词读法遗漏之处,欢迎评论区补充请一定看到最后 有惊喜 常用词美音为例,音源来自 Google,附带了发音示例如果觉得不好发音
阅读全文讲真的,这篇文章啥也不是,屁都没有。但就是 AI 看完之后,就开始可劲吹了。<think> 嗯?这是一篇微信爆款文章...阅读量...10W+?!!!!这段文本... 仔细读来,字里行间透露着一种老练
阅读全文