DeepSeek开源第三日，行业影响几何？

2月26日，在开源周（OpenSourceWeek）第三日，DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。DeepSeek这三天的发布都与算法有关，偏技术向。

大模型生态社区OpenCSG（开放传神）创始人陈冉对第一财经举例表示，“相当于以前DeepSeek是直接给一辆车，告诉大家这辆车续航900公里，但是现在DeepSeek在深挖，用什么方式能够开到900公里。”DeepSeek的模型为什么能够实现较好的效果，对应有一些算法和相应的框架，而这些“脚手架”的开源有利于之后的生态搭建。

具体到此次发布的关键词，GEMM（General Matrix Multiplication，通用矩阵乘法）是线性代数中的基本运算，而FP8 GEMM则是一种使用8位浮点数进行矩阵乘法的计算操作。FP8是一种低精度浮点格式，适用于深度学习和高性能计算，能够在保持较高计算效率的同时减少内存占用和带宽需求。

据DeepSeek方面介绍，DeepGEMM同时支持传统的稠密模型和MoE（混合专家）模型的GEMM运算，这一代码为基于英伟达Hopper架构（如H100 GPU）的V3/R1系列硬件提供高效的训练和推理支持。

DeepSeek提到，基于这一代码库，在英伟达Hopper架构的GPU上可实现1350+ FP8 TFLOPS（每秒浮点运算次数）的性能，充分利用算力。同时，该代码库设计非常简洁，只有一个核心内核函数，代码量约为300行，但在大多数矩阵规模上均优于专家调优的内核。

开源 DeepGEMM有何影响？记者将此问题抛给DeepSeek，它回答称，DeepGEMM 通过FP8和硬件级优化，解决了大模型计算效率和资源消耗的痛点，尤其为 MoE模型的落地提供了关键支持。其开源行为不仅加速了技术民主化，更可能成为AI计算生态的“基础设施”，推动行业向更高效、低成本的方向发展。

FP8是AI计算的新兴标准，其高效性可加速千亿参数模型的训练，降低显存需求。在边缘设备或云端部署时，FP8的低精度计算能显著提升吞吐量，降低成本。因此，开源 DeepGEMM可以推动FP8生态普及，降低开发者使用门槛，促进更多框架和模型适配FP8，加速行业向低精度计算迁移。

此外，MoE模型因计算复杂性难以落地，DeepGEMM 的开源提供了高效实现参考，可能催生更多MoE应用（如多模态模型、边缘端高效模型）。

对于DeepSeek连续三天的代码库开源，陈冉对记者表示，“我们看下来蛮震撼的。”DeepSeek最终的目标是要表明他们的R1和V3是怎么做出来的，他认为，DeepSeek现在发布的算法某种意义上属于“脚手架”，“一定要给大家‘脚手架’，才能真正让大家基于DeepSeek的技术线继续往前用，最终行业能基于此将生态做起来。”

长期来看，陈冉认为，DeepSeek这一开源动作非常有意义，既有模型标准，也有工具标准，也有生态基石，生态才能长起来。

陈冉判断，DeepSeek的代码开源或许会影响一批做AI Infra层的从业者，“DeepSeek基本将技术栈、模型给出来，就差数据了，但是别人也有可能将数据复现出来，AI Infra层的人就要找新的方向。”但他同时表示，这种开源是一把双刃剑，如果能将DeepSeek开源的内容用好可能也会得利，“用不好就被冲击”。

也有从业者对记者表示，DeepSeek开源的是Infra层的推理加速这一块，DeepSeek底层技术开源对从业者有影响，但或许不会太大。

“DeepSeek对行业的影响这才刚刚开始，没有人能猜到结局。”上述从业者说。

DeepSeek在此前宣布会陆续开源5个代码库，接下来DeepSeek还有两个代码库在这周发布。“每分享一行代码，都会成为加速AI行业发展的集体动力。”DeepSeek在公告中表示。

对文章打分

DeepSeek开源第三日，行业影响几何？

最新资讯

编辑精选

热门评论

相关文章

Anthropic的最新旗舰AI的训练成本相比以往并不高昂

DeepSeek第三弹：开源DeepGEMM

DeepSeek开源周才第二天有些公司就已经坐不住了

OpenAI向更多付费用户开放“分析师”智能体网友：马斯克那边免费

OpenAI将"深度研究"扩展到所有付费 ChatGPT 用户

Top 10

世界上最大的锂矿藏可能改变能源供应现状但它也可能破坏生态系统

留美博士用AI写论文遭开除后起诉校方导师力挺：从未见过如此大的敌意

苹果iPhone 16e正式登场售价4499元 21日接受预定

OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密

巨兽之地：这是地球史上最独特的生物群落之一各种动物大到离谱

蛇年最忙的女人赵雅芝：73岁高龄身材、颜值依然抗打