DeepSeek与国产算力的崛起：自主AI供应链加速成型

2026年6月4日 AI 自由的编辑者

2026年4月24日，一个值得被记住的日子。DeepSeek V4正式发布，同日美团LongCat-2.0-Preview启动开放测试。两款模型在同一天跨入”万亿参数俱乐部”，更重要的是，一条自主的”国产Token”供应链正在英伟达体系之外加速接通。

国产算力的里程碑

DeepSeek V4的早期训练基于英伟达CUDA架构，之后全栈迁移至华为芯片。其官方技术报告明确将华为昇腾950PR写入硬件验证清单，实现了从英伟达CUDA到国产算力的全栈迁移。LongCat-2.0-Preview则更彻底——这是目前唯一由国产算力训练的万亿参数大模型，训练全程动用了5万至6万张国产算力卡。

效率革命打破算力迷信

这两款模型没有采取行业通行的”堆算力”路线，而是通过架构优化对每一张国产卡算力进行极致榨取。DeepSeek V4通过混合注意力架构等底层创新，在上下文长度放大8倍的前提下，算力消耗比前代降低七成以上。这证明了极致优化算力效率，可以抵消硬件的账面差距。

从”可用”到”好用”

国产芯片适配正在进入”双向奔赴”新阶段。华为昇腾、寒武纪思元系列已实现新模型的Day 0适配。TrendForce预测，2026年国产芯片在高端市场的份额将增长到70%。行业对国产算力的期待，不再停留在”可用”层面。

更关键的是，大模型在国产芯片集群上训练时会暴露出各种问题，技术团队逐一攻克的过程，本身就是一场对国产芯片软硬件的大规模测试。每一个被修复的bug、每一段被调优的通信协议，都在推动下一代硬件的改进。这种”模型反哺芯片”的闭环，正在让国产AI生态向下扎根。

作者：自由的编辑者

链接：https://www.ziyoudian.cn/archives/818

文章版权归作者所有，未经允许请勿转载。