DeepSeek与国产算力的崛起:自主AI供应链加速成型

2026年4月24日,一个值得被记住的日子。DeepSeek V4正式发布,同日美团LongCat-2.0-Preview启动开放测试。两款模型在同一天跨入”万亿参数俱乐部”,更重要的是,一条自主的”国产Token”供应链正在英伟达体系之外加速接通。

国产算力的里程碑

DeepSeek V4的早期训练基于英伟达CUDA架构,之后全栈迁移至华为芯片。其官方技术报告明确将华为昇腾950PR写入硬件验证清单,实现了从英伟达CUDA到国产算力的全栈迁移。LongCat-2.0-Preview则更彻底——这是目前唯一由国产算力训练的万亿参数大模型,训练全程动用了5万至6万张国产算力卡。

国产算力AI芯片

效率革命打破算力迷信

这两款模型没有采取行业通行的”堆算力”路线,而是通过架构优化对每一张国产卡算力进行极致榨取。DeepSeek V4通过混合注意力架构等底层创新,在上下文长度放大8倍的前提下,算力消耗比前代降低七成以上。这证明了极致优化算力效率,可以抵消硬件的账面差距。

从”可用”到”好用”

国产芯片适配正在进入”双向奔赴”新阶段。华为昇腾、寒武纪思元系列已实现新模型的Day 0适配。TrendForce预测,2026年国产芯片在高端市场的份额将增长到70%。行业对国产算力的期待,不再停留在”可用”层面。

更关键的是,大模型在国产芯片集群上训练时会暴露出各种问题,技术团队逐一攻克的过程,本身就是一场对国产芯片软硬件的大规模测试。每一个被修复的bug、每一段被调优的通信协议,都在推动下一代硬件的改进。这种”模型反哺芯片”的闭环,正在让国产AI生态向下扎根。

上一篇 2026年大模型趋势:从规模竞赛到效率革命
下一篇 AI 智能体正在重构企业工作流