AI芯片新架构:存算一体与光子计算的突破

后摩尔时代的AI芯片新路径

随着AI模型规模的持续膨胀,传统的冯·诺依曼架构和通用GPU正在面临严峻的挑战。一方面,芯片制程工艺逐渐逼近物理极限,摩尔定律的放缓使得单纯依靠晶体管微缩来提升性能变得越来越困难。另一方面,AI计算中频繁的数据搬移操作消耗了大量的能量和时间——这就是著名的“存储墙”问题。2026年,以存算一体和光子计算为代表的新型芯片架构正在成为突破算力瓶颈的关键路径。

据估计,2026年全球AI芯片市场规模已突破1500亿美元,其中面向数据中心训练的GPU和AI加速卡占比约60%,而面向边缘推理的新型架构芯片正在快速崛起,年增长率超过45%。中国AI芯片企业在这一波新型架构浪潮中表现尤为活跃。

AI芯片新架构

存算一体技术:打破存储墙

存算一体技术的核心思想是让计算操作直接在数据存储的位置进行,从而消除数据在存储器和计算单元之间的频繁搬移。在传统架构中,AI模型的计算需要反复从DRAM或HBM中读取权重和中间结果,这个过程消耗的能量占总能耗的90%以上。存算一体架构通过将计算单元嵌入存储阵列中,显著降低了数据搬移的距离和能耗。

存算一体技术主要分为数字和模拟两大类。数字存算一体使用SRAM或RRAM作为存储介质,在存储单元附近集成数字计算逻辑,精度高但芯片面积较大。模拟存算一体利用非易失性存储器的物理特性直接在存储阵列中完成矩阵乘法运算,能效比极高但精度受硬件噪声影响。国内初创企业知存科技在模拟存算一体领域处于国际领先地位,其WTM系列芯片在2025年实现了量产,在语音识别和低功耗视觉任务中展现了超过传统架构10倍以上的能效提升。

头部企业也在积极布局。华为海思在2025年发布了基于存算一体架构的昇腾AI推理芯片,据称在特定推理场景下的能效比相比传统方案提升了5倍。阿里巴巴平头哥也在其最新的神经网络处理器中集成了存算一体单元,主要面向云端的AI推理加速。

光子计算:以光速运行AI

光子计算利用光子代替电子进行信息处理,理论上可以实现超高速、低功耗的AI计算。光子的传播速度远高于电子,且光子之间几乎没有相互作用,使得光子芯片可以实现极高的并行度。对于AI计算中最核心的矩阵乘法运算,光子计算可以实现与数据维度无关的即时计算——输入数据以光信号的形式通过芯片上的干涉仪阵列,输出端直接得到计算结果。

2025年至2026年,光子计算领域迎来了多个里程碑事件。国内的光本位科技、曦智科技等初创企业在光子AI芯片的工程化方面取得了重要进展。光本位科技在2025年底推出的光学矩阵乘法芯片,在特定的矩阵规模下实现了比电子GPU高两个数量级的能效比。曦智科技则专注于光子计算在数据中心光互联和AI推理中的融合应用。国际上,Lightmatter和Lightelligence等公司也在光子计算领域持续发力,其Envue系列芯片已经在部分超大规模数据中心中开始了试点部署。

新型架构的产业化路径

尽管存算一体和光子计算展现了巨大的潜力,但距离全面替代GPU仍有相当距离。存算一体在灵活性和通用性方面不如GPU,更适合特定场景的推理任务而非通用训练。光子计算面临着集成度、精度和封装成本等方面的挑战。预计在未来3到5年内,最现实的路径是将新型架构芯片与传统的GPU和CPU进行异构集成,在AI系统的不同环节各取所长。长远来看,这些新型计算架构将共同构成下一代AI基础设施的基石。

上一篇 AI在网络安全中的攻防新前线
下一篇 AI Agent元年:2026年智能体如何从对话走向行动