AI芯片王者没有停下脚步——NVIDIA在GTC 2026上投下两颗”核弹”
2026年6月,NVIDIA在台北GTC大会上发布了两个重磅产品,再次改写了AI计算的硬件格局:面向数据中心Agentic AI的Vera Rubin计算平台,以及面向PC边缘AI的RTX SPARK ARM芯片。这两款产品的发布,清晰地展示了NVIDIA对未来AI计算的战略判断——Agentic AI需要全新的计算架构,而AI推理正在从云端走向终端。
GTC 2026的主题是”AI即基础设施”,黄仁勋在主题演讲中提出了一个核心观点:AI计算正在经历从”训练主导”到”推理主导”的结构性转变。2026年,全球AI推理计算量首次超过了训练计算量,而这一趋势在未来几年只会加速。NVIDIA的两款新品正是对这一趋势的直接回应。

Vera Rubin:为Agentic AI量身定制的计算平台
Vera Rubin是NVIDIA继Blackwell之后的新一代数据中心计算平台,专为运行长时间、多步骤的AI Agent工作负载而设计。与上一代Blackwell相比,Vera Rubin在三个关键维度上实现了突破:
第一是持久化推理能力。AI Agent需要持续运行数小时甚至数天,传统GPU的”快速响应然后空闲”模式并不适合。Vera Rubin引入了”持续计算引擎”,专门针对Agent式推理的长时间运行场景进行了优化,在连续推理工作负载上的能效比是Blackwell的4倍。
第二是内存带宽的革命性提升。Agent在自主推理过程中需要频繁读写大量上下文数据。Vera Rubin配备了全新的HBM4e高带宽内存,带宽达到了惊人的12TB/s,是Blackwell的2.5倍。这意味着Agent可以在毫秒级别访问数GB的上下文信息,而无需频繁与CPU或系统内存交换数据。
第三是多实例GPU(MIG)的Agent化改造。Vera Rubin支持将一块GPU动态划分为多个”Agent计算单元”,每个单元独立运行不同的AI Agent。这使得企业可以在单台服务器上同时运行数十个Agent实例,大幅提升了硬件利用率和部署效率。
RTX SPARK:ARM架构的AI PC芯片
RTX SPARK是NVIDIA进军ARM PC芯片市场的重要产品。它基于ARM架构,集成了NVIDIA新一代NPU(神经网络处理单元),AI算力达到200 TOPS。这款芯片的定位非常明确:让AI推理全面走向边缘设备。
RTX SPARK的能效比达到了惊人的15 TOPS/W,是上一代RTX 40系列的3倍。这意味着搭载RTX SPARK的笔记本电脑可以在不插电的情况下持续运行本地AI模型数小时。NVIDIA与高通、联发科的ARM PC芯片竞争正式打响,而RTX SPARK的核心优势在于CUDA生态的向下兼容——开发者无需为边缘设备重新编写AI代码。
GTC 2026传递的信号
从Vera Rubin到RTX SPARK,NVIDIA在GTC 2026上传递了一个清晰的信号:AI计算正在从”训练”走向”推理”,从”数据中心”走向”终端设备”,从”单次响应”走向”持续运行”。硬件架构的设计哲学正在跟随AI应用形态的变化而深刻调整。对于那些正在构建AI Agent系统和边缘AI应用的开发者来说,Vera Rubin和RTX SPARK的出现意味着更多的算力选择和更低的部署门槛。