英伟达推出维拉·鲁宾:革命性六芯片AI计算平台在2026年国际消费电子展上首次亮相
新闻摘要
英伟达在 2026 年国际消费电子展 (CES) 上正式发布了其革命性的 Vera Rubin AI 计算平台,标志着人工智能基础设施的重大突破。该公告于太平洋时间 2026 年 1 月 6 日星期一,在首席执行官黄仁勋的主题演讲中发布,推出了一种下一代 AI 超级计算机架构,有望改变 AI 训练和推理能力的格局。
革命性的六芯片架构承诺性能提升 5 倍,成本降低 10 倍
在拉斯维加斯举行的 2026 年国际消费电子展上,英伟达首席执行官黄仁勋公布了该公司迄今为止最雄心勃勃的 AI 计算平台:Vera Rubin。该平台以美国开创性天文学家 Vera Rubin 的名字命名,代表了英伟达首个“极端协同设计”方法,集成了六个专用芯片,创造了该公司所称的“一台令人难以置信的 AI 超级计算机”。
平台概述和技术规格
Vera Rubin 平台由六个精心设计的组件组成,它们完美协同工作:
核心组件:
- Vera CPU:一款 88 核定制 ARM 处理器,采用“空间多线程”技术,可提供 176 线程的性能。
- Rubin GPU:一款基于台积电 3nm 工艺的双芯片处理器,拥有 3360 亿个晶体管和 288GB HBM4 内存。
- NVLink 6 Switch:先进的互连技术,提供 28.8 TB/s 的带宽。
- ConnectX-9 SuperNIC:高性能网络接口,提供 1.6 Tb/s 的带宽。
- BlueField-4 DPU:数据处理单元,用于增强安全性和卸载存储。
- Spectrum-6 以太网交换机:用于数据中心网络的革命性硅光子技术。
性能突破
Vera Rubin NVL72 机架级系统提供了前所未有的性能指标,树立了新的行业标准。每颗 Rubin GPU 使用英伟达的 NVFP4 精确格式可实现 50 PFLOPS 的推理性能,比上一代 Blackwell 架构提高了 5 倍。对于训练工作负载,该系统可提供 35 PFLOPS 的性能,性能提升了 3.5 倍。
最值得注意的是,英伟达声称该平台可将混合专家(MoE)模型的推理成本降低高达 10 倍,同时与 Blackwell 系统相比,训练所需的 GPU 数量仅为四分之一。这种显著的效率提升有望显著加速主流 AI 的普及。
内存和存储创新
该平台引入了多项对下一代 AI 工作负载至关重要的内存创新。每颗 Rubin GPU 都集成了八堆 HBM4 内存,提供 288GB 容量和令人印象深刻的 22 TB/s 内存带宽,比 Blackwell 的 HBM3e 实现提高了 2.8 倍。
英伟达还推出了其 AI 原生存储解决方案——推理上下文内存存储平台。这种专用的 KV 缓存层通过 5 倍的令牌吞吐量、5 倍的总拥有成本性能以及 5 倍的能效提升,增强了长上下文推理能力。
市场影响和行业采用
此次发布对 AI 行业产生了重大影响,主要云服务提供商已将其定位为早期采用者。亚马逊网络服务、谷歌云、微软 Azure 和甲骨文云基础设施都已承诺在 2026 年下半年开始部署基于 Vera Rubin 的实例。
微软计划将英伟达 Vera Rubin NVL72 机架级系统集成到其下一代 Fairwater AI 超级工厂中,规模将达到数十万个英伟达 Vera Rubin 超级芯片。CoreWeave 将把基于 Rubin 的系统集成到其 AI 云平台中,通过其 Mission Control 界面进行操作,以增强灵活性和性能。
生产时间表和可用性
英伟达确认所有六款 Rubin 平台芯片已成功从制造厂返回,目前已全面投入生产。该公司预计将在 2026 年下半年实现批量生产,合作伙伴将在同一时间段提供基于 Rubin 的服务。
生产就绪标志着英伟达的一个重要里程碑,尽管面临日益增长的复杂性和性能要求,该公司仍保持着每年交付新一代 AI 超级计算机的节奏。
竞争格局影响
Vera Rubin 的发布正值 AI 基础设施市场竞争日益激烈之际。超微半导体公司正在推出其 Helios 机架级系统,以直接与英伟达的产品竞争,而谷歌和亚马逊等主要云服务提供商则继续开发专有处理器。
尽管面临这些竞争压力,英伟达的全面平台方法——将整个数据中心而非单个组件视为计算单元——使该公司在市场上独树一帜。极端协同设计理念确保了所有系统组件的优化性能,而不是孤立的优化。
未来应用和用例
该平台专门针对新兴的 AI 应用,包括智能体 AI、高级推理模型和复杂的混合专家架构。这些应用代表了人工智能的下一个前沿,超越了简单的聊天机器人,发展为能够进行多步问题解决的复杂推理系统。
英伟达将 Vera Rubin 定位为从传统推理向首席执行官黄仁勋所描述的“思考过程”转变的关键基础设施——即 AI 系统能够通过复杂查询进行深思熟虑和推理,而不是提供即时响应。
更广泛的技术生态系统
Vera Rubin 的发布伴随着多项补充技术的发布,包括用于自动驾驶汽车开发的 Alpamayo 开源推理模型系列,以及与工业自动化领导者西门子的合作伙伴关系得到加强。
这些公告强化了英伟达创建全面生态系统而非独立产品的战略,将该公司定位为跨多个行业的下一代 AI 应用的基础设施提供商。
Vera Rubin 平台不仅仅是一次硬件升级,它体现了英伟达对能够支持未来人工智能系统海量规模和复杂性需求的 AI 基础设施的愿景。随着人工智能从实验技术转向工业规模部署,Vera Rubin 等平台可能对于充分发挥人工智能在社会和全球经济中的潜力至关重要。