NVIDIA dévoile Vera Rubin : une plateforme de calcul IA révolutionnaire à six puces fait ses débuts au CES 2026

January 07, 2026

NVIDIA

6 min

Résumé des actualités

NVIDIA a officiellement lancé sa plateforme informatique révolutionnaire d'IA Vera Rubin lors du Consumer Electronics Show (CES) 2026, marquant une avancée significative dans l'infrastructure de l'intelligence artificielle. L'annonce, faite lors de la présentation de son discours d'ouverture par le PDG Jensen Huang le lundi 6 janvier 2026 (heure du Pacifique), introduit une architecture de supercalculateur d'IA de nouvelle génération qui promet de transformer le paysage des capacités d'entraînement et d'inférence de l'IA.

Une architecture révolutionnaire à six puces promet une augmentation de performance de 5x et une réduction des coûts de 10x

Au Consumer Electronics Show 2026 à Las Vegas, le PDG de NVIDIA, Jensen Huang, a dévoilé la plateforme informatique d'IA la plus ambitieuse de l'entreprise à ce jour : Vera Rubin. Nommé d'après la pionnière astronome américaine, ce système révolutionnaire représente la première approche de "co-conception extrême" de NVIDIA, intégrant six puces spécialisées pour créer ce que l'entreprise appelle "un incroyable supercalculateur d'IA".

Aperçu de la plateforme et spécifications techniques

La plateforme Vera Rubin se compose de six composants méticuleusement conçus qui fonctionnent en parfaite harmonie :

Composants principaux :

Vera CPU : Un processeur ARM personnalisé à 88 cœurs avec une technologie "spatial multi-threading", offrant efficacement des performances de 176 threads
Rubin GPU : Un processeur à double puce construit sur le procédé 3 nm de TSMC, comprenant 336 milliards de transistors et 288 Go de mémoire HBM4
NVLink 6 Switch : Technologie d'interconnexion avancée offrant une bande passante de 28,8 Téraoctets/s
ConnectX-9 SuperNIC : Interface réseau haute performance offrant une bande passante de 1,6 Téraoctet/s
BlueField-4 DPU : Unité de traitement de données pour une sécurité améliorée et une décharge du stockage
Spectrum-6 Ethernet Switch : Technologie révolutionnaire de photonique sur silicium pour la mise en réseau des centres de données

Avancées en matière de performances

Le système à l'échelle du rack Vera Rubin NVL72 offre des métriques de performance sans précédent qui établissent de nouvelles normes industrielles. Chaque GPU Rubin atteint 50 PFLOPS de performance d'inférence en utilisant le format de précision NVFP4 de NVIDIA, ce qui représente une amélioration de 5x par rapport à l'architecture Blackwell précédente. Pour les charges de travail d'entraînement, le système offre 35 PFLOPS, marquant une augmentation de performance de 3,5x.

Le plus remarquable est peut-être que NVIDIA affirme que la plateforme réduit les coûts d'inférence des modèles "mixture-of-experts" (MoE) jusqu'à 10x tout en nécessitant seulement un quart du nombre de GPU pour l'entraînement par rapport aux systèmes Blackwell. Cette amélioration spectaculaire de l'efficacité positionne la plateforme pour accélérer considérablement l'adoption généralisée de l'IA.

Innovation en matière de mémoire et de stockage

La plateforme introduit plusieurs innovations de mémoire essentielles pour les charges de travail d'IA de nouvelle génération. Chaque GPU Rubin intègre huit piles de mémoire HBM4, offrant une capacité de 288 Go avec une bande passante mémoire impressionnante de 22 Téraoctets/s, ce qui représente une amélioration de 2,8x par rapport à l'implémentation HBM3e de Blackwell.

NVIDIA a également dévoilé sa solution de stockage native pour l'IA, la plateforme de stockage "Inference Context Memory". Cette couche spécialisée de cache KV améliore l'inférence à long contexte avec un débit de jetons 5x plus élevé, des performances 5x meilleures par coût total de possession et une efficacité énergétique 5x améliorée.

Impact sur le marché et adoption par l'industrie

L'annonce a des implications significatives pour l'industrie de l'IA, les principaux fournisseurs de cloud se positionnant déjà comme des adopteurs précoces. Amazon Web Services, Google Cloud, Microsoft Azure et Oracle Cloud Infrastructure se sont tous engagés à déployer des instances basées sur Vera Rubin à partir du second semestre 2026.

Microsoft prévoit d'intégrer les systèmes à l'échelle du rack NVIDIA Vera Rubin NVL72 dans ses sites de superfabriques d'IA Fairwater de nouvelle génération, pour une mise à l'échelle à des centaines de milliers de Superchips NVIDIA Vera Rubin. CoreWeave intégrera des systèmes basés sur Rubin dans sa plateforme cloud d'IA, exploitée via son interface Mission Control pour une flexibilité et des performances accrues.

Calendrier de production et disponibilité

NVIDIA a confirmé que les six puces de la plateforme Rubin sont sorties avec succès de la fabrication et sont actuellement en production complète. L'entreprise prévoit d'augmenter la production en volume au cours du second semestre 2026, les partenaires proposant des services basés sur Rubin dans le même laps de temps.

La préparation de la production marque une étape importante pour NVIDIA, qui a maintenu sa cadence annuelle de livraison de supercalculateurs d'IA de nouvelle génération malgré une complexité et des exigences de performance croissantes.

Implications sur le paysage concurrentiel

L'annonce de Vera Rubin intervient dans un contexte de concurrence accrue sur le marché de l'infrastructure d'IA. Advanced Micro Devices lance ses systèmes à l'échelle du rack Helios pour concurrencer directement les offres de NVIDIA, tandis que les principaux fournisseurs de cloud, dont Google et Amazon, continuent de développer des processeurs propriétaires.

Malgré ces pressions concurrentielles, l'approche de plateforme complète de NVIDIA, traitant l'ensemble du centre de données plutôt que des composants individuels comme unité de calcul, positionne l'entreprise de manière unique sur le marché. La philosophie de co-conception extrême garantit des performances optimisées sur tous les composants du système plutôt qu'une optimisation isolée.

Applications futures et cas d'utilisation

La plateforme cible spécifiquement les applications d'IA émergentes, notamment l'IA agentique, les modèles de raisonnement avancés et les architectures sophistiquées "mixture-of-experts". Ces applications représentent la prochaine frontière de l'intelligence artificielle, allant au-delà des simples chatbots pour des systèmes de raisonnement complexes capables de résoudre des problèmes en plusieurs étapes.

NVIDIA positionne Vera Rubin comme une infrastructure essentielle pour la transition de l'inférence traditionnelle vers ce que le PDG Jensen Huang décrit comme des "processus de pensée" : des systèmes d'IA qui délibèrent et raisonnent sur des requêtes complexes plutôt que de fournir des réponses immédiates.

Écosystème technologique plus large

L'annonce de Vera Rubin a été accompagnée de plusieurs révélations technologiques complémentaires, notamment la famille de modèles de raisonnement ouverts Alpamayo pour le développement de véhicules autonomes et des partenariats renforcés avec le leader de l'automatisation industrielle Siemens.

Ces annonces renforcent la stratégie de NVIDIA consistant à créer des écosystèmes complets plutôt que des produits autonomes, positionnant l'entreprise comme le fournisseur d'infrastructure fondamentale pour la prochaine génération d'applications d'IA dans de multiples industries.

La plateforme Vera Rubin représente plus qu'une simple mise à niveau matérielle : elle incarne la vision de NVIDIA pour une infrastructure d'IA capable de supporter les exigences d'échelle et de complexité massives des futurs systèmes d'intelligence artificielle. Alors que l'IA passe d'une technologie expérimentale à un déploiement à l'échelle industrielle, des plateformes comme Vera Rubin pourraient s'avérer essentielles pour réaliser le plein potentiel de l'intelligence artificielle dans la société et l'économie mondiale.