Cartes graphiques

GPU Hopper GH100, Nvidia dévoile ses principales caractéristiques

Le GPU Hopper GH100 de Nvidia à l’origine du processeur de calcul H100 s’arme d’un équipement impressionnant. Dans un document la firme révèle ses principales spécifications.

L’engin est issu du processus de fabrication le plus avancé actuellement de TSMC à savoir du N4 (gravure EUV en 4 nm). Nous retrouvons une approche accompagnée d’un maximum de six piles HBM3. L’ensemble s’équipe de 80 milliards de transistors soit une augmentation de presque 50% par rapport au GA100 tout en ayant une surface plus petite (814 mm² au lieu de 826 mm²). Cette avancée s’explique par l’adoption d’une finesse de gravure plus petite ( 4 nm Vs 7 nm).

GPU Hopper GH100 de Nvidia

L’architecture s’appuie sur144 multiprocesseurs (SM) en streaming soit la présence de 18 432 cœurs CUDA FP32 et 9 216 cœurs CUDA double précision (FP64). A cela s’ajoute 576 cœurs Tensor de quatrième génération et une interface HBM3 5120-bit afin d’exploiter 80 Go de mémoire. La bande passante mémoire devrait dépasser les 3 To/s et prendre en charge l’ECC.

Les interfaces hôtes bénéficient également d’une mise à niveau. La carte SXM5 s’accompagne d’une interconnexion NVLink de dernière génération qui dispose d’une bande passante de 900 Go/s. Le modèle AIC (carte d’extension) exploite de son coté une interface PCI-Express 5.0 x16 (128 Go/s). Les deux interfaces introduisent des fonctionnalités de mise en commun des ressources.

Enfin, Nvidia repousse la limite de puissance avec du 700 W contre 400 W pour le A100. A noter que le H100 dispose de 132 SM au travers d’une solution au format SXM5 contre 114 SM avec un format AIC (carte fille PCIe). Dans les deux cas les fréquences devraient atteindre les 1,80 GHz.

GH100GA100GV100
ArchitectureHopperAmpereVolta
Approche

Monolithique

Finesse de gravureTSMC N4TSMC N7TSMC 12FFN
Nombre de transistors80,0 Milliarden54,2 Milliarden21,1 Milliarden
Surface du die814 mm²826 mm²815 mm²
Nombre de SMs14412884
Cœurs CUDA FP649.2164.0962.688
Cœurs CUDA FP3218.4328.1925.376
Cœurs Tensor576512672
Fréquence GPU?1.41 GHz1,45 GHZ
Mémoire vidéo80 Go HBM348 Go HBM2 et 80 Go HBM2e32 Go HBM2
Fréquence mémoire?1,25 GHz0.88 Ghz
Interface mémoire?6144-bit4096-bit
Bande passante mémoire+ 3 To/s1,9 To/s et 2,4 To/s900 Go/s
TDP700 Watt400 Watt300 Watt
InterconnexionNVLink 900 Go/s
PCIe 5.0 128 Go/s
NVLink 600 Go/s
PCIe 4.0 64 Go/s
NVLink 300 Go/s
PCIe 3.0 32 Go/s

Source

Jérôme Gianoli

Aime l'innovation, le hardware, la High Tech et le développement durable. Soucieux du respect de la vie privée.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page