Le GPU Hopper GH100 de Nvidia à l’origine du processeur de calcul H100 s’arme d’un équipement impressionnant. Dans un document la firme révèle ses principales spécifications.
L’engin est issu du processus de fabrication le plus avancé actuellement de TSMC à savoir du N4 (gravure EUV en 4 nm). Nous retrouvons une approche accompagnée d’un maximum de six piles HBM3. L’ensemble s’équipe de 80 milliards de transistors soit une augmentation de presque 50% par rapport au GA100 tout en ayant une surface plus petite (814 mm² au lieu de 826 mm²). Cette avancée s’explique par l’adoption d’une finesse de gravure plus petite ( 4 nm Vs 7 nm).
GPU Hopper GH100 de Nvidia
L’architecture s’appuie sur144 multiprocesseurs (SM) en streaming soit la présence de 18 432 cœurs CUDA FP32 et 9 216 cœurs CUDA double précision (FP64). A cela s’ajoute 576 cœurs Tensor de quatrième génération et une interface HBM3 5120-bit afin d’exploiter 80 Go de mémoire. La bande passante mémoire devrait dépasser les 3 To/s et prendre en charge l’ECC.
Les interfaces hôtes bénéficient également d’une mise à niveau. La carte SXM5 s’accompagne d’une interconnexion NVLink de dernière génération qui dispose d’une bande passante de 900 Go/s. Le modèle AIC (carte d’extension) exploite de son coté une interface PCI-Express 5.0 x16 (128 Go/s). Les deux interfaces introduisent des fonctionnalités de mise en commun des ressources.
Enfin, Nvidia repousse la limite de puissance avec du 700 W contre 400 W pour le A100. A noter que le H100 dispose de 132 SM au travers d’une solution au format SXM5 contre 114 SM avec un format AIC (carte fille PCIe). Dans les deux cas les fréquences devraient atteindre les 1,80 GHz.
GH100 | GA100 | GV100 | |
Architecture | Hopper | Ampere | Volta |
Approche | Monolithique | ||
Finesse de gravure | TSMC N4 | TSMC N7 | TSMC 12FFN |
Nombre de transistors | 80,0 Milliarden | 54,2 Milliarden | 21,1 Milliarden |
Surface du die | 814 mm² | 826 mm² | 815 mm² |
Nombre de SMs | 144 | 128 | 84 |
Cœurs CUDA FP64 | 9.216 | 4.096 | 2.688 |
Cœurs CUDA FP32 | 18.432 | 8.192 | 5.376 |
Cœurs Tensor | 576 | 512 | 672 |
Fréquence GPU | ? | 1.41 GHz | 1,45 GHZ |
Mémoire vidéo | 80 Go HBM3 | 48 Go HBM2 et 80 Go HBM2e | 32 Go HBM2 |
Fréquence mémoire | ? | 1,25 GHz | 0.88 Ghz |
Interface mémoire | ? | 6144-bit | 4096-bit |
Bande passante mémoire | + 3 To/s | 1,9 To/s et 2,4 To/s | 900 Go/s |
TDP | 700 Watt | 400 Watt | 300 Watt |
Interconnexion | NVLink 900 Go/s PCIe 5.0 128 Go/s | NVLink 600 Go/s PCIe 4.0 64 Go/s | NVLink 300 Go/s PCIe 3.0 32 Go/s |