Nvidia ne laisse aucun répit à AMD. Dans un récent article la firme compare sa solution Ampere A100 au Instinct MI250. Le bilan est rapide.
Nvidia affirme que son « accélérateur » offre des performances 2 fois supérieures et une efficacité presque 3 fois supérieure face à l’offre de son concurrent. Cette posture est intéressante sachant que Nvidia a déjà annoncé la relève avec son GPU H100 basé sur l’architecture graphique Hopper. Le lancement est attendu dans les prochain mois.
Les attentes sont fortes et l’impatience évidente sachant que Hopper serait 26 fois plus performant que la solution Pascal P100 lancée il y a six ans.
Cette progression est impressionnante sachant que nous sommes sur une trajectoire 3 fois plus rapide que celle année par la loi de Moore.
A100 Vs Instinct MI250
Pour revenir à l’étude de l’A100, Nvidia s’est appuyé sur des configurations mono et multi-GPU et certaines charges de travail populaires des centres de données. Nous retrouvons par exemple LAMMPS, NAMD, openMM, GROMACS et AMBER.
Le GPU Ampere A100 se dévoile jusqu’à 1,9 fois plus rapide que l’accélérateur GPU AMD Instinct MI250, tandis qu’un système quad-GPU proposerait jusqu’à 2,1 fois les performances d’une solution Quad Instinct MI250.
Enfin Nvidia affirme qu’un module équipé de quatre GPU Ampere A100 offre une efficacité 2,8 fois supérieure à celle d’une solution à quatre GPU Instinct MI250.
Note de Nvidia
Efficiency ratio of A100 to MI250 shown – higher is better for NVIDIA. Geomean over multiple datasets (varies) per application. Efficiency is Performance / Power consumption (Watts) as measured for the GPUs using measured using NVIDIA SMI and equivalent functionality in ROCm |
AMD MI250 measured on a GIGABYTE M262-HD5-00 with (2) AMD EPYC 7763 with 4x AMD Instinct™ MI250 OAM (128 GB HBM2e) 500W GPUs with AMD Infinity Fabric™ technology. NVIDIA runs on ProLiant XL645d Gen10 Plus using dual EPYC 7713 CPUs and 4x A100 (80 GB) SXM4
LAMMPS develop_db00b49(AMD) develop_2a35ec2(NVIDIA) datasets ReaxFF/c, Tersoff, Leonard-Jones, SNAP | NAMD 3.0alpha9 dataset STMV_NVE | OpenMM 7.7.0 Ensemble runs for datasets: amber20-stmv, amber20-cellulose, apoa1pme, pme|
GROMACS 2021.1(AMD) 2022(NVIDIA) datasets ADH-Dodec (h-bond), STMV (h-bond) | AMBER 20.xx_rocm_mr_202108(AMD) and 20.12-AT_21.12 (NVIDIA) datasets Cellulose_NVE, STMV_NVE | 1x MI250 has 2x GCD
A noter que l’Instinct MI250 n’est pas l’accélérateur ultime d’AMD, il s’agit du MI250X.
Source : Nvidia