Cartes graphiques

GPU Xe HPC Ponte Vecchio, Intel prépare un monstre de puissance ?

Lors de sa conférence “Architecture Day” Intel a proposé plusieurs détails techniques autour de ses solutions Xe HPC Ponte Vecchio. Nous avons aussi quelques informations concernant les performances. Il s’agit par contre de données « préliminaires » issues de prototypes (A0).

L’une des dernières puces en question atteint les 45 TFLOPs en FP32. Ce chiffre est prometteur. Obtenu à l’aide d’une plateforme Xeon “Sapphire Rapids” exécutant un seul OAM Ponte Vecchio, ce score est au-dessus des 19.5 TFLOPs  annoncés pour l’A100 Tensor Core de Nvidia. AMD ne s’en sort pas mieux avec sa solution Instinct MI100 et ses 23.1 TFLOPs toujours en FP32.

GPU Xe HPC Ponte Vecchio

La référence « A0 silicon » indique qu’il s’agit d’un premier lot de puces. Ces prototypes sont probablement en circulation dans les laboratoires d’Intel et chez un groupe « exclusif » d’éditeurs de logiciels. Il est aussi possible que quelques partenaires de l’industrie soient concernés moyennant le respect d’un NDA très stricte. Il n’y a rien d’étonnant car ce type de démarche est courante.  L’expédition de « jeunes » prototypes à des fréquences inférieures à celles de la version finale permet aux éditeurs de préparer leurs logiciels. La finalité est d’être opérationnel lors de l’annonce officielle afin d’exploiter toute le potentiel de ces nouveautés.

Il est possible que d’ici le lancement, la puissance soit encore revue à la hausse.  Pourquoi ? Intel peut envisager une hausse de la fréquence sachant que nous sommes face à de “jeunes” prototypes. Il n’y a cependant pas de certitude. Les rumeurs évoquent déjà une importante demande énergétique. Il serait question de 600 W pour cette version A0 nécessitant au passage un refroidissement liquide pour ces OAMs.

GPU Xe HPC Ponte Vecchio

A titre d’information, voici les différentes caractéristiques des solutions A100 de Nvidia

Spécifications

A100 40 Go PCIeA100 80 Go PCIeA100 40 Go SXMA100 80 Go SXM
FP649,7 TFlops
FP64 Tensor Core19,5 TFlops
FP3219,5 TFlops
Tensor Float 32 (TF32)156 TFlops | 312 TFlops
BFLOAT16 Tensor Core312 TFlops | 624 TFlops
FP16 Tensor Core312 TFlops | 624 TFlops
INT8 Tensor Core624 TOPs | 1248 TOPs
Mémoire GPU40 Go HBM280 Go HBM2e40 Go HBM280 Go HBM2e
Bande passante GPU1555 Go/s1935 Go/s1555 Go/s2039 Go/s
Enveloppe thermique (TDP)250W300W400W400W
GPU multi-instancesJusqu’à 7 instances MIG à 5 GoJusqu’à 7 instances MIG à 10 GoJusqu’à 7 instances MIG à 5 GoJusqu’à 7 instances MIG à 10 Go
ConfigurationPCIeSXM
Interface d’interconnexionPont NVIDIA NVLink pour 2 GPU : 600 Go/s
PCIe Gen4 : 64 Go/s
NVLink : 600 Go/s
PCIe Gen4 : 64 Go/s
Options de serveurSystèmes partenaires et systèmes NVIDIA certifiés avec de 1 à 8 GPUSystèmes partenaires NVIDIA HGX A100 et systèmes NVIDIA certifiés avec 4, 8 ou 16 GPU
NVIDIA DGX A100 avec 8 GPU

 

Jérôme Gianoli

Aime l'innovation, le hardware, la High Tech et le développement durable. Soucieux du respect de la vie privée.

Un commentaire

  1. A efficacité énergétique comparable, une consommation de 600 W serait
    un minimum ce qui laisse songeur concernant la fiabilité d’une telle
    solution…

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page