Lors de sa conférence “Architecture Day” Intel a proposé plusieurs détails techniques autour de ses solutions Xe HPC Ponte Vecchio. Nous avons aussi quelques informations concernant les performances. Il s’agit par contre de données « préliminaires » issues de prototypes (A0).
L’une des dernières puces en question atteint les 45 TFLOPs en FP32. Ce chiffre est prometteur. Obtenu à l’aide d’une plateforme Xeon “Sapphire Rapids” exécutant un seul OAM Ponte Vecchio, ce score est au-dessus des 19.5 TFLOPs annoncés pour l’A100 Tensor Core de Nvidia. AMD ne s’en sort pas mieux avec sa solution Instinct MI100 et ses 23.1 TFLOPs toujours en FP32.
La référence « A0 silicon » indique qu’il s’agit d’un premier lot de puces. Ces prototypes sont probablement en circulation dans les laboratoires d’Intel et chez un groupe « exclusif » d’éditeurs de logiciels. Il est aussi possible que quelques partenaires de l’industrie soient concernés moyennant le respect d’un NDA très stricte. Il n’y a rien d’étonnant car ce type de démarche est courante. L’expédition de « jeunes » prototypes à des fréquences inférieures à celles de la version finale permet aux éditeurs de préparer leurs logiciels. La finalité est d’être opérationnel lors de l’annonce officielle afin d’exploiter toute le potentiel de ces nouveautés.
Il est possible que d’ici le lancement, la puissance soit encore revue à la hausse. Pourquoi ? Intel peut envisager une hausse de la fréquence sachant que nous sommes face à de “jeunes” prototypes. Il n’y a cependant pas de certitude. Les rumeurs évoquent déjà une importante demande énergétique. Il serait question de 600 W pour cette version A0 nécessitant au passage un refroidissement liquide pour ces OAMs.
A titre d’information, voici les différentes caractéristiques des solutions A100 de Nvidia
A100 40 Go PCIe | A100 80 Go PCIe | A100 40 Go SXM | A100 80 Go SXM | |
FP64 | 9,7 TFlops | |||
FP64 Tensor Core | 19,5 TFlops | |||
FP32 | 19,5 TFlops | |||
Tensor Float 32 (TF32) | 156 TFlops | 312 TFlops | |||
BFLOAT16 Tensor Core | 312 TFlops | 624 TFlops | |||
FP16 Tensor Core | 312 TFlops | 624 TFlops | |||
INT8 Tensor Core | 624 TOPs | 1248 TOPs | |||
Mémoire GPU | 40 Go HBM2 | 80 Go HBM2e | 40 Go HBM2 | 80 Go HBM2e |
Bande passante GPU | 1555 Go/s | 1935 Go/s | 1555 Go/s | 2039 Go/s |
Enveloppe thermique (TDP) | 250W | 300W | 400W | 400W |
GPU multi-instances | Jusqu’à 7 instances MIG à 5 Go | Jusqu’à 7 instances MIG à 10 Go | Jusqu’à 7 instances MIG à 5 Go | Jusqu’à 7 instances MIG à 10 Go |
Configuration | PCIe | SXM | ||
Interface d’interconnexion | Pont NVIDIA NVLink pour 2 GPU : 600 Go/s PCIe Gen4 : 64 Go/s | NVLink : 600 Go/s PCIe Gen4 : 64 Go/s | ||
Options de serveur | Systèmes partenaires et systèmes NVIDIA certifiés avec de 1 à 8 GPU | Systèmes partenaires NVIDIA HGX A100 et systèmes NVIDIA certifiés avec 4, 8 ou 16 GPU NVIDIA DGX A100 avec 8 GPU |
Les cartes mères LGA 1851 équipées du chipset Intel B860 commencent à apparaître. La ROG… Lire d'avantage
L’utilitaire GPU-Z évolue en version 2.61. Le focus concerne la prise en charge de nouveaux… Lire d'avantage
Les premières informations sur la GeForce RTX 5070 Ti, prévue pour début 2025, indiquent des… Lire d'avantage
Annoncé en mars dernier, le SK hynix Platinum P51 PCIe 5.0 est enfin lancé en… Lire d'avantage
Acer lève le voile sur sa gamme de SSD FA200 PCIe 4.0. Visant le milieu… Lire d'avantage
Kioxia a dévoilé l'Exceria Plus G4, un SSD M.2 NVMe qui promet des débits musclés… Lire d'avantage
Voir commentaires
A efficacité énergétique comparable, une consommation de 600 W serait
un minimum ce qui laisse songeur concernant la fiabilité d'une telle
solution...