Nous y sommes, Intel officialise sa gamme Core Ultra 200 visant nos ordinateurs de bureau. Ces nouveautés proposent des changements en matière d’efficacité énergétique, des performance et d’équipement. En effet un nouveau composant fait son entrée dans le processeur, un Neural Processing Unit alias un NPU. Il se destine aux tâches d’intelligence artificielle.
Ces processeurs de nouvelle génération sont aussi connus sous le nom de code d’Arrow Lake-S. Comme nous venons de le souligner les nouveautés sont nombreuses et touchent à plusieurs éléments. Les faits les plus marquants concernent des améliorations architecturales, de nouveaux cœurs graphiques, une première intégration d’un NPU et l’abandon de la technologie Hyper-Threading. Désormais le nombre de cœurs et identique à celui des threads.
Pour ce lancement, Intel dévoile quatre processeurs avec une vitrine le Core Ultra 9 285K, le Core Ultra 7 265K et le Core Ultra 5 245K (et les variantes sans iGPU).
Référence | P-Cores | E-Cores | Total de cœurs | Fréquence boost (GHz) | GPU | NPU (TOPs) |
Core Ultra 9 285K | 8 | 16 | 24 | 5.7 | 4 cœurs GPU Xe | 13 |
Core Ultra 7 265K(F) | 8 | 12 | 20 | 5.5 | 4 cœurs GPU Xe | 13 |
Core Ultra 5 245K(F) | 6 | 8 | 14 | 5.2 | 4 cœurs GPU Xe | 13 |
Core Ultra 200, l’architecture
Selon Intel, les nouveaux P-Cores connus également sous le nom de code Lion Cove propose une amélioration de l’IPC de 9% face à P-Cores équipant les P-Cores des Core de 14ème génération. Ils peuvent s’accompagner d’un cache L3 pouvant atteindre 36 Mo tandis que la configuration du cache L2 a été mise à jour, avec une augmentation de 2 Mo à 3 Mo.
De leur coté les E-Cores Skymont affichent des gains d’IPC significatifs, notamment une amélioration de 32 % en opérations entières et de 72 % pour les opérations en virgule flottante par rapport à la génération précédente Gracemont.Intel explique avoir doubler la bande passante du cache L2 et intégré 4 Mo de cache L2.
La partie graphique prend en charge DirectX 12 Ultimate et offrent des capacités d’inférence IA avec 8 TOPS. Par contre attention il s’agit de solutions aux performances limitées en Gaming. De con coté le moteur multimédia “Xe Media Engine” prend en charge l’encodage vidéo de haute qualité (AV1, AVC, HEVC), similaire à la série Alchemist. A noter qu’Arrow Lake-S est la première plate-forme de bureau dotée de l’architectureXe-Cores (Xe-LP). Nous retrouvons 4 Xe-Cores et jusqu’à 4 unités de Ray Tracing. Le GPU est capable de proposer jusqu’à 8 TOPS pour l’inférence de l’IA. A tout ceci s’ajoute le support des instructions DP4a, permettant la mise à l’échelle XeSS.
Intel insiste beaucoup sur les performances en matière d’économie d’énergie avec un effondrement de la demande à puissance égale ou supérieure.
Elle peut atteindre les 58 % lors de tâches de productivité par rapport au Raptor Lake-R (R pour Refresh) et se situe en moyenne sur en gain (moyenne géométrique) de 73W en gaming par rapport au Core i9-14900K.
Cette réduction de la gourmandise énergétique se traduit par une forte baisse des besoins en refroidissement. En moyenne selon Intel, la température processeur baisse de 13°C par rapport à la génération précédente, lorsqu’un refroidisseur AIO de 360 mm est utilisé.
Core Ultra 200, un nouveau socket, une nouvelle carte mère
Ces processeurs Arrow Lake-S nécessitent une nouvelle carte mère basée en raison d’un changement de socket. nous passons du LGA 1700 au LGA 1851. Intel en profite pour introduire une nouvelle génération de chipset avec comme vitrine le Z890.
La mise à niveau la plus importante est la prise en charge de 20 lignes PCIe 5.0 par le processeur en complément de 4 lignes PCIe 4.0. Cela implique que la plateforme ne sera pas limitée à du 8 lignes en PCIe 5.0 avec une carte graphique de prochaine génération si un SSD M.2 PCIe 5.0 x4 est utilisée. Concernant le chipset il prend en charge 24 lignes PCIe 4.0 soit avec le processeur un total de 48 lignes PCIe.
Le Z890 gère un maximum
- Jusqu’à 5 ports USB 3.2 Gen 2×2 (20Gb/s)
- Jusqu’à 10 ports USB 3.2 Gen 2 (10Gb/s)
- Jusqu’à 10 ports USB 3.2 Gen 1 (5Gb/s)
- Jusqu’à 14 ports USB 2.0
- 8 ports SATA à 6,0 Go/s avec prise en charge des modes RAID 0,1, 5 et 10 pour les SSD PCIe et 0, 1, 5 et 10 pour les unités SATA,
- Wi-Fi 6E AX211
La plateforme abandonne la DDR4 et se concentre uniquement sur la DDR5 en dual Channel.
Du coté des tarifs aucune mauvaise surprise. Il y a même des point positifs avec un positionnement tarifaire parfois légèrement inférieur à celui des Core de 14e génération pour certaines référence.
Le Core Ultra 9 285K est annoncé au prix public conseillé de 589 $ contre 394$ pour le 265K. Ces puces seront disponibles à partir du 24 octobre prochain. Elles seront accompagnées du 265KF, qui n’a pas le GPU Arc intégré, au prix de 379 $ tandis que le 245K à 14 cœurs est positionné à 309 $ contre 294$ pour la version son iGPU.
Architecture Arrow Lake-S, quelques détails
Les puces « Arrow Lake » s’appuient sur une conception « désagrégée » basée sur des tuiles. Cette approche délaisse l’architecture monolithique souvent issue de la dernière finesse de gravure pour un ensemble de modules dont certains sont plus à même que d’autres à profiter des dernières avancées en matière de finesse de gravure. Cela peut concerner par exemple les parties processeurs et graphiques.
Comme les récentes fuites l’ont dévoilé avant l’heure nous retrouvons plusieurs types de tuiles qui composent « Arrow Lake ».
Tuile Compute
La première tuile se nomme Compute. Elle profite d’une finesse de gravure 3 nm de TSMC. Nous retrouvons les cœurs du processeur avec d’un côté des P-Cores « Lion Cove » et de l’autres des E-Cores « Skymont » . Ces derniers sont disposés en quatre grappes de 4 cœurs chacune. Les huit clusters P-cores et les quatre clusters E-core sont disposés le long d’une interconnexion de bus en anneau.
Il est intéressant de souligner que ces P-Cores et E-Cores sont disposés en alternance. Intel explique qu’il s’agit d’un choix architectural afin de réduire la concentration de chaleur générée par P-Cores dans les scénarios de calcul intensifs tels que les jeux.
Les P-Cores se partagent un cache L3 de 36 Mo tandis que la cache L2 est de 3 Mo par cœur. La technologie Hyper-Threading n’est plus présente. Au niveau architecture tous les composants clés profitent d’améliorations. Cela va d’un bloc de prédiction de branche 8 fois plus grand à une capacité du cache des micro-opérations plus importante en passant par l’arrivée des « nano-ops », des groupes de tâches de micro-opérations similaires qui peuvent être exécutées en tandem.
Le nombre d’ALU entiers passe de 5 à 6, avec 3 unités de saut au lieu de 2, 3 unités de décalage au lieu de 2 et 3 unités MUL au lieu de 1. Le moteur d’exécution vectorielle voit 4 ALU SIMD au lieu de 3, deux unités FMA @ 4 cycles et 2 unités de diviseur. Le sous-système de stockage de chargement voit une taille de 128 DTLB, au lieu de 96, et 3 générateurs d’adresses STE au lieu de 2.
Intel a également refait le sous-système de cache au niveau du cœur, avec l’introduction d’un cache de données intermédiaire entre les caches L1 et L2.
Autre avancée, la fréquence CPU des P-cores a désormais une granularité de 16,67 MHz.
Concernant E-Cores et plus précisément les clusters E-core « Skymont », ils partagent le cache L3 avec les P-cores tandis que chaque grappe se partage un cache L2 de 4 Mo. Intel annonce avoir doublé la bande passante de ce cache L2 partagé par rapport aux clusters E-core « Gracemont » de « Raptor Lake-S ».
Skymont devient plus performant grâce à une amélioration de son système de récupération et de prédiction des branches. Il peut désormais anticiper jusqu’à 128 octets à l’avance, ce qui accélère la récupération des instructions, avec jusqu’à 96 octets d’instructions récupérés simultanément. Le système de décodage a été amélioré avec 9 entrées et le support des “nano-codes” (des morceaux de code regroupés pour travailler plus efficacement) et la file d’attente des micro-opérations est plus grande, passant de 64 à 96 entrées.
Le moteur d’exécution est l’élément ayant le plus profité de mises à jour. Nous pouvons évoqué une file d’attente d’allocation désormais de 8 et la file d’attente de retrait de 16. Le système gère mieux les dépendances entre les opérations. La fenêtre pour exécuter les opérations en désordre a été élargie à 416 entrées (contre 256 avant), ainsi que les registres physiques.
Le système dispose de 26 canaux pour distribuer les tâches au moteur d’exécution, avec 8 unités de calcul entières (ALU), 3 pour les sauts et 3 pour les chargements par cycle, ce qui représente une augmentation de 50 %.
Le moteur vectoriel dispose de quatre unités de calcul flottant (FPU) de 128 bits, ce qui double la puissance de calcul. Les latences pour les opérations comme la multiplication, l’addition et la fusion sont réduites. L’arrondi des nombres flottants est maintenant accéléré par le matériel. La taille de la table de correspondance (TLB) du cache L2 passe 3 096 à 4 192 entrées.
Concernant ces P-Core et E-Core, Intel introduit la troisième génération de son système Thread Director, un planificateur qui s’assure que chaque tâche est gérée par le bon type de cœur. Cette nouvelle version est équipée d’un système de retour d’information plus précis sur les performances des E-cores pour mieux indiquer quelles ressources sont disponibles. Intel a aussi ajouté une nouvelle mesure des performances des P-cores pour mieux orienter les tâches vers ces cœurs. Le modèle de prédiction de Thread Director est désormais plus précis.
Avec des cœurs “Skymont” ayant une efficacité bien supérieure, Thread Director (V3) dirige en priorité toutes les tâches de productivité vers ces derniers. Cela permet d’optimiser la gestion des tâches et d’améliorer l’efficacité énergétique du processeur.
Tuile SoC
La deuxième tuile la plus importante est la tuile SoC. Placée dans la région centrale de la puce elle est issue d’une finesse de gravure TSMC N6 6 nm. Elle se compose de différents éléments dont le contrôleur de mémoire DDR5 double canal, le PHY de mémoire DDR5 et le complexe racine PCI-Express du processeur.
Ce dernier en complément d’un bus du chipset DMI 4.0 x8, gère 20 lignes PCIe Gen 5 dont 16 sont dédiés à l’interface PEG (pour la carte graphique) et quatre à un emplacement M.2 NVMe dédié attaché au CPU. Il y a en fait deux emplacements M.2 attachés. Le premier est cablé en PCIe 5.0 x4 et le deuxième en PCIe 4.0 x4. A tout ceci s’ajoute un contrôleur Thunderbolt 4 40 Gbps. La tuile SoC contient également trois des composants en relation à l’iGPU, le moteur d’affichage, le moteur d’accélération multimédia et les E/S d’affichage.
Le contrôleur de mémoire DDR5 double canal de « Arrow Lake-S » prend en charge jusqu’à 192 Go de mémoire double canal, avec une densité allant jusqu’à 48 Go par DIMM. Il est livré avec un support natif pour JEDEC DDR5-6400.
Enfin nous avons une unité NPU basé sur l’architecture NPU de 3e génération d’Intel dont la puissance atteint les 13 AI TOPS, ce qui n’est pas suffisant pour répondre aux 40 TOPS demandés par Microsoft pour les PCs Copilot+. Ce NPU embarque deux moteurs de calcul neuronaux (NCE), avec deux matrices MAC INT8/FP16, quatre DSP SHAVE et une mémoire vive de 4 Mo.
Tuile GPU
La troisième tuile clé est la tuile graphique, construite sur l’architecture graphique Xe-LPG. Nous retrouvons quatre cœurs Xe, d’une valeur de 64 unités d’exécution (UE) ou de 512 shaders et une unité de Ray Tracing par cœur Xe permettant de prendre en charge DirectX 12 Ultimate. Intel a également doté l’iGPU d’un cache L2 assez important de 4 Mo, qui amortit les transferts entre celui-ci et la tuile SoC.
Le moteur multimédia de « Arrow Lake-S » fournit une accélération matérielle pour les vidéos jusqu’à 8K @ 60 Hz avec HDR 10 bits, avec des formats pris en charge tels que VP9, AVC, HEVC, AV1 et SSC. L’encodage accéléré par le matériel est pris en charge pour des définition allant jusqu’à 8K @ 120 Hz avec HDR 10 bits, avec des formats pris en charge tels que VP9, AVC, HEVC et AV1. Le moteur d’affichage supporte le HDMI 2.1, le DisplayPort 2.1 et l’eDP 1.4 le tout avec le support des définitions 8K @ 60 Hz HDR, ou quatre 4K @ 60 Hz HDR, ou 1080p @ 360 Hz, ou 1440p @ 360 Hz.