Cartes Graphiques

Test GeForce RTX 4080 Founders Edition de Nvidia

Nvidia enrichit sa gamme de GeForce RTX 40 series avec une nouvelle référence sur le haut de gamme, la GeForce RTX 4080 16G. La belle est disponible en édition Founders Edition au prix conseillé de 1469 €.

La carte est massive avec un impressionnant système de refroidissement. Il occupe trois slots d’extension et s’accompagne de deux ventilateurs. Il est nécessaire de prévoir de la place pour son installation et son alimentation s’appuie sur le nouveau connecteur 12VHPWR. Nvidia promet un nouveau palier de performance avec une mécanique moins énergivore que celle de son ainée la GeForce RTX 3080 Ti. Sur le papier, les avancées sont nombreuses. Elles touchent à la puissance et à l’équipement.

Nous l’avons mise à l’épreuve pour connaitre en détail ses prestations. Est-elle à la hauteur de son tarif ? Face à la GeForce RTX 3080 Ti, les gains de performance sont-ils importants ? A l’usage, le carte se montre-t-elle silencieuse ?

GPU AD102.

La GeForce RTX 4090 exploite un GPU AD102 issu d’un processus de fabrication 4N de TSMC. Il se compose de 76.3 milliards de transistors répartis sur une surface de 608 mm²

 

Ce processeur graphique exploite l’architecture graphique Ada Lovelace. Son interface haute est en PCI-Express 4.0 x16 tandis qu’il gère de la mémoire GDDR6X au travers d’un bus 384-bit.

Le diagramme proposé par Nvidia dévoile une organisation profitant du moteur Gigathread en charge d’allouer les ressources. L’architecture Ada Lovelace dispose d’un module nommé OFA contraction d’Optical Flow Accelerator. Nous verrons en fin d’article qu’il joue un rôle essentiel pour la technologie DLSS de troisième génération. Il génère des images entières grâce à l’IA sans solliciter la machinerie de rendu graphique.

La puce embarque deux fois plus d’unités d’encodage multimédia qu’« Ampere ». Cela comprend l’accélération matérielle de l’encodage et décodage AV1. Ce choix améliore les performances dans un contexte de production. La présence de plus d’unités d’encodage multimédia signifie plus de flux de vidéos pouvant être traités en même temps. Les principaux composants de rendu graphique de l’AD102 sont les GPC alias les graphics processing clusters. Nous en retrouvons 12 contre 7 pour le GA102 (Ampere).  Il se compose d’un moteur Raster et de 6 TPC (texture processing clusters). Chaque TPC contient deux SM (multiprocesseurs de streaming).

Nvidia explique que les SM ont été retravaillés. Chaque SM contient un cœur RT de 3e génération, un cache L1 de 128 Ko et quatre TMUs. Nous observons 16 cœurs CUDA (FP32), 16 cœurs CUDA (FP32 + INT32), 4 unités de LD/ST (chargement / stockage), un petit cache L0 épaulé du « Warp Sheduler » et du « dispatch » ainsi qu’un fichier de registre et un noyau Tensor de 4e génération.

Du coup par simple multiplication, un SM embarque 128 cœurs CUDA, 4 cœurs Tensor et un cœur RT. Sachant qu’il y a 12 SM par GPC, nous retrouvons un total de 1 536 cœurs CUDA, 48 cœurs Tensor et 12 cœurs RT par GPC soit pour un ensemble de douze GPC  18 432 cœurs CUDA, 576 cœurs Tensor et 144 cœurs RT.

NVIDIA n’a pas mentionné la taille du cache L2, mais il est censé être plus imposant que celui de la génération Ampere.

Architecture Ada LoveLace

Shader Execution Reordering

Ada Lovelace profite également d’une réorganisation de l’exécution sharder (SER). L’idée est de réarranger en amont, pour chaque thread de travail, les charges de travail mathématique afin qu’elles soient traitées le plus efficacement possible par les composants SIMD. Il est promis un impact sur les performances en Rastérisation mais surtout en Ray Tracing. Pourquoi ?

Les performances sont optimales lorsqu’une même opération peut être traitée pour plusieurs cibles. Cela diminue la charge de traitement. En Ray Tracing, chaque rayon engendre un grand nombre de besoins de traitement différents. L’action du SER est de « trier » les opérations pour créer des morceaux de tâches identiques et de les exécuter. L’impact peut être très important. Par exemple sous Cyberpunk 2077, la technologie SER améliore les performances jusqu’à 44% et 29 % avec Portal RTX.

Lors de sa présentation, Nvidia a souhaité souligner que cette technologie est adaptable et modulable. Il existe différentes approches pour le SER et le meilleur choix varie selon le jeu. L’API proposera un contrôle sur le fonctionnement de l’algorithme de tri.

Displaced Micro-Meshes

Ada Lovelace profite également d’un moteur de micro-maillage déplacé (Displaced Micro-Meshes) assuré par les cœurs RT de 3e génération. Ces DIMMs élaborent les hiérarchies de volumes englobants (BVH alias Bounding-Volume Hierarchy) de manière plus efficace et moins gourmande en ressource. Nvidia évoque une vitesse accrue d’un facteur 10 et des besoins en mémoire vidéo divisés par 20. Ce maillage structuré de micro-triangles est traité en natif par les cœurs RT de 3ième génération.

L’approche est de représenter des objets à géométrie complexe sous la forme d’un maillage grossier d’un triangle de base. La structure de données BVH se simplifie ce qui soulage les besoins en mémoire et réduit la charge du processeur de ray tracing. Contrairement à Ampere, où les Core RT de 2ième génération doivent traiter toutes les informations de chaque triangle format le maillage, les Core RT de 3ième génération d’Ada LoveLace traitent un triangle accompagné d’un map permettant de reconstruire l’objet et ses interactions avec la lumière.

Les gains se situent à plusieurs échelles, de quoi soulager les besoins en:

      • bande passante,
      • stockage,
      • bus PCIe,
      • et ressource processeur.

Opacity Micro Meshes

Nous avons également la fonctionnalité OMM alias l’Opacity Micro Meshes visant à booster les performances de pixellisation, en particulier avec les objets qui ont une valeur « alpha » (données de transparence).  Certains objets composant une scène 3D, tels que les feuilles d’un arbre ont une forme difficile à maitriser pour les cœurs RT en charge de déterminer les interactions avec les rayons de lumière. Les feuilles sont essentiellement des rectangles exploitant des textures mais accompagnés d’un alpha (de transparence). Il permet de créer la forme de la feuille.

Les cœurs RT se retrouvent dans une situation complexe puisque la gestion des rayons avec de tels objets demande de connaitre la forme. Les cœurs RT Ampere ont besoin de plusieurs interactions pour déterminer cette forme. La situation a été résolue avec cette fonctionnalité OMM. Elle créé un maillage de textures rectangulaires qui s’alignent avec les parties de la texture sans donnée alpha. Du coup, les cœurs RT appréhendent mieux la forme exacte de l’objet à traiter. La méthode profite aussi à l’ombrage dans de rendu sans Ray Tracing.

DLSS 3

Enfin, la technologie DLSS 3 promet de doubler le nombre d’images par seconde à qualité comparable. Ceci est possible en raison d’une nouvelle avancée nommée AI frame-génération. Le DLSS 3 s’appuie sur le fonctionnement du DLSS 2 tout en générant des images entières de demi trame à l’aide de l’IA. De plus, ces images alternées sont le résultat d’une analyse des trames précédentes et suivantes.

Cela n’est cependant possible que sur l’architecture graphique Ada lovelace, en raison d’un composant matériel , l’OFA (Optical flow accelerator). Il apporte son aide à prédire la prochaine image en créant un champ de flux optique (Optical flow-field).

Son rôle est de permettre au DLSS 3 de connaitre les objets statiques dans une scène 3D dynamique. Ce processus s’appuie sur le format mathématique FP8 pris en charge par les coeurs Tensor de 4e génération. A noter que pour réduire la latence inhérente à cette avancée le DLSS 3.0 s’appuie sur Reflex.

Complément d’informations

Technologie DLSS 3.

La technologie DLSS 3 utilise l’IA pour générer des images nouvelles et non de simples pixels.

Cette technologie combine des techniques du DLSS actuelles comme les vecteurs de mouvement et les algorithmes d’IA de super résolution avec de nouvelles techniques de génération de trames tirant avantage des fameux OFA que nous avons vus plus haut. De plus, la technologie Reflex est utilisée pour réduire la latence.

A noter que, sachant que le DLSS 3 génère une nouvelle image sans impliquer le jeu, il profite aux titres ayant des ressources limitées en CPU, en particulier ceux qui sont lourds en gestion physique du monde ou proposant un monde vaste et détaillé à l’origine de lourds calculs processeur. Le DLSS 3 permet dans ce cas de dépasser les framerates assurés par le processeur. En clair, nous avons un effet CPU limited moins présent.

Le DLSS 3 fonctionne simultanément avec DLSS Super Resolution (alias DLSS 2) afin de booster les performances dans les charges de travail sollicitant un rendu en Ray Tracing exigeants.

Les jeux DLSS 3 sont rétro compatibles avec la technologie DLSS 2 qui va continuer à s’améliorer, c’est du moins une promesse de Nvidia.

Architecture Ada LoveLace.

Comme nous l’avons souligné, l’architecture Ada Lovelace dispose de multiprocesseur de streaming amélioré, de cœurs RT (Ray Tracing) de troisième génération, de cœurs Tensor de quatrième génération, d’encodeurs de huitième génération prenant en charge AV1.

Les cœurs Tensor de 4e génération profite du moteur Hopper FP8 Transformer dédié aux charges de travail d’inférence d’IA. Par rapport au FP16, le FP8 réduit de moitié les exigences de stockage de données. Nvidia annonce un doublement des performances de l’IA permettant à la GeForce RTX 4090 d’offrir 2 fois la puissance totale de traitement des Tensor Core de la RTX 3090 Ti.

Cœurs RT de 3ième génération.

Ils disposent

      • d’un nouveau moteur « Opacity Micromap » capable d’accélérer d’un facteur 2 le Ray Tracing de l’Alpha-tested geometry
      • d’un nouveau moteur Micro-Mesh censé augmenter la richesse géométrique du monde sans le coût de « construction » et de stockage BVH. Il permet au débit d’intersection rayon-triangle de grimper de 78 RT-Flops (Ampere) à 191 RT-TFLOPS.

GeForce RTX 4080, les spécifications

La GeForce RTX 4080 16 Go fait partie de l’offre phare de Nvidia. Elle se positionne comme une vitrine aux coté de sa grande sœur la GeForce RTX 4090. Son GPU est composé de 45.9 milliards de transistors. Ils s’organisent pour donner naissance à 7 Graphics Processing Clusters, 38 Texture Processing Clusters et 76 Streaming Multiprocessors. Tout ceci permet de profiter de 9728 cœurs CUDA, 304 cœurs Tensors de quatrième génération, 76 cœurs RT de 3ième génération, 304 unités de texture et 112 ROPs.

Nvidia calibre la fréquence GPU boost à 2505 MHz tandis que la mémoire vidéo (16 Go de GDDR6X) turbine à 11200 MHz (22.4 Gbps). Elle est exploitée au travers d’un bus 256-bit. Tout ceci offre une bande passante de 716.8 Go/s.

L’équipement de la Founders Edition comprend trois DisplayPort et un HDMI permettant du 4K à 240 Hz au maximum et du 8k à 60 Hz. Son enveloppe thermique est de 320 Watts tandis que Nvidia conseille un bloc de 750 Watts au minimum pour assurer son alimentation. Le bundle comprend un adaptateur 3 x PCIe 8 broches vers un 16 broches (12VHPWR).  Cette connectique d’alimentation additionnelle abandonne les connecteurs PCIe 6 ou 8 broches pour un connecteur PCIe 5.0 12+4 broches acceptant 450 ou 600 Watts.

Voici un bilan face à sa GeForce RTX 3080 Ti.

GeForce RTX 3080 TiGeForce RTX 4080
Graphics Processing Clusters77
Texture Processing Clusters4038
Streaming Multiprocessors8076
Cœurs CUDA102409728
Cœurs Tensor320 (3rd Gen)304 (4th Gen)
Cœurs RT80 (2nd Gen)76 (3rd Gen)
Unités de texture320304
ROPs112112
Fréquence GPU boost1665 MHz2505 MHz
Fréquence mémoire9500 MHz11200 MHz
Vitesse mémoire19 Gbps22.4 Gbps
Cache L26144 KB65536 KB
VRAM12 Go GDDR6X16 Go GDDR6X
Interface mémoire384-bit256-bit
Bande passe mémoire912 GB/sec716.8 GB/sec
Texture Rate532.8 Gigatexels/sec761.5 Gigatexels/sec
Finesse de gravureSamsung 8 nm 8N NVIDIA Custom ProcessTSMC 4N NVIDIA Custom Process
Nombre de transistors28.3 billion45.9 billion
Sorties vidéo3 x DisplayPort

1 x HDMI

3 x DisplayPort

1 x HDMI

Définition / Taux de rafraichissement4K at 240Hz or 8K at 60Hz with DSC4K at 240Hz or 8K at 60Hz with DSC
Facteur de forme2 Slots3 Slots
Alimentation1×16-pin

(Dongle to 2x 8-Pins)

1×16-pin

(Dongle to 3x 8-Pins)

Alimentation750 Watts750 Watts
Total Graphics Power (TGP)350 Watts320 Watts
Température GPU Maximale93° C90° C
PCI ExpressGen 4Gen 4

Compléments d’information.

Cœurs tensors

Les cœurs Tensors sont dédiés aux calculs hautes performances. Ils sont spécialisés et adaptés aux calculs matriciels et aux opérations mathématiques complexes utilisées dans les applications d’IA et HPC. Le calcul matriciel est utilisé par l’apprentissage profond des réseaux neuronaux et les fonctions d’inférence comme la technologie DLSS 2.1 pour les joueurs.

Core RT de 3ième génération

Les cœurs RT de troisième génération sont des unités matérielles dédiées au Ray Tracing. Nous les retrouvons afin d’accélérer la traversée BVH et l’exécution de calculs de test d’intersection rayon-triangle. Du coup, ces tâches ne sont pas assurées par les SM dont les ressources peuvent être allouées à d’autres calculs. Face à Ampere, Nvidia promet un débit d’intersection Rayon-Triangle 2 fois plus important que celui disponible avec Ampere.  Dans le concret, cela permet par exemple d’augmenter les détails du monde du jeu sans avoir d’impact sur les performances actuelles.  De son côté, le moteur micro-mesh génère des micro-maillages à la volée pour générer une géométrie supplémentaire, permettant une complexité géométrique accrue sans le coût de construction et de stockage BVH.

Encodeurs vidéo AV1

La GeForce RTX 4090 disposent de deux encodeurs matériels connus sous le nom de NVENC. Ils assurent une prise en charge du codec vidéo AV1. Ce dernier assure un meilleur rendu que les classiques codecs H.264 ou H.265. C’est une avancée intéressante pour les joueurs amateurs de streaming.

Face à Ampere, le passage d’un à deux moteurs d’encodage permet de paralléliser certains calculs. L’image peut être divisée par deux pour être traitée par les deux encodeurs puis recombinée en un seul flux binaire. Du coup, l’encodage peut être accéléré jusqu’à 2 fois par rapport à l’encodage disponible avec les GeForce RTX 30 series.

GeForce RTX 4080 Founders Edition de Nvidia.

Pour ce dossier, Nvidia nous a fait parvenir sa GeForce RTX 4080 Founders Edition. Nous sommes ainsi en présence d’une carte de référence annoncée au prix recommandé de 1469 €. Le positionnement tarifaire est haut de gamme, au point de s’adresser à un marché de niche.

Le GeForce RTX 4080 Founders Edition et sa grande sœur la GeForce RTX 3080 Ti

Face à sa grand sœur ,la GeForce RTX 3080 Ti Founders Edition, le style ne change pas. Nous sommes sur une carte bien plus imposante mais au travers d’une robe connue proposant un doux mélange de noir et d’anthracite. L’approche est « austère » accompagnée d’une finition « Premium ».

En main, elle respire la qualité avec une charpente solide et réconfortante. Il y a peu de plastique. Sa structure s’appuie en grande partie sur de l’aluminium anodisé. Le look gagne en rondeur tout en continuant à souligner une forme « d’infini ».

Elle demande un espace de plus de 30,5 cm pour son installation. De plus avec un poids de plus de 2.1 Kg, il est conseillé d’utiliser un support GPU afin de soulager le port PCIe x16 de la carte mère. Le bundle ne propose pas ce support ce qui est dommage, surtout à la vue du tarif.

GeForce RTX 4080 Founders Edition de Nvidia

Cet « embonpoint » s’explique par son imposant dissipateur thermique. Il a l’originalité d’utiliser deux ventilateurs axiaux (7 pales) de 115 mm de diamètre en position opposée. Ainsi le ventilateur du haut, une fois la carte mise en place dans son logement PCIe x16, est en position d’extraction. Il aspire l’air pour le propulser vers le haut. Le flux traverse ainsi la carte en terminaison puisqu’aucun PCB n’est présent. Le second ventilateur, placé à l’avant et sur le dessous de la carte, aspire l’air du bas du boitier pour le propulser au travers des multiples ailettes en aluminium.

L’alimentation est assurée par le port PCIe x16 et le nouveau connecteur 12VHPWR. Il est placé en latéral au milieu de la carte. Un adaptateur 3 x 8 pins vers cette fiche 12HPWR est présent en bundle.

A noter que contrairement à l’adaptateur 4 x 8 pins présent dans le bunlde de la RTX 4080, ce denier ne permettra pas de dépasser la limite de puissance en cas d’overclocking.

Coté équipement, nous avons 3 sorties vidéo DisplayPort 1.4 et une sortie vidéo HDMI 2.1. Tout ce petit monde est placé sur le bas de la face arrière de la carte libérant ainsi une large surface afin de favoriser l’extraction de l’air char.

Comme nous l’avons souligné, le système de refroidissement est proche à première vue de celui de la GeForce RTX 3080 Ti. Nous avons cependant des optimisations de ce design afin d’augmenter le flux d’air. La première directement visible concerne la taille avec des ventilateurs plus grands afin de fournir un débit d’air plus élevé sans modifier l’acoustique. Sur ce point, Nvidia promet que Face à la RTX 3090 Founders Edition le débit d’air progresse de 15 % tout en conservant les mêmes nuisances sonores.

La distance entre les ailettes du dissipateur est également modifiée. Elle est différente en fonction de la hauteur du refroidisseur afin de maintenir un débit d’air et une pression constante. Le GPU, la mémoire et les éléments d’alimentation sont en contact avec une chambre à vapeur plus large. Nvidia utilise également des caloducs pour transporter la chaleur vers les zones de dissipation.

Au repos, l’utilitaire GPU-Z annonce une fréquence GPU calibrée à 210 MHz tandis que les 16 Go de GDDR6 sont à 50,6 MHz. En charge, le GPU se stabilise à 2430 MHz et la mémoire à 1400.2 GHz.

Protocole de test.

Nous avons utilisé des jeux, plusieurs définitions (1440P et 2160p), plusieurs benchmarks et des applications GPGPU. Pour chaque titre, tous les paramètres de rendu sont au maximum. Les pilotes graphiques sont les derniers en date à l’heure d’écriture de ce test. Il s’agit des Drivers Press GeForce 526.72 Game Ready.

Configuration Intel socket LGA 1200

      • Carte mère : Asus ROG Maximus Z690 HERO
      • Processeur : Intel Core i9-12900K,
      • Mémoire vive : Vengeance RGB DDR5 6400 MHz CL38 de Corsair (2×16 Go),
      • Stockage: SSD Kioxia Exceria Pro 2 To,
      • Alimentation: Dark Power 13 1000 Watts
      • Dissipateur : Ventirad Noctua NH-D12L de Noctua

Pour son alimentation be quiet! nous a fait parvenir une Dark Power 13 de 1000 Watts.

Cette alimentation répond aux contraintes du label 80 Plus Titanium. Elle s’arme d’un très haut rendement limitant le gaspillage énergétique.

Elle propose une gestion 100% modulaire des câbles et surtout s’arme en natif du nouveau câble 12VHPWR. Il permet d’alimenter notre GeForce RTX 4090 Gaming OC 24 Go à l’aide d’un unique faisceau.

L’adaptateur en Y demandant quatre PCIe 8 broches n’est plus nécessaire, de quoi simplifier le montage, limiter les câbles, optimiser le rangement, améliorer le rendu et optimiser l’organisation des câbles dans le boitier.

Ce 12VHPWR permet de distribuer beaucoup plus de puissance. Il est désormais la norme pour les cartes graphiques de 450 watts et plus. Il faut remonter à 2013 pour revivre un tel changement. A l’époque, le PCIe révision a fait son entrée. Le connecteur PCIe 8 broches fournit jusqu’à 150 watts, alors que son petit frère en 6 broches est limité à 75 watts.

Les cartes graphiques les plus exigeantes actuellement, comme notre ROG STRIX GeForce RTX 3090 White Edition, nécessitent jusqu’à trois de ces connecteurs 8 broches.

Pour le moniteur, nous avons utilisé l’imposant ROG Swift PG32UQX d’Asus.

Jeux vidéo

      • Metro Exodus,
      • Far Cry 6,
      • Shadow of Tom Raider,
      • Total War : Warhammer,
      • Horizon Zero Dawn,
      • Watch Dogs Legion,
      • Cyberpunk 2077,
      • A Plague Tale: Requiem
      • Microsoft Flight Simulator.

Benchmarks

      • Heaven,
      • 3DMark Fire Strike (Performance, Extreme, Ultra),
      • 3DMark Time Spy Extreme,
      • 3DMark Port Royal (1440p, 2160p),
      • 3DMark DirectX RayTracing Feature Test,
      • 3DMark DLSS Feature Test,
      • Blender v2.9
        Puissant outil de développement pour créer des images et animations 3D. Cette version apporte la prise en charge de l’OptiX chez Nvidia soit une accélération matérielle avec une GeForce ou Quadro RTX. Cela concerne le rendu et le viewport. Pour les Radeon RX 6000 Series nous utilisons l’API OpenCL.
      • LuxMark 3.1
        Cette application exploite l’API OpenCL pour exécuter des calculs de rendu 3D. Il est possible de travailler uniquement avec le GPU, le CPU ou encore les deux en même temps (idéal pour se rendre compte de la différence de performance qu’il existe entre un processeur et une solution graphique). Mieux encore, ce benchmark existe sur différents environnements comme Linux, OS X et Windows. Il livre un score et des indices de valeurs Samples/sec et Rays/sec.
      • OctaneBench 2020.1.5
        Test de rendu 3D avec activation ou non du RTX.
      • Blender BenchMark Version 3.0.1.
        Exercices Monster, JunkShop et Classroom.
      • Black Magic Design.
        Le test consiste a encoder des vidéos en 8k Prores442HQ à 30FPS et en 4K Prores422HQ à 30FPS en HEVC et AV1.

Attention.

Dans certains cas, notre GeForce RTX 4080 Founders Edition se montre très puissante au point que notre configuration n’arrive pas à suivre.  Il faut impérativement disposer d’un écran 4K au minium pour profiter au mieux de sa mécanique et ne pas hésiter à activer le Ray Tracing et du Full Option

GeForce RTX 4080 Founders Edition, environnement

Performance de refroidissement.

L’ensemble du monitoring est assuré par GPU-Z. Nous avons torturé cette solution durant 10 minutes en sollicitant au maximum son GPU. Les tests sont faits à l’air libre afin de faire abstraction des performances de refroidissement du boitier. La température de la pièce est de 21°C.

GeForce RTX 4080 Founders Edition – Performance de refroidissement

Au repos, la carte propose un mode fanless. Ses deux ventilateurs sont à l’arrêt. Le GPU se stabilise aux alentours des 35°C. la montée en charge déclenche rapidement la mise en route de la ventilation de la carte. Nous observons une progression par palier de 1% de la vitesse maximale des deux ventilateurs. Au bout de 10 minutes, ils turbinent à 40% de leur vitesse maximale soit environ 1300 rpm. Le GPU ne dépasse pas 61°C, ce qui est parfait comme nous allons le voir lors de l’analyse de la stabilité de sa fréquence.

Nuisances sonores.

GeForce RTX 4080 Founders Edition – Nuisances sonores

Sur la question des nuisances sonores, le bilan est positif. Au repos, la carte est inaudible tandis qu’en burn notre sonomètre dépasse à peine 39.1 dBa. La différence est nette face à sa grande sœur la GeForce RTX 3080 Ti (0 à 43.1 dBA). Nous avons une carte plus silencieuse tout en assurant un refroidissement efficace puisque la température GPU se stabilise à 61°C.

Stabilité des fréquences.

GeForce RTX 4080 Founders Edition – Stabilité des fréquences

Voici un suivi des fréquences GPU et VRAM durant notre test de montée en charge. La courbe bleue (fréquence GPU) se montre stable. Les fluctuations sont minimes. La fréquence moyenne est de 2417 MHz contre 1400,2 MHz pour le GDDR6. Il n’y a aucun enclenchement d’une protection particulière. Avec un TGP respecté et une température GPU maitrisée, le carte délivre toute sa puissance dans le temps.

C’est parfait.

Consommations électriques.

Voici les besoins énergétiques de cette Founders Edition aux côtés d’autres solutions comme la ROG STRIX GeForce RTX 3090 White Edition, la GeForce RTX 3080 Ti Founders Edition ou encore la GeForce RTX 4090 Gaming OC 24G.

GeForce RTX 4080 Founders Edition – Consommations électriques

Nvidia annonce un TGP de 320W contre 350W pour son ainée la RTX 3080 Ti. De notre coté, nous enregistrons une demande énergétique entre 4.3 et 321 Watts contre 24.8 et 348 Watts pour la RTX 3080 Ti. Nous avons ainsi une solution moins énergivore.

Remarque.

Cette mesure de consommation correspond aux besoins minimal et maximal de la carte afin de pouvoir faire une évaluation globale de son cout d’exploitation et son empreinte carbone de fonctionnement.

Dans le détail, ses besoins énergétiques varient énormément selon le type d’exercice. L’enveloppe thermique ( TGP) déclarée de 320 W est une information intéressante mais elle ne permet pas de détailler la consommation d’énergie en fonction des usages. En clair, son bilan énergétique n’est pas universel. Il varie en fonction des usages et des besoins.

Le TGP est la limite de puissance maximale pour la fréquence boost du GPU. Elle sera optimisée en fonction de cette limite mais également d’autres paramètres comme la température. Cette puissance peut être atteinte (c’est notre cas dans ce test) avec des applications très gourmandes.

Cout financier et empreinte carbone de fonctionnement.

Les consommations au repos et en burn permettent de calculer le coût annuel de fonctionnement et son empreinte carbone de fonctionnement.

Tarifs EDF au aout 2022

Notre base de travail est une utilisation quotidienne de 6 heures par jour, 365 jours par an avec un tarif de 0,174 € le kWh facturé (tarifs réglementé métropole au 01/08/2022 d’EDF pour une puissance souscrite de 6 kVA).

Indicateur mensuel d’émissions de gaz à effet de serre en 2020-2021 (en g équivalent CO2 par KWh)

L’indicateur EDF, en gramme d’équivalent CO2 pour la production de 1 kWh, est fixé à 21,6 grammes (période novembre 2020 à novembre 2021). Il est synonyme du taux de rejet de gaz à effet de serre induit par la production de l’électricité consommée.

GeForce RTX 4080 Founders Edition - Cout financier d'exploitation
GeForce RTX 4080 Founders Edition - Empreinte carbone de fonctionnement

Avec les plus faibles besoins de notre comparatif, cette GeForce RTX 4080 FE a le plus faible coût d’exploitation annuel. Il se situe entre 1.7 et 122.3 € selon les usages. Le bilan est identique du coté de son empreinte carbone. Elle est la plus faible avec une valeur comprise entre 0.2 et 15.2 kilogrammes d’équivalent CO2.

GeForce RTX 4080 Founders Edition, performance en gaming

Performance en Rasterisation.

Nous avons pris comme référence les performances proposées par la GeForce RTX 3090. Elle dispose d’un indice 100 dans nos tableaux. Nous avons fonctionné avec deux définitions à savoir le 1440p et le 2160p. Dans tous les cas, les options graphiques sont au maximum.

GeForce RTX 4080 Founders Edition – Bilan des performances en Rasterisation

Nous avons une jolie progression des performances. Face à la GeForce RTX 3080 Ti, elle se situe à 19.3% en 1440p et 30.6% en 2160p. L’écart n’est donc pas négligeable. Il permet également de dépasser avec générosité le bilan de la GeForce RTX 3090 de 16.2% et 26.3% en 1440p et 2160p.

En rapprochant ces résultats de ceux des consommations électriques, nous avons un beau bilan face à la RTX 3080 Ti (moins puissante et plus gourmande). La GeForce RTX 4090 décroche la première place. La différence face à notre RTX 4080 FE est de 13.8% en 1440p et 35.7% en 2160p.

Remarque.

Il est important de souligner que nous sommes devant une carte graphique très puissance. A l’image de la RTX 4090, cette RTX 4080 Founders Edition arrive à mettre en difficulté notre processeur, le Core i9-12900K. Voici par exemple le même bilan mais avec cette fois que les scores GPU relevés par le benchmark 3DMark Fire Strike.

GeForce RTX 4080 Founders Edition – Bilan des performances sous 3DMark Fire Strike

Les écarts sont plus marqués avec la RTX 4090 et la génération 30 series !

GeForce RTX 4080 Founders Edition – Framerate en Rasterisation

L’analyse des framerates montre un bilan quasiment parfait quelle que soit la définition.  En 1440P, le framerate dépasse les 90 images par seconde sauf sous Flight Simulator. A nos yeux, cette barre permet d’assurer un gameplay optimal. En 4K (2160p), les résultats sont également musclés mais dans trois titres la barre des 90 images par seconde n’est pas franchie. Le titre le plus gourmand est une nouvelle fois Flight Simulator de Microsoft. Il est intéressant de noter la faible différence de framerate entre 1440p et 2160p. Nous avons ici un goulot d’étranglement limitant les performances.

GeForce RTX 4090 Gaming OC 24G - Performances en Rasterisation
GeForce RTX 3080 Ti - Performances en Rasterisation
ROG Strix GeForce RTX 3090 WE - Performances en Rasterisation

Performance en Ray Tracing.

Voici les performances sous différents jeux avec l’activation du Ray Tracing. Nous travaillons toujours avec des options graphiques au maximum. La technologie DLSS n’est pas désactivée pour le moment.

GeForce RTX 4080 Founders Edition – Bilan des performances en Ray Tracing

Le classement ne change pas. La RTX 4090 domine suivie de la RTX 4080 FE. L’écart par rapport à la RTX 3080 Ti est une nouvelle fois significatif (+32.8% en 1440p et 33.2% en 2160P).

GeForce RTX 4080 FE – Performances en Ray Tracing

L’analyse de framerate montre que l’activation de cette technologie est gourmande en ressource. En 1440p, le framerate se situe entre 83 et 162 images par seconde selon le titre. Le passage au 4K fait chuter cette fourchette entre 46 et 92 images par seconde.

Nous observons que, dans plusieurs jeux, il est nécessaire d’intervenir sur les options graphiques pour assurer 90 images par seconde. Une autre solution est d’activer la technologie DLSS si elle est prise en charge.

GeForce RTX 3080 TI FE – Performances en Ray Tracing

Performance du DLSS 2 et DLSS 3

Le test 3DMark – DLSS Feature permet d’avoir une évaluation du « boost » proposé par le DLSS 2 et 3.

GeForce RTX 4080 Founders Edition – 3DMark DLSS Feature Test

Les scores montrent des gains de 170% au minimum selon la carte. La série des GeForce RTX 40 series assure de son coté le support du DLSS 3 avec un nouveau boost des performances à la clé. Avec cette technologie, le framerate progresse de 230 % au minimum.

Voici maintenant la même étude avec deux jeux en Ray Tracing.

GeForce RTX 4080 Founders Edition - Performance en Ray Tracing (Watch_Dogs Legion)
GeForce RTX 4080 Founders Edition - Performance en Ray Tracing (Shadow Of Tomb Raider)

Les résultats sont ici moins optimistes mais restent importants. En moyenne, nous enregistrions des gains de 17% en 1440p et 54% en 2160p.  Cette technologie permet d’apporter un plus non négligeable au gameplay tout en profitant d’un Ray Tracing activé avec des options au maximum.

Nous avons également tenté l’aventure sous Cyberpunk 2077, A Plague Tale: Requiem et Flight Simulator avec cette fois le DLSS 3. Dans les deux définitions, tout est au maximum (options graphiques et le Ray Tracing) tandis que le DLSS 3 est en mode « performance ». La technologie Reflex est aussi activée.

GeForce RTX 4080 Founders Edition – Performances DLSS 3.0

Le framerate progresse en moyenne d’un facteur 2.3 en 1440p et 2.6 en 2160p soit de quoi offrir 106 images par seconde au minimum en 4K avec du Full Option et du Full Ray Tracing.

Vous trouverez ci-dessous les détails des différents benchmarks que nous avons utilisés.

3DMark – Port Royal.

GeForce RTX 4080 Founders Edition – 3Dmark Port Royal

3DMark – Speed Way

GeForce RTX 4080 Founders Edition – 3DMark Speed Way

3DMark – Fire Strike

GeForce RTX 4080 Founders Edition – Performances sous 3DMark Fire Strike

3DMark DirectX Ray Tracing Feature test.

GeForce RTX 4080 Founders Edition – Bilan sous 3DMark DirectX Ray Tracing Feature Test

GeForce RTX 4080 Founders Edition, les performances « création ».

La mécanique de notre GeForce RTX 4080 Founders Edition peut aussi accélérer les calculs en création et en encodage vidéo. Cette solution peut être utilisée dans certains contextes comme la création vidéo, le 3D… De nombreuses applications sont capables d’exploiter sa mécanique pour profiter d’une accélération matérielle.

Une nouvelle fois, nous avons pris comme référence les performances de la GeForce RTX 3090. Elle dispose d’un indice de 100 dans notre graphique.

GeForce RTX 4080 Founders Edition – Bilan Création

Le bilan est en gros identique à celui constaté en gaming. Notre GeForce RTX 4080 Founders Edition améliore en moyenne de 30% les performances de la GeForce RTX 3080 Ti. Elle dépasse de 26% les prestations de sa grande sœur,la RTX 3090, et se positionne en dessous de la nouvelle vitrine de Nvidia la GeForce RTX 4090. L’écart est important entre les deux cartes. En moyenne, il se situe à 39%.

Voici les détails des différents tests que nous avons menés.

Blender 2.9.

GeForce RTX 4080 Founders Edition – Blender 2.9

OctaneBench

GeForce RTX 4080 Founders Edition – OctaneBench

Blender Benchmark Launcher

GeForce RTX 4080 Founders Edition – Blender benchmark

LuxMark v3.1

GeForce RTX 4080 Founders Edition – Performances sous Luxmark

Enfin pour terminer, nous avons mis à l’épreuve les deux encodeurs matériels de cette GeForce RTX 4080 Founders Edition face à l’unique encodeur matériel de la RTX 3090 afin de savoir s’ils permettent de diviser par deux le temps nécessaire à certains traitements vidéo tout en prenant en charge le codec vidéo AV1 en plus du classique H.265.

Nous avons utilisé l’application Black Magic Design afin d’encoder des vidéos en 8K Prores442HQ à 30FPS et 4K Prores422HQ à 30FPS en HEVC et AV1.

Voici les temps nécessaires à ces travaux et ceux mesurés avec la GeForce RTX 3090.

GeForce RTX 4080 Founders Edition – Encodage vidéo

Il n’y a pas de résultat AV1 pour la RTX 3090 car elle ne dispose pas d’une accélération matérielle pour ce format. Nous retrouvons en gros les prestations de la GeForce RTX 4090 . les temps nécessaires à l’encodage de notre vidéo sont divisés par plus de deux. Là où une GeForce RTX 3090 demande 33s en 4K30-H.265 et 120s en 8K30-H.265 nous chutons à 15 et 52 secondes.

Ce gain est une avancée permettant d’optimiser et améliorer la production, en particulier dans un cadre professionnel.

GeForce RTX 4080 Founders Edition, conclusion.

Top Performance – GinjFo

Review Overview

Performance
Nuisances sonornes
Consommation

Nous voici au terme de notre dossier consacré à cette nouvelle GeForce RTX 4080 en édition Founders Edition. Face à la GeForce RTX 3080 Ti Founders Edition, les gains en performance en 1440p et 2160p sont de 19% au minimum en Rasterisation et de 33% en Ray Tracing, le tout avec une consommation électrique en baisse de 7% au minimum en burn.  A cela s’ajoutent une hausse de 30% des prestations en Création 3D et la présence de deux encodeurs matériels permettant de diviser par plus de deux le temps nécessaire à l’encodage vidéo H.265 et AV1. Le bilan est donc parfait si en plus nous rajoutons un système de refroidissement moins bruyant et tout aussi performant.La carte souffre cependant d’un très imposant dissipateur thermique demandant beaucoup de place dans un boitier. Son poids est également important et il faut prévoir un support GPU afin de soulager le port PCIe x16 de la carte mère. Il n’est malheureusement pas proposé en bundle. A noter que la carte se vante d’un châssis robuste et rigide qui n’affiche aucune faiblesse à la torsion si bien qu’une fois en place dans le boitier et fixée à l’aide de vis cruciformes, il permet de limiter les contraintes mécaniques exercées à la carte mère.Sa puissance assure un framerate à plus de 90 images par seconde en 4K Full Option. Le Full Ray Tracing est aussi possible mais en visant 60 fps. L’usage de la technologie DLSS 2, et plus particulièrement de la DLSS 3, permet de son coté du 4K Full Option et Full Ray Tracing avec 90 images par seconde et plus.Tout ceci a malheureusement un prix. Positionné à 1469 €, cette GeForce RTX 4080 Founders édition vise les joueurs fortunés en quête d’une solution aux performances musclées, de quoi équiper un PC avec une mécanique pensée pour aujourd’hui et demain.

Jérôme Gianoli

Aime l'innovation, le hardware, la High Tech et le développement durable. Soucieux du respect de la vie privée.

Voir commentaires

  • C'est vrai qu'il manque pas grand chose, c'est même trop pour mon niveau technique. En tout cas cette version Founders n'a rien à envier aux cartes partenaires.

Partager
Publié par
Jérôme Gianoli
Tags: reviewtest

Article récent

ZOTAC dévoile la gamme des GeForce RTX 50 et confirme les spécifications

Le site officiel de Zotac a confirmé l’existence des GeForce RTX 50 series et leur… Lire d'avantage

23/12/2024

Les Radeon RX 9070 XT et non XT apparaissent !

La prochaine Radeon RX 8800 XT pourrait bien d’appeler la Radeon RX 9070 XT. C’est… Lire d'avantage

23/12/2024

WigiDash de G.Skill, un écran USB tactile de 7 pouces indispensable ?

G.Skill tente de se distinguer sur le marché des périphériques en lançant le WigiDash, un… Lire d'avantage

23/12/2024

Test WigiDash de G.Skill

G.Skill a étoffé son catalogue produits avec l’annonce du WigiDash. Il s’agit d’un périphérique USB… Lire d'avantage

23/12/2024

Ventilateur UNI FAN TL, Lian li propose du sans fil 2,4 GHz

Lian Li dévoile sa gamme de ventilateurs UNI FAN TL Wireless. La technologie 2,4 GHz… Lire d'avantage

20/12/2024

Intel abandonne le projet x86S et forme un partenariat avec AMD

Intel abandonne son initiative x86S, un projet visant à rationaliser l'architecture x86 en supprimant les… Lire d'avantage

20/12/2024