Nvidia complète sa gamme de GeForce RTX 30 series avec l’arrivée de la GeForce RTX 3070. La belle est attendue avec impatience car elle s’accompagne d’une belle promesse. Depuis son annonce, le positionnement est alléchant sur le papier. Cette solution vise à offrir les performances de l’ancienne vitrine, la GeForce RTX 2080 Ti mais à un prix bien plus compétitif. Certains évoquent un positionnement milieu de gamme mais la tarification reste conséquente. La GeForce RTX 3070 Founder Edition est annoncée à 519 €. Nous vous proposons un test complet au travers d’une version personnalisée signée Asus, le TUF Gaming GeForce RTX 3070 OC Edition 8G. GeForce RTX 3070 et l’architecture Ampere Au cœur de cette GeForce RTX 3070, nous retrouvons l’architecture Ampere. Elle a été lancée deux ans après Turing qui pour la première fois a proposé une prise en charge du Ray Tracing en temps réel dans les jeux vidéo et la technologie DLSS. Ampere permet à Nvidia de déployer des ajustements, des optimisations et des améliorations. L’objectif est simple. Il consiste à mieux s’armer pour le Ray-Tracing tout en proposant une hausse conséquente de la puissance. La gamme des GeForce RTX 3000 series se compose, à l’heure d’écriture de ce test, de trois modèles exploitant deux GPU différents. Nous retrouvons un GA104 au cœur de la GeForce RTX 3070 et un GA102 dans les mécaniques des GeForce RTX 3080 et 3090. Ce dernier n’est naturellement pas identique car les deux cartes ne proposent pas les mêmes prestations et ne sont pas positionnées au même tarif. La GeForce RTX 3090 prend vie grâce à un GA102-300 tandis que sa petite sœur, la GeForce RTX 3080, grâce à un GA102-200. La gravure est du 8 nm (technologie Samsung) et la puce offre une surface de die de 628 mm2 pour un total de 28 milliards de transistors. La différence se fait au niveau de l’équipement activé ou non. Nous parlons des GPC et des SM. Nvidia fait en quelque sorte sa « petite salade » afin de calibrer chaque solution à un niveau de puissance particulier. Nous sommes un peu comme dans le monde de l’automobile avec un moteur en commun mais des puissances en sortie différentes. Ainsi, la RTX 3080 dispose de 6 GPCs et 68 SMs là où la RTX 3090 dispose de 7 GPCs et 82 SMs. Ces choix architecturaux permettent de proposer au final 10 496 cœurs Cuda et 328 Cœurs Tensor et 82 cœurs RT pour la 3090 et 8 704 cœurs Cuda, 272 coeurs Tensor et 68 cœurs RT pour la 3080. A titre de comparaison, l’ancienne vitrine de Nvidia sur le segment « Mainstream », la GeForce RTX 2080 Ti, s’équipe de 6 GPcs, 68 SMs soit 4352 cœurs Cuda, 544 cœurs Tensor et 68 cœurs RT. Concernant la GeForce RTX 3070, nous retrouvons un GPU équipé de 46 SMs, 5 888 cœurs Cuda, 184 cœurs Tensor de troisième génération, 46 cœurs RT de 2ème génération de 184 unités de texture et de 96 ROPS. Du coté de la fréquence, la version Founder Edition est calibrée à 1725 MHz en mode boost et ses 8 Go de GDDR6 turbinent à 7000 MHz. L’ensemble est exploité au travers d'un bus mémoire 256-bits. Nous retrouvons une bande passante de 448 Go/s et une enveloppe thermique (TGP) de 220 Watts. Voici un bilan face à son ainée, la GeForce RTX 2070 (Founder Edition). GeForce RTX 3070 – Les spécifications de référence GeForce RTX 2070 (Founders Edition) GeForce RTX 3070(Founders Edition) SMs 36 46 Cœurs Cuda 2304 5888 Cœurs Tensor 288 (2nd Generation) 184 (3rd Generation) Cœurs RT 36 (1st Generation) 46(2nd Generation) Unités de textures 144 184 ROPs 64 96 Fréquence GPU (Boost) 1710 MHz 1725 MHz Fréquence mémoire 7000 MHz 7000 MHz Mémoire vidoé 8192 MB GDDR6 8192 MB GDDR6 Interface mémoire 256-bit 256-bit Bande passante mémoire 448 GB/s 448 GB/s TGP 185 Watts 220 Watts Sur le papier, nous avons une solide montée en puissance entre les deux cartes. Si la RTX 2070 est annoncée avec une puissance conjuguée de 31,7 TFLOPS (7,9 Shader-TFLOPS + 23,8 RT-TFLOPS), la GeForce RTX 3070 est à 60 TFLOPS (20,2 Shader-TFLOPS + 39,7 RT-TFLOPS). Nvidia ne s’est pas contenté d’ajuster l’équipement. Nous avons des améliorations et des optimisations autour des trois grands moteurs, à savoir les cœurs RT et Tensor et les SM (Streaming Multiprocessors). Ampere s’équipe de cœurs Tensor de troisième génération. Exploités pour différents exercices dont la mise en œuvre de la technologie DLSS, ils profitent d’une efficacité plus importante afin d’accroitre d’un facteur 2 ou 4 la puissance de calcul tout en diminuant leur nombre par deux. Le DLSS est la contraction de Deep Learning Super Sampling. Introduit pour la première fois avec Turing (RTX 20 series), cette technologie de rendu exploite les cœurs Tensor dédiés à l’IA. Elle exploite la puissance d’un réseau optimisé de neurones profonds pour accélérer les fréquences d’images tout en générant des visuels sans dégradation. Les gains de performance permettent de maximiser les paramètres du ray tracing et de profiter de définitions plus élevées. Les cœurs RT en charge d’assurer une prise en charge matérielle du Ray-Tracing passent en deuxième génération. Nous n’avons pas beaucoup d’information autour de ce changement. Le constructeur évoque une efficacité plus importante et une accélération matérielle disponible en parallèle à l’application du Motion Blur (effet de flou). Au sujet des Streaming Multiprocessors, nous avons une organisation autour de quatre clusters équipés chacun de 32 unités de calculs dont 16 sont exclusivement dédiées aux opérations FP32. Ainsi chaque SM peut traiter simultanément 4 x 32 opérations FP32 ou 4 x 16 opérations FP32 et 4 x 16 opérations INT32 (entiers). A cela, le cache L1 grimpe à 128 Ko (64 Ko par SM avec Turing). Du coté des nouveautés, nous avons la prise en charge du codec AV1 en décompression. Il s’agit d’une avancée intéressante car ce format commence à prendre de l’importance dans le monde du streaming. Ses promesses de compression pour la diffusion de contenu permettent de réduire les besoins en bande passante tout en assurant une qualité de rendu en hausse. AV1 – Wikipedia AV1 est un codec vidéo ouvert et libre de droits1 créé en 2018 et conçu pour la diffusion de flux vidéo sur Internet et réseaux IP comme successeur de VP9. (…) Il peut atteindre un taux de compression supérieur de 30 à 40 % en moyenne à VP9 et H.265/HEVC et supérieur de 50 % à H.264, le codec vidéo le plus répandu pour le streaming en 2019. AV1 permet donc de diviser par deux l’utilisation de la bande passante par rapport au H.264 mais, en contrepartie, l’implémentation de référence (libaom) consomme nettement plus de ressources de calcul que VP9 et H264, tant pour le codage que pour le décodage. Néanmoins, le développement de libaom a privilégié la correction et l’exhaustivité vis-à-vis du standard, au détriment de l’efficacité ; d’autres implémentations améliorent significativement les performances. Ampere reprend ainsi l’encodeur « maison » de 7ème génération présent sur Turing mais s’enrichit d’un décodeur de 5ème génération assurant la prise en charge de l’AV2. Nous avons ainsi en encodage la prise en charge des Codecs H.264, H.265 et LossLess et le décodage des codecs AV1, MPEG-2, VC1, VP8, VP9, H.264, H.265 et Lossless. A cela s’ajoute un port HDMI 2.1 capable d’assurer un débit maximal de 48 Gbps, de quoi prendre ne charge un moniteur disposant d’une définition 8K à un taux de rafraichissement de 60 Hz en HDR. Technologie RTX IO. Nvidia a évoqué d’autres axes de travail pour proposer une expérience « gaming » améliorée. L’un d’eux concerne les temps de chargement avec la présentation de la technologie RTX IO. Elle s’appuie sur l’API Directx Storage de Microsoft (2021). L’idée est d’éviter les goulots d’étranglement lors du transport des données de jeux compressées. La solution est de trouver un moyen de se passer du processeur (CPU). Ce dernier assure actuellement la décompression de ses données compressées puis leur envoi au processeur graphique, le GPU. Avec son RTX IO, Nvidia souhaite confier cette tâche de décompression au GPU directement. Cela limite les transports de données et le nombre d’intervenants (CPU et RAM) afin d’accélérer de manière importante le temps de chargement des jeux. Il faut dire que les titres AAA sont de plus en plus exigeants nécessitant le pré-traitement d’énormes quantités de données. L’apport du RTX IO sera lié aux performances de l’unité de stockage. En clair, pour profiter des meilleurs gains possibles, une unité SSD rapide est nécessaire. Elle permet des débits plus élevés et donc des temps de chargement plus courts. Du coup, il n’est pas impossible que dans un avenir proche les recommandations matérielles de jeux incluent des caractéristiques minimum pour les SSD. Cette technologie n’est pas propre à Ampere. Les GeForce RTX 2000 series seront aussi compatibles, tout comme les GeForce GTX 1600 series. Son exploitation demandera une mise à jour des pilotes. Technologies Reflex et Broadcast Lors de la présentation d’Ampere, Nvidia a abordé d’autres nouveautés. Par exemple, Reflex vise les joueurs. Cette technologie œuvre à réduire la latence dans les jeux. Elle est censée assurer une réponse « in game » plus rapide afin d’être plus efficace et précis. Enfin le constructeur a présenté Broadcast. Il concerne le streaming. Nous avons d’un côté un encodeur matériel dédié à la diffusion et de l’autre l’utilisation de la mécanique des cartes RTX pour l’IS afin d’améliorer la qualité du son et de l’image (suppression du bruit audio, effets d'arrière-plan ou encore auto-frame de la webcam.) La TUF Gaming GeForce RTX 3070 OC Edition. Notre carte personnalisée est signée Asus, il s’agit de la TUF Gaming GeForce RTX 3070 OC Edition. La belle s’équipe d’un imposant système de refroidissement, d’une plaque arrière, d’une petite touche de RGB, de plusieurs modes de refroidissement et de fréquences overclockées en sortie de carton. La carte est imposante. Elle affiche des dimensions de 143 x 44 mm pour une longueur de 301 mm. Son installation demande trois slots d’extension en raison d’un carter massif. La finition est là avec un bel ensemble en aluminium brossé mettant en valeur trois ventilateurs axials. Les deux externes tournent en sens contraire de celui du milieu afin de limiter les phénomènes de turbulences. Nous avons des ventilateurs de nouvelle génération. Capables de turbiner à 3600 rpm, ils se montrent légèrement plus bruyants mais proposent un débit d’air et une pression statique plus importants. L’ancienne génération tablait sur un débit d’air de 40,66 CFM et 2,41 mm H20, les actuelles versions sont annoncées avec des débits de 44,16 CFM (ventilateur central) et 46,03 CFM (ventilateurs externes) et des pressions statistiques respectives de 2,27 mm H20 et 2,6 mm H20. Concernant le refroidissement, la carte profite d’un mode semi fanless. En clair, sa ventilation est capable de se mettre à l’arrêt si le GPU est peu sollicité. Son fonctionnement est inaudible. Nous avons en latéral un switch permettant de sélectionner (sans logiciel) soit le mode Performance soit le mode Silence. Cette option concerne uniquement la gestion de la ventilation. Il n’y a pas de modification de fréquence. Le PCB n’occupe pas toute la longueur de la carte. Il s’accompagne d’un imposant dissipateur thermique en aluminium mettant en avant trois radiateurs connectés à l’aide de caloducs. A ce sujet, nous retrouvons en terminaison une ouverture facilitant le passage de l’air. Asus précise que la conception de la carte répond à une charte qualité précise, ce qui lui permet de profiter de l’appellation TUF Gaming. Cela comprend des tests de fiabilité et l’usage de composants particuliers répondant parfois à des normes militaires (condensateur, Choke, MOSFETS). Les besoins énergétiques sont assurés par un connecteur PCIe 4.0 x16 et deux connecteurs PCIe 8 broches. L’équipement comprend deux sorties vidéo HDMI 2.1 et trois DisplayPort 1.4a. La carte embarque un total de 8 Go de GDDR6 calibrée à 14 Gbps et exploités par un bus 256-bit. Asus propose deux profils de fonctionnement. Le mode gaming calibre le GPU à une fréquence maximale de 1815 MHz tandis que le mode OC fixe la fréquence maximale à 1845 MHz. Nous vous conseillons l’utilisation d’une alimentation de 750 ou 850 Watts si un Core i9 ou un Ryzen 9 équipe votre PC. Dans le cas d’une puce Intel ou AMD HEDT, 850 Watts minimum sont nécessaires. Concernant son tarif, il devrait se situer aux alentours des 624 €. Protocole de test Nous avons utilisé des jeux, trois définitions (1080p, 1440P et 2160p), plusieurs benchmarks et un logiciel d’évaluation des prouesses GPGPU. Pour chaque titre, tous les paramètres de rendu sont au maximum. Les pilotes graphiques sont les derniers en date. Configuration Intel socket LGA 2011 Carte mère : Asus ROG Strix Z490-E Gaming Processeur : Intel Core i9-10900K, Mémoire vive : 4×8 Go Dominator Platinum DDR4-3200 CL14, Stockage : SSD Crucial BX300 480 Go + Aorus NVMe Gen 4 2 To Alimentation : Dark Power Pro 11 1200 Watts Dissipateur : Ventirad Noctua NH-U12A. Jeux vidéo Metro Exodus Far Cry Primal Shadow of Tom Raider Doom Eternal Far Cry 5 Total War : Warhammer Horizon Zero Dawn Benchmarks Valley 1.0 (Mode Extreme, Full HD, 1440p, AA 8X), Heaven 4.0 (Mode Extreme, Full HD, 1440p, AA 8X), 3DMark Fire Strike (Performance, Extreme, Ultra) 3DMark Time Spy 3DMark Port Royal 3DMark DSLL Feature Test en 2160P V-Ray Benchmark 4.1. V-Ray Benchmark est une application qui teste les performances d’un PC lors de rendus de plusieurs scènes V-Ray avec le processeur, le GPU ou les deux. OctaneBench 2020.1.5 Test de rendu 3D avec activation ou non du RTX. Blender v2.9 Puissant outil de développement pour créer des images et animations 3D. Cette version apporte la prise en charge de l’OptiX chez Nvidia soit une accélération matérielle avec une GeForce ou Quadro RTX. Cela concerne le rendu et le viewport. LuxMark 3.0 Cette application exploite l’API OpenCL pour exécuter des calculs de rendu 3D. Il est possible de travailler uniquement avec le GPU, le CPU ou encore les deux en même temps (idéal pour se rendre compte de la différence de performance qu’il existe entre un processeur et une solution graphique). Mieux encore, ce benchmark existe sur différents environnements comme Linux, OS X et Windows. Il livre un score et des indices de valeurs Samples/sec et Rays/sec. Vous retrouverez les scores avec Luxmark v3.1 et la scènes Luxball HDR. TUF Gaming GeForce RTX 3070 OC Edition, refroidissement et nuisances sonores. L’ensemble du monitoring est confié à l’application GPU-Z. La carte est torturée à l’air libre afin de faire abstraction des performances de la ventilation d’un boitier. Nous sollicitons au maximum sa mécanique durant 10 minutes.L’ensemble de tous les tests est mené avec le mode OC actif. En clair, la fréquence GPU maximale est calée sur 1845 MHz (1815 MHz en mode gaming). Au repos, la température GPU se stabilise à 39 °C. Les trois ventilateurs de la carte sont à l’arrêt. Le mode semi fanless est activé. La montée en charge s’accompagne d’une augmentation progressive de la vitesse des trois ventilateurs. Le GPU grimpe à 59°C tandis que la ventilation se situe à 63% de sa vitesse maximale. Le refroidissement se montre efficace avec une température GPU bien maitrisée. Les nuisances sonores se situent entre 0 et 36,8 dBA ce qui est un très bon résultat. La carte est inaudible à faible charge et reste très discrète en burn. Attention, nous travaillons à l’air libre. TUF Gaming GeForce RTX 3070 OC Edition, stabilité des fréquences. La carte s’accompagne de différentes technologies de protection comme un ajustement de la fréquence GPU afin de maintenir son bon fonctionnement tout en protégeant sa mécanique. Des seuils d’alerte sont ainsi constamment sous surveillance comme la température GPU et le TGP. Voici un bilan des fréquences GPU et mémoire selon deux scénarios. Dans le premier, la limite TDP n’est jamais dépassée. Nous observons une fréquence mémoire maximale calée sur 1750,2 MHz durant tout l’exercice. Du côté du GPU, la barre des 2000 MHz est presque atteinte au lancement des calculs et la fréquence s’ajuste rapidement autour des 1950 MHz. Sur l’ensemble du test, la fréquence moyenne est de 1948,5 MHz avec peu de variation, signe d’une bonne maitrise de la température GPU. Dans le second cas, le TGP est dépassé si bien que la fréquence GPU ne dépasse jamais les 1800 MHz. Ses fluctuations sont plus importantes mais restent correctes. Nous enregistrons une fréquence moyenne de 1767 MHz sur l’ensemble du test. De son coté, la mémoire est calibrée à 1750,2 MHz. TUF Gaming GeForce RTX 3070 OC Edition, consommations électriques Voici les besoins énergétiques de notre TUF Gaming GeForce RTX 3070 OC (mode gaming). Vous trouvez aussi ceux de la GeForce RTX 2080 Ti Founders Edition, de la GeForce RTX 3090 Eagle OC 24G et de la GeForce RTX 2070 Super Gaming OC 8G. Ses besoins se situent entre 18,3 et 239 Watts. En pleine charge, nous gagnons en gros 20 watts par rapport à la GeForce RTX 2080 Ti. Face à sa grande sœur la RTX 2070, la consommation est en hausse en particulier en burn (239 Watts contre 215,9 Watts). Ces chiffres indiquent la consommation de la carte durant les tests. Il ne s’agit pas de la demande énergétique de notre plateforme équipée d’un Core i9-10900K d’Intel. TUF Gaming GeForce RTX 3070 OC Edition, les performances gaming. Voici un bilan face à sa grande sœur la GeForce RTX 2080 Ti. Cette carte est prise comme référence dans notre graphique. Elle dispose ainsi d’un indice 100. Nous avons fonctionné avec trois définitions, du 1080p, du 1440p et du 2160p. Nous avons un beau bilan. La promesse de Nvidia, de proposer à un tarif plus compétitif avec des performances au niveau de la RTX 2080 Ti, est quasiment tenue. Les deux cartes offrent des prestations quasiment identiques. L’écart est de seulement 0,6% en Full HD, 1,3% en 1440p et 3% en 4K. La principale raison est à chercher du côté de la mémoire vive avec une bande passante plus musclée pour le RTX 2080 Ti. Nvidia propose un important bond en avant face à l’ancienne génération. L’écart selon la définition se situe entre 25 à 30% avec comme base de travail les prouesses de la RTX 2080 Ti ! Le bilan est en gros identique avec des jeux capables d’exploiter la technologie de Ray Tracing en temps réel. En Full HD, la belle prend la main avec un +0.7% puis se positionne en seconde place en 1440p et 4K. L’écart avec la GeForce RTX 2070 est tout aussi important voire plus important. Il atteint les 30.3% en 4K. Dans les détails, nous avons un framerate, c’est-à-dire un nombre d’images pas seconde, musclé en 1080p et 1440P. Nous travaillons avec des options graphiques au maximum. La carte est taillée pour assurer de belles prestations en 1440p. Nous enregistrons un framerate entre 117 et 224 images par seconde. Metro Exodus est un peu à part car son moteur est très gourmand. En 1440P, nous sommes à 46 images par seconde contre 28 images par seconde en 4K. Doom Eternal est par contre à l’opposé. Avec des options graphiques poussées à l’extrême, nous avons du 224 images par seconde en 1440p et 115 en 4K. le gameplay est optimal. L’activation du Ray Tracing n’est pas anodin sur le framerate. Voici deux exemples avec les titres Metro Exodus et Shadows of Tomb Raider. Nous avons une nouvelle fois, la confirmation d’une carte taillée pour le 1440p. Pour profiter pleinement du Ray Tracing, il est fortement conseillé d’activer la technologie DLSS (si elle est disponible). Elle permet de booster les performances. Voici d’autres résultats avec les benchmarks Valley et Heaven, 3DMark Fire Strike, 3DMark Time Spy et 3DMark Port Royal. TUF Gaming GeForce RTX 3070 OC Edition, les performances « création ». Bien que la GeForce RTX 3070 vise en priorité les joueurs, elle peut aussi trouver sa place dans un PC dédié à la création (vidéo, 3D…). De nombreuses applications sont capables d’exploiter sa mécanique pour profiter d’une accélération matérielle. Voici un bilan sous Blender v2.9. Ce logiciel de création 3D est très populaire. Open Source, il regorge de possibilités allant de la modélisation 3D à l’animation 2D en passant par le rendu, la simulation, l’animation ou encore le motion tracking. Cette version prend en charge le rendu accéléré Optix Nvidia. Il peut être utilisé pour un rendu final et le rendu en temps réel dans le Viewport. Nous l’avons utilisé pour le rendu final avec trois scènes différentes Simultaneous Render JunkShop, Pavillon Barcelone et ClassRomm. Le bilan est ici rapide. Avec ses cœurs RT de 2ème génération et ses cœurs Tensor de 3ème génération, elle prend facilement la main sur la GeForce RTX 2080 Ti. Sur les trois scènes, nous avons une belle avance de 20,5%. Le même bilan est observé sous V-Ray Benchmark. Le score, suite au rendu de plusieurs scènes, est de 464 contre 355 pour la RTX 2080 Ti et 284 pour la RTX 2070. Sous OctaneBench (rendu de 12 scènes), l’activation du RTX permet d’accélérer le calcul de manière significative. Les gains avec la GeForce RTX 3070 sont de 27% ce qui permet de prendre la main face à la RTX 2080 Ti. L’avance est de 17% avec le RTX ON et de 2% sans. Face à sa grande sœur, l’écart est important (54% avec le RTX ON et 40% sans). Enfin, LuxMark V3.1 confirme ce bilan avec une avance de 25% face à la RTX 2080 Ti et un écart de 53,6% face à la RTX 2070. TUF Gaming GeForce RTX 3070 OC Edition, conclusion
Comme toujours super test 🙂 je vais craqué !
C’est vrai…c’est complet, plus de jeux peut-être ?
Moins de test , plus de dispo !