Name: GeForce RTX 3060 Ti Eagle de Gigabyte, le test complet
Item: GeForce RTX 3060 Ti Eagle de Gigabyte, le test complet
Rating: 4.17
Author: Jérôme Gianoli

GeForce RTX 3060 Ti, les présentations.

Cette Geforce RTX 3060 Ti s’attaque à l’offre milieu de gamme. Nous sommes probablement sur le segment le plus dynamique. Il suffit de regarder la dernière enquête Steam sur le matériel et les logiciels pour constater que la GeForce GTX 1060 est encore aujourd’hui la carte la plus populaire chez les joueurs.

PC Gaming 2020, Steam dévoile le duo gagnant, Intel et Nvidia

Cette RTX 3060 Ti se positionne comme étant la relève avec en poche des arguments touchant les performances et les fonctionnalités. Il est possible que Nvidia prépare également une version légèrement moins véloce avec la GeForce RTX 3060.

Pour l’heure, cette carte graphique est à considérer comme la remplaçante de l’actuelle GeForce RTX 2060 Super. Son GPU Ampere s’arme d’un équipement plus conséquent permettant une jolie hausse des performances. Nous retrouvons 38 SM donnant vie à 4864 cœurs Cuda. Ils se complètent avec 152 cœurs Tensor de 3^ème génération, 38 cœurs RT de 2^ème génération et 80 ROPs. L’ensemble turbine à 1665 MHz en mode Boost tandis que 8 Go de GDDR6 sont présents et calibrés à 7000 MHz. Ces deux fréquences sont celles de la version founders Edition de Nvidia. A tout ceci s’ajoutent un bus mémoire 256-bit et une bande passante de 448 Go/s contre un TGP de 200 Watts.

Si la partie « mémoire » avec la RTX 2060 Super est identique, les changements concernent surtout l’architecture GPU. Nous avons une progression de la puissance Shaders en TFLOPS de 7,2 à 16,2 contre 21,7 à 31,6 pour celle RT toujours en TFLOPS. Du coup, la combinaison des deux permet une 47,8 TFLOPS dédiée au Ray Tracing contre 28,9 pour la RTX 2060 Super.

Voici un bilan entre les deux cartes

	GeForce RTX 2060 Super FE	GeForce RTX 3060 Ti FE
SMs	34	38
Cœurs CUDA	2176	4864
Cœurs Tensor	272 de 2^ème génération	152 de 3^ème génération
Cœurs RT	34 de 1^ère génération	38 de 2^ème génération
Unités de texture	136	152
ROPs	64	80
Fréquence GPU Boost	1650 MHz	1665 MHz
Fréquence mémoire	7000 MHz	7000 MHz
Quantité Mémoire	8 Go de GDDR6	8 Go de GDDR6
Interface Mémoire	256-bit	256-bit
Bande passante mémoire	448 Go/s	448 Go/s
TGP	175 Watts	200 Watts

A la vue de toute cette mécanique nous sommes plus prêts de la GeForce RTX 2080 Super.

	GeForce RTX 2080 Super FE	GeForce RTX 3060 Ti FE
Architecture	Turing	Ampere
Cœurs CUDA	3072	4864
Cœurs Tensor	384 de 2^ème génération	152 de 3^ème génération
Cœurs RT	48 de 1^ère génération	38 de 2^ème génération
Unités de texture	192	152
ROPs	64	80
Fréquence GPU Boost	1815 MHz	1665 MHz
Quantité Mémoire	8 Go	8 Go de GDDR6
Interface Mémoire	256-bit	256-bit
Bande passante mémoire	496 Go/s	448 Go/s
TGP	250 Watts	200 Watts

Comme nous l’avons souligné lors des tests des GeForce RTX 3070 et 3090, l’architecture Ampere apporte des améliorations et des optimisations. Elles touchent trois grands moteurs, à savoir les cœurs RT et Tensor, et les SM (Streaming Multiprocessors).

Ampere s’équipe de cœurs Tensor de troisième génération. Exploités pour différents exercices dont la mise en œuvre de la technologie DLSS, ils profitent d’une efficacité plus importante afin d’accroitre d’un facteur 2 ou 4 la puissance de calcul tout en diminuant leur nombre par deux. Le DLSS est la contraction de Deep Learning Super Sampling.

Introduit pour la première fois avec Turing (RTX 20 series), cette technologie de rendu exploite les cœurs Tensor dédiés à l’IA. Elle exploite la puissance d’un réseau optimisé de neurones profonds pour accélérer les fréquences d’images tout en générant des visuels sans dégradation. Les gains de performance permettent de maximiser les paramètres du ray tracing et de profiter de définitions plus élevées.

Les cœurs RT en charge d’assurer une prise en charge matérielle du Ray-Tracing passent en deuxième génération. Nous n’avons pas beaucoup d’information autour de ce changement. Le constructeur évoque une efficacité plus importante et une accélération matérielle disponible en parallèle à l’application du Motion Blur (effet de flou).

Au sujet des Streaming Multiprocessors, nous avons une organisation autour de quatre clusters équipés chacun de 32 unités de calculs dont 16 sont exclusivement dédiées aux opérations FP32. Ainsi chaque SM peut traiter simultanément 4 x 32 opérations FP32 ou 4 x 16 opérations FP32 et 4 x 16 opérations INT32 (entiers). A cela, le cache L1 grimpe à 128 Ko (64 Ko par SM avec Turing).

Du coté des nouveautés, nous avons la prise en charge du codec AV1 en décompression. Il s’agit d’une avancée intéressante car ce format commence à prendre de l’importance dans le monde du streaming. Ses promesses de compression pour la diffusion de contenu permettent de réduire les besoins en bande passante tout en assurant une qualité de rendu en hausse.

AV1 – Wikipedia

AV1 est un codec vidéo ouvert et libre de droits1 créé en 2018 et conçu pour la diffusion de flux vidéo sur Internet et réseaux IP comme successeur de VP9. (…) Il peut atteindre un taux de compression supérieur de 30 à 40 % en moyenne à VP9 et H.265/HEVC et supérieur de 50 % à H.264, le codec vidéo le plus répandu pour le streaming en 2019. AV1 permet donc de diviser par deux l’utilisation de la bande passante par rapport au H.264 mais, en contrepartie, l’implémentation de référence (libaom) consomme nettement plus de ressources de calcul que VP9 et H264, tant pour le codage que pour le décodage. Néanmoins, le développement de libaom a privilégié la correction et l’exhaustivité vis-à-vis du standard, au détriment de l’efficacité ; d’autres implémentations améliorent significativement les performances.

Ampere reprend ainsi l’encodeur « maison » de 7ème génération présent sur Turing mais s’enrichit d’un décodeur de 5ème génération assurant la prise en charge de l’AV2. Nous avons ainsi en encodage la prise en charge des Codecs H.264, H.265 et LossLess et le décodage des codecs AV1, MPEG-2, VC1, VP8, VP9, H.264, H.265 et Lossless.

A cela s’ajoute un port HDMI 2.1 capable d’assurer un débit maximal de 48 Gbps, de quoi prendre en charge un moniteur disposant d’une définition 8K à un taux de rafraichissement de 60 Hz en HDR.

Technologie RTX IO.

Nvidia a évoqué d’autres axes de travail pour proposer une expérience « gaming » améliorée. L’un d’eux concerne les temps de chargement avec la présentation de la technologie RTX IO. Elle s’appuie sur l’API Directx Storage de Microsoft (2021). L’idée est d’éviter les goulots d’étranglement lors du transport des données de jeux compressées.

La solution est de trouver un moyen de se passer du processeur (CPU). Ce dernier assure actuellement la décompression de ces données compressées puis leur envoi au processeur graphique, le GPU. Avec son RTX IO, Nvidia souhaite confier cette tâche de décompression au GPU directement. Cela limite les transports de données et le nombre d’intervenants (CPU et RAM) afin d’accélérer de manière importante le temps de chargement des jeux. Il faut dire que les titres AAA sont de plus en plus exigeants, nécessitant le pré-traitement d’énormes quantités de données.

L’apport du RTX IO sera lié aux performances de l’unité de stockage. En clair, pour profiter des meilleurs gains possibles, une unité SSD rapide est nécessaire. Elle permet des débits plus élevés et donc des temps de chargement plus courts. Du coup, il n’est pas impossible que dans un avenir proche les recommandations matérielles de jeux incluent des caractéristiques minimum pour les SSD.

Cette technologie n’est pas propre à Ampere. Les GeForce RTX 2000 series seront aussi compatibles, tout comme les GeForce GTX 1600 series. Son exploitation demandera une mise à jour des pilotes.

Technologies Reflex et Broadcast

Lors de la présentation d’Ampere, Nvidia a abordé d’autres nouveautés. Par exemple, Reflex vise les joueurs. Cette technologie œuvre à réduire la latence dans les jeux. Elle est censée assurer une réponse « in game » plus rapide afin d’être plus efficace et précis.

Enfin le constructeur a présenté Broadcast. Il concerne le streaming. Nous avons d’un côté un encodeur matériel dédié à la diffusion et de l’autre l’utilisation de la mécanique des cartes RTX pour l’IS afin d’améliorer la qualité du son et de l’image (suppression du bruit audio, effets d’arrière-plan ou encore auto-frame de la webcam.)