Test GeForce RTX 2070, 2080, 2080 Ti : que vaut le haut de gamme de Turing ?

Par
Le 21 septembre 2018
 0

Le SM selon Turing


Avant d'aborder en détails les RT Cores et Tensor Cores, il est nécessaire de prendre un peu de temps pour analyser les nouveautés concernant le nouveau streaming multiprocessor (SM). Annoncé, selon NVIDIA, plus performant à hauteur de 50% sur le traitement des shaders que sur la génération Pascal, le nouveau SM voit arriver deux changements majeurs dans son architecture.

concurent execution.jpg
L'exécution simultanée devrait apporter un important gain de performances


Premièrement, Turing emprunte à Volta son support de l'exécution simultanée des instructions FP32 et INT32. Sur les générations précédentes, ces types d'instructions ne pouvaient pas s'exécuter en même temps. Sur Turing on trouve des cœurs dédiés FP32 et des cœurs dédiés INT32 pour chaque bloc SM, alors que sur la génération Pascal on avait affaire à des cœurs CUDA non spécialisés.

Le fait d'avoir des cœurs dédiés à chaque type d'instruction et gérés de façon complètement indépendante permet donc d'effectuer les calculs simultanément.

A cela s'ajoute une gestion de la mémoire revue, afin d'unifier la mémoire partagée et le cache L1 en une seule et unique unité.

shared memory


Troisième changement majeur, le passage à la mémoire GDDR6 sur un bus 352-bit qui permet d'améliorer significativement la vitesse des échanges entre les cœurs et la mémoire. On parle d'une amélioration de plus de 27% de bande passante par rapport à la génération Pascal.

L'objectif de NVIDIA est d'offrir un maximum de souplesse aux développeurs, qui pourront exploiter Turing selon leurs besoins.
Modifié le 07/11/2018 à 19h36

Les dernières actualités Cartes graphiques NVIDIA

scroll top