NVIDIA GeForce GTX 980 & 970: Maxwell sur le haut de gamme en DirectX 12

19 septembre 2014 à 04h30
0

Architecture Maxwell : vue d'ensemble

Avec Maxwell, NVIDIA ne change pas fondamentalement la donne par rapport à ses précédentes architectures et notamment face au Kepler des GeForce 600 et 700. On conserve donc un découpage de la puce en larges unités, les GPC ou Graphic Processing Cluster. On dénombre un total de 4 GPC au cœur de la GeForce GTX 980. Chaque cluster comporte quatre pool de SM ou Streaming Multiprocessors (et non plus SMX), chacun avec 128 cœurs CUDA, 8 unités de texture et quatre contrôleurs mémoire 64 bits, en plus bien sûr du PolyMorph Engine. À partir de ces quelques données brutes, on se fait vite une idée de la puce et de ses caractéristiques.

Dans sa version la plus évoluée, la puce GM204 peut tabler sur 2048 processeurs CUDA, 128 unités de texture et un bus mémoire de 256 bits. Ce dernier point nous rappelle d'emblée que la GeForce GTX 980 vise bien à prendre la relève de la GeForce GTX 680 et sa puce GK104 qui était elle aussi dotée d'un bus mémoire 256 bits. Les variantes de GeForce autour de la puce GK110, comme les GeForce GTX 770 et 780 pouvaient elles s'appuyer sur un bus mémoire 384 bits. Gageons que si le bus mémoire n'évolue pas avec le GM204, NVIDIA a mis en place diverses solutions pour booster la bande passante mémoire.

0208000007627213-photo-nvidia-maxwell-block-diagram.jpg


Justement, NVIDIA a revisité l'organisation de la partie mémoire de la puce. Chaque contrôleur est ainsi relié à 16 unités ROP avec 512 Ko de mémoire cache de second niveau. En tout, la puce GM204 dispose de 64 unités ROP et 2 Mo de cache L2. À titre de comparaison, la puce GK104 du GeForce GTX 680 ne comptait que 32 unités ROP et 512 Ko de cache. Les GeForce les plus rapides basées sur le GK110 doivent se contenter de 48 unités ROP et 1,5 Mo de cache L2. Un vrai progrès donc, d'autant que le cache additionnel, probablement moins coûteux à implémenter que précédemment, devrait contribuer à réduire la pression sur le bus mémoire en allégeant notamment le nombre de requêtes : pas besoin d'aller chercher des données en mémoire si elles sont déjà dans le cache.

Côté géométrie, la puce GM204 est pourvue de deux fois plus d'unités que le GK104 des GeForce GTX 680. NVIDIA annonce a minima une performance géométrique logiquement doublée avec dans certains cas des performances jusqu'à trois fois supérieures.

Architecture Maxwell : la même en mieux

Nous l'évoquions, l'architecture Maxwell ne représente pas un bouleversement par rapport aux précédentes architectures GeForce. Toutefois si les schémas se ressemblent, il faut avoir en tête le but de NVIDIA : augmenter la capacité de traitement de la puce face au GK104 sans pour autant augmenter sa complexité. Pour être en mesure de revendiquer l'intégration de deux fois plus de SM sans avoir fait exploser la taille du die, NVIDIA a dû passer par la refonte d'un certain nombre d'éléments...

... à commencer par le scheduler de chaque SM. Celui-ci bénéficie d'une nouvelle conception visant à accroître son efficacité dans la répartition des tâches. Puisque chaque opération effectuée par la puce va à un moment ou un autre passer par le SM, il faut un bloc pour répartir les instructions en direction des cœurs CUDA notamment. C'est le rôle du scheduler : on en trouve quatre par SM, chacun pouvant envoyer deux instructions par cycle d'horloge.

00EB000007628053-photo-nvidia-geforce-gtx-980-maxwell-smm.jpg

Gros plan sur un SMM


Face à Kepler, le scheduler est d'autant plus efficace que l'agencement des SM a évolué. Précédemment, les 192 cœurs CUDA de chaque SM pouvaient être adressés indifféremment. Ils sont aujourd'hui rationalisés et moins nombreux. Chaque SM compte 128 cœurs CUDA et ceux-ci sont subdivisés en quatre groupes de 32 cœurs, chacun avec son scheduler. Un redécoupage avec un fonctionnement en silo qui affecte la hiérarchie mémoire : la mémoire cache de premier niveau rejoint le bloc de texture alors que l'on dispose maintenant de 96 Ko de mémoire partagée par SM.

Une mémoire plus efficace

Nous l'écrivions plus haut, Maxwell dispose d'une interface mémoire 256 bits. Ce n'est clairement pas le nec plus ultra en la matière et pour compenser cela NVIDIA a revisité le fonctionnement du système mémoire. L'augmentation de la quantité de mémoire cache de second niveau à 2 Mo devrait aider aux performances mémoire tout comme l'utilisation de mémoire GDDR5 rapide.

Mais NVIDIA met en place de nouveaux algorithmes. Afin de réduire la bande passante mémoire utilisée, la puce fait appel à une compression sans perte des données qui devront être écrites en mémoire. En fonction de la composition des données à écrire en mémoire, une compression avec un ratio différent est appliquée.

012C000007627215-photo-nvidia-maxwell-color-compression.jpg
012C000007627219-photo-nvidia-maxwell-memory-architecture.jpg


Depuis les puces GeForce de génération Fermi, NVIDIA utilise également la compression delta. Il s'agit toujours de préserver la bande passante mémoire en n'enregistrant pas directement les informations de couleur d'un pixel mais plutôt la différence de couleur par rapport à d'autres pixels. Les résultats sont ensuite regroupés pour minimiser l'empreinte mémoire. NVIDIA propose avec Maxwell sa troisième génération algorithme de compression delta avec, nous dit-on, une efficacité accrue.
Modifié le 01/06/2018 à 15h36
0 réponses
0 utilisateurs
Suivre la discussion

Les actualités récentes les plus commentées

De nouveaux modèles climatiques ont été créés... et la situation est pire que prévue
La dernière mise à jour de Windows 10 causerait des pannes de carte réseau
La Suisse veut forcer les compagnies aériennes à renseigner les émissions CO2 sur les billets d'avion
Un démantèlement des GAFA ?
Le trou noir au centre de notre galaxie semble avoir de plus en plus faim
Ça y est, le Fold est disponible en France... pour 1,6 SMIC (net).
Des chercheurs remettent sur la table la solution de l'ascenseur vers la Lune
Le saviez-vous ? Un Game Boy, meurtri, a survécu à la guerre du Golfe
Le GPS européen Galileo est désormais utilisé sur un milliard de smartphones
La Renault ZOE 2 se lance (enfin !) officiellement

Notre charte communautaire

1. Participez aux discussions

Nous encourageons chacun à exprimer ses idées sur les sujets qui l'intéressent, et à faire profiter l'ensemble de la communauté de son expertise sur un sujet particulier.

2. Partagez vos connaissances

Que vous soyez expert ou amateur passionné, partagez vos connaissances aux autres membres de la communauté pour enrichir le niveau d'expertise des articles.

3. Échangez vos idées

Donnez votre opinion en étayant votre propos et soyez ouverts aux idées des autres membres de la communauté, même si elles sont radicalement différentes des vôtres.

4. Faites preuve de tolérance

Qu'il s'agisse de rédacteurs professionnels ou amateurs, de lecteurs experts ou passionnés, vous devez faire preuve de tolérance et vous placer dans une démarche d'entraide.

5. Restez courtois

Particulièrement lorsque vous exprimez votre désaccord, critiquez les idées, pas les personnes. Évitez à tout prix les insultes, les attaques et autres jugements sur la forme des messages.

6. Publiez des messages utiles

Chaque participation a vocation à enrichir la discussion, aussi les partages d'humeurs personnelles ne doivent pas venir gêner le fil des échanges.

7. Soignez votre écriture

Utilisez la ponctuation, prohibez le langage SMS et les majuscules, relisez-vous afin de corriger un peu les fautes de frappe et de français : trop de fautes n’engagent ni à lire le message, ni à répondre à une question.

8. Respectez le cadre légal

Ne publiez pas de contenus irrespectueux, racistes, homophobes, obscènes ou faisant l'apologie de courants radicaux, qu'ils soient politiques ou religieux. N'utilisez pas plusieurs comptes utilisateurs.

9. Ne faites pas de promotion

Ne profitez pas d'une discussion pour faire la publicité d'un produit, d'un service ou même de votre site web personnel.

10. Ne plagiez pas

Exprimez uniquement vos opinions ou partagez des idées en citant vos sources.

scroll top