Radeon HD 7970 : AMD revient sur le très haut de gamme, en DirectX 11.1

22 décembre 2011 à 06h00
0
0

Graphics Core Next : la géométrie n'est pas oubliée !

Alors que nous avons largement évoqué les capacités de calcul des Radeon HD de la série 7000, il ne faut pas perdre de vue pour autant l'aspect graphique. En la matière, on retrouve un double moteur graphique, à l'instar de ce qu'AMD a pu introduire avec les Radeon HD 6900. Ces deux moteurs ont en charge des fonctions clefs comme la rasterization, l'assemblage des vertex ou encore la géométrie. Avec la possibilité de travailler sur deux triangles par cycle d'horloge, le double moteur évolue finalement assez peu par rapport à celui des Cayman, à une exception près : les unités de tesselation.

Pour mémoire, une unité de tesselation génère des détails supplémentaires en subdivisant des triangles : cela permet d'avoir une scène visuellement plus riche sans pour autant alourdir la charge de travail de la puce graphique, la géométrie additionnelle nécessaire à ces détails étant effectuée « gratuitement » par les unités dédiées. Chaque moteur de géométrie dispose de sa propre unité de tesselation et ladite unité est de neuvième génération. Son débit est annoncé comme quatre fois supérieur à celui des Radeon HD 6900. AMD évoque des paramètres de cache plus larges, mais aussi diverses améliorations au niveau de la gestion des tampons.

Rappelons que dans les générations précédentes, les puces AMD souffraient d'un déficit de performances au niveau de la tesselation face aux GeForce du caméléon, des GeForce redoutablement efficaces en la matière. Reste à voir si dans les faits ces améliorations seront suffisantes, AMD ayant toujours une approche où les unités de tesselation, et plus largement la géométrie, sont découplées des unités de calcul.

01AE000004836498-photo-southern-island-architecture-1.jpg

Gros plan sur le double moteur graphique et les unités de tesselation

Au niveau des ROP, AMD organise sa puce avec 8 unités de rendu final, en charge notamment des dernières opérations sur les pixels comme les fonctions d'anticrénelage. C'est dans ces Render Back End qu'on retrouve les fameuses unités ROP : avec 4 ROP par unité de rendu, on arrive à un total de 32 ROP. Et puisque nous parlons des ROP, il nous faut évoquer les unités de texture. Précédemment nous évoquions la présence de 4 unités de texture par CU ou unité de calcul. Avec 32 CU au cœur du Radeon HD 7970, nous avons donc 128 unités de texture... Pas mal ! Et puisque nous parlons texture, sachez qu'AMD a revu ses algorithmes de filtre pour réduire les effets de fourmillement sans affecter les performances.

0186000004836896-photo-southern-island-test-af.jpg

Filtrage anisotropique 16x sur Radeon HD 7970

Enfin, les ROP pourront s'appuyer sur un bus mémoire largement amélioré puisqu'interfacé sur 384 bits et naturellement toujours compatible avec la GDDR5.

Graphics Core Next : tout pour le calcul

Dans sa version la plus évoluée, anciennement baptisée XT, la puce Tahiti comptera 32 unités de calcul. Chaque bloc renferme 64 unités vectorielles ou plus précisément 4 unités SIMD pouvant travailler sur 16 éléments. En additionnant tout cela, on arrive à un total de 2048 processeurs de flux. Naturellement cette notion est plus marketing que réel, la puce ne comptant bien évidemment pas 2048 cœurs.

À un plus haut niveau, on trouve les Asynchronous Compute Engines ou ACE. Au nombre de deux, ces unités comme leur nom le suggère sont dédiées aux tâches de calcul générique, autrement dit de compute. Elles sont indépendantes et permettent de programmer le travail et de le distribuer aux unités de calcul sans passer par la partie graphique. Toujours pour améliorer les performances en calcul, l'architecture des Southern Island dispose de deux moteurs DMA pour un accès direct à la mémoire. Ceux-ci sont annoncés comme capables de saturer la bande-passante du bus PCI-Express 3.0.

015E000004837864-photo-amd-southern-island-ace.jpg


En terme de puissance de calcul, AMD annonce 947 Gigaflops en double précision alors que la puce répond bien entendu aux spécifications IEEE. Les diverses améliorations déjà énumérées devraient permettre en matière de calcul générique des changements de contexte plus rapide, une virtualisation de la mémoire facilitée ou encore de bien meilleures performances en mode multitâches.
Modifié le 01/06/2018 à 15h36
0
0
Partager l'article :

Actualités récentes

Test Mario Kart Live : Home Circuit, un
Coincés à la maison ? Voilà 10 films à (re)voir absolument en streaming
Qu'est-ce qu'un malware et comment s'en protéger ?
Test Roccat Elo Air 7.1 : un casque complet, qui oublie pourtant l'essentiel
Sonde Galileo : en route pour Jupiter
Boston Dynamics va vendre des bras pour Spot, son chien robot, dès l'an prochain
Test Apple Watch Series 6 : une évolution en douceur pour une montre toujours aussi réussie
La supercar hybride de McLaren se dévoile grâce à ses dépôts de brevets
Comparatif impression photo en ligne : à qui confier vos souvenirs ?
scroll top