Espace membre :
flechePublicité

// Radeon HD 7970 : AMD revient sur le très haut de gamme, en DirectX 11.1

Partager ce dossier

Publié par Julien Jay le Jeudi 22 Décembre 2011

Graphics Core Next : une architecture revisitée… totalement


En développement depuis plusieurs années à Orlando, trois si l'on en croit Michael Mantor, Senior Fellow Architect pour AMD, l'architecture Graphics Core Next vise à proposer aux développeurs un modèle de programmation simplifié tout en offrant un plus grand niveau de parallélisme.

Pour AMD, Graphics Core Next est une suite logique dans l'évolution des architectures graphiques, du modèle à fonction fixe des débuts aux premières architectures à shaders programmables en passant par les architectures hautement parallèle. Petit retour en arrière : depuis la série 5000 des Radeon HD, AMD propose un modèle d'architecture basé sur le VLIW ou Very Large Instruction Word. En clair, il s'agit pour les unités de la puce d'exécuter d'un seul coup plusieurs instructions : d'une génération de Radeon à l'autre AMD a d'ailleurs ajusté la longueur du VLIW… 4 ou 5 composantes par vecteur. Avec Graphics Core Next, la firme tire un trait sur cette époque et propose une architecture de type scalaire.

Utilisant un nouveau jeu d'instructions, l'architecture Graphics Core Next se compose d'un nouveau front-end, de nouveaux processeurs de commande et d'une gestion des caches intégralement revue entre autres. En s'intéressant de plus près aux unités de calcul composant la puce, on s'aperçoit que leur agencement a été totalement revu. Il n'est plus question d'envoyer une quantité d'instructions indépendantes à la puce et d'attendre leur bonne exécution puisque AMD propose dorénavant un fonctionnement scalaire du moins d'un point de vue développeur.

Chaque unité de calcul dispose de son propre scheduler pour la répartition des tâches, une répartition qui s'effectue sur les quatre unités vectorielles SIMD qui lui sont rattachées. Les dites unités comportent chacune 16 voies ainsi que des registres vectoriels à hauteur de 64 Ko par unité. Dans les faits, une unité de calcul CU (Compute Unit) pourra donc exécuter 4 instructions sur 16 éléments.

Southern Island - Architecture - 2

Gros plan sur une Compute Unit

On retrouve également au cœur de nos unités de calcul une unité scalaire accompagnée de ses registres (4 Ko) sans oublier une mémoire partagée en local de 64 Ko. À l'instar des processeurs et de leur mémoire cache partagée, cette mémoire locale est partagée entre les quatre unités vectorielles notamment. Les unités de texture, au nombre de 4, se retrouvent dans chaque unité de calcul avec 16 unités en charge des opérations de chargement, stockage des texture. En prime, AMD propose 16 Ko de mémoire cache de premier niveau dont le débit est de 64 octet par cycle d'horloge. Il est important de noter que chaque unité de calcul peut exécuter des instructions de plusieurs Kernel en même temps, tandis que l'agencement même des unités de calcul a été conçu pour maximiser le nombre d'instructions traitées par cycle d'horloge.

En ce qui concerne le cache, AMD a entièrement revu sa copie. Comme nous l'avons exposé précédemment chaque unité de calcul dispose de ses propres registres, d'un cache L1 et de sa mémoire locale partagée mais cela ne saurait résumer l'organisation du cache au sein de Tahiti. Chaque groupe de quatre CU dispose en effet d'un cache dédié aux instructions de 16 Ko et d'un cache de 32 Ko pour les données scalaires. On retrouve qui plus est une mémoire globale partagée censée faciliter la synchronisation entre les unités de calcul ainsi qu'un deuxième niveau de mémoire cache. Chaque contrôleur mémoire sur 64 bits est en effet adossé à une partition de cache de second niveau.

Southern Island - Architecture - 3

L'architecture Graphics Core Next

Si nous résumons, Tahiti dispose de 512 Ko de cache L1 pour les données, 384 Ko de cache L1 partagé (instructions et données scalaires notamment), 768 Ko de cache local partagé et 768 Ko de cache L2. Au total, le Radeon HD 7970 peut s'appuyer sur pas loin de 5 Mo de mémoire cache, un record pour une puce graphique.


Vous aimerez aussi

Envoyer par mail Envoyer par mail
Chargement des commentaires...
( les afficher maintenant )

flechePublicité

Les bons plans !

Partenaire Clubic.com

Top logiciels Editeurs de tags

RealPlayer SP
RealPlayer SP : La nouvelle génération du pionnier de la vidéo en streaming !
Windows Media Player
La nouvelle génération du lecteur Microsoft
Winamp
Winamp : La dernière version du plus célèbre lecteur audio !
MP3tag
Petit outil pour 'renommer/retagger' très simplement mp3, ogg, ape, mpc...
MediaMonkey
Cataloguer, tagger et lire tous ses fichiers musicaux
Yamipod
Gerer son iPod sans iTunes

Partenaire Clubic.com

flechePublicité

BE GEEK ! Avec Clubic Logo

flechePublicité