La grande offensive AMD : Radeon HD 4850/4870

25 juin 2008 à 06h00
0

AMD RV770 : L'architecture RV670 revisitée

Au cœur des Radeon HD 4000 nous retrouvons une toute nouvelle puce graphique baptisée RV770. Celle-ci reprend l'architecture unifiée DirectX 10.1 des précédentes puces RV670, tout en l'améliorant. Les équipes d'ATI/AMD se sont en effet employées à corriger ou à revisiter certaines zones du RV670 qui posaient problème à commencer par la structure même de l'architecture SIMD de la puce. Avant de rentrer dans les détails, un petit rappel s'impose. Avec les G80, G92 et plus récemment avec le G200, NVIDIA propose une architecture qu'il qualifie de SIMT c'est-à-dire « Single Instruction, Multiple Threads » et qui correspond dans la pratique à l'application d'une opération sur plusieurs threads par opposition à l'architecture SIMD, Single Instruction, Multiple Data, où une instruction de plusieurs opérations est appliquée à un élément. Techniquement, qu'il s'agisse d'architecture SIMT ou SIMD, les puces, en l'occurrence AMD ou NVIDIA, sont dans tous les cas dotées d'unités scalaires. Sur le papier le SIMT est censé être plus efficace, le programmeur n'ayant pas à se soucier du remplissage de l'unité vectorielle, ce qui n'est pas le cas du SIMD.

000000E101406918-photo-amd-rv770-architecture-2.jpg

Découpage de la puce RV770


Bien que les puces d'AMD et de NVIDIA proposent toutes deux des architectures graphiques unifiées, elles comportent un nombre différent d'unités de traitement, autrement appelés processeurs de flux. Et la simple comparaison du nombre d'unités ne suffit pas à estimer la puissance d'une puce face à l'autre, puisque NVIDIA et AMD comptent leurs unités de calcul d'une manière différente. Ainsi si nous prenons le dernier GeForce GTX 280, il dispose de 240 processeurs de flux alors qu'AMD annonce fièrement 800 processeurs de flux pour son RV770 ! Mais à la différence du GeForce 8800 GTX qui va travailler sur 128 éléments simultanément ou du GeForce GTX 280 qui travaille sur 240 éléments en même temps, le RV770 va travailler sur 160 éléments, chaque élément pouvant contenir jusqu'à cinq instructions : ses unités de calcul sont en effet de type vec5.

000000E101406916-photo-amd-rv770-architecture-1.jpg

Vue d'ensemble de l'architecture du RV770


Niveau organisation, et comme évoqué plus haut, AMD a revu l'agencement des unités SIMD puisque la puce comporte un total de dix cœurs SIMD, chacun étant composé de 16 processeurs de flux de type vec5. Précédemment, les Radeon HD 3850/3870 disposaient de quatre cœurs SIMD, chacun avec 16 processeurs de flux vec5, pour un total de 320 processeurs de flux. Chaque cœur SIMD dispose de ses propres contrôles et peut travailler de manière indépendante alors que les cœurs peuvent communiquer entre eux via une mémoire cache globale partagée de 16 Ko. Par ailleurs, AMD annonce des améliorations au niveau des temps de traitement de certaines opérations par ses unités vec5, notamment en matière de double précision. Quand aux shaders de géométrie, instaurés avec DirectX 10, leur traitement est plus véloce qu'auparavant, AMD ayant augmenté le nombre maximum de threads supporté. L'unité de tesselation, introduite avec le Radeon HD 2900 et servant à multiplier les formes géométriques en partant d'une figure simple, a également fait l'objet d'améliorations pour gérer l'instancing alors qu'elle est dorénavant compatible DirectX 10 et DirectX 10.1. Reste qu'il y a hélas peu de chances pour que les développeurs l'utilisent, l'unité de tesselation d'ATI ayant jusqu'alors été boudée par la plus grande partie des créateurs de jeux vidéo.

000000F501407082-photo-amd-rv770-architecture-3.jpg

Gros plan sur un coeur SIMD


Chaque cœur SIMD dispose de sa propre unité de texture, elle-même dotée de quatre unités, soit un total de quarante processeurs de texture. AMD explique avoir revu la conception de ces unités pour une meilleure performance. C'est ainsi que par diverses petites astuces la bande passante de leur mémoire cache a été multipliée par deux ce qui influe notamment sur les performances en terme de filtrage. Autre très bonne nouvelle, AMD a enfin revu ses unités ROP en charge des derniers traitements sur les pixels et notamment responsables de l'anticrénelage. Celles-ci sont en effet bugguées depuis la sortie du R600 et AMD ne les avait pas revues avec le RV670, ce qui se traduisait par de mauvaises performances en anticrénelage. Exit les ROP buggués du R600 et place à de nouvelles unités ROP affichant de meilleures performances, les ROP du RV770 pouvant traiter deux fois plus de pixels par cycle d'horloge que celles du RV670 alias Radeon HD 3800. Précisons que face aux Radeon HD 3800, les Radeon HD 4850 et 4870 disposent du même nombre d'unités ROP, à savoir 16.

000000E601407228-photo-amd-rv770-rop.jpg

Unités ROP


Enfin, AMD revoit le contrôleur mémoire de sa puce graphique. Bien que nous soyons toujours en présence d'un contrôleur mémoire 256 bits distribué, celui-ci est maintenant doté d'un hub. Le hub est dédié au trafic à faible bande passante alors que l'on distingue à la périphérie de la puce quatre contrôleurs mémoire, placés le plus près des unités les plus consommatrices de bande passante et ce pour des temps de latence les plus faibles possibles. La conception du contrôleur mémoire a également été revue pour supporter les fréquences de fonctionnement élevées de la mémoire GDDR5 proposée avec le Radeon HD 4870. Ainsi, avec de la mémoire GDDR5, AMD peut offrir avec un bus mémoire conventionnel de 256 bits une bande passante dépassant les 100 Go/s.
Modifié le 01/06/2018 à 15h36
0
0
Partager l'article :

Actualités récentes

Microsoft aide une ONG à nettoyer les océans grâce au machine learning
En Chine, Auchan cède sa filiale SunArt à Alibaba pour 3 milliards d'euros
Amazfit ZenBuds : des écouteurs pour dormir sur ces deux oreilles
L'opérateur RED by SFR casse les prix sur ses forfaits mobiles 4G
La Karma GSe-6 sera affichée à un prix de départ de 79 900 dollars
Basemark lance un nouveau bench GPUScore pour le haut de gamme et le Ray Tracing
Ubisoft : des hackers dérobent le code source de Watch Dogs: Legion et réclament une rançon
Taxe GAFA : les prélèvements reprendront dès le mois de décembre en France !
Après l'armée, c'est l'industrie automobile qui s'intéresse aux exosquelettes
La Chine met à jour ses lois pour lutter contre les dépendances numériques des plus jeunes
scroll top