Espace membre :
flechePublicité

// NVIDIA GeForce 100: Aperçu de l'architecture

Publié par le Lundi 18 Janvier 2010

Un maître mot pour le GeForce 100 : la géométrie

Après avoir introduit avec DirectX 10 les Geometry Shaders, Microsoft officialisait avec DirectX 11 la prise en charge de la tesselation, une fonction chère au cœur d'AMD puisque proposée depuis plusieurs générations dans les puces Radeon. La tesselation permet de générer de la géométrie en subdivisant des triangles et ce sans coût sur les performances brutes de la puce. Pour être compatible DirectX 11, NVIDIA avait donc besoin d'unités de tesselation : celles-ci font donc leur apparition dans ce que NVIDIA appelle les « Polymorph Engines ».

Plus largement, NVIDIA insiste sur la place importante accordée à la « géométrie » dans le GeForce 100. Et de comparer les progrès accomplis entre le GeForce FX 5800 et le GT 200 en puissance de shaders : environ 150 fois plus de puissance quand la puissance géométrique entre les deux puces n'a progressé que d'un facteur de 3x. Et parallèlement aux nouvelles unités de tesselation, NVIDIA dit avoir mis en place de nouveaux moteurs de rastérisation afin d'offrir une puissance géométrique théorique huit fois supérieure au GT 200. Le changement intéressant à noter est que les unités de rastérisation ne sont pas situés au centre de la puce comme sur de précédents designs, et ce afin de ne pas agir comme un goulet d'étranglement. Au total, NVIDIA dédie près de 10% du die de la puce aux unités géométriques.

Démo GeForce 100 - Tesselation Hair
Démo GeForce 100 - Water

Deux démonstrations technologiques NVIDIA utilisant la puissance géométrique du GeForce 100


Reste que ces chiffres de performance sont quelque peu abstraits tout comme certains détails techniques non communiqués par NVIDIA : on peut en effet s'interroger sur le débit des unités de tesselation. Quelle utilité de générer une foultitude de triangles, si le reste de la puce et notamment les unités de shaders ne peuvent les traiter ? NVIDIA montrait quelques démonstrations technologiques tirant profit de la puissance géométrique avec l'usage de techniques combinant un vieux procédé comme le displacement mapping, les fans de Matrox s'en souviendront, aux unités de tesselation et au shading de nos pixels.

GeForce 100 : le reste de l'architecture

Pour ce qui est du reste de l'architecture, la puce GeForce 100 totalise 512 processeurs CUDA, répartis selon quatre blocs ou GPC Graphics Processing Cluster. Chaque bloc compte 128 processeurs de flux, 4 « Polymorph Engine » en d'autres termes une unité de tesselation avec des fonctions annexes et 16 unités de texture. Quant aux unités de rasterisation elles sont au nombre de 4 : une par bloc. La puce dispose également d'un tout nouveau système de mémoire cache, partagé entre les unités et programmable.

Comme sur un processeur x86, on compte deux niveaux de cache avec un cache L1 et un cache L2. Le cache L1 constitue une nouveauté puisqu'il était absent des GeForce GT200 pour ce qui est des opérations de Load et de Store : il est de 64 Ko configurable en 16+48 Ko (ou inversement). Quant au cache de second niveau, il voit sa taille augmenter et passer de 256 Ko pour le GT200 à 768 Ko : il n'est pas dit toutefois que cela soit suffisant pour l'ensemble des données à traiter notamment du fait du nouvel agencement du dit cache et du fait qu'il remplace une série de caches dédiés. NVIDIA ne communique pas les temps de latence des caches.

Enfin, le « Context switching » c'est à dire la capacité de la puce à traiter aussi bien des données 3D que des données génériques a largement été amélioré. Cela devrait permettre d'obtenir de bien meilleures performances en activant PhysX sur une seule carte GeForce 100 notamment.

Schéma architecture NVIDIA GeForce 100

Diagramme de l'architecture GeForce 100


Avec un bus mémoire de seulement 384 bits, NVIDIA compense la faible bande passante par l'emploi de GDDR5. Cela ne devrait toutefois pas permettre aux GeForce de faire de grands progrès en matière de bande passante mémoire alors que l'on sait précisément que la bande passante mémoire reste l'un des facteurs critiques pour les performances d'une puce graphique.

Les unités ROP, en charge notamment de l'anticrénelage, bénéficient d'améliorations avec le GeForce 100. Celles-ci seraient plus performantes, mais NVIDIA se refuse à de plus amples commentaires préférant indiquer que leurs algorithmes ont été revus. Et si le seul benchmark présenté, Far Cry 2 affichait effectivement un gain de performances de 50% en 4x face au GeForce GTX 285, c'est aussi parce que les cartes GeForce 100 embarquent 1,5 Go de mémoire vidéo.

Au total, la puce GeForce 100 compte 48 unités ROP et 64 unités de texture. En comparant avec le GeForce GT200 on s'aperçoit que la nouvelle puce graphique de NVIDIA compte plus d'unités ROP : 48 contre 32 précédemment, mais moins d'unités de texture. Les GeForce GT200 en embarquent en effet 80 : gageons que la fréquence de fonctionnement des unités de texture du GeForce 100 sera supérieure ce qui permettra de compenser leur moins grand nombre. Du reste les caractéristiques des unités de texture ne semblent pas avoir changé.


Envoyer par mail Envoyer par mail
Chargement des commentaires...
( les afficher maintenant )
flechePublicité

Les bons plans !

Partenaire Clubic.com

Top logiciels Filtrage de contenu

IE AdBlock
Antipopup pour Internet Explorer
Anti-Porn
Logiciel de filtrage de contenu.
AdBlock Configurator For Opera
Bloquez les contenus publicitaires sous Opera avec cet utilitaire efficace et gratuit !
SniperSpy
Espionnez l'activité de votre PC à distance
Privoxy
Proxy libre puissant
ProxyCap
Accédez à Internet derrière un pare-feu.

Fond d'écran

Paysage paisible de la Brevine (Suisse)

Partenaire Clubic.com

flechePublicité

BE GEEK ! Avec

Glossaire High-Tech : #   A  B  C  D  E  F  G  H  I  J  K  L  M  N  O  P  Q  R  S  T  U  V  W  X  Y  Z