NVIDIA GeForce 100: Aperçu de l'architecture

NVIDIA profitait du CES pour dévoiler à la presse certaines spécifications jusqu'alors inconnues de son architecture « Fermi » que l'on retrouvera dans les prochaines GeForce. Après avoir évoqué en octobre dernier les caractéristiques de « Fermi » pour le calcul et le GPGPU, NVIDIA parle cette fois de 3D et de jeux, en détaillant un peu plus l'architecture du GeForce 100, le nom de code donné au processeur de la prochaine carte graphique GeForce haut de gamme.

Alors que les cartes finales ne sont toujours pas disponibles, et cela ne sera pas le cas avant le mois de mars si tout va bien, NVIDIA tente d'occuper au mieux l'espace médiatique en générant du « buzz ». Il faut dire que maintenant qu'AMD a décliné son architecture DirectX 11 sur toute sa gamme de Radeon, du bas de gamme au haut de gamme, le retard de NVIDIA se fait de plus en plus pesant.

0000012202754212-photo-die-nvidia-geforce-100-fermi.jpg

GeForce 100 : petits rappels

Mais revenons-en aux annonces de NVIDIA concernant le GeForce 100 : la firme au caméléon a choisi de se concentrer sur l'architecture, les informations techniques sur les fréquences, débits et performances n'étant toujours pas officielles, puisqu'encore en train d'être ajustées au fur et à mesure du retour des premiers wafers en 40nm de TSMC.

Rappelons que la puce répondant au nom de code GeForce 100 compte 3 milliards de transistors et est gravé en 40nm. De quoi donner quelques cheveux gris aux équipes de NVIDIA quand on connaît certaines des difficultés de TSMC avec le procédé 40nm notamment. Elle est la première GeForce à prendre en charge DirectX 11 : une particularité qui aura poussé NVIDIA à retravailler son architecture.

L'industrie des puces graphiques fonctionne par cycle, et avec son GeForce GT200 NVIDIA était clairement en fin de cycle... Il n'était plus possible pour la firme de modifier cette architecture et il lui a fallu repartir de zéro pour concevoir une nouvelle architecture répondant non seulement aux exigences de DirectX 11 et qui s'avère prête pour l'avenir.

0000011302754216-photo-nvidia-geforce-100-sonicsled.jpg

Un maître mot pour le GeForce 100 : la géométrie

Après avoir introduit avec DirectX 10 les Geometry Shaders, Microsoft officialisait avec DirectX 11 la prise en charge de la tesselation, une fonction chère au cœur d'AMD puisque proposée depuis plusieurs générations dans les puces Radeon. La tesselation permet de générer de la géométrie en subdivisant des triangles et ce sans coût sur les performances brutes de la puce. Pour être compatible DirectX 11, NVIDIA avait donc besoin d'unités de tesselation : celles-ci font donc leur apparition dans ce que NVIDIA appelle les « Polymorph Engines ».

Plus largement, NVIDIA insiste sur la place importante accordée à la « géométrie » dans le GeForce 100. Et de comparer les progrès accomplis entre le GeForce FX 5800 et le GT 200 en puissance de shaders : environ 150 fois plus de puissance quand la puissance géométrique entre les deux puces n'a progressé que d'un facteur de 3x. Et parallèlement aux nouvelles unités de tesselation, NVIDIA dit avoir mis en place de nouveaux moteurs de rastérisation afin d'offrir une puissance géométrique théorique huit fois supérieure au GT 200. Le changement intéressant à noter est que les unités de rastérisation ne sont pas situés au centre de la puce comme sur de précédents designs, et ce afin de ne pas agir comme un goulet d'étranglement. Au total, NVIDIA dédie près de 10% du die de la puce aux unités géométriques.

000000DC02754208-photo-d-mo-geforce-100-tesselation-hair.jpg

Deux démonstrations technologiques NVIDIA utilisant la puissance géométrique du GeForce 100

Reste que ces chiffres de performance sont quelque peu abstraits tout comme certains détails techniques non communiqués par NVIDIA : on peut en effet s'interroger sur le débit des unités de tesselation. Quelle utilité de générer une foultitude de triangles, si le reste de la puce et notamment les unités de shaders ne peuvent les traiter ? NVIDIA montrait quelques démonstrations technologiques tirant profit de la puissance géométrique avec l'usage de techniques combinant un vieux procédé comme le displacement mapping, les fans de Matrox s'en souviendront, aux unités de tesselation et au shading de nos pixels.

GeForce 100 : le reste de l'architecture

Pour ce qui est du reste de l'architecture, la puce GeForce 100 totalise 512 processeurs CUDA, répartis selon quatre blocs ou GPC Graphics Processing Cluster. Chaque bloc compte 128 processeurs de flux, 4 « Polymorph Engine » en d'autres termes une unité de tesselation avec des fonctions annexes et 16 unités de texture. Quant aux unités de rasterisation elles sont au nombre de 4 : une par bloc. La puce dispose également d'un tout nouveau système de mémoire cache, partagé entre les unités et programmable.

Comme sur un processeur x86, on compte deux niveaux de cache avec un cache L1 et un cache L2. Le cache L1 constitue une nouveauté puisqu'il était absent des GeForce GT200 pour ce qui est des opérations de Load et de Store : il est de 64 Ko configurable en 16+48 Ko (ou inversement). Quant au cache de second niveau, il voit sa taille augmenter et passer de 256 Ko pour le GT200 à 768 Ko : il n'est pas dit toutefois que cela soit suffisant pour l'ensemble des données à traiter notamment du fait du nouvel agencement du dit cache et du fait qu'il remplace une série de caches dédiés. NVIDIA ne communique pas les temps de latence des caches.

Enfin, le « Context switching » c'est à dire la capacité de la puce à traiter aussi bien des données 3D que des données génériques a largement été amélioré. Cela devrait permettre d'obtenir de bien meilleures performances en activant PhysX sur une seule carte GeForce 100 notamment.

0000010E02754210-photo-sch-ma-architecture-nvidia-geforce-100.jpg

Diagramme de l'architecture GeForce 100

Avec un bus mémoire de seulement 384 bits, NVIDIA compense la faible bande passante par l'emploi de GDDR5. Cela ne devrait toutefois pas permettre aux GeForce de faire de grands progrès en matière de bande passante mémoire alors que l'on sait précisément que la bande passante mémoire reste l'un des facteurs critiques pour les performances d'une puce graphique.

Les unités ROP, en charge notamment de l'anticrénelage, bénéficient d'améliorations avec le GeForce 100. Celles-ci seraient plus performantes, mais NVIDIA se refuse à de plus amples commentaires préférant indiquer que leurs algorithmes ont été revus. Et si le seul benchmark présenté, Far Cry 2 affichait effectivement un gain de performances de 50% en 4x face au GeForce GTX 285, c'est aussi parce que les cartes GeForce 100 embarquent 1,5 Go de mémoire vidéo.

Au total, la puce GeForce 100 compte 48 unités ROP et 64 unités de texture. En comparant avec le GeForce GT200 on s'aperçoit que la nouvelle puce graphique de NVIDIA compte plus d'unités ROP : 48 contre 32 précédemment, mais moins d'unités de texture. Les GeForce GT200 en embarquent en effet 80 : gageons que la fréquence de fonctionnement des unités de texture du GeForce 100 sera supérieure ce qui permettra de compenser leur moins grand nombre. Du reste les caractéristiques des unités de texture ne semblent pas avoir changé.

Conclusion

Difficile en l'état de se prononcer favorablement sur l'architecture du GeForce 100. Celle-ci est indubitablement nouvelle, en rupture avec ce que NVIDIA proposait jusqu'alors, et cela ne va pas sans poser problèmes puisque l'ensemble des optimisations déjà apportées aux pilotes GeForce pour les G80 et GT200 sont à reprendre. Au-delà de cet aspect pratique, NVIDIA met l'accent sur la puissance géométrique. Un terme fourre-tout qui recouvre avant tout l'arrivée des unités de tesselation. Si l'on veut bien croire NVIDIA lorsque les représentants de la marque nous disent que leurs unités sont plus puissantes que celles de la concurrence, on reste dubitatif sur la puissance de shaders qui sera de toute façon nécessaire pour traiter l'ensemble de ces informations géométriques. Et que dire des jeux qui sont encore loin de tirer aujourd'hui profit des avancées en terme de géométrie induites par DirectX 11 notamment.

0000011302754214-photo-nvidia-geforce-100-rendu-raytracing-voiture.jpg

Sur le papier, l'architecture GeForce 100 semble relativement convaincante mais pas foncièrement surprenante. NVIDIA tient ici une puce 3D qui devrait satisfaire les joueurs mais vraisemblablement sans inquiéter outre-mesure AMD dont les Radeon HD 5870 risquent bien de donner du fil à retordre à ces futures GeForce ! Rendez-vous dans les semaines à venir pour les premiers tests de performance.

La carte GeForce 100 dans une version non définitive