NVIDIA GeForce GTX 280 : la nouvelle bombe ?

16 juin 2008 à 15h00
0

NVIDIA GeForce GTX 280 : l'architecture plus en détails

Avec le GeForce GTX 280, l'architecture unifiée reste le maître mot alors que NVIDIA revoit diverses choses, à commencer par le nombre de processeurs de flux et leur organisation au sein de la puce. Alors que le GeForce 8800 était doté de 128 processeurs de flux, le GeForce GTX 280 en comporte240, soit presque deux fois plus. L'occasion pour nous de vous mettre en garde contre la communication de NVIDIA qui tente de mettre en parallèle les 240 processeurs de flux de son processeur graphique aux quatre cœurs que l'on trouve dans les processeurs Intel Penryn notamment. Cette comparaison n'est absolument pas valable, les processeurs de flux du GeForce GTX 280 n'ayant pas du tout les mêmes capacités de calcul que les cœurs d'exécution d'un CPU alors qu'ils ne travaillent pas non plus avec les instructions x86 utilisées par les processeurs AMD ou Intel. Pour en revenir à l'architecture du GeForce GTX 280, les 240 processeurs de flux sont organisés selon 10 grappes ou clusters. Chaque cluster est divisé selon trois unités de traitement multi-processeurs (les SM ou Streaming Multiprocessor), chaque unité étant elle-même dotée de 8 processeurs de flux (les SP ou Streaming Processors).

000000DC01367782-photo-nvidia-geforce-gtx-280-tpc.jpg

Gros plan sur le TPC ou Thread Processing Cluster


Chacun des 240 cœurs d'exécution du GeForce GTX 280 peut effectuer des opérations arithmétiques sur des nombres entiers ou des nombres flottants alors qu'ils sont capables d'effectuer des opérations logiques avec un accès à la mémoire. Chaque processeur scalaire est qui plus est multi-threadé de manière matérielle et peut exécuter une instruction par processus et par cycle d'horloge. Rappelons au passage, qu'au contraire des architectures vectorielles précédemment employées au sein des puces graphiques, l'architecture unifiée de NVIDIA travaille non pas sur l'ensemble d'un vecteur mais sur une seule de ses composantes (coordonnées X, Y, Z pour un vertex, valeurs de couleurs RGBA d'un pixel).

000000F001367774-photo-nvidia-geforce-gtx-280-architecutre.jpg

Vue d'ensemble de l'architecture du GeForce GTX 280


En tête d'architecture, on retrouve le « Thread Scheduler », une super unité qui a le rôle d'arbitre et est chargée de dispatcher les calculs, en fonction de leur nature (pixel, géométrie, vertex) vers chacun des clusters de traitement tout en maximisant leur efficacité. Naturellement, avec près de 240 processeurs de flux à faire travailler, NVIDIA s'est sérieusement penché sur l'optimisation des algorithmes de son organiseur de processus avec des gains de performance atteignant jusqu'à 20% dans certains cas bien précis.

NVIDA GeForce GTX 280 : un seul GPU mais deux personnalités...

La charge de travail n'étant pas la même que le GPU traite de la 3D ou qu'il effectue des calculs parallèles pour par exemple encoder une vidéo, l'architecture du GeForce GTX 280 a pour particularité d'offrir deux facettes. Comme sur le G80, le GeForce GTX 280 dispose d'une mémoire locale partagée entre chacun des huit processeurs de flux. Cette mémoire est cruciale puisqu'elle permet l'échange de données directement entre les processeurs de flux, ce qui accélère sensiblement le traitement puisque cela évite à la puce de lire les données depuis une mémoire externe. Avec le GeForce GTX 280, NVIDIA augmente la taille de cette mémoire cache tout en l'exposant de meilleure manière pour les développeurs qui peuvent l'utiliser plus simplement.

000000F001367842-photo-nvidia-geforce-gtx-280-archi-mode-calcul.jpg

Architecture du GeForce GTX 280 pour les calculs


En mode calcul, les caches dédiés au stockage des textures sont utilisés pour combiner les accès mémoire afin d'offrir une bande passante plus large pour les opérations de lecture/écriture en mémoire. On notera dans le diagramme de la puce des unités baptisées « Atomic » : celles-ci offrent un accès granulaire aux divers emplacements mémoire et permettent d'effectuer des opérations de lecture, écriture et modification.

000000E101367848-photo-nvidia-geforce-gtx-280-archi-mode-calcul-tpc.jpg

Gros plan sur un TPC en mode calcul du GeForce GTX 280 : observez l'apparition de mémoire partagée
Modifié le 01/06/2018 à 15h36
0
0
Partager l'article :

Les actualités récentes les plus commentées

Pour le patron de Take Two (GTA, BioShock), Stadia est une déception
Microsoft bloque la mise à jour de Windows 10 (mai 2020) sur de nombreux appareils
La Maison-Blanche s'en prend aux pays qui taxent les géants numériques américains
Microsoft licencie des dizaines de journalistes, remplacés par des robots
Citroën prépare une nouvelle berline hybride haut de gamme pour 2021
Le plus gros avion électrique de la planète a réussi son premier vol
Davantage d'animaux sauvages : la solution pour réconcilier éleveurs et loups ?
Gaia-X : le projet européen de cloud computing visant à concurrencer la Silicon Valley se précise
La Poste déploie l'Identité Numérique, un service pour se connecter à 700 services avec un identifiant unique
Sony reporte son événement dédié à la PS5 et soutient le mouvement de contestation en cours aux USA

Notre charte communautaire

  • 1. Participez aux discussions
  • 2. Partagez vos connaissances
  • 3. Échangez vos idées
  • 4. Faites preuve de tolérance
  • 5. Restez courtois
  • 6. Publiez des messages utiles
  • 7. Soignez votre écriture
  • 8. Respectez le cadre légal
  • 9. Ne faites pas de promotion
  • 10. Ne plagiez pas
  • Consultez la charte
scroll top