AMD Trinity : un Bulldozer dans un portable ?

Il y a un peu plus d'un an, AMD introduisait Fusion, c'est-à-dire l'association sur un même morceau de silicium du processeur et du cœur graphique. Le concept d'APU (comprendre Accelerated Processing Unit) était enfin matérialisé, et Zacate et Ontario en étaient les deux premiers représentants.

Ces deux puces étaient destinées en priorité aux netbooks et PC portables d'entrée de gamme. Pour voir Fusion débarquer sur les ordinateurs de bureau, il faudra attendre Llano, l'été dernier. Et si le degré d'innovation apportée par cette solution associant partie graphique et cœurs x86 était conséquent pour AMD, l'ex-fondeur s'était à l'époque contenté d'utiliser, pour la partie processeur, les vieillissants cœurs Stars, hérités de l'architecture K10.

Il fallait attendre l'arrivée de Bulldozer pour voir AMD faire évoluer son offre en la matière, avec une toute nouvelle micro-architecture destinée, jusqu'à présent, aux ordinateurs de bureau. Avec Trinity, AMD propose donc une nouvelle gamme d'APU, dotée cette fois des cœurs x86 de dernière génération, tandis qu'il fait également évoluer la partie graphique et effectue quelques ajustements au sein de son architecture.

Pour le moment, AMD ne propose que des puces destinées aux ordinateurs portables : l'occasion de comparer Trinity à l'ancienne génération d'APU Llano, ou encore à une solution à base de processeur Intel et de GPU NVIDIA. Comment se comporte Trinity face à cette concurrence ? Réponses dans les lignes suivantes !

Die Shot

Trinity : au nom du père, du fils et du Piledriver

Comme nous le disions en introduction, Llano représentait jusqu'alors ce qu'AMD avait fait de mieux en terme d'APU. Les performances étaient là en ce qui concerne la partie graphique, notamment lorsqu'on la comparait à l'époque avec le HD 3000 d'Intel, et même encore aujourd'hui par rapport au HD 4000 (voir le test de Ivy Bridge). Malheureusement, la partie processeur et donc les cœurs x86 hérités des Phenom II se montraient bien limités face à l'offre d'Intel. Pour Trinity, AMD a donc introduit au sein de son APU des cœurs de nouvelle génération, hérités des fameux Bulldozer présentés en octobre dernier, afin de les rendre plus performants que ceux de la génération Llano.

Pour une information complète sur cette nouvelle micro-architecture, nous vous renvoyons vers l'article de Julien (FX 8150, alias Bulldozer, le nouveau processeur 8 coeurs d'AMD). Nous nous contenterons ici de décrire les optimisations réalisées par AMD, puisque l'ex-fondeur a fait évoluer les cœurs Bulldozer pour parvenir aux Piledriver qui prennent place au sein de ses APU de dernière génération, succédant ainsi aux Husky qui officiaient sur Llano. La promesse d'AMD ? Un rapport performance / consommation qui grimpe de 29% pour les puces mobiles qui nous intéressent aujourd'hui, par rapport aux cœurs Husky (contre un gain annoncé de 26% sur les versions desktop).

Piledriver

Des résultats obtenus notamment par une hausse des fréquences : la meilleure des APU Trinity atteint au lancement 3,2 GHz, contre 2,4 GHz pour la figure de proue Llano, le A8-3510MX, et ce à finesse de gravure constante, puisque le procédé de fabrication reste en 32 nm. La version desktop pourra même atteindre les 4 GHz d'après AMD.

Mais là n'est pas la seule explication, l'architecture issue de Bulldozer ayant également sa part de responsabilité dans ces gains de performances annoncés. Une architecture qu'AMD a optimisée, du remaniement du module de prédiction de branchement à un scheduler amélioré en passant par des optimisations au niveau des caches, et notamment un cache TLB de premier niveau plus large. Alors que certaines instructions devraient s'exécuter plus rapidement, AMD dit avoir accru l'efficacité du cache L2 partagé alors que certains problèmes liés à la fabrication et aux courants de fuite auraient été résolus. Rien ne change concernant la quantité de mémoire cache par rapport à Llano, même si la structure du cache est évidemment différente du fait du changement d'architecture : chaque module dispose de 2 Mo de mémoire cache partagée de second niveau, soit un total de 4 Mo pour une APU Trinity en configuration quadri-cœurs. Le cache L1 propose quant à lui 64 Ko pour les instructions et 64 Ko pour les données. Et comme sur Llano, mais contrairement aux processeurs de bureau basés sur Bulldozer, Trinity ne dispose pas de cache de niveau 3.

Cœur graphique : Northern Islands et rien d'autre

Alors que les APU Llano de la série A étaient pourvues d'un cœur graphique « Sumo », hérité de la génération des Radeon HD 5670, les APU Trinity embarquent quant à elles une partie graphique de génération Northern Islands, c'est-à-dire celle des Radeon HD 6000. Malgré les dénominations en 76xx (nom de code « Thames »), les APU Trinity ne disposent donc pas de Southern Islands et de ses Core Next, mais bien d'une classique architecture Radeon que nous avons pu détailler dans notre article sur les Radeon HD 6950/6970. À noter que le département marketing AMD appelle dorénavant les cœurs Radeon de ses puces Trinity des Radeon Core 2.0.

GPU diagram

Si les générations sont différentes, les architectures sont comparables : on retrouve ainsi les unités SIMD (Single Instruction Multiple Data) en configuration VLIW4 qui sont ici au nombre de 6 alors qu'elles n'étaient que 4 ou 5 sur les APU Llano. Sauf qu'auparavant, chacune de ces unités renfermait 80 processeurs de flux, pour un total variant de 320 à 400 processeurs de flux. Sur Trinity, on ne compte que 64 processeurs de flux par unités SIMD, pour un total atteignant 384 au maximum. Si le nombre d'unités de calcul diminue, le nombre d'unités de texture évolue légèrement pour passer à 24 (contre 20 pour les Llano de la série A8), alors que le nombre d'unités ROP stagne à 8. Naturellement, cette partie graphique prend en charge DirectX 11, OpenCL 1.1 et DirectCompute 11. Mais point n'est question de DirectX 11.1.

Côté fréquences de fonctionnement, sachez que les cœurs graphiques présents au sein des APU Trinity officient tous à 497 MHz, et peuvent grimper jusqu'à 686 MHz pour certains. C'est donc plus rapide que les 600 MHz dont étaient capables les meilleures APU A8 Llano. Aucune indication concernant les fréquences de la mémoire, puisque c'est bien dans celle du système que le cœur graphique viendra piocher, en utilisant l'UNB que nous allons immédiatement évoquer.

Une base Llano et quelques nouveautés

Malgré l'introduction de nouveaux cœurs x86 ou d'une partie graphique plus performante, Trinity reste grandement basée sur Llano. AMD a toutefois effectué quelques ajustements par rapport à son ancienne architecture.

Labelled Die

Trinity introduit la notion d'Unified Northbridge (ou UNB). Puisque la bande passante mémoire est la clé pour des performances graphiques ou de calcul élevées, la marque a soigné ce point. L'UNB se présente comme une plateforme d'échange gérant les requêtes en accès mémoire du processeur et de la partie graphique de l'APU. Ce northbridge unifié embarque un contrôleur mémoire crossbar et pilote de la mémoire DDR sur deux canaux tout en s'interfaçant avec le Radeon Memory Bus (RMB, bus 256-bit). Ce dernier est dédié à la seule partie graphique de l'APU et s'accommode de la mémoire DDR, tout en s'affranchissant de certains contrôles de cohérence, et offre au GPU un accès à la mémoire système. Techniquement, le contrôleur mémoire prend en charge deux canaux de DDR3 avec une fréquence maximale de 1 866 MHz pour les versions desktop uniquement, les APU mobiles supportant une fréquence maximale de 1 600 MHz. Notez également que les APU Trinity embarquent un contrôleur PCI-Express 2.0, gérant 24 lignes comme pour Llano. La prise en charge du PCI-Express 3.0 passe donc à la trappe.

UNB

Comme par le passé, le chipset est relié à l'APU via une connexion appelée Unified Media Interface. Un chipset qui, par ailleurs, n'évolue pas. Avec Llano, AMD inaugurait sa nouvelle plateforme Lynx, reconduite sans surprise par le constructeur. Notre PC portable de test est ainsi équipé d'un chipset A70M (Hudson-M3), pourvu de 6 ports SATA 6 Gbps, de 4 ports USB 3.0 et d'une dizaine de ports USB 2.0. Il gère un rail PCI-Express 4x et dispose d'une enveloppe thermique variant entre 2,7 et 4,7 Watts.

Platform


AMD inaugure en revanche son HD Media Accelerator, qui comprend l'UVD (Unified Video Decoder) de troisième génération, mais également l'Accelerated Video Converter, qui prend en charge l'encodage matériel en H.264, des optimisations pour les scènes rapides, une qualité de compression variable ou encore le multiplexing audio / vidéo. L'UVD3 reste quant à lui compatible avec les formats H.624, AVCHD, VC-1, MPEG-2, MVC (Blu-ray 3D) ou encore MPEG-4 et DivX. Le décodage Bitstream est évidemment assuré tandis que le circuit audio 7.1 supporte le PCM, l'AC-3, l'AAC, le DTS, le Dolby TrueHD et le DTS Master.

Media Acceleratore

Enfin, Trinity étend les possibilités de la technologie Eyefinity en proposant la gestion de quatre affichages grâce à trois contrôleurs indépendants et à la connectique DisplayPort 1.2, le quatrième affichage étant obtenu par daisy-chain. Toutefois, cette possibilité reste limitée au haut de la gamme Trinity mobile, à savoir le A10-4600M. Au contraire, toutes les APU desktop en disposeront, des A6 aux A10. Autre limitation : seules les APU A8 et A10, qu'elles soient mobiles ou non, bénéficieront de la technologie AMD HD3D, les APU A6 en étant privées.

Les puces Trinity


De ces changements résulte une augmentation raisonnable de la taille de la puce, qui passe de 228 mm² pour Llano à 246 mm². Le nombre de transistors évolue également, puisque l'on arrive au total de 1, 303 milliard d'unités, contre 1,178 milliard pour les APU d'ancienne génération, si AMD ne s'est pas trompé dans son décompte. La finesse de gravure stagne en revanche à 32 nm toujours avec SOI, alors que dans le même temps, Intel inaugure un procédé en 22 nm avec Ivy Bridge.

L'arrivée de Trinity est enfin l'occasion pour AMD de proposer des APU de la série A dont l'enveloppe thermique n'excède pas 17 W. C'est moins que les Zacate (série E) et ça devient comparable avec ce qui existe chez Intel. Les nouvelles APU mobiles d'AMD se voient ainsi dotées d'un TDP allant de 17 à 35 W, alors que la génération Llano voyait ces chiffres évoluer entre 35 et 45 W. Pour les APU destinées aux ordinateurs de bureau, cette enveloppe thermique stagne en revanche entre 65 et 100 W, comme c'était déjà le cas pour Llano.
Modifié le 11/07/2012 à 11h42
Commentaires