Le successeur du Core 2 Duo : Intel Core i7 (Nehalem)

03 novembre 2008 à 06h00
0
000000B401656848-photo-logo-core-i7-marg.jpg
Lancé en juillet 2006, le processeur Core 2 Duo d'Intel avait fort à faire pour restaurer le prestige du fondeur dans le monde des micro-processeurs. Car il fut un temps, pas si lointain, où son rival AMD lui donnait du fil à retordre tant il dominait, pour ainsi dire outrageusement, avec des solutions plus performantes et nettement moins gourmandes. Les choix effectués par Intel avec l'architecture NetBurst mise en place au sein des Pentium 4 et de leurs descendants les Pentium D ou Pentium Extreme Edition ont en effet bien vite montré leurs limites, les solutions d'Intel s'effaçant à l'époque devant l'efficacité des Athlon 64 et autres Athlon 64 X2. Avec l'arrivée du Core 2 Duo, Intel a subitement et brutalement renversé la vapeur.

Partisan du mégahertz à tout crin, Intel a tout d'un coup rejoint le credo d'AMD : favoriser l'efficacité et le rendement de l'architecture, alors qu'avec sa famille de processeurs Core 2 Duo il proposait pour la première fois depuis des années, des processeurs économes en énergie et s'échauffant modérément. D'abord lancés selon le procédé de fabrication en 65nm, les Core 2 Duo sont récemment passés en 45nm, alors qu'AMD n'a toujours pas basculé ses gammes sur cette finesse de gravure tandis que la famille Phenom ne comporte toujours aucun processeur capable de lutter ne serait-ce qu'en face du dernier Core 2 Extreme d'Intel, le QX9770.

C'est dans ce contexte où Intel est présent sur tout le spectre de l'entrée au très haut de gamme alors qu'AMD se borne à l'entrée et au milieu de gamme, que le géant de Santa Clara redistribue ses cartes et lance officiellement sa famille de processeurs Core i7, s'appuyant sur une nouvelle architecture répondant au nom de code Nehalem. A peine plus de deux ans après le lancement des Core 2 Duo, ceux-ci sont ils déjà dépassés ?

0000012701738150-photo-processeur-intel-core-i7-3.jpg

Intel Core i7 : un nouveau tock !

Cela fait plusieurs années déjà qu'Intel a adopté un modèle singulier dans la conception de ses microprocesseurs en retenant une sorte de cadencement baptisé « tick-tock » (ou tic- tac en français dans le texte). Derrière ce vocable pour le moins imagé, se cache un cycle de développement où Intel crée et introduit une nouvelle microarchitecture de micro-processeur, le tock, avant de la décliner plus tard avec une finesse de gravure généralement supérieure et d'autres petits raffinements ; le tick. Alors que Penryn, la variante gravée en 45nm des processeurs Core 2, était ce qu'Intel appelle un tick, Nehalem est un tock. Il s'agit donc d'une toute nouvelle micro-architecture, même si celle-ci conserve l'héritage de l'architecture Core. Forts des solides bases définies avec les processeurs Core 2 Duo, les ingénieurs d'Intel ont cherché à gommer les lacunes technologiques de ces derniers. Histoire de bien comprendre les changements introduits par Nehalem, il nous faut revenir sur les faiblesses de l'architecture Core.

000000E601738176-photo-intel-tick-tock-development-model.jpg


Trouvant ses racines dans le monde du mobile, et notamment du côté du fameux Banias ou Pentium M, l'architecture Core a signé le renouveau d'Intel. Pourtant et malgré ses excellentes performances, ladite architecture pèche sur de nombreux points avec des retards technologiques plus ou moins criants. On pense ainsi au bus système, véritable goulet d'étranglement pour les processeurs Intel depuis des années, ou encore à l'architecture quadri-cœurs non native ou même à l'absence de contrôleur mémoire intégré, une particularité qu'offrent pourtant les processeurs AMD depuis l'Athlon 64 introduit pour mémoire... en 2004 ! Et bien que l'héritage mobile de Core soit un atout indéniable sur bien des aspects, il a aussi constitué une certaine faiblesse puisque l'architecture Core a eu maille à partir, dans le monde des serveurs, avec les Opteron d'AMD. Ces derniers se prêtent en effet bien mieux à un fonctionnement MP ou multiprocesseurs grâce à leur lien HyperTransport : chaque processeur peut communiquer avec son voisin, directement, sans repasser par le chipset.

0000011801738168-photo-intel-core-i7-die-shot-nehalem.jpg

Visuel du die Nehalem


Avec Nehalem, le travail des ingénieurs d'Intel vise non seulement à améliorer les faiblesses technologiques précédemment identifiées, tout en essayant d'obtenir le meilleur compromis possible pour se plier aux exigences pour le moins contradictoires des différentes plates formes sur lesquelles Nehalem devra tourner (mobile, PC de bureau et serveur). En cela, l'architecture Nehalem se veut résolument modulaire et si les premiers processeurs Core i7 l'utilisant seront composés de quatre cœurs, des versions munies de huit cœurs sont d'ores et déjà d'actualité alors qu'Intel projette de proposer dans le courant 2009 des processeurs sur l'architecture Nehalem avec cœur graphique intégré.

0000011801738296-photo-architecture-intel-core-i7-sch-ma-1.jpg

Le die de Nehalem cartographié


Intel Core i7 : 4x2 = 8 ou le retour de l'HyperThreading

L'architecture Nehalem se distingue en premier lieu par son design quadri-cœurs natif autrement appelé monolithique. C'est une première pour Intel, qui rejoint pour l'anecdote l'approche retenue par AMD avec son Phenom. Jusqu'alors, les processeurs quadri-cœurs d'Intel étaient en effet composés de deux dies double-cœur, le die étant le morceau de silicium sur lequel est gravé tout processeur. Industriellement futée, cette solution n'était pas sans inconvénients notamment au niveau de la communication entre les cœurs ou de la cohérence ces caches.

000000F001738298-photo-architecture-intel-core-i7-sch-ma-2.jpg


Seconde nouveauté avec Nehalem, la réapparition d'une technologie que l'on croyait disparue à jamais. Nehalem réintroduit en effet l'HyperThreading , le nom commercial autrefois choisi par Intel pour la technologie SMT, ou Simultaneous Multi-Threading, équipant certains de ses Pentium 4. Le principe de cette technologie est simple : faire en sorte qu'une unité d'exécution physique puisse travailler sur deux processus en simultané, et non de manière concurrente. Avec un cœur classique dépourvu de technologie SMT, il est bien sûr possible de travailler sur plusieurs processus à la fois mais cela implique des interruptions et des aller/retour perpétuels entre les threads avec au passage la nécessité pour le cœur de sauvegarder certains états induisant des temps de latence pas forcément bienvenue. Avec la technologie SMT, les ressources du cœur sont partagées entre les deux processus, et ce sur chacun des quatre cœurs. C'est pour cette raison qu'un système d'exploitation comme Windows verra un ordinateur équipé d'un processeur Core i7 comme doté de huit processeurs logiques.

Reste que l'HyperThreading n'avait pas que des avantages et que son efficacité était grandement liée aux choix architecturaux opérés par Intel à l'époque du NetBurst. Le pipeline démesurément long du Pentium 4, et d'ailleurs difficilement exploitable à 100%, se prêtait en effet très bien à cette technologie. Mais qu'en est-il d'une architecture à pipeline court comme Nehalem ? Nous le verrons un peu plus loin mais en attendant il y a fort à parier que les observations formulées à l'époque du Pentium 4 se vérifient à nouveau avec Core i7 : l'HyperThreading étant un allié de choix pour les applications multimédias mais... pas pour les jeux !

0000011801731228-photo-intel-nehalem-gestionnaire-des-t-ches.jpg

Gestionnaire de tâches de Windows Vista : 8 processeurs logiques

Les améliorations du moteur d'exécution 4-Wide

Nous le disions précédemment, l'architecture Nehalem reprend le moteur d'exécution de l'architecture Core. Si le moteur 4-Wide des Core 2 Duo est donc toujours d'actualité avec Nehalem, de nombreuses améliorations sont de la partie, notamment pour permettre l'implémentation de la technologie SMT mais aussi pour offrir un meilleur rendement. Rappelons, avant la revue de détail, que le moteur 4-Wide tire son nom de sa capacité à traiter jusqu'à quatre instructions simultanément. Mais pour traiter les instructions x86 en question, il faut d'abord les décoder. Bien que toujours doté de quatre décodeurs, Nehalem améliore le mécanisme dit de macro-fusion déjà présent dans Core et qui va repérer les couples d'instructions x86 pouvant être traduits en une seule micro-opération. L'idée est de réduire le nombre d'étapes nécessaires au décodage afin d'utiliser au mieux les cycles d'horloge. Avec Nehalem, la nouveauté en matière de macro-fusion réside dans l'ajout de nouveaux couples remarquables alors que la macro-fusion est disponible en mode 64 bits ! Et oui, avec les processeurs Core 2, tout le mécanisme de macro-fusion est inopérant avec les systèmes d'exploitation 64 bits.

Le détecteur de boucle, également présent dans l'architecture Core, est lui aussi remanié. Ici, le LSD ou Loop Stream Detector, vise à identifier les boucles dans le code, une technique de programmation fréquemment utilisée notamment dans le cadre de traitement par lots. L'idée est de repérer les boucles pour les manipuler séparément du reste du code afin d'éviter des redondances. Précédemment, la détection des boucles s'opérait avant le décodage des instructions. Dorénavant elle s'exécute après le décodage directement sur les micro-opérations, et non plus sur les instructions x86. L'idée est ici de ne pas forcer le décodage systématique des boucles à chaque occurrence. Du reste, Intel fait état d'une meilleure efficacité énergétique, le nouveau positionnement de l'unité LSD permettant de désactiver un nombre plus important de circuits lorsque le processeur entre en veille.

000000F001738300-photo-architecture-intel-core-i7-sch-ma-3.jpg


L'unité de prédiction de branchements est bien sûr l'une des zones d'optimisation les plus importantes pour Intel qui tente, à chaque nouvelle génération de processeur, d'améliorer la précision de cette dernière. L'idée de la prédiction de branche est de conférer au processeur une certaine intelligence pour qu'il détecte en amont le code qui est appelé à être exécuté si telle ou telle condition est remplie afin de précharger certains éléments qui serait nécessaire à l'exécution du reste du code : on évite ainsi toute pause ou tout temps mort dans le traitement du code. Ici Nehalem ajoute aux fonctionnalités existantes de Core une seconde mémoire tampon pour la prédiction de branchements qui sera utilisée par les applications dont le code est assez volumineux, comme les bases de données. De plus, Intel ajoute un mécanisme dit RSB ou Return Stack Buffer qui stocke les adresses de retour et corrige dans la plupart des cas les problèmes de mauvaise prédiction avec les instructions x86 de type RET.

Quant au moteur d'exécution, toujours de type OOO ou Out-of-order, qui exécute les instructions dans le désordre, il subit là aussi plusieurs petites retouches par rapport à l'architecture Core. Il s'agit essentiellement pour Intel d'augmenter la taille des buffers, ou mémoire tampon, en vue de permettre une bonne prise en charge de la technologie SMT. De plus la zone baptisée « Reservation Station », et responsable de la planification des opérations dans les unités d'exécution est désormais partagée dynamiquement entre les processus alors qu'Intel a augmenté son nombre d'entrées : 36 contre 32 précédemment.

000000F001738322-photo-architecture-intel-core-i7-sch-ma-8.jpg


Avec Nehalem, Intel continue d'enrichir ses jeux d'instructions et si le jeu d'instructions x86 principal n'évolue pas, Core i7 profite de nouvelles instructions SSE 4.2. Il s'agit avant tout de compléter les instructions SSE 4.1 apparues avec Penryn en ajoutant des fonctions spécifiques pour traiter plus rapidement les longues chaînes de texte ou de donner ou de calculer plus facilement une valeur CRC, le contrôle de redondance cyclique, utile pour tout ce qui touche à la compression de données.

000000F001738316-photo-architecture-intel-core-i7-sch-ma-6.jpg

Intel Core i7 : un contrôleur mémoire embarqué !

Pour la seconde fois de son histoire (il faut remonter à une variante lointaine du i386 pour retrouver un tel cas de figure), Intel propose un processeur avec contrôleur mémoire intégré autrement appelé IMC (non ce n'est pas l'indice de masse corporel le mais l'Integrated Memory Controller). Le changement n'est pas anecdotique puisqu'il devrait permettre, du moins sur le papier, de réduire les temps de latence lors des accès à la mémoire. Avec Core i7, le chipset de la carte mère n'aura donc qu'un rôle secondaire puisque le processeur embarque l'élément stratégique que constitue le contrôleur mémoire et que l'on retrouvait jusqu'alors dans le chipset.

Pour cette première version du Core i7, Intel nous propose un contrôleur mémoire DDR3 dont la spécificité est de fonctionner non pas sur deux mais sur trois canaux ! Exit donc le double canal... bienvenue au triple canal ! Il faudra en clair munir son système de trois barrettes mémoire DDR3 (ou un multiple de trois) si l'on souhaite exploiter pleinement la bande passante mémoire gérée par le processeur. En revanche là où le dernier chipset d'Intel, le X48, prenait en charge la mémoire DDR3-1600, il faudra se contenter sur Core i7 de mémoire DDR3-1066 selon les spécifications officielles du fondeur. Face à un système Core 2 Duo avec mémoire DDR3-1600 et chipset X48 dont la bande passante atteint 25,6 Go/s, Core i7 offre avec trois barrettes de DDR3-1066 une bande passante mémoire maximale de 25,5 Go/s. Ce chiffre est somme toute décevant puisque sur les premiers modèles de Core i7 l'apparition du mode triple canal ne sert qu'à compenser une prise en charge mémoire assez limitée. Notez d'ailleurs qu'Intel indique prendre en charge une tension d'alimentation maximale de 1,6 volts pour la mémoire : toute tension supérieure pourrait endommager le dit processeur.

Intel Core i7 : Une nouvelle architecture de la mémoire cache

Avec quatre cœurs sur le même die, l'architecture de la mémoire cache a une importance capitale dans le rendement des unités d'exécution et donc plus généralement dans les performances finales du processeur. Design monolithique oblige, Intel a dû revoir l'agencement de la mémoire cache, la cohérence des caches ne pouvant plus être assurée par le bus processeur comme avec Core 2. Sur Nehalem, chaque cœur dispose de sa propre mémoire cache de premier et second niveau, une mémoire naturellement non partagée.

000000F001738320-photo-architecture-intel-core-i7-sch-ma-7.jpg


Le cache de premier niveau offre une taille de 64 Ko avec 32 Ko pour les instructions et 32 Ko pour les données alors qu'il est censé prendre en charge plus d'échecs que Core, logique puisque la bande passante mémoire offerte par Nehalem est plus importante. Le cache de second niveau, est de type 8 voies, pour une taille de seulement 256 Ko. C'est peu par rapport aux Mégaoctets de cache de second niveau auquel nous avait habitué l'architecture Core mais cela garantit logiquement des temps d'accès rapides alors que ce choix architectural est compensé par la présence d'un cache de troisième niveau, partagé cette fois-ci entre les quatre cœurs. Le cache L3 affiche une taille de 8 Mo sur les versions initiales du Core i7 et opte pour un fonctionnement inclusif sur 16 voies. Du reste ce cache est assez souple puisque l'intégralité de son contenu peut être assigné, comme sur l'architecture Core, à une application simple thread.

Si l'agencement des caches sur Nehalem évoque à ne pas manquer le Phenom d'AMD, leur fonctionnement diffère. Ainsi le troisième niveau de cache est inclusif : il comporte donc toutes les données des caches L1 et L2. Ce choix réduit bien sûr la taille utile du cache L3 mais permet en cas d'échec en lecture, d'être sûr que les données recherchées dans le L3 ne sont pas non plus dans les deux premiers niveaux de cache et donc d'initier un appel des données en question dans la mémoire principale sans repasser par une vérification des caches L1 et L2. Avec Nehalem, Intel introduit dans le cache L3 la possibilité d'attribuer un flag (drapeau) pour chaque ligne de données afin de spécifier dans quel cache privé L1 ou L2 se situe la donnée en question, en cas de réussite en lecture du cache L3 : c'est le cache snooping.

Nous avons bien sûr cherché à mesurer les temps de latence du cache des nouveaux processeurs Core i7 pour les comparer non seulement aux processeurs Penryn quadri-coeurs mais aussi au Phenom d'AMD. Les résultats obtenus dans le tableau ci-dessous sont plutôt bons puisque les temps de latence des caches de premier et second niveau restent très bons. Le temps de latence du cache de troisième niveau est naturellement bien plus élevé mais il reste inférieur à celui obtenu chez la concurrence.

 Intel Core 2
Extreme QX9770
Intel Core i7 920AMD Phenom 9850
Cache L1343
Cache L2151215
Cache L3N/A3948


Parallèlement, Intel introduit des changements au niveau du TLB ou Translation Lookaside Buffers. Cette partie du processeur est assez importante puisqu'elle consiste en une mémoire tampon qui stocke les adresses virtuelles utilisées par les logiciels et correspondants aux adresses mémoire physique. On se souvient que chez AMD, cette partie avait causé de graves problèmes au lancement des Phenom, puisque le TLB de ses derniers était buggué, entraînant des pertes de performance considérables. Afin de s'accommoder de la technologie SMT, Intel a du se séparer du micro-TLB de l'architecture Core. Reste donc un TLB à deux niveaux avec deux mémoires tampon de premier niveau stockant code et données avec un total de 192 entrées et un second buffer pouvant contenir 512 entrées. Selon Intel, cette augmentation en capacité du TLB est là pour pallier à l'augmentation en taille de données des applications modernes.

De plus, et cela sera surtout utile avec les logiciels de virtualisation, Intel introduit dans le TLB un identifiant de processeur virtuel. Cela permet d'associer une entrée du TLB au processus en cours d'exécution sur une machine virtuelle. L'avantage est d'éviter la remise à zéro des TLB lors du changement d'hôte virtuel.

Intel Core i7 : Adieu FSB, bonjour QPI

Autre changement structurel important apporté par Nehalem, la disparition du FSB, le Front Side Bus ou bus système qui n'avait pas évolué, hormis en fréquence, depuis le lancement du Pentium 4. Utilisé pour connecter le processeur au reste du système, ce bus s'est révélé au fil des années être un véritable goulet d'étranglement, limitant de fait les performances du système. Avec Nehalem, Intel introduit un tout nouveau bus de données baptisé QPI ou QuickPath Interconnect (anciennement connu sous le nom de code CSI). Le contrôleur mémoire étant maintenant intégré directement au processeur, ce bus sert essentiellement à la communication entre le processeur et son chipset pour les échanges avec le sous système de stockage ou le système graphique par exemple. Similaire en tout point ou presque au bus HyperTransport d'AMD, le bus QPI est de type point à point et peut servir, dans une configuration serveur multi-processeurs, à interfacer directement les processeurs entre eux.

En termes de performances, la première implémentation du bus QPI affiche un débit de 6,4 Gigatransfer à la seconde soit 12,8 Go à la seconde et il est interfacé sur 80 bits. Le bus étant bi-directionnel, le débit grimpe à 25,6 Go par seconde : largement de quoi satisfaire les importantes demandes en bande passante des périphériques modernes.

000000F001738304-photo-architecture-intel-core-i7-sch-ma-5.jpg


Intel Core i7 : Une fréquence qui dépend pour partie du TDP

Avec Nehalem, Intel introduit plusieurs changements dans le cadencement de ses micro-processeurs puisque dorénavant toutes les unités de la puce ne fonctionnent pas à la même fréquence. C'est ainsi qu'il convient de distinguer la partie « Core » de la partie « Uncore » de la puce. La partie « Core » comporte logiquement les quatre cœurs d'exécution de Core i7 alors que la partie « Uncore » regroupe notamment le contrôleur mémoire, le gestionnaire de bus QPI et la mémoire cache de troisième niveau.

La fréquence de fonctionnement définitive de tout ce petit monde est fonction du coefficient multiplicateur, pour l'heure compris entre 12 et 24x, appliqué à la fréquence de référence système, fixée par défaut à 133 MHz. C'est ainsi que la partie « Core » opère à une fréquence d'horloge différente de la partie « Uncore ». Exemple avec la version 940 du Core i7 : alors que les quatre cœurs opèrent à 2,93 GHz, la mémoire cache L3 tourne de son côté à 2,66 GHz. Cela est du reste à prendre en compte lorsque l'on se penche sur les temps de latence de la mémoire cache qui sont forcément impactés par les ratios mis en place.

000000F001738302-photo-architecture-intel-core-i7-sch-ma-4.jpg

Séparation entre zone Core et Uncore


Puisque le contrôleur mémoire est situé dans la zone « Uncore » du Core i7, sa fréquence de fonctionnement dépend bien sûr de la fréquence de référence de base. Toute modification de cette dernière entraîne une modification de la fréquence de fonctionnement du contrôleur mémoire, ce qui impacte directement la bande passante mémoire et le type de mémoire que l'on peut utiliser dans son système. Même constat pour le bus QPI, dont le taux de transfert évoluera en fonction de la fréquence système de base, tout étant imbriqué dans Core i7.

000000F001738282-photo-intel-core-i7-pcu.jpg

Unité PCU du Core i7


Du reste, Core i7 se dote d'une toute nouvelle unité baptisée PCU ou Power Control Unit. Il s'agit d'un micro-contrôleur intégré au processeur dont le rôle est de surveiller en permanence la fréquence, la température et le voltage de chacun des coeurs de la puce. Non seulement cette unité contrôle les différentes valeurs énumérées à l'instant mais elle peut agir directement dessus, prenant ainsi la main sur les VRM de la carte mère. En clair, ce n'est plus le système d'exploitation qui choisit de jouer sur les contrôles de fréquence et d'ajustement du voltage de la puce, mais bien le processeur lui même en fonction d'un paramètre définit en sortie d'usine : le TDP maximal admissible par la puce. Capable de calculer en permanence l'enveloppe thermique du processeur en fonction de son activité, l'unité PCU fera baisser la fréquence de fonctionnement d'un ou plusieurs coeurs si elle l'estime nécessaire afin de rester dans le TDP maximum fixé par le fondeur.

Agissant même sur la fonction Turbo, décrite quelques lignes plus loin, l'unité PCU peut sévèrement limiter les possibilités d'overclocking des processeurs Core i7. C'est pourquoi Intel autorise, depuis le BIOS, la modification du TDP maximum défini pour le processeur... mais seulement pour les modèles Extreme ! Si l'unité PCU peut être vue comme un frein à l'overclocking, c'est aussi un rouage de plus dans les mécanismes d'économie d'énergie mis au point par Intel, l'unité gérant les C-States.

Intel Core i7 : Apparition du mode Turbo

Depuis plusieurs années maintenant, Intel a pour habitude de proposer sur ces processeurs ce que l'on appelle les « T's », du nom de technologies spécifiques apparaissant de temps à autre avec tel ou tel nouveau modèle. Avec Nehalem, Intel nous propose l'Intel Turbo Boost Technology, une fonction héritée de la version mobile de Penryn et permettant d'ajuster à la hausse, et de manière automatique, la fréquence de fonctionnement du processeur, en agissant indépendamment sur le coefficient multiplicateur de chacun des coeurs, dans la limite de 2x133 MHz et toujours en se conformant au TDP maximal de la puce. Fonctionnant de manière transparente sur un laps de temps donné, l'Intel Turbo Boost Technology est opérationnel que les programmes en cours d'exécution utilisent un seul cœur ou bien les quatre cœurs. Naturellement, la technologie Turbo Boost Technology d'Intel peut être désactivée depuis le BIOS.

Intel Core i7 920, 940 et Core i7 965 Extreme Edition

Pour ce lancement, Intel propose trois processeurs Core i7 avec le Core i7 920, le Core i7 940 et le Core i7 965 Extreme Edition (nom de code Bloomfield). Tous les processeurs sont au format Socket LGA1366 et sont dotés de quatre cœurs avec technologie SMT et d'une mémoire cache de troisième niveau de 8 Mo. Gravés en 45nm, les processeurs Intel Core i7 se dotent de 731 millions de transistors et leur contrôleur mémoire DDR3 intégré se limite à la prise en charge de la DDR3-1066. Seul distinguo entre le Core i7 920 et le Core i7 940, la fréquence de fonctionnement fixée à 2,66 GHz pour le premier modèle et 2,93 GHz pour le second.

Le Core i7 Extreme Edition 965 est pour sa part cadencé à 3,2 GHz avec un lien QPI opérant à 6,4 GT/s (contre 4,8 GT/s pour les modèles i920 et i940). L'Intel Core i7 965 Extreme Edition profite du retrait de certaines limitations avec notamment la possibilité de modifier le TDP maximal. Comme sur tous les Extreme, le coefficient multiplicateur est déverrouillé alors qu'il est possible de régler la fréquence de la partie « Uncore » du Core i7 965 Extreme. Du reste, si sur le papier le Core i7 965 Extreme supporte au mieux la DDR3-1066, il est tout à fait à même de tirer profit de la DDR3-1333 ou 1600, grâce à ses coefficients débridés.

Côté TDP, les trois processeurs se partagent la même enveloppe thermique maximale à savoir 130 Watts. Cette valeur est certes plus importante que sur les Core 2 Duo mais il ne faut pas perdre de vue que le processeur intègre dorénavant le contrôleur mémoire, un élément que l'on retrouvait précédemment dans le chipset.

000000C801738172-photo-intel-core-i7-1.jpg
000000C801738174-photo-intel-core-i7-2.jpg

Processeur Intel Core i7


A noter un détail d'importance, l'ensemble des ventilateurs pour Socket LGA 775 n'est pas compatible avec la nouvelle plate-forme Nehalem. En effet, l'espacement des trous étant plus large sur les cartes mères il faudra trouver de nouveaux ventirads ou utiliser ceux fourni par Intel.

000000DC01731244-photo-intel-core-i7-920-cpu-z.jpg
000000DC01731246-photo-intel-core-i7-extreme-965-cpu-z.jpg

Processeurs Intel Core i7 920 et Core i7 965 Extreme Edition vus sous CPU-Z


Un nouveau chipset pour la plate-forme Core i7 : le X58

0000007801738160-photo-chipset-intel-x58-avec-ich10.jpg
Pour accompagner le lancement de ses nouveaux processeurs Core i7, Intel propose un nouveau chipset ultra haut de gamme, le X58. C'est pour l'heure le seul chipset à fonctionner avec les nouveaux processeurs Core i7. Dépourvu de contrôleur mémoire, ce rôle incombant dorénavant au processeur, le X58 est connecté au processeur via un lien Quick Path Interconnect alors qu'il conserve une architecture northbridge et southbridge. Le X58 est donc toujours composé de deux puces avec dans le northbridge ou IOH (Input Output Hub) toute la partie en charge du PCI-Express 2.0. Le contrôleur PCI-Express gère un total de 36 lignes soit la possibilité de gérer deux cartes graphiques PCI-Express 2.0 en 16x avec en prime 4 lignes restantes pour un éventuel connecteur PCI-Express 4x. Intel annonce un TDP de 20 Watts pour le northbridge du X58.

0000011301738112-photo-chipset-intel-x58.jpg

Gros plan sur l'IOH du X58


Côté southbridge en revanche il n'y a pas de nouveauté puisqu'on retrouve ce bon vieil ICH10, tout de même gravé en 65nm et connecté à l'IOH X58 par un lien DMI dont la bande passante est de 2 Go/s. Celui-ci intègre également un contrôleur PCI-Express, mais de première génération, avec six lignes disponibles, un contrôleur USB 2.0 pouvant gérer un total de 12 ports alors que la partie en charge du stockage est à même de piloter six connecteurs Serial-ATA de seconde génération tout en offrant une prise en charge RAID relativement complète : RAID 0, RAID 1, RAID 0+1 et même RAID 5 et RAID 10. Le composant ICH10 est en plus doté d'un contrôleur réseau intégré de classe Gigabit et du support de certaines technologies Intel plus utilisées dans le monde mobile comme l'Intel Turbo Memory.

0000014A01738170-photo-intel-x58-block-diagram.jpg

Diagramme des interconnexions du chipset Intel X58

Asus P6T Deluxe

0000004101661128-photo-logo-asus-noir-marg.jpg
Asus accompagne logiquement le lancement du Core i7 d'une série de cartes mères compatibles avec la nouvelle plate-forme Nehalem. Pour l'instant orientée haut de gamme, la plate-forme d'Intel s'articule autour du chipset X58 dont nous parlions précédemment. Pour cette présentation de Nehalem, nous avons reçu la P6T Deluxe d'Asus, une nouvelle carte mère au format ATX et au positionnement logiquement très haut de gamme. Adoptant le chipset Intel X58 avec southbridge ICH10R, la carte se dote fort logiquement du tout nouveau socket Intel, le LGA1366. Elle comporte un total de six bancs mémoire DDR3 et son alimentation est assurée par un connecteur ATX 24 broches et un double connecteur ATX 12 volts. Alors que la carte peut gérer jusqu'à 12 Go de mémoire DDR3, elle est compatible avec la DDR3 1066, la DDR 1333 et la DDR3 1600, ces dernières en mode overclocking et uniquement avec un processeur Extreme Edition.

Refroidie de manière passive, via un système de radiateurs interconnectés par caloducs (on notera que le logo Asus du radiateur du southbridge s'illumine à la mise sous tension), la P6T Deluxe embarque un total de six connecteurs Serial ATA de seconde génération alors qu'elle conserve un connecteur IDE. Les connecteurs d'extension sont variés avec deux ports PCI, un connecteur PCI-Express 4x assez mal situé puisqu'en face du radiateur du X58 ce qui empêchera l'installation de cartes semi-longues et trois connecteurs PCI-Express 2.0 16x. On notera que la carte mère est certifiée compatible avec les technologies NVIDIA SLI et ATI CrossFire. Attention, le troisième connecteur PCI-Express 16x est câblé sur 8x.

0000011801738328-photo-carte-m-re-asus-p6t-deluxe-2.jpg

Carte mère Asus P6T Deluxe


Du côté des fonctions avancées, la P6T Deluxe intègre un contrôleur Marvell 88SE6320 qui gère deux connecteurs SAS, ou Serial-Attached Storage, une variante professionnelle du Serial-ATA. Un contrôleur Marvell 88SE6111 a lui en charge la gestion de l'IDE et du eSATA alors qu'Asus a retenu un contrôleur VIA VT 6308P pour gérer le FireWire. Le réseau est ici piloté par des puces Marvell, encore, en l'occurrence des contrôleurs gigabit Ethernet référence 88E8056. Avec la possibilité de piloter jusqu'à 12 ports USB 2.0, la P6T Deluxe adopte quelques petits raffinements sympathiques comme la présence d'un bouton de mise en marche sur la carte mère et d'un bouton de remise à zéro, toujours très pratiques. Quant à la partie audio, Asus reste fidèle à Analog Devices, le fabricant ayant retenu une puce ADI2000B gérant le son sur 8 canaux avec prise en charge DTS Surround.

Asus ne serait pas Asus sans livrer tout une panoplie de gadgets et l'on retrouve dans la boîte de la P6T Deluxe un périphérique externe avec écran LCD. Hérité des cartes mères de la série Vista, l'OC Palm, comme Asus l'appelle dorénavant, n'a plus pour vocation d'afficher des gadgets à la mode Windows Sideshow. Non il s'agit cette fois d'un écran, relié en USB au système et fonctionnant uniquement une fois Windows démarré, vous permettant de régler les paramètres d'overclocking en temps réel et de contrôler les paramètres du système comme la température de certains composants, la vitesse de rotation des ventilateurs, etc. La fonctionnalité ExpressGate chère à Asus est également présente sur la P6T Deluxe même si Asus l'a rebaptisée ExpressGate SSD pour surfer sur la vague des SSD. La carte-mère comporte en effet une puce de mémoire flash sur laquelle est stockée un mini système d'exploitation Linux qui démarre ultra-rapidement et offre certaines fonctions bien pratiques comme un navigateur Internet ou encore la possibilité de converser avec ses amis via les clients de messagerie instantanée.

0000009101738326-photo-carte-m-re-asus-p6t-deluxe-1.jpg
0000009101738330-photo-carte-m-re-asus-p6t-deluxe-3.jpg
0000009101738154-photo-carte-m-re-asus-p6t-deluxe-5.jpg
0000009101738332-photo-carte-m-re-asus-p6t-deluxe-4.jpg

Détails de l'Asus P6T Deluxe


Terminons en évoquant la connectique extérieure de la carte mère. Celle-ci est assez fouillée avec un seul et unique port PS/2 bicolore qui pourra servir aussi bien pour le clavier que pour une souris. On dénombre 8 ports USB 2.0 sur la P6T Deluxe, deux connecteurs RJ45, un connecteur eSATA, un port FireWire, une rampe de six connecteurs audio au format miniJack et des sorties audio numériques, l'une optique, l'autre coaxiale.

Gigabyte GA-EX58-UD5P

Chez Gigabyte aussi on est prêt pour le Core i7 avec notamment la GA-EX58-UD5P, une carte mère haut de gamme sur chipset Intel X58. Au format ATX avec PCB bleu de type Ultra-Durable 3 avec huit couches s'il vous plait et embouts arrondis, la carte se dote d'une alimentation sur six phases chacune découplée avec un socket LGA 1366 et six connecteurs pour barrettes DDR3 aux couleurs pour le moins originales. Adoptant un système de refroidissement passif au design assez moderne, la carte voit son northbridge et son southbridge recouverts de radiateurs tout comme les étages d'alimentation. L'alimentation est ici constituée d'un connecteur ATX 24 broches et d'un connecteur ATX 2x 12 volts.

Avec deux ports PCI, l'EX58-UD5 se dote de trois ports PCI Express 16x, le troisième étant câblé sur 8x. Comme chez Asus, l'EX58-UD5 gère à la fois le Crossfire et la technologie SLI de NVIDIA, les deux en mode 3-Way. On trouve également un connecteur PCI-Express 4x ouvert et un connecteur PCI-Express 1x. Ce dernier est du reste inutilisable puisque le radiateur du northbridge barre tout simplement la route. Une erreur de design comme Gigabyte en a hélas l'habitude. Dotée d'un connecteur IDE et même d'un connecteur pour lecteur de disquettes, la carte est assez riche en matière de connectiques Serial-ATA avec six ports gérés par le chipset Intel et quatre ports gérés par une puce additionnelle. A noter que tous les connecteurs Serial-ATA sont positionnés en L.

0000011801738382-photo-carte-m-re-gigabyte-ga-ex58-ud5p-1.jpg
0000011801738384-photo-carte-m-re-gigabyte-ga-ex58-ud5p-2.jpg


Dotée de deux contrôleurs Gigabit Ethernet, des composants Realtek 8111D avec fonction de teaming, l'EX58-UD5 adopte un contrôleur FireWire signé Texas Instruments alors que la partie audio est à la charge d'une puce Realtek ALC889A. Cette dernière est compatible Dolby. Avec un afficheur à LED pour les codes de diagnostics, la carte comporte un bouton de mise en marche rapide, du reste situé assez bizarrement à proximité des emplacements pour barrettes mémoire. En sortie, l'EX58-UD5 offre deux ports PS/2, huit ports USB 2.0, deux connecteurs RJ45, un connecteur FireWire, une rampe de six jacks audio et deux sorties audios numériques l'une optique, l'autre coaxiale. On retrouve en prime un bouton de Clear CMOS, Gigabyte s'étant ici visiblement inspiré de la série de cartes mère ROG (Republic of gamers) d'Asus. Pour ce qui est des ventilateurs on pourra en connecter jusqu'à six, dont celui du processeur.

000000B401738386-photo-carte-m-re-gigabyte-ga-ex58-ud5p-3.jpg
000000B401738388-photo-carte-m-re-gigabyte-ga-ex58-ud5p-4.jpg
000000B401738402-photo-carte-m-re-gigabyte-ga-ex58-ud5p-5.jpg

Détails EX58-UD5

Intel DX58SO aka SmackOver

Fournie par Intel, la carte mère nous ayant servi de référence pour ces tests est la DX58SO alias SmackOver. Orientée haut de gamme, cette carte adopte un PCB noir aux embouts arrondis et utilise logiquement le chipset Intel X58. Son agencement est toutefois différent de celui des autres cartes mères X58 de ce dossier, les emplacements pour barrettes mémoires étant placées à l'horizontale au sommet du socket LGA1366 alors que le chipset X58 est situé à la droite du Socket. On notera le nombre restreint d'emplacements mémoire : seulement 4 slots DDR3 quand les autres cartes en comportent systématiquement 6. Refroidie de manière passive, la carte voit son northbridge ou IOH surmonté d'un radiateur métallique tout comme le southbridge et certains composants de l'étage d'alimentation. Tous les radiateurs sont de couleur bleue métallisée. Les connecteurs pour l'alimentation électrique du système sont standards avec un connecteur ATX 24 broches et un connecteur ATX 2x 12 volts. Celui-ci est du reste placé de manière originale, juste en dessous de la puce X58.

0000014A01738406-photo-carte-m-re-intel-dx58so-2.jpg


Dotée d'un seul port PCI, la DX58SO comporte deux ports PCI-Express 1x, deux connecteurs PCI-Express 16x et un connecteur PCI-Express 4x ouvert. Par ouvert, on entend qu'il est physiquement possible d'y installer une carte graphique PCI-Express 16x même si celle-ci opèrera en mode 4x. Pour stabiliser l'alimentation des slots PCI-Express, Intel dote sa SmackOver d'un connecteur Molex 12 volts alors que le fondeur semble plutôt pingre sur tout ce qui concerne le stockage. La carte est en effet dépourvue de prise en charge IDE et l'on dénombre seulement six ports Serial-ATA 3 Gb/s, des ports éparpillés un peu partout sur la tranche droite de la carte et dont certains seront inaccessibles une fois une carte graphique imposante installée.

Munie de cinq connecteurs pour ventilateurs, dont un réservé au processeur, la carte comporte un bouton de mise en route rapide et adopte quelques composants additionnels. On retrouve ainsi une puce Texas Instruments pour la gestion du FireWire ainsi qu'un contrôleur Marvell pour la gestion du eSATA. L'audio est ici gérée par une puce Realtek, type ALC889 alors que le réseau dépend évidemment d'un contrôleur Intel Gigabit. En sorti,e la carte se débarrasse de toute la connectique « legacy » : exit donc les ports PS/2, ports série et ports parallèle. On retrouve à la place huit ports USB 2.0, deux connecteurs eSATA, un port FireWire, une prise RJ45 et cinq connecteurs audios mini-jack avec en prime une sortie optique.

000000B901738404-photo-carte-m-re-intel-dx58so-1.jpg
000000B901738408-photo-carte-m-re-intel-dx58so-3.jpg
000000B901738410-photo-carte-m-re-intel-dx58so-4.jpg

Détails de la SmackOver d'Intel


Supportant la technologie de rendu multi processeurs graphiques d'AMD, le CrossFire, la carte ne prend pas en charge la technologie SLI de NVIDIA, Intel n'ayant pas l'intention de s'acquitter de la licence nécessaire. Livrée avec un ensemble de logiciel, la carte profite de l'Intel Desktop Control Center, un logiciel qui évolue d'année en année et dont l'interface de cette quatrième version est assez sympathique. On y retrouve diverses indications sur le statut du système : charge CPU, températures, fréquences de fonctionnement ainsi que la possibilité de modifier certains paramètres (activation de la technologie Turbo Boost, réglage du coefficient multiplicateur du processeur, etc). Reste un petit bug, en charge le logiciel nous indique une température de 22° C pour notre processeur ce qui est bien sûr impossible.

000000B401731222-photo-intel-nehalem-intel-desktop-control-center-1.jpg
000000B401731224-photo-intel-nehalem-intel-desktop-control-center-2.jpg

Logiciel Intel Desktop Control Center


Quant au BIOS, et bien qu'il s'agisse d'une carte mère Intel, il offre un certain nombre de paramétrages, de la fréquence de la mémoire au réglage indépendant des coefficients multiplicateurs par coeurs à la possibilité de modifier le TDP des processeurs Extreme Edition.

MSI Eclipse

MSI a lui aussi adopté le chipset X58 et la plate-forme Intel Core i7 pour concevoir de nouvelles cartes mères. Parmi celles-ci figure la MSI Eclipse, une carte haut de gamme avec deux couleurs phares : le noir et le bleu. Exit le PCB rouge usuel de MSI, et place à un PCB noir aux embouts arrondis. Avec un socket LGA 1366, la carte se dote de six emplacements mémoire DDR3. Son design semble plus aéré que celui de l'EX58-UD5 de Gigabyte, en partie à cause de la taille réduite du radiateur surplombant le southbridge. Refroidie de manière passive, la carte comporte un ensemble de trois radiateurs cuivrés, le plus imposant étant celui qui surplombe le northbridge. A noter que seuls les radiateurs du northbridge et du southbridge sont reliés entre eux par un double caloduc. Comme chez Asus, et contrairement à la SmackOver d'Intel, l'Eclipse adopte un système d'alimentation où il n'est pas utile de raccorder un double connecteur ATX 12 volts pour démarrer le système. On retrouve bien sûr l'habituel connecteur ATX 24 broches alors que l'étage d'alimentation est réparti sur six phases.

0000011801738336-photo-msi-eclipse-1.jpg


Offrant trois connecteurs PCI-Express 16x, le troisième opérant en mode 4x, la carte comporte deux connecteurs PCI-Express 1x et deux connecteurs PCI. Tous sont du reste exploitables y compris le connecteur 1x situé à proximité du radiateur du northbridge. A l'inverse des cartes Asus et Gigabyte, la carte mère MSI ne supporte que la technologie CrossFire d'AMD. Avec un connecteur IDE, mais pas de connecteur pour lecteur de disquettes (on ne s'en plaint pas), la carte se dote de six connecteurs Serial-ATA en L gérés par le chipset Intel et de quatre connecteurs supplémentaires qui dépendent d'un contrôleur JMicron. Avec une puce VIA assurant la prise en charge du FireWire, la carte comporte deux puces Realtek 8111C pour la gestion du réseau, de type Gigabit Ethernet. A la différence des autres cartes de ce comparatif, l'Eclipse ne comporte aucun contrôleur audio intégré. Et pour cause puisque MSI livre une carte fille PCI-Express 1x qui n'est en réalité qu'une Sound Blaster X-Fi Xtreme Audio avec prise en charge Dolby Digital EX.

000000F501738350-photo-msi-eclipse-8.jpg


En sortie, la carte offre huit ports USB 2.0, deux connecteurs PS/2, un connecteur FireWire, deux ports RJ45, deux connecteurs eSATA (dont le contrôle est assuré par une énième puce JMicron), et un bouton « Clear CMOS ».On ne trouve aucune connectique audio, puisque celle-ci est présente sur la carte fille livrée avec la carte mère. L'Eclipse offre sur son PCB divers boutons dont un bouton de mise en route, un bouton de « Reset » et un bouton baptisé D-LED 2. Celui-ci permet de changer la vue sur l'afficheur optionnel J-LED qui s'enfiche sur un connecteur propriétaire de la carte mère. On retrouve non loin de là un bloc DIP Switch qui permet de changer la fréquence de base du processeur, facilitant ainsi l'overclocking avec un mode 133 MHz, un mode 166 MHz et un mode 200 MHz. Au total, la carte comporte six connecteurs pour ventilateurs dont un dédié au processeur.

000000A001738340-photo-msi-eclipse-3.jpg
000000A001738342-photo-msi-eclipse-4.jpg
000000A001738344-photo-msi-eclipse-5.jpg
00310184-photo-ordinateur-de-bureau-dell-dimension-3100c.jpg
Nous arrivons maintenant à la partie essentielle de ce dossier, à savoir les tests de performance. Voici la configuration utilisée pour mesurer les performances du Core i7 :
  • Carte mère Intel DX58SO SmackOver,
  • 3x 1 Go mémoire DDR3-1066 Qimonda,
  • Disque SSD Intel X25 80 Go,
  • Carte graphique AMD Radeon HD 4870 X2
Sur cette plate-forme nous avons pu tester les processeurs Core i7 sous Windows Vista Edition Intégrale avec Service Pack 1. Les pilotes utilisés étaient les derniers disponibles avec notamment les CATALYST 8.10. Afin de comparer le Core i7 à l'offre précédente d'Intel nous avons eu recours à une seconde machine de test dont le détail figure ci-dessous :
  • Carte mère Asus P5E3 Premium (Chipst Intel X48 - BIOS 0605),
  • 3x 1 Go mémoire DDR3-1066 Qimonda,
  • Disque SSD Intel X25 80 Go,
  • Carte graphique AMD Radeon HD 4870 X2
Enfin, pour comparer l'offre d'Intel à celle de son concurrent de Sunnyvale, nous avons eu recours à la configuration suivante :
  • Carte mère Gigabyte MA790X-DS4 (BIOS F5C),
  • 3x 1 Go mémoire DDR2-1066 Corsair,
  • Disque SSD Intel X25 80 Go,
  • Carte graphique AMD Radeon HD 4870 X2
Sur toutes ces machines nous avons utilisé les mêmes logiciels, les mêmes pilotes et plus globalement les mêmes réglages y compris pour les temps de latence mémoire. Côté processeurs nous opposerons les Core i7 920, 940 et Core i7 965 Extreme Edition aux Core 2 Duo E8500, Core 2 Extreme Edition QX9770 et au Phenom 9850 Black Edition d'AMD. Nous en profiterons pour introduire de nouveaux tests dans notre panoplie avec notamment FarCry 2 et Sandra 2009.

Notez que sur tous les tests qui vont suivre, les fonctions HyperThreading et Turbo Boost des processeurs Core i7 étaient actives.

3DMark Vantage - Test processeur

01738454-photo-performances-intel-core-i7-3dmark-vantage.jpg

Premier utilitaire de notre série, le test processeur de 3DMark Vantage donne le Core i7 965 Extreme grand vainqueur. Si l'on en croit la dernière édition de l'outil de test de FutureMark, le nouveau processeur haut de gamme d'Intel est 60% plus rapide que le Core 2 Extreme QX9770 ! Face au Phenom l'écart est tel qu'il en devient indécent. On note la montée en puissance des performances du Core i7 920 au modèle 965 avec 9% de performances pour le Core i7 940 face au modèle i920 et 8% pour le Core i7 965 face au modèle 940.

Sandra 2009 - Test processeur

01738476-photo-performances-intel-core-i7-sandra-2009-cpu.jpg

On reste dans les outils synthétiques avec la dernière mouture 2009 de Sandra. Scindés en MFLOPS (millions de calculs en virgule flottante) et MIPS (millions d'instructions à la seconde), les résultats de Sandra donne les Core i7 largement gagnants. Le Core i7 965 Extreme affiche ici des performances 53% supérieures àl'ancienne puce haut de gamme d'Intel, le Core 2 Extreme QX9770, une puce cadencée à 3,2 GHz comme le Core i7 965.

Sandra 2009 - Test mémoire

01738478-photo-performances-intel-core-i7-sandra-2009-mem.jpg

Avec trois canaux mémoire disponibles, au lieu de deux, Core i7 est forcément largement en tête sur le test de bande passante mémoire de Sandra. Les Phenom et autres processeurs Core 2 sont ici bien dépassés.

PCMark 05 - v1.2.0 - Test Processeur

01738468-photo-performances-intel-core-i7-pcmark-cpu.jpg

Bien plus timoré que ces prédécesseurs, le test processeur de PCMark 05 remet quelque peu les pendules à l'heure. Notre Core i7 965 est ici à peine plus rapide que le Core 2 Extreme QX9770 alors que les Core i7 940 et 920 sont un peu en retrait. Reste que face au Phenom X4, la comparaison est toujours aussi douloureuse pour AMD, le dernier-né d'Intel étant juste 40% plus rapide.

PCMark 05 - v1.2.0 - Test mémoire

01738470-photo-performances-intel-core-i7-pcmark-m-moire.jpg

Si le test processeur de PCMark 05 n'a pas particulièrement apprécié les raffinements de Core i7, l'HyperThreading semblant ne servir à rien ici, le sous test mémoire est en revanche un plébiscite pour Core i7. Ici les nouveaux processeurs d'Intel sont en tête devant Phenom mais aussi devant le Core 2 Extreme QX9770, l'ancienne référence haut de gamme d'Intel. A en croire PCMark 05, les performances mémoire de Core i7, avec le modèle 965, sont 38% supérieures à celles du Core 2 Extreme QX9770.

ScienceMark 2.0 - Primordia

01738480-photo-performances-intel-core-i7-sciencemark-2.jpg

On referme cette première page de tests avec ScienceMark 2.0. Non multi-threadé, le logiciel ne profite que peu des améliorations introduites par l'architecture Nehalem. Si le Core i7 965 Extreme est en tête il le doit plus à sa fréquence de fonctionnement et à sa technologie TurboBoost qu'à l'HyperThreading ou une plus grande efficacité de l'architecture. On notera que les Core 2 Extreme QX9770, Core 2 Duo E8500 et Core i7 940 sont du reste à égalité. Face au Core 2 Extreme QX9770, le Core i965 Extreme est à peine 6% plus véloce.

Cinebench v10

01738458-photo-performances-intel-core-i7-cinebench.jpg

On démarre les tests applicatifs avec Cinebench qui évalue les performances d'un système en effectuant le rendu d'une scène 3D. En tête nous retrouvons notre Core i7 965 suivi logiquement des Core i7 940 et Core i7 920. Multithreadé l'application profite forcément de l'HyperThreading. Ainsi le Core i920 cadencé à 2,66 GHz se hisse devant le Core 2 Extreme QX9770 avec des performances 6% plus élevées. Comparé au Core 2 Extreme QX9770, le Core i7 965 est ici 27% plus rapide.

3DSMax 2008 - 1280*1024 - Radiosité

01738456-photo-performances-intel-core-i7-3dsmax.jpg

Attention : les résultats sont exprimés en seconde, la lecture du graphique est donc inversée. Sous 3DSMax 2008 nous mesurons le temps nécessaire pour que le système effectue le rendu d'une scène 3D complexe. En tête, les processeurs Core i7 profitent bien entendu de leur technologie HyperThreading. Quand il faut près de deux minutes à un Phenom pour effectuer le rendu de notre scène, le Core i7 965 se charge de la tâche en à peine plus d'une minute. Quant à la différence entre les Core i7 920, 940 et 965 elle est assez faible : à peine 20 secondes séparent le Core i7 920 du Core i7 965 Extreme.

Adobe Photoshop CS3

01738472-photo-performances-intel-core-i7-photoshop-cs3.jpg

Attention : les résultats sont exprimés en seconde, la lecture du graphique est donc inversée. Sous Photoshop CS3 nous modifions quelque peu notre test en utilisant une image source encore plus imposante sous la forme d'un fichier TIFF d'une résolution de 4288*2848. Nous mesurons, chronomètre en main, le temps nécessaire à l'application d'un filtre multi-threadé sur cette image. Le Core i7 965 Extreme est logiquement le processeur le plus rapide puisqu'il applique notre filtre en six secondes de moins que le Core 2 Extreme QX9770. Du reste, le Core i7 940 affiche de meilleures performances que le Core 2 Extreme QX 9770, alors que le Core i7 920 talonne ce dernier. Quand il faut une minute à Phenom ou à un Core 2 Duo E8500 (seule puce double coeur du test) pour appliquer le filtre, le meilleur des Core i7 fait le travail en 24 secondes.

Compression de fichiers - WinRAR 3.80

01738482-photo-performances-intel-core-i7-winrar.jpg

Attention : les résultats sont exprimés en seconde, la lecture du graphique est donc inversée. Avec WinRAR nous mesurons le temps nécessaire pour effectuer la compression de cinq volumineux fichiers. Les résultats plaident en faveur des processeurs Core i7 qui sont tous plus rapides que l'ancienne offre haut de gamme d'Intel. Les gains sont du reste appréciables puisque l'on effectue la même opération en 30 secondes de moins si l'on compare le Core 2 Extreme QX9770 au Core i7 940. Dans ces conditions, Phenom ne peut pas grand chose.

Encodage vidéo - TMPGEnc 4.5

01738484-photo-performances-intel-core-i7-tmpgenc.jpg

Attention : les résultats sont exprimés en seconde, la lecture du graphique est donc inversée. Nous mesurons ici le temps nécessaire pour effectuer la compression au format MPEG 2 d'une séquence vidéo au format AVI brut. Les résultats semblent calqués sur ceux de WinRAR avec des Core i7 largement en tête. Le Core i7 965 Extreme remouline notre vidéo en onze secondes de moins que le Core 2 Extreme QX9770. Onze secondes de grapiller, ce n'est certes pas grand chose dans l'absolu mais quand le temps de traitement est inférieur à une minute, il convient de relativier.

Pinnacle Studio 12.1

01738506-photo-performances-intel-core-i7-studio-12.jpg

Attention : les résultats sont exprimés en seconde, la lecture du graphique est donc inversée. Nous modifions quelque peu notre protocole de test habituel sous Studio en profitant du passage à la version 12 pour effectuer un rendu au format Blu-ray (AVC). Notre trio de processeurs Core i7 est le tiercé gagnant et même le Core i7 920 fait mieux que le Core 2 Extreme QX9770 : le rendu se fait en 41 secondes de moins ! Logiquement en revanche, les différences de temps de rendu entre chacun des processeurs Core i7 sont beaucoup plus ténues.

Mathematica 5.2

01738466-photo-performances-intel-core-i7-mathematica.jpg

On termine cette seconde page avec Mathematica. Application mathématique par excellence, Mathematica semble apprécier notre Core i7 965 qui est ici en tête avec des performances 22% supérieures au Core 2 Extreme QX9770. Ce dernier est du reste aussi rapide que le Core i7 920. Face à Phenom... l'écart est bien trop important, les processeurs Core i7 étant plus de deux fois plus rapides.

Call Of Duty 4 v1.7 - 1024x768x32

01738460-photo-performances-intel-core-i7-call-of-duty-4.jpg

Le dernier épisode en date du célèbre jeu de tir Call Of Duty, semble bien s'accommoder des processeurs Core i7, le Core i7 965 étant largement en tête, avec en seconde position le Core i7 940. Le Core 2 Extreme QX9770 ne désarme pas puisqu'il termine troisième à égalité avec le Core i7 920. Face au Core 2 Extreme QX9770, le Core i7 965 Extreme est 23% plus performant.

Far Cry 2 - 1024x768x32

01738464-photo-performances-intel-core-i7-farcry-2.jpg

Tout nouveau, tout beau, Far Cry 2 rejoint notre panoplie de test. Mais à l'inverse de Call Of Duty 4, les performances relevées sont nettement plus contrastées. Ainsi le Core i7 965 est ici à peine 2% supérieures au Core 2 Extreme QX9770 ! Ce dernier est d'ailleurs en tête face aux Core i7 940 et 920. Il semblerait que Far Cry 2 n'apprécie guère l'HyperThreading...

Crysis v1.2 - 1024x768x32 - Réglages Elevés

01738462-photo-performances-intel-core-i7-crysis.jpg

Quant à Crysis, il nous permet de tempérer quelque peu les observations formulées sous Far Cry 2. Si le Core i7 965 est bel et bien le processeur le plus rapide, son avantage n'est que de 10% sur le Core 2 Extreme QX9770. C'est bien mais loin des 30% de gain relevés dans les applicatifs sur les pages précédentes. Quant au Core i7 920 il fait jeu égal avec le Core 2 Duo E8500, un processeur pourtant muni de seulement deux coeurs. On le voit, sous les jeux la fréquence de fonctionnement compte encore énormément pour les performances, bien plus que le nombre de coeurs.

Quake Wars Enemy Territory - v1.5 - 1024x768x32

01738474-photo-performances-intel-core-i7-quake-wars.jpg

On termine avec Quake Wars Enemy Territory. Multi-threadé, Quake Wars, qui se base pour partie sur le moteur de l'auguste Doom 3, donne le Core i7 965 premier toute catégorie alors que les Core i7 940 et Core i7 920 suivent. Face au Core 2 Extreme QX9770, le Core i7 965 Extreme se montre 24% plus performant, à fréquence égale.

Tests d'architecture

Core i7 étrennant une toute nouvelle architecture, il nous a paru utile d'effectuer quelques tests de performances liés spécifiquement à certains détails de l'architecture en question. L'idée étant de vérifier les gains, ou même les pertes de performances, que peuvent engendrer certains choix opérés par Intel.

De l'importance de la fréquence du bus QPI

Principale différence entre les processeurs Core i7 920/940 et le Core i7 965, un lien QPI qui passe de 4,8 Gigatransfer/seconde à 6,4 Gigatransfer/seconde sur le processeur le plus évolué de l'offre Intel. Nous avons donc cherché à mettre en lumière l'impact sur les performances du débit du bus QPI en utilisant un Core i7 965 à 3,2 GHz, sans le mode turbo, en réglant d'abord le lien QPI à 4,8 GT/s dans le BIOS puis à 6,4 GT/s.

Cinebench 10

01738510-photo-intel-core-i7-test-qpi-cinebench.jpg

Comme on pouvait l'imaginer, à fréquence nominale constante, l'augmentation de débit du bus QPI n'impacte pour ainsi dire pas les performances. L'écart entre un bus QPI à 6,4GT/s et un bus QPI à 4,8 GT/s est inférieur à 1%.

3DMark Vantage - Test processeur

01738512-photo-intel-core-i7-test-qpi-3dmark-vantage.jpg

Même constat avec le test processeur de 3DMark Vantage : ici l'écart entre un bus QPI à 4,8 GT/s et un bus QPI à 6,4 GT/s n'est plus que de 0,6%. Insignifiant donc.

Impact du Turbo Boost Technology

Nouveauté des Core i7, la technologie Turbo Boost, censée augmenter automatiquement la fréquence du processeur lorsqu'une application l'utilise intensivement pour accélérer le traitement en cours, dans la limite de l'enveloppe thermique maximale. Pour ces tests nous utilisons un Core i7 920 où nous activons puis désactivons depuis le BIOS la technologie Turbo Boost.

ScienceMark 2 - Primordia

01738534-photo-intel-core-i7-test-architecture-turboboost-sciencemark.jpg

Sous ScienceMark 2, test mono-threadé, l'activation du Turbo Boost offre un gain de performances de 8%.

Quake Wars Enemy Territory - v1.5 - 1024x768x32

01738536-photo-intel-core-i7-test-architecture-turboboost-quake-wars.jpg

Quake Wars Enemy Territory confirme le gain de performances observé sous ScienceMark avec des performances 9% supérieures lorsque la technologie Turbo Boost est active.

Far Cry 2 - 1024x768x32

01738538-photo-intel-core-i7-test-architecture-turboboost-far-cry-2.jpg

Petite fausse note... Far Cry 2 ne tire pas de bénéfice de la technologie Turbo Boost d'Intel, les performances du jeu étant identiques que cette fonction soit active... ou non !

Quel impact pour l'HyperThreading ?

Le fait qu'Intel réintroduise sa technologie HyperThreading sur ses nouveaux processeurs soulève quelques questions notamment sur son efficacité. Aussi nous avons testé le Core i7 965 Extreme avec et sans la technologie HyperThreading :

3DMark Vantage - Test processeur

01738562-photo-intel-core-i7-test-architecture-ht-3dmark-vantage.jpg

Pour le test processeur de 3DMark Vantage, les bénéfices de l'HyperThreading sont évidents : les performances bondissent de 35% une fois l'HyperThreading activé. Comportement que l'on retrouvera avec la plupart des applications multi-threadées.

Call Of Duty 4 v1.7 - 1024x768x32

01738560-photo-intel-core-i7-test-architecture-ht-cod-4.jpg

Histoire d'être complet, il nous fallait naturellement vérifier l'impact de l'HyperThreading avec les jeux. Call Of Duty 4 est très clair à ce sujet : la désactivation de l'HyperThreading augmente les performances de plus de 4% !

Studio 12.1

01738630-photo-intel-core-i7-test-architecture-ht-studio-12.jpg

Résumer l'HyperThreading a un test synthétique et à un jeu nous semblait un peu réducteur. Aussi nous avons procédé à la compression de notre projet de référence sous Studio 12.1 avec et sans HyperThreading. Résultat, l'activation de l'HyperThreading permet d'effectuer le rendu de notre Blu-ray avec 25 secondes de moins que sans HyperThreading.

DDR3 : Double ou triple canal ?

Le contrôleur mémoire intégré du Core i7 peut fonctionner avec deux barrettes mémoire, en mode double canal donc, mais aussi avec trois barrettes selon le nouveau mode triple canal. Nous avons cherché à savoir quelle différence de performances provoquant le passage du double au triple canal avec notre Core i7 965.

Cinebench 10

01738564-photo-intel-core-i7-test-architecture-ddr3-cinebench.jpg

Pour Cinebench l'apport de bande passante mémoire se ressent sur le score final mais assez peu, avec un gain de seulement 1,3% en mode triple canal.

Crysis v1.2 - 1024x768x32 - Réglages Elevés

01738566-photo-intel-core-i7-test-architecture-ddr3-crysis.jpg

Crysis semble du même avis que Cinebench. Le passage à trois barrettes mémoire augmente certes les performances mais de façon très limitée. Entre un Core i7 965 avec deux barrettes DDR3 et le même processeur avec trois barrettes de DDR3, le gain enregistré sous Crysis est de 2,2%.

Overclocking

Avant de refermer définitivement ce dossier avec la conclusion, nous avons bien entendu chercher à évaluer le potentiel en overclocking des nouveaux processeurs Core i7 d'Intel. Pour cela, nous avons employé le Core i7 920, un processeur qui dispose de plusieurs verrous, pour justement voir en quoi les nouveaux systèmes de contrôle du TDP mis en place par Intel peuvent s'avérer handicapant (ou non) pour l'overclocking. Côte plate-forme, notre choix s'est arrêté sur la carte mère P6T Deluxe d'Asus avec le dernier BIOS.

Bonne nouvelle, au prix de quelques manipulations assez simples, nous avons pu changer la fréquence système de référence influant ainsi directement sur la fréquence du processeur. Alors que le Core i7 920 est cadencé à 2,66 GHz, nous avons réussi à le faire fonctionner à 3,3 GHz puis à 4 GHz en faisant passer la fréquence de référence de 133 MHz à 200 MHz. A 4 GHz, le système était stable, et Windows Vista démarrait sans encombre, alors même que nous n'avons pas touché à la tension d'alimentation du CPU. Au delà, de 200 MHz, en revanche ce fut l'écran noir.

000000DC01738266-photo-intel-core-i7-920-oc-4-ghz.jpg

Overclocker un Core i7 ? C'est possible !


L'overclocking du Core i965 Extreme semble en revanche plus délicat. Certes le coefficient multiplicateur de ce processeur est débloqué, certes la fréquence du lien QPI est déverouillée, certes encore la fréquence de la partie « Uncore » est paramétrable. Mais cela commence à faire beaucoup de paramètres à gérer ou à modifier alors que notre Asus P6T Deluxe nous a donné bien du fil à retordre. Impossible en effet de dépasser les 166 MHz de fréquence de base pour le bus système. Vu qu'avec le Core i7 920 nous avons atteint sans problème les 200 MHz de fréquence pour le bus système, nos soucis avec le Core i7 965 semblent plutôt provenir du BIOS de la carte Asus qui n'est pas encore tout à fait au point.

Consommation

La consommation électrique des composants électroniques étant devenue depuis quelques années déjà un critère déterminant, nous avons mesuré et comparé la consommation électrique de nos différents processeurs en pleine charge. Pour cela nous avons recours à une pince ampèremétrique dans laquelle nous faisons passer les câbles positifs de l'alimentation ATX 12 volts dédiée au processeur. Pour le relevé, nous exécutions autant d'instance de Prime 95 qu'il y a de coeurs afin de charger au maximum le processeur.

 Consommation CPU
Core 2 Duo E850055,2 Watts
Core i7 920103,2 Watts
Core i7 940115,2 Watts
Core 2 Extreme QX9770105,6 Watts
Core i7 965 Extreme124,8 Watts
Phenom X4 9850156 Watts


Le constat est frappant, en pleine charge Core i7 consomme sans vergogne.Si le Core i7 965 consomme 20 watts de plus que le Core 2 Extreme QX9770, les modèles Core i7 920 et 940 sont eux plus raisonnables avec une consommation maximale dans l'ordre de la centaine de watts. Dans tous les cas, on reste loin de la consommation électrique record du Phenom X4.

Conclusion

Plus de vingt quatre mois après la sortie en grande pompe des Core 2 Duo, des processeurs unanimement plébiscités, Intel renouvelle son offre avec la sortie des Core i7. Etrennant une toute nouvelle architecture qui regroupe pour la première fois chez le fondeur quatre cœurs sur le même morceau de silicium, les Core i7 se veulent modulaires et devraient être déclinés dans les mois à venir sur le segment de la mobilité, dans le monde du serveur mais aussi sur le marché des PC de bureau avec des variantes à moindre coût.

Pour donner une descendance digne de ce nom au Core 2 Duo, Intel n'est cependant pas reparti d'une feuille blanche. Avec Nehalem, l'architecture déployée au sein des Core i7, la firme de Santa-Clara a préféré capitaliser sur des valeurs sûres, en améliorant tout ce qui pouvait l'être. Ainsi le moteur d'exécution des Core 2 Duo et autres Core 2 Quad a été discrètement remanié, par petites touches, mais avec toujours en tête l'idée d'augmenter le rendement de l'architecture et son adéquation aux programmes d'aujourd'hui. De l'agencement de la mémoire cache, aux diverses mémoires tampons, en passant par certaines unités stratégiques comme celles en charge des prédictions de branchement, tout à été revu, corrigé et généralement amélioré.

En parallèle, les ingénieurs d'Intel ont remis à niveau la puce pour se débarrasser de certains héritages devenus pour le moins encombrants. C'est ainsi que le FSB ou Front Side Bus est mort, et on ne s'en plaindra pas : vive le QPI ! Dans la même veine, Intel emboîte (enfin ?) le pas à AMD pour intégrer dans son processeur un contrôleur mémoire, histoire de réduire les temps de latence et d'améliorer encore les performances. Zélé, Intel en profite même pour inaugurer le concept du triple canal en associant trois canaux DDR3 et non plus deux ; ce qui au final ne bouleverse pas tellement les performances applicatives. Et surprise... l'HyperThreading des Pentium 4 signe avec Core i7 son grand retour. Qui plus est avec Nehalem, Intel en profite pour définir une toute nouvelle plate-forme architecturée autour du Socket LGA 1366 et du chipset Intel X58. Certes le changement de Socket n'est pas forcément bienvenu mais depuis le temps que le Socket LGA775 rôde, Intel est presque pardonné sur ce point.

0000010401738166-photo-intel-core-i7-wafer-nehalem-2.jpg


Quant au processeur, ses performances sont tout simplement excellentes, avec des gains assez fréquents de l'ordre de 30% face à la précédente offre d'Intel. Pourtant, Core i7 n'est pas exempt de défauts. Ainsi, le contrôleur mémoire DDR3 intégré se limite étrangement au support de la DDR3-1066 alors que la précédente plate-forme d'Intel gérait la DDR3-1600 ! Autre regret, certains choix architecturaux, et plus particulièrement le come back de l'HyperThreading ont des résultats variés notamment dans les jeux même si côté applicatif, l'HyperThreading fait toujours un carton. L'overclocking est pour sa part toujours d'actualité, contrairement à ce que laissaient redouter les rumeurs, même si sa pratique diffère de ce que nous connaissions jusqu'alors chez Intel. De plus, l'introduction d'une PCU qui régule la fréquence de fonctionnement du processeur en fonction de son TDP n'est pas franchement une bonne nouvelle puisqu'elle créée une nouvelle segmentation dont on se serait bien passé alors qu'elle rend la pérennité d'un overclocking plus aléatoire sur les Core i7 non extreme. Quant aux 730 millions de transistors des processeurs Core i7, ils ont tout de même tendance à s'échauffer et à consommer, malgré tous les efforts d'Intel en la matière. Vivement le passage au 32 nm !

Du côté de la tarification, nous avons quelques interrogations... car d'un modèle de Core i7 à l'autre le prix double alors que la fréquence n'augmente que très légèrement ! Ainsi quand le Core i7 920 est annoncé autour des 280 euros, le modèle 940 est proposé à 550 euros pour seulement 266 MHz de plus... Le tarif du modèle 965 Extreme étant toujours aussi extrême à plus ou moins mille euros pièce. On retiendra toutefois qu'avec le Core i7 920, Intel propose les performances du Core 2 Extreme QX9770, un processeur facturé 1000 euros, dans une puce commercialisée un peu moins de 300 euros. Et puisque l'on parle finance, n'oublions pas le coût de la plate-forme, les premières cartes mères à base de chipset Intel X58 étant plutôt onéreuses : comptez environ 250 euros !

Mais finalement, à l'heure où nous écrivons ces lignes, et malgré les défauts précédemment énumérés, Core i7 reste le meilleur processeur du moment, tout simplement. A tel point d'ailleurs que la comparaison avec l'offre d'AMD laisse sceptique : le challenger d'Intel arrivera-t-il à rattraper tant de retard ?

Intel Core i7 920

8

Les plus

  • Design quadri-coeurs natif
  • Bonnes performances
  • Nouveau bus QPI

Les moins

  • HyperThreading dans les jeux
  • DDR3 limitée à 1066 !

0

Performances9

Innovation8

Qualité/prix8



Intel Core i7 965 Extreme

6

Les plus

  • Design quadri-coeurs natif
  • Aucune limitation (TDP, ratio)
  • Nouveau bus QPI

Les moins

  • HyperThreading dans les jeux
  • Prix astronomique

0

Performances9

Fonctionnalités8

Qualité/prix6



  • Venez discuter de ce dossier dans le forum
Haut de page