Qualcomm veut s’imposer durablement sur le marché du PC, du laptop au desktop. Pour y parvenir, le géant mise sur le processeur Snapdragon X2 Elite. Segmentation, architecture, ambitions… Nous avons ouvert le capot pour voir ce que cette nouvelle puce a dans le ventre.

Chez Clubic, lorsqu'il est question de CPU, nous avons l'habitude de parler d'AMD ou d'Intel. Justement, Qualcomm entend les bouleverser ces habitudes. Et après le Snapdragon X Elite lancé en 2024 sous l'impulsion de Microsoft et de son IA Copilot, la marque revient à la charge avec le Snapdragon X2 Elite, fort des premiers retours d'expérience accumulés dans l'environnement Windows.
Snapdragon reste une architecture « monolithique »
À la manière de ses principales concurrentes, Qualcomm propose une vaste gamme de processeurs à ses partenaires afin de toucher un public aussi large que possible. Le Snapdragon X2 Plus est le petit dernier de la gamme, officialisé simplement lors du dernier CES de Las Vegas alors que les X2 Elite et X2 Elite Extreme ont été présentés dès le mois de novembre. C'est sur cette doublette que nous nous focalisons ici, la version X2 Plus étant surtout marquée par une réduction des caractéristiques des deux grands frères (voir encadré).

40 ans d'histoire Qualcomm, mais beaucoup moins pour Snapdragon. ©Qualcomm
En premier lieu, il faut bien comprendre que l'architecture adoptée par Qualcomm diffère nettement de ce que peuvent proposer AMD et Intel. Les Snapdragon sont des processeurs dits ARM et les X2 Elite/Elite Extreme ne dérogent pas à cette règle. De fait, ils reposent sur un environnement logiciel différent, en mesure de s'adapter à cette spécificité : c'est la raison pour laquelle, en 2024, Qualcomm a dévoilé les Snapdragon X Elite en parallèle de l'annonce Copilot+ de Microsoft, cela venait s'ajouter à une nouvelle version, ARM, de Windows.
Par ailleurs, même sur un plan technique, Qualcomm se distingue des deux concurrentes que nous connaissons bien, AMD et Intel. AMD a été le première à se tourner vers une organisation « chiplet » de ses processeurs et Intel lui a emboîté le pas avec les générations Arrow Lake/Nova Lake. L'idée est de déstructurer le processeur pour aboutir à des tuiles distinctes les unes des autres : la tuile CPU peut ainsi être produite via un nœud de gravure différent de la tuile GPU par exemple. Qualcomm reste « sage » et continue à adopter une conception monolithique de ses puces.
Une telle conception découle des habitudes de Qualcomm dans la mobilité et les smartphones, mais ne l’empêche pas de proposer plusieurs variantes de ses puces : le X2 Elite Extreme X2E-96-100 est doté de 18 cœurs et il en va de même pour le X2 Elite X2E-88-100 alors que le X2 Elite XE2-80-100 se contente de 12 cœurs. Enfin, le X2 Plus X2P-64-100 est doté de 10 cœurs et le X2 Plus X2P-42-100 doit se contenter de 6 cœurs. Le cache associé, les fréquences et le GPU Adreno peuvent également être modifiés selon les références, mais le NPU ou accélérateur IA reste à chaque fois le même (80 TOPS de puissance).
La partie CPU : les cœurs Oryon
Si le terme d'Oryon reste celui retenu par Qualcomm pour la partie CPU des Snapdragon X2 Elite et Elite Extreme (X2E), il s'agit en réalité déjà de la troisième génération d'Oryon. La microarchitecture repose toujours sur l'association de cœurs dits Prime et de cœurs dits Performants. Attention, cette dénomination peut prêter à confusion : les plus puissants sont bien les Prime, mais Qualcomm ne voulant pas que ses autres cœurs semblent « faiblards », ils sont donc « performants ».
La conception des Snapdragon X2E repose donc sur deux clusters de cœurs Prime : chaque cluster est ainsi doté de six cœurs auxquels est associé un bloc de cache de second niveau partagé de 16 Mo. Chaque cluster intègre aussi une unité matricielle (Matrix Engine). Qualcomm donne ces clusters pour un maximum de 5 GHz en boost alors que la fréquence de base est calée à 4,4 GHz. Il nous a été précisé qu'un seul cœur peut accélérer jusqu'à 5 GHz par cluster (donc deux en même temps sur l'ensemble du CPU) : en revanche, pas question de choisir un cœur spécifique, ils sont tous individuellement éligibles à cette fréquence maximale.
Une fois n'est pas coutume, Qualcomm n'a pas botté en touche au moment de parler de la prédiction de branchement, un élément clé des processeurs modernes, mais peu abordé par les marques. Il s'agit d'anticiper les données réellement envoyées aux cœurs afin d'être traitées et si vous n'êtes pas familier avec la chose, le mieux est encore de consulter la vidéo signée Branch Education et qui revient sur la chaîne Fetch – Decode – Execute – Memory – Writeback, au cœur du fonctionnement du CPU. L'étape fetch est dotée d'un cache de 192 Ko sur 6 voies, soit trois de plus que sur un Panther Lake d'Intel.
Un « étage » de décodage sur neuf voies. ©Qualcomm
Ensuite, la prédiction de branchement intervient en trois segments avec, schématiquement, le Branch Target Buffer qui travaille en un cycle, le Conditionnal Branch Predictor sur deux cycles et l'Indirect Branch Predictor lui aussi en deux cycles. Enfin, il est bon de souligner que le CPU doit faire avec une « pause » de 13 cycles en cas d'erreur : il s'agit là de la latence incompressible pour vider l'ensemble du pipeline de prédiction de branchement. Rien de dramatique cependant et les puces AMD ou Intel sont plus ou moins logées à la même enseigne.
Les parties dédiées aux calculs et aux calculs flottants. ©Qualcomm
Enfin, la partie decode du CPU peut alors intervenir et se charger de travailler sur les instructions ainsi obtenues. Qualcomm évoque ici la présence de neuf unités de décodage travaillant en parallèle pour aboutir à un traitement plus rapide avant transmission au back-end.
À ce niveau, une large part du travail repose sur ce que l’on appelle le scheduler. Son objectif est – les anglophones l'auront compris – d'organiser les tâches avec la possibilité de gérer plus de 400 registres physiques entiers et plus de 400 registres vectoriels. Après l'étape du register, il faut passer au dispatch et, là, on parle d'un total de 14 reservation stations partagées en 6 pour les calculs entiers, 4 pour le vectoriel et encore 4 pour la mémoire. Qualcomm détaille ensuite les pipelines entiers et vectoriels, mais cela devient un peu trop complexe pour vous en rendre compte de manière claire.
Notons tout de même que sur la partie vectorielle/flottante, Qualcomm semble avoir un petit train de retard sur ses concurrentes AMD et Intel. En effet, l'Oryon des Snapdragon X2E se repose sur 4 pipes de 128-bit chacun : c'est certes deux fois plus « large » qu'Intel et son AVX2 (256-bit), mais c'est au même niveau qu'AMD avec l'AVX-512 (512-bit). Rien d'extraordinaire donc. Plus original en revanche, surtout pour un CPU ARM, Qualcomm évoque ici l'Armv9 comme pour insister sur le fait qu'elle se veut aussi moderne que possible.
Plus discret, le cluster de cœurs performants n'en est pas moins important. ©Qualcomm
Enfin, il ne faut pas oublier qu'à côté des clusters de cœurs Prime, le Snapdragon X2E intègre des cœurs Performants. Ici, les choses sont évidemment moins ambitieuses, mais on parle encore d'un cluster de six cœurs Performants au sein duquel figurent tout de même 12 Mo de cache L2 partagé. Les cœurs performants sont plus petits que les Prime et, logiquement, moins énergivores, mais ils profitent toujours du Qualcomm Matrix Engine. Notons que la fréquence de ces cœurs Performants est en revanche sensiblement plus faible : 3,6 GHz de base et aucune mention de boost.
Encadré : les X2 Plus pour compléter la gamme
Avant d'embrayer sur la suite de la plongée technologique dans l'architecture X2 de Qualcomm, faisons un aparté pour évoquer le cas des X2 Plus annoncés au dernier CES pour compléter la gamme. Deux références sont prévues par Qualcomm : le X2P-64-100 doté de 10 cœurs CPU et le X2P-42-100 avec « seulement » 6 cœurs CPU.
Nous n'entrons pas davantage dans les détails techniques de ces puces car il ne s'agit que de dérivés des X2 Elite et X2 Elite Extreme. À côté de la partie CPU Oryon, Qualcomm conserve effectivement les mêmes parties GPU Adreno et NPU Hexagon, jouant juste sur les fréquences de fonctionnement. La prise en charge mémoire est également identique : de la LPDDR5x jusqu'à 9523 MT/s.
La partie GPU : Adreno X2 au rapport
Chez AMD ou Intel, on parlerait de « tuile GPU », mais ce n'est donc pas le cas avec un Snapdragon monolithique. La partie GPU se nomme toujours Adreno, mais elle est suivie d'un « X2 » bien sûr là pour marquer son évolution. Pour la petite histoire, saviez-vous que Adreno est une anagramme de Radeon et que ce n'est pas le fruit du hasard ? Il s'agit d'un clin d'œil d'ingénieurs débauchés chez AMD par Qualcomm.
Sur un Snapdragon X2E, Adreno X2 occupe un espace important, à peu de chose près un cinquième de la surface de la puce. Cette solution est annoncée par Qualcomm comme capable d'offrir des performances jusqu'à 2,3x plus élevées que la précédente génération tout en offrant une efficacité énergétique jusqu'à 125% supérieure. Des chiffres flatteurs qui vont dans le bon sens pour Qualcomm, mais qui ne doivent pas faire oublier la notion clé : la scalability.
Le principe des slices, garant de la scalability de l'architecture Snapdragon X2. ©Qualcomm
Derrière ce terme se cache la capacité d'une architecture à évoluer en fonction des besoins, des objectifs recherchés : c'est d'autant plus important, bien sûr, que Qualcomm vise des marchés très différents avec ses puces Snapdragon X2E – des laptops autant que des machines desktop – et, pour y parvenir, Qualcomm a opté pour une organisation en « slices » qui constitue ce que l'on peut appeler la plus petite unité du GPU Adreno X2.
Ces slices sont au nombre de quatre au sein du GPU Adreno X2 des Snapdragon X2E. Elles peuvent ainsi afficher un impressionnant 2 048 unités FP32 et 128 texels par cycle. Si on décompose tout cela, une slice est donc dotée de 512 unités FP32 alors qu'elle contient également 1 024 unités FP16. On parle aussi d'un module de rendu front-end lequel est capable d'un triangle par cycle, soit quatre au total sur l'ensemble de la partie GPU du Snapdragon XE2.
DirectX 12.2 Ultimate et ray tracing sont évidemment à l'honneur. ©Qualcomm
Côté cache, il est intéressant de noter que Qualcomm multiplie les kiloctets : il est ainsi question de 128 Ko de cache cluster par slice et d'un cache de second niveau unifié, donc partagé entre les slices, de 2 Mo. Qualcomm souligne à ce niveau que son GPU Adreno X2 est capable de communiquer avec une bande passante de « jusqu'à 228 Go/s » avec la mémoire vive du système qui, bien sûr, est la même avec laquelle communique Oryon : de la LPDDR5x-9523, dans le meilleur des cas.
Histoire de rendre les choses toujours plus complexes à comparer entre les concepteurs de puces, Qualcomm adopte aussi le terme de « shader processors » : AMD le fait déjà, mais pour décrire une réalité différente. Il est ici question de deux SP par slice qui, comme vous pouvez le voir sur les schémas de la puce, se décomposent ensuite en 2 µSP. Ils peuvent travailler séparément ou fonctionner en paires. À proximité, on remarque aussi la présence d'unités dédiées au ray tracing… Comment pouvait-il en être autrement ?
Enfin, notons la présence de modules un peu plus étonnants. En effet, avec Adreno X2, Qualcomm intègre ce qu'elle appelle l'AHPM ou Adreno High Performance Memory. Il s'agit d'une mémoire de 21 Mo au total (5,25 Mo par slice) qui agit comme une espèce de cache, mais qui reste disponible de manière indépendante pour les développeurs, avec une bande passante de 4 To/s. Autant d'éléments qui doivent bien sûr booster les performances graphiques.
Qualcomm insiste ici sur son avantage compétitif côté GPU. ©Qualcomm
Il faudra évidemment aller au-delà des seules informations officielles publiées par Qualcomm, mais les promesses sont là : sur un Snapdragon X2 Elite Extreme, on devrait pouvoir flirter avec les 60 images par seconde (ips) en 1 080p détails moyens sans technologie annexe sur des jeux comme Cyberpunk 2077 ou Red Dead Redemption 2. Moins gourmands, des titres comme Fortnite ou Overwatch 2 devraient dans les mêmes conditions dépasser les 110, voire les 120 ips.
La partie NPU : Hexagon et ses 80 TOPS
Forcément. Qualcomm ne pouvait présenter sa nouvelle architecture sans faire un point sur l'intelligence artificielle et, donc, sur l'intégration de son Neural Processing Unit ou NPU, un module devenu clé pour répondre aux sollicitations des usagers. En l'occurrence, le NPU est ici baptisé Hexagon et doit offrir une réserve de puissance assez remarquable : pensez que Qualcomm n'annonce rien de moins que 80 TOPS pour cette seule entité Hexagon.
Une valeur à tempérer tout de même, car il s'agit encore d'un « jusqu'à… ». Pour vous donner une idée, ces NPU autoriseraient une performance « jusqu'à 78% » supérieure à la précédente génération de puces Snapdragon tout en étant plus efficaces en consommation électrique. Pour introduire sa « révolution », Qualcomm a d'abord mis un peu de contexte : avant d'être un NPU, Hexagon était un DSP en charge d'appliquer des filtres audios. Il a ensuite évolué vers un processeur avant de devenir NPU à partir de 2019.
D'abord « simple DSP », Hexagon s'est mué en NPU très complexe. ©Qualcomm
Plusieurs variantes ont été tentées par Qualcomm avant d'aboutir à ce qu'elle nomme le NPU 6. Il se partage en trois parties : unité scalaire, unité vectorielle et unité matricielle. Un cache sur plusieurs niveaux est ainsi associé aux deux premières avec du L1 – oui, comme sur un CPU – pour la partie scalaire et du L2 accessible pour les scalaire et vectorielle. Cette dernière unité accède aussi à une mémoire TCM (Tightly Couple Memory) qui agit comme un buffer partagé avec l'unité matricielle.
Comme on peut le voir sur les diapositives diffusées, la partie scalaire du NPU dispose de 12 threads qu'elle gère en SMT (Simultaneous Multi-Threading) afin de réduire la latence. On parle aussi d'un prédicteur de branches sur le NPU Hexagon. Oui, là encore comme sur un CPU. Au niveau de l'unité vectorielle, il est question de 8 threads avec prise en charge des précisions INT8 et FP16, mais aussi FP8 et BF16 avec un gain, annoncé, de 143% par rapport à la génération précédente (pas de « jusqu'à… » ici ?).
Qualcomm clame haut et fort que son NPU est, de loin, le meilleur. ©Qualcomm
En « fin de parcours », Qualcomm présente son unité matricielle qui profite elle aussi de la prise en charge des FP8 et BF16. En revanche, les performances sont moins impressionnantes : on parle tout de même de +78% par rapport à ce que pouvait offrir la génération précédente, soit 45 TOPS sur Snapdragon X Elite face aux 80 TOPS de Snapdragon X2 Elite Extreme. Plus important, cela se fait avec une meilleure efficacité énergétique : à iso-puissance (5 watts), les performances prennent un facteur 1,6.
Sensing Hub : un mini-SoC ultra-basse consommation
Alors que tout le monde ou presque a CPU, GPU et NPU en tête quand on parle de processeurs, Qualcomm ne s'est pas contentée de ce trio pour son tech deep dive… et cela a son importance. En effet, à côté de ces trois éléments, la marque a imaginé un duo conçu pour la consommation électrique la plus faible possible. Always on subsystem et Sensing Hub sont le cœur de ce fonctionnement à très faible empreinte électrique, épine dorsale du Snapdragon X2E.
Always on subsystem et Sensing Sub : outils de l'ultra-basse consommation. ©Qualcomm
Il est d'ailleurs amusant de constater combien le Sensing Hub peut ressembler à une sorte de mini-SoC au sein du SoC. Cependant, avant ce hub, il faut parler de l'Always on subsystem lequel n'est jamais coupé, même sur les divers niveaux de veille. Il agit justement comme un moyen de réveiller le reste de la puce en fonction des besoins et il a la main sur tout ce qui est gestion des fréquences ou des tensions de fonctionnement avec la possibilité d'accélérer les transitions entre les différents états de la machine.
Le Sensing Hub n'est pour sa part pas tout le temps « éveillé », mais ses modules distincts permettent de n'activer que le nécessaire à un instant T. De fait, au contraire de ce qui existe sur la tuile ultra-basse consommation d'Intel avec l'architecture Lunar Lake, pas de cœurs CPU ici. Non, Qualcomm voit le Sensing Hub comme un module capable de contrôler les autres unités pour, par exemple, exploiter le Wi-Fi sans faire intervenir la partie CPU Oryon, bien plus énergivore.
De manière plus directement pratique, le Sensing Hub est par exemple en mesure de réveiller la machine après utilisation de la reconnaissance faciale pour identifier l'usager. Deux petites unités dites eNPU sont ainsi présentes aux côtés d'un module de gestion de la voix et de capteurs divers afin de rendre ce hub aussi polyvalent que possible. Mieux, les eNPU pourront compter sur la présence d'un petit « last level cache » pour travailler plus efficacement.
Spectra ISP apporte le meilleur des capteurs smartphones à nos laptops. ©Qualcomm
Enfin, moins clinquantes, mais malgré tout clés pour le fonctionnement d'un Snapdragon, plusieurs unités complètent les puces X2E. Le Spectra ISP (pour Image Signal Processor) se charge de tout ce qui est gestion des caméras : c'est indispensable sur smartphone. Son expérience du mobile permet à Qualcomm de soigner les choses avec deux caméras 36 mégapixels, un module 64 Mpx ZSL (pour Zero Shutter Lag) et la prise en charge d'un mode slow motion à 120 images par seconde, en Full HD cependant.
Jusqu'à quatre capteurs peuvent être employés avec deux en IFE (ou Image Front End) et deux en IFE-Lite, des modules évidemment moins costauds. Il est intéressant de noter que la gestion des capteurs se fait avec force technologies modernes et Qualcomm parle HDR, réduction de bruit et flou d'arrière-plan. Certains de ces termes se retrouvent sur l'Adreno VPU (ou Video Processing Unit) qui profite de la prise en charge HDR 10-bit et dispose aussi d'un encodeur dédié AV1.
L'encodage est d'ailleurs le cheval de bataille de Qualcomm sur cette génération avec une architecture deux cœurs qui doit impressionner : transcodage 2,5 fois plus rapide que sur la génération précédente, encodage 8K@30 ips en gérant simultanément un décodage jusqu'en 8K@60 ips. L'Adreno VPU est associé à l'Adreno DPU (ou Display Processing Unit) qui se charge, vous l'aurez compris, de la gestion de tout ce qui est affichage : prise en charge de 4 écrans 4K@144 Hz ou de 4 écrans 5K@60 Hz.
Sans surprise, Qualcomm annonce que le HDR est de la partie de même que des options de gestion des couleurs, et souligne la présence du VRR (ou Variable Refresh Rate) pour que la synchronisation CPU/GPU soit toujours parfaite.
Puissance et consommation : question de portabilité
À travers les différentes annonces de Qualcomm, vous avez forcément vu passer ces mini-PC d’une finesse absolument incroyable. Une telle compacité passe évidemment par une gestion rigoureuse de la consommation énergétique et nous terminerons notre plongée dans la technologie Snapdragon X2E par quelques informations à ce niveau. En effet, plus encore que sur la génération précédente, la marque entend capitaliser sur son expertise issue du monde du smartphone.
Cinq références de Snapdragon X2 et diverses gammes de laptops. ©Nerces pour Clubic
Là, Qualcomm a beau jeu de dire que ses puces sont bien plus efficaces que celles de ses principaux concurrents : nous verrons cela au moment des tests, aucun doute là-dessus. Focalisons-nous plutôt sur tout ce qui est organisation de la gamme. Au lancement des premières machines équipées en X2E, dans quelques semaines, il sera surtout question de portables dits « thin and light » : ils bénéficieront d'un refroidissement actif, discret, alors que l'on parle d'une dissipation de 20 à 40 watts maximum.
Pas moyen de comparer ce chiffre avec ceux d'AMD ou Intel car Qualcomm a surtout parlé d'INPP (ou Idle Normalized Platform Power) pour ses puces. Cela dit, AMD et Intel s'amusent aussi à rendre les choses peu comparables… tant que nous n'avons pas les PC entre les mains ! On retiendra que ces Snapdragon X2E dits thin and light seront suivis, par des portables dits premium thin dans un second temps et des desktop replacements, enfin.
De l'importance de la gestion des fréquences pour un CPU « économe ». ©Qualcomm
Par ailleurs, Qualcomm a aussi une nouvelle fois présenté ses mini-PC ultra-fins en clarifiant un peu les choses du point de vue fréquences de fonctionnement de la partie CPU. En effet, avec un cluster à six cœurs, la fréquence boost peut atteindre 5 GHz sur un cœur, 4,8 GHz sur deux cœurs, 4,47 GHz sur trois cœurs et encore 4,45 GHz sur quatre, cinq ou six cœurs actifs en même temps. Une façon de gérer au mieux la puissance nécessaire aux travaux parallélisés et la consommation/la chauffe de l'ordinateur.
Un avenir en lien avec Microsoft… et Google ?
Ces quelques lignes dédiées à la consommation de puces avant tout prévues pour le monde du laptop, mais qui – au moins sur le papier – feront aussi d'excellents processeurs desktop, nous conduisent vers une conclusion qui ne saurait être figée. Impossible d'arrêter un avis tant que nous n'avons pas pu poser nos mains aussi librement que nous l'aurions voulu sur les nouveaux Snapdragon.
Qualcomm semble plus que jamais décidée à bousculer le monde du PC en général, et l'alliance x86 AMD/Intel en particulier, via ses partenariats : celui la liant à Microsoft pour s'inviter au sein de Windows et un autre avec Google car, après tout, pourquoi ne pas aussi viser ChromeOS… ou, plutôt, son évolution ?
Une chose est en tout cas certaine, plus que jamais Qualcomm joue la double carte de la faible consommation et de l'efficacité alors qu'AMD et Intel sont en retard sur ce segment. La question est de savoir si Qualcomm va s'imposer avant que ses deux concurrentes ne réagissent. Quand on voit les promesses de Panther Lake, on se dit que, malgré les troubles d'approvisionnement que connaît l’univers informatique, il y a des raisons de croire en 2026.