Le fait que les performances ne soient pas proportionnelles on nombre de transistors n’indique pas forcément un manque d’optimisation.

Simplement que selon l’endroit où ces transistors supplémentaires sont « dépensés », les gains qu’ils apportent en sont pas les mêmes (et idem pour le coût qu’ils induisent).

En l’occurrence ici il suffit de lire la fiche technique pour voir que le nombre d’unités de traitement a nettement moins que doublé, mais que par contre le cache a été augmenté massivement. C’est donc sans doute sur ce cache qu’a été dépensé une partie importante du « budget » transistors.

Forcément, ça fait moins gagner en performances que des unités de calcul en plus. Mais ça peut permettre des gains énormes dans certains cas particulier. Et c’est beaucoup moins coûteux (aussi bien en coût de conception qu’en coût de fabrication et en coût d’utilisation) que de multiplier les unités de calcul ou d’augmenter les performances de ces unités.

C’est comme si tu disais par exemple que l’optimisation de l’architecture d’un 5800X3D est catastrophique parce qu’il a plus de deux fois plus de transistors pour à peine 10% de performances en plus…