Il y a un exemple récent avec l’introduction des RT Core sur la RTX 2070 par exemple. Ce GPU fait 450 mm² parce qu’il embarque des unités spécialisés pour le ray tracing. Le GTX 1080 Ti qui fait lui aussi 450 mm² a une efficacité « généraliste » à peine moindre (en fait, il est plus performant, mais il consomme plus) alors qu’il est gravé en 16 nm (contre 12 pour le RTX 2070). La différence se situe dans l’ajout de fonctionnalités que le GTX 1080 Ti ne gère pas ou très mal (en software par exemple, l’efficacité du ray tracing serait mauvaise). Donc, on a bien une chute « générale » de l’efficacité, accompagné d’un gain « spécialisé ». Si ils restaient sur la même architecture, il n’y aurait pas d’ajout de fonctionnalités géré au niveau matériel.
Dans d’autres cas, l’efficacité générale dû à l’architecture peut être légèrement amélioré (HD5870 vs HD6870).

Non. Diviser la taille de gravure par 2 n’a jamais multiplié l’efficacité énergétique par 4 (ou en tout cas pas depuis très longtemps). Et surtout, depuis un paquet d’années, les gains d’efficacité lié au processus de gravure sont relativement marginaux…

Oui, c’est surtout vrai depuis le 28 nm. Ils sont d’ailleurs passés du 28 nm au 14 nm (16 et 12 nm pour Nvidia) directement sans passer par le 20 nm intermédiaire.
Il n’empêche que le passage du RTX 3090 Ti au RTX 4090 a permis de passer de 45 millions de transistors par mm² à 125 MTr/mm² soit une densité de 2,8x au lieu de 4x, mais à surface égale et surtout à TDP égale, la RTX 4090 a une fréquence plus élevé.

TSMC a fait un travail exceptionnel ici, il n’y a aucun doute là dessus.

Pour le gain intrinsèque à l’architecture d’Nvidia, il faudra attendre un GPU d’environ 28 milliard de transistors (un semi-RTX4090 sur bus 192 bit serait idéal pour la comparaison) pour en avoir le coeur net et pouvoir comparer à nombre de transistors égal avec le RTX 3090 par exemple.

Il n’empêche que le RTX 4090 est plus perf et efficace que le RTX 3090(Ti) malgré tout, c’est indiscutable.