Gemini 2.5 Pro a été testé sur Pokémon. Et si elle réussit à finir le jeu, elle passe aussi par des phases semble-t-il assez tendues.

Pour prouver que l'intelligence artificielle est une technologie qui représente vraiment une rupture, beaucoup s'amusent à lui faire faire des tâches normalement propres aux êtres humains. Parmi celles-ci, jouer à des jeux vidéos, comme le célébrissime Pokémon. Après Claude, c'est Gemini qui a été mise à l'essai sur ce jeu. Et le moins que l'on puisse dire est qu'elle a d'étranges réactions.
Gemini panique quand un Pokémon est proche du stade du KO
DeepMind, la filiale de Google spécialisée dans l'intelligence artificielle, a voulu en savoir plus sur les possibilités offertes par le puissant modèle de langage Gemini 2.5 Pro. Et pour ce faire, elle l'a fait jouer à Pokémon.
Un jeu qui lui a donné des sueurs froides. Car oui, l'IA serait passée selon DeepMind par des phases de paniques, celles-ci étant caractérisées par une « dégradation qualitativement observable de la capacité de raisonnement du modèle ». Des phases des paniques observables au moment où un Pokémon n'est plus très loin d'être mis KO lors d'un combat.

L'IA est encore loin d'être aussi bonne joueuse qu'un humain
« Au cours du jeu, Gemini 2.5 Pro se retrouve dans diverses situations qui provoquent une simulation de panique dans le modèle » a-t-il ainsi été confirmé. Et si évidemment l'intelligence artificielle ne possède pas des émotions similaires à celles des êtres humains, dans les conditions de stress du jeu, elle reproduit d'une façon assez fascinante son comportement dans ces moments là, en prenant des décisions aussi mauvaises que précipitées.
À noter que si Gemini 2.5 Pro a elle aussi pu finalement achever le jeu Pokémon, le processus a été beaucoup plus ardu pour cette IA que pour n'importe quel enfant jouant au jeu. Il lui faut ainsi plusieurs centaines d'heures pour le terminer, alors qu'un enfant prend beaucoup moins de temps. L'IA capable de stress, est-ce le signe avant-coureur de la fameuse IA générale après laquelle tout le monde court ?
Source : TechCrunch
04 février 2025 à 14h11