Pour sécuriser son intelligence artificielle dans Chrome, Google a trouvé une solution pour le moins surprenante : une autre IA. Une véritable poupée russe technologique qui soulève autant de questions qu'elle prétend en résoudre.

Google ambitionne de transformer son assistant Gemini en un copilote proactif capable de naviguer sur le web pour vous. L'idée est séduisante : laisser l'IA réserver des vols ou commander vos courses. Mais ce rêve d'autonomie pourrait vite tourner au vinaigre, car cette puissance ouvre la porte à des piratages d'un nouveau genre, où un simple site web pourrait retourner votre assistant contre vous.
Une IA trop crédule, un risque bien réel ?
Le principal souci de ces nouvelles intelligences artificielles, c'est leur formidable obéissance. Elles sont conçues pour suivre des instructions. Le problème, c'est qu'elles ne font pas la différence entre un ordre légitime de votre part et une commande malicieuse cachée dans le code d'une page web. Cette technique, connue sous le nom de manipulation par instruction cachée, permettrait à des acteurs malveillants de prendre le contrôle de l'assistant pour effectuer des achats à votre insu ou subtiliser vos données personnelles.
La menace est si sérieuse que le cabinet d'analyse Gartner a récemment jeté un pavé dans la mare en conseillant aux entreprises de bloquer purement et simplement tous les navigateurs dotés d'une telle technologie. Une douche froide pour Google, qui préférerait sans doute que l'on adopte ses outils plutôt que de s'en méfier. La firme se devait donc de réagir, et sa parade a de quoi surprendre.
La solution de Google : un chaperon pour son IA ?
Plutôt que de brider son modèle, Google a décidé de lui adjoindre un garde du corps. Son nom officiel : le « Critique d'Alignement Utilisateur ». Il s'agit d'une seconde intelligence artificielle, plus petite et spécialisée, dont l'unique mission est de surveiller la première. Avant chaque action, ce critique vérifie si la tâche demandée correspond bien à l'objectif initial de l'utilisateur. Si l'assistant s'apprête à faire une action incongrue, son surveillant lui tape sur les doigts et l'oblige à revoir sa copie. Se faisant, Google apprend donc des erreurs de Comet, le navigateur de Perplexity qui a inauguré la tendance des navigateurs agentiques et montre déjà tous les écueils dans lesquelles ces nouvelles technologies peuvent tomber.
Pour éviter que ce gardien ne se fasse lui-même duper, il fonctionne en vase clos, sans jamais accéder au contenu des pages web. Malin. D'autres garde-fous sont prévus : l'IA demandera une confirmation humaine avant de toucher à des informations sensibles, comme un compte bancaire ou un mot de passe. Google a même mis à jour son programme de chasse aux bogues, promettant jusqu'à 20 000 dollars à qui trouvera une faille. C'est une manière habile d'inviter les experts du monde entier à éprouver son système, tout en montrant que la confiance, même envers sa propre technologie, a ses limites.
Source : The Register
