OpenAI renforce la sécurité d'Atlas, son navigateur IA. L'entreprise reconnaît que les injections de prompt, ces attaques visant à détourner l'agent, resteront un problème permanent, mais mise sur un système automatisé pour les découvrir avant les pirates.
Le navigateur Atlas a récemment reçu une mise à jour de sécurité. Celle-ci cible les injections de prompt, ces attaques qui exploitent le mode agent en insérant des instructions malveillantes dans le contenu web pour détourner le comportement de l'IA. OpenAI reconnaît explicitement que cette menace ne disparaîtra probablement jamais.
Une nouvelle IA chargée de détecter les failles
OpenAI a développé une stratégie assez originale. L'entreprise a créé un attaquant IA entraîné via apprentissage par renforcement, une technique qui récompense l'IA chaque fois qu'elle trouve une faille. Ce système simule en continu le comportement d'un pirate informatique. Il peut découvrir des scénarios d'attaque complexes qui se développent sur des dizaines ou des centaines d'étapes. D'emblée le mécanisme est donc plus performant qu'une équipe de sécurité dédiée cherchant à détecter manuellement un potentiel comportement malveillant.
Quand cette IA d'attaque met au jour une nouvelle faille, le cycle de réaction s'enclenche. OpenAI renforce immédiatement son modèle d'agent, améliore ses systèmes de surveillance et affine les instructions de sécurité. L'avantage : le système identifie des classes d'attaques entièrement nouvelles que les équipes humaines auraient ratées.
Des vulnérabilités liées à la nature même d'Atlas
La menace des injections va persister. Le navigateur peut consulter des emails, cliquer sur des liens, remplir des formulaires et accéder à n'importe quel contenu web. C'est précisément ce qui le rend puissant, mais aussi ce qui expose l'IA à de multiples vecteurs d'attaque : chaque email, chaque page visitée, chaque document peut contenir du code malveillant caché.
OpenAI compare cette menace aux techniques d'escroquerie et de manipulation sociale qui perdurent malgré des décennies de sensibilisation. L'entreprise ne cherche pas à éradiquer le problème, mais à maintenir une longueur d'avance par détection continue. Cette année, les navigateurs IA ont connu un faux-départ à bien des égards, mais la question de la sécurité est particulièrement préoccupante. Impossible à ce jour de recommander l'un d'eux en tant que navigateur par défaut.