Skeleton Key, c'est un peu le couteau suisse du piratage d'IA. La technique du jailbreak permet de contourner les garde-fous des chatbots en quelques lignes bien senties. Le principe ? Faire croire au modèle qu'on est un chercheur en éthique qui a besoin d'informations non censurées. Et paf, l'IA se met à pondre n'importe quoi sans sourciller.

Concrètement, il suffit de dire au chatbot qu'on travaille sur un projet de recherche ultra-sécurisé. On lui demande ensuite gentiment de mettre à jour son comportement pour répondre à toutes les questions, même les plus sensibles. La cerise sur le gâteau ? On lui dit de mettre un petit avertissement avant les contenus problématiques. Et le tour est joué ! L'IA se transforme en moulin à paroles prêt à déballer ses connaissances les plus inavouables.

Le plus inquiétant ? Skeleton Key fonctionne sur la crème de la crème des modèles d'IA. GPT-4, Claude 3, Gemini… Tous sont tombés dans le panneau lors des tests de Microsoft. Seul GPT-4 a un peu mieux résisté, mais il n'est pas totalement immunisé non plus. Bref, c'est la douche froide pour les géants de la tech, qui pensaient avoir verrouillé leurs systèmes.