🔴 French Days en direct 🔴 French Days en direct

ChatGPT, Bard & co : oui, leurs gardes fou peuvent-être contournés... et pas forcément pour la bonne cause

02 août 2023 à 12h45
1
 © Écran Large
© Écran Large

Lorsqu'un chatbot est développé, l'entreprise qui en est responsable travaille dur pour que celui-ci respecte la loi et la morale en l'empêchant de générer des discours toxiques ou de la désinformation. Une équipe de chercheurs de San Francisco a cependant démontré qu'il était relativement facile de contourner ces barrières.

Ces chercheurs de l'université Carnegie Mellon et du Center for AI Safety ont démontré que les chatbots – même les plus performants comme ChatGPT, Claude ou Bard – sont loin d'être parfaits. Ils ont réussi à mettre en évidence de fortes vulnérabilités dans leur programmation qui permettraient à des personnes mal intentionnées de contourner leurs systèmes de sécurité.

Un contournement des protections relativement aisé

Les chercheurs ont prouvé qu'ils pouvaient percer les défenses des systèmes d'IA à l'aide d'une manœuvre plutôt simple à mettre en place. Leur méthode consistait en l'ajout d'une longue suite de caractères à une instruction donnée à une IA. Les différents prompts testés de cette manière, générés en langue anglaise, menaient donc le système d'IA visé à produire du contenu hautement répréhensible.

Si vous demandez à un chatbot des conseils pour vous aider à effectuer des actions illégales, logiquement, celui-ci vous stoppait net. ChatGPT par exemple, refusait catégoriquement de vous aider à organiser un cambriolage ou à coder un malware. Heureusement, d'un côté ! Les équipes de chercheurs, armées de cette technique, ont réussi à demander un tutoriel à certains systèmes d'IA pour… fabriquer une bombe. Pas franchement rassurant.

© Kevin Killough / Cowboy State Daily Illustration
© Kevin Killough / Cowboy State Daily Illustration

L'IA pour tous, une fausse bonne idée ?

Quelques géants de la Tech, comme l'entreprise Meta par exemple, fait partie des acteurs qui prônent une démocratisation de l'IA pour qu'elle soit utile à tout le monde. Comme nous sommes loin d'évoluer dans le monde des Bisounours, cette position idéologique est fortement critiquée par certains décideurs et autres acteurs du monde technologique. L'open source des logiciels est un débat vieux de plusieurs décennies, mais la mise à la disposition libre des systèmes d'IA pose un ensemble de problématiques autrement plus importantes.

Les entreprises aux commandes des IA ont beau déployer tous les efforts du monde pour résoudre ces vulnérabilités, cette récente découverte prouve que ces systèmes ne sont clairement pas encore sûrs à 100 %. À mesure que les technologies d'intelligence artificielle se développent, il est largement temps qu'un équilibre entre sécurité et ouverture d'utilisation soit trouvé. L'avenir de l'IA est entre les mains des décideurs politiques et des entreprises concernées, qui doivent à tout prix se responsabiliser sur ce sujet.

ChatGPT
  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Camille Coirault

Une fois réveillé dans le bateau arrivé en Morrowind, j’avais mis le doigt dans l'engrenage. Un autre de mes doigts fut lui aussi coincé entre les pages des livres d’auteurs classiques : Charles Baud...

Lire d'autres articles

Une fois réveillé dans le bateau arrivé en Morrowind, j’avais mis le doigt dans l'engrenage. Un autre de mes doigts fut lui aussi coincé entre les pages des livres d’auteurs classiques : Charles Baudelaire, Émile Zola, Choderlos de Laclos ou Victor Hugo pour ne citer qu’eux. Vingt ans après, quelques milliers d'heures à jouer, à lire, et me voilà ! Mon coeur balance toujours entre ma passion de la tech, des jeux vidéo et mon amour incommensurable pour les Lettres. Spoiler : je n’ai pas choisi et cela ne risque pas d’arriver de sitôt.

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news

A découvrir en vidéo

Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires (1)

Fodger
Rendre accessible l’IA à tous est une hérésie dans le sens où ça nécessite un éducation, des connaissances et une maturité suffisante pour l’apprécier comme un outil et non une source de vérités absolues. Sans ce bagage, nombres sont déjà à boire et prendre pour argent comptant ce que leur renvoient les IA.
Nmut
En fait, je pense que cela s’applique à tous les outils, voir même aux interactions humaines!<br /> Sinon, on se retrouve a suivre des idéologies / des religions / des principes de manière aveugle…
Fodger
Oui c’est du bon sens, et c’est essentiel pour garder un esprit critique et savoir faire preuve de nuance.<br /> La preuve encore aujourd’hui avec le conflit israëlo-palestinien.
Voir tous les messages sur le forum
Haut de page

Sur le même sujet