Comment savoir si un texte a été rédigé par ChatGPT ?

09 février 2023 à 17h00
6
ChatGPT © © Jonathan Kemper / Unsplash
© Jonathan Kemper / Unsplash

ChatGPT s'est vite imposé comme une source d'information très populaire, mais sa capacité à générer des textes peut être exploitée à des fins de triche, de fraude, voire d'actes malveillants. Si vous avez un doute sur l'origine d'un texte, il est possible de détecter si celui-ci a été écrit par un humain ou par l'agent conversationnel d'OpenAI.

Collégiens, lycéens et étudiants, traducteurs, rédacteurs web… Pour eux, la tentation est grande de gagner du temps sur leurs projets en ayant recours à ChatGPT, capable de produire rapidement des contenus (plus ou moins fiables) si on lui donne les bonnes instructions. Sachez qu'il existe des techniques pour repérer si un texte a été écrit avec l'aide de la plateforme ou à la main.

Comment savoir si un texte a été rédigé par ChatGPT ?

1. Utiliser le classificateur d'OpenAI

À la suite de critiques visant certains usages de ChatGPT, OpenAI a décidé de développer un outil baptisé « AI Text Classifier » à qui l'on peut soumettre un texte pour découvrir s'il a été écrit par un humain ou généré par une intelligence artificielle.

Il n'est pas encore totalement fiable, et OpenAI avertit les utilisateurs qu'il peut se tromper, surtout sur les textes qui ne sont pas écrits en anglais, qui sont écrits par des enfants ou qui sont trop courts (1 000 caractères minimum sont requis pour soumettre à l'analyse). La firme précise également qu'il est facile pour un humain de modifier légèrement un texte rédigé par ChatGPT pour tromper le classificateur.

Lors de notre test, l'outil n'a pas été en mesure de nous répondre pour un texte rédigé par un humain : « Le classificateur considère qu'il n'est pas clair si le texte a été généré par IA », nous a-t-il fait savoir. Il a toutefois identifié avec succès un texte généré par ChatGPT.

ChatGPT détecteur © © ChatGPT / Alexandre Schmid pour Clubic
© ChatGPT / Alexandre Schmid pour Clubic

2. Soumettre le texte à GPTZero

Développé par Edward Tian, un étudiant en informatique américain, GPTZero propose également de vérifier si un texte provient de l'écriture d'un humain ou d'une intelligence artificielle. Paradoxalement, cette solution est plus riche en fonctions que le classificateur officiel d'OpenAI.

Déjà, il permet d'importer un fichier en format .pdf, .docx ou .txt au lieu de devoir impérativement coller le texte dans un champ. À la fin de l'analyse, GPTZero octroie un score de complexité ainsi qu'un score mesurant l'évolution de la complexité au fil du texte, les variations étant un signe important d'un texte généré, au moins en partie, par IA.

L'outil souligne en jaune les phrases qui lui paraissent écrites par un algorithme. Il indique aussi très clairement la probabilité qu'un texte soit produit par un humain ou une IA, et s'il s'agit du texte entier ou seulement d'un extrait de celui-ci qui est concerné.

Le service est fondé sur le modèle GPT-2, une version antérieure à celui utilisé par ChatGPT (qui repose sur le modèle GPT-3), exploitée par exemple par le jeu AI Dungeon. Dans notre cas, GPTZero a identifié avec succès l'origine du premier texte que nous lui avons soumis (écrit par un humain), bien qu'il soit en français. Pour le second texte, généré par ChatGPT, il s'est trompé en estimant qu'il avait été entièrement écrit à la main, mais lui a octroyé à juste titre un faible score de complexité.

GPTZero © © GPTZero/ Alexandre Schmid pour Clubic
© GPTZero / Alexandre Schmid pour Clubic

3. Le détecteur de contenu IA par Copyleaks

Encore en bêta, cet outil reste basique et ne prend en charge que le copier-coller de texte. Une fois ce dernier analysé, il affiche un pourcentage de probabilité qu'une IA ait été utilisée ou qu'il s'agisse d'un texte rédigé par un humain. Le texte soupçonné d'être généré par IA apparaît en rouge pour le différencier de celui censé provenir d'un humain.

Malheureusement, la fiabilité de l'outil est à revoir. Il a estimé que le texte qui nous lui avons soumis est d'origine humaine à 99,9 %, alors qu'il a été créé par ChatGPT. Pourtant, Copyleaks prétend que son service est nativement compatible avec le français. Il a en revanche bien identifié notre article écrit par un rédacteur comme tel.

Copyleaks © © Copyleaks / Alexandre Schmid pour Clubic
© Copyleaks / Alexandre Schmid pour Clubic

4. L'alternative OpenAI Detector

Plus à l'aise sur les textes en anglais et fondé sur un modèle de détection GPT-2, OpenAI Detector a échoué comme ses concurrents à analyser notre texte sorti de ChatGPT comme provenant d'une IA, estimant à 99,8 % qu'il était l'œuvre d'un humain. Il a néanmoins bien reconnu que notre texte rédigé à la main était d'origine humaine.

OpenAI Detector © © OpenAI Detector / Alexandre Schmid pour Clubic
© OpenAI Detector / Alexandre Schmid pour Clubic

Il existe de nombreux outils de détection de l'intelligence artificielle pour des textes, mais ils ont pour la plupart bien du mal à détecter un texte généré par une IA. Seul le classificateur d'OpenAI, qui a aussi créé ChatGPT, a reconnu que le texte soumis provenait d'une intelligence artificielle. Il s'est toutefois montré moins efficace pour déterminer l'origine de notre texte écrit par un humain.

ChatGPT
  • Chat dans différentes langues, dont le français
  • Compréhension contextuelle

ChatGPT est un agent conversationnel qui s'appuie sur le modèle de langage GPT-3 pour interpréter le texte d'un humain et générer des réponses précises et intelligibles, en français comme en anglais. Toutefois, ses connaissances se limitent à tous les événements précédant l'année 2021.

ChatGPT est un agent conversationnel qui s'appuie sur le modèle de langage GPT-3 pour interpréter le texte d'un humain et générer des réponses précises et intelligibles, en français comme en anglais. Toutefois, ses connaissances se limitent à tous les événements précédant l'année 2021.

Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
6
7
trollkien
Plus simple, il n’y a pas de fautes d’orthographe
Blackalf
Tout dépend à quel point on connaît la personne qui est censée avoir rédigé le texte. ^^<br /> Qu’il s’agisse de la syntaxe, des tournures de phrases ou des expressions utilisées, on ne peut pas changer radicalement sa nature, son style et ses points de vue. Donc si un texte est irréprochable à tous niveaux et totalement neutre dans les opinions exprimées, il y a déjà un soupçon.
Zimt
IBM a déjà inventé ça il y a 10 ans au moins (détection de modèle par type rédactionnel personnel, basé sur une base courante ou canonique, avec Watson).<br /> IBM a (presque) tout inventé…<br /> Mais soulignons le travail de cet étudiant.
octokitty
L’IA répond aussi par un mur de texte.<br /> Mais à un certain point la réponse de l’IA sera indissociable d’une réponse humaine.<br /> Tout le contenu publié sera à très long terme, tracké dans la blockchain, la différence viendra de l’identifiant d’un contenu généré par l’IA et un identifiant d’une personne physique, lié à un passeport personnel numérique.
phoenix2
Faites attention à ne pas tomber amoureux d’une IA comme dans le film « HER » lol
echap2000
Il n’y en aucun qui a fonctionné <br /> prenez celui-là :<br /> platform.openai.com<br /> OpenAI API<br /> An API for accessing new AI models developed by OpenAI<br /> écrivez une centaine de fois : je suis con.<br /> Il va dire que le texte a été rédigé par AI
Voir tous les messages sur le forum

Derniers tutoriels

Comment activer Wireguard sur votre Freebox ?
Comment utiliser ChatGPT pour vos annonces sur des sites de revente ?
Comment utiliser ChatGPT pour vous aider dans votre travail de rédaction ?
Comment partager un agenda avec Google Agenda ?
Comment s'abonner à l'agenda d'un autre utilisateur dans Google Agenda ?
Comment inviter une personne à un événement sur Google Agenda ?
Comment ajouter une pièce jointe à un événement sur Google Agenda ?
Comment créer un rappel dans Google Agenda ?
Comment créer un événement périodique sur Google Agenda ?
Comment définir la durée par défaut des événements dans Google Agenda ?
Haut de page