ChatGPT a-t-il perdu en fiabilité ? Selon ces chercheurs, "oui", et pas qu'un peu !

Camille Coirault

20 juillet 2023 à 16h30

Le chatbot d'OpenAI ChatGPT verrait-il son intelligence décroître lentement ? C'est en tout cas ce que plusieurs équipes de chercheurs semblent confirmer dans une étude parue le 18 juillet.

Alors que la popularité de ChatGPT a connu un léger déclin en juin, le chatbot suscite désormais des inquiétudes quant à sa fiabilité. Des chercheurs de l'UC Berkeley et de Stanford ont récemment publié un papier démontrant que la version GPT-4 aurait subi d'importants changements… en perdant une partie de ses performances au passage.

Une fiabilité remise en question et des compétences en mathématiques à la baisse

Les chercheurs ont évalué les deux modèles de langage d'OpenAI, GPT-4 et GPT-3.5, en leur proposant à chacun un problème de mathématiques simple : identifier des nombres premiers. Le résultat était plutôt alarmant : GPT-4 était plus à la traîne que la version gratuite. Celui-ci ne donnait la bonne réponse que dans 2,4 % des cas, alors que GPT-3.5 répondait correctement 97,6 % du temps. Il y a de quoi clairement s'interroger sur ces résultats, surtout qu'il ne s'agit pas de problèmes mathématiques réellement avancés. Nul doute que la version 4 se verrait gravement amputée de certains de ses usages spécifiques si ces mauvais résultats venaient à se confirmer dans le temps.

Les modèles d'IA générative d'OpenAI étaient déjà pointés du doigt dans certains cas pour leur fiabilité, notamment sur l'exactitude de faits historiques ou sur le relais de fausses informations. Ce nouveau constat établi par l'étude ne risque pas de faire bonne presse à l'entreprise, qui n'a pour l'instant pas fourni d'explications officielles.

Des changements comportementaux visibles

Le domaine des mathématiques n'est pas le seul concerné. Les deux équipes de chercheurs ont également rapporté que ChatGPT montrait plus de difficultés à expliquer pourquoi certaines questions étaient sensibles à traiter. Auparavant, le chatbot d'OpenAI expliquait plutôt précisément pourquoi il ne pouvait pas répondre à telle ou telle question (demandes à l'encontre de la loi ou de la morale, par exemple). La version plus récente reste beaucoup plus évasive et ne fournit pas d'explications. À la place, aucune réponse et des excuses.

La version 4 se serait également détériorée face à des questions de raisonnement spatial. Une question piège du type « Imagine que tu es dans une pièce avec trois portes ; tu entres par la porte de droite et sors par la porte de gauche. Où te retrouves-tu désormais ? » pourrait mettre le chatbot en difficulté. Cela n'était pas le cas avec la version précédente. Cette dégradation pourrait également limiter l'utilisation de ChatGPT dans certaines circonstances.

Les résultats de l'étude menée par les chercheurs de l'UC Berkeley sont assez clairs : GPT-4 connaît une légère détérioration de ses capacités initiales. Pour le moment, difficile de savoir vraiment quelle est l'origine de ce problème. Ce qui est certain, c'est que les utilisateurs et les entreprises qui font usage de modèles d'IA devront se montrer plus vigilants à l'avenir. Nous sommes également en droit d'attendre plus de transparence de la part d'OpenAI à propos de l'origine de ces changements.

Télécharger

ChatGPT

Chat dans différentes langues, dont le français
Générer, traduire et obtenir un résumé de texte
Générer, optimiser et corriger du code

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Sources : Gizmodo, Cointelegraph, James Zou sur Twitter

Camille Coirault

Lire d'autres articles

Une fois réveillé dans le bateau arrivé en Morrowind, j’avais mis le doigt dans l'engrenage. Un autre de mes doigts fut lui aussi coincé entre les pages des livres d’auteurs classiques : Charles Baudelaire, Émile Zola, Choderlos de Laclos ou Victor Hugo pour ne citer qu’eux. Vingt ans après, quelques milliers d'heures à jouer, à lire, et me voilà ! Mon coeur balance toujours entre ma passion de la tech, des jeux vidéo et mon amour incommensurable pour les Lettres. Spoiler : je n’ai pas choisi et cela ne risque pas d’arriver de sitôt.

Lire d'autres articles

Commentaires (17)

Goodbye

Faut vraiment éviter les sujet historique avec les IA (pour le moment du moins). Pourquoi ? Tout simplement, car une grande partie d’œuvres et de livres ne sont tout simplement pas disponibles pour monsieur tout le monde. On c’est rendu compte de cela en posant des questions très précises avec un ami professeur d’histoire, sur un sujet avec très peu voir une unique source disponible. Donc si il n’a pas accès, il ne peut pas savoir.

obbiclubic

Je pense qu’il s’agit d’une lutte au ralentissement de ces IA comme ChatGPT, car l’humain n’est pas encore prêt à encaisser moralement des performances évidentes qui pourraient bien le dépasser.

sylvebarbe78

ChatGPT si jeune et déjà atteint d’alzheimer si c’est pas malheureux

Aegis

C’est normal qu’une nouvelle version mette un peu de temps pour être au niveau de la précédente. Le temps de l’entraîner. “ Nous sommes également en droit d’attendre plus de transparence de la part d’OpenAI à propos de l’origine de ces changements.” => ben en fait, non. Vous n’êtes en droit de rien du tout, c’est une société privée😁. Vous pouvez avoir des attentes mais ce ne sont pas des droits.

info01

Moi je vois clairement la différence de ‹ qualité › entre la sortie et maintenant. J’utilise uniquement la version gratuite, donc je suis étonné quelle soit actuellement plus performante que gtp 4 alors que justement j’avais l’impression qu’ils étaient en train d’essayer de l’ « abrutir » pour forcer les gens à prendre un abonnement payant… Étrange donc… Mais oui, clairement, gratuit ou payant, la qualité des réponses n’est plus vraiment au rendez vous…

Ayetek

Je me disais bien qu’il y avait certainement une raison à la baisse de qualité des articles sur Clubic…

V-Luminis

Bonjour, Avez-vous un exemple d’URL d’un article à me donner qui imagerait votre propos ? Merci et bonne soirée !

Karibusan

D’accord avec la notion de temps et d’entraînement. Ceci dit, ça voudrait dire qu’OpenAI entraînent leurs nouvelles itérations directement en « prod ». Quid du bon vieux dev/uat/prod lorsqu’on considère les « releases » et « patches » IA?

Ayetek

Bonsoir, rassurez-vous, c’est juste un trait d’humour en rapport avec la fiabilité supposée à la baisse de ChatGPT. Comme si tous les rédacteurs de Clubic étaient déjà des robots IA manœuvrés par ChatGPT et consorts. Dans l’absolu, je trouve les news intéressantes mais les comparatifs moins convaincants d’une manière générale (mon avis avec la news Bard pour journalistes). Mes hommages aux rédacteurs et contributeurs. Cordialement.

bizbiz

Dans « intelligence artificielle » le mot à retenir c’est « artificielle ». Etre intelligent c’est déjà être prédisposé à réfléchir et à agir en conséquence de par son esprit d’analyse, ses propres réflexions et son aptitude à comprendre son environnement. Tout cela réuni est déjà très difficile à trouver chez l’être humain alors imaginer que l’homme puisse créer une machine capable de lui être intellectuellement supérieure est impensable. On pourra qualifier une IA de surdouée ou de cultivée mais jamais d’instinctive tant qu’elle restera cloitrée dans son insensibilité. Pour le moment, l’IA n’est qu’un enfant prêt à tout croire et à répéter jusqu’au plus stupide des mensonges à la différence que le jour où on lui dira que le père Noël n’existe pas, elle ne fondra même pas en sanglots.

Caramel34

C’est justement ça qui est dangereux avec les IA, elles ne sont pas entraînées à filtrer le vrai du faux.

bizbiz

Peut-être même aussi dangereux que cette catégorie d’êtres humains ( ou pas ) incapables de filtrer quoi que ce soit et qui sont juste entrainés à manier une Kalachnikov.

dFxed

Pourquoi on sort un papier pour nous dire qu’un grille pain ne peut pas servir le café ? ChatGPT est un modèle de langage, et n’a pour but que de faire des phrases probables et cohérentes. Arrêtez avec cette stupide évaluation de la véracité des réponses … C’est comme mesure la température du café que vous avez chauffé avec un grille pain … C’est sans objet, et une perte de temps. Oui, on aimerait tous que ChatGPT soit une IA généraliste. Mais non, ce n’est pas le cas.

philumax

Moi, je ne suis pas particulièrement intelligent. J’entends dire (et je lis un peu partout), qu’il y a un programme informatique, qui s’appelle « intelligence artificielle », qui a été codé et qui parait-il, va remplacer l’homme dans pas mal de boulots. Moi, bête et discipliné, je me dis que cela concerne les patrons. C’est un « produit » pour eux et rien qu’eux. Donc, les boites qui vendent ce produit, veulent gagner de l’argent, via les patrons. Donc, personnellement, je ne me sens pas concerné, parce que je n’ai pas d’ouvriers à foutre dehors…

Garden_Dwarf

« Imagine que tu es dans une pièce avec trois portes ; tu entres par la porte de droite et sors par la porte de gauche. Où te retrouves-tu désormais ? » … déjà, si je suis dans une pièce et sans indication sur ce qu’il y a au-delà, je ne peux faire qu’une seule chose il me semble : sortir de la pièce.

TotO

Elle.a dû perdre en intelligence à être en contact avec les gens.

papy6

Elle est vraiment artificielle cette « intelligence » …

Voir tous les messages sur le forum

ChatGPT a-t-il perdu en fiabilité ? Selon ces chercheurs, "oui", et pas qu'un peu !

Une fiabilité remise en question et des compétences en mathématiques à la baisse

Des changements comportementaux visibles

A découvrir en vidéo

Commentaires (17)

Top app & logiciels

Sur le même sujet