Insolite : quand des articles générés par ordinateur s'invitent chez les éditeurs universitaires

27 février 2014 à 16h17
0
Un programme informatique permettant de générer de faux articles universitaires a permis à de nombreux chercheurs de composer des textes complètement incohérents, et pourtant publiés, ces dernières années. Un système développé par un universitaire français a récemment révélé la supercherie.

00FA000007197940-photo-scigen.jpg
Un article généré par SciGen
Conçu en 2005 par 3 étudiants de l'Institut de technologie du Massachusetts (MIT), le logiciel SciGen permet de générer aléatoirement des résumés d'études scientifiques. Cette usine à canulars est disponible gratuitement sur Internet depuis près de 10 ans, et une découverte récente a permis de constater qu'elle était utilisée depuis longtemps par des scientifiques pour soumettre de faux sujets de recherches à l'occasion de congrès, ou à destination de maisons d'édition.

A la base conçu pour critiquer et tester la rigueur du secteur universitaire concernant des sujets d'études parfois totalement incompréhensibles - et pour cause - SciGen a fini par piéger des éditeurs sérieux. Lundi 24 févier, Springer et IEEE, deux maisons d'édition basées aux USA et en Allemagne, ont ainsi annoncé la suppression de 120 articles totalement erronés de leurs archives. Ils avaient tous été conçus via SciGen.

Un Français découvre le pot-aux-roses

La découverte de cette supercherie est due à Cyril Labbé, un chercheur de l'université Joseph-Fourier de Grenoble. Ce dernier a conçu en 2012 un système qui permet d'identifier les articles composés à l'aide de SciGen. Car le système, qui créé des phrases aléatoires à l'aide de chaînes de mots et intègre même des tableaux, des graphiques et des sources, compose des articles qui tiennent du charabia scientifique pour les profanes, et n'attire pas nécessairement l'attention si on ne se penche pas concrètement dessus. La méthode de détection de Cyril Labbé, disponible en ligne, permet de rechercher du vocabulaire spécifique utilisé par SciGen. Des dizaines d'articles erronés ont ainsi été décelés.

Springer et IEEE ne sont pas les seules victimes du phénomène : le site Nature explique que des dizaines de documents générés par SciGen sont disponibles en ligne, notamment sur Google Scholar.

Reste à savoir comment de tels documents peuvent circuler et même être publiés alors qu'ils n'ont pas de sens réel. Cyril Labbé évoque le fait que de nombreux articles sont associés à des conférences tenues en Chine, et associées à des auteurs chinois. Les éditeurs pris au piège se font quant à eux discrets sur la question.
Modifié le 01/06/2018 à 15h36
0
0
Partager l'article :

Les actualités récentes les plus commentées

La justice allemande demande à Tesla de mettre en pause la construction de sa Gigafactory
Une taxe sur chaque connexion aux réseaux sociaux, pour remplacer la redevance TV ?
L'éolien a, en 2019, fourni 15% de l'électricité consommée en Europe
La centrale nucléaire de Fessenheim va être arrêtée ce samedi en vue de son démantèlement
Airbus : les USA augmentent nettement les taxes douanières sur les avions européens
La France et l'Allemagne s'associent pour travailler sur le successeur du Rafale et de l'Eurofighter
Il y a maintenant 300 satellites Starlink au-dessus de nos têtes
Uber ferme son bureau de Los Angeles, écarte des dizaines de salariés et délocalise aux Philippines
L'Arctique révèle deux millions de points chauds de méthane, selon un rapport de la NASA

Notre charte communautaire

1. Participez aux discussions

Nous encourageons chacun à exprimer ses idées sur les sujets qui l'intéressent, et à faire profiter l'ensemble de la communauté de son expertise sur un sujet particulier.

2. Partagez vos connaissances

Que vous soyez expert ou amateur passionné, partagez vos connaissances aux autres membres de la communauté pour enrichir le niveau d'expertise des articles.

3. Échangez vos idées

Donnez votre opinion en étayant votre propos et soyez ouverts aux idées des autres membres de la communauté, même si elles sont radicalement différentes des vôtres.

4. Faites preuve de tolérance

Qu'il s'agisse de rédacteurs professionnels ou amateurs, de lecteurs experts ou passionnés, vous devez faire preuve de tolérance et vous placer dans une démarche d'entraide.

5. Restez courtois

Particulièrement lorsque vous exprimez votre désaccord, critiquez les idées, pas les personnes. Évitez à tout prix les insultes, les attaques et autres jugements sur la forme des messages.

6. Publiez des messages utiles

Chaque participation a vocation à enrichir la discussion, aussi les partages d'humeurs personnelles ne doivent pas venir gêner le fil des échanges.

7. Soignez votre écriture

Utilisez la ponctuation, prohibez le langage SMS et les majuscules, relisez-vous afin de corriger un peu les fautes de frappe et de français : trop de fautes n’engagent ni à lire le message, ni à répondre à une question.

8. Respectez le cadre légal

Ne publiez pas de contenus irrespectueux, racistes, homophobes, obscènes ou faisant l'apologie de courants radicaux, qu'ils soient politiques ou religieux. N'utilisez pas plusieurs comptes utilisateurs.

9. Ne faites pas de promotion

Ne profitez pas d'une discussion pour faire la publicité d'un produit, d'un service ou même de votre site web personnel.

10. Ne plagiez pas

Exprimez uniquement vos opinions ou partagez des idées en citant vos sources.

scroll top