Insolite : quand des articles générés par ordinateur s'invitent chez les éditeurs universitaires

01 juin 2018 à 15h36
0
Un programme informatique permettant de générer de faux articles universitaires a permis à de nombreux chercheurs de composer des textes complètement incohérents, et pourtant publiés, ces dernières années. Un système développé par un universitaire français a récemment révélé la supercherie.

00FA000007197940-photo-scigen.jpg
Un article généré par SciGen
Conçu en 2005 par 3 étudiants de l'Institut de technologie du Massachusetts (MIT), le logiciel SciGen permet de générer aléatoirement des résumés d'études scientifiques. Cette usine à canulars est disponible gratuitement sur Internet depuis près de 10 ans, et une découverte récente a permis de constater qu'elle était utilisée depuis longtemps par des scientifiques pour soumettre de faux sujets de recherches à l'occasion de congrès, ou à destination de maisons d'édition.

A la base conçu pour critiquer et tester la rigueur du secteur universitaire concernant des sujets d'études parfois totalement incompréhensibles - et pour cause - SciGen a fini par piéger des éditeurs sérieux. Lundi 24 févier, Springer et IEEE, deux maisons d'édition basées aux USA et en Allemagne, ont ainsi annoncé la suppression de 120 articles totalement erronés de leurs archives. Ils avaient tous été conçus via SciGen.

Un Français découvre le pot-aux-roses

La découverte de cette supercherie est due à Cyril Labbé, un chercheur de l'université Joseph-Fourier de Grenoble. Ce dernier a conçu en 2012 un système qui permet d'identifier les articles composés à l'aide de SciGen. Car le système, qui créé des phrases aléatoires à l'aide de chaînes de mots et intègre même des tableaux, des graphiques et des sources, compose des articles qui tiennent du charabia scientifique pour les profanes, et n'attire pas nécessairement l'attention si on ne se penche pas concrètement dessus. La méthode de détection de Cyril Labbé, disponible en ligne, permet de rechercher du vocabulaire spécifique utilisé par SciGen. Des dizaines d'articles erronés ont ainsi été décelés.

Springer et IEEE ne sont pas les seules victimes du phénomène : le site Nature explique que des dizaines de documents générés par SciGen sont disponibles en ligne, notamment sur Google Scholar.

Reste à savoir comment de tels documents peuvent circuler et même être publiés alors qu'ils n'ont pas de sens réel. Cyril Labbé évoque le fait que de nombreux articles sont associés à des conférences tenues en Chine, et associées à des auteurs chinois. Les éditeurs pris au piège se font quant à eux discrets sur la question.
Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
0
0

Actualités du moment

Garmin fenix 2 : une montre GPS connectée vraiment multi sports
Asus dévoile une station d'accueil avec charge par induction pour la Nexus 7
Les ventes de smartphones vont fortement ralentir en 2014
Droit de filmer, voler en ville : 10 questions à se poser avant d’acheter un drone
Intel annonce ses SSD 730 Series
Résidences secondaires : Orange condamné à régler une amende de 51 millions d'euros à SFR
Boeing prépare un smartphone ultra-sécurisé
Samsung Galaxy S5 : son prix révélé
Entente sur les prix des LCD : les amendes de LG Display et InnoLux sont réduites
MWC 2014 : De nouveaux mobiles pour séniors chez Doro et Fujitsu
Haut de page