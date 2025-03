L'étude du Tow Center for Digital Journalism a analysé huit moteurs de recherche IA, en leur soumettant des extraits d'articles de presse. Les chercheurs voulaient vérifier leur capacité à identifier correctement la source originale, l'URL, la date et l'éditeur du contenu.

Les résultats montrent que ces systèmes produisent des erreurs fréquentes. Collectivement, ils ont fourni des réponses incorrectes dans plus de 60 % des cas. Grok 3, dont les débuts n'ont pas franchement convaincu, affiche un taux d'erreur de 94 %, ce qui en fait l'un des outils les moins fiables du panel. D'autres IA, comme Perplexity, ont un taux d'erreur moindre, mais restent loin d'être précises.

Les chatbots testés donnent rarement des indices sur leur niveau d'incertitude. ChatGPT, par exemple, a donné 134 réponses incorrectes sur 200 requêtes, tout en n'indiquant un manque de confiance que dans 15 cas. Seul Copilot s'est distingué en refusant de répondre à plus de questions qu'il n'en a traitées. On peut dire que c'est le plus honnête de ses pairs.

En plus de ces erreurs, les chatbots citent souvent des URL inexistantes ou erronées. Grok 3 et Gemini renvoient vers des liens cassés plus de la moitié du temps. Ces résultats compliquent la vérification des sources par les utilisateurs. Les chercheurs ont aussi constaté que certaines IA contournaient les restrictions imposées par les éditeurs de presse, en accédant à des contenus pourtant bloqués dans leurs fichiers robots.txt.