Les inquietudes concernant les "illusions" creees par l'intelligence artificielle (IA) sont de plus en plus presentes dans le monde academique, car de fausses citations commencent a apparaître meme lors des conferences scientifiques les plus prestigieuses au monde.
Selon un nouveau rapport de la start-up de decouverte d'IA GPTZero aux Etats-Unis, plus de 51 articles de recherche acceptes lors de la conference NeurIPS (en abrege NeurIPS) ont ete decouverts contenant de fausses citations creees par l'IA. Au total, plus de 100 citations "inexistantes" ont ete trouvees parmi ces articles.
NeurIPS est l'une des conferences annuelles les plus importantes et les plus influentes dans le domaine de l'intelligence artificielle et de l'informatique (IA/ML).
GPTZero a declare avoir scanne 4 841 etudes acceptees lors du NeurIPS 2025, qui s'est tenu en decembre dernier a San Diego, en Californie (Etats-Unis), afin de detecter a la fois les fausses citations et le contenu de l'IA creative.
Bien que le ratio de 51 a 4 841 articles ne soit pas statistiquement significatif, selon la politique de NeurIPS sur l'utilisation de grands modeles linguistiques (LLM), une simple fausse citation peut servir de base au rejet ou au retrait d'un article.
Ces articles ont ete acceptes, presentes directement et publies officiellement. Dans un contexte ou le taux d'acceptation de NeurIPS 2025 n'atteint que 24,52%, chaque article a depasse plus de 15 000 autres manuscrits, bien qu'ils contiennent toujours une ou plusieurs fausses illusions", a precise GPTZero.
Cette decouverte est particulierement preoccupante car NeurIPS est un lieu de rassemblement pour les meilleurs experts mondiaux en intelligence artificielle. Le fait que des œuvres rigoureusement evaluees aient encore des fausses citations montre que meme les chercheurs en IA ont des difficultes a controler la precision des outils qu'ils utilisent.
NeurIPS n'est pas un cas isole. En decembre de l'annee derniere, GPTZero a egalement decouvert plus de 50 citations virtuelles dans des etudes en cours d'examen pour la conference ICLR 2026.
En outre, les entrepots de stockage de manuscrits en ligne tels qu'arXiv sont de plus en plus nombreux a presenter des ouvrages de faible qualite, crees ou fortement soutenus par l'IA.
Une analyse citee dans The Atlantic (Etats-Unis) montre que les scientifiques qui utilisent des outils bases sur de grands modeles linguistiques publient environ 33% plus d'articles que ceux qui n'utilisent pas ces outils.
Pour detecter les fausses citations, GPTZero utilise son propre outil d'IA appele "Hallucination Check", specialise dans l'examen des sources de citations qui ne peuvent pas etre trouvees en ligne.
Les citations etiquetees sont ensuite verifiees manuellement par les humains et appelees "citations emotionnelles" par l'entreprise, ce sont des citations qui semblent raisonnables mais qui n'existent absolument pas.
GPTZero a declare avoir fourni cet outil aux auteurs, au redacteur en chef et au president de la conference afin de detecter precocement les erreurs de citation, aidant ainsi le processus d'evaluation academique a etre plus rapide et plus precis a l'ere de l'IA creative.