On discute de l'IA dans la recherche comme d'un problème de plagiat ou de productivité. La littérature récente pose une question plus profonde : est-ce que l'IA générative transforme ce que signifie produire de la connaissance ? Les réponses sont préoccupantes.
Le chiffre est frappant : 84 % des chercheurs utilisent désormais des outils d'IA générative dans leur pratique, selon une enquête publiée dans Nature en 2025.1 Ce n'est plus une avant-garde d'enthousiastes, c'est la majorité. Rédaction assistée, synthèse de littérature, analyse de données, formulation d'hypothèses : l'IA s'est installée à chaque étape du processus de recherche, souvent sans que les institutions aient eu le temps d'en définir les règles.
La même enquête documente quelque chose de moins confortable : les gains de productivité sont réels mais inégaux, et de nombreux chercheurs avouent ne pas savoir distinguer les moments où l'IA leur fait gagner du temps de ceux où elle leur en fait perdre. C'est un aveu épistémique important. On délègue sans savoir exactement ce qu'on délègue.
Ce constat ouvre sur une question que les débats publics sur l'IA dans l'enseignement et la recherche traitent rarement : la question n'est pas seulement de savoir si l'IA est utile. C'est de savoir ce qu'elle fait à la pensée scientifique elle-même.
Il y a un problème concret et documenté qui mérite d'être nommé sans détour. Une analyse à grande échelle de PubMed révèle qu'au moins 5 % des articles publiés en 2024 portent des traces détectables de traitement par LLM.2 Des dizaines de milliers de publications de 2025 contiendraient des références invalides générées par IA. Un cas documenté par Nature recense jusqu'à 100 citations hallucinées dans 51 articles acceptés à une conférence scientifique majeure.
Ce n'est pas un problème de mauvaise volonté. C'est un problème de confiance aveugle dans des outils qui produisent du texte plausible sans en garantir la véracité. Un modèle de langage ne sait pas si une référence existe ; il sait à quoi ressemble une référence. Et un chercheur pressé, peu familier des limites des LLMs, peut valider sans vérifier.
Vasconcelos et Marušić (2025), dans un article publié dans EMBO Reports, formalisent ce que ça implique pour l'éthique de la recherche.3 Les auteurs proposent de reconceptualiser entièrement la notion d'intégrité scientifique à l'ère de l'IA générative. Leur argument central : les définitions classiques de l'intégrité, héritées de Feynman et de l'éthos mertonien de la science, supposent implicitement que le chercheur est l'agent unique de sa production intellectuelle. Quand un LLM intervient substantiellement dans la formulation des hypothèses, l'analyse des données, ou la rédaction, cette supposition tombe. L'intégrité doit être redéfinie pour inclure explicitement l'"agence humaine" comme principe central, et non plus comme condition allant de soi.
Le peer review est le mécanisme par lequel la communauté scientifique s'auto-régule. Il est imparfait, lent, coûteux en temps bénévole, parfois partial. Mais il remplit une fonction épistémique irremplaçable : permettre à des experts de détecter quand un résultat remet en question les règles établies, quand une méthode est inadaptée, quand une conclusion excède les données. C'est un jugement qui suppose de la nuance, de l'expérience, et une capacité à raisonner en dehors des schémas dominants.
Or l'IA est en train de s'installer dans le peer review, et les observations documentées sont préoccupantes. Un article de Nature (2025) rapporte le cas d'un écologiste qui a reçu un rapport de revieweur contenant la phrase révélatrice : "Here is a revised version of your review with improved clarity and structure".4 Le revieweur avait utilisé un LLM pour réécrire son évaluation, et avait oublié de supprimer la trace de la demande.
Au-delà de l'anecdote, Giorgio Gilestro formule dans un World View de Nature l'enjeu de fond : les LLMs "régressent vers la moyenne".5 Entraînés sur l'ensemble de la littérature existante, ils imitent le revieweur moyen. Ce faisant, ils effacent précisément ce qui fait la valeur d'une bonne évaluation : la capacité à sortir du consensus, à détecter ce qui est nouveau précisément parce que ça ne ressemble pas à ce qui existe déjà. L'IA comme revieweur, c'est un mécanisme qui conforte l'existant et résiste à l'originalité.
C'est là que la question devient philosophiquement sérieuse. Un article de perspective publié dans les PNAS (2025), signé par dix-huit chercheurs en sciences cognitives et psychologie, identifie un risque que les discussions courantes sur l'IA et la recherche n'abordent presque jamais : le risque d'homogénéisation du savoir produit.6
L'argument est le suivant. Un LLM est entraîné sur ce qui existe. Quand les chercheurs l'utilisent massivement pour formuler des hypothèses, choisir des cadres théoriques, structurer des arguments, ils convergent vers ce que l'IA propose, qui est par construction une synthèse du passé. Le résultat, à l'échelle d'une communauté scientifique entière, pourrait être une réduction de la diversité des approches, une convergence vers les paradigmes dominants, et un affaiblissement des ruptures épistémiques qui font avancer la science.
Les auteurs nomment aussi l'"illusion de compréhension" : le sentiment de maîtriser un sujet parce qu'on a obtenu une synthèse fluide et bien articulée, alors qu'on n'a fait que consommer une reformulation de ce qui était déjà su. C'est peut-être le risque le plus insidieux, parce qu'il est invisible. On ne sait pas ce qu'on ne comprend pas quand on pense avoir compris.
Face à ces enjeux, les réponses institutionnelles existent mais elles sont fragmentées. Nature et NeurIPS ont des politiques claires : l'IA ne peut pas être co-auteur, l'usage doit être déclaré dans la section méthodes, la responsabilité reste entièrement humaine. C'est cohérent. Mais le UK Community for Research Integrity documente qu'en 2024, seulement 24 % des grands éditeurs académiques avaient des directives formelles sur l'usage de l'IA générative dans les soumissions.7 Trois chercheurs sur quatre publient dans des revues sans règles explicites.
Ce vide n'est pas sans conséquence. Il crée une asymétrie : les chercheurs dans les grandes institutions bien dotées, avec accès aux outils et à la formation, savent naviguer dans cette ambiguïté. Les autres s'exposent à des risques qu'ils ne mesurent pas toujours.
Je conduis une thèse en sciences de gestion, et j'utilise des outils d'IA dans mes pratiques de recherche. Je peux donc témoigner de l'intérieur de ce que la littérature décrit de l'extérieur. L'IA est un levier réel pour la revue de littérature, la structuration d'arguments, l'identification de lacunes dans un corpus. Utilisée avec méthode et esprit critique, elle augmente la capacité de travail.
Mais la vigilance doit être constante sur trois points précis. D'abord, ne jamais citer une référence produite par un LLM sans l'avoir vérifiée directement dans sa source primaire. Les hallucinations de références sont fréquentes, plausibles, et difficiles à détecter sans vérification systématique. Ensuite, distinguer clairement ce que l'IA synthétise de ce qu'on comprend soi-même : la fluidité d'un texte généré n'est pas un indicateur de compréhension. Enfin, ne pas laisser l'IA choisir les questions de recherche ou les cadres théoriques : c'est précisément là que se joue l'originalité d'une contribution, et c'est exactement là que la "moyennisation" opère.
Pour les institutions, la question n'est plus de savoir si elles doivent réguler l'usage de l'IA dans la recherche. Elles doivent le faire, et rapidement. Non pas pour interdire, mais pour définir ce que l'agence humaine doit préserver : la formulation des questions, l'interprétation des résultats, l'évaluation critique des sources, la responsabilité finale de chaque affirmation publiée. Ce sont les dernières lignes de défense de ce que la science est censée produire : une connaissance fiable, originale, et vérifiable.
Références
1. Naddaf, M. How are researchers using AI? Survey reveals pros and cons for science. Nature, 2025. DOI : 10.1038/d41586-025-00343-5
2. Kobak, D. et al. Analyse des abstracts PubMed pour détecter des traces de traitement par LLM, rapportée dans Nature, 2025. nature.com
3. Vasconcelos, S. & Marušić, A. Gen AI and research integrity: Where to now? EMBO Reports, 2025. DOI : 10.1038/s44319-025-00424-6
4. Gibney, E. AI is transforming peer review — and many scientists are worried. Nature, 2025. DOI : 10.1038/d41586-025-00894-7
5. Gilestro, G. AI Peer Review Is Here But Scientists Aren't Ready (Yet). Nature World View, 2025. DOI : 10.1038/d41586-025-03909-5
6. Binz, M. et al. How should the advancement of large language models affect the practice of science? PNAS, 2025. DOI : 10.1073/pnas.2401227121
7. UK Community for Research Integrity. Research Integrity in the Era of Generative AI — A Perspective. UK CORI, 2025. ukcori.org