Éducation

Scandale académique : des centaines de milliers d’articles scientifiques auraient été générés par l’IA ?

Quoc Duong DNUM_BBZAHZCACF 10:50

Une étude récemment publiée a choqué le monde universitaire en révélant qu’il pourrait y avoir des centaines de milliers d’articles scientifiques rédigés en tout ou en partie à l’aide de l’IA.

L'étude, publiée dans la prestigieuse revue Science Advances, a mis au point une méthode d'analyse linguistique extrêmement sophistiquée. Les chercheurs ont identifié 454 mots caractéristiques couramment utilisés par les grands modèles linguistiques (LLM) comme ChatGPT.

Ces mots incluent « recueilli », « englobant », « en plein essor » et de nombreux autres termes qui apparaissent inhabituellement fréquemment dans le texte généré par l’IA.

Appliquée à la base de données PubMed, qui stocke environ 1,5 million d'articles scientifiques chaque année, cette analyse a donné des résultats stupéfiants. Selon une étude du New York Times, environ 200 000 articles par an présentent des traces d'intelligence artificielle.

Cette réalité devient de plus en plus évidente à mesure que de plus en plus d'articles scientifiques contiennent de graves erreurs pointant vers l'IA. Subbarao Kambhampati, informaticien à l'Université d'État de l'Arizona, a présenté un exemple concret : un article dans le domaine de l'imagerie médicale contenait une réponse claire provenant d'un chatbot.

«

« Je suis désolé, mais je n'ai pas accès aux informations en temps réel ni aux données spécifiques des patients, car je suis un modèle de langage IA. »

Des erreurs plus subtiles, comme l'expression « régénérer la réponse », utilisée par ChatGPT pour recréer les réponses, ont été relevées dans de nombreuses études. Plus inquiétant encore, certains articles incluaient des références totalement inventées ou des images absurdes générées par l'IA.

Face à cette situation, la communauté scientifique se divise clairement en deux groupes. Si certains auteurs tentent de dissimuler leur utilisation de l'IA en ajustant leur langage et en supprimant des mots qui pourraient facilement être qualifiés d'« écrits par l'IA », d'autres font preuve de négligence ou ne se soucient guère de dissimuler leurs origines.

La tendance à dissimuler l’utilisation de l’IA devient de plus en plus sophistiquée, ce qui pose des défis majeurs au maintien de la transparence et de la qualité de la recherche scientifique.

bài báo khoa học - Ảnh 1.
Chaque année, des centaines de milliers d'articles scientifiques utilisent l'IA, en partie ou dans la totalité de leurs recherches - Photo : NREL

L'équipe a lancé un avertissement alarmant quant à l'impact potentiel de ce phénomène. Selon son évaluation, si l'utilisation incontrôlée de l'IA dans la rédaction scientifique se poursuit, elle pourrait avoir un « impact sans précédent sur la rédaction scientifique dans le domaine de la recherche biomédicale, dépassant même l'impact de la pandémie de COVID-19 ».

Le co-auteur de l'étude, Dmitry Kobak, a souligné l'importance de maintenir l'authenticité dans la recherche : « Je pense que pour quelque chose d'aussi important que la rédaction d'un résumé de recherche, vous ne devriez pas laisser l'IA le faire à votre place. »

Journal Nghe An en vedette

Dernier

x
Scandale académique : des centaines de milliers d’articles scientifiques auraient été générés par l’IA ?
ALIMENTÉ PARUNCMS- UN PRODUIT DENEKO