Giáo dục

Scandal trong giới học thuật: Hàng trăm nghìn bài báo khoa học bị phát hiện do AI tạo ra?

Quốc Duẩn 11/07/2025 10:50

Một nghiên cứu mới công bố đã khiến giới học thuật chấn động khi tiết lộ rằng có thể đã có tới hàng trăm ngàn bài báo khoa học được viết toàn bộ hoặc một phần bằng AI.

Nghiên cứu được công bố trên tạp chí uy tín Science Advances đã phát triển một phương pháp phân tích ngôn ngữ cực kỳ tinh vi. Các nhà nghiên cứu đã xác định được 454 từ ngữ đặc trưng mà các mô hình ngôn ngữ lớn (LLM) như ChatGPT thường sử dụng.

Những từ này bao gồm "garnered" (thu được), "encompassing" (bao trùm), "burgeoning" (nở rộ) và nhiều thuật ngữ khác có tần suất xuất hiện bất thường trong văn bản do AI tạo ra.

Khi áp dụng phương pháp phân tích này vào cơ sở dữ liệu PubMed - nơi lưu trữ khoảng 1,5 triệu bài báo khoa học mỗi năm, kết quả thu được thực sự gây sốc. Con số ước tính cho thấy ít nhất 200.000 bài viết mỗi năm có dấu vết của việc sử dụng trí tuệ nhân tạo, theo đánh giá của tờ New York Times.

Thực tế này trở nên rõ ràng hơn khi nhiều bài báo khoa học chứa đựng những lỗi nghiêm trọng cho thấy nguồn gốc từ AI. Nhà khoa học máy tính Subbarao Kambhampati từ Đại học Bang Arizona đã chia sẻ một trường hợp điển hình: một bài báo trong lĩnh vực chẩn đoán hình ảnh y khoa chứa đựng câu trả lời rõ ràng của chatbot.

"Tôi rất xin lỗi, nhưng tôi không có quyền truy cập thông tin theo thời gian thực hay dữ liệu bệnh nhân cụ thể vì tôi là một mô hình ngôn ngữ AI"

Những lỗi tinh vi hơn như cụm từ "regenerate response", một thuật ngữ đặc trưng của ChatGPT khi tạo lại câu trả lời đã xuất hiện trong nhiều nghiên cứu. Đáng lo ngại hơn, một số bài báo còn chứa các tài liệu tham khảo hoàn toàn bịa đặt hoặc hình ảnh vô lý do AI tạo ra.

Trước tình trạng này, cộng đồng nghiên cứu đang phân hóa thành hai nhóm rõ rệt. Trong khi một số tác giả cố gắng che đậy việc sử dụng AI bằng cách điều chỉnh ngôn ngữ và loại bỏ những từ ngữ dễ bị gắn mác "AI viết", thì một số khác lại tỏ ra bất cẩn hoặc không quan tâm đến việc che giấu nguồn gốc này.

Xu hướng che giấu việc sử dụng AI đang trở nên tinh vi hơn, đặt ra những thách thức lớn cho việc duy trì tính minh bạch và chất lượng trong nghiên cứu khoa học.

bài báo khoa học - Ảnh 1.
Hàng trăm nghìn bài báo khoa học mỗi năm bị phát hiện có sử dụng AI, dù là trong một phần hay toàn bộ nghiên cứu - Ảnh: NREL

Nhóm nghiên cứu đã đưa ra cảnh báo nghiêm trọng về tác động tiềm tàng của hiện tượng này. Theo đánh giá của họ, nếu tình trạng sử dụng AI một cách không kiểm soát trong việc viết bài báo khoa học tiếp tục diễn ra, nó có thể gây ra 'tác động chưa từng có tiền lệ đến việc viết lách khoa học trong lĩnh vực nghiên cứu y sinh, thậm chí còn vượt qua cả ảnh hưởng của đại dịch COVID-19'.

Đồng tác giả nghiên cứu Dmitry Kobak đã nhấn mạnh tầm quan trọng của việc duy trì tính chân thực trong nghiên cứu: "Tôi nghĩ rằng đối với việc quan trọng như viết phần tóm tắt của nghiên cứu, bạn không nên để AI làm thay mình".

Nổi bật Báo Nghệ An

Mới nhất

x
Scandal trong giới học thuật: Hàng trăm nghìn bài báo khoa học bị phát hiện do AI tạo ra?
POWERED BY ONECMS - A PRODUCT OF NEKO