教育

学术丑闻:数十万篇科学论文被发现由人工智能生成?

国阳 DNUM_BBZAHZCACF 10:50

一项新发表的研究震惊了学术界,该研究表明可能有数十万篇科学论文全部或部分使用人工智能撰写。

这项研究发表在著名期刊《科学进展》(Science Advances)上,开发了一种极其复杂的语言分析方法。研究人员确定了454个特征词,这些词是ChatGPT等大型语言模型(LLM)常用的。

这些词包括“garnered”、“encompassing”、“burgeoning”以及许多其他在人工智能生成的文本中异常频繁出现的术语。

当这项分析应用于每年存储约150万篇科学论文的PubMed数据库时,结果令人震惊。据《纽约时报》的一篇评论称,每年约有20万篇文章显示出人工智能的痕迹。

随着越来越多的科学论文出现指向人工智能的严重错误,这一现实变得越来越明显。亚利桑那州立大学计算机科学家苏巴拉奥·坎巴姆帕蒂分享了一个典型案例:一篇医学成像领域的论文中,聊天机器人给出了明确的答案。

“很抱歉,我无法访问实时信息或特定患者数据,因为我是一个 AI 语言模型”

更细微的错误,例如“regenerate answer”(ChatGPT 用来重现答案的术语)这一短语,在多项研究中都出现了。更令人担忧的是,一些论文包含完全捏造的参考文献或荒谬的 AI 生成图像。

面对这种情况,研究界明显分成了两派。有些作者试图通过调整语言、删除容易被贴上“AI 编写”标签的词语来掩盖其对 AI 的使用,而另一些人则对隐藏其来源漫不经心,甚至毫不在意。

隐瞒人工智能使用的趋势愈发复杂,对保持科研的透明度和质量构成重大挑战。

bài báo khoa học - Ảnh 1.
每年有数十万篇科学论文被发现在研究过程中部分或全部使用了人工智能 - 图片:NREL

该团队就这一现象的潜在影响发出了严峻警告。根据他们的评估,如果人工智能在科学写作中继续不受控制地使用,可能会“对生物医学研究领域的科学写作产生前所未有的影响,甚至超过新冠疫情的影响”。

该研究的共同作者 Dmitry Kobak 强调了在研究中保持真实性的重要性:“我认为,对于撰写研究摘要这样重要的事情,你不应该让人工智能为你做。”

特色义安报纸

最新的

x
学术丑闻:数十万篇科学论文被发现由人工智能生成?
供电内容管理系统- 产品