论文中透着“AI味儿”,是怎么回事?这些期刊的AI比例,高到哪里去?
在学术论文写作领域,AI的渗透速度远超想象。当一篇论文里出现454个特定词汇时,往往意味着它可能经历了AI的深度加工。这种现象背后,折射出科研写作正在经历一场静默的革命。
说到底,谁先用AI写论文,谁就能先发论文。一些科学家早在三年前就尝到了AI带来的效率红利。他们用6个月时间,就掌握了多个医学领域的专业写作技巧,成功在各类期刊上发表论文。这种现象在生物医学领域尤为明显,从心脏病学到精神病学,从免疫学到外科学,AI写作的足迹无处不在。
但AI留下的痕迹远比想象中明显。图宾根大学的研究团队发现,AI特别偏爱使用"深入探讨""关键的""潜在的"等词汇,这些词在论文摘要中的出现频率比人类作者高出数倍。这种语言风格特征成为识别AI写作的重要线索。
研究人员对2010-2024年间的1510万篇生物医学论文摘要进行了词频分析。数据显示,2024年有454个词汇被AI使用频率显著提升。这些词汇多数属于风格化表达,如"深入探究""展示"等,它们的出现往往暗示着AI的介入。
具体来看,"深入探究"这个词的使用频率在2024年暴增28倍,"展示"的使用量也翻了10倍。这些词汇的高频出现,让AI写作的痕迹更加明显。研究人员通过计算超额频率差和超额频率比,量化了AI写作的特征。比如"potential"这个词,其超额频率达到9%,意味着至少9%的论文存在AI痕迹。
不同领域的AI使用率差异显著。计算生物学领域AI使用率高达20%,而传统临床领域不足5%。非英语国家的论文中,AI使用率接近20%,而英语国家仅5%左右。最夸张的是Sensors期刊的深度学习论文,AI使用率高达41%。
这种差异背后有深层原因。顶刊审稿严格、周期长,AI痕迹有更多机会被修改。而快审期刊往往保留原始AI写作风格。亚利桑那州立大学教授Subbarao Kambhampati指出,科学家们已经意识到AI的偏好特征,但具体原因仍不清楚。
一些研究者开始主动规避AI特征词。比如避免使用"深入探讨"这样的词汇,以免被怀疑使用AI写作。但也有学者完全不在乎,甚至在论文中注明"我是AI模型"。
AI写作引发的争议持续发酵。Science期刊调查显示,超过5000名研究人员对AI撰写论文的接受度存在分歧。有人担心AI会编造不存在的研究结论,比如让AI总结某领域进展时,它可能会嫁接相似研究的结论,甚至虚构数据。
这种现象正在改变学术写作的风格。当大家都用AI写作,论文的语言风格会越来越趋同,甚至讨论部分的逻辑框架都趋于一致。这可能扼杀创新思维,让科研写作陷入同质化困境。
斯坦福AI医学教育主任Jonathan H. Chen表示,目前学术界处于"灰色地带",像西部荒野一样模糊。这种模糊性引发了一个关键问题:如果投稿完全是AI写的,期刊该不该直接拒稿?
Keith Humphreys教授举了一个典型案例。他收到一封letter,评论了一篇刚发表的论文,写得有道理。但论文作者却说从未听说过这个作者,搜索发现此人发表了大量跨领域的letter和comment。这些文章都是AI生成的,作者可能是学术岗位,工资与发表量挂钩。
这种现象让学术界陷入两难。AI生成的letter写得不错,也不是传统意义上的欺诈。但同事指出,既然每个人都有聊天机器人,为什么要发表AI写的东西?任何想看分析的人都可以自己生成。
Humphreys认为,AI生成的社论可能有洞见,但缺乏人类作者的声誉和道德价值。当AI开始代笔,我们更需要思考:什么才是科研写作不可替代的核心?或许不是华丽的辞藻,而是对科学问题的深刻洞察,以及那份探索未知的真诚。