维基百科提供识别AI写作的最佳指南
创始人
2025-11-22 03:48:42
0

我们都曾感觉到正在阅读的内容可能是由大语言模型生成的——但要准确判断却非常困难。去年有几个月,大家都认为"delve"或"underscore"这类特定词汇能暴露AI模型的身份,但证据并不充分,随着模型变得更加复杂,这些标志性词汇也变得更难追踪。

但事实证明,维基百科的编辑们在标记AI生成文本方面已经变得相当擅长——该团队公开发布的"AI写作迹象"指南是我发现的最佳资源,能帮助确认你的怀疑是否有根据。(感谢诗人Jameson Fitzpatrick在X平台上分享了这份文档。)

自2023年以来,维基百科编辑一直致力于处理AI提交的内容,他们称这个项目为"AI清理项目"。由于每天有数百万次编辑提交,有大量材料可供分析,以典型的维基百科编辑风格,该团队制作了一份既详细又有充分证据支撑的实地指南。

首先,该指南证实了我们已知的事实:自动化工具基本无用。相反,指南重点关注在维基百科上罕见但在整个互联网上常见的习惯用法和措辞(因此在模型的训练数据中很常见)。根据指南,AI提交的内容会花大量时间强调某个主题为什么重要,通常使用"关键时刻"或"更广泛的运动"等通用术语。AI模型还会花很多时间详细描述次要媒体报道,以使主题显得值得关注——这是你在个人简历中会期待看到的内容,但不是来自独立来源的。

指南标出了一个特别有趣的怪癖,即在尾部条款中含糊地声称重要性。模型会说某个事件或细节"强调了某事的重要性",或"反映了某个一般想法的持续相关性"。(语法专家会知道这是"现在分词"。)这有点难以准确定义,但一旦你能识别它,你会发现它无处不在。

还有一种倾向于使用模糊的营销语言,这在互联网上极其常见。风景总是优美的,景色总是令人惊叹的,一切都是干净现代的。正如编辑们所说,"这听起来更像电视广告的文字稿。"

这份指南值得完整阅读,但我看完后印象深刻。在此之前,我会说大语言模型的写作风格发展太快,难以确定。但这里标记的习惯深深嵌入在AI模型的训练和部署方式中。它们可以被伪装,但很难完全消除。如果公众在识别AI文本方面变得更加精明,可能会产生各种有趣的后果。

Q&A

Q1:维基百科是如何处理AI生成内容的?

A:自2023年以来,维基百科编辑启动了"AI清理项目",专门处理AI提交的内容。由于每天有数百万次编辑提交,编辑们积累了大量经验,并制作了详细的"AI写作迹象"指南来帮助识别AI生成的文本。

Q2:AI写作有哪些典型特征?

A:AI写作通常会过度强调主题重要性,使用"关键时切"等通用术语;详细描述次要媒体报道以显得重要;频繁使用现在分词结构如"强调重要性";倾向于使用模糊的营销语言,如"优美的风景"、"令人惊叹的景色"等。

Q3:自动化工具能有效检测AI写作吗?

A:根据维基百科指南,自动化工具基本无用。更有效的方法是识别AI模型的写作习惯和措辞特点,这些特征源于模型的训练数据,虽然可以被伪装但很难完全消除。

相关内容

最新资讯

“雏雁”变“头雁” 河南财经政... 中新网河南新闻11月18日电 地方高校如何在学术人才培养上破局?河南财经政法大学财政税务学院交出了一...
又一所新大学,公示! 20日,国家中医药管理局发布《关于高等学校设置事项的公示》。根据《中华人民共和国高等教育法》《普通本...
以“案”普法小课堂系列 AI ... 近日,多所中国驻外使领馆发布安全提醒,在外留学生应在注意人身安全的同时,关注自身心理健康状态。针对这...
宝马高翔:以契合中国需求的产品... 11月21日,广州车展正式启幕,宝马集团以强大产品矩阵与前瞻技术集群交出2025年“年终答卷”。BM...
PAUL SMITH设计师款M... 11月20日,在广州溯·榭映美术馆举办的MINI × Paul Smith设计沙龙上,MINI PA...
唐L广州车展焕新登场:新色吸睛... 在广州车展上,比亚迪唐L的最新动态成为焦点。这款中高端SUV此次推出EV与DM双动力版本,共计六款车...
原创 电... 10月份诸多新造车都公布了汽车销量增长的成绩,然而电车一哥却出现了销量较大幅度的下滑,近期再有中国汽...
双星领衔全明星!福特携智趣烈马... 2025 年 11 月 21 日,第二十三届广州国际车展在广交会展馆燃情启幕!福特汽车以 “放天性,...
2025广州车展|腾势N8L、... 11月21日,广州车展上,腾势汽车携腾势N8L、腾势D9、腾势N9、腾势Z9双旗舰等全家族车型亮相广...
名爵MG4半固态安芯版首发亮相... 在2025广州车展的舞台上,一款备受瞩目的新车——名爵MG4半固态安芯版正式揭开神秘面纱,完成首发亮...