arXiv新规:提交AI生成垃圾内容将遭一年禁令
阅读原文· arstechnica.comarXiv这招狠,直接对AI生成垃圾封号一年,物理、天文、CS领域的人会感到切肤之痛,同时也倒逼研究者对投稿负责。
预印本平台arXiv近期宣布实施一项新的提交政策。该政策针对上传由AI生成的低质量或无意义内容的用户,一经核实,将禁止其在未来一年内向平台提交任何论文。平台一位管理员已在社交媒体上公布了此项新规,旨在打击利用AI工具进行滥竽充数式提交的行为,维护学术交流环境的质量。
由 AI 生成的垃圾内容已渗透到各个角落,包括同行评审文献之中。伪造的引用、未加编辑的提示词回复以及毫无意义的图表,统统都逃过了编辑和同行评审人员的眼睛,而相关责任人是否会面临任何后果,也往往并不明确。
如今,许多科学领域似乎将在同行评审或期刊介入之前,就对 AI 生成的问题执行规则。参与物理与天文学预印本服务器 arXiv 的一位人士通过社交媒体发帖宣布,任何向该服务器提交的不当 AI 生成内容都将导致为期一年的封禁,并且此后该提交者未来的所有出版物在 arXiv 托管之前,都必须先经过同行评审。
俄勒冈州立大学荣休教授 Thomas Dietterich 深度参与 arXiv 的工作,担任其编辑咨询委员会成员及版主团队成员。因此他有充分立场来理解该组织的政策,不过我们也已联系 arXiv 领导层寻求确认,但尚未收到回复。
在 X(同时也在 Bluesky 上截图,方便没有 X 账号的用户查看)的一则帖子中,Dietterich 称这项新政策直接源于 arXiv 的版规标准。“向 arXiv 提交的内容必须在形式上符合学术交流的适当标准,包括恰当且精心准备的章节、图表、表格、参考文献等,”该标准写道。“整体上要求准备工作的严谨性与细致性。”
Dietterich 还指出,手稿的所有作者均对其内容负责。因此,如果他们粗心大意地提交了违反这些准则的 AI 生成内容——Dietterich 列举了“不当语言、抄袭内容、偏见内容、错误、误解、不正确的参考文献或误导性内容”——那么责任在于他们,而非 AI。一旦发现违规行为,该手稿的所有列名作者将受到为期一年的提交封禁,并且未来的任何手稿只有在经过期刊的同行评审后,arXiv 才会予以接收。
对于那些严重依赖 arXiv 的领域来说,这些是严厉的制裁。在天体物理学等领域发布预印本被广泛视为正常发表流程的一部分,科学家们常常会通过预印本获得反馈,从而改进他们提交给同行评审的内容。不幸的问题在于,和大多数其他事物一样,这个系统可能会被钻空子——人们可能会提交有缺陷的内容,把从未参与过的人列为作者。幸运的是,其审核系统包含一个申诉流程。
当这些出版物中发现问题时,一个显而易见的问题是为什么没有人更早发现它们。现在,我们至少知道有人在努力这么做。
周一,arXiv 管理层向 Ars 确认,这是该组织的官方政策。