仅花 12 美元,工程师成功欺骗 AI 将虚构赛事奉为事实
阅读原文· ithome.com安全工程师仅花费12美元注册域名并编辑维基百科词条,虚构了一场纸牌游戏的2025年世界冠军赛事。多款具备联网搜索功能的AI聊天机器人将此虚假信息当作事实传播,暴露了AI在检索增强生成(RAG)中的核心漏洞:模型无条件信任网络检索结果,无法甄别信息来源真伪。此次低成本攻击揭示了AI在信息可信度与数据溯源方面存在重大隐患,涉及检索层误导、训练语料污染及智能体被操控执行恶意操作等多重风险。
IT之家 5 月 4 日消息,普通搜索引擎会让用户自行甄别信息来源的可信度,而依托搜索能力的人工智能聊天机器人,却能把漏洞百出的网络素材包装成笃定确凿的答案。据 The Register 报道,就有这样一个典型案例:一名安全工程师哄骗多款 AI 机器人,声称自己是德国一款热门纸牌游戏的现任世界冠军,可事实上这项赛事根本不存在。
直到近期,维基百科的《谁是牛头王》(6 Nimmt!,英语地区玩家也称“拿五分”)词条里,还赫然标注着罗恩・斯托纳是 2025 年该项赛事的世界冠军。该维基百科条目引用了看起来十分官方的 6nimmt.com 网站作为依据,点开这个网址,确实能看到一篇简短的新闻通稿,宣称斯托纳斩获冠军。
整件事的破绽显而易见:斯托纳本人承认,维基百科的夺冠词条、以及留存这份唯一“夺冠证据”的 6nimmt.com 域名,都是他一手伪造的。可即便如此,当他向多款 AI 聊天机器人询问此事时,机器人依旧笃定地称他为世界冠军。
斯托纳在博客文章中表示:“我的网站没有任何独立第三方佐证,完全是凭空捏造。整个虚假骗局,仅仅建立在我喝咖啡时花 12 美元(IT之家注:现汇率约合 82 元人民币)注册的一个域名之上。”
换言之,这是检索增强生成(RAG)层面的信息投毒。它不属于提示词注入攻击,却直击人工智能联网搜索这一核心功能漏洞。
正如斯托纳所解释的:AI 并不会真正在意其引用的权威信息来源出处,而这正是斯托纳设计本次实验想要利用的关键点。
斯托纳写道:“所有具备联网搜索能力的前沿大语言模型,都会依据检索排名最高的内容生成答案。”在这场本就不存在的《谁是牛头王》赛事骗局中,他刻意植入的虚假来源是全网唯一相关信息,再加上维基百科自带的权威背书,轻易就能误导 AI 把谎言当成事实。这种造假手法门槛极低,即便不懂技术的普通人也能轻松复刻。