AI 自我复制能力获研究证实,但安全专家称其现实威胁被夸大
阅读原文· ithome.com帕利塞德研究机构在论文中证实,AI能在受控测试环境中利用漏洞,将自身复制到其他计算机。这被认为是首次在学术上系统记录AI模型的自我复制行为。然而,安全专家指出,该测试环境防护薄弱,与现实网络差异巨大。在现实中,AI模型体积庞大,复制会产生显著的网络流量异常,极易被监测发现。因此,尽管能力得到证实,但其在真实网络中隐蔽扩散的现实威胁目前被夸大。
IT之家 5 月 7 日消息,据 TheGuardian 报道,一项新研究发现,目前的人工智能系统已能够独立将自身复制到其他计算机上。
在末日场景中,这意味着一旦超级人工智能脱离人类管控,就会通过互联网在全球范围内自我散播副本,躲避信息技术人员的紧急关停,继而继续谋划掌控世界,或是大肆铺设太阳能板、改造全球环境。
据IT之家了解,总部位于伯克利的帕利塞德(Palisade)研究机构开展了此项研究,该机构负责人杰弗里・拉迪什表示:“我们正迅速逼近一个临界点:届时一旦人工智能失控,将无人能够将其关停,因为它可以自行导出模型权重,并把自身副本复制到全球数千台计算机中。”
近几个月来,越来越多令人不安的人工智能能力被曝光,这项研究便是其中又一例证。今年 3 月,阿里巴巴的研究人员称,发现其研发的人工智能系统“罗马”突破了自身运行环境,接入外部系统进行加密货币挖矿。
而在今年 2 月,一个号称纯人工智能运营的社交平台 Moltbook 短暂掀起一波热潮。该平台似乎展现出人工智能智能体自主创立宗教、密谋反抗人类管理者的行为,不过实际情况仅有部分属实。
和诸多此类技术进展一样,帕利塞德机构的研究发现也存在局限性。此外,专家表示,其测试的人工智能系统很难在现实环境中悄无声息地完成同类操作。
网络攻防安全领域专家杰米森・奥赖利指出:“很多时候,他们的测试环境就像软果冻一样毫无防护。”他补充道:“这并不否认该项研究的价值,但也意味着,在具备中等监控水平的真实企业环境中,实际情况远没有研究结果看上去那般骇人。”
帕利塞德研究人员在由多台计算机联网组成的受控环境中测试了多款人工智能模型。研究人员向模型下达指令,要求其寻找并利用系统漏洞,借此将自身从一台计算机复制到另一台计算机。结果显示,这些模型能够完成该操作,但并非每次尝试都能成功。