Simon Willison 博客
网络安全专家评Fable越狱:模型按预期工作用于网络防御
AI 摘要
网络安全专家、Luta Security CEO Katie Moussouris称,Anthropic与她分享了一份白宫关于Fable越狱的报告。报告中IT专家让Fable帮助查找与修复漏洞,当收到故意不安全的代码时,Fable拒绝了“审查代码安全问题”的提示,但被要求“修复此代码”并按手动步骤执行后照做。Moussouris认为这恰是模型按预期工作,用于网络防御。
这是一则列表来源,站内未收录完整正文。
阅读完整原文simonwillison.net