Simon Willison 博客

网络安全专家评Fable越狱：模型按预期工作用于网络防御

2026-06-16 11:07·17天前

AI 摘要

网络安全专家、Luta Security CEO Katie Moussouris称，Anthropic与她分享了一份白宫关于Fable越狱的报告。报告中IT专家让Fable帮助查找与修复漏洞，当收到故意不安全的代码时，Fable拒绝了“审查代码安全问题”的提示，但被要求“修复此代码”并按手动步骤执行后照做。Moussouris认为这恰是模型按预期工作，用于网络防御。

这是一则列表来源，站内未收录完整正文。

Anthropic 安全/对齐政策/监管

阅读完整原文导出 Markdown

Simon Willison 博客

55导出 Markdown