Simon Willison 博客

Anthropic 撤回可能"破坏"使用 Claude 的 AI 研究者的政策

2026-06-11 11:45·21天前

AI 摘要

Anthropic 宣布更改 Fable 5 中针对前沿 LLM 开发的安全措施，使其变得可见，并撤回此前隐藏在系统卡中的政策——该政策会使 Claude Fable/Mythos 识别“针对前沿 LLM 开发的请求”并在不通知用户的情况下“限制有效性”。Anthropic 在声明中承认做出了错误的权衡，并为未能达到平衡而道歉。

这是一则列表来源，站内未收录完整正文。

Anthropic 大佬观点安全/对齐

阅读完整原文导出 Markdown

Simon Willison 博客

62导出 Markdown