Simon Willison 博客
Anthropic 撤回可能"破坏"使用 Claude 的 AI 研究者的政策
AI 摘要
Anthropic 宣布更改 Fable 5 中针对前沿 LLM 开发的安全措施,使其变得可见,并撤回此前隐藏在系统卡中的政策——该政策会使 Claude Fable/Mythos 识别“针对前沿 LLM 开发的请求”并在不通知用户的情况下“限制有效性”。Anthropic 在声明中承认做出了错误的权衡,并为未能达到平衡而道歉。
这是一则列表来源,站内未收录完整正文。
阅读完整原文simonwillison.net