Anthropic同日推出两款模型:Fable 5面向所有用户,配备安全分类器(检测攻击/生化武器/蒸馏时降级至Opus 4.8,超95%对话不触发);Mythos 5仅限Project Glasswing合作伙伴。Fable 5能力超越以往:Stripe在5000万行Ruby代码库完成全库迁移(原需两月团队→一天);FrontierCode测试获最高分;仅基础视觉接口通关宝可梦火红版;蛋白质设计加速约10倍;基因组学中自主工作一周多,训练出超越Science论文的模型。API定价输入$10/百万token、输出$50。订阅用户6月22日前免费。所有Mythos级别模型流量强制保留30天(仅安全监控)。
Anthropic 今天同时发布了两个模型:Claude Fable 5 和 Claude Mythos 5。
两个模型用的是同一个底座,区别在于 Fable 5 加了一套安全分类器,面向所有用户开放;Mythos 5 去掉了部分安全限制,只给 Project Glasswing 的网络安全合作伙伴用。
简单说,Fable 5 就是"带护栏的 Mythos"。两个月前,Mythos Preview 还锁在大约 200 家防御机构手里,现在普通开发者也能用到同级别的能力了。
【Fable 5 的安全机制】
Fable 5 的安全机制不是传统的"拒绝回答",而是降级:当分类器检测到请求涉及网络安全攻击、生物化学武器相关内容或模型蒸馏行为时,会自动切换到 Opus 4.8 来回答,并告知用户发生了降级。Anthropic 给出的数据是,超过 95% 的对话不会触发降级。
Anthropic 也坦承分类器目前调得偏严,会误伤正常请求,后续会持续优化降低误报率。
【能力到底有多强】