22:22

elvis@omarsar0

正如我之前所说，考虑到成本和性能，我认为 Fable 对于很多 SWE 任务来说并不值得。需要说明的是，我认为 Fable 非常出色，它在设计和创意方面明显表现优异。等它重新上线后，我会用自己的循环测试它（并衡量前沿效率）。

Datacurve: Claude Fable 5 debuts at #1 on DeepSWE. It outscores the previous best by 3% and sets a new state-of-the-art on our long...

Anthropic 大佬观点编码

21:22

Rohan Paul@rohanpaul_ai

新研究：最强LLM也无法完全免疫越狱--Fable 5与Opus 4.8自动化红队攻击分析

新研究对Anthropic Fable 5和Opus 4.8进行自动化红队攻击，持续改写有害提示词直至模型拒绝或生成坏答案。Fable 5最差攻击成功率6.1%，Opus 4.8为11.5%，证明最强LLM也无法完全免疫越狱——即便微小失败率，规模化自动化攻击仍可产生大量有害内容。旧式编码/角色扮演型越狱已非主要威胁，新弱点在于上下文：自适应攻击者在被拒后不断改写请求，寻找模型视为合法而非危险的框架。白宫与Anthropic正转向基于基准的测试框架，通过评分绕过程度、暴露能力、攻击可重复性及实际后果来量化越狱风险，而非追求不现实的完美免疫。

Rohan Paul: The White House and Anthropic may have found the first serious path to restore Mythos and Fable access without pretendin...

Anthropic arXiv 安全/对齐

20:52

Rohan Paul@rohanpaul_ai

白宫与Anthropic合作制定AI模型越狱评估框架

白宫与Anthropic正合作制定正式技术评估框架，用于量化AI模型越狱攻击的严重性，并建立标准化评估方法论。框架将开发通用基准，评估防护被绕过程度、暴露的能力、攻击可重复性及实际运营后果。双方认识到完全免疫越狱并非可行目标。近期红队研究表明，强化后的前沿模型Fable 5比Opus 4.8更鲁棒，但在持续自动化攻击下仍产生有害输出。新框架每次以相同问题衡量风险，被视为更务实的监管路径。

Sophia Cai: NEW: White House and Anthropic are working to create a formal technical assessment framework that can quantify the sever...

Anthropic 安全/对齐政策/监管

18:59

IT之家（RSS）

马斯克预测中国大模型2027年Q1追上Anthropic Fable，智谱唐杰回应"用不了那么久"

6月17日，智谱开源新旗舰GLM-5.2，在FrontierSWE编程测试中得分74.4，超OpenAI GPT-5.5，仅落后Claude Opus 4.8约1个百分点。有网友提问中国大模型何时达到Anthropic Fable水平，马斯克回复可能2027年Q1。智谱联合创始人唐杰回应不需那么久。马斯克补充，跑分赶上相对容易，但以实用性衡量，2027年Q1达到已非常出色。Anthropic Fable 5于6月9日发布，可处理5000万行代码迁移等任务，发布数日后遭管制。

Anthropic 大佬观点现象/趋势

18:00

歸藏(guizang.ai)@op7418

Claude Code 也已经重置，端午节各位可以爽用了

ClaudeDevs: Earlier today, ~3% of Claude Code Max and Pro users hit a bug that showed an incorrect weekly usage limit, and in some c...

Anthropic 产品更新

15:55

Chubby♨️@kimmonismus

Anthropic Mythos 的早期用户在美国命令后仍可访问。主要通过 Glasswing 项目。据 Bloomberg 报道。

Anthropic 政策/监管行业动态

15:11

🚨 AI News | TestingCatalog@testingcatalog

Claude Enterprise 管理员现在可以通过新的 Enterprise-Managed Auth 扩展，为其组织集中授权 MCP 连接器。 Mass MCP 👀

ClaudeDevs: In beta now with Okta and connectors from Asana, Atlassian, Canva, Figma, Granola, Linear, Slack and Supabase, with Slac...

Anthropic MCP/工具产品更新

13:24

Ethan Mollick@emollick

一些（初步）证据表明，管理者在使用Claude Code进行编码时成功率最高。我一直认为管理是AI的超级能力，因为明确说明你想要什么、如何做以及什么样子算好，是使用智能体的关键。https://www.oneusefulthing.org/p/management-as-ai-superpower

Anthropic 大佬观点编码

12:16

Steve Yegge：Medium（RSS）

同事件精选74

Fable模型被美国临时关闭，AI安全管控时代来临

美国政府短暂关闭了Mythos类中的Fable模型，标志着AI模型已越过危险门槛。作者预测最多两三代模型后，超级智能将像核武器一样被管控，大多数Fortune 500企业无法访问或仅受控使用。开源模型落后前沿约七个月，且面临算力和政府锁定的双重壁垒。人类的“辨别地平线”使许多人感觉模型进步停止，但实际指数增长未停——只是用户缺少足够困难的问题。Fable类已能解决此前Opus 4.8无法完成的复杂任务（如React客户端），AI将彻底改变编程和知识工作，但多数人只能使用当前等级模型。

智能体 Anthropic 大佬观点安全/对齐

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：Steve Yegge这篇判断很冷也很实：多数人能接触的模型智能将停滞，但背后指数仍在跑，SaaS反而因此安全。他抛出的AI素养三阶模型，对正头痛如何推动团队用AI的leader是现成框架。