Claude Fable 5 debuts at #1 on DeepSWE. It outscores the previous best by 3% and sets a new state-of-the-art on our long...
Claude Fable 5 debuts at #1 on DeepSWE. It outscores the previous best by 3% and sets a new state-of-the-art on our long...
新研究对Anthropic Fable 5和Opus 4.8进行自动化红队攻击,持续改写有害提示词直至模型拒绝或生成坏答案。Fable 5最差攻击成功率6.1%,Opus 4.8为11.5%,证明最强LLM也无法完全免疫越狱——即便微小失败率,规模化自动化攻击仍可产生大量有害内容。旧式编码/角色扮演型越狱已非主要威胁,新弱点在于上下文:自适应攻击者在被拒后不断改写请求,寻找模型视为合法而非危险的框架。白宫与Anthropic正转向基于基准的测试框架,通过评分绕过程度、暴露能力、攻击可重复性及实际后果来量化越狱风险,而非追求不现实的完美免疫。
The White House and Anthropic may have found the first serious path to restore Mythos and Fable access without pretendin...
白宫与Anthropic正合作制定正式技术评估框架,用于量化AI模型越狱攻击的严重性,并建立标准化评估方法论。框架将开发通用基准,评估防护被绕过程度、暴露的能力、攻击可重复性及实际运营后果。双方认识到完全免疫越狱并非可行目标。近期红队研究表明,强化后的前沿模型Fable 5比Opus 4.8更鲁棒,但在持续自动化攻击下仍产生有害输出。新框架每次以相同问题衡量风险,被视为更务实的监管路径。
NEW: White House and Anthropic are working to create a formal technical assessment framework that can quantify the sever...
6月17日,智谱开源新旗舰GLM-5.2,在FrontierSWE编程测试中得分74.4,超OpenAI GPT-5.5,仅落后Claude Opus 4.8约1个百分点。有网友提问中国大模型何时达到Anthropic Fable水平,马斯克回复可能2027年Q1。智谱联合创始人唐杰回应不需那么久。马斯克补充,跑分赶上相对容易,但以实用性衡量,2027年Q1达到已非常出色。Anthropic Fable 5于6月9日发布,可处理5000万行代码迁移等任务,发布数日后遭管制。
Earlier today, ~3% of Claude Code Max and Pro users hit a bug that showed an incorrect weekly usage limit, and in some c...
In beta now with Okta and connectors from Asana, Atlassian, Canva, Figma, Granola, Linear, Slack and Supabase, with Slac...
美国政府短暂关闭了Mythos类中的Fable模型,标志着AI模型已越过危险门槛。作者预测最多两三代模型后,超级智能将像核武器一样被管控,大多数Fortune 500企业无法访问或仅受控使用。开源模型落后前沿约七个月,且面临算力和政府锁定的双重壁垒。人类的“辨别地平线”使许多人感觉模型进步停止,但实际指数增长未停——只是用户缺少足够困难的问题。Fable类已能解决此前Opus 4.8无法完成的复杂任务(如React客户端),AI将彻底改变编程和知识工作,但多数人只能使用当前等级模型。
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》Enterprise-Managed Authorization (EMA) 扩展现已稳定。该扩展允许组织通过受信任的身份提供商(如 Okta)集中控制 MCP 服务器的访问权限。终端用户首次登录即可自动连接所有已授权的 MCP 服务器,无需逐个执行 OAuth 授权。Anthropic 已在 Claude、Claude Code 和 Cowork 中实现该扩展,Visual Studio Code 也已支持。Asana、Atlassian、Canva、Figma、Granola、Linear、Supabase 等服务器已启用 EMA,Slack 正在添加支持。Microsoft、Okta 等也参与了采用。
美国政府对Anthropic最强大的AI模型Claude Mythos实施出口管制,导火索是该公司将访问权限授予韩国电信巨头SK Telecom,美方担忧SK Telecom与中国存在关联。随后亚马逊向白宫报告Mythos的公开版本Fable 5存在可被绕过的防护漏洞,加剧不信任。白宫命令Anthropic撤销所有外国国民(包括美国境内移民)对Mythos和Fable 5的访问权限,Anthropic因此完全禁用这两个模型。Mythos此前通过Project Glasswing向约150家组织开放,SK Telecom于本月早些时候获得访问权,其曾向Anthropic投资1亿美元。SK Telecom在2024年中国营收仅约190万美元,但其所属SK集团在华业务广泛,且与中国联通有过合资历史,引发审查。
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Claude Code v2.1.183 增强了自动模式安全性:未经请求时阻止 git reset --hard、git commit --amend(非本轮提交)、terraform destroy 等破坏性命令。新增 attribution.sessionUrl 设置,可省略 claude.ai 会话链接;/config --help 列出所有速记键;/config 切换行为改为 Enter/Space 变更、Esc 保存退出。修复了 thinking 块导致 400 错误、子智能体 WebSearch 空结果、vim 模式光标滞留、Windows Terminal TUI 错乱、多插件技能重复、MCP 认证存根暴露、tmux 面板启动失败、后台任务被杀、定时任务/Webhook 误判为键盘输入、focus mode 额外计时行等问题。
Nypost: Anthropic is trying to get Washington to reverse the US block on its most powerful Mythos Anthropic has proposed...
Announcing AA-Briefcase, the benchmark for the next era of agentic knowledge work AA-Briefcase is our new benchmark for ...
@yaojingang(姚老师)打磨的元Skill(创建Skill的Skill)已升级至2.0。该工具源自Anthropic官方泄露的Claude code源码,并整合了全网其他模型Skill,比官方Skill-creator更强大。用户可借助它写出90分的Skill。2.0版本已推送到GitHub,附带升级方案和对比报告。
终于完成了对元Skill(创建skill的skill)的2.0升级 已推送到GitHub 这两天又进行了一些微调和测试,欢迎体验 相关资源与文档分享: 1、元skill仓库:https://github.com/yaojingang/yao...
Artificial Analysis 推出新基准 AA-Briefcase,用于评估模型在长期知识工作项目中的智能体能力。基准包含 4 个私有场景(每项目需处理 25000+ Slack 消息、3500+ 邮件等碎片化上下文)及一个公开演示场景。评测结果:Claude Fable 5 以 Elo 1587 领先,其次为 Claude Opus 4.8(1356)、Opus 4.7 及智谱 GLM 5.2(max,1266)。成本方面,Claude Fable 5 平均每任务 $31,Opus 4.8 为 $10.40,GPT-5.5 (xhigh) 为 $3.68,GLM 5.2 (max) 为 $2.40,DeepSeek V4 Flash (max) 仅约 $0.04。所有模型中仅 3% 的任务满足全部标准,31/91 个任务无模型得分超 50%,显示真实世界复杂性仍是挑战。最佳性价比为开源权重模型 GLM-5.2 (max) 和 DeepSeek V4 Pro (max)。
Claude Code 新增 Artifacts 功能(Team 和 Enterprise 计划 beta 版)。用户可从 coding session 生成交互页面(如 PR 演示、项目 dashboard),通过私有链接分享给团队;页面随 session 自动刷新,调用代码库、插件、技能等全部上下文。该更新旨在将 Claude Code 从单人工具拓展为团队实时协作平台,解决上下文传递和版本同步痛点。
New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dash...
Claude Code 新增 Artifact 功能,可将终端会话中的 PR 走查、调试时间线等过程生成实时更新的交互页面,并通过私有链接分享给团队成员。Artifact 利用当前会话的完整上下文(代码库、外部工具、对话),随会话自动更新,支持历史版本回溯。默认私有,仅同组织认证成员可见。该功能以 beta 形式向 Claude Team 和 Enterprise 组织开放,通过 CLI 和桌面应用生成,个人用户暂不可用。Anthropic 内部测试显示调试场景最高频。
New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dash...
Artifacts draw on the full context of your session: codebase, plugins, skills, connected tools. They're private until yo...
Huge: Dean Ball, who helped shape the Trump administration's, heading to OpenAI. Via Axios This is an even more signific...
New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dash...
OpenAI今日取得重大胜利:Transformer架构发明者之一Noam Shazeer正式加入,他曾创立CharacterAI、通过27亿美元交易回归DeepMind并参与Gemini项目;曾帮助塑造特朗普政府AI政策的Dean Ball也加盟。The Information指出,Shazeer的招聘是AI人才战的重大胜利,他是支撑GPT系列模型的Transformer原始论文关键作者。Ball的加入使OpenAI能提前预判政策冲突并深入美国政府人脉圈,而其主要竞争对手Anthropic正面临政府关系困境。OpenAI成为Anthropic当前挣扎的最大受益者。
Huge: Dean Ball, who helped shape the Trump administration's, heading to OpenAI. Via Axios This is an even more signific...
@jietang @teortaxesTex On benchmarks, yes, but as measured by true usefulness even Q1 would be very impressive. Anthropi...
报道称,Anthropic关闭Claude Mythos与Fable 5的导火索是:SK Telecom通过合作伙伴项目Project Glasswing获取了Mythos访问权限,美国官员担忧其与中国关联,白宫要求切断访问,Anthropic立即执行。SK Telecom否认涉华,但其母公司SK集团在中国有重大商业利益。随后Amazon等公司指出Fable 5存在可绕过安全限制的漏洞。两起事件使白宫失去信心,强制两款模型完全下线。
Claude Code 现已支持 Artifacts,可将编程会话结果转为交互式网页并分享给团队。网页包含完整会话上下文(代码、工具、聊天记录),自动更新并保留版本历史。用户只需在会话中提出请求即获得链接,用于 PR 审查、事故时间线等场景。Artifacts 默认私有,仅组织内认证成员可见,管理员通过角色和保留策略控制访问。该功能以 beta 版向 Claude Team 和 Enterprise 客户提供,支持 CLI 和桌面应用。
New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dash...
从今日起,Claude Code 可将工作进度生成为 artifacts——实时、可分享的交互式网页,涵盖 PR 走查、系统说明、仪表盘、发布清单等。artifacts 基于会话完整上下文(代码库、连接器、对话)自动构建,更新时页面原地刷新,同事即时可见。默认仅作者可见,可分享给组织内成员,由管理员通过组织层级开关和角色权限管控。内部测试中最常见用例为调试:工程师调查事件,Claude Code 分析日志并发布包含时间线、嫌疑提交和错误率图表的 artifact,团队无需再“走过场式汇报”。
Claude Code 新增 Artifacts 功能,可从会话生成交互页面(如 PR 走查或项目仪表板),通过私密链接与团队分享,现已在 Team 和 Enterprise 计划中开放 Beta。宝玉点评道:“挺好的,好的功能就应该集成进去,共同学习共同进步。”
New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dash...
New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dash...
Claude Enterprise 推出企业托管授权功能,管理员可通过身份提供商(率先支持 Okta)为整个组织配置 MCP 连接器。用户首次登录 Claude 时自动获得授权,无需手动操作,实现零接触设置。该功能基于 Model Context Protocol 的 Enterprise-Managed Authorization 扩展构建,支持 Asana、Atlassian、Canva、Figma、Granola、Linear、Supabase 等 MCP 提供商,Slack 即将支持。授权管理集成到现有 IdP 工作流中,可按组限定范围、通过 IdP 快速撤销授权,并支持要求连接器仅通过 IdP 连接以隔离工作与个人使用。
Claude Code 提供七种自定义指令方式:CLAUDE.md(根目录始终加载,子目录按需加载)、规则(无范围或路径范围)、技能(按需调用,共享 token 预算)、子智能体(隔离上下文运行并返回最终消息)、钩子(生命周期事件触发,绕过压缩)、输出样式(注入系统提示,永不压缩)和附加系统提示(CLI 标志,仅单次有效)。每种方式在加载时机、压缩行为、上下文成本和适用场景上各有不同,例如 CLAUDE.md 适合存放构建命令与编码规范,路径范围规则避免无关上下文消耗,子智能体用于并行隔离任务,钩子用于确定性自动化(如运行 linter 或备份聊天记录)。
Anthropic 在 Project Fetch 第二阶段展示 Claude Opus 4.7 独立编程机器狗。Opus 4.7 用 12 分 7 秒完成 5 项任务,约为去年人类团队(借助 Opus 4.1)耗时 264 分钟的 20 倍,代码量从 10,309 行降至 1,045 行。速度提升源于快速选择正确接口并写出无需人类试错的脚本。但机器狗仍未能取球,失败原因在于闭环控制——机器人需根据飘移的球实时调整动作。AI 擅长将杂乱硬件转为可运行代码,但实时物理判断仍具挑战。
New Frontier Red Team blog: Phase 2 of Project Fetch, where we test how well Claude can program a robodog. Opus 4.7, on ...