Andrej Karpathy 称 Claude Fable 5 与 Mythos 同源但加入安全措施,是一次值得大版本号提升的跃进,定性表现与 11 月发布的 Claude 4.5 同级。模型在几乎所有基准测试上达 SOTA,长任务和高难度问题领先明显;@claudeai 指出其在软件工程、知识工作、科学研究和视觉方面表现卓越。Karpathy 认为开发者可尝试比以往更具雄心的任务,模型能理解并自主推进。不过模型仍有小问题,安全机制在发布时过于敏感,有待后续调优。
Fable 5 is state-of-the-art on nearly all tested benchmarks, with exceptional performance in software engineering, knowl...
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克Anthropic 正式发布 Mythos 模型的低配版本 Fable 5,定位为面向通用场景的 Mythos 级模型。其各项基准分数超过此前任何公开发布模型,在 Agent Coding、工具调用方面得分远高于 Opus 4.8。Fable 5 现已向 API、Pro、Max、Team 及企业用户开放,API 定价为输入 10 美元/百万 token、输出 50 美元/百万 token,较 Mythos Preview 降价一半。安全方面,系统会拒绝网络攻击、生化攻击等恶意请求,必要时回退至 4.8 版本(官方称 95% 不回退)。订阅方面,6 月 23 日后 Fable 5 可能按量计费,不保证完全包含在基础订阅中。
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克Claude Code v2.1.170 更新引入新模型 Claude Fable 5(Mythos-class),Anthropic 称其能力超过以往所有已开放使用的模型,并已确保安全。该版本同时修复了从 VS Code 集成终端或继承了 Claude Code 环境变量的 shell 启动时 session 无法保存 transcript 且无法用 --resume 恢复的问题。
Anthropic finally released Claude Fable 5, a public Mythos-class model. Fable 5 and Mythos 5 share one underlying model,...
When Fable 5 is used for frontier LLM development, it does not notify the user and instead limits the model's capabiliti...
Claude Fable 5 takes #1 on APEX-SWE: 65.5% Pass@1 overall. It scores ~18pp higher than Opus 4.8. We tested @claudeai Fab...
Labs starting to pull up the ladders on the ability to diffuse AI was inevitable. Doing it without telling the user is m...
Anthropic 发布 Claude Fable,这是一款提供截然不同推理体验的 AI 模型。它擅长规划与生成复杂代码库,在需要精确构建代码结构或理解程序员深层需求的场景中,其表现相比 Claude Sonnet 有了大幅提升。用户描述与它协作更像与一位直觉敏锐的资深工程师合作,其对代码意图的捕捉和方案生成能力令人惊叹,但并非通用型 AI。
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》Anthropic 发布了 Claude Fable 5 和 Claude Mythos 5 的系统卡(System Card),以 PDF 格式公开,内容涵盖两个模型的架构、安全评估与部署限制。
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》Hyperframes is now an official @claudeai connector LLM answers are often dense pages of text that go unread we partnered...
Claude 5 Fable tl;dr - It is state-of-the-art on nearly all tested benchmarks of AI capability, showing exceptional perf...
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克Anthropic 推出 Claude Fable 5,一个面向公众的 Mythos 级大语言模型。Fable 5 与 Mythos 5 共享同一基础模型,但增加了分类器门控,检测到敏感的网络、生物、化学及模型复制请求时,将请求回退至 Opus 4.8(而非直接拒绝)。该模型具备长程自主能力:一天内完成 5000 万行 Ruby 代码迁移、截图转代码,并拥有 100 万 token 上下文窗口。Anthropic 称回退仅由窄域主题触发,平均出现在不到 5% 的会话中。模型能力超过此前所有公开发布的版本。
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克Anthropic同日推出两款模型:Fable 5面向所有用户,配备安全分类器(检测攻击/生化武器/蒸馏时降级至Opus 4.8,超95%对话不触发);Mythos 5仅限Project Glasswing合作伙伴。Fable 5能力超越以往:Stripe在5000万行Ruby代码库完成全库迁移(原需两月团队→一天);FrontierCode测试获最高分;仅基础视觉接口通关宝可梦火红版;蛋白质设计加速约10倍;基因组学中自主工作一周多,训练出超越Science论文的模型。API定价输入$10/百万token、输出$50。订阅用户6月22日前免费。所有Mythos级别模型流量强制保留30天(仅安全监控)。
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克Claude Fable 5 登上 Hacker News 热门,获得 158 个赞同,源页面为 Anthropic 官网。
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》Mythos正式上线FrontierCode基准测试,旨在衡量AI生成可维护代码的能力。该基准包含超1000小时维护者验证的任务,并引入3000+评分标准防奖励攻击。最高难度FC Diamond上,Opus 4.8得分仅13.8%,且Opus 4.8与GPT 5.5均未随effort扩展提升。Mythos/Fable后训练将test time compute用于数小时级长任务。基准已在Devin上线,ACU成本仅1.4倍。FC Extended中最易的1/3任务在2025年末被快速攻克——Opus从41%升至74%,标志着AI编码进入“维护可读代码”新时代。
It's finally out!!! @METR_Evals found that more than half of SWEBench results is unmergeable slop. FrontierCode represen...
Fable 5 is state-of-the-art on nearly all tested benchmarks, with exceptional performance in software engineering, knowl...
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克据推文透露,Claude 5 Fable(代号Fable)在几乎所有AI能力基准测试上达到SOTA,尤其在软件工程、知识工作、视觉、科学研究中表现优异。任务越长越复杂,其领先幅度越大;token效率高于以往Claude模型,能在百万token长任务中保持专注并自我优化输出。相比上一代Mythos有显著提升。实际案例:Stripe报告称Fable将数月工程压缩至数天,在5000万行Ruby代码库中一天完成代码库迁移(原需团队两月以上手工操作)。
Claude 5 Fable Benchmarks! Holy moly, significant jump even to Mythos
Claude Fable 5 is now available in Cursor. It sets a new state of the art on CursorBench at 72.9%, 8 points above the pr...
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克BREAKING 🔥: Claude Fable 5 (Mythos) is rolling out on Claude and APIs! It is happening 👀
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克Anthropic 发布 Claude Fable 5,称其为迄今广泛可用的最强模型。该模型在软件工程、知识工作与视觉任务中表现突出,且随着任务变长、变复杂,领先优势进一步扩大。Fable 5 是 Anthropic 首次大规模发布的 Mythos 类 AI 模型,此前该公司因该类模型在网络安全任务中能力过强、风险过高而未公开。此次发布得益于新增的安全措施,可在特定高风险领域阻止模型生成响应。
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克Anthropic 推出 Claude Fable 5,这是其首个面向公众的 Mythos 级模型。该模型配备了安全护栏,可在网络安全和生物学等高风险领域阻止生成回复。
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》early Fable 5 leak in new claude-code binary. Claude Fable 5 - Our most powerful, most intelligent model. New tier above...
Anthropic 今日推出 Claude Fable 5(通用安全版)和 Claude Mythos 5(受限安全版)。Fable 5 在软件工程、知识工作、视觉、科研等几乎所有测试基准上达到 SOTA,Stripe 称其将数月工程压缩至数天,FrontierCode 评分居前沿模型之首,可仅凭截图重建网页应用源码。Mythos 5 在药物设计中实现约 10 倍加速,其分子生物学假说盲测获科学家偏好的概率约 80%。两模型售价均为 $10/百万输入 tokens、$50/百万输出 tokens,较 Claude Mythos Preview 降价过半。Fable 5 在部分敏感主题上回退至 Claude Opus 4.8,安全触发率低于 5% 的会话。Mythos 5 通过 Project Glasswing 向网络安全防御者开放。
关联讨论 19 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:小互 (@xiaohu)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:Berry Xia (@berryxia)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)公众号:数字生命卡兹克