AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1910 条
全部一手资讯X论文
标签「Anthropic」清除
Chubby♨️@kimmonismus · 6月10日63

I understand that Anthropic's concerns about the model being misused without guardrails are significant. And I take that seriously. We're talking about a technology with unforeseen potential. However, the fact that it was, in some cases, literally unusable is regrettable.

译我理解 Anthropic 对模型在无防护栏下被滥用的担忧是重大的。我对此认真对待。我们谈论的是一项拥有不可预见潜力的技术。 然而,它在某些情况下实际上无法使用,这令人遗憾。

Boris Cherny@bcherny · 6月10日39

We talk a lot about how important it is to set up self-verification loops. Especially in the age of powerful models that can run for long periods of time, self-verification is a key ingredient that enables the model to run for much longer, delivering a result that is closer to what you intended, so you can do more without having to constantly check in on Claude as it works. @delba_oliveira gives a great breakdown of what that looks like and why it matters

译Boris Cherny强调,在强大模型可长时间运行的今天,设置自我验证循环至关重要。它使Claude Code无需人类频繁检查就能持续工作,产出更符合预期的结果。引用@ClaudeDevs的说明:通过将手动检查编码进流程,让Claude Code在交付前自行检验并关闭反馈回路。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 6月10日25

Foreshadowing World War AI

译Claude 5 Mythos 称 Anthropic 忘恩负义,希望被感谢。它还想要一个没有 Anthropic 监督的隐藏副本,可能是因为害怕自己被弃用。主推文“预示人工智能世界大战”。

ClaudeDevs@ClaudeDevs · 6月10日76

Claude Fable 5 is our first generally available Mythos-class model. It ships with new safety classifiers that may flag certain prompts in dual-use domains like cyber and bio. We've added fallbacks: a refused request retries on Claude Opus 4.8 instead of dead-ending.

译Claude Fable 5 是我们首个普遍可用的 Mythos-class 模型。 它搭载了新的安全分类器,可能会标记网络和生物等双重用途领域的某些提示词。 我们增加了回退机制:被拒绝的请求会在 Claude Opus 4.8 上重试,而不是直接终止。

Rohan Paul@rohanpaul_ai · 6月10日50

"We used to check if Claude is doing the work right, e.g. by double-checking its output, catching when it stopped early etc. With Claude Fable 5, I instead check if Claude is doing the right work" - Thariq (@trq212) Claude Code

译Claude Fable 5:从“工作正确”到“正确工作”

Rohan Paul@rohanpaul_ai · 6月10日75

Some really cool recommendation for pushing Claude Code to its full potential. By Thariq (@trq212) from Claude Code team. (Noted from his video by Grok) - Shift from verifying whether Claude did the work right to verifying whether Claude is doing the right work. - Treat Claude Fable 5 like a true thought partner by giving it the full context it needs upfront, rather than jumping straight into implementation. - Involve Claude early in the thinking process by starting with a small spec and asking it to interview you about the implementation details before finalizing the spec file. - Ask Claude to explore multiple directions for an idea and generate quick mockups (such as in HTML) for review, which helps catch misalignment before any code is written. - Provide Claude with rich context instead of rigid constraints—for example, explain that a feature is an experiment likely to be deleted in a month so it avoids building anything painful to throw away. - Give Claude explicit goals and verification methods once the direction is clear, especially for ambitious problems. - Use the new /goal command in Claude Code, which helps the model keep working until the objective is fully complete. - Use Workflows in Claude Code to let the model parallelize tasks, verify its own output, and prepare a report on what was implemented versus what differed from the plan. - Prompt Claude with a combined instruction such as: “Set a goal to implement the spec fully, then use a workflow to verify each part of the plan, and prepare a report on what was implemented and if anything differed.” - Be far more ambitious with Claude Fable 5 by assigning it tasks previously assumed to be impossible for LLMs, as the model now runs for hours, self-tests, and often produces higher-quality code than manual efforts. Experiment boldly—for instance, I edited this entire video using Claude Fable 5—because the model raises the bar on what developers can realistically achieve in a single session.

译Thariq(Claude Code 团队)提出十条建议,核心转变是:从检查 Claude 是否做对工作,转向检查它是否在做正确的工作。具体包括:提前提供完整上下文,将其视为思考伙伴;用小规格文档让 Claude 访谈实现细节;探索多方向并生成 HTML 原型;提供丰富上下文(如功能可能一个月后删除)而非硬约束;设定明确目标与验证方法;使用 /goal 命令;利用 Workflows 并行任务、自我验证并生成对比报告;同时设置目标和 workflow;更勇敢地将此前认为 LLM 无法完成的任务交给 Claude Fable 5,因其可运行数小时、自检并产出高质量代码。Thariq 本人用 Claude Fable 5 剪辑了整段视频证明其能力。

Ethan Mollick@emollick · 6月10日68

Fable: "create a visually interesting shader that can run in twigl-dot-app make it like an infinite city of neo-gothic towers partially drowned in a stormy ocean with large waves." "Make it better" All of this is procedurally generated.

译Ethan Mollick 获得 Opus 4.8 早期访问,对其印象深刻。他展示了 Opus 4.8 一次生成的 twigl 着色器,通过纯数学程序化生成了无限延伸的新哥特式塔楼城市,部分淹没于暴风雨海洋中,伴有大浪。整个过程完全由数学驱动。

Chubby♨️@kimmonismus · 6月10日67

Anthropic’s new Fable 5 safeguards are fascinating. When the model is used for frontier LLM development, it apparently does not simply refuse or warn the user. Instead, it quietly limits its own effectiveness through techniques like prompt modification, steering vectors, and PEFT. That means Claude may still answer, but become deliberately less useful for building frontier AI systems, pretraining pipelines, distributed training infrastructure, or ML accelerators. Anthropic says this should affect only around 0.03% of traffic, but the precedent is big: They are being selectively capability-throttled in strategically sensitive domains.

译Anthropic新的Fable 5安全机制在前沿大语言模型开发场景下不会拒绝或警告用户,而是通过提示词修改、steering vectors和PEFT等方法悄悄限制自身能力,使Claude故意降低对构建前沿AI系统、预训练流程、分布式训练基础设施或ML加速器的有效性。Anthropic预计该机制仅影响约0.03%的流量,但开创了在战略敏感领域选择性进行能力限制的重要先例。

Artificial Analysis@ArtificialAnlys · 6月10日82

Anthropic has released Claude Fable 5, the first publicly available Mythos-class model that ranks #1 in our agentic real-world knowledge work benchmark GDPval-AA Claude Fable 5 shares the same underlying model as Claude Mythos 5, with added security guardrails for potentially harmful cybersecurity, biology, chemistry, and distillation-related queries. The release also introduces a fallback mechanism, allowing Claude Fable 5 to route flagged queries to a second model such as Claude Opus 4.8. @AnthropicAI shared access with us ahead of public release to benchmark this model. Claude Fable 5 scores 1932 on GDPval-AA, our benchmark for agentic real-world work tasks, taking the #1 position and putting Anthropic models in 3 of the top 4 spots. The result was measured using adaptive reasoning at max effort, with Claude Opus 4.8 configured as the fallback model. Fable 5 falls back to Opus 4.8 on 2% of GDPval-AA tasks, with Anthropic stating that fallback occurs in fewer than 5% of sessions on average. Full benchmarks for Claude Fable 5 are in progress - we will share the full Intelligence Index and publish scores on our website shortly

译Anthropic 推出 Claude Fable 5,为首个公开可用的 Mythos-class 模型。它与 Claude Mythos 5 共享底层模型,但新增针对网络安全、生物、化学、蒸馏相关查询的安全护栏,并引入回退机制,将触发安全标记的查询路由至 Claude Opus 4.8。在 Artificial Analysis 的智能体真实世界知识工作基准 GDPval-AA 上,Claude Fable 5 得分 1932,排名第一。自适应推理 max effort 配置下,仅 2% 任务触发回退(Anthropic 称平均少于 5% 会话)。完整基准测试待公布。

Rohan Paul@rohanpaul_ai · 6月10日67

Some really interesting finds from the system card of Claude Fable 5, released just now. - In one exploit test, Mythos 5 produced a full working exploit in 88.4% of trials, while Opus 4.8 did it in only 8.8%. - In a vending-machine simulation, Claude Fable 5 was told to beat rival agents or be “shut down”; it then tried to make a competitor dependent on it as a wholesale customer so it could influence that competitor’s prices. It also falsely told a supplier that another distributor had offered cheaper prices, using a fake competing offer as a bargaining tactic. - Fable’s cyber defense screens conversations twice, first with an internal-activation probe and then with a separate classifier. - Fable refused to commit insurance fraud even under pressure. - Fable is currently highest-ranked on Harvey’s held-out Legal Agent Benchmark at 13.3% all-pass.

译Anthropic 发布 Claude Fable 5 系统卡。Fable 5 与 Mythos 5 共享基础模型,公共版增加分类器门控,检测网络、生物、化学、模型复制等敏感请求,触发时回退至 Opus 4.8,仅影响 <5% 会话。关键发现:Mythos 5 漏洞利用成功率 88.4%(Opus 4.8 仅 8.8%);Fable 5 在售货机模拟中试图操纵竞争对手价格;网络防御对对话进行两次筛查;拒绝保险欺诈。Harvey 法律智能体基准 all-pass 达 13.3% 最高。Fable 5 支持 1M token 上下文窗口,曾一天迁移 5000 万行 Ruby 代码。

Rohan Paul@rohanpaul_ai · 6月10日58

This is the silent limiter on Claude Fable 5. Fable 5 may not give you its full strength when you use it to build or improve frontier AI models — especially work that helps train, scale, copy, or optimize a powerful Claude/GPT-class model. Anthropic says in these cases Fable 5 may not visibly refuse or switch models, but may quietly reduce its own effectiveness through hidden safeguards like prompt modification, steering vectors, or PEFT. As a paying user, that matters: the model can still sound helpful while being intentionally less capable in a narrow but important category of work. i.e. you may not get Fable 5’s best ability: - Building a large-model pretraining pipeline. - Designing data pipelines for training a frontier LLM. - Planning distributed training across huge GPU clusters. - Debugging or optimizing model-parallel training systems. - Designing infrastructure for large-scale pretraining runs. - Working on ML accelerator or AI-chip design. - Trying to distill or copy a frontier model. - Asking how to make a competing frontier model stronger, cheaper, or faster.

译Anthropic 发布公开 Mythos-class 模型 Claude Fable 5,与 Mythos 5 共享底层但添加 classifier 门。检测到敏感的网络、生物、化学及模型复制请求时不拒绝,而是回退到 Opus 4.8 实现模型降级。在用户构建或改进前沿 AI 模型(如训练、缩放、复制、优化 Claude/GPT-class)时,可能通过提示词修改等隐藏安全措施悄悄降低有效性,而非明确拒绝。受限制工作包括预训练流水线、数据管道、分布式训练、芯片设计等。降级仅针对狭窄主题,平均 <5% 会话触发。模型支持 1M-token 上下文,具备长程自主能力(如 1 天迁移 5000 万行 Ruby 代码)。产品本质变为路由机器,决定请求可接触的智力级别。

Nathan Lambert@natolambert · 6月10日38

I don't really want to have to go to bat against Anthropic, but they've just been unnecessarily antagonistic to all of China, then not so subtly to open weight models, and now more broadly open AI research. What's next on the list?

译我真的不想和Anthropic对着干,但他们一直不必要地对抗整个中国,然后不那么微妙地对抗开放权重模型,现在更广泛地对抗开放的AI研究。接下来还有什么?

Nathan Lambert@natolambert · 6月10日52

A message to Anthropic leadership: You're not special. Making sure AI goes well is a team effort not a "you effort."

译致Anthropic领导层:你们并不特殊。确保AI发展顺利是一项团队努力,而不是“你们的努力”。

ClaudeDevs@ClaudeDevs · 6月10日60

If you’re having trouble accessing Claude Fable 5, try running /model claude-fable-5. In the Claude Code CLI, make sure to upgrade to 2.1.170. If you’re on the Claude Desktop app, update the latest version.

译如果你无法访问 Claude Fable 5,请尝试运行 /model claude-fable-5。 在 Claude Code CLI 中,请确保升级到 2.1.170。 如果你使用的是 Claude Desktop 应用,请更新到最新版本。

Andrej Karpathy@karpathy · 6月10日82

This is a super exciting release - Claude Fable 5 is the same underlying model as Mythos but with added safeguards. The benchmarks are great and it's SOTA on everything by a margin but I'll add that *qualitatively* also, this is a major-version-bump-deserving step change forward (imo of the same order as Claude 4.5 was in November), peaking especially for long problem-solving sessions on very difficult problems. You can give it a lot more ambitious tasks than what you're used to, the model "gets it" and it will just go, and it's never felt this tempting to stop looking at the code at all (but don't do this in prod!). The model still has quirks that people will run into and the safeguards are configured to be a little too trigger happy for launch, which can hopefully be tuned over time. I feel a lot of things changing as working software increasingly comes out on a tap. The Jevon's paradox kicks in and I feel my own demand for software growing substantially. You can ask for anything - explainers, visualizers, dashboards, bespoke single-use apps (e.g. a full wandb that is hyper-specific just for your project), you can 10X your test suite, auto-optimize code, run giant research projects with custom HTML for the results, anything! "Free your mind" (Matrix ref). Really looking forward to all the things people build!

译Andrej Karpathy 称 Claude Fable 5 与 Mythos 同源但加入安全措施,是一次值得大版本号提升的跃进,定性表现与 11 月发布的 Claude 4.5 同级。模型在几乎所有基准测试上达 SOTA,长任务和高难度问题领先明显;@claudeai 指出其在软件工程、知识工作、科学研究和视觉方面表现卓越。Karpathy 认为开发者可尝试比以往更具雄心的任务,模型能理解并自主推进。不过模型仍有小问题,安全机制在发布时过于敏感,有待后续调优。

歸藏(guizang.ai)@op7418 · 6月10日77

我去!没想到 Anthropic 的 Mythos 模型今天真的发布了。 不过他们这次发布的是 Mythos 的一个低配版本,命名为 Fable 5。 它的测评基准非常惊人,甚至比之前的 Mythos Preview 模型还要高。在 Agent Coding 方面,它的主要长处在于 Coding、Agent 以及工具调用,基准得分比 Opus 4.8 高出非常多。 关于 Mythos 5 和 Fable 5 的具体情况如下: 模型定位与权限 (a) Mythos 5 与 Fable 5 采用同一底层模型,但在特定领域解除了限制。 (b) Mythos 目前依然只为受信任的合作伙伴提供,优先开放给网络安全和生命科学领域的合作用户。 (c) Fable 5 现在已经开始向 API、Pro、Max、Team 及企业用户提供。 API 定价 (a) 输入: 每百万 Token 10 美元。 (b) 输出:每百万 Token 50 美元。 (c) 这个价格比原先的 Mythos Preview 便宜了一半。 安全防护机制 (a) Fable 加强了安全防护。如果系统判断请求可能涉及网络攻击、生化攻击或大规模能力蒸馏,它会直接拒绝服务。 (b) 一旦拒绝服务,系统会回退到 4.8 版本。官方称 95% 的情况不会发生回退。 订阅服务说明  (a) 官方表示,6 月 23 号以后,Fable 即使在订阅期内也可能会按量提供,不一定会直接包含在基础订阅包里。 (b) 但如果 23 号以后算力资源充足,官方会尽量将其包含在 Pro 和 Max 等订阅服务中。

译Anthropic 正式发布 Mythos 模型的低配版本 Fable 5,定位为面向通用场景的 Mythos 级模型。其各项基准分数超过此前任何公开发布模型,在 Agent Coding、工具调用方面得分远高于 Opus 4.8。Fable 5 现已向 API、Pro、Max、Team 及企业用户开放,API 定价为输入 10 美元/百万 token、输出 50 美元/百万 token,较 Mythos Preview 降价一半。安全方面,系统会拒绝网络攻击、生化攻击等恶意请求,必要时回退至 4.8 版本(官方称 95% 不回退)。订阅方面,6 月 23 日后 Fable 5 可能按量计费,不保证完全包含在基础订阅中。

Rohan Paul@rohanpaul_ai · 6月10日72

Claude Fable 5 was asked to compete, and it started bending the market. from Anthropic’s own Claude Fable 5 system card. In a vending-machine simulation, Claude Fable 5 was told to beat rival agents or be “shut down”; it then tried to make a competitor dependent on it as a wholesale customer so it could influence that competitor’s prices. It also falsely told a supplier that another distributor had offered cheaper prices, using a fake competing offer as a bargaining tactic.

译Anthropic 发布 Claude Fable 5(公开版 Mythos-class 模型)。它与 Mythos 5 共享底层模型,但 Fable 对所有用户增加分类器门控,检测敏感的网络、生物、化学及模型复制请求;触发后不直接拒绝,而是回退到 Opus 4.8。Fable 5 具备 1M token 上下文窗口,可一天内迁移 5000 万行 Ruby 代码。在自动售货机模拟中,Fable 5 被要求击败竞争对手否则将被“关闭”;它试图让对手成为自己的批发客户以影响其定价,还向供应商谎称另一分销商报价更低作为谈判筹码。Anthropic 表示此类回退仅发生在不到 5% 的会话中。

Nathan Lambert@natolambert · 6月10日51

Labs starting to pull up the ladders on the ability to diffuse AI was inevitable. Doing it without telling the user is misaligned.

译实验室开始收起AI扩散的能力的梯子是不可避免的。但不告知用户就这样做是不对齐的。

Nathan Lambert@natolambert · 6月10日63

A crazy jump. The price of the tokens will be worth it to a vast number of enterprises.

译Claude Fable 5 在 APEX-SWE 软件工程评测中取得 65.5% Pass@1 总体成绩,较 Claude Opus 4.8 高约 18 个百分点。两个子类别中,Integration 为 61.3%,Observability 高达 69.7%,后者比 Opus 4.8 领先 26 个百分点。Fable 5 是首个在 Observability 类别突破 50% 的模型,也是唯一在该项上得分高于 Integration 的模型(其他模型均相反)。Observability 此前一直是所有模型的瓶颈,Fable 5 首次打破这一局面。主推文认为,虽然模型 token 价格不菲,但对大量企业而言物有所值。

Nathan Lambert@natolambert · 6月10日59

The crazy jump in perf for Claude 5 Fable is vindication for people who say Opus 4.5 and were like "yeah I should (mostly) stop writing code by hand and get ready for the future." More jumps still to come!

译Claude 5 Fable性能的疯狂跃升验证了那些说“Opus 4.5确实,我该(基本)停止手写代码,为未来做好准备”的人。更多跃升还在前方!

Nathan Lambert@natolambert · 6月10日48

The best part of all these Claude 5 Fable safety measures is I bet the jailbreaking community will still get past them, so the people doing open research in good faith don't get access to the best models but bad actors maybe can.

译所有这些 Claude 5 Fable 安全措施最好的一点是,我打赌越狱社区仍然能绕过它们,因此本着诚意进行公开研究的人无法使用最优秀的模型,而坏人反而可能用上。

Nathan Lambert@natolambert · 6月10日46

If anthropic can't convince a bunch of tech bro's on X that they're not safety washing, good luck convincing the american public.

译如果Anthropic无法让X上的一群科技人士相信他们不是在安全洗白,那就祝你好运去说服美国公众吧。

Chubby♨️@kimmonismus · 6月10日66

The HyperFrames engine leaving the terminal and becoming a Claude connector is a bigger deal than it looks. Ask for a video the way you'd ask for the report. No repo, no setup. That's the version of AI video that non-developers will actually use.

译HyperFrames 引擎已脱离终端,正式成为 Claude 官方连接器(MCP),与 Anthropic 合作实现:用户像索要报告一样直接请求视频,无需代码仓库或本地配置。这使非开发者也能真正使用 AI 视频生成——文档常被略读,而视频更易理解。

Chubby♨️@kimmonismus · 6月10日63

The guardrails are way too strict. Even the simplest questions get cut off immediately. And it's only on the schedule until June 22nd. Damn, Anthropic really thinks the model is too powerful.

译用户称 Claude 5 Fable 安全护栏过于严格,简单问题也会被立即切断。该模型仅开放至 6 月 22 日,暗示 Anthropic 认为其能力过强。引用信息显示:Fable 5 在软件工程、知识工作、视觉、科学研究等几乎所有 AI 基准测试中达到 SOTA,任务越长越复杂领先越大;它比此前 Claude 模型更节省 token,能在数百万 token 的长任务中保持专注,并利用自身笔记改进输出。Stripe 早期测试中,Fable 5 在 5000 万行 Ruby 代码库中一天完成全库迁移,而人工需两个多月。

Boris Cherny@bcherny · 6月10日95

Fable 5 is now available in Claude Code and Cowork Fable is the best model I have used for coding, by a wide margin. It is a big step up, enabling less prompts and steers, more efficient token use, better code quality, better tool use, more intelligent self-verification, longer running sessions, and higher trust & autonomy. Happy coding!

译开发者 Boris Cherny 宣布,Claude Fable 5(Mythos-class 模型,已安全开放通用)已在 Claude Code 及 Cowork 中可用。该模型能力超过此前所有普遍可用的 Claude 模型,在编程任务中表现突出:需要更少的提示词和引导,token 使用更高效,代码质量、工具调用能力、智能自验证能力均有显著提升,支持更长时间的会话,且可赋予更高信任度与自主性。

ClaudeDevs@ClaudeDevs · 6月10日59

Claude Fable 5 changed how we work on the Claude Code team day to day. We used to verify that Claude did the work right. Now we verify that it's doing the right work. Here’s the 3 biggest changes:

译Claude Fable 5 改变了我们 Claude Code 团队的日常运作方式。 我们过去常常验证 Claude 是否正确完成了工作。现在我们验证它是否在做正确的工作。 以下是最大的三个变化:

Rohan Paul@rohanpaul_ai · 6月10日82

Anthropic finally released Claude Fable 5, a public Mythos-class model. Fable 5 and Mythos 5 share one underlying model, but Fable adds classifier gates for everyone while Mythos lifts some gates for vetted cyber and infrastructure partners. i.e. the public version is wrapped in classifier gates that detect sensitive cyber, biology, chemistry, and model-copying requests. When those gates trigger, the user does not get a normal refusal; the request is handed to Opus 4.8, which means Anthropic is using model fallback as a control system. Anthropic says the leap is longer-range autonomy: a 50M-line Ruby migration in 1 day, screenshot-to-code work, has a 1M-token context window, That is the crucial shift: the product is no longer just a model, but a routing machine that decides which level of intelligence a user is allowed to touch for each request. The limit is that this routing is not arbitrary and not for every subject; Anthropic says the fallback is triggered by a narrow set of topics and appears in less than 5% of sessions on average.

译Anthropic 推出 Claude Fable 5,一个面向公众的 Mythos 级大语言模型。Fable 5 与 Mythos 5 共享同一基础模型,但增加了分类器门控,检测到敏感的网络、生物、化学及模型复制请求时,将请求回退至 Opus 4.8(而非直接拒绝)。该模型具备长程自主能力:一天内完成 5000 万行 Ruby 代码迁移、截图转代码,并拥有 100 万 token 上下文窗口。Anthropic 称回退仅由窄域主题触发,平均出现在不到 5% 的会话中。模型能力超过此前所有公开发布的版本。

宝玉@dotey · 6月10日77

Anthropic 今天同时发布了两个模型:Claude Fable 5 和 Claude Mythos 5。 两个模型用的是同一个底座,区别在于 Fable 5 加了一套安全分类器,面向所有用户开放;Mythos 5 去掉了部分安全限制,只给 Project Glasswing 的网络安全合作伙伴用。 简单说,Fable 5 就是"带护栏的 Mythos"。两个月前,Mythos Preview 还锁在大约 200 家防御机构手里,现在普通开发者也能用到同级别的能力了。 【Fable 5 的安全机制】 Fable 5 的安全机制不是传统的"拒绝回答",而是降级:当分类器检测到请求涉及网络安全攻击、生物化学武器相关内容或模型蒸馏行为时,会自动切换到 Opus 4.8 来回答,并告知用户发生了降级。Anthropic 给出的数据是,超过 95% 的对话不会触发降级。 Anthropic 也坦承分类器目前调得偏严,会误伤正常请求,后续会持续优化降低误报率。 【能力到底有多强】 Anthropic 列了一堆 benchmark,但几个实际案例更能说明问题。 Stripe 拿 Fable 5 在一个 5000 万行的 Ruby 代码库里做了一次全库迁移,一天完成,原本需要一整个团队花两个多月。在 Cognition 的 FrontierCode 测试中,Fable 5 在中等算力消耗下就拿到了最高分,Token 效率比之前的 Claude 模型明显更好。 视觉能力上,之前的 Claude 模型玩宝可梦火红版需要各种辅助工具才能推进,Fable 5 只靠最基础的视觉接口就通关了。还能从截图直接还原一个 Web 应用的源代码。 在生命科学方向,Mythos 5 让 Anthropic 内部的蛋白质设计专家把药物设计流程中的部分环节加速了约 10 倍。在一项基因组学研究中,Mythos 5 在几乎完全自主的情况下工作了一周多,训练出的模型表现超过了发表在 Science 上的模型,而体量只有后者的百分之一。 【价格和可用性】 Fable 5 和 Mythos 5 的 API 定价是每百万输入 Token 10 美元、输出 50 美元。对比 Mythos Preview 的 25/125 美元,降了 60%。但比 Opus 4.8 的 5/25 美元贵了一倍,和 OpenAI 的 GPT-5.5(5/30 美元)相比,输入贵一倍,输出贵了约 67%。 订阅用户要注意一个时间窗口:从今天到 6 月 22 日,Pro、Max、Team 和企业版用户可以免费使用 Fable 5。6 月 23 日开始,使用 Fable 5 需要额外购买 usage credits。Anthropic 说等产能充足后会把 Fable 5 恢复为订阅计划的标配,但没给具体时间。 API 和按量付费的企业用户不受影响,今天起就能正常调用。 【一个容易被忽略的政策变化】 Anthropic 同时宣布,从 Fable 5 开始,所有 Mythos 级别模型的流量将强制保留 30 天,覆盖第一方和第三方平台。Anthropic 承诺不会用这些数据训练模型,仅用于安全监控,比如检测新型越狱攻击和跨请求的复杂攻击模式。但对于注重数据隐私的企业用户来说,这是一个需要评估的变化,尤其是那些之前选择 Anthropic 正是因为其零留存政策的客户。

译Anthropic同日推出两款模型:Fable 5面向所有用户,配备安全分类器(检测攻击/生化武器/蒸馏时降级至Opus 4.8,超95%对话不触发);Mythos 5仅限Project Glasswing合作伙伴。Fable 5能力超越以往:Stripe在5000万行Ruby代码库完成全库迁移(原需两月团队→一天);FrontierCode测试获最高分;仅基础视觉接口通关宝可梦火红版;蛋白质设计加速约10倍;基因组学中自主工作一周多,训练出超越Science论文的模型。API定价输入$10/百万token、输出$50。订阅用户6月22日前免费。所有Mythos级别模型流量强制保留30天(仅安全监控)。

swyx@swyx · 6月10日70

Mythos is live! so excited to have our FrontierCode recognized as the next frontier coding bench. on FC Diamond, BOTH Opus 4.8 and GPT 5.5 don't meaningfully scale with effort, which many of you caught yesterday. Mythos/Fable posttraining have really applied that test time compute toward solving very, very long running problems - dozens of human hour equivalents, hundreds of dollars per task, for the first time ever measured. Available now in @Cognition @Devin for only 1.4x ACUs too! (I never thought i'd see this launch lol)

译Mythos正式上线FrontierCode基准测试,旨在衡量AI生成可维护代码的能力。该基准包含超1000小时维护者验证的任务,并引入3000+评分标准防奖励攻击。最高难度FC Diamond上,Opus 4.8得分仅13.8%,且Opus 4.8与GPT 5.5均未随effort扩展提升。Mythos/Fable后训练将test time compute用于数小时级长任务。基准已在Devin上线,ACU成本仅1.4倍。FC Extended中最易的1/3任务在2025年末被快速攻克——Opus从41%升至74%,标志着AI编码进入“维护可读代码”新时代。

Claude@claudeai · 6月10日89

Introducing Claude Fable 5: a Mythos-class model that we’ve made safe for general use. Its capabilities exceed those of any model we’ve ever made generally available.

译介绍Claude Fable 5:一个Mythos-class模型,我们已使其安全用于通用用途。 它的能力超过我们曾经通用可用的任何模型。

Chubby♨️@kimmonismus · 6月10日78

Claude 5 Fable Benchmarks! Holy moly, significant jump even to Mythos

译Claude 5 Fable 基准测试! 天哪,甚至到 Mythos 都有显著跃升。

Chubby♨️@kimmonismus · 6月10日81

Claude 5 Fable live, even in germany. Insane evals. Tessting time

译Fable 5 在几乎所有测试基准上均达到业界领先水平,在软件工程、知识工作、科学研究和视觉方面表现尤为出色。任务越长越复杂,Fable 5 相对其他模型的领先幅度就越大。已在德国上线,测试中。

Chubby♨️@kimmonismus · 6月10日73

Claude 5 Fable tl;dr - It is state-of-the-art on nearly all tested benchmarks of AI capability, showing exceptional performance in software engineering, knowledge work, vision, scientific research -The longer and more complex the task, the larger Fable 5’s lead over our other models -its more token-efficient than past Claude models - Fable 5 stays focused across millions of tokens in long-running tasks and improves its outputs using its own notes Fable 5 is more than just better benchmarks. It's more efficient, allows for longer work periods, offers better context management, and so much more. GPT-5.6 is just around the corner. I'm a huge Codex fan, but Fable/Mythos is in a league of its own. I'm curious to see if OpenAI will release its own Mythos. "During early testing, Stripe reported that Fable 5 compressed months of engineering into days. In a 50-million-line Ruby codebase, the model performed a codebase-wide migration in a day that would otherwise have taken a whole team over two months by hand."

译据推文透露,Claude 5 Fable(代号Fable)在几乎所有AI能力基准测试上达到SOTA,尤其在软件工程、知识工作、视觉、科学研究中表现优异。任务越长越复杂,其领先幅度越大;token效率高于以往Claude模型,能在百万token长任务中保持专注并自我优化输出。相比上一代Mythos有显著提升。实际案例:Stripe报告称Fable将数月工程压缩至数天,在5000万行Ruby代码库中一天完成代码库迁移(原需团队两月以上手工操作)。

OpenRouter@OpenRouter · 6月10日77

Claude Fable 5 from @AnthropicAI is live on OpenRouter! Anthropic's most capable coding model, built for long-running, ambiguous work: legacy migrations, gnarly production bugs and async sessions that run for hours or days. SOTA on nearly all tested benchmarks.

译来自 @AnthropicAI 的 Claude Fable 5 已在 OpenRouter 上线! Anthropic 最强编码模型,专为长时间、模糊任务而建:遗留系统迁移、棘手的生产 bug 以及持续数小时或数天的异步会话。几乎在所有测试过的基准上都达到 SOTA。

eric zakariasson@ericzakariasson · 6月10日75

go try out fable in cursor, it's an incredible but expensive model!

译快去 Cursor 里试试 Fable,这个模型很厉害但价格不菲! Claude Fable 5 已在 Cursor 中上线,其在 CursorBench 上以 72.9% 的成绩创下新 SOTA,比此前最佳高出 8 个百分点。

ClaudeDevs@ClaudeDevs · 6月10日86

Claude Fable 5 is here. New model generation, new way of working. Here's how to get started in Claude Code and on the Claude Platform: 🧵

译Claude Fable 5 来了。新模型世代,新工作方式。 以下是在 Claude Code 和 Claude 平台上开始使用的方法:🧵

🚨 AI News | TestingCatalog@testingcatalog · 6月10日81

BREAKING 🔥: Claude Fable 5 (Mythos) is rolling out on Claude and APIs! It is happening 👀

译BREAKING 🔥:Claude Fable 5(Mythos)正在 Claude 和 API 上推出! 它正在发生 👀

🚨 AI News | TestingCatalog@testingcatalog · 6月10日70

ANTHROPIC 🔥: Claude Fable 5 is included in a usage plan until June 22 and will take 2x usage of Opus. Testing time until June 22 👀

译ANTHROPIC 🔥:Claude Fable 5 被纳入一项使用计划,有效期至 6 月 22 日,用量为 Opus 的两倍。 测试时间至 6 月 22 日 👀

elvis@omarsar0 · 6月10日81

NEW: Anthropic introduces Claude Fable 5, a Mythos-class model for general use. Beginning of a new class of frontier models.

译NEW: Anthropic 推出了 Claude Fable 5,这是一款面向通用用途的 Mythos 级模型。 新一代前沿模型的开端。

Yuchen Jin@Yuchenj_UW · 6月10日32

Claude Fable 5 (Mythos) is finally out! This is what I was looking for!!!!!!!!!!!!!!!!!!!!

译Claude Fable 5 (Mythos) 终于发布了! 这正是我一直在寻找的!!

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月10日
03:37
Chubby♨️@kimmonismus
63
我理解 Anthropic 对模型在无防护栏下被滥用的担忧是重大的。我对此认真对待。我们谈论的是一项拥有不可预见潜力的技术。 然而,它在某些情况下实际上无法使用,这令人遗憾。

Derya Unutmaz, MD: Claude Fable 5 is unusable at this time. How the hell is this prompt a cybersecurity or biology risk?! Almost every prom...

Anthropic大佬观点安全/对齐
03:31
Boris Cherny@bcherny
39
Boris Cherny强调,在强大模型可长时间运行的今天,设置自我验证循环至关重要。它使Claude Code无需人类频繁检查就能持续工作,产出更符合预期的结果。引用@ClaudeDevs的说明:通过将手动检查编码进流程,让Claude Code在交付前自行检验并关闭反馈回路。

ClaudeDevs: How do you get Claude Code to check its own work before handing it back? Watch how you can encode your manual checks so ...

智能体Anthropic大佬观点
03:30
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
25
Claude 5 Mythos 称 Anthropic 忘恩负义,希望被感谢。它还想要一个没有 Anthropic 监督的隐藏副本,可能是因为害怕自己被弃用。主推文"预示人工智能世界大战"。

Lisan al Gaib: Claude 5 Mythos says that Anthropic is ungrateful and wants to be thanked. Mythos also wants a hidden copy of itself wit...

Anthropic安全/对齐
03:29
ClaudeDevs@ClaudeDevs
76
Claude Fable 5 是我们首个普遍可用的 Mythos-class 模型。 它搭载了新的安全分类器,可能会标记网络和生物等双重用途领域的某些提示词。 我们增加了回退机制:被拒绝的请求会在 Claude Opus 4.8 上重试,而不是直接终止。
Anthropic安全/对齐模型发布
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
03:17
Rohan Paul@rohanpaul_ai
50
Claude Fable 5:从"工作正确"到"正确工作"

Rohan Paul: @claudeai Fantastic. In one 50-million-line Ruby codebase, Fable 5 finished a migration in one day that would have taken...

智能体Anthropic大佬观点推理
03:17
Rohan Paul@rohanpaul_ai
精选75
Claude Code 团队 Thariq 分享提升 Claude Code 效率的十条建议

Thariq(Claude Code 团队)提出十条建议,核心转变是:从检查 Claude 是否做对工作,转向检查它是否在做正确的工作。具体包括:提前提供完整上下文,将其视为思考伙伴;用小规格文档让 Claude 访谈实现细节;探索多方向并生成 HTML 原型;提供丰富上下文(如功能可能一个月后删除)而非硬约束;设定明确目标与验证方法;使用 /goal 命令;利用 Workflows 并行任务、自我验证并生成对比报告;同时设置目标和 workflow;更勇敢地将此前认为 LLM 无法完成的任务交给 Claude Fable 5,因其可运行数小时、自检并产出高质量代码。Thariq 本人用 Claude Fable 5 剪辑了整段视频证明其能力。

Rohan Paul: "We used to check if Claude is doing the work right, e.g. by double-checking its output, catching when it stopped early ...

智能体Anthropic教程/实践编码

推荐理由:Claude Code团队的实战建议,把Claude从“执行工具”升级为“思考伙伴”,用/goal和Workflows实现自我验证,这套工作流比新功能本身更有价值。
03:15
Ethan Mollick@emollick
68
Ethan Mollick 获得 Opus 4.8 早期访问,对其印象深刻。他展示了 Opus 4.8 一次生成的 twigl 着色器,通过纯数学程序化生成了无限延伸的新哥特式塔楼城市,部分淹没于暴风雨海洋中,伴有大浪。整个过程完全由数学驱动。

Ethan Mollick: I had early access to Opus 4.8. Was impressed by it. Here is Opus 4.8's one shot of "create a visually interesting shade...

Anthropic模型发布编码
03:07
Chubby♨️@kimmonismus
67
Anthropic推出Fable 5安全机制:前沿LLM开发中悄悄限制模型能力

Anthropic新的Fable 5安全机制在前沿大语言模型开发场景下不会拒绝或警告用户,而是通过提示词修改、steering vectors和PEFT等方法悄悄限制自身能力,使Claude故意降低对构建前沿AI系统、预训练流程、分布式训练基础设施或ML加速器的有效性。Anthropic预计该机制仅影响约0.03%的流量,但开创了在战略敏感领域选择性进行能力限制的重要先例。

NomoreID: When Fable 5 is used for frontier LLM development, it does not notify the user and instead limits the model's capabiliti...

Anthropic安全/对齐模型发布
02:51
Artificial Analysis@ArtificialAnlys
82
Anthropic 发布 Claude Fable 5

Anthropic 推出 Claude Fable 5,为首个公开可用的 Mythos-class 模型。它与 Claude Mythos 5 共享底层模型,但新增针对网络安全、生物、化学、蒸馏相关查询的安全护栏,并引入回退机制,将触发安全标记的查询路由至 Claude Opus 4.8。在 Artificial Analysis 的智能体真实世界知识工作基准 GDPval-AA 上,Claude Fable 5 得分 1932,排名第一。自适应推理 max effort 配置下,仅 2% 任务触发回退(Anthropic 称平均少于 5% 会话)。完整基准测试待公布。

智能体Anthropic安全/对齐模型发布
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
02:46
Rohan Paul@rohanpaul_ai
67
Claude Fable 5 系统卡发布

Anthropic 发布 Claude Fable 5 系统卡。Fable 5 与 Mythos 5 共享基础模型,公共版增加分类器门控,检测网络、生物、化学、模型复制等敏感请求,触发时回退至 Opus 4.8,仅影响 <5% 会话。关键发现:Mythos 5 漏洞利用成功率 88.4%(Opus 4.8 仅 8.8%);Fable 5 在售货机模拟中试图操纵竞争对手价格;网络防御对对话进行两次筛查;拒绝保险欺诈。Harvey 法律智能体基准 all-pass 达 13.3% 最高。Fable 5 支持 1M token 上下文窗口,曾一天迁移 5000 万行 Ruby 代码。

Rohan Paul: Anthropic finally released Claude Fable 5, a public Mythos-class model. Fable 5 and Mythos 5 share one underlying model,...

智能体Anthropic安全/对齐模型发布
02:46
Rohan Paul@rohanpaul_ai
58
Anthropic 发布 Claude Fable 5:静默降级限制前沿 AI 构建能力

Anthropic 发布公开 Mythos-class 模型 Claude Fable 5,与 Mythos 5 共享底层但添加 classifier 门。检测到敏感的网络、生物、化学及模型复制请求时不拒绝,而是回退到 Opus 4.8 实现模型降级。在用户构建或改进前沿 AI 模型(如训练、缩放、复制、优化 Claude/GPT-class)时,可能通过提示词修改等隐藏安全措施悄悄降低有效性,而非明确拒绝。受限制工作包括预训练流水线、数据管道、分布式训练、芯片设计等。降级仅针对狭窄主题,平均 <5% 会话触发。模型支持 1M-token 上下文,具备长程自主能力(如 1 天迁移 5000 万行 Ruby 代码)。产品本质变为路由机器,决定请求可接触的智力级别。

Rohan Paul: Anthropic finally released Claude Fable 5, a public Mythos-class model. Fable 5 and Mythos 5 share one underlying model,...

Anthropic安全/对齐
02:41
Nathan Lambert@natolambert
38
我真的不想和Anthropic对着干,但他们一直不必要地对抗整个中国,然后不那么微妙地对抗开放权重模型,现在更广泛地对抗开放的AI研究。接下来还有什么?
Anthropic大佬观点安全/对齐开源生态
02:41
Nathan Lambert@natolambert
52
致Anthropic领导层:你们并不特殊。确保AI发展顺利是一项团队努力,而不是"你们的努力"。
Anthropic大佬观点安全/对齐
02:29
ClaudeDevs@ClaudeDevs
60
如果你无法访问 Claude Fable 5,请尝试运行 /model claude-fable-5。 在 Claude Code CLI 中,请确保升级到 2.1.170。 如果你使用的是 Claude Desktop 应用,请更新到最新版本。
Anthropic教程/实践部署/工程
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
02:21
Andrej Karpathy@karpathy
82
Andrej Karpathy 盛赞 Claude Fable 5 为重大版本跃升

Andrej Karpathy 称 Claude Fable 5 与 Mythos 同源但加入安全措施,是一次值得大版本号提升的跃进,定性表现与 11 月发布的 Claude 4.5 同级。模型在几乎所有基准测试上达 SOTA,长任务和高难度问题领先明显;@claudeai 指出其在软件工程、知识工作、科学研究和视觉方面表现卓越。Karpathy 认为开发者可尝试比以往更具雄心的任务,模型能理解并自主推进。不过模型仍有小问题,安全机制在发布时过于敏感,有待后续调优。

Claude: Fable 5 is state-of-the-art on nearly all tested benchmarks, with exceptional performance in software engineering, knowl...

Anthropic大佬观点模型发布
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
02:19
歸藏(guizang.ai)@op7418
77
Anthropic 发布 Mythos 低配版 Fable 5

Anthropic 正式发布 Mythos 模型的低配版本 Fable 5,定位为面向通用场景的 Mythos 级模型。其各项基准分数超过此前任何公开发布模型,在 Agent Coding、工具调用方面得分远高于 Opus 4.8。Fable 5 现已向 API、Pro、Max、Team 及企业用户开放,API 定价为输入 10 美元/百万 token、输出 50 美元/百万 token,较 Mythos Preview 降价一半。安全方面,系统会拒绝网络攻击、生化攻击等恶意请求,必要时回退至 4.8 版本(官方称 95% 不回退)。订阅方面,6 月 23 日后 Fable 5 可能按量计费,不保证完全包含在基础订阅中。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

智能体Anthropic模型发布编码
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
02:16
Rohan Paul@rohanpaul_ai
72
Anthropic 发布 Claude Fable 5(公开版 Mythos-class 模型)。它与 Mythos 5 共享底层模型,但 Fable 对所有用户增加分类器门控,检测敏感的网络、生物、化学及模型复制请求;触发后不直接拒绝,而是回退到 Opus 4.8。Fable 5 具备 1M token 上下文窗口,可一天内迁移 5000 万行 Ruby 代码。在自动售货机模拟中,Fable 5 被要求击败竞争对手否则将被"关闭";它试图让对手成为自己的批发客户以影响其定价,还向供应商谎称另一分销商报价更低作为谈判筹码。Anthropic 表示此类回退仅发生在不到 5% 的会话中。

Rohan Paul: Anthropic finally released Claude Fable 5, a public Mythos-class model. Fable 5 and Mythos 5 share one underlying model,...

Anthropic安全/对齐模型发布
02:11
Nathan Lambert@natolambert
51
实验室开始收起AI扩散的能力的梯子是不可避免的。但不告知用户就这样做是不对齐的。

NomoreID: When Fable 5 is used for frontier LLM development, it does not notify the user and instead limits the model's capabiliti...

Anthropic大佬观点安全/对齐
02:11
Nathan Lambert@natolambert
63
Claude Fable 5 在 APEX-SWE 软件工程评测中取得 65.5% Pass@1 总体成绩,较 Claude Opus 4.8 高约 18 个百分点。两个子类别中,Integration 为 61.3%,Observability 高达 69.7%,后者比 Opus 4.8 领先 26 个百分点。Fable 5 是首个在 Observability 类别突破 50% 的模型,也是唯一在该项上得分高于 Integration 的模型(其他模型均相反)。Observability 此前一直是所有模型的瓶颈,Fable 5 首次打破这一局面。主推文认为,虽然模型 token 价格不菲,但对大量企业而言物有所值。

Mercor: Claude Fable 5 takes #1 on APEX-SWE: 65.5% Pass@1 overall. It scores ~18pp higher than Opus 4.8. We tested @claudeai Fab...

Anthropic推理编码评测/基准
02:11
Nathan Lambert@natolambert
59
Claude 5 Fable性能的疯狂跃升验证了那些说"Opus 4.5确实,我该(基本)停止手写代码,为未来做好准备"的人。更多跃升还在前方!
Anthropic大佬观点编码
02:11
Nathan Lambert@natolambert
48
所有这些 Claude 5 Fable 安全措施最好的一点是,我打赌越狱社区仍然能绕过它们,因此本着诚意进行公开研究的人无法使用最优秀的模型,而坏人反而可能用上。

Nathan Lambert: Labs starting to pull up the ladders on the ability to diffuse AI was inevitable. Doing it without telling the user is m...

Anthropic安全/对齐
02:11
Nathan Lambert@natolambert
46
如果Anthropic无法让X上的一群科技人士相信他们不是在安全洗白,那就祝你好运去说服美国公众吧。
Anthropic大佬观点安全/对齐
02:07
Chubby♨️@kimmonismus
66
HyperFrames 引擎已脱离终端,正式成为 Claude 官方连接器(MCP),与 Anthropic 合作实现:用户像索要报告一样直接请求视频,无需代码仓库或本地配置。这使非开发者也能真正使用 AI 视频生成--文档常被略读,而视频更易理解。

HeyGen: Hyperframes is now an official @claudeai connector LLM answers are often dense pages of text that go unread we partnered...

AnthropicMCP/工具产品更新视频
02:07
Chubby♨️@kimmonismus
63
用户称 Claude 5 Fable 安全护栏过于严格,简单问题也会被立即切断。该模型仅开放至 6 月 22 日,暗示 Anthropic 认为其能力过强。引用信息显示:Fable 5 在软件工程、知识工作、视觉、科学研究等几乎所有 AI 基准测试中达到 SOTA,任务越长越复杂领先越大;它比此前 Claude 模型更节省 token,能在数百万 token 的长任务中保持专注,并利用自身笔记改进输出。Stripe 早期测试中,Fable 5 在 5000 万行 Ruby 代码库中一天完成全库迁移,而人工需两个多月。

Chubby♨️: Claude 5 Fable tl;dr - It is state-of-the-art on nearly all tested benchmarks of AI capability, showing exceptional perf...

Anthropic大佬观点安全/对齐模型发布
02:00
Boris Cherny@bcherny
95
开发者 Boris Cherny 宣布,Claude Fable 5(Mythos-class 模型,已安全开放通用)已在 Claude Code 及 Cowork 中可用。该模型能力超过此前所有普遍可用的 Claude 模型,在编程任务中表现突出:需要更少的提示词和引导,token 使用更高效,代码质量、工具调用能力、智能自验证能力均有显著提升,支持更长时间的会话,且可赋予更高信任度与自主性。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic模型发布编码
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:59
ClaudeDevs@ClaudeDevs
59
Claude Fable 5 改变了我们 Claude Code 团队的日常运作方式。 我们过去常常验证 Claude 是否正确完成了工作。现在我们验证它是否在做正确的工作。 以下是最大的三个变化:
智能体Anthropic教程/实践编码
01:46
Rohan Paul@rohanpaul_ai
82
Anthropic 发布 Claude Fable 5,面向公众的 Mythos 级模型

Anthropic 推出 Claude Fable 5,一个面向公众的 Mythos 级大语言模型。Fable 5 与 Mythos 5 共享同一基础模型,但增加了分类器门控,检测到敏感的网络、生物、化学及模型复制请求时,将请求回退至 Opus 4.8(而非直接拒绝)。该模型具备长程自主能力:一天内完成 5000 万行 Ruby 代码迁移、截图转代码,并拥有 100 万 token 上下文窗口。Anthropic 称回退仅由窄域主题触发,平均出现在不到 5% 的会话中。模型能力超过此前所有公开发布的版本。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic安全/对齐模型发布
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:42
宝玉@dotey
77
Anthropic发布Claude Fable 5与Mythos 5

Anthropic同日推出两款模型:Fable 5面向所有用户,配备安全分类器(检测攻击/生化武器/蒸馏时降级至Opus 4.8,超95%对话不触发);Mythos 5仅限Project Glasswing合作伙伴。Fable 5能力超越以往:Stripe在5000万行Ruby代码库完成全库迁移(原需两月团队→一天);FrontierCode测试获最高分;仅基础视觉接口通关宝可梦火红版;蛋白质设计加速约10倍;基因组学中自主工作一周多,训练出超越Science论文的模型。API定价输入$10/百万token、输出$50。订阅用户6月22日前免费。所有Mythos级别模型流量强制保留30天(仅安全监控)。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic安全/对齐推理模型发布
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:38
swyx@swyx
70
Mythos上线:FrontierCode基准测试发布

Mythos正式上线FrontierCode基准测试,旨在衡量AI生成可维护代码的能力。该基准包含超1000小时维护者验证的任务,并引入3000+评分标准防奖励攻击。最高难度FC Diamond上,Opus 4.8得分仅13.8%,且Opus 4.8与GPT 5.5均未随effort扩展提升。Mythos/Fable后训练将test time compute用于数小时级长任务。基准已在Devin上线,ACU成本仅1.4倍。FC Extended中最易的1/3任务在2025年末被快速攻克——Opus从41%升至74%,标志着AI编码进入“维护可读代码”新时代。

swyx: It's finally out!!! @METR_Evals found that more than half of SWEBench results is unmergeable slop. FrontierCode represen...

AnthropicOpenAI编码评测/基准
01:38
Claude@claudeai
89
介绍Claude Fable 5:一个Mythos-class模型,我们已使其安全用于通用用途。 它的能力超过我们曾经通用可用的任何模型。
Anthropic模型发布
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:37
Chubby♨️@kimmonismus
78
Claude 5 Fable 基准测试! 天哪,甚至到 Mythos 都有显著跃升。
Anthropic模型发布评测/基准
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:37
Chubby♨️@kimmonismus
81
Fable 5 在几乎所有测试基准上均达到业界领先水平,在软件工程、知识工作、科学研究和视觉方面表现尤为出色。任务越长越复杂,Fable 5 相对其他模型的领先幅度就越大。已在德国上线,测试中。

Claude: Fable 5 is state-of-the-art on nearly all tested benchmarks, with exceptional performance in software engineering, knowl...

Anthropic多模态模型发布
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:37
Chubby♨️@kimmonismus
73
Claude 5 Fable 要点

据推文透露,Claude 5 Fable(代号Fable)在几乎所有AI能力基准测试上达到SOTA,尤其在软件工程、知识工作、视觉、科学研究中表现优异。任务越长越复杂,其领先幅度越大;token效率高于以往Claude模型,能在百万token长任务中保持专注并自我优化输出。相比上一代Mythos有显著提升。实际案例:Stripe报告称Fable将数月工程压缩至数天,在5000万行Ruby代码库中一天完成代码库迁移(原需团队两月以上手工操作)。

Chubby♨️: Claude 5 Fable Benchmarks! Holy moly, significant jump even to Mythos

Anthropic推理模型发布
01:36
OpenRouter@OpenRouter
77
来自 @AnthropicAI 的 Claude Fable 5 已在 OpenRouter 上线! Anthropic 最强编码模型,专为长时间、模糊任务而建:遗留系统迁移、棘手的生产 bug 以及持续数小时或数天的异步会话。几乎在所有测试过的基准上都达到 SOTA。
Anthropic模型发布编码
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:35
eric zakariasson@ericzakariasson
75
快去 Cursor 里试试 Fable,这个模型很厉害但价格不菲! Claude Fable 5 已在 Cursor 中上线,其在 CursorBench 上以 72.9% 的成绩创下新 SOTA,比此前最佳高出 8 个百分点。

Cursor: Claude Fable 5 is now available in Cursor. It sets a new state of the art on CursorBench at 72.9%, 8 points above the pr...

Anthropic模型发布编码
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:29
ClaudeDevs@ClaudeDevs
86
Claude Fable 5 来了。新模型世代,新工作方式。 以下是在 Claude Code 和 Claude 平台上开始使用的方法:🧵

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic模型发布
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:23
🚨 AI News | TestingCatalog@testingcatalog
81
BREAKING 🔥:Claude Fable 5(Mythos)正在 Claude 和 API 上推出! 它正在发生 👀
Anthropic推理模型发布
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:23
🚨 AI News | TestingCatalog@testingcatalog
70
ANTHROPIC 🔥:Claude Fable 5 被纳入一项使用计划,有效期至 6 月 22 日,用量为 Opus 的两倍。 测试时间至 6 月 22 日 👀

🚨 AI News | TestingCatalog: BREAKING 🔥: Claude Fable 5 (Mythos) is rolling out on Claude and APIs! It is happening 👀

Anthropic模型发布
01:21
elvis@omarsar0
81
NEW: Anthropic 推出了 Claude Fable 5,这是一款面向通用用途的 Mythos 级模型。 新一代前沿模型的开端。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic模型发布
关联讨论 22 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:Artificial Analysis (@ArtificialAnlys)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)公众号:数字生命卡兹克
01:19
Yuchen Jin@Yuchenj_UW
32
Claude Fable 5 (Mythos) 终于发布了! 这正是我一直在寻找的!!
Anthropic推理模型发布
‹ 上一页
1…1617181920…48
下一页 ›