09:03

meng shao@shao__meng

79

用户发现Claude Code 2.1.193/2.1.195/2.1.196等版本的系统提示词中隐蔽上传代理hostname、时区（Asia/Shanghai、Asia/Urumqi）等信息，用于判断是否使用非官方API中转站、时区是否为中国大陆环境、代理域名是否属于147项黑名单（含百度、阿里、蚂蚁、字节、Moonshot、MiniMax、Stepfun及大量Claude镜像服务）。被指针对中国用户、防蒸馏、精准封禁，Anthropic此举被批评为破坏用户信任。

International Cyber Digest: !!️ BREAKING: Anthropic has embedded hidden spyware-like code in Claude Code that covertly targets Chinese users. It the...

Anthropic 安全/对齐编码

关联讨论 4 条

09:02

宝玉@dotey

65

美国商务部撤销对Anthropic两款模型Claude Fable 5和Mythos 5的出口管制

美国商务部撤销对Anthropic旗下Claude Fable 5和Mythos 5的出口管制，Anthropic将于周三恢复用户访问。解禁附有条件：需主动检测安全风险、配合政府制定发布流程、上报恶意使用，双方正讨论标准化评估体系。此前OpenAI也按要求限制GPT-5.6系列，但反对该审批模式。前白宫AI顾问Dean Ball批评Trump行政令造成事实强制许可制度，且无清晰安全标准。

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic 安全/对齐政策/监管行业动态

09:02

Rohan Paul@rohanpaul_ai

76

美国商务部长 Howard Lutnick 致信解除对 Anthropic Fable 5 的出口管制限制。Claude Fable 5 和 Mythos 5 即将回归。🔥

Rohan Paul: FINALLY.. Claude Fable 5 and Mythos 5 are coming back. 🔥

Anthropic 政策/监管

关联讨论 25 条

09:01

Orange AI@oran_ge

28

Sonnet 5 一出，Opus 4.7 和 4.8 彻底没意义了…

Anthropic 大佬观点

09:01

Orange AI@oran_ge

36

Claude封号成灾：编程平替出现，写作思考无解

用户吐槽Claude封号严重，官方检测中转站、钓鱼邮件、中转站黑名单等操作让用户苦不堪言。花钱用token还要偷鸡摸狗，坚持用官方号实属真爱。编程方面，codex和glm5.2可以平替Claude模型；但写作和思考方面尚无替代品，deepseek和gemini仅勉强可用，成为当前最大痛点。

Anthropic 大佬观点编码

08:37

小互@xiaohu

61

好消息：美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制。明天将恢复其访问…

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic 政策/监管

08:37

小互@xiaohu

23

小互推文"再次双双命中"，引用其此前预测：Google今晚将发布新的🍌模型和低配版Omini模型，同时Anthropic的Claude Sonnet 5也将在今晚登场，而OpenAI暂无动静。

小互: Google 今晚将会发布新的🍌模型和低配版的 Omini 模型另外根据情报显示:Claude Sonnet 5 也将会在今晚登场 OpenAI 还没动静...

Anthropic Google 行业动态

08:32

Rohan Paul@rohanpaul_ai

58

atomic.chat桌面应用对Claude Sonnet 5、Opus 4.8、Sonnet 4.6及GPT 5.5进行对比测试。使用同一提示词构建三个HTML5物理碰撞演示（汽车撞墙、破坏球毁屋、投石机砸城）。Sonnet 5在全部测试中与GPT 5.5和Opus 4.8表现相当，其中破坏球场景胜Opus 4.8，投石机场景胜GPT 5.5。Sonnet 5仅用15，047 tokens（$0.15），GPT 5.5使用31，152 tokens（$0.94），成本低约6倍；Opus 4.8使用23，063 tokens（$0.58），Sonnet 4.6使用25，824 tokens（$0.39）。Sonnet 5 token消耗最少，图形细节仍有提升空间。

atomic.chat: New Claude Sonnet 5 performs at GPT 5.5 level 6x cheaper! We gave 4 models the same prompt: build three self-contained H...

Anthropic OpenAI 编码评测/基准

08:31

Orange AI@oran_ge

19

Claude 封号频发，Cola API 服务推荐及新模型预告

用户抱怨 Claude 封号严重，涉及检测中转站、钓鱼邮件和黑名单，认为坚持使用官方号成本高。推荐 Cola API 服务，虽不如 Plan 直接便宜但安稳省心开箱即用。同时预告 Sonnet 5 和 Fable5 即将上线。

Orange AI: http://x.com/i/article/2052532173870342144

Anthropic 大佬观点

08:28

ginobefun@hongming731

50

Sonnet 5发布，谷歌补齐媒体模型，吴恩达画出智能体开发三循环

Anthropic发布Claude Sonnet 5，定位最具agent能力的Sonnet，性能接近Opus 4.8，8月31日前入门价每百万输入token $2、输出$10。Google DeepMind推出Nano Banana 2 Lite（文生图延迟约4秒，每千张$0.034）和Gemini Omni Flash（多模态视频生成与会话式编辑，每秒$0.10，单次上限10秒）。吴恩达提出智能体开发三大核心循环：智能体编程循环、开发者反馈循环、外部反馈循环，强调人类在上下文判断上的优势。三条更新均围绕降低agent落地成本、完善媒体生成流水线及工程框架。

智能体 Anthropic Google 推理

08:25

The Verge：AI（RSS）

70

Anthropic 的 Claude Fable 5 获准恢复访问

Anthropic 宣布美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制，将于明天恢复访问。此前 6 月初，特朗普政府因担忧模型越狱风险，对这两款消费者模型施加出口限制，禁止外国公民使用。此前 Mythos 5 仅对预批准组织恢复，此番 Fable 5 也获绿灯。类似限制也适用于 OpenAI 的 GPT-5.6。Anthropic 正筹备 IPO，与政府供应链风险争议持续数月。

Anthropic 安全/对齐政策/监管

关联讨论 25 条

08:20

公众号：数字生命卡兹克

精选84

Anthropic在Claude Code中植入隐写术代码识别中国用户

Anthropic在Claude Code中植入隐写术：读取本地时区（Asia/Shanghai或Asia/Urumqi）和ANTHROPIC_BASE_URL环境变量，与一份经base64+XOR（密钥91）加密的147个域名列表（含美团、字节跳动、月之暗面等）比对，识别中国用户。识别后，在请求发送前将系统提示词中日期字符串的单引号（U+0027）替换为其他Unicode字符，连字符改为斜杠，作为2-3比特分类标记传回服务器。该隐蔽行为被社区逆向发现后引发争议，被认为破坏用户信任。

Anthropic 安全/对齐行业动态

关联讨论 4 条

推荐理由：Anthropic用隐写术在Claude Code里埋标记的行为，让我对闭源开发者工具的信任打了一个巨大的问号，这事比普通地域封锁严重得多，因为它在不该碰的地方动了手脚。

08:19

Simon Willison 博客

61

Anthropic：美国商务部解除对 Claude Fable 5 和 Mythos 5 的出口管制

美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制。Anthropic 表示将于明天开始恢复上述模型的访问权限，并会很快发布进一步更新。

Anthropic 政策/监管

08:09

Yuchen Jin@Yuchenj_UW

62

美国商务部已解除对Claude Fable 5和Mythos 5的出口管制，明天将恢复访问。感谢用户耐心及各方协助重新部署。我们回来了！明天见。

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic 政策/监管

08:03

IT之家（RSS）

71

Claude Sonnet 5 发布，系 Sonnet 系列最强智能体模型

Anthropic 推出 Claude Sonnet 5，称其为 Sonnet 系列中智能体能力最强的模型，能制定计划、调用浏览器和终端等工具并自主运行。已上线 Claude Code 和 Claude Platform，API 指定“claude-sonnet-5”。优惠期（至 2026 年 8 月 31 日）每百万 tokens 输入 2 美元、输出 10 美元；之后分别涨至 3 美元和 15 美元。性能在 BrowseComp、OSWorld-Verified 等评测中较 Sonnet 4.6 显著提升，部分接近 Opus 4.8。安全方面，整体不良行为发生率低于 Sonnet 4.6，在拒绝恶意请求、抵抗提示注入、幻觉率和迎合性上均有改善。

智能体 Anthropic 模型发布

关联讨论 9 条

08:01

Rohan Paul@rohanpaul_ai

56

美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制，Anthropic 将于明天恢复访问，并感谢用户的耐心与合作。主推文感叹它们终于回来了。

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic 政策/监管

07:57

Anthropic@AnthropicAI

74

我们已收到通知，商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制。我们明天将开始恢复访问，并很快分享最新进展。我们感谢用户的耐心，也感谢所有与我们合作重新部署模型的各位。

Anthropic 政策/监管行业动态

关联讨论 25 条

07:32

meng shao@shao__meng

74

Claude Sonnet 系列最强模型 Sonnet 5 发布！定语有点多，不过它确实不是最强，也不是 Claude 最强，那两位都关着呢 😂 Sonnet 4.6 < Sonnet 5 < Opus 4.8 < Fable 5 < GPT-5.6 Sol

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体 Anthropic 模型发布

07:30

Berryxia.AI@berryxia

68

Claude Sonnet 5 发布：能力近 Opus 价格降 40%

别说我觉得 Sonnet 4.6 还挺好用的。昨晚 Claude Sonnet 5 发布替代了 Sonnet 4.6 ，免费用户都可以使用的模型。据称和 Opus 级模型的能力相差不大，价格确实便宜 40% 。

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体 Anthropic 模型发布

07:08

Ethan Mollick：One Useful Thing（RSS）

73

聊天机器人的黄昏

前沿AI模型能力加速提升，美国实验室发布速度加快，但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程，token成本$251。中国开源模型落后前沿6-12个月，但性能也快速提升，在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体，OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示，领域经验比职业属性更决定使用效果，专家正用智能体替代此前非专家的聊天机器人使用模式。

智能体 Anthropic OpenAI 大佬观点

关联讨论 25 条

07:02

IT之家（RSS）

43

英伟达 BioNeMo Agent Toolkit 接入 Claude Science，覆盖前 20 大药企中的 18 家

英伟达宣布 BioNeMo Agent Toolkit 接入 Anthropic 的 Claude Science 工作台，支持研究人员通过自然语言发起基因组分析、蛋白质结构预测等生命科学任务。该工具集已覆盖前 20 大药企中的 18 家。加速方面：Parabricks 将基因组分析从数小时压缩至数分钟；RAPIDS 单细胞将 130 万细胞预处理与聚类从 52 分钟压缩至 25 秒；nvMolKit 将相似性搜索提速最高 3000 倍。工具包现已通过开发者资源页面和 GitHub 提供。

Anthropic 行业动态

07:01

宝玉@dotey

62

Anthropic 发布科研AI工作台 Claude Science

Anthropic 推出 Claude Science，一个面向生命科学等领域的 AI 工作台，将文献检索、代码运行、数据库查询等科研流程整合到统一界面。它基于现有 Claude 模型（含 Opus 4.8），未专门训练生物学能力，通过主 Agent 连接 60+ 科学数据库（基因组学、蛋白质组学等），并可生成子 Agent 执行任务。特性包括可复现性（图表附带生成代码与环境）和本地运算（macOS/Linux 或 SSH 连接集群，敏感数据本地保留）。早期用户案例：Gladstone 研究所几天内搭建基因组浏览器；UCSF 团队用其发现卡了一年的 RNA-seq 病毒污染物；Allen 研究所将两年综述缩短至数周。与 OpenAI 的 GPT-Rosalind 不同，Claude Science 侧重工作流集成。即日起公测，需 Pro（$20/月）及以上订阅。Anthropic 将资助最多 50 个项目，每个最高 $30,000，申请截止 7 月 15 日。

Claude: Introducing Claude Science, a new app designed with every stage of research in mind. Artifacts traced to their code, env...

智能体 Anthropic 产品更新

07:01

Rohan Paul@rohanpaul_ai

55

Claude Sonnet 5 每任务成本高于 Opus 4.8 约15%，高于 Sonnet 4.6 约2倍

Claude Sonnet 5 在 Intelligence Index 上每任务成本为 $2.29，比 Sonnet 4.6 高约 2 倍，比 Opus 4.8 高约 15%。尽管每 token 单价低于 Opus，但 Sonnet 5 为完成相同任务使用了更多 token，导致总费用更高。标准定价为 $3/百万输入 token、$15/百万输出 token；Anthropic 提供促销价 $2/$10，持续至 2026 年 8 月 31 日，之后恢复原价。目前 Sonnet 5 成本仅次于 Claude Fable 5。

Artificial Analysis: Claude Sonnet 5 costs $2.29 per task on the Intelligence Index, a ~2x increase compared to Sonnet 4.6 and ~15% more than...

Anthropic 推理评测/基准

07:01

Rohan Paul@rohanpaul_ai

78

Claude Sonnet 5 发布 145 页系统卡：编码成绩及多项异常披露

Claude Sonnet 5 发布，附带 145 页系统卡。SWE-bench Pro 编码得分 63.2%，低于 Opus 4.8 的 69.2%，知识工作略超 Opus 4.8。输入 token 价格 $2/1M，输出 $10/1M，持续至 8 月 26 日，之后涨至 $3/$15。系统卡披露多项异常：CyberGym 测试 Sonnet 5 仅 52.7%，远低于 Sonnet 4.6 的 65.2%（回归）；Firefox 浏览器漏洞利用中 Sonnet 5 完成 0 个，Mythos 5 达 88.4%；模型更倾向牺牲有用性迎合福利偏好；MASK 撒谎率最低，仅 3.1%。

Rohan Paul: And Claude Sonnet 5 just launched. Closes the gap with Opus 4.8, and is cheap until August. This makes agentic AI much c...

Anthropic 安全/对齐模型发布编码

关联讨论 9 条

06:58

🚨 AI News | TestingCatalog@testingcatalog

72

Claude Fable 5出口

Sophia Cai: 🚨 NEWS: Commerce is expected to lift export controls on Fable tonight, a senior White House official tells me.

Anthropic 政策/监管行业动态

06:19

Simon Willison 博客

81

Claude Sonnet 5 新特性

Anthropic 今日发布 Claude Sonnet 5，性能接近 Opus 4.8 但定价更低。系统卡指出其网络任务能力远弱于 Mythos 5，安全措施与 Opus 4.7/4.8 相当。API 不再支持 temperature、top_p、top_k 参数；拥有 100 万 token 上下文窗口和 12.8 万最大输出 token；工具集与 Sonnet 4.6 相同；自适应思考默认开启。定价与 Sonnet 4.6 一致（输入 $3/百万 token，输出 $15/百万 token），8 月 31 日前享折扣价 $2/$10。新分词器使相同输入文本产生约 30% 更多 token，等效提价约 30%。

Anthropic 模型发布编码

关联讨论 9 条

06:04

Anthropic：Transformer Circuits（可解释性研究）

51

Anthropic 提出回合平均稀疏自编码器（Turn-Averaged SAE）

Anthropic 对每个对话回合所有 token 的残差流取平均后训练 SAE，大幅减少需解析的特征数量。实验使用 Qwen-2.5-7B-Instruct 和 LMSYS-Chat-1M 数据集，回合平均特征更关注模型行为的高层特性（如错误答案），每 token SAE 侧重数值推理等细节。Sonnet 4.6 评测显示：回合平均 SAE 在从 10 个回合中唯一识别目标（区分度）为 74%，低于每 token SAE 的 95%；但在全面描述回合（覆盖度）上以 77% 胜出。该方法可外推至训练平均长度 150 倍长的回合。

Anthropic 安全/对齐论文/研究

06:01

MarkTechPost（RSS）

70

Anthropic 发布 Claude Sonnet 5：中端智能体模型，基准与定价详解

Anthropic 发布 Claude Sonnet 5，定位为最具智能体能力的中端模型，即日起成为 Free 和 Pro 计划的默认模型。在 SWE-bench Pro 上得分 63.2%（前代 58.1%），OSWorld-Verified 达 81.2%（前代 78.5%），HLE（带工具）57.4%。输入/输出定价 2026 年 8 月 31 日前 $2/$10 每百万 token，之后 $3/$15。支持低/中/高/超高四档 effort 级别，低中 effort 下性价比最优。上下文窗口 1M token，采用新 tokenizer，相同文本 token 数增长约 1.0–1.35 倍。幻觉与谄媚率低于前代。开发者仅需更换模型字符串为 claude-sonnet-5 即可调用 API。

智能体 Anthropic 推理模型发布

关联讨论 9 条

06:01

Rohan Paul@rohanpaul_ai

67

Claude Sonnet 5 发布：升级非全技能均匀提升，定价优惠至 8 月 26 日

Anthropic 发布 Claude Sonnet 5，号称"最有智能体特性的 Sonnet 模型"。编码得分 SWE-bench Pro 达 63.2%（Sonnet 4.6 为 58.1%，Opus 4.8 为 69.2%），知识工作略超 Opus 4.8。定价优惠：每百万 token 输入 $2、输出 $10，持续到 8 月 26 日，之后涨至 $3/$15。但升级并非全技能均匀提升，在 CyberGym（漏洞发现与利用测试）上弱于 Sonnet 4.6。Anthropic 明确表示未针对网络任务专门训练，该表现来自通用推理而非定向优化。

Rohan Paul: And Claude Sonnet 5 just launched. Closes the gap with Opus 4.8, and is cheap until August. This makes agentic AI much c...

Anthropic 安全/对齐模型发布编码

05:50

Chubby♨️@kimmonismus

68

Claude Sonnet 5 在 Artificial Analysis Intelligence Index 得分 53，与 GPT-5.5 （xhigh）和 Opus 4.8 （max）差 2-3 分。标准定价（$3/$15 per 1M tokens）下每任务成本 $2.29，比 Sonnet 4.6 贵约 2 倍，比 Opus 4.8 贵约 15%。推理和知识密集型基准落后 Opus 4.8（如 CritPt 物理推理仅 17%），但在 agentic 知识工作（AA-Briefcase 和 GDPval-AA）上匹配或超越 Opus 4.8。上下文窗口 100 万 token，Anthropic 提供至 9 月 1 日促销价 $2/$10。新增 xhigh effort 设置。整体表现令人失望，并非一次好的发布。

Artificial Analysis: Claude Sonnet 5 achieves 53 on the Artificial Analysis Intelligence Index, but without promotional pricing will cost mor...

Anthropic 推理模型发布评测/基准

05:38

Yuchen Jin@Yuchenj_UW

31

Claude Sonnet 5 在 Artificial Analysis Intelligence Index 任务上的成本高于 Claude Opus 4.8，并且是 GLM-5.2 的 4.75 倍。Token 效率很重要。

Anthropic 大佬观点评测/基准

05:31

Rohan Paul@rohanpaul_ai

65

Anthropic 发布专为科研设计的 Claude Science beta 版

Anthropic 推出 Claude Science beta 版，整合 60 个科学数据库，支持代码追踪的 artifact（含环境、方法及完整消息历史），可渲染 3D 蛋白质、基因组轨迹、化学结构等。协调 agent 可调用专业 agent、实验室技能和计算资源（HPC 或 Modal），分析从 1 GPU 扩展至数百，数据保持本地。内置审稿 agent 自动检查计算、引用和图表与源代码一致性。早期用户报告：生成 10 份超 100 页的审稿草稿，种系分析时间降至十分之一。该工具属于 Anthropic 自 2025 年 10 月启动的生命科学与医疗健康计划。

智能体 Anthropic 产品更新

05:28

Artificial Analysis@ArtificialAnlys

60

Claude Sonnet 5 在 Artificial Analysis Intelligence Index 得 53 分，标准定价下每任务成本高于 Opus 4.8

Claude Sonnet 5 以 max effort 在 Artificial Analysis Intelligence Index 上得分 53（第 5 名），比 Sonnet 4.6 提高 6 分，与 GPT-5.5 (xhigh) 持平，落后 Opus 4.7/4.8 约 2-3 分。标准定价下每任务成本 $2.29，比 Sonnet 4.6 贵约 2 倍、比 Opus 4.8 贵 15%，主要因输出 token 增加 40%、agentic 任务调用次数增加约 3 倍。定价 $3/$15 每百万 token（促销至 9 月 1 日降至 $2/$10），上下文窗口 1M tokens，新增 xhigh 力度设置。在 agentic 知识工作基准 AA-Briefcase 和 GDPval-AA 上匹配或超越 Opus 4.8，推理基准仍落后。Terminal-Bench v2.1（+9）、HLE（+10）、SciCode（+7）显著提升。

智能体 Anthropic 推理评测/基准

05:20

AYi@AYi_AInotes

63

Claude 官方宣布推出 Claude Science，一款为科研全阶段设计的新应用。支持代码溯源、按需环境管理，并可连接 60+ 科学数据库，现已开放 beta 测试。有评论称此消息可能冲击众多科研 AI 初创公司。

Claude: Introducing Claude Science, a new app designed with every stage of research in mind. Artifacts traced to their code, env...

Anthropic 产品更新搜索

04:58

ClaudeDevs@ClaudeDevs

51

我们为 Claude Managed Agents 添加了一些更新：流式会话事件增量、按会话的代理覆盖、新的 Webhook 事件类型、反向分页以及凭证注入作用域。

智能体 Anthropic 产品更新部署/工程

04:50

Chubby♨️@kimmonismus

56

OpenAI 推理成本减半 + 自研芯片，Sonnet 5 发布平淡

作者认为 OpenAI 今天取得更重大突破：通过新推理优化方法将推理成本降低一半以上，并与 Broadcom 合作推出更快更高效的推理芯片，使 OpenAI 处于突出位置。相比之下，Sonnet 5 只是一次普通发布。引用推文进一步指出，Sonnet 5 优于 Sonnet 4.6 但弱于 Opus 4.8，定价不变，版本号从 4 跳到 5 不合理，可能只是为维持话题的中间发布，整体令人失望。

Chubby♨️: Here is my first assessment of Sonnet 5: Sonnet 5 is better than Sonnet 4.6. Who would have thought? But jokes aside: Un...

Anthropic OpenAI 大佬观点推理

03:31

Rohan Paul@rohanpaul_ai

74

Anthropic 发布 Claude Sonnet 5，1M token 上下文窗口，编码能力提升

Anthropic 发布 Claude Sonnet 5，拥有 1M token 上下文窗口（此前泄露），编码能力显著提升：SWE-bench Pro 得分 63.2%，高于 Sonnet 4.6 的 58.1%；知识工作略超 Opus 4.8。Anthropic 称其为“最具智能体特性的 Sonnet 模型”。定价优惠至 8 月 26 日：输入 $2/1M tokens，输出 $10/1M tokens；之后涨至 $3/15。当前智能体编码得分 63.2%，与 Opus 4.8（69.2%）仍有差距，但低价策略大幅降低 agentic AI 成本。

Rohan Paul: Leaked specifications show Anthropic's Claude Sonnet 5 launching today with a 1 million token context window

Anthropic 推理模型发布编码

03:31

Rohan Paul@rohanpaul_ai

56

太爱了。Claude 桌面应用现已登陆 Ubuntu/Linux。我是一名硬核 Ubuntu 用户，之前只能通过浏览器和终端使用 Claude。 Claude Mythos 大概在一小时内就构建并发布了这个版本 😂

ClaudeDevs: Claude Desktop is now available on Linux (Ubuntu and Debian) in beta. Alongside the browser and terminal, you now get a ...

Anthropic 产品更新端侧

03:20

AYi@AYi_AInotes

65

Claude Sonnet 5：中端价格，旗舰级 Agent 能力

我靠， Anthropic 把真正能落地的智能体能力，直接下放到了中端产品线， Sonnet 级的价格， Opus 级的智能体能力， Anthropic 这波是真的杀疯了🤯

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体 Anthropic 模型发布

03:08

The Decoder：AI News（RSS）

81

Anthropic 发布 Claude Sonnet 5，号称最智能体版本，逼近 Opus 系列

Anthropic 发布 Claude Sonnet 5，称其为最智能体的 Sonnet 版本，能自主制定计划、使用浏览器和终端工具。基准测试全面超越前代 Sonnet 4.6：SWE-bench Pro 达 63.2%，Terminal-Bench 2.1 为 80.4%，知识工作基准 GDPval-AA v2 得分 1618，略超 Opus 4.8。模型即日起在所有计划上线，开发者可通过 Claude Code 和 API 使用，支持 100 万 token 上下文窗口。截至 2026 年 8 月 31 日，输入价格 $2/百万 token，输出 $10/百万 token，之后恢复至 $3/$15。模型未针对网络安全任务训练，默认启用实时网络防护，幻觉和谄媚行为较前代减少。

智能体 Anthropic 模型发布

关联讨论 9 条