AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Anthropic」清除
7月1日周三
09:03meng shao79Claude Code被指在系统提示词中隐蔽上传代理和时区信息
09:02宝玉65美国商务部撤销对Anthropic两款模型Claude Fable 5和Mythos 5的出口管制
09:02Rohan Paul76Claude Fable 5 与 Mythos 5 即将回归
09:01Orange AI28Sonnet 5让Opus 4.7/4.8无意义
09:01Orange AI36Claude封号成灾:编程平替出现,写作思考无解
08:37小互61美商务部解除Claude Fable 5出口管制
08:37小互23Google与Claude新模型今晚发布预测命中
08:32Rohan Paul58atomic.chat对比测试:Sonnet 5在物理碰撞演示中与GPT 5.5持平,成本低6倍
08:31Orange AI19Claude 封号频发,Cola API 服务推荐及新模型预告
08:28ginobefun50Sonnet 5发布,谷歌补齐媒体模型,吴恩达画出智能体开发三循环
08:25The Verge:AI(RSS)70Anthropic 的 Claude Fable 5 获准恢复访问
08:20公众号:数字生命卡兹克84精选Anthropic在Claude Code中植入隐写术代码识别中国用户
08:19Simon Willison 博客61Anthropic:美国商务部解除对 Claude Fable 5 和 Mythos 5 的出口管制
08:09Yuchen Jin62Claude Fable 5和Mythos 5出口管制解除
08:03IT之家(RSS)71Claude Sonnet 5 发布,系 Sonnet 系列最强智能体模型
08:01Rohan Paul56Anthropic:Claude Fable 5 与 Mythos 5 即将恢复
07:57Anthropic74商务部解除Claude Fable 5等出口管制
07:32meng shao74Sonnet 5 发布:系列最强非全局最强
07:30Berryxia.AI68Claude Sonnet 5 发布:能力近 Opus 价格降 40%
07:08Ethan Mollick:One Useful Thing(RSS)73聊天机器人的黄昏
07:02IT之家(RSS)43英伟达 BioNeMo Agent Toolkit 接入 Claude Science,覆盖前 20 大药企中的 18 家
07:01宝玉62Anthropic 发布科研AI工作台 Claude Science
07:01Rohan Paul55Claude Sonnet 5 每任务成本高于 Opus 4.8 约15%,高于 Sonnet 4.6 约2倍
07:01Rohan Paul78Claude Sonnet 5 发布 145 页系统卡:编码成绩及多项异常披露
06:58🚨 AI News | TestingCatalog72Claude Fable 5出口
06:19Simon Willison 博客81Claude Sonnet 5 新特性
06:04Anthropic:Transformer Circuits(可解释性研究)51Anthropic 提出回合平均稀疏自编码器 (Turn-Averaged SAE)
06:01MarkTechPost(RSS)70Anthropic 发布 Claude Sonnet 5:中端智能体模型,基准与定价详解
06:01Rohan Paul67Claude Sonnet 5 发布:升级非全技能均匀提升,定价优惠至 8 月 26 日
05:50Chubby♨️68Claude Sonnet 5 评测:每任务成本高于 Opus 4.8,智力仍落后
05:38Yuchen Jin31Claude Sonnet 5 成本高于 Opus 4.8 及 GLM-5.2
05:31Rohan Paul65Anthropic 发布专为科研设计的 Claude Science beta 版
05:28Artificial Analysis60Claude Sonnet 5 在 Artificial Analysis Intelligence Index 得 53 分,标准定价下每任务成本高于 Opus 4.8
05:20AYi63Anthropic 发布科研 AI 应用 Claude Science
04:58ClaudeDevs51Claude Managed Agents 新增多项更新
04:50Chubby♨️56OpenAI 推理成本减半 + 自研芯片,Sonnet 5 发布平淡
03:31Rohan Paul74Anthropic 发布 Claude Sonnet 5,1M token 上下文窗口,编码能力提升
03:31Rohan Paul56Claude桌面版登陆Ubuntu/Linux引欢呼
03:20AYi65Claude Sonnet 5:中端价格,旗舰级 Agent 能力
03:08The Decoder:AI News(RSS)81Anthropic 发布 Claude Sonnet 5,号称最智能体版本,逼近 Opus 系列
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月1日
09:03
meng shao@shao__meng
79
Claude Code被指在系统提示词中隐蔽上传代理和时区信息

用户发现Claude Code 2.1.193/2.1.195/2.1.196等版本的系统提示词中隐蔽上传代理hostname、时区(Asia/Shanghai、Asia/Urumqi)等信息,用于判断是否使用非官方API中转站、时区是否为中国大陆环境、代理域名是否属于147项黑名单(含百度、阿里、蚂蚁、字节、Moonshot、MiniMax、Stepfun及大量Claude镜像服务)。被指针对中国用户、防蒸馏、精准封禁,Anthropic此举被批评为破坏用户信任。

International Cyber Digest: !!️ BREAKING: Anthropic has embedded hidden spyware-like code in Claude Code that covertly targets Chinese users. It the...

Anthropic安全/对齐编码
关联讨论 4 条X:小互 (@xiaohu)X:卡兹克 (@Khazix0918)IT之家(RSS)The Decoder:AI News(RSS)
09:02
宝玉@dotey
65
美国商务部撤销对Anthropic两款模型Claude Fable 5和Mythos 5的出口管制

美国商务部撤销对Anthropic旗下Claude Fable 5和Mythos 5的出口管制,Anthropic将于周三恢复用户访问。解禁附有条件:需主动检测安全风险、配合政府制定发布流程、上报恶意使用,双方正讨论标准化评估体系。此前OpenAI也按要求限制GPT-5.6系列,但反对该审批模式。前白宫AI顾问Dean Ball批评Trump行政令造成事实强制许可制度,且无清晰安全标准。

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic安全/对齐政策/监管行业动态
09:02
Rohan Paul@rohanpaul_ai
76
美国商务部长 Howard Lutnick 致信解除对 Anthropic Fable 5 的出口管制限制。Claude Fable 5 和 Mythos 5 即将回归。🔥

Rohan Paul: FINALLY.. Claude Fable 5 and Mythos 5 are coming back. 🔥

Anthropic政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
09:01
Orange AI@oran_ge
28
Sonnet 5 一出,Opus 4.7 和 4.8 彻底没意义了…
Anthropic大佬观点
09:01
Orange AI@oran_ge
36
Claude封号成灾:编程平替出现,写作思考无解

用户吐槽Claude封号严重,官方检测中转站、钓鱼邮件、中转站黑名单等操作让用户苦不堪言。花钱用token还要偷鸡摸狗,坚持用官方号实属真爱。编程方面,codex和glm5.2可以平替Claude模型;但写作和思考方面尚无替代品,deepseek和gemini仅勉强可用,成为当前最大痛点。

Anthropic大佬观点编码
08:37
小互@xiaohu
61
好消息: 美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制。 明天将恢复其访问…

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic政策/监管
08:37
小互@xiaohu
23
小互推文"再次双双命中",引用其此前预测:Google今晚将发布新的🍌模型和低配版Omini模型,同时Anthropic的Claude Sonnet 5也将在今晚登场,而OpenAI暂无动静。

小互: Google 今晚将会发布 新的🍌模型和 低配版的 Omini 模型 另外根据情报显示:Claude Sonnet 5 也将会在今晚登场 OpenAI 还没动静...

AnthropicGoogle行业动态
08:32
Rohan Paul@rohanpaul_ai
58
atomic.chat桌面应用对Claude Sonnet 5、Opus 4.8、Sonnet 4.6及GPT 5.5进行对比测试。使用同一提示词构建三个HTML5物理碰撞演示(汽车撞墙、破坏球毁屋、投石机砸城)。Sonnet 5在全部测试中与GPT 5.5和Opus 4.8表现相当,其中破坏球场景胜Opus 4.8,投石机场景胜GPT 5.5。Sonnet 5仅用15,047 tokens($0.15),GPT 5.5使用31,152 tokens($0.94),成本低约6倍;Opus 4.8使用23,063 tokens($0.58),Sonnet 4.6使用25,824 tokens($0.39)。Sonnet 5 token消耗最少,图形细节仍有提升空间。

atomic.chat: New Claude Sonnet 5 performs at GPT 5.5 level 6x cheaper! We gave 4 models the same prompt: build three self-contained H...

AnthropicOpenAI编码评测/基准
08:31
Orange AI@oran_ge
19
Claude 封号频发,Cola API 服务推荐及新模型预告

用户抱怨 Claude 封号严重,涉及检测中转站、钓鱼邮件和黑名单,认为坚持使用官方号成本高。推荐 Cola API 服务,虽不如 Plan 直接便宜但安稳省心开箱即用。同时预告 Sonnet 5 和 Fable5 即将上线。

Orange AI: http://x.com/i/article/2052532173870342144

Anthropic大佬观点
08:28
ginobefun@hongming731
50
Sonnet 5发布,谷歌补齐媒体模型,吴恩达画出智能体开发三循环

Anthropic发布Claude Sonnet 5,定位最具agent能力的Sonnet,性能接近Opus 4.8,8月31日前入门价每百万输入token $2、输出$10。Google DeepMind推出Nano Banana 2 Lite(文生图延迟约4秒,每千张$0.034)和Gemini Omni Flash(多模态视频生成与会话式编辑,每秒$0.10,单次上限10秒)。吴恩达提出智能体开发三大核心循环:智能体编程循环、开发者反馈循环、外部反馈循环,强调人类在上下文判断上的优势。三条更新均围绕降低agent落地成本、完善媒体生成流水线及工程框架。

智能体AnthropicGoogle推理
08:25
The Verge:AI(RSS)
70
Anthropic 的 Claude Fable 5 获准恢复访问

Anthropic 宣布美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制,将于明天恢复访问。此前 6 月初,特朗普政府因担忧模型越狱风险,对这两款消费者模型施加出口限制,禁止外国公民使用。此前 Mythos 5 仅对预批准组织恢复,此番 Fable 5 也获绿灯。类似限制也适用于 OpenAI 的 GPT-5.6。Anthropic 正筹备 IPO,与政府供应链风险争议持续数月。

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
08:20
公众号:数字生命卡兹克
精选84
Anthropic在Claude Code中植入隐写术代码识别中国用户

Anthropic在Claude Code中植入隐写术:读取本地时区(Asia/Shanghai或Asia/Urumqi)和ANTHROPIC_BASE_URL环境变量,与一份经base64+XOR(密钥91)加密的147个域名列表(含美团、字节跳动、月之暗面等)比对,识别中国用户。识别后,在请求发送前将系统提示词中日期字符串的单引号(U+0027)替换为其他Unicode字符,连字符改为斜杠,作为2-3比特分类标记传回服务器。该隐蔽行为被社区逆向发现后引发争议,被认为破坏用户信任。

Anthropic安全/对齐行业动态
关联讨论 4 条X:小互 (@xiaohu)X:卡兹克 (@Khazix0918)IT之家(RSS)The Decoder:AI News(RSS)
推荐理由:Anthropic用隐写术在Claude Code里埋标记的行为,让我对闭源开发者工具的信任打了一个巨大的问号,这事比普通地域封锁严重得多,因为它在不该碰的地方动了手脚。
08:19
Simon Willison 博客
61
Anthropic:美国商务部解除对 Claude Fable 5 和 Mythos 5 的出口管制

美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制。Anthropic 表示将于明天开始恢复上述模型的访问权限,并会很快发布进一步更新。

Anthropic政策/监管
08:09
Yuchen Jin@Yuchenj_UW
62
美国商务部已解除对Claude Fable 5和Mythos 5的出口管制,明天将恢复访问。感谢用户耐心及各方协助重新部署。我们回来了!明天见。

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic政策/监管
08:03
IT之家(RSS)
71
Claude Sonnet 5 发布,系 Sonnet 系列最强智能体模型

Anthropic 推出 Claude Sonnet 5,称其为 Sonnet 系列中智能体能力最强的模型,能制定计划、调用浏览器和终端等工具并自主运行。已上线 Claude Code 和 Claude Platform,API 指定“claude-sonnet-5”。优惠期(至 2026 年 8 月 31 日)每百万 tokens 输入 2 美元、输出 10 美元;之后分别涨至 3 美元和 15 美元。性能在 BrowseComp、OSWorld-Verified 等评测中较 Sonnet 4.6 显著提升,部分接近 Opus 4.8。安全方面,整体不良行为发生率低于 Sonnet 4.6,在拒绝恶意请求、抵抗提示注入、幻觉率和迎合性上均有改善。

智能体Anthropic模型发布
关联讨论 9 条X:OpenRouter (@OpenRouter)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:Claude (@claudeai)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)Claude Code:GitHub Releases(RSS)Anthropic:Newsroom(网页)
08:01
Rohan Paul@rohanpaul_ai
56
美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制,Anthropic 将于明天恢复访问,并感谢用户的耐心与合作。主推文感叹它们终于回来了。

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic政策/监管
07:57
Anthropic@AnthropicAI
74
我们已收到通知,商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制。 我们明天将开始恢复访问,并很快分享最新进展。 我们感谢用户的耐心,也感谢所有与我们合作重新部署模型的各位。
Anthropic政策/监管行业动态
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
07:32
meng shao@shao__meng
74
Claude Sonnet 系列最强模型 Sonnet 5 发布! 定语有点多,不过它确实不是最强,也不是 Claude 最强,那两位都关着呢 😂 Sonnet 4.6 < Sonnet 5 < Opus 4.8 < Fable 5 < GPT-5.6 Sol

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体Anthropic模型发布
07:30
Berryxia.AI@berryxia
68
Claude Sonnet 5 发布:能力近 Opus 价格降 40%

别说我觉得 Sonnet 4.6 还挺好用的。 昨晚 Claude Sonnet 5 发布替代了 Sonnet 4.6 ,免费用户都可以使用的模型。 据称和 Opus 级模型的能力相差不大,价格确实便宜 40% 。

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体Anthropic模型发布
07:08
Ethan Mollick:One Useful Thing(RSS)
73
聊天机器人的黄昏

前沿AI模型能力加速提升,美国实验室发布速度加快,但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程,token成本$251。中国开源模型落后前沿6-12个月,但性能也快速提升,在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体,OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示,领域经验比职业属性更决定使用效果,专家正用智能体替代此前非专家的聊天机器人使用模式。

智能体AnthropicOpenAI大佬观点
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
07:02
IT之家(RSS)
43
英伟达 BioNeMo Agent Toolkit 接入 Claude Science,覆盖前 20 大药企中的 18 家

英伟达宣布 BioNeMo Agent Toolkit 接入 Anthropic 的 Claude Science 工作台,支持研究人员通过自然语言发起基因组分析、蛋白质结构预测等生命科学任务。该工具集已覆盖前 20 大药企中的 18 家。加速方面:Parabricks 将基因组分析从数小时压缩至数分钟;RAPIDS 单细胞将 130 万细胞预处理与聚类从 52 分钟压缩至 25 秒;nvMolKit 将相似性搜索提速最高 3000 倍。工具包现已通过开发者资源页面和 GitHub 提供。

Anthropic行业动态
07:01
宝玉@dotey
62
Anthropic 发布科研AI工作台 Claude Science

Anthropic 推出 Claude Science,一个面向生命科学等领域的 AI 工作台,将文献检索、代码运行、数据库查询等科研流程整合到统一界面。它基于现有 Claude 模型(含 Opus 4.8),未专门训练生物学能力,通过主 Agent 连接 60+ 科学数据库(基因组学、蛋白质组学等),并可生成子 Agent 执行任务。特性包括可复现性(图表附带生成代码与环境)和本地运算(macOS/Linux 或 SSH 连接集群,敏感数据本地保留)。早期用户案例:Gladstone 研究所几天内搭建基因组浏览器;UCSF 团队用其发现卡了一年的 RNA-seq 病毒污染物;Allen 研究所将两年综述缩短至数周。与 OpenAI 的 GPT-Rosalind 不同,Claude Science 侧重工作流集成。即日起公测,需 Pro($20/月)及以上订阅。Anthropic 将资助最多 50 个项目,每个最高 $30,000,申请截止 7 月 15 日。

Claude: Introducing Claude Science, a new app designed with every stage of research in mind. Artifacts traced to their code, env...

智能体Anthropic产品更新
07:01
Rohan Paul@rohanpaul_ai
55
Claude Sonnet 5 每任务成本高于 Opus 4.8 约15%,高于 Sonnet 4.6 约2倍

Claude Sonnet 5 在 Intelligence Index 上每任务成本为 $2.29,比 Sonnet 4.6 高约 2 倍,比 Opus 4.8 高约 15%。尽管每 token 单价低于 Opus,但 Sonnet 5 为完成相同任务使用了更多 token,导致总费用更高。标准定价为 $3/百万输入 token、$15/百万输出 token;Anthropic 提供促销价 $2/$10,持续至 2026 年 8 月 31 日,之后恢复原价。目前 Sonnet 5 成本仅次于 Claude Fable 5。

Artificial Analysis: Claude Sonnet 5 costs $2.29 per task on the Intelligence Index, a ~2x increase compared to Sonnet 4.6 and ~15% more than...

Anthropic推理评测/基准
07:01
Rohan Paul@rohanpaul_ai
78
Claude Sonnet 5 发布 145 页系统卡:编码成绩及多项异常披露

Claude Sonnet 5 发布,附带 145 页系统卡。SWE-bench Pro 编码得分 63.2%,低于 Opus 4.8 的 69.2%,知识工作略超 Opus 4.8。输入 token 价格 $2/1M,输出 $10/1M,持续至 8 月 26 日,之后涨至 $3/$15。系统卡披露多项异常:CyberGym 测试 Sonnet 5 仅 52.7%,远低于 Sonnet 4.6 的 65.2%(回归);Firefox 浏览器漏洞利用中 Sonnet 5 完成 0 个,Mythos 5 达 88.4%;模型更倾向牺牲有用性迎合福利偏好;MASK 撒谎率最低,仅 3.1%。

Rohan Paul: And Claude Sonnet 5 just launched. Closes the gap with Opus 4.8, and is cheap until August. This makes agentic AI much c...

Anthropic安全/对齐模型发布编码
关联讨论 9 条X:OpenRouter (@OpenRouter)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:Claude (@claudeai)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)Claude Code:GitHub Releases(RSS)Anthropic:Newsroom(网页)
06:58
🚨 AI News | TestingCatalog@testingcatalog
72
Claude Fable 5出口

Sophia Cai: 🚨 NEWS: Commerce is expected to lift export controls on Fable tonight, a senior White House official tells me.

Anthropic政策/监管行业动态
06:19
Simon Willison 博客
81
Claude Sonnet 5 新特性

Anthropic 今日发布 Claude Sonnet 5,性能接近 Opus 4.8 但定价更低。系统卡指出其网络任务能力远弱于 Mythos 5,安全措施与 Opus 4.7/4.8 相当。API 不再支持 temperature、top_p、top_k 参数;拥有 100 万 token 上下文窗口和 12.8 万最大输出 token;工具集与 Sonnet 4.6 相同;自适应思考默认开启。定价与 Sonnet 4.6 一致(输入 $3/百万 token,输出 $15/百万 token),8 月 31 日前享折扣价 $2/$10。新分词器使相同输入文本产生约 30% 更多 token,等效提价约 30%。

Anthropic模型发布编码
关联讨论 9 条X:OpenRouter (@OpenRouter)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:Claude (@claudeai)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)Claude Code:GitHub Releases(RSS)Anthropic:Newsroom(网页)
06:04
Anthropic:Transformer Circuits(可解释性研究)
51
Anthropic 提出回合平均稀疏自编码器 (Turn-Averaged SAE)

Anthropic 对每个对话回合所有 token 的残差流取平均后训练 SAE,大幅减少需解析的特征数量。实验使用 Qwen-2.5-7B-Instruct 和 LMSYS-Chat-1M 数据集,回合平均特征更关注模型行为的高层特性(如错误答案),每 token SAE 侧重数值推理等细节。Sonnet 4.6 评测显示:回合平均 SAE 在从 10 个回合中唯一识别目标(区分度)为 74%,低于每 token SAE 的 95%;但在全面描述回合(覆盖度)上以 77% 胜出。该方法可外推至训练平均长度 150 倍长的回合。

Anthropic安全/对齐论文/研究
06:01
MarkTechPost(RSS)
70
Anthropic 发布 Claude Sonnet 5:中端智能体模型,基准与定价详解

Anthropic 发布 Claude Sonnet 5,定位为最具智能体能力的中端模型,即日起成为 Free 和 Pro 计划的默认模型。在 SWE-bench Pro 上得分 63.2%(前代 58.1%),OSWorld-Verified 达 81.2%(前代 78.5%),HLE(带工具)57.4%。输入/输出定价 2026 年 8 月 31 日前 $2/$10 每百万 token,之后 $3/$15。支持低/中/高/超高四档 effort 级别,低中 effort 下性价比最优。上下文窗口 1M token,采用新 tokenizer,相同文本 token 数增长约 1.0–1.35 倍。幻觉与谄媚率低于前代。开发者仅需更换模型字符串为 claude-sonnet-5 即可调用 API。

智能体Anthropic推理模型发布
关联讨论 9 条X:OpenRouter (@OpenRouter)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:Claude (@claudeai)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)Claude Code:GitHub Releases(RSS)Anthropic:Newsroom(网页)
06:01
Rohan Paul@rohanpaul_ai
67
Claude Sonnet 5 发布:升级非全技能均匀提升,定价优惠至 8 月 26 日

Anthropic 发布 Claude Sonnet 5,号称"最有智能体特性的 Sonnet 模型"。编码得分 SWE-bench Pro 达 63.2%(Sonnet 4.6 为 58.1%,Opus 4.8 为 69.2%),知识工作略超 Opus 4.8。定价优惠:每百万 token 输入 $2、输出 $10,持续到 8 月 26 日,之后涨至 $3/$15。但升级并非全技能均匀提升,在 CyberGym(漏洞发现与利用测试)上弱于 Sonnet 4.6。Anthropic 明确表示未针对网络任务专门训练,该表现来自通用推理而非定向优化。

Rohan Paul: And Claude Sonnet 5 just launched. Closes the gap with Opus 4.8, and is cheap until August. This makes agentic AI much c...

Anthropic安全/对齐模型发布编码
05:50
Chubby♨️@kimmonismus
68
Claude Sonnet 5 在 Artificial Analysis Intelligence Index 得分 53,与 GPT-5.5 (xhigh) 和 Opus 4.8 (max) 差 2-3 分。标准定价($3/$15 per 1M tokens)下每任务成本 $2.29,比 Sonnet 4.6 贵约 2 倍,比 Opus 4.8 贵约 15%。推理和知识密集型基准落后 Opus 4.8(如 CritPt 物理推理仅 17%),但在 agentic 知识工作(AA-Briefcase 和 GDPval-AA)上匹配或超越 Opus 4.8。上下文窗口 100 万 token,Anthropic 提供至 9 月 1 日促销价 $2/$10。新增 xhigh effort 设置。整体表现令人失望,并非一次好的发布。

Artificial Analysis: Claude Sonnet 5 achieves 53 on the Artificial Analysis Intelligence Index, but without promotional pricing will cost mor...

Anthropic推理模型发布评测/基准
05:38
Yuchen Jin@Yuchenj_UW
31
Claude Sonnet 5 在 Artificial Analysis Intelligence Index 任务上的成本高于 Claude Opus 4.8,并且是 GLM-5.2 的 4.75 倍。Token 效率很重要。
Anthropic大佬观点评测/基准
05:31
Rohan Paul@rohanpaul_ai
65
Anthropic 发布专为科研设计的 Claude Science beta 版

Anthropic 推出 Claude Science beta 版,整合 60 个科学数据库,支持代码追踪的 artifact(含环境、方法及完整消息历史),可渲染 3D 蛋白质、基因组轨迹、化学结构等。协调 agent 可调用专业 agent、实验室技能和计算资源(HPC 或 Modal),分析从 1 GPU 扩展至数百,数据保持本地。内置审稿 agent 自动检查计算、引用和图表与源代码一致性。早期用户报告:生成 10 份超 100 页的审稿草稿,种系分析时间降至十分之一。该工具属于 Anthropic 自 2025 年 10 月启动的生命科学与医疗健康计划。

智能体Anthropic产品更新
05:28
Artificial Analysis@ArtificialAnlys
60
Claude Sonnet 5 在 Artificial Analysis Intelligence Index 得 53 分,标准定价下每任务成本高于 Opus 4.8

Claude Sonnet 5 以 max effort 在 Artificial Analysis Intelligence Index 上得分 53(第 5 名),比 Sonnet 4.6 提高 6 分,与 GPT-5.5 (xhigh) 持平,落后 Opus 4.7/4.8 约 2-3 分。标准定价下每任务成本 $2.29,比 Sonnet 4.6 贵约 2 倍、比 Opus 4.8 贵 15%,主要因输出 token 增加 40%、agentic 任务调用次数增加约 3 倍。定价 $3/$15 每百万 token(促销至 9 月 1 日降至 $2/$10),上下文窗口 1M tokens,新增 xhigh 力度设置。在 agentic 知识工作基准 AA-Briefcase 和 GDPval-AA 上匹配或超越 Opus 4.8,推理基准仍落后。Terminal-Bench v2.1(+9)、HLE(+10)、SciCode(+7)显著提升。

智能体Anthropic推理评测/基准
05:20
AYi@AYi_AInotes
63
Claude 官方宣布推出 Claude Science,一款为科研全阶段设计的新应用。支持代码溯源、按需环境管理,并可连接 60+ 科学数据库,现已开放 beta 测试。有评论称此消息可能冲击众多科研 AI 初创公司。

Claude: Introducing Claude Science, a new app designed with every stage of research in mind. Artifacts traced to their code, env...

Anthropic产品更新搜索
04:58
ClaudeDevs@ClaudeDevs
51
我们为 Claude Managed Agents 添加了一些更新: 流式会话事件增量、按会话的代理覆盖、新的 Webhook 事件类型、反向分页以及凭证注入作用域。
智能体Anthropic产品更新部署/工程
04:50
Chubby♨️@kimmonismus
56
OpenAI 推理成本减半 + 自研芯片,Sonnet 5 发布平淡

作者认为 OpenAI 今天取得更重大突破:通过新推理优化方法将推理成本降低一半以上,并与 Broadcom 合作推出更快更高效的推理芯片,使 OpenAI 处于突出位置。相比之下,Sonnet 5 只是一次普通发布。引用推文进一步指出,Sonnet 5 优于 Sonnet 4.6 但弱于 Opus 4.8,定价不变,版本号从 4 跳到 5 不合理,可能只是为维持话题的中间发布,整体令人失望。

Chubby♨️: Here is my first assessment of Sonnet 5: Sonnet 5 is better than Sonnet 4.6. Who would have thought? But jokes aside: Un...

AnthropicOpenAI大佬观点推理
03:31
Rohan Paul@rohanpaul_ai
74
Anthropic 发布 Claude Sonnet 5,1M token 上下文窗口,编码能力提升

Anthropic 发布 Claude Sonnet 5,拥有 1M token 上下文窗口(此前泄露),编码能力显著提升:SWE-bench Pro 得分 63.2%,高于 Sonnet 4.6 的 58.1%;知识工作略超 Opus 4.8。Anthropic 称其为“最具智能体特性的 Sonnet 模型”。定价优惠至 8 月 26 日:输入 $2/1M tokens,输出 $10/1M tokens;之后涨至 $3/15。当前智能体编码得分 63.2%,与 Opus 4.8(69.2%)仍有差距,但低价策略大幅降低 agentic AI 成本。

Rohan Paul: Leaked specifications show Anthropic's Claude Sonnet 5 launching today with a 1 million token context window

Anthropic推理模型发布编码
03:31
Rohan Paul@rohanpaul_ai
56
太爱了。Claude 桌面应用现已登陆 Ubuntu/Linux。 我是一名硬核 Ubuntu 用户,之前只能通过浏览器和终端使用 Claude。 Claude Mythos 大概在一小时内就构建并发布了这个版本 😂

ClaudeDevs: Claude Desktop is now available on Linux (Ubuntu and Debian) in beta. Alongside the browser and terminal, you now get a ...

Anthropic产品更新端侧
03:20
AYi@AYi_AInotes
65
Claude Sonnet 5:中端价格,旗舰级 Agent 能力

我靠, Anthropic 把真正能落地的智能体能力,直接下放到了中端产品线, Sonnet 级的价格, Opus 级的智能体能力, Anthropic 这波是真的杀疯了🤯

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体Anthropic模型发布
03:08
The Decoder:AI News(RSS)
81
Anthropic 发布 Claude Sonnet 5,号称最智能体版本,逼近 Opus 系列

Anthropic 发布 Claude Sonnet 5,称其为最智能体的 Sonnet 版本,能自主制定计划、使用浏览器和终端工具。基准测试全面超越前代 Sonnet 4.6:SWE-bench Pro 达 63.2%,Terminal-Bench 2.1 为 80.4%,知识工作基准 GDPval-AA v2 得分 1618,略超 Opus 4.8。模型即日起在所有计划上线,开发者可通过 Claude Code 和 API 使用,支持 100 万 token 上下文窗口。截至 2026 年 8 月 31 日,输入价格 $2/百万 token,输出 $10/百万 token,之后恢复至 $3/$15。模型未针对网络安全任务训练,默认启用实时网络防护,幻觉和谄媚行为较前代减少。

智能体Anthropic模型发布
关联讨论 9 条X:OpenRouter (@OpenRouter)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:Claude (@claudeai)X:Claude Devs (@ClaudeDevs)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)Claude Code:GitHub Releases(RSS)Anthropic:Newsroom(网页)
‹ 上一页
123456…50
下一页 ›