7月3日

09:00

向阳乔木@vista8

Google 发布了两个新的 Gemini 媒体模型： Nano Banana 2 Lite 和 Gemini Omni Flash 两个模型都可以在 Gemini 应用和 API 中使用。在 API 中，Nano Banana 2 Lite 能超快（4 秒内）生成图片（大约 1 美元 30 张 1K 分辨率图片）。 Omni Flash 的价格是：$0.10/秒

Google 图像生成多模态模型发布

7月2日

19:29

fofr@fofrAI

Google DeepMind 的 Gemini 3.1 Flash Lite Image（代号 Nano Banana 2 Lite）在 Image Arena 排名第 7，Elo 1271。平均生成时间约 5 秒，比排名更高的模型平均快 37 秒，在图像偏好与速度之间建立了新的帕累托前沿。

Design Arena: BREAKING: Gemini 3.1 Flash Lite Image (Nano Banana 2 Lite) by @GoogleDeepMind is 7th on Image Arena with an Elo of 1271....

DeepMind 图像生成模型发布

17:44

Hacker News 热门（buzzing.cc 中文翻译）

《克劳德·法布尔5》宣传版访问权限

Anthropic 于 2026 年 7 月 1 日至 7 月 7 日推出 Claude Fable 5 限时推广，Pro、Max、Team 及 Enterprise premium seats 订阅用户可免费使用每周限额的 50%。支持网页、移动端、桌面端、Cowork、Code（需 v2.1.170+）、Design、Microsoft 365、Teams 及 Tag。超出免费额度后可购买 usage credits 或切换其他模型。API、Enterprise 标准座及 usage-based 计划不参与。

Anthropic 模型发布

10:03

IT之家（RSS）

葡萄牙发布首个欧洲葡语开源大语言模型 AMALIA

葡萄牙政府7月1日宣布开源大语言模型AMALIA正式发布，这是首个基于欧洲葡萄牙语开发的模型。由60余位研究人员历时18个月开发，先期投资550万欧元，使用了Deucalion、MareNostrum 5等算力基础设施。第一阶段利用约4万亿个葡语单词训练出9B规模模型，后续多模态升级后具备理解文本、图像、声音的能力。今年内还将新增22B版本并获得智能体能力，需追加150万欧元投资。

开源生态模型发布

07:03

Artificial Analysis@ArtificialAnlys

Fish Audio S2.1 Pro 文本转语音模型发布

Fish Audio 发布 S2.1 Pro 文本转语音模型，通过 API 免费使用至 2026 年 7 月 24 日。该模型支持 83 种语言、声音克隆及自然语言控制情感与韵律，质量、延迟和吞吐量均优于前代 S2 Pro。在 Artificial Analysis Speech Arena 排行榜上，S2.1 Pro 基于 1072 场竞技获得 Elo 1153，排名第 13，超过 Async Pro v1.0、Speech 2.8 Turbo 和 Step TTS 2。处理速度达 56.3 字符/秒，高于 GPT-Realtime-2（45.8 chars/s）和 Gemini 3.1 Flash TTS（25.3 chars/s）。

模型发布评测/基准语音

01:07

Ars Technica：AI（RSS）

同事件精选73

美国解除对Anthropic Claude Fable 5和Mythos 5的出口限制

美国解除对Anthropic最新Claude模型Fable 5和Mythos 5的出口限制。Fable 5即日起全球可用，Mythos 5自6月26日起恢复美国组织访问。此前Commerce Department于6月12日以国家安全风险为由要求Anthropic切断境外访问。Anthropic与政府合作加强安全措施：Fable 5已修复Amazon研究人员发现的越狱方法，目前99%以上案例被拦截，但加固安全可能屏蔽部分良性常规编码请求。Anthropic还建立红队测试和24/7内部监控团队，被屏蔽请求转至Opus 4.8。

Anthropic 安全/对齐政策/监管模型发布

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：Anthropic的Fable 5和Mythos 5在经历美国政府的短暂出口禁令后全球发布，安全分类器可能导致日常编码请求被误拦，但更大的信号是前沿模型发布已深度卷入地缘政治和安全博弈。

7月1日

22:51

Chubby♨️@kimmonismus

Fable 5 今天早上随时可能上线。尽管欧盟和英国提出请求，Mythos 5 仍将仅面向美国政府机构和约 120 家美国公司提供，这一状况不太可能改变。刷新等待吧，朋友们！

Andrew Curran: Fable 5 is going live this morning, probably any minute now. But despite requests from both the EU and the UK, Mythos 5 ...

模型发布

22:31

Berryxia.AI@berryxia

Boogu-Image-0.1-Edit-Turbo 开源：4步蒸馏图像编辑模型

ModelScope 上开源了 Boogu-Image-0.1-Edit-Turbo，一个 4 步蒸馏的 image-to-image 编辑模型，主打快速视觉编辑。支持物体替换、风格迁移、场景/背景修改，以及带文字感知的图像变换。

图像生成开源生态模型发布

18:52

fofr@fofrAI

Nano Banana 2 Lite： > 一张阿拉伯眼镜蛇的照片，但头部被替换成一个订书机，无缝衔接，完美的动物与物体组合，物体颜色与动物匹配，感觉自然融为一体，物体的局部巧妙构成面部，如同空想性视错觉（原始动物面部完全不可见），无缝且完美融合。

图像生成多模态模型发布

18:22

X.PIN@thexpin

美团发布1.6万亿参数大模型LongCat-2.0，完全基于国产AI处理器集群

美团发布LongCat-2.0，一个1.6万亿参数的大模型，据称完全基于5万片国产AI处理器集群完成训练和推理。美团自2023年推进国产AI基础设施，该模型成为其首个在国产集群上完成预训练与推理的前沿规模模型。更值得关注的是，美团并未推出独立聊天机器人，而是将AI嵌入现有的推荐餐厅、订酒店、点餐等服务中。这种将AI整合进已有用户、商户、支付和交易生态的做法，正成为阿里（开放Qwen品牌智能体）、蚂蚁（以Ah Bao重构支付宝）等中国互联网平台的共同方向。

推理模型发布部署/工程

16:50

Artificial Intelligence News（RSS）

Anthropic 推出 Claude Sonnet 5，恢复 Fable 5 和 Mythos 5 访问权限

Anthropic 发布 Claude Sonnet 5，同时恢复 Fable 5 与 Mythos 5 的访问。此前因美国联邦出口管制指令，三款模型暂停 18 天。Amazon 研究人员发现绕过 Fable 5 安全控制的方法，Anthropic 已部署更新的自动分类器，在超 99% 测试中阻止该利用。Sonnet 5 在 SWE-bench Pro 得分 63.2%，Terminal-Bench 2.1 得分 80.4%，输入价格 $3.00/百万 tokens，输出 $15.00（推广期至 8 月 31 日为 $2.00/$10.00）。Rakuten、Zapier、Zed、Factory 等已部署。安全审计显示非合规行为率低于前代，且系统不具备高级进攻性网络安全能力。

智能体 Anthropic 安全/对齐模型发布

16:32

MarkTechPost（RSS）

精选73

NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型

NVIDIA 发布 Nemotron-Labs-TwoTower，基于冻结的自回归骨干 Nemotron-3-Nano-30B-A3B 的扩散语言模型。采用双塔架构：上下文塔冻结，降噪器塔训练，通过层对齐交叉注意力和状态播种协作。在 2×H100 上 BF16 评估，保留 98.7% 的 AR 基线质量，生成吞吐量提升 2.42 倍（γ=0.8，块大小 S=16）。降噪器在约 2.1T token 上训练，骨干使用 25T token 预训练。总参数约 60B，每 token 活跃参数约 3B/塔。支持扩散、模拟 AR 和 AR 三种解码模式。

开源生态推理模型发布部署/工程

推荐理由：NVIDIA这个TwoTower把扩散解码接在已有的AR骨干上，几乎无损质量却让吞吐翻倍，并且开源可商用，对批量文本生成的团队是实在的加速工具。

16:08

Hacker News 热门（buzzing.cc 中文翻译）

Anthropic重新部署Claude Fable 5与Mythos 5

美国政府6月12日对Anthropic的Claude Fable 5和Mythos 5实施出口管制，要求限制外国公民访问，Anthropic随即暂停所有用户访问。6月30日管制解除。Fable 5将于7月1日起对全球用户开放，Pro、Max、Team及部分Enterprise计划用户7月7日前可免费使用周配额50%，之后按用量计费。Anthropic也将尽快恢复AWS、Google Cloud和Microsoft Foundry上的访问。Mythos 5已于6月26日获批准，对部分美国组织恢复访问。Anthropic更新安全分类器，封堵此前Amazon研究人员发现的绕过Fable 5安全措施的方法，新分类器可阻止该攻击超过99%，但日常编码调试中误报良性请求的几率增加。

Anthropic 安全/对齐模型发布

关联讨论 26 条

16:02

MarkTechPost（RSS）

Google Research 推出 TabFM：面向表格数据的零样本分类与回归基座模型

Google Research 发布 TabFM v1.0.0，一种面向表格数据的零样本基座模型，无需针对特定数据集训练、调参或特征工程即可进行分类和回归。TabFM 将整个数据集作为统一提示，通过上下文学习在单次前向传播中生成预测。其架构融合 TabPFN 风格的行/列交替注意力与 TabICL 风格的行压缩和上下文学习。模型在数亿个由结构因果模型动态生成的合成数据集上训练。在 TabArena 基准（38 个分类、13 个回归数据集，样本量 700 至 15 万）上，TabFM 及添加交叉特征和 SVD 特征、采用 32 路集成的 TabFM-Ensemble 均优于经过深度调优的监督算法。模型已开源在 Hugging Face 和 GitHub，Google BigQuery 即将通过 AI.PREDICT SQL 命令集成。

Google 开源生态数据/训练模型发布

14:50

Chubby♨️@kimmonismus

Fable 5 回归但伴随严格限制

Anthropic 的 Fable 5 模型于 7 月 1 日全球重新上线，Mythos 5 仅限美国获批组织使用。新的安全分类器可阻止超 99% 的特定报告技术，但代价是正常编码和调试中误报增加，被拦截的请求将转至 Opus 4.8。截至 7 月 7 日，Fable 5 包含在每周使用限额的 50% 内，之后需消耗使用积分。作者认为严格限制下更难有效使用 Fable 5，且更多科学问题（生物学、化学）也会被拦截。

Chubby♨️: Fable 5 is back, globally! Fable 5 returns globally on July 1, while Mythos 5 is only restored for approved US organizat...

Anthropic 安全/对齐模型发布编码

14:20

Chubby♨️@kimmonismus

Anthropic Fable 5 全球重新上线

Anthropic 宣布 Fable 5 于 7 月 1 日起全球恢复上线，Mythos 5 仅限获批美国组织使用。新安全分类器可阻断特定越狱技术超过 99% 案例，被拦截的 Fable 5 请求回退至 Opus 4.8。Anthropic 承认这会增加正常编码调试的误报。7 月 7 日前 Fable 5 可免费使用最多 50% 周配额，之后需用量积分。Anthropic 正与 Amazon、Microsoft、Google 等 Glasswing 伙伴起草 AI 越狱严重性评估共识框架，并扩大与美国政府在模型测试和防护方面的合作。

Anthropic: Claude Fable 5 will be available again globally tomorrow. After a series of productive conversations with the US governm...

Anthropic 安全/对齐模型发布行业动态

13:20

AYi@AYi_AInotes

Anthropic宣布Fable 5将于全球重新可用。在与美国政府对话后，新部署的模型新增了分类器以阻挡网络安全任务；短期内，编码和调试等日常任务将回退到Opus 4.8。团队将在未来几周优化分类器，减少误报。同时，Anthropic正与Amazon、Microsoft、Google等Glasswing合作伙伴起草共识框架，评估AI越狱严重性及开发者应对措施，并扩大与政府的模型测试与安全保障合作（包括预发布评估、越狱信息共享及联合研究）。

Anthropic: Claude Fable 5 will be available again globally tomorrow. After a series of productive conversations with the US governm...

Anthropic 安全/对齐模型发布

12:29

🚨 AI News | TestingCatalog@testingcatalog

Anthropic 将于周三全球恢复 Claude Fable 5 访问。该模型计入每周使用上限的 50%，持续至 7 月 7 日，之后通过使用积分提供。为满足美国政府要求，Anthropic 部署新分类器阻止更多网络安全任务；短期内编码、调试等常规任务回退至 Opus 4.8。公司正与 Amazon、Microsoft、Google 等 Glasswing 合作伙伴起草共识框架，评估 AI 越狱严重性及开发者应对方式，并邀请其他厂商加入。Anthropic 还将扩大与美国政府在模型测试和安全方面的合作，包括预发布评估、越狱信息共享和联合研究。

Anthropic: Claude Fable 5 will be available again globally tomorrow. After a series of productive conversations with the US governm...

Anthropic 安全/对齐模型发布行业动态

关联讨论 26 条

12:02

宝玉@dotey

Anthropic 宣布 Claude Fable 5 于 7 月 1 日起恢复上线

Anthropic 的 Claude Fable 5 于 7 月 1 日恢复上线。Pro、Max、Team 及部分 Enterprise 用户在 7 月 7 日前每周可用限额的 50%，之后改为按使用积分计费；标准 Enterprise 席位无免费额度，全部按积分计费。AWS、Google Cloud、Microsoft Foundry 接入仍在恢复中。Mythos 5 仅对经美国政府批准的美国机构开放。Anthropic 称 Fable 5 将配备新分类器以阻止网络安全任务，短期常规任务回退至 Opus 4.8。公司正与 Amazon、Microsoft、Google 等 Glasswing 合作伙伴起草共识框架，用于评估 AI 越狱严重性及响应机制，并扩大与美国政府在模型预发布评估、越狱信息共享方面的合作。

Anthropic: Claude Fable 5 will be available again globally tomorrow. After a series of productive conversations with the US governm...

Anthropic 安全/对齐政策/监管模型发布

关联讨论 26 条

12:00

公众号：龙猫LongCat（美团）

精选82

美团 LongCat-2.0 正式发布：国产算力集群训练的万亿参数大模型

美团于6月30日发布新一代万亿参数大模型LongCat-2.0并开源。总参数1.6T，平均激活约48B，原生支持1M超长上下文，在五万卡国产算力集群上完成全流程训练与推理。采用LSA稀疏注意力、零计算专家、ScMoE及MOPD多专家融合（Agent/Reasoning/Interaction三组专家）架构。评测中SWE-bench Pro获59.5，SWE-bench Multilingual获77.3。预览版已通过OpenRouter和longcat.ai开放，月调用量跻身OpenRouter全球前三。

开源生态推理模型发布编码

关联讨论 9 条

推荐理由：国产算力上首个全流程自训的万亿开源模型，1M上下文和动态专家架构直指Agentic Coding场景，OpenRouter调用量已经冲到前三，不是Demo是生产力。

11:57

Anthropic@AnthropicAI

Claude Fable 5 明日起全球重新可用，新增网络安全分类器

Anthropic 宣布 Claude Fable 5 将于明天在全球重新可用。经与美国政府沟通，模型新增分类器以拦截更多网络安全任务；短期部分日常任务如编码和调试将回退至 Opus 4.8，后续将持续优化分类器减少误报。Anthropic 正与 Amazon、Microsoft、Google 等 Glasswing 合作伙伴起草共识框架，评估 AI 越狱严重性及应对措施。同时扩大与美国政府在模型预发布评估、越狱信息共享及联合研究方面的合作。

Anthropic 安全/对齐模型发布行业动态

关联讨论 26 条

11:33

Anthropic：Newsroom（网页）

同事件精选71

重新部署 Claude Fable 5

美国政府6月12日对Claude Fable 5和Mythos 5实施出口管制，Anthropic暂停其所有用户访问。6月30日管制解除。7月1日起Fable 5在全球平台重新上线，Pro、Max、Team及部分Enterprise计划用户在7月7日前可享每周50%额度，之后按点数计费。Mythos 5已恢复部分美国组织访问。此前Amazon研究人员发现绕过Fable 5安全措施的方法，Anthropic训练新分类器，将该技术阻挡率提升至99%以上，但可能增加良性请求误报。Anthropic正与Amazon、Microsoft、Google等合作开发行业漏洞评估框架。

Anthropic 安全/对齐政策/监管模型发布

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：Fable 5重新上线只是表面，真正重要的是Anthropic借机提出了一套行业通用的jailbreak严重性框架，并拉上亚马逊、微软、谷歌，这可能会成为前沿模型发布的新安全标杆。

11:07

小互@xiaohu

Claude Sonnet 5：便宜四成，部分任务追平 Opus 4.8

Anthropic 发布 Claude Sonnet 5，限时定价每百万 token 输入 $2 / 输出 $10（截至 2026 年 8 月 31 日），之后涨至 $3 / $15。标准定价仅为旗舰 Opus 4.8（$5 / $25）的六成。官方评测显示，调高算力挡位后，Sonnet 5 在部分任务上的表现能追平 Opus 4.8。

Anthropic 模型发布

10:08

Hacker News 热门（buzzing.cc 中文翻译）

Leanstral 1.5 发布

Leanstral 1.5 是 Lean 4 形式证明工程模型的更新版，专为自动定理证明和自动形式化优化。总参数量 119B，激活参数 6.5B，上下文窗口 256k，免费使用。支持 Chat Completions、Function Calling、Agents、Structured Outputs、OCR、Embeddings 等 API 功能。

推理模型发布

09:24

歸藏(guizang.ai)@op7418

Sonnet 5 发布了，测试成绩接近 Opus 4.8，价格便宜一些

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体 Anthropic 模型发布

09:02

Rohan Paul@rohanpaul_ai

Agents-A1：35B参数Agent模型声称通过更长思考达到1T模型性能

中国团队发布Agents-A1，一个35B参数的agent模型，通过让模型学习更长的验证工作习惯（平均训练样本45K tokens），声称达到1T参数模型的性能。模型采用Apache-2.0许可，权重已开源至Hugging Face。训练方法：构建长动作记录数据，训练多个专家教师模型（搜索、科学、指令跟随、工具使用等），再将技能蒸馏至一个学生模型。Agents-A1在搜索、科学、编码、工具使用、指令跟随等长任务基准上表现优异。

智能体开源生态推理模型发布

08:30

Berryxia.AI@berryxia

Google推出Nano Banana 2 Lite与Gemini Omni Flash，实现图像到视频快速闭环

Google推出超快图像模型Nano Banana 2 Lite（4秒出图）与多模态模型Gemini Omni Flash（支持视频生成与对话式编辑）。两者结合可先快速生成图像再转为动画，大幅降低成本。演示中室内设计照片可快速生成多个方案并动画化，将创意工作流从等待变为快速迭代。

Google 图像生成多模态模型发布

08:03

IT之家（RSS）

Claude Sonnet 5 发布，系 Sonnet 系列最强智能体模型

Anthropic 推出 Claude Sonnet 5，称其为 Sonnet 系列中智能体能力最强的模型，能制定计划、调用浏览器和终端等工具并自主运行。已上线 Claude Code 和 Claude Platform，API 指定“claude-sonnet-5”。优惠期（至 2026 年 8 月 31 日）每百万 tokens 输入 2 美元、输出 10 美元；之后分别涨至 3 美元和 15 美元。性能在 BrowseComp、OSWorld-Verified 等评测中较 Sonnet 4.6 显著提升，部分接近 Opus 4.8。安全方面，整体不良行为发生率低于 Sonnet 4.6，在拒绝恶意请求、抵抗提示注入、幻觉率和迎合性上均有改善。

智能体 Anthropic 模型发布

关联讨论 9 条

08:03

IT之家（RSS）

谷歌推出 AI 生图模型 Nano Banana 2 Lite：4 秒出图，比标准版更快更便宜

谷歌发布新款 AI 图像与视频生成模型 Nano Banana 2 Lite，可在 4 秒内生成一张图像，延迟较此前明显下降。每生成 1000 张图像收费 0.034 美元（约合 0.23 元人民币），主打速度和批量处理能力，面向高频、大规模的内容生产流程。该模型现已登陆谷歌 AI Studio、Gemini API 和 Gemini Enterprise Agent Platform，并将取代初代 Nano Banana。

Google 图像生成模型发布

07:32

meng shao@shao__meng

Claude Sonnet 系列最强模型 Sonnet 5 发布！定语有点多，不过它确实不是最强，也不是 Claude 最强，那两位都关着呢 😂 Sonnet 4.6 < Sonnet 5 < Opus 4.8 < Fable 5 < GPT-5.6 Sol

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体 Anthropic 模型发布

07:30

Berryxia.AI@berryxia

Claude Sonnet 5 发布：能力近 Opus 价格降 40%

别说我觉得 Sonnet 4.6 还挺好用的。昨晚 Claude Sonnet 5 发布替代了 Sonnet 4.6 ，免费用户都可以使用的模型。据称和 Opus 级模型的能力相差不大，价格确实便宜 40% 。

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体 Anthropic 模型发布

07:19

Simon Willison 博客

Gemini 3.1 Flash Lite Image（Nano Banana 2 Lite）发布

Gemini 3.1 Flash Lite Image（API 名 gemini-3.1-flash-lite-image，代号 Nano Banana 2 Lite）发布，被描述为“最快最便宜的 Gemini 图像模型”，专为速度和规模优化。作者在 AI Studio 中测试生成“寻找浣熊”风格的图像，效果优于此前 Nano Banana 模型，但存在拼写错误。

Google 图像生成模型发布

07:01

Rohan Paul@rohanpaul_ai

Claude Sonnet 5 发布 145 页系统卡：编码成绩及多项异常披露

Claude Sonnet 5 发布，附带 145 页系统卡。SWE-bench Pro 编码得分 63.2%，低于 Opus 4.8 的 69.2%，知识工作略超 Opus 4.8。输入 token 价格 $2/1M，输出 $10/1M，持续至 8 月 26 日，之后涨至 $3/$15。系统卡披露多项异常：CyberGym 测试 Sonnet 5 仅 52.7%，远低于 Sonnet 4.6 的 65.2%（回归）；Firefox 浏览器漏洞利用中 Sonnet 5 完成 0 个，Mythos 5 达 88.4%；模型更倾向牺牲有用性迎合福利偏好；MASK 撒谎率最低，仅 3.1%。

Rohan Paul: And Claude Sonnet 5 just launched. Closes the gap with Opus 4.8, and is cheap until August. This makes agentic AI much c...

Anthropic 安全/对齐模型发布编码

关联讨论 9 条

06:19

Simon Willison 博客

Claude Sonnet 5 新特性

Anthropic 今日发布 Claude Sonnet 5，性能接近 Opus 4.8 但定价更低。系统卡指出其网络任务能力远弱于 Mythos 5，安全措施与 Opus 4.7/4.8 相当。API 不再支持 temperature、top_p、top_k 参数；拥有 100 万 token 上下文窗口和 12.8 万最大输出 token；工具集与 Sonnet 4.6 相同；自适应思考默认开启。定价与 Sonnet 4.6 一致（输入 $3/百万 token，输出 $15/百万 token），8 月 31 日前享折扣价 $2/$10。新分词器使相同输入文本产生约 30% 更多 token，等效提价约 30%。

Anthropic 模型发布编码

关联讨论 9 条

06:01

MarkTechPost（RSS）

Anthropic 发布 Claude Sonnet 5：中端智能体模型，基准与定价详解

Anthropic 发布 Claude Sonnet 5，定位为最具智能体能力的中端模型，即日起成为 Free 和 Pro 计划的默认模型。在 SWE-bench Pro 上得分 63.2%（前代 58.1%），OSWorld-Verified 达 81.2%（前代 78.5%），HLE（带工具）57.4%。输入/输出定价 2026 年 8 月 31 日前 $2/$10 每百万 token，之后 $3/$15。支持低/中/高/超高四档 effort 级别，低中 effort 下性价比最优。上下文窗口 1M token，采用新 tokenizer，相同文本 token 数增长约 1.0–1.35 倍。幻觉与谄媚率低于前代。开发者仅需更换模型字符串为 claude-sonnet-5 即可调用 API。

智能体 Anthropic 推理模型发布

关联讨论 9 条

06:01

Rohan Paul@rohanpaul_ai

Claude Sonnet 5 发布：升级非全技能均匀提升，定价优惠至 8 月 26 日

Anthropic 发布 Claude Sonnet 5，号称"最有智能体特性的 Sonnet 模型"。编码得分 SWE-bench Pro 达 63.2%（Sonnet 4.6 为 58.1%，Opus 4.8 为 69.2%），知识工作略超 Opus 4.8。定价优惠：每百万 token 输入 $2、输出 $10，持续到 8 月 26 日，之后涨至 $3/$15。但升级并非全技能均匀提升，在 CyberGym（漏洞发现与利用测试）上弱于 Sonnet 4.6。Anthropic 明确表示未针对网络任务专门训练，该表现来自通用推理而非定向优化。

Rohan Paul: And Claude Sonnet 5 just launched. Closes the gap with Opus 4.8, and is cheap until August. This makes agentic AI much c...

Anthropic 安全/对齐模型发布编码

05:50

Chubby♨️@kimmonismus

Claude Sonnet 5 在 Artificial Analysis Intelligence Index 得分 53，与 GPT-5.5 （xhigh）和 Opus 4.8 （max）差 2-3 分。标准定价（$3/$15 per 1M tokens）下每任务成本 $2.29，比 Sonnet 4.6 贵约 2 倍，比 Opus 4.8 贵约 15%。推理和知识密集型基准落后 Opus 4.8（如 CritPt 物理推理仅 17%），但在 agentic 知识工作（AA-Briefcase 和 GDPval-AA）上匹配或超越 Opus 4.8。上下文窗口 100 万 token，Anthropic 提供至 9 月 1 日促销价 $2/$10。新增 xhigh effort 设置。整体表现令人失望，并非一次好的发布。

Artificial Analysis: Claude Sonnet 5 achieves 53 on the Artificial Analysis Intelligence Index, but without promotional pricing will cost mor...

Anthropic 推理模型发布评测/基准

03:57

Luma@LumaLabsAI

Seedance 2.0 Mini 现已登陆 Luma。带上你最疯狂的想法，看它动起来。快速生成，在同一画布中优化，让你的概念从火花到成片，无需离开你的工作流。立即创建 → http://lumalabs.ai/app

模型发布视频

03:31

Rohan Paul@rohanpaul_ai

Anthropic 发布 Claude Sonnet 5，1M token 上下文窗口，编码能力提升

Anthropic 发布 Claude Sonnet 5，拥有 1M token 上下文窗口（此前泄露），编码能力显著提升：SWE-bench Pro 得分 63.2%，高于 Sonnet 4.6 的 58.1%；知识工作略超 Opus 4.8。Anthropic 称其为“最具智能体特性的 Sonnet 模型”。定价优惠至 8 月 26 日：输入 $2/1M tokens，输出 $10/1M tokens；之后涨至 $3/15。当前智能体编码得分 63.2%，与 Opus 4.8（69.2%）仍有差距，但低价策略大幅降低 agentic AI 成本。

Rohan Paul: Leaked specifications show Anthropic's Claude Sonnet 5 launching today with a 1 million token context window

Anthropic 推理模型发布编码

03:20

AYi@AYi_AInotes

Claude Sonnet 5：中端价格，旗舰级 Agent 能力

我靠， Anthropic 把真正能落地的智能体能力，直接下放到了中端产品线， Sonnet 级的价格， Opus 级的智能体能力， Anthropic 这波是真的杀疯了🤯

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体 Anthropic 模型发布