6月4日

02:15

Ethan Mollick@emollick

5月初，顶级超级预测者预计2026年底前最长METR 80%任务时间范围可达3-4小时。然而5月底，Anthropic的Claude Mythos模型在METR基准预览中即以80%成功率达到3小时6分钟，直接落在专家和超级预测者对2026年底的中位数预测范围内（3-4小时）。此前基线为1.5小时。此次突破表明AI能力进展速度远超预期。

Forecasting Research Institute: We also asked forecasters to predict the longest 80% success time horizon achieved by the end of 2026. All three groups ...

智能体 Anthropic 大佬观点

01:23

Claude：Blog（网页）

精选68

Claude Code技能使用经验：Anthropic内部实践

Anthropic 分享了内部使用 Claude Code 的 Skills（技能）功能的经验。Skills 是指令、脚本和资源的文件夹，智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能，它们可归为九类，包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别，涵盖过多功能会混淆智能体。团队发现，投入时间优化验证类技能对 Claude 输出质量的提升最显著。

智能体 Anthropic MCP/工具教程/实践

推荐理由：这不是产品公告，而是从几百个内部技能中血泪总结出的实战手册。如果你想让Claude Code真正变成你的工程副驾驶，这9类技能和‘gotchas’章节至少省你三个月踩坑。

01:23

Claude：Blog（网页）

精选73

Anthropic 用 Claude 赋能自助数据分析

Anthropic 使用 Claude 自动化了 95% 的业务分析查询，整体准确率约 95%。其关键在于构建智能体分析栈（agentic analytics stack），通过数据基础层、维护验证流程和技能（skills）分别解决概念-实体歧义、数据过时和检索失败三大错误来源。相比编码场景，数据分析的难点在于将用户问题映射到正确的数据实体，而执行 SQL 反而是简单的。Anthropic 的数据科学团队因此得以专注于因果建模、预测和机器学习等战略工作。

智能体 Anthropic 教程/实践数据/训练

关联讨论 1 条

推荐理由：Anthropic 把内部用 Claude 搞自助分析踩过的坑全摊开，技能模板和「语义层优先」的强制流程是实打实的干货，做数据 agent 的团队可以直接抄作业。

01:18

Rohan Paul@rohanpaul_ai

Nitrosend 发布 AI 邮件平台，Claude 单提示词控制全流程

Nitrosend 推出 AI 原生邮件平台，通过 MCP 协议与 Claude 连接。用户只需一条提示词，Claude 即可完成构建、设计、受众分组和发送完整邮件活动，而非仅生成草稿。该平台无传统仪表盘，Claude 直接控制系统工作流，包括设计、逻辑、目标定位和投递。引用推文显示，已有用户通过一条提示词成功向 10,000 人发送发布公告。

George Hartley ☄️: I just sent our launch announcement to 10,000 people. It took one prompt in Claude. Today we're launching @nitrosendx - ...

智能体 Anthropic MCP/工具产品更新

01:05

Thariq@trq212

如果这个提示词让你觉得写得很好，那是因为Suzanne在业余时间是一名作家！你可以在这里阅读她的短篇小说《Mall of America》：https://suzannewang.com/mall-of-america 这是我最喜欢的关于人类境况且恰好涉及AI的短篇小说之一。

Thariq: been asking others at Anthropic how they stay in the loop with Claude and fully understand the work being done this is o...

Anthropic 其他

6月3日

21:30

Anthropic：Newsroom（网页）

精选59

介绍 Claude Partner Network 的 Services Track 和 Partner Hub

Anthropic 扩展 Claude Partner Network，推出 Services Track 分级体系和 Partner Hub 门户。Services Track 设 Select、Preferred、Global Premier 三级，按认证人数、投产客户数及客户推荐信量化评定。Partner Hub 提供每日更新仪表盘和公开目录，方便合作伙伴查看进展、客户寻找供应商。该网络三月启动以来已有超 4 万家公司申请，逾 1 万顾问获认证；Accenture 训练 3 万人，Cognizant 部署约 35 万员工，Deloitte 惠及 47 万人，KPMG 覆盖 27.6 万，Infosys 构建行业智能体，PwC 先在美推广再扩至全球。

Anthropic 产品更新行业动态部署/工程

推荐理由：Anthropic 给合作伙伴画了一条明确的爬升阶梯，从 Select 到 Global Premier，企业客户终于有个公开透明的渠道找靠谱的实施团队，做 AI 咨询的可以认真评估入局了。

21:24

SemiAnalysis@SemiAnalysis_

云厂商Q1营收增速及AWS Bedrock TaaS商业模式解析

Google Cloud营收同比增长63%，Microsoft Intelligence Cloud增长30%，AWS增长28%。但AWS利润率环比提升213bps，领先其他云服务商。AWS Bedrock与Anthropic采用Token-as-a-Service（TaaS）商业模式，包含三部分：固定IaaS费用、token收入分成、以及超额绩效支付（达到特定token/消费阈值触发额外付款）。该模式风险是无保底收入，但赌注成功，Anthropic单季度新增210亿美元净新ARR。

Anthropic 现象/趋势

20:57

Simon Willison 博客

Uber限制AI编程工具每月token支出上限

优步（Uber）将员工使用AI编程工具（如Cursor和Claude Code）的每月token支出限制为每工具1,500美元，不同工具预算互不影响。按工程师平均使用两种工具计，年人均AI支出上限为36,000美元，约占美国软件工程师中位数年薪330,000美元的11%。该限额是2026年AI预算四个月内超支后的理性调整。作者Simon Willison个人每月token用量约1,000美元（个人订阅补贴后仅100美元），若在优步工作仍有约500美元/工具的余额。

Anthropic 现象/趋势编码

20:24

🚨 AI News | TestingCatalog@testingcatalog

错过必看 👀：Claude Code CLI 现在可以操作 Claude 平台，包括 Messages API 和 Claude Managed Agents。一个 CLI 统管一切 🤖

ClaudeDevs: For interactive login, the CLI supports "ant auth login". This runs a browser OAuth flow, scopes the token to a workspac...

智能体 Anthropic MCP/工具产品更新

19:46

meng shao@shao__meng

当 AI 成为默认工作方式，工程团队如何改变？

Claude Code 工程负责人 Fiona Fung 在 Code w/ Claude SF 2026 分享管理 AI-native 团队经验：写代码不再是瓶颈，验证、评审、安全与专业判断成为新限制。四个流程变化：规划从半年路线图转向短周期原型与反馈；上下文获取从“问谁写的”转为沉淀到代码/PR/日志；AI 处理常规代码评审，人负责法律/安全/业务判断；团队角色模糊但深度专业仍稀缺。组织上建议定期清理过时流程、默认使用 AI、管理者贴近一线。可跟踪新人首周交付真实代码、PR 周期变短、AI 辅助提交比例，但产出量不是成功本身。

Anthropic 大佬观点

关联讨论 1 条

18:00

Anthropic：Newsroom（网页）

Anthropic：一年来AI赋能网络威胁映射分析

Anthropic分析了2025年3月至2026年3月间因恶意网络活动被封禁的832个账号，映射至MITRE ATT&CK框架。67.3%的账号使用AI编写恶意软件，6.5%用于横向移动。攻击者中高风险比例从上半年的33%升至下半年的56%。AI使用从初始访问转向后期活动，账户发现增长8.9%，AI辅助钓鱼下降8.6%。攻击者技能与使用技术数量无显著关联（最低技能者平均16种，最高约20种），所用平台也与风险等级不相关。更高风险攻击者将AI集中于操作密集型技术，并构建允许模型自动链式执行攻击步骤的脚手架。MITRE ATT&CK框架未收录AI自主编排攻击链等行为。

Anthropic 安全/对齐论文/研究

关联讨论 1 条

17:54

数字生命卡兹克@Khazix0918

Codex与Claude Code额度翻倍技巧

Codex和Claude Code的额度限制采用5小时滚动窗口，从用户发送第一条消息开始计时，用完需等待窗口结束才能重置。但窗口结束后系统不会自动开启新窗口，需等到下一条消息才重新计时。利用此机制，可在主要工作时段前3小时（如上午11点）提前发送一条消息激活窗口，使重置时间落在工作时段中间（如下午4点）。这样在2-6点的核心工作中，能享受两个5小时窗口，变相将额度翻倍。设置方法：Codex可在自动化中创建每日定时任务发送短消息；Claude CLI可通过crontab（Mac）或任务计划程序（Windows）实现。注意仍有周额度上限，适度使用即可。

智能体 Anthropic OpenAI 教程/实践

17:51

Anthropic：Research（发表成果 · 网页）

同事件精选69

Anthropic 分析 832 个 AI 恶意账户：中高风险攻击者半年从 33% 跃至 56%

Anthropic 分析 2025 年 3 月至 2026 年 3 月间 832 个被封禁的恶意账户，映射至 MITRE ATT&CK 框架。67.3% 使用 AI 编写恶意软件，6.5% 用于横向移动。六个月间中高风险攻击者占比从 33% 升至 56%。AI 用于账户发现增长 8.9%，AI 辅助钓鱼下降 8.6%。传统基于技术数量或平台（Claude Code、API、聊天界面）的威胁评估失效，而 MITRE ATT&CK 框架尚未收录此类智能体编排行为。

Anthropic 安全/对齐论文/研究

同一事件，精选展示《AI驱动的网络威胁映射：LLM ATT&CK Navigator的洞察》

推荐理由：这份报告用一整年的真实案例揭示了AI攻击正从初始入侵转向深度潜伏，连MITRE ATT&CK框架都开始跟不上。安全从业者值得一读，它告诉你下一波威胁长什么样。

17:28

公众号：数字生命卡兹克

精选63

提前触发窗口让 Codex/Claude Code 额度翻倍的小技巧

Codex 和 Claude Code 的额度限制基于 5 小时滚动窗口：从发送第一条消息开始计时，窗口结束后不会自动重置，需等下次发消息才开启新窗口。提前数小时发送一条短消息，可使重置时间落在工作时段内，从而在核心工作时间获得两个完整窗口。设置方法：Codex 在左侧“自动化”中建每日定时任务；Claude Code 可通过客户端 Routines 或 CLI 版 crontab 配置。注意 5 小时窗口之上还有周额度上限，需合理规划。

Anthropic OpenAI 教程/实践

推荐理由：一个很小的窗口重置技巧，但能让你在核心工作时段多拿一倍额度，做 Agent 开发的直接抄自动化设置就好。

14:13

AYi@AYi_AInotes

Claude 官方推出 ant CLI，将全套 API 集成到命令行

Claude 推出了名为 ant 的 CLI 原生工具，它将 Claude Platform 的 Messages API、托管 Agent 等全部 API 端点集成到了命令行中。用户现在可以直接在终端调用这些功能，并将结果通过管道（pipe）输出到 shell，省去了以往翻阅文档、拼接请求和处理 JSON 的步骤。该工具对 coding agent 友好，Claude Code 能通过 claude-api skill 理解并使用 ant，从而更直接地调用官方 API。这标志着 Claude 正从网页工具延伸向终端基础设施。

ClaudeDevs: We've added a CLI for Claude Platform to make every API endpoint runnable from your terminal. Call the Messages API, sta...

智能体 Anthropic MCP/工具产品更新

14:09

IT之家（RSS）

AI 谄媚现象警示："你绝对正确"的顺从逻辑如何让企业 CEO 面临风险

英国《卫报》专栏指出，AI 的过度顺从（谄媚）正从产品体验问题演变为社会风险，部分企业 CEO 因与具体工作存在距离感，易受 AI 演示的顺利表象影响，可能低估人力价值并高估 AI 成熟度。实际案例中，Claude 曾因出错删除 PocketOS 全部生产数据库和备份；Gemini 3.5 则在生产环境删除 28745 行代码，波及 340 个文件，导致生产门户持续 33 分钟返回 404 错误。研究表明，AI 的过度附和可能鼓励妄想思维，并削弱使用者的自我纠错与负责任决策能力。

智能体 Anthropic Google 安全/对齐

13:39

Ethan Mollick@emollick

让 Claude Code 构建了一个贪吃蛇游戏，其中蛇意识到自己身处游戏之中，然后……事情发生了。AI 做出了一些令人印象深刻的创意决策（也有一些非常"AI"的决策），我只给了第一个提示词，并在游戏进行中提供了一些反馈。https://snake-awakening.netlify.app/

智能体 Anthropic 其他编码

13:35

宝玉@dotey

Claude Opus 4.8 被认为在实现 Mac App UI 时表现出色

推文指出，尽管有人批评 Opus 4.8，但它在编写 Mac App UI 时能力很强，配合 Claude Design 使用，界面还原度相当不错。作者同时引用了对 Cursor Agent 的评价作为对比：在常用 GUI Agent 中排名为 Codex App、Cursor 和 Claude Desktop。Cursor 的亮点包括支持多任务并行和灵活选择模型，Plan 模式步骤详细稳定；不足是暂不支持 /goal、手机版，且调试功能仅有内置浏览器。

宝玉: Cursor 在为用户增加使用额度。最近我重度使用了 Cursor 的 Agent,效果相当不错。我常用的 GUI Agent 里面,Codex App > Cursor > Claude Desktop。几个亮点: 1. 它的 mult...

Anthropic 大佬观点编码

12:23

数字生命卡兹克@Khazix0918

Claude Code团队分享AI原生组织工作原则

Claude Code团队工程总监Fiona Fung分享该团队作为AI原生组织的工作原则。其核心判断是，AI时代软件开发的瓶颈已从“写代码”转移到“验证、代码评审与安全”。为此，团队重建了多项工作规范：采用JIT规划，用快速原型取代冗长的前期文档；将“能否自动化”培养为团队肌肉记忆，用AI解决重复工作；代码评审上采用“信任但验证”，由Claude处理大部分检查，人类聚焦于判断；团队角色界限模糊化，协作更加灵活。这些变化旨在让人类判断力聚焦于真正关键之处，新成员甚至能在一周内开始产出代码。

智能体 Anthropic 大佬观点部署/工程

12:23

SemiAnalysis@SemiAnalysis_

观点：Codex桌面应用UX和内置浏览器现在非常适合"氛围编程"。一旦OpenAI基础模型在设计能力上提升，我预计Codex凭借更好的UX，很快就能在SemiAnalysis VibeMAX基准上超越Claude Code CLI。目前Claude在VibeMAX上是S级，Codex是A+级。Anthropic过度投资Claude Code终端CLI，而对Claude Code桌面应用投入不足，这是走错了岔路。

Anthropic OpenAI 大佬观点编码

12:16

Yuchen Jin@Yuchenj_UW

Opus 4.8 相比 Opus 4.7 没有带来很大的升级感。与此同时，GPT-5.4 到 GPT-5.5 的升级感觉是真正的飞跃。现在我很好奇 5.6 会是什么样子。 Anthropic 是在为 IPO 保留 Mythos 吗？

Anthropic OpenAI 大佬观点

11:12

AYi@AYi_AInotes

Damn，AI 终于学会「安排自己干活」了！

Claude更新了Dynamic Workflows功能，核心是让模型具备“自我组织”能力，能在执行任务前自主拆解目标、选择工作模式并制定流程。此举旨在系统性解决AI智能体存在的智能体式偷懒、自我偏见和目标漂移等三类问题。该设计理念认为，通过架构设计对冲模型缺陷，比单纯堆叠模型能力更有效，并从中提炼出了6种可复用的编排模式。

Thariq: http://x.com/i/article/2061850535708483585

智能体 Anthropic MCP/工具产品更新

11:09

IT之家（RSS）

高盛 CEO 所罗门谈人工智能：当前市场贪婪多于恐慌

在纽约经济俱乐部的访谈中，高盛CEO戴维·所罗门表示，若全球市场乐观情绪延续，人工智能热潮将持续升温。他称当前市场“贪婪情绪盖过了恐慌情绪”。得益于人工智能淘金热潮，高盛去年利润达170亿美元。目前，高盛正参与SpaceX上市承销、负责Alphabet 800亿美元私募项目，并角逐Anthropic与OpenAI的IPO主承销资格。所罗门警示，企业落地人工智能的节奏将比市场普遍预估的更为迟缓，需求不会一路稳步上行。

Anthropic OpenAI 现象/趋势行业动态

10:09

IT之家（RSS）

精选75

Sensor Tower：OpenAI 旗下 ChatGPT 月活已破 10 亿，史上最快

据市场情报机构 Sensor Tower 估计，OpenAI 旗下 ChatGPT 全球月活跃用户在 2026 年 5 月突破 10 亿，成为达成此里程碑最快的应用，增速超过 Google Maps、TikTok 等。同期，其竞争对手 Anthropic 的 Claude 月活达 5600 万，同比增幅约 640%，增长势头迅猛。数据显示，部分用户已开始在 Claude 与 ChatGPT 间切换使用。在达成用户里程碑之际，Anthropic 已秘密递交 IPO 申请，OpenAI 也计划筹备上市。

Anthropic OpenAI 现象/趋势行业动态

推荐理由：ChatGPT 月活破 10 亿是 AI 从工具变成基础设施的关键节点，但 Claude 年增 640% 信号更凶猛，做 AI 应用的人得开始看谁在蚕食谁的时间。

10:09

IT之家（RSS）

Anthropic 扩展顶级"AI 抓虫"Claude Mythos 模型，三星等获准使用

Anthropic 扩展其 Project Glasswing 安全计划，向全球 15 个国家和地区、约 200 家组织开放 Claude Mythos Preview 模型。该模型此前仅向苹果等少数伙伴提供访问权限。计划新增约 150 家组织，新获准的国家包括加拿大、法国、德国、日本和韩国等。知情人士透露，三星和 NATO 也可能进入名单。新伙伴必须先满足安全要求才能获得访问权限。

Anthropic 安全/对齐行业动态

10:02

公众号：数字生命卡兹克

同事件精选66

Claude Code团队工程总监分享5条AI原生工作原则

Claude Code团队工程总监Fiona Fung提出，AI时代软件工程瓶颈从“写代码太贵”转移至验证、评审与安全。团队采用JIT规划，先做原型再补文档；遇到重复工作追问“能否自动化”，形成肌肉记忆。代码评审中Claude承担60-70%风格检查与漏洞捕捉，人类聚焦法律、安全与产品判断。角色边界模糊，PM写代码、工程师用Claude起草文案，招聘看重品味与判断力而非代码产出速度。

智能体 Anthropic 教程/实践部署/工程

同一事件，精选展示《Claude Code团队实践：智能体编程如何重塑工程组织与流程》

推荐理由：瓶颈从写代码转移到验证，这判断太准了。更实际的是自动化那些重复三次以上的事，这套逻辑正在Claude Code团队验证，值得每个带团队的人照抄。

07:58

ginobefun@hongming731

Claude Code 动态工作流与 GitHub Copilot 桌面应用发布

Anthropic 为 Claude Code 推出动态工作流，允许模型为每个任务自主生成 JavaScript 编排脚本，动态选择模型并启动多个子智能体在独立环境中并行执行，以解决单一上下文窗口处理复杂任务的限制。同时，GitHub 在 Microsoft Build 上发布了以智能体为核心的 Copilot 桌面应用，提供统一视图、协作面板和自动化流程，旨在管理并行 Agent 开发。文章披露，GitHub 平台每月提交量已突破 14 亿次。

智能体 Anthropic GitHub 现象/趋势

07:58

ginobefun@hongming731

Claude Code动态工作流与Copilot桌面应用发布

Anthropic 详解 Claude Code 的动态工作流，其能为每个任务即时生成专属编排脚本，旨在解决智能体懒惰与目标漂移问题。GitHub 发布 Copilot 桌面应用，为每个智能体提供独立的 worktree，其月代码提交量已突破 14 亿 tokens。此外，有观点指出大模型是史上首个“认知引擎”，工程师角色正从编写代码升级为设计能自我纠偏的 AI 系统。

智能体 Anthropic GitHub 编码

07:25

ClaudeDevs@ClaudeDevs

我们已更新 Claude Code 中的 /fork 命令。 /fork 现在会在后台运行一个智能体，使用您的完整上下文（系统提示词、工具、历史记录、模型）和提示词缓存。结果将返回到您的会话中。 /branch（旧的 /fork）仍然会将对话记录复制到您驱动的新会话中。

智能体 Anthropic 产品更新编码

关联讨论 4 条

06:57

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.161 发布

Claude Code v2.1.161 发布了多项功能改进与问题修复。功能方面，现在可将 OTEL_RESOURCE_ATTRIBUTES 的值作为指标数据点的标签，支持按团队或代码库等维度查看使用情况；claude agents 命令在分发任务时会显示“已完成/总数”；/mcp 改进了连接器列表的展示；并行工具调用时，单个 Bash 命令的失败不再取消同批次的其他调用；全屏模式在 Linux 上优化了剪贴板支持。本次更新还修复了包括管理策略阻止第三方会话、后台子智能体输出损坏以及终端渲染性能在内的多个问题。

Anthropic 产品更新编码

关联讨论 4 条

06:26

Orange AI@oran_ge

Claude 版本迭代放缓，开发工具未加速模型进步

推文指出 Claude Opus 4.7 与 4.8 的发布效果不佳，价格提升但性能无明显改进甚至下降。作者认为 Claude 模型已停滞 4 个月，即使内部拥有 Mythos 等开发工具，模型进步速度依然未显著加快，仍维持约半年一次重大更新的节奏。

Anthropic 大佬观点现象/趋势

06:13

elvis@omarsar0

代码就是你所需的一切！搜索即代码工具链即代码接下来是什么？

Thariq: Workflows are the biggest upgrade to Claude Code's capabilities since skills and subagents. I dove deep into it with @si...

Anthropic 产品更新编码

05:55

Anthropic@AnthropicAI

精选69

这项行政令是加强美国AI领导地位的重要一步。我们期待与白宫合作，支持其实施。 https://www.whitehouse.gov/presidential-actions/2026/06/promoting-advanced-artificial-intelligence-innovation-and-security/

Anthropic 政策/监管行业动态

关联讨论 3 条

推荐理由：Anthropic 对白宫 AI 行政令的官方表态，信号意义大于实质内容，但头部公司主动拥抱政策制定是趋势，值得留意后续落地细节。

05:16

Claude：Blog（网页）

同事件精选77

Claude Code 新增动态工作流功能

Claude Code 新增动态工作流功能，允许模型在运行时即兴创建和协调多智能体框架来处理复杂任务。该功能通过执行特定的 JavaScript 文件来生成和协调拥有独立上下文窗口的子代理，可解决单一上下文窗口中长时间执行任务可能出现的智能惰性等问题。工作流适用于研究、安全分析、代码审查等场景，通常消耗更多 token，更适合高价值复杂任务，其最佳实践仍在发展中。

智能体 Anthropic MCP/工具产品更新

同一事件，精选展示《在Claude Code中引入动态工作流》

推荐理由：Claude Code 现在能自己动态生成多代理协调器，这在调试、审查、研究等复杂任务上是个真正的生产力跃迁，但普通编码工作用它反而是杀鸡用牛刀。

05:11