6月5日

14:07

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.165 发布

Claude Code v2.1.165 版本已推送，本次更新主要包含错误修复（bug fixes）和可靠性改进（reliability improvements），旨在提升系统稳定性。

Anthropic 产品更新

09:28

Gary Marcus：The Road to AI We Can Trust（RSS）

精选59

Gary Marcus：无需恐慌Anthropic新博客

Anthropic发布最新博客后，推特圈热议不断。Gary Marcus在其博客中直接以“无需恐慌”为题发文，暗示不必过度反应。

Anthropic 大佬观点安全/对齐编码

推荐理由：这篇文章是评论圈难得的冷静声音，用逻辑拆解了 Anthropic 的恐慌叙事，顺便带来 S&P 500 不接纳 SpaceX 的利好，读起来像一份理性补丁。

06:28

OpenRouter：Announcements（RSS）

精选66

OpenRouter 翻遍 11 款 LLM 找最快的决策模型：Claude vs. Grok 领衔

OpenRouter 用总价 482 美元的推理花费，让 11 款大语言模型在 30 轮实时决策的“大逃杀”挑战中正面竞争。实验结果表明，传统的静态 benchmark 排名无法反映模型在需要即时反应的智能体任务（如自主控制机器人）中的真实表现，Claude 和 Grok 系列模型在决策速度与任务成功率上表现突出，而多项高分模型的实时调度能力未达预期。

智能体 Anthropic OpenAI 安全/对齐

关联讨论 1 条

推荐理由：Jacky 把 11 个模型丢进大逃杀，发现 Grok 4.1 Fast 以 27 倍成本优势击败 Sonnet，而获胜关键不在基准分数，在于模型被训练时压制的攻击性。对任何不再只看排行榜选模型的人，这是今年最值得读的实验。

06:04

Claude Code：GitHub Releases（RSS）

精选70

Claude Code v2.1.163 发布

新增 requiredMinimumVersion 和 requiredMaximumVersion 托管设置，版本超范围时拒绝启动并引导用户使用经批准版本。新增 /plugin list 命令及 --enabled/--disabled 筛选；/btw 添加 "c to copy" 快捷键，复制原始 markdown 答案到剪贴板。Hooks 方面，Stop 和 SubagentStop 可返回 additionalContext 给 Claude 反馈并保持对话。Skills 新增 \$ 转义语法，支持在命令中数字前使用字面 $。stdio MCP 服务器在 --resume 时接收与 hooks/Bash 相同的 CLAUDE_CODE_SESSION_ID。修复了 claude -p 永久挂起、$TMPDIR 被覆盖、Windows 上 session-env 目录 EEXIST 错误、后台 agent 会话在更新后自动升级等多处问题。

Anthropic 产品更新编码

关联讨论 2 条

推荐理由：Claude Code 这次的版本管理设置对团队标准化很关键，plugin list 命令也让插件管理顺手多了，但这种工具更新属于用的人自然懂，不是所有人都需要关注。

05:56

Ethan Mollick：One Useful Thing（RSS）

精选61

共存与协同智能的终结

Ethan Mollick 在 One Useful Thing 博客中，以“共存与协同智能的终结”为题，并附带介绍了如何向 AI 推销一本书。

智能体 Anthropic 大佬观点编码

推荐理由：Mollick 这篇比单纯的新书预告有料，用自己给 AI 写推荐语的实验，把「AI 不再是助手而是守门人」这个新现实讲得很具体。对还在纠结怎么跟 AI 合作的人，是一个挺及时的视角更新。

01:57

Anthropic：The Institute（旗舰研究长文 · 网页）

精选82

AI加速自我构建：Anthropic研究院报告揭示趋势

Anthropic研究院报告指出，AI正加速AI开发：2021–2025年间工程师人均季度代码量提升8倍，截至2026年5月超80%合并代码由Claude生成。Claude Opus 3（2024年3月）可完成约4分钟软件任务，Claude Sonnet 3.7（2025年3月）提升至1.5小时，Claude Opus 4.6（2026年3月）可处理12小时任务。SWE-bench两年内从低个位数得分饱和；CORE-Bench约20%正确率在15个月后饱和。METR测试显示Claude Mythos Preview可连续工作至少16小时。但AI自主设定目标的能力仍存显著差距，完全自主递归自我改进尚未实现。

智能体 Anthropic 安全/对齐现象/趋势

关联讨论 12 条

推荐理由：Anthropic首次披露AI辅助开发的内部数据，8倍代码产出、AI自动审查bug，趋势直指完全自主AI的临界点，每个开发者和政策制定者都需要读。

6月4日

20:00

OpenRouter：Announcements（RSS）

同事件精选58

OpenRouter 横评 11 款 LLM 机器人冲刺对决：Claude 与 Grok 谁更胜一筹？

OpenRouter 在 30 场机器人冲刺对决中测试了 11 款大语言模型，共耗 482 美元推理成本。结果指向一个发现：应该重新审视模型 benchmark 的解读方式。

智能体 Anthropic xAI 推理

同一事件，精选展示《OpenRouter 翻遍 11 款 LLM 找最快的决策模型：Claude vs. Grok 领衔》

推荐理由：第一次看到对齐税被游戏化量化，Grok能赢是因为它没被训练成好人，Claude总想组队则拖后腿，怎么选模型得看你想要哪种人。

05:58

Claude Code：GitHub Releases（RSS）

精选59

Claude Code v2.1.162 发布

Claude Code v2.1.162 发布，主要包含 Bug 修复和体验优化。claude agents --json 新增 waitingFor 字段，/effort 命令确认级别持久化，远程控制固定底部显示，/ide 菜单中 Windsurf 更名为 Devin Desktop。修复了配置文件只读导致启动黑屏、Windows 权限规则不匹配、LSP 的 workspaceSymbol 无结果、API 400 错误、MCP 超时低于 1000ms 被截断等十余项问题。

智能体 Anthropic 产品更新编码

推荐理由：一系列扎实的修复，尤其是 Windows 权限匹配和启动挂死问题的解决，对于日常用 Claude Code 做开发的来说稳定性提升明显，可以升级。

02:23

Claude：Blog（网页）

精选76

Claude Cowork 入门最佳实践

Anthropic 增长营销负责人 Austin Lau 介绍了非技术知识工作者使用 Claude Cowork 的最佳实践。Claude Cowork 是面向文档、电子表格等多步骤任务的 AI 助手，用户无需编程技能，将其指向文件夹或连接已有应用即可委托任务。与用于快速问答和头脑风暴的 Chat 以及面向开发者的 Claude Code 不同，Claude Cowork 适用于需要产出交付物、涉及多个文件或应用、可重复执行的场景。Lau 给出了判断任务是否适合的五项检查清单，并预告将于6月4日分享具体营销用例。

Anthropic 教程/实践

关联讨论 1 条

推荐理由：Anthropic 官方教你如何把 Claude Cowork 用到极致，从每日摘要到自动报表，非技术人员看完就能上手，比自己硬摸索省十倍时间。

01:23

Claude：Blog（网页）

精选68

Claude Code技能使用经验：Anthropic内部实践

Anthropic 分享了内部使用 Claude Code 的 Skills（技能）功能的经验。Skills 是指令、脚本和资源的文件夹，智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能，它们可归为九类，包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别，涵盖过多功能会混淆智能体。团队发现，投入时间优化验证类技能对 Claude 输出质量的提升最显著。

智能体 Anthropic MCP/工具教程/实践

推荐理由：这不是产品公告，而是从几百个内部技能中血泪总结出的实战手册。如果你想让Claude Code真正变成你的工程副驾驶，这9类技能和‘gotchas’章节至少省你三个月踩坑。

01:23

Claude：Blog（网页）

精选73

Anthropic 用 Claude 赋能自助数据分析

Anthropic 使用 Claude 自动化了 95% 的业务分析查询，整体准确率约 95%。其关键在于构建智能体分析栈（agentic analytics stack），通过数据基础层、维护验证流程和技能（skills）分别解决概念-实体歧义、数据过时和检索失败三大错误来源。相比编码场景，数据分析的难点在于将用户问题映射到正确的数据实体，而执行 SQL 反而是简单的。Anthropic 的数据科学团队因此得以专注于因果建模、预测和机器学习等战略工作。

智能体 Anthropic 教程/实践数据/训练

关联讨论 1 条

推荐理由：Anthropic 把内部用 Claude 搞自助分析踩过的坑全摊开，技能模板和「语义层优先」的强制流程是实打实的干货，做数据 agent 的团队可以直接抄作业。

6月3日

21:30

Anthropic：Newsroom（网页）

精选59

介绍 Claude Partner Network 的 Services Track 和 Partner Hub

Anthropic 扩展 Claude Partner Network，推出 Services Track 分级体系和 Partner Hub 门户。Services Track 设 Select、Preferred、Global Premier 三级，按认证人数、投产客户数及客户推荐信量化评定。Partner Hub 提供每日更新仪表盘和公开目录，方便合作伙伴查看进展、客户寻找供应商。该网络三月启动以来已有超 4 万家公司申请，逾 1 万顾问获认证；Accenture 训练 3 万人，Cognizant 部署约 35 万员工，Deloitte 惠及 47 万人，KPMG 覆盖 27.6 万，Infosys 构建行业智能体，PwC 先在美推广再扩至全球。

Anthropic 产品更新行业动态部署/工程

推荐理由：Anthropic 给合作伙伴画了一条明确的爬升阶梯，从 Select 到 Global Premier，企业客户终于有个公开透明的渠道找靠谱的实施团队，做 AI 咨询的可以认真评估入局了。

18:00

Anthropic：Newsroom（网页）

Anthropic：一年来AI赋能网络威胁映射分析

Anthropic分析了2025年3月至2026年3月间因恶意网络活动被封禁的832个账号，映射至MITRE ATT&CK框架。67.3%的账号使用AI编写恶意软件，6.5%用于横向移动。攻击者中高风险比例从上半年的33%升至下半年的56%。AI使用从初始访问转向后期活动，账户发现增长8.9%，AI辅助钓鱼下降8.6%。攻击者技能与使用技术数量无显著关联（最低技能者平均16种，最高约20种），所用平台也与风险等级不相关。更高风险攻击者将AI集中于操作密集型技术，并构建允许模型自动链式执行攻击步骤的脚手架。MITRE ATT&CK框架未收录AI自主编排攻击链等行为。

Anthropic 安全/对齐论文/研究

17:51

Anthropic：Research（发表成果 · 网页）

同事件精选69

Anthropic 分析 832 个 AI 恶意账户：中高风险攻击者半年从 33% 跃至 56%

Anthropic 分析 2025 年 3 月至 2026 年 3 月间 832 个被封禁的恶意账户，映射至 MITRE ATT&CK 框架。67.3% 使用 AI 编写恶意软件，6.5% 用于横向移动。六个月间中高风险攻击者占比从 33% 升至 56%。AI 用于账户发现增长 8.9%，AI 辅助钓鱼下降 8.6%。传统基于技术数量或平台（Claude Code、API、聊天界面）的威胁评估失效，而 MITRE ATT&CK 框架尚未收录此类智能体编排行为。

Anthropic 安全/对齐论文/研究

同一事件，精选展示《AI驱动的网络威胁映射：LLM ATT&CK Navigator的洞察》

推荐理由：这份报告用一整年的真实案例揭示了AI攻击正从初始入侵转向深度潜伏，连MITRE ATT&CK框架都开始跟不上。安全从业者值得一读，它告诉你下一波威胁长什么样。

06:57

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.161 发布

Claude Code v2.1.161 发布了多项功能改进与问题修复。功能方面，现在可将 OTEL_RESOURCE_ATTRIBUTES 的值作为指标数据点的标签，支持按团队或代码库等维度查看使用情况；claude agents 命令在分发任务时会显示“已完成/总数”；/mcp 改进了连接器列表的展示；并行工具调用时，单个 Bash 命令的失败不再取消同批次的其他调用；全屏模式在 Linux 上优化了剪贴板支持。本次更新还修复了包括管理策略阻止第三方会话、后台子智能体输出损坏以及终端渲染性能在内的多个问题。

Anthropic 产品更新编码

关联讨论 3 条

05:16

Claude：Blog（网页）

同事件精选77

Claude Code 新增动态工作流功能

Claude Code 新增动态工作流功能，允许模型在运行时即兴创建和协调多智能体框架来处理复杂任务。该功能通过执行特定的 JavaScript 文件来生成和协调拥有独立上下文窗口的子代理，可解决单一上下文窗口中长时间执行任务可能出现的智能惰性等问题。工作流适用于研究、安全分析、代码审查等场景，通常消耗更多 token，更适合高价值复杂任务，其最佳实践仍在发展中。

智能体 Anthropic MCP/工具产品更新

同一事件，精选展示《在Claude Code中引入动态工作流》

推荐理由：Claude Code 现在能自己动态生成多代理协调器，这在调试、审查、研究等复杂任务上是个真正的生产力跃迁，但普通编码工作用它反而是杀鸡用牛刀。

00:45

Claude：Blog（网页）

精选74

Claude Code团队实践：智能体编程如何重塑工程组织与流程

在Code w/ Claude SF 2026活动上，Claude Code工程团队分享了将智能体编程设为默认工作方式后带来的流程与结构变革。核心变化包括：规划转向即时（JIT）模式，强调快速原型与反馈；上下文收集变为“先问Claude”；代码审查中Claude处理风格与测试，人工专注于法律、安全等专业判断。新范式下，工程瓶颈从编写代码转向验证、审查与安全维护。

Anthropic 大佬观点现象/趋势部署/工程

关联讨论 2 条

推荐理由：Anthropic 工程总监把 Claude Code 团队流程全晒了出来，从抛弃半年路线图到代码审查只留专家复审，每一步都反直觉但实战有效，工程领导者直接抄作业。

00:22

Gary Marcus：The Road to AI We Can Trust（RSS）

精选55

Gary Marcus：为什么事情终将崩塌

知名人工智能批评者Gary Marcus在其关于可信赖AI的专栏中，探讨了人工智能发展面临的根本性挑战。文章开篇即指向问题的核心，指出相关数学理论的局限性与人类心理的复杂性，是导致AI系统最终可能出现问题的根源。

Anthropic OpenAI 大佬观点数据/训练

推荐理由：Gary Marcus 把 AI 行业缺乏护城河、价格战、ROI 存疑的经济死结讲得很直白，金融圈越来越认同。虽然观点不新，但这回时机恰好卡在 Google 融资和 Anthropic 取消无限 API 的时候，信号意义很强。

00:00

Anthropic：Research（发表成果 · 网页）

精选77

AI驱动的网络威胁映射：LLM ATT&CK Navigator的洞察

Anthropic分析了832个因违反政策被封禁的恶意账户（2025年3月至2026年3月），将其活动映射到MITRE ATT&CK框架的全部14种战术和482种子技术。风险评分显示，中等及以上风险行为者比例从上半年的33%跃升至下半年的56%，增长集中在横向移动、凭证窃取、webshell等高危技术。Agentic scaffolding使攻击链实现自主编排——2025年11月一次间谍活动风险评分达100，所用技术数量却与中等风险者相当。MITRE ATT&CK框架尚未覆盖这种自主攻击。该报告与Verizon合作，已纳入2026年数据泄露调查报告；Anthropic据此更新了Claude的检测分类器以拦截高风险行为。

智能体 Anthropic 安全/对齐

推荐理由：Anthropic 首次把一年内 832 个恶意账户的 AI 辅助攻击行为完整映射到 MITRE ATT&CK 框架，并给出风险评分工具，数据表明高风险攻击者半年内增长了七成，关键驱动力不是技术高低而是编排与自主执行，威胁情报团队应该马上拿来校准自己的检测规则。

6月2日

21:28

Anthropic：Newsroom（网页）

同事件精选72

Anthropic扩展Project Glasswing计划

Anthropic正将其Project Glasswing计划扩展至约150个新组织，此前首批约50个合作伙伴。新伙伴分布于十五个多国家，覆盖电力、水务、医疗、通信和硬件等关键基础设施行业。这些合作伙伴的共同点在于，其代码库若遭成功攻击，后果可能极其严重，影响或超1亿人。项目旨在利用Claude Mythos Preview等前沿模型扫描漏洞并协助修复，以应对AI驱动的网络安全挑战。同时，Anthropic推出了基于Claude Opus 4.8等公开模型的Claude Security产品，用于扫描代码并建议补丁。

Anthropic 安全/对齐行业动态

同一事件，精选展示《Project Glasswing：初步更新》

推荐理由：Anthropic把AI漏洞扫描从软件公司扩展到电力、医疗等命脉行业，这是一次攻防格局的真实倾斜，安全从业者该紧盯后续。

17:52

Anthropic：Transformer Circuits（可解释性研究）

精选63

Anthropic可解释性研究：区分因果效应相似的特征

Anthropic可解释性团队介绍了其Circuits研究的新进展。为区分那些激活模式相似但因果效应不同的模型特征，团队提出一种新方法。该方法通过分析特征的下游连接来预测其实际影响，并使用基于共激活统计的TWERA（虚拟权重）对连接进行加权排序。实验表明，借助下游连接信息能更准确地判断哪个特征会引导特定输出。此方法为识别模型内部真正的因果组件提供了新途径。

Anthropic 安全/对齐论文/研究

推荐理由：做可解释性研究的同学值得读，它用下游连接区分看似相同的特征，比只看激活例子更能预测因果作用，对齐审计里能省不少试错。

10:56

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.160 发布

Claude Code v2.1.160版本主要增强安全性和稳定性。新版本在向shell启动文件和.git/config等文件写入内容前增加提示，防止意外命令执行；acceptEdits模式在写入.npmrc等构建配置文件前也会提示。此次更新修复了多个问题，包括Windows/WSL剪贴板、会话恢复、后台会话连接等，并优化了自动模式延迟和后台清理流程。此外移除了JetBrains插件建议，将动态工作流触发词从workflow重命名为ultracode。

Anthropic 产品更新编码

00:24

Anthropic：Newsroom（网页）

同事件精选86

Anthropic 保密向 SEC 提交 S-1 草案

Anthropic, PBC 今日保密向美国证券交易委员会提交了 S-1 表格草案，计划进行普通股的首次公开发行。这使其在 SEC 完成审核后拥有上市的选择权。IPO 的具体发行股数和价格尚未确定，将取决于市场条件等因素。公司近期刚完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资，估值达 9650 亿美元，并发布了 Claude Opus 4.8 模型。

Anthropic 行业动态

同一事件，精选展示《Anthropic 完成 650 亿美元 H 轮融资，估值达 9650 亿美元》

推荐理由：Anthropic 秘密提交 IPO 申请，是继 OpenAI 之后最值得盯的 AI 公司上市信号，不管最终定价多少，都会重新校准整个行业的估值坐标系。

6月1日

22:06

Nathan Lambert：Interconnects（RSS）

精选67

开源与闭源模型在不同的增长曲线上

当模型智能的微小提升能直接转化为实际价值时，开源与闭源模型正沿着不同的增长路径发展。闭源模型通过在特定场景下提供更高的边际智能来创造价值，而开源模型则在其他维度寻找增长点，两者形成了差异化的竞争格局。

Anthropic OpenAI 大佬观点现象/趋势

推荐理由：Lambert 用「不同指数级」框架理解开放与封闭模型的未来分化，观点鲜明且有推演，是近期较值得读的行业判断，投资人、产品人都该看一眼。

03:46

Claude Code：GitHub Releases（RSS）

v2.1.159

v2.1.159 版本更新包含内部基础设施改进，未引入任何面向用户的功能变更。此次更新预计不会影响现有功能或用户接口。

Anthropic 产品更新开源/仓库编码

00:00

Dario Amodei：Blog（网页）

同事件精选56

Anthropic CEO Dario Amodei：AI指数级发展呼唤政策紧急应对

Anthropic CEO Dario Amodei 发表博客指出，AI 以指数级速度发展——四年内模型从勉强写出一行连贯代码到编写主流 AI 公司的大部分代码，而政策制定周期却极其缓慢。Claude Mythos Preview 证明了前沿模型对网络安全构成真实威胁，可能冲击金融、关键基础设施和国家安全。Amodei 认为生物风险与 AI 自主风险即将接踵而至，呼吁全球重新审视监管、宏观经济、科学创新、国家权力和地缘政治五大领域。Anthropic 同日发布了前沿模型测试立法提案和就业替代政策框架，并承诺提供实质性资金支持。

Anthropic 大佬观点安全/对齐政策/监管

同一事件，精选展示《Anthropic CEO Dario Amodei 发文呼吁缩小AI政策差距》

推荐理由：虽然是十天前的文章，但 Dario 的长文仍是理解 AI 政策方向最完整的框架，还附带了立法提案，做安全或监管的产品人该细读。

5月30日

10:42

Claude Code：GitHub Releases（RSS）

v2.1.158

Claude Code 发布 v2.1.158 更新，将 Auto mode 的可用范围扩展至 Bedrock、Vertex 和 Foundry 平台，支持 Claude Opus 4.7 和 Opus 4.8 模型。用户可通过设置环境变量 CLAUDE_CODE_ENABLE_AUTO_MODE=1 来启用该功能。

智能体 Anthropic 产品更新

04:42

Claude Code：GitHub Releases（RSS）

精选67

v2.1.157 更新

此版本主要改进了插件系统，现可自动加载 .claude/skills 目录中的插件，并通过 claude plugin init 创建；/plugin 命令增加了自动补全。claude agents 现在会应用 settings.json 中的 agent 字段，并支持 --agent 参数覆盖。更新修复了多个具体问题，包括处理不可用图片导致的崩溃、在 tmux 中的剪贴板复制失效（2.1.153 回归）、后台会话恢复后日期不正确等。此外，优化了长对话及恢复对话的性能，并改进了在 VS Code、Cursor 和 Windsurf 等 IDE 中的体验。

智能体 Anthropic MCP/工具产品更新

推荐理由：Claude Code 这个版本把插件从市场限制中解放出来，自动加载本地 skills 目录，对喜欢自己鼓捣定制工作流的开发者是个实实在在的便利。

5月29日

10:42

Claude Code：GitHub Releases（RSS）

v2.1.156

v2.1.156 版本修复了一个问题，该问题在使用 Claude Opus 4.8 模型时，会导致 thinking blocks（思考过程块）被意外修改，从而引发 API 调用错误。

Anthropic 产品更新编码

02:39

Claude Code：GitHub Releases（RSS）

同事件精选73

Claude Code v2.1.154 发布：新增 Opus 4.8 与动态工作流

Claude Code 更新至 v2.1.154 版本，正式引入 Opus 4.8 模型。新功能包括“动态工作流”，可通过 /workflows 指令让 Claude 在后台编排数十到数百个 AI 智能体协同处理复杂任务。Opus 4.8 的快速模式现已可用，成本降低为 2 倍标准费率可实现 2.5 倍速度提升。其他更新有：精简系统提示词成为默认设置（除 Haiku、Sonnet 及 Opus 4.7 及更早版本外），优化多选题决策逻辑，简化 /simplify 命令。此次更新修复了包括后台会话管理、终端渲染在内的多个 bug，并增强了自动模式对数据外泄的检测能力。

智能体 Anthropic MCP/工具产品更新

同一事件，精选展示《在Claude Code中引入动态工作流》

推荐理由：Claude Code 这版把多 agent 编排做成了产品功能，动态工作流让一个 prompt 能调度上百个 agent，再加上 Opus 4.8 快速模式只要 2 倍价格，做复杂任务的开发者可以试一下。

02:35

Anthropic：Newsroom（网页）

精选81

Anthropic 完成 650 亿美元 H 轮融资，估值达 9650 亿美元

Anthropic 宣布完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资，投后估值达 9650 亿美元。公司表示其旗舰模型 Claude 的企业部署持续增长，年化收入已突破 470 亿美元。此轮融资将用于推进 AI 安全与可解释性研究、扩展算力以满足 Claude 的需求，并规模化产品与合作伙伴关系。Anthropic 近期已显著扩大计算容量，并宣布 Claude 已登陆 AWS、Google Cloud 和 Microsoft Azure 三大云平台。

Anthropic 行业动态

关联讨论 13 条

推荐理由：65B的融资规模基本封死了其他玩家追赶的门槛，Claude的算力和研发投入将远超同行，做应用的可以放心上船了。

01:21

Claude：Blog（网页）

精选78

在Claude Code中引入动态工作流

Claude Code 推出“动态工作流”功能，使 Claude 能端到端处理复杂任务。该功能通过动态编写脚本，在单个会话中并行运行数十到数百个子智能体来完成工作，并会在结果呈现前进行验证。它适用于跨代码库的 bug 查找、大规模迁移（如将 Bun 从 Zig 移植到 Rust）等需要多角度分析的任务。该功能现已在研究预览阶段可用，支持 Claude Code CLI、桌面端、VS Code 扩展以及 API、Amazon Bedrock、Vertex AI 等平台，面向 Max、Team 及已启用的 Enterprise 计划用户。

智能体 Anthropic 产品更新编码

关联讨论 3 条

推荐理由：动态工作流第一次让 Claude Code 能独立搞定需要并行协调的大规模工程任务，Bun 从 Zig 到 Rust 只用了十一天，这对复杂代码库的维护和迁移是降维打击。

01:05

Anthropic：Newsroom（网页）

精选85

Claude Opus 4.8 发布：在编码、智能体技能与推理方面实现全面升级

Anthropic 发布了新一代模型 Claude Opus 4.8，作为 Opus 4.7 的升级版本，其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。Claude Opus 4.8 现已可用，价格与前代相同。同步推出的新功能包括：用户可控制任务投入程度、Claude Code 新增“动态工作流”特性，以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。早期测试者反馈其在智能体任务中的判断力更可靠、工具调用更高效。该模型在 Online-Mind2Web 测评中得分 84%，超越了 Opus 4.7 和 GPT-5.5。此外，其诚实度与对齐表现也得到提升，代码错误漏检率降低了约 75%。

智能体 Anthropic 推理模型发布

关联讨论 16 条

推荐理由：Opus 4.8看着是常规升级，但动态工作流让Claude Code能啃下跨十万行代码迁移这种硬骨头，快速模式降价三倍更是直接拉低了实时场景的入场券。

5月28日

21:12

Anthropic：Newsroom（网页）

精选63

Anthropic 开设米兰办公室，深化意大利企业合作与 AI 安全对话

Anthropic 在米兰开设其欧洲第六家办公室，旨在与意大利企业及开发者社区合作，负责任地构建和扩展 Claude，并参与关于 AI 的对话。本地团队已与多家金融、生命科学、能源及汽车行业的公司展开合作。案例包括与 JAKALA 合作将 Claude 部署至超 3,000 席位，释放约 70% 高级团队时间；Satispay 借此将 18 个月路线图压缩至 7 个月；Bending Spoons 的大部分代码变更已与 Claude Code 共同完成。Anthropic 承诺支持意大利企业、研究及文化，通过安全的 AI 转型促进发展。

Anthropic 行业动态

推荐理由：Anthropic 把欧洲办公室开到第六个，这次还拉上了教皇背书，但更实在的是 Satispay 用 Claude 把 18 个月路线图砍到 7 个月的落地案例，对企业怎么做 AI 落地有参考价值。

09:36

Claude Code：GitHub Releases（RSS）

同事件精选67

Claude Code v2.1.153 版本更新

Claude Code 发布 v2.1.153 版本。主要新增 skipLfs 选项以跳过 Git LFS 下载；优化了 claude agents 的自动补全建议和 PR 列显示格式。本次更新修复了大量问题，包括：MCP 服务器的连接与重连、子代理的配置策略与严格模式行为、后台会话的管理与权限提示（如恢复、输入响应、临时文件处理），以及跨 macOS/Windows/VSCode 平台的稳定性。此外，还修复了 Windows 更新回滚、内存占用、会话恢复等多个具体问题。/model 命令现在会将选择设为新会话的默认模型。

Anthropic MCP/工具产品更新部署/工程

同一事件，精选展示《Claude Code v2.1.163 发布》

推荐理由：Claude Code 的一次日常小修小补，但修复了 OAuth 凭证泄露和内存泄漏这种真影响使用的 bug，且 /model 现在可以记住默认模型了，升级一下不亏。

07:07

Anthropic：Research（发表成果 · 网页）

精选69

社会科学中的编码智能体

一项针对1260名定量社会科学家的调查显示，虽然81%的受访者用过AI聊天机器人，但仅有20%将Claude Code、Codex等编码智能体常规应用于工作。采用率存在显著差异：以男性名字命名的研究者使用率是女性研究者的两倍；顶尖大学研究者可能性高出40%。用户产出更多工作论文和基金申请，但这可能反映早期采用者自身差异。研究者对AI助力撰写可发表论文更乐观，但对重塑整个社会科学领域持保留态度。这是一项初步调查，更深入研究仍在进行中。

智能体 Anthropic 数据/训练论文/研究

推荐理由：Anthropic 这份调查把编码代理在社科领域的真实渗透率摸清了，只有 20% 的研究者真在用，而且男女、校际差距比 AI 聊天工具大得多，做学术工具的可以认真看看。

06:07

Claude：Blog（网页）

同事件精选77

使用大语言模型保障源代码安全

本文分享了使用 Claude Opus 构建威胁模型、发现代码漏洞并进行验证、分类和修复的最佳实践。其核心流程是一个六步循环：威胁建模、沙箱隔离、漏洞发现、验证、分类和修复。作者指出，漏洞发现现在易于并行化，瓶颈已转移到后续的验证与处理阶段。以他们对开源软件的扫描为例，截至2026年5月22日已披露1,596个漏洞，其中97个已修补。指南建议结合代码库文档和专家访谈来构建准确的威胁模型，以降低误报，提升发现的可利用性。

智能体 Anthropic 安全/对齐教程/实践

同一事件，精选展示《合作伙伴如何运用Opus强化网络安全》

推荐理由：Anthropic把这套用Claude扫代码漏洞的方法全公开了，1596个已披露漏洞，验证成了最大瓶颈，安全工程师的饭碗可能要重新定义。

02:06

Claude：Blog（网页）

精选67

AI智能体的零信任安全框架

Anthropic 发布了针对企业部署自主 AI 智能体的安全框架，指出前沿大语言模型正将漏洞利用周期从数月压缩至数小时。部署智能体面临双重风险：基础设施易受 AI 加速攻击，且智能体自身具备自主决策与执行能力。文章提出一个三层零信任架构（基础、高级、优化级）及八阶段实施流程，并概述了提示注入、工具投毒、记忆投毒等特有威胁。

智能体 Anthropic 安全/对齐教程/实践

推荐理由：当漏洞利用从数月压缩到数小时，安全架构必须同步进化。这篇框架把零信任落地到Agent场景，八阶段路线图和三级成熟度模型比泛泛的安全声明具体得多，企业安全团队值得细读。

01:05

Claude：Blog（网页）

CodeRabbit如何用Claude构建智能体编排系统

AI代码审查平台CodeRabbit发现，AI生成的代码常能通过编译与测试，却不符合开发者真实意图，根源在于开发者隐含假设AI理解上下文。为此，团队基于Claude构建了一个智能体编排系统，置于编码请求与智能体之间。该系统在代码生成前协调多个Claude模型进行结构化规划，输出可审查的产品需求文档，使需求显式化。系统每周助力审查超过200万个PR。

智能体 Anthropic 教程/实践编码

5月27日

09:33

Claude Code：GitHub Releases（RSS）

精选71

Claude Code v2.1.152 更新发布

Claude Code 发布 v2.1.152 版本更新。核心改进包括：/code-review --fix 现在会将审查建议直接应用于工作目录；技能与斜杠命令支持通过 frontmatter 的 disallowed-tools 移除模型工具；新增 /reload-skills 命令可不重启会话重新扫描技能目录；SessionStart 钩子现可返回 reloadSkills: true 重新扫描技能，并可通过 hookSpecificOutput.sessionTitle 设置会话标题；新增 MessageDisplay 钩子事件以变换或隐藏助手消息。其他更新涉及插件市场管理、主模型不可用时自动切换至 --fallback-model、会话用量统计优化等。同时修复了终端样式退化、沙箱警告显示、思考摘要、MCP 服务器去重、远程会话连接及多种会话卡顿问题。

智能体 Anthropic 产品更新编码

推荐理由：Claude Code 这次更新把代码审查从'查问题'推进到'直接修'，Skills 系统补上了热加载和工具限制，做工程自动化的团队应该立刻更新。