4月1日

09:07

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.89 发布，新增 defer 权限决策支持 headless 会话暂停恢复，引入 CLAUDE_CODE_NO_FLICKER 环境变量实现无闪烁渲染，新增 PermissionDenied hook 允许模型重试被拒命令。修复 Windows 平台 CRLF 处理、StructuredOutput 缓存失效、内存泄漏、LSP 僵尸进程、CJK 字符截断等 30 余项 bug。调整 Edit 工具行为，支持直接编辑通过 Bash 查看的文件；hook 输出超 5 万字符将转存磁盘；默认关闭 thinking summaries。优化 MCP 连接超时和子代理提及体验。

智能体 Anthropic 产品更新编码

06:34

Ethan Mollick：One Useful Thing（RSS）

精选

Claude Dispatch 与界面的力量

AI 能力已足够强大，但人们仍缺乏趁手的工具和界面来完成实际工作。Claude Dispatch 强调，优秀的界面设计才是释放 AI 全部潜力的关键。

智能体 Anthropic 大佬观点

推荐理由：Ethan Mollick 深度解析 Claude 与 AI 界面力量，洞察工具与能力的鸿沟

3月31日

00:00

Anthropic：Newsroom（网页）

澳大利亚政府与 Anthropic 签署 AI 安全与研究合作备忘录

Anthropic 与澳大利亚政府签署备忘录，承诺与澳 AI 安全研究所共享前沿模型风险研究及经济指数数据，并探索在当地投资数据中心。公司宣布向澳大利亚国立大学等四家机构提供 300 万澳元 Claude API 积分，支持罕见疾病基因分析与计算机教育；同时推出深科技初创企业计划，提供最高 5 万美元 API 积分用于药物发现等领域。Anthropic 还将开设悉尼办公室作为亚太扩张起点。

Anthropic 行业动态

00:00

Anthropic：Research（发表成果 · 网页）

Anthropic宣布在澳扩张并发布Claude使用数据

Anthropic宣布在悉尼设立办公室，并与澳大利亚政府签署AI安全合作备忘录。数据显示，澳大利亚占全球Claude流量1.6%，人均使用量是预期的4倍以上，全球排名第11位，人均第7位。使用集中在新南威尔士州（37%）和维多利亚州（31%）。使用场景为46%工作、47%个人、7%课程作业。澳用户倾向于处理更复杂任务，但耗时比平均短20%，AI自主性得分较低（3.38/5），表明更多采用协作而非完全委托模式。

智能体 Anthropic 现象/趋势

3月25日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选77

Claude Code 自动模式：在安全与效率间取得平衡

Anthropic 为 Claude Code 推出“自动模式”，旨在解决用户因频繁手动批准而产生的“批准疲劳”。该模式介于完全手动审批和危险的无权限跳过之间，采用两层防御机制：输入层通过服务器端提示注入探测器扫描工具输出；输出层则利用基于 Sonnet 4.6 模型的转录分类器，在执行前评估操作风险。分类器采用高效的两阶段设计，先快速过滤，必要时才启动思维链推理。其目标是拦截危险操作（如过度积极行为、无心之失、提示注入等），同时让大部分安全操作无需确认即可运行，内部测试显示用户原本会批准约93%的手动提示。

Anthropic 产品更新安全/对齐编码

推荐理由：这是 Claude Code 从「手动审批」跳到「AI 自审」的关键一步，双层防御设计坦诚到连 17% 漏检率都公开讲，做 coding agent 的团队该把这篇当安全设计参考。

3月24日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选75

利用对抗网络灵感设计多代理架构，突破长时应用开发瓶颈

作者受生成对抗网络启发，设计了一个包含规划器、生成器和评估器的三代理架构，以解决Claude在长时应用开发中的两大瓶颈。该架构通过上下文重置机制，有效克服了模型在长任务中的“上下文焦虑”问题；同时，通过分离生成与评估功能，使代理能依据具体标准进行迭代改进，而非盲目自评。这一方法成功使系统能在多小时的自主运行中生成完整的全栈应用程序，突破了此前提示工程和传统工具设计的性能上限。

智能体 Anthropic 教程/实践编码

推荐理由：Anthropic 工程师把 GAN 的 generator-evaluator 思路搬进长时 Agent 架构，从设计到全栈编码都跑通了，还附了成本和失败模式。做 Agent 产品的人读完能直接抄作业，比看十篇论文管用。

00:00

Anthropic：Research（发表成果 · 网页）

Anthropic经济指数报告：揭示AI学习曲线效应

Anthropic发布Economic Index报告，基于2026年2月数据分析Claude使用趋势。Claude.ai使用场景显著多样化，前10大任务占比从24%降至19%，平均经济价值因个人查询增加而下降。49%的工作岗位已有至少四分之一任务使用Claude。数据显示明显学习曲线效应：资深用户对话成功率比新用户高10%，更多将模型用于高等教育任务。全球使用不平等持续，前20国家占人均使用量48%，但美国内部差距略有缩小。

Anthropic 论文/研究

3月23日

00:00

Anthropic：Research（发表成果 · 网页）

氛围物理：AI研究生

哈佛物理教授Matthew Schwartz全程监督Claude Opus 4.5完成G2级理论物理计算（Sudakov shoulder重求和），两周内产出通常需一年的研究成果。项目消耗110余版草稿、3600万token及40余小时CPU计算。研究显示Claude虽速度快且不知疲倦，但易犯粗心错误，必须依赖领域专家验证。实验证明AI尚不能独立进行端到端科研，但在专家监督下已能完成前沿物理研究，作者认为此方法论突破比物理成果本身更具重要意义。

Anthropic 论文/研究

00:00

Anthropic：Research（发表成果 · 网页）

精选71

利用长时运行智能体工作流革新科学计算

Anthropic 研究员展示了如何将多日智能体编码工作流应用于科学计算任务。以使用 Claude Opus 实现宇宙学玻尔兹曼求解器的可微分版本为例，该任务通常需耗费研究人员数月甚至数年时间。通过制定清晰的项目指令、利用日志文件作为智能体的持久记忆并设置测试预言，即使是非领域专家也能引导智能体在数小时内完成这类复杂项目。该方法的核心在于设定高层目标后，让智能体团队自主工作，仅需偶尔人工监督，从而显著提升了科学代码开发与移植的效率。

智能体 Anthropic 教程/实践编码

推荐理由：Anthropic 研究员用 Claude Opus 4.6 花几天从零写出了一个宇宙学 Boltzmann 求解器，原本是博士级团队几个月的活。这不是论文，是一份完整的多日 Agent 工作流实操手册，做科研或长周期编码的人可以直接抄作业。