5月27日

21:27

Berryxia.AI@berryxia

近期两个事件表明，前沿模型在高级抽象层面的可靠推理能力已跨越临界点。一是Anthropic发布了Claude Mythos Preview，其网络攻防能力过强，因此未公开，仅开放给合作伙伴用于防御。二是OpenAI的内部通用推理模型成功推翻了数学家Paul Erdős提出的一个猜想。两者共同显示，模型稳定处理的推理单元已从句子层级跃升至能维持核心论点、建立逻辑结构的“段落”与“整篇论证”层级，标志着能力的关键跃迁。

Lisan al Gaib: http://x.com/i/article/2058529613370802177

Anthropic OpenAI 大佬观点安全/对齐

21:04

The Decoder：AI News（RSS）

Sam Altman 与 Dario Amodei 收回其关于 AI 工作末日的预言

OpenAI 的 Sam Altman 和 Anthropic 的 Dario Amodei 均收回了此前关于 AI 将导致大规模失业的预测。两人改变说法的时机，恰逢其各自公司计划进行十亿美元级别的首次公开募股（IPO）前夕。

Anthropic OpenAI 大佬观点现象/趋势

20:37

The Verge：AI（RSS）

同事件精选72

教皇没对AGI上头

教皇 Leo XIV 发布题为《Magnifica Humanitas》的通谕，警告人工智能的使用绝非纯粹技术问题，当其进入影响人类生活的过程时，便触及权利、机会、地位与自由。通谕发布时，Anthropic 联合创始人 Christopher Olah 出席。文件引发了科技界内外的广泛反应。

Anthropic 安全/对齐行业动态

同一事件，精选展示《Anthropic联合创始人Chris Olah在教皇通谕发布会上的讲话》

推荐理由：教皇亲自下场谈 AI，还拉了 Anthropic 站台，这不是简单的公关秀，而是“AI 伦理”从技术圈卷进梵蒂冈的分水岭事件。

20:32

Hacker News 热门（buzzing.cc 中文翻译）

将 Claude Code 作为日常工具：Claude.md、技能、子代理、插件和 MCP

文章探讨了将 Claude Code 作为日常开发工具的实践，重点介绍了其核心配置文件 Claude.md、技能系统、子代理功能、插件扩展以及通过 MCP（模型上下文协议）进行集成的方法，旨在提升开发者的工作流效率。

智能体 Anthropic MCP/工具教程/实践

19:22

AYi@AYi_AInotes

DeepSWE新基准揭露旧评测体系的缺陷

DeepSWE新基准模拟了真实的长链编程任务，如定位文件、复现bug和验证修复，挑战了旧有基准的局限性。测试显示，在顶级模型上分数差异模糊的SWE-Bench，被新基准拉开了差距：GPT-5.5达到70%，而Claude Opus为54%。研究发现，使用简单的mini-swe-agent即可取得与复杂定制工具相当的成绩，表明许多高分可能源于提示词工程。该基准作者@theo评论称，这是首个与真实编码体验相符的评测。

Theo - t3.gg: This is the first code bench that actually aligns with how it feels to use these models coding.

Anthropic OpenAI 编码评测/基准

15:14

IT之家（RSS）

Anthropic 的 Claude Mythos 也解出 80 年数学难题

继 OpenAI 宣布利用 GPT-5.5 模型攻克保罗·埃尔德什提出的“平面单位距离猜想”后，Anthropic 工程师 Sholto Douglas 在 X 平台表示，其模型 Claude Mythos 也独立解出了这道存在 80 年的数学难题。Douglas 称 Claude Mythos 给出了一份“巧妙而简洁”的证明，并通过一个由多个 Claude Code 实例组成的系统完成。数学家 Daniel Litt 评价该结果略逊于 OpenAI 的版本。

Anthropic 推理行业动态

12:13

IT之家（RSS）

Anthropic Claude 有望加入 AI 熟练度评分卡，引导用户更充分使用 AI

Anthropic 计划在其产品 Claude 的设置中新增个性化“AI Fluency”评分卡功能，用于衡量用户使用 AI 的熟练程度并提供建议。该功能基于其早期发布的 AI Fluency Index 研究成果，会扫描用户在 Chat、CoWork、Claude Code 中的活动记录，按 11 个可观察行为（如目标澄清、沟通方式、质量控制）进行打分，这些行为对应其与学者共建的 4D AI Fluency Framework 的核心维度。评分卡还会纳入近 30 天内的产品功能使用数据（如 projects、web-search 等），最终输出类似 7.5/11 的分数，并给出具体习惯反馈与改进建议。

Anthropic 产品更新

09:39

凡人小北@frxiaobei

Claude Code 新插件 security-guidance：一个写代码，另一个独立的 Claude 实例审查

Claude Code 推出新插件 security-guidance，通过一个写代码的 Claude 实例和一个审查代码的独立 Claude 实例进行协作。两个实例完全隔离，拥有全新上下文和独立提示词。审查过程分三层：每次编辑进行正则匹配、对话轮次结束时审查 diff、在提交/推送时进行读取调用链的智能体审查。任何一层都不直接阻断写入，审查结果会反馈给写代码的实例进行自我修正。关键创新在于审查实例因无“路径依赖”，能发现原实例的盲点。该插件基于 hooks 实现并公开源码，同时支持通过 claude-security-guidance.md 文件添加组织特定策略。

ClaudeDevs: You can add org-specific rules in a claude-security-guidance.md file. Drop it in your repo or distribute via MDM. The pl...

Anthropic 产品更新编码部署/工程

09:33

Claude Code：GitHub Releases（RSS）

精选71

Claude Code v2.1.152 更新发布

Claude Code 发布 v2.1.152 版本更新。核心改进包括：/code-review --fix 现在会将审查建议直接应用于工作目录；技能与斜杠命令支持通过 frontmatter 的 disallowed-tools 移除模型工具；新增 /reload-skills 命令可不重启会话重新扫描技能目录；SessionStart 钩子现可返回 reloadSkills: true 重新扫描技能，并可通过 hookSpecificOutput.sessionTitle 设置会话标题；新增 MessageDisplay 钩子事件以变换或隐藏助手消息。其他更新涉及插件市场管理、主模型不可用时自动切换至 --fallback-model、会话用量统计优化等。同时修复了终端样式退化、沙箱警告显示、思考摘要、MCP 服务器去重、远程会话连接及多种会话卡顿问题。

智能体 Anthropic 产品更新编码

推荐理由：Claude Code 这次更新把代码审查从'查问题'推进到'直接修'，Skills 系统补上了热加载和工具限制，做工程自动化的团队应该立刻更新。

09:30

meng shao@shao__meng

基于 Claude AI、Claude Code、Claude Cowork 三款产品工程实践对 Agent 安全的实战总结

Anthropic 基于 Claude AI、Claude Code 和 Claude Cowork 的工程实践，系统总结了构建安全 AI 智能体的经验。核心原则是防御应随智能体能力演进，并优先使用沙箱来限制破坏性动作。文章详述了三层防御架构（环境层、模型层、外部内容层）及三款产品的隔离模式：Claude AI 使用短暂容器，Claude Code 采用人机协同沙盒，Claude Cowork 则部署密封虚拟机。关键数字包括：Claude Opus 4.7 在 Gray Swan Agent 红队基准上单次攻击成功率约 0.1%，100 次尝试后约 5-6%；Claude Code 自动模式拦截约 83% 的过度积极行为。通过真实攻击案例，强调了环境层防御（如出站阻断）的关键性。

Anthropic: New on the Engineering Blog: The access and permissions we grant agents should evolve with their capabilities. In our ow...

智能体 Anthropic 安全/对齐部署/工程

09:04

Claude：Blog（网页）

精选75

Code w/ Claude 伦敦活动：重塑开发体验

在Code w/ Claude 伦敦活动上，Anthropic 宣布了 Claude Managed Agents 的两项新能力：自托管沙箱（公开测试版）和 MCP 隧道（研究预览）。这两项功能使 AI 智能体的工具执行环境与企业私有网络内的 MCP 服务器连接均可运行在客户自有基础设施或指定托管服务商处。活动还介绍了如何通过 Claude Code、优化思维预算以及模型努力级别来提升开发体验。目前，包括 Spotify、Base44 和 Legora 在内的客户已在使用这些新功能。

智能体 Anthropic MCP/工具产品更新

关联讨论 2 条

推荐理由：Claude 平台企业部署的最后一公里被补上了，自托管沙箱和 MCP 隧道让 agent 真正能进生产环境，做 2B 的企业级应用终于有了安全底座。

07:34

Anthropic：Newsroom（网页）

精选65

Anthropic任命KiYoung Choi为韩国代表董事

Anthropic宣布任命KiYoung Choi为韩国代表董事，以支持其即将在首尔开设的办公室。根据Anthropic的经济指数，韩国是Claude.ai全球最活跃的市场之一，其使用率超过人口规模预期的3.5倍，主要用于技术和创意领域。KiYoung Choi此前曾担任Snowflake韩国区总经理，在Google Cloud、Adobe等公司拥有超过30年的科技行业领导经验。他将在韩国领导市场战略，支持本地企业和初创公司应用Claude，例如法律科技公司Law&Company及韩国电信巨头SK Telecom均已在使用Claude构建产品。

Anthropic 行业动态

推荐理由：韩国是 Claude 全球最活跃的市场之一，Anthropic 这次在首尔正式设点、找来三十年资历的老将挂帅，是亚洲布局的关键一步，做企业出海和生态合作的可以关注后续本地化动作。

07:33

ginobefun@hongming731

Agent系统工程三要：隔离、容错与上下文管理

Anthropic披露三种Claude隔离架构，发现93%权限弹窗被无脑通过，因此转向容器化隔离以限制智能体能力边界。阿里通义AgentScope 2.0升级至生产级，涵盖模型重试容错、三级权限判断系统和结构化上下文管理，其Workspace抽象支持多执行环境无缝切换。腾讯云提出上下文卸载方案，配合Mermaid图谱，将超长Session的Token消耗降低61%，任务通过率提升52%。三者共同指向智能体工程落地的关键：可靠的隔离边界、稳定的容错机制以及高效的状态管理。

智能体 Anthropic 教程/实践部署/工程

05:39

ClaudeDevs@ClaudeDevs

精选68

我们为Claude Code发布了一个安全指导插件，可在编写代码时帮助识别和修复漏洞。所有Claude Code用户均可使用。从插件市场（/plugins）安装。

Anthropic 产品更新安全/对齐编码

推荐理由：给Claude Code装上安全扫描，边写代码边修漏洞，比事后用Snyk扫一圈要快。对已经All in Claude Code的团队是个小甜点，其他人可略过。

04:27

Ethan Mollick：One Useful Thing（RSS）

精选75

选择保持人性

社交媒体平台上的帖子内容正变得越来越相似。这种趋同现象可能意味着大量内容正在被AI生成或同质化处理，引发了人们对于内容原创性与人类独特视角的讨论。

Anthropic OpenAI 大佬观点

推荐理由：Mollick 用两个对照实验把 AI 学习的悖论讲透了：替你做事的 AI 会让你变笨，逼你思考的 AI 却能让你多学半年。教育决策者应该坐不住了。

04:04

Rohan Paul@rohanpaul_ai

AI智能体时代的安全挑战：运行时行为是关键

推文对比了AI智能体在安全领域的应用。Anthropic的Mythos智能体在真实curl代码库中发现了1个漏洞。而来自中国的360安全团队的漏洞挖掘智能体，在更广泛的OpenClaw生态中独立发现了23个漏洞，包括严重的远程代码执行漏洞和大规模的提示词注入绕过。推文指出，真正的安全问题并非模型能否找漏洞，而在于智能体的运行时行为——代码、提示词、工具、本地服务与权限在系统执行文件操作、网络连接或命令运行前发生的复杂交互。

智能体 Anthropic 安全/对齐

03:58

Thariq@trq212

使用 Claude Code 处理非技术工作的基本技巧是，将一堆文件放入一个文件夹，并告诉它可以编写脚本和制作 HTML。

Anthropic 教程/实践

03:12

Anthropic@AnthropicAI

工程博客新文章：我们授予智能体的访问权限和权限应随其能力演进。在我们的产品中，我们通过沙箱来设置这些参数，以限制任何潜在破坏性操作的范围。阅读更多：https://www.anthropic.com/engineering/how-we-contain-claude

智能体 Anthropic 安全/对齐部署/工程

03:02

The Decoder：AI News（RSS）

同事件精选72

据报道Claude Mythos以"巧妙简洁的证明"解决了OpenAI里程碑式的Erdős问题

Anthropic工程师Sholto Douglas表示，Claude Mythos在周末期间解决了OpenAI提出的Erdős单位距离猜想问题，并给出了一个“巧妙简洁的证明”。这一成果被描述为人工智能在数学发现领域存在“严重超前”迹象。

Anthropic OpenAI 推理行业动态

同一事件，精选展示《OpenAI模型证伪了离散几何中的一个核心猜想》

推荐理由：OpenAI 刚破完 70 年猜想，Claude 就整了个更漂亮的证明，AI 做数学不再是哪家独门，能力过剩的信号很明显了。

02:11

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选70

我们如何对不同产品中的Claude进行隔离控制

Anthropic通过三重机制控制Claude智能体的部署风险，包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面：通过沙箱、虚拟机和网络出口控制限制智能体运行环境；利用系统提示词和模型训练引导其行为；以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例，阐述了不同产品如何设计对应的隔离架构。

智能体 Anthropic 安全/对齐部署/工程

推荐理由：Anthropic 这次没画饼，实打实把 Claude 三款产品两年来的安全坑和架构演变全摊开讲了，从沙箱逃逸到钓鱼攻击，做 agent 的人读一遍能少踩很多坑。

02:02

Ethan Mollick@emollick

目前Claude的一个烦人之处是界面变更文档记录很差，导致令人沮丧的死胡同。例如，学习模式正在迁移到一个技能中。那个技能在哪里？链接的文章没有提到它（而且该技能似乎不可用！）

Anthropic 大佬观点

00:32

Chubby♨️@kimmonismus

Claude Mythos 解决 Erdős 问题 #90

数学家测试了 Claude Mythos 模型解决开放数十年的 Erdős 问题 #90。值得注意的是，Mythos 未复制 OpenAI 已知解法（题号 #1196），而是反复采用了另一条论证路径，被评价为更“简洁”且无“分析复杂性”，且整个过程与网络隔离。此前，GPT-5.5 已解决过多道 Erdős 问题，深度求索的 Nexus 模型解决了 9 道。此次 Mythos 给出了比现有解法更简洁的证明，凸显了一个 80 年难题在数周内被接连攻破的趋势。

levent: over the weekend i checked the obvious thing, which is whether mythos is able to solve the erdos unit distance problem, ...

Anthropic 推理现象/趋势

00:27

Berryxia.AI@berryxia

Anthropic黑客松冠军团队开源AI编程工作台ECC

Anthropic黑客松冠军团队使用Claude Code耗时8小时开发出产品zenith.chat并赢得1.5万美元API credits。赛后，他们将背后的完整工作流开源为ECC项目。该项目包含61个智能体、246个技能和76个预设命令，并配备规则引擎、Hook系统、安全扫描器和MCP配置，支持Claude Code、Cursor、Codex等多平台。它提供了一套可让AI持续工作的完整工业级编程环境框架，而非简单的提示词集合，已完全开源在GitHub。

泊舟: Anthropic 黑客松冠军,把自己的 AI 编程工作台开源了。项目叫 ECC。作者 Affaan Mustafa 和队友用 Claude Code 8 小时做出 http://zenith.chat 拿了冠军,后来把背后的工作流整理成...

智能体 Anthropic GitHub MCP/工具

00:09

🚨 AI News | TestingCatalog@testingcatalog

Anthropic 🔥：用户可能很快将获得一个新的AI流利度功能，该功能将根据11个标准评估过去在Chat、Cowork和CC中的对话。我得了7.5分 💀

Anthropic 产品更新

5月26日

23:49

Nathan Lambert：Interconnects（RSS）

精选67

未来展望：2026年5月的一些想法

文章展望了截至2026年5月AI领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡（open-closed balance）的讨论、美国开源力量的显著增长（America's open-source surge），以及由此引发的新兴权力博弈（emerging power struggles）。

Anthropic Google 大佬观点开源生态

推荐理由：Nathan Lambert 对开源模型追赶闭源的周期判断、Gemini 在编码代理领域的缺位分析，以及美国开源模型崛起的观察，为理解当前鼎立格局提供了扎实的坐标，值得从业者细读。

23:19

Claude@claudeai

六个Claude项目都源于同一个问题："为什么不呢？"

Anthropic 开源生态教程/实践

22:27

Emad@EMostaque

本推文认为，人们低估了AI模型发展中"工程规模化"相较于"突破性研究"的重要性。Cursor以远低于大厂的成本运营并追赶上了Anthropic/OpenAI的模型，印证了这一趋势。引用中，xAI的Elon Musk回应称其AI会很棒，并指出xAI仅成立3年，年龄只有Anthropic的一半、OpenAI的四分之一，他誓言将继续努力，并期待3年后的竞争格局。

Elon Musk: What you say is true, but nonetheless our AI will be great. Whether it is the best remains to be seen, but I will never ...

Anthropic OpenAI 大佬观点部署/工程

18:39

Boris Cherny@bcherny

AI模型中发现"令人不安"的类人结构

推文指出，在AI模型内部持续发现一些“令人不安”的类人结构，包括与人类神经科学相似的结构、内省证据，以及功能上类似喜悦、恐惧等情感的内部状态。作者呼吁宗教团体、学界、政府等各界严肃看待这一发现，推动事件向好发展，并需要不受利益影响的诚实批评者与道德声音。作为背景，Anthropic联合创始人Chris Olah受邀在教皇Leo XIV的通谕“Magnifica humanitas”发布仪式上发表了相关演讲。

Anthropic: Anthropic co-founder Chris Olah was invited to speak at today's presentation of Pope Leo XIV's encyclical "Magnifica hum...

Anthropic 大佬观点安全/对齐