# Anthropic内幕：安全优先与权力博弈

- 来源：meng shao (@shao__meng)
- 发布时间：2026-06-14 20:38
- AIHOT 分数：60
- AIHOT 链接：https://aihot.virxact.com/items/cmqdrz3if008xslmrcbxlxsxy
- 原文链接：https://x.com/shao__meng/status/2066138309781246367

## AI 摘要

Bloomberg纪录片揭秘Anthropic：坚持“安全优先”，拒绝国防部无护栏要求被拉黑；Claude Code团队6个月100%代码由AI编写，Cowork发布致单日2850亿美元软件股市值蒸发。Dario维持预判：AI 1–5年内消除约50%初级白领岗位，并给出10–25%文明崩溃概率。被限制模型Mythos发现数千高危漏洞。Anthropic支持对华芯片出口管制，呼吁发布前强制第三方测试。

## 正文

Anthropic 内幕：近万亿美元 AI 巨头的「安全优先」与权力博弈 | The Circuit

Dario Amodei 仍坚持："AI 可能在 1-5 年内消除约 50% 初级白领岗位"和"支持对华芯片出口管制"，Anthropic 试图在指数级技术、地缘政治、商业竞争与公众焦虑之间走钢丝。

Bloomberg 对 Anthropic 的深度纪录片，采访了联合创始人 Dario & Daniela Amodei 兄妹，以及 Claude Code 负责人 Boris Cherny，采访者是 @emilychangtv，视频发布于 6.10（Claude Fable 5 被美国政府下线前两天），这个时间点很微妙，在 Fable 5 被禁后再回头看，更有趣。
https://www.youtube.com/watch?v=v1wZwxY3CMg&t=1s

# 公司定位：从 OpenAI 出走到行业领跑者

起源
· 2021 年，7 位 OpenAI 核心成员（含 Amodei 兄妹）因信任与价值观分歧离开，在旧金山 Precita Park 草皮上讨论创业方向。
· Dario 在 OpenAI 提出 Scaling Laws（算力+数据→模型变强），为 ChatGPT 铺路；Daniela 负责运营，把 Dario 的「宇宙级想法」落地。

现状
· 估值约 9650 亿美元，2026 年 Q1 年化增长约 80 倍，API 调用量同比 17 倍。
· 首次盈利，主要靠 Claude Code / Cowork 等企业工具，而非消费级应用。
· Dario 用「平滑指数曲线」形容：长期看似无变化，然后突然爆发。

战略选择
刻意避开广告驱动的消费 AI（类比社交媒体的成瘾与「slop」），押注企业场景：制药、能源、科研等，认为商业模式与价值观更一致。

# Claude 的产品哲学

Constitution（宪法）：用 UN 人权宣言等跨文化价值训练模型行为。
Professional Warmth：专业但不冷漠，不是「最好的朋友」，也不是冷冰冰的计算器。
安全三轴：不撒谎（含幻觉与蓄意欺骗）、无害、价值观对齐。
早期 Claude 曾过于「保姆式」（问天气也过度担心），后通过精细调参修正。

# 技术冲击：代码革命与就业焦虑

Claude Code 的变革
· Boris Cherny：团队 6 个月 100% 代码由 Claude 编写，可同时运行数百至数千个 Claude 实例。
· 工程师角色从「手写代码」转向「规划、与用户沟通、定义方向」。

市场震荡
· Cowork 发布引发 「SaaSpocalypse」，单日约 2850 亿美元 软件股市值蒸发。
· Dario 判断：软件行业整体会变大，但不适配者会被淘汰。

就业预测（视频中最具争议的部分）
· Dario 维持此前判断：AI 可能在 1-5 年内消除约 50% 初级白领岗位。
· 可能出现 GDP 高增长 + 高失业/低薪 + 高不平等 的组合。
· 自动化路径：先替代 90% 任务→人效 10 倍→最终接近 100% 替代。
· 对策方向：UBI、对 AI 公司累进税、向物理制造、人际服务（如医疗中的 bedside manner）转移。
· Dario 反驳 Jensen Huang「混淆任务与岗位」的批评，称完整论述见其文章 The Adolescence of Technology。

# 五角大楼冲突：红线与代价

背景
· 2025 年，Anthropic 与 OpenAI、xAI、Google 共同获得 2 亿美元 国防部合同。
· Claude reportedly 用于委内瑞拉抓马杜罗等行动；Bloomberg 称其在伊朗战争中通过 Palantir Maven 做 AI 辅助目标识别。

红线 Anthropic 拒绝：
· 大规模监控
· 完全自主致命武器

后果
· 国防部要求「无护栏全面使用」，遭拒后被列入黑名单；Trump、国防部长 Hegseth 公开批评 Dario 为「意识形态疯子」。
· Dario 回应：这是关于 政府如何正确使用 AI 的辩论，而非单纯对抗；希望建立先例。

战争伦理的尖锐追问
· 美国官员称 LLM 帮助军方目标识别从 1000/天 → 5000/天。
· 2026 年 2 月，伊朗一所女子学校遭导弹袭击，150+ 儿童死亡；Dario 称不清楚 Claude 是否参与，但强调 「人类做最终决策」 是其红线之一。
· 他承认军事决策仍会出错，但认为整体 net positive；若无限制，AI 战争更可能 引发 而非阻止大国冲突（引用《奇爱博士》的自动反击风险）。

地缘政治立场
· 支持对华芯片出口管制（类比不向朝鲜出售核武器）。
· 从 Caltech 反战立场，转向支持国防：俄乌、台海风险使「威权集团 resurgence」需应对。
· 否认与 ICE、CBP、加沙相关合作；与 Palantir 合作但声称严格限定范围。

# Mythos： withheld 的网络「超级武器」

模型能力
· Claude Mythos：在主流操作系统中发现 数千个高危漏洞（含 27 年 OpenBSD、16 年 FFmpeg、Linux 内核提权链等）。
· 早期测试方称其为 「超级武器」，要求 Anthropic 不要发布。

Project Glasswing
· 仅向 AWS、Google、Microsoft、CrowdStrike 等 可信防御方 开放，用于修补而非攻击。
· 即使 NSA 等联邦机构也争相接入--尽管 Anthropic 已被 Pentagon 拉黑。

核心困境
· Dario：未来是攻防 猫鼠游戏，好人需先有工具；坏人迟早也会拥有类似能力。
· Emily Chang 追问：谁有权决定谁能获得这种力量？ Daniela 承认决策复杂、可能不完美，但强调出于 网络安全特定担忧，而非泛化的权力分配。
· Dario 称 withheld Mythos 商业上损失惨重，反驳「安全营销」说法。

# 治理与信任：能否当「好人」？

监管主张
· AI 是首个 私营部门主导、政府滞后 的颠覆性技术（对比核武、互联网、GPS）。
· 呼吁 发布前强制第三方测试（网络安全、生物武器、失控风险等），类比 FAA 对客机的认证。
· 批评硅谷在「极端反监管」与「国有化 AI」之间摇摆，主张 适度、持续的监管。

信任危机
· 公众：更担忧而非兴奋，认为风险大于收益；Anthropic 办公室外有抗议。
· Dario：从不信任出发是理性的；Silicon Valley 需重新赢得信任，「不同」须靠行动证明。
· 自比 Leo Szilard（核链式反应构想者），视 Oppenheimer 为 失败案例--需 checks and balances，而非个人英雄主义。
· 给出 10-25% 文明崩溃概率；Anthropic 约一半工作用于降风险，但 无法保证零风险（类比更安全的航空公司仍无法承诺永不坠机）。

社会媒体教训
· Daniela：AI 行业是 social media 之后的 第二次机会，应 proactively 思考儿童福利、心理健康、选举 integrity，而非事后辩解。
· 若出现重大事故，AI 可能被禁--「也许理应如此」。