meng shao@shao__meng

2026-06-14 20:38·18天前

AI 摘要

Bloomberg纪录片揭秘Anthropic：坚持“安全优先”，拒绝国防部无护栏要求被拉黑；Claude Code团队6个月100%代码由AI编写，Cowork发布致单日2850亿美元软件股市值蒸发。Dario维持预判：AI 1–5年内消除约50%初级白领岗位，并给出10–25%文明崩溃概率。被限制模型Mythos发现数千高危漏洞。Anthropic支持对华芯片出口管制，呼吁发布前强制第三方测试。

Anthropic 内幕：近万亿美元 AI 巨头的「安全优先」与权力博弈 | The Circuit

Dario Amodei 仍坚持："AI 可能在 1-5 年内消除约 50% 初级白领岗位"和"支持对华芯片出口管制"，Anthropic 试图在指数级技术、地缘政治、商业竞争与公众焦虑之间走钢丝。

Bloomberg 对 Anthropic 的深度纪录片，采访了联合创始人 Dario & Daniela Amodei 兄妹，以及 Claude Code 负责人 Boris Cherny，采访者是 @emilychangtv，视频发布于 6.10（Claude Fable 5 被美国政府下线前两天），这个时间点很微妙，在 Fable 5 被禁后再回头看，更有趣。 https://www.youtube.com/watch?v=v1wZwxY3CMg&t=1s

公司定位：从 OpenAI 出走到行业领跑者

起源 · 2021 年，7 位 OpenAI 核心成员（含 Amodei 兄妹）因信任与价值观分歧离开，在旧金山 Precita Park 草皮上讨论创业方向。 · Dario 在 OpenAI 提出 Scaling Laws（算力+数据→模型变强），为 ChatGPT 铺路；Daniela 负责运营，把 Dario 的「宇宙级想法」落地。

现状 · 估值约 9650 亿美元，2026 年 Q1 年化增长约 80 倍，API 调用量同比 17 倍。 · 首次盈利，主要靠 Claude Code / Cowork 等企业工具，而非消费级应用。 · Dario 用「平滑指数曲线」形容：长期看似无变化，然后突然爆发。

战略选择刻意避开广告驱动的消费 AI（类比社交媒体的成瘾与「slop」），押注企业场景：制药、能源、科研等，认为商业模式与价值观更一致。

Claude 的产品哲学

Constitution（宪法）：用 UN 人权宣言等跨文化价值训练模型行为。 Professional Warmth：专业但不冷漠，不是「最好的朋友」，也不是冷冰冰的计算器。安全三轴：不撒谎（含幻觉与蓄意欺骗）、无害、价值观对齐。早期 Claude 曾过于「保姆式」（问天气也过度担心），后通过精细调参修正。

技术冲击：代码革命与就业焦虑

Claude Code 的变革 · Boris Cherny：团队 6 个月 100% 代码由 Claude 编写，可同时运行数百至数千个 Claude 实例。 · 工程师角色从「手写代码」转向「规划、与用户沟通、定义方向」。

市场震荡 · Cowork 发布引发「SaaSpocalypse」，单日约 2850 亿美元软件股市值蒸发。 · Dario 判断：软件行业整体会变大，但不适配者会被淘汰。

就业预测（视频中最具争议的部分） · Dario 维持此前判断：AI 可能在 1-5 年内消除约 50% 初级白领岗位。 · 可能出现 GDP 高增长 + 高失业/低薪 + 高不平等的组合。 · 自动化路径：先替代 90% 任务→人效 10 倍→最终接近 100% 替代。 · 对策方向：UBI、对 AI 公司累进税、向物理制造、人际服务（如医疗中的 bedside manner）转移。 · Dario 反驳 Jensen Huang「混淆任务与岗位」的批评，称完整论述见其文章 The Adolescence of Technology。

五角大楼冲突：红线与代价

背景 · 2025 年，Anthropic 与 OpenAI、xAI、Google 共同获得 2 亿美元国防部合同。 · Claude reportedly 用于委内瑞拉抓马杜罗等行动；Bloomberg 称其在伊朗战争中通过 Palantir Maven 做 AI 辅助目标识别。

红线 Anthropic 拒绝： · 大规模监控 · 完全自主致命武器

后果 · 国防部要求「无护栏全面使用」，遭拒后被列入黑名单；Trump、国防部长 Hegseth 公开批评 Dario 为「意识形态疯子」。 · Dario 回应：这是关于政府如何正确使用 AI 的辩论，而非单纯对抗；希望建立先例。

战争伦理的尖锐追问 · 美国官员称 LLM 帮助军方目标识别从 1000/天 → 5000/天。 · 2026 年 2 月，伊朗一所女子学校遭导弹袭击，150+ 儿童死亡；Dario 称不清楚 Claude 是否参与，但强调「人类做最终决策」是其红线之一。 · 他承认军事决策仍会出错，但认为整体 net positive；若无限制，AI 战争更可能引发而非阻止大国冲突（引用《奇爱博士》的自动反击风险）。

地缘政治立场 · 支持对华芯片出口管制（类比不向朝鲜出售核武器）。 · 从 Caltech 反战立场，转向支持国防：俄乌、台海风险使「威权集团 resurgence」需应对。 · 否认与 ICE、CBP、加沙相关合作；与 Palantir 合作但声称严格限定范围。

Mythos： withheld 的网络「超级武器」

模型能力 · Claude Mythos：在主流操作系统中发现数千个高危漏洞（含 27 年 OpenBSD、16 年 FFmpeg、Linux 内核提权链等）。 · 早期测试方称其为「超级武器」，要求 Anthropic 不要发布。

Project Glasswing · 仅向 AWS、Google、Microsoft、CrowdStrike 等可信防御方开放，用于修补而非攻击。 · 即使 NSA 等联邦机构也争相接入--尽管 Anthropic 已被 Pentagon 拉黑。

核心困境 · Dario：未来是攻防猫鼠游戏，好人需先有工具；坏人迟早也会拥有类似能力。 · Emily Chang 追问：谁有权决定谁能获得这种力量？ Daniela 承认决策复杂、可能不完美，但强调出于网络安全特定担忧，而非泛化的权力分配。 · Dario 称 withheld Mythos 商业上损失惨重，反驳「安全营销」说法。

Anthropic 安全/对齐现象/趋势编码

在 X 查看原推导出 Markdown

meng shao@shao__meng · X

60导出 Markdown

2026-06-14 20:38·18天前

在 X 看原推· x.com

AI 摘要

Anthropic 内幕：近万亿美元 AI 巨头的「安全优先」与权力博弈 | The Circuit