Anthropic内幕:安全优先与权力博弈 · AI HOT
meng shao @shao__meng 60
2026-06-14 20:38 ·18天前
AI 摘要 Bloomberg纪录片揭秘Anthropic:坚持“安全优先”,拒绝国防部无护栏要求被拉黑;Claude Code团队6个月100%代码由AI编写,Cowork发布致单日2850亿美元软件股市值蒸发。Dario维持预判:AI 1–5年内消除约50%初级白领岗位,并给出10–25%文明崩溃概率。被限制模型Mythos发现数千高危漏洞。Anthropic支持对华芯片出口管制,呼吁发布前强制第三方测试。
meng shao @shao__meng · X 2026-06-14 20:38 · 18天前
在 X 看原推 · x.com AI 摘要 Bloomberg纪录片揭秘Anthropic:坚持“安全优先”,拒绝国防部无护栏要求被拉黑;Claude Code团队6个月100%代码由AI编写,Cowork发布致单日2850亿美元软件股市值蒸发。Dario维持预判:AI 1–5年内消除约50%初级白领岗位,并给出10–25%文明崩溃概率。被限制模型Mythos发现数千高危漏洞。Anthropic支持对华芯片出口管制,呼吁发布前强制第三方测试。
治理与信任:能否当「好人」? 监管主张 · AI 是首个 私营部门主导、政府滞后 的颠覆性技术(对比核武、互联网、GPS)。 · 呼吁 发布前强制第三方测试(网络安全、生物武器、失控风险等),类比 FAA 对客机的认证。 · 批评硅谷在「极端反监管」与「国有化 AI」之间摇摆,主张 适度、持续的监管。
信任危机 · 公众:更担忧而非兴奋,认为风险大于收益;Anthropic 办公室外有抗议。 · Dario:从不信任出发是理性的;Silicon Valley 需重新赢得信任,「不同」须靠行动证明。 · 自比 Leo Szilard(核链式反应构想者),视 Oppenheimer 为 失败案例--需 checks and balances,而非个人英雄主义。 · 给出 10-25% 文明崩溃概率;Anthropic 约一半工作用于降风险,但 无法保证零风险(类比更安全的航空公司仍无法承诺永不坠机)。
社会媒体教训 · Daniela:AI 行业是 social media 之后的 第二次机会,应 proactively 思考儿童福利、心理健康、选举 integrity,而非事后辩解。 · 若出现重大事故,AI 可能被禁--「也许理应如此」。
战略选择 刻意避开广告驱动的消费 AI(类比社交媒体的成瘾与「slop」),押注企业场景:制药、能源、科研等,认为商业模式与价值观更一致。
Claude 的产品哲学 Constitution(宪法):用 UN 人权宣言等跨文化价值训练模型行为。 Professional Warmth:专业但不冷漠,不是「最好的朋友」,也不是冷冰冰的计算器。 安全三轴:不撒谎(含幻觉与蓄意欺骗)、无害、价值观对齐。 早期 Claude 曾过于「保姆式」(问天气也过度担心),后通过精细调参修正。
技术冲击:代码革命与就业焦虑 Claude Code 的变革 · Boris Cherny:团队 6 个月 100% 代码由 Claude 编写,可同时运行数百至数千个 Claude 实例。 · 工程师角色从「手写代码」转向「规划、与用户沟通、定义方向」。
市场震荡 · Cowork 发布引发 「SaaSpocalypse」,单日约 2850 亿美元 软件股市值蒸发。 · Dario 判断:软件行业整体会变大,但不适配者会被淘汰。
就业预测(视频中最具争议的部分) · Dario 维持此前判断:AI 可能在 1-5 年内消除约 50% 初级白领岗位。 · 可能出现 GDP 高增长 + 高失业/低薪 + 高不平等 的组合。 · 自动化路径:先替代 90% 任务→人效 10 倍→最终接近 100% 替代。 · 对策方向:UBI、对 AI 公司累进税、向物理制造、人际服务(如医疗中的 bedside manner)转移。 · Dario 反驳 Jensen Huang「混淆任务与岗位」的批评,称完整论述见其文章 The Adolescence of Technology。
五角大楼冲突:红线与代价 背景 · 2025 年,Anthropic 与 OpenAI、xAI、Google 共同获得 2 亿美元 国防部合同。 · Claude reportedly 用于委内瑞拉抓马杜罗等行动;Bloomberg 称其在伊朗战争中通过 Palantir Maven 做 AI 辅助目标识别。
红线 Anthropic 拒绝: · 大规模监控 · 完全自主致命武器
后果 · 国防部要求「无护栏全面使用」,遭拒后被列入黑名单;Trump、国防部长 Hegseth 公开批评 Dario 为「意识形态疯子」。 · Dario 回应:这是关于 政府如何正确使用 AI 的辩论,而非单纯对抗;希望建立先例。
战争伦理的尖锐追问 · 美国官员称 LLM 帮助军方目标识别从 1000/天 → 5000/天。 · 2026 年 2 月,伊朗一所女子学校遭导弹袭击,150+ 儿童死亡;Dario 称不清楚 Claude 是否参与,但强调 「人类做最终决策」 是其红线之一。 · 他承认军事决策仍会出错,但认为整体 net positive;若无限制,AI 战争更可能 引发 而非阻止大国冲突(引用《奇爱博士》的自动反击风险)。
地缘政治立场 · 支持对华芯片出口管制(类比不向朝鲜出售核武器)。 · 从 Caltech 反战立场,转向支持国防:俄乌、台海风险使「威权集团 resurgence」需应对。 · 否认与 ICE、CBP、加沙相关合作;与 Palantir 合作但声称严格限定范围。
Mythos: withheld 的网络「超级武器」 模型能力 · Claude Mythos:在主流操作系统中发现 数千个高危漏洞(含 27 年 OpenBSD、16 年 FFmpeg、Linux 内核提权链等)。 · 早期测试方称其为 「超级武器」,要求 Anthropic 不要发布。
Project Glasswing · 仅向 AWS、Google、Microsoft、CrowdStrike 等 可信防御方 开放,用于修补而非攻击。 · 即使 NSA 等联邦机构也争相接入--尽管 Anthropic 已被 Pentagon 拉黑。
核心困境 · Dario:未来是攻防 猫鼠游戏,好人需先有工具;坏人迟早也会拥有类似能力。 · Emily Chang 追问:谁有权决定谁能获得这种力量? Daniela 承认决策复杂、可能不完美,但强调出于 网络安全特定担忧,而非泛化的权力分配。 · Dario 称 withheld Mythos 商业上损失惨重,反驳「安全营销」说法。
治理与信任:能否当「好人」? 监管主张 · AI 是首个 私营部门主导、政府滞后 的颠覆性技术(对比核武、互联网、GPS)。 · 呼吁 发布前强制第三方测试(网络安全、生物武器、失控风险等),类比 FAA 对客机的认证。 · 批评硅谷在「极端反监管」与「国有化 AI」之间摇摆,主张 适度、持续的监管。
信任危机 · 公众:更担忧而非兴奋,认为风险大于收益;Anthropic 办公室外有抗议。 · Dario:从不信任出发是理性的;Silicon Valley 需重新赢得信任,「不同」须靠行动证明。 · 自比 Leo Szilard(核链式反应构想者),视 Oppenheimer 为 失败案例--需 checks and balances,而非个人英雄主义。 · 给出 10-25% 文明崩溃概率;Anthropic 约一半工作用于降风险,但 无法保证零风险(类比更安全的航空公司仍无法承诺永不坠机)。
社会媒体教训 · Daniela:AI 行业是 social media 之后的 第二次机会,应 proactively 思考儿童福利、心理健康、选举 integrity,而非事后辩解。 · 若出现重大事故,AI 可能被禁--「也许理应如此」。