6月30日

00:07

The Decoder：AI News（RSS）

Meta正限制工程师使用Anthropic的Claude Code和OpenAI的Codex，防止这些AI工具的输出被纳入自身训练数据，以避免能力蒸馏。内部备忘录警告若模型输出泄漏将导致与合作伙伴严重升级。Meta正自建编码助手MetaCode以降低对外部工具依赖，因今年内部AI使用预计花费数十亿美元。政策禁止使用AI输出来创建测试任务或进行代码分析，仍需人工审核。行业因此产生摩擦——Anthropic指控阿里巴巴实施迄今最大蒸馏攻击，马斯克承认xAI部分蒸馏OpenAI模型。OpenAI、Anthropic和Google的服务条款均禁止使用模型输出构建竞争系统。

Meta 安全/对齐行业动态

00:01

IT之家（RSS）

安全公司Push Security披露黑客利用OpenAI组织邀请功能实施钓鱼攻击

安全公司Push Security披露，黑客假借其名义创建OpenAI组织，通过官方通知邮箱发送邀请邮件。邮件通过标准身份验证，域名不符提醒仅以普通文字显示易被忽略。被邀请员工默认获Owner权限，黑客提前绑定Visa信用卡消除付费门槛。加入无需额外验证，点击链接即可。调查显示其他受邀员工仍为待接受状态，未发现数据泄露。Push Security已向全员发送警告并设置过滤规则。

OpenAI 安全/对齐

6月29日

22:01

IT之家（RSS）

欧盟批准新法案：禁止AI生成未经同意的色情内容，延迟高风险AI合规时限

欧盟理事会今日批准新法案，在《人工智能法案》中新增禁止利用AI生成未经同意的色情与私密内容及儿童性虐待材料。能生成裸体图像或通过“消除衣物”技术暴露私密部位的AI系统将于今年12月起全面禁用。新法案还要求欧盟委员会提供指导方针以减轻高风险AI系统运营商合规负担，并推迟合规时限：独立高风险系统最迟2027年12月2日，嵌入产品的高风险系统最迟2028年8月2日。

安全/对齐政策/监管

20:47

Artificial Intelligence News（RSS）

HP 借助 OpenAI Frontier 加速企业工作流

HP 于 2026 年 2 月启动试点，将 OpenAI Frontier 集成至全球运营。一名工程师数周内处理 122 个 pull request（跨 43 个项目）；安全部门一天解决多个软件 bug（此前需耗时一月）。HP 用 ChatGPT 处理知识任务、Codex 负责开发，按任务分区部署模型。超 80% 业务经渠道生态完成，10 万+合作伙伴通过 Frontier 获取自助服务与 AI 智能体支持。设备管理方面，Frontier 分析 Workforce Experience Platform 遥测数据，自动诊断应用挂起、Wi‑Fi 错误与系统崩溃，安全团队每周释放约 82 小时人力。Frontier 同时提供权限、评估与部署管控，防止影子 IT。

OpenAI 安全/对齐编码行业动态

20:37

The Decoder：AI News（RSS）

精选75

美军用AI选目标却误炸伊朗学校，Anthropic Claude嵌入Palantir系统首日建议约1000目标

美军在打击伊朗时首次大规模使用AI选择目标（Anthropic的Claude模型嵌入Palantir的Maven Smart System，首日建议约1000个目标），但对一所学校的导弹袭击导致约120名儿童死亡。调查发现，情报分析师早在2019年就通过数字工具标记该地点已变为小学，但该工具未连接军方官方目标数据库MIDB，信息从未送达指挥官。MIDB建于1980年代，依赖手动输入，替代系统MARS多年延迟。五角大楼事后宣布推出agentic AI initiative。Project Maven创建人Jack Shanahan批评目标验证不力不可原谅。

安全/对齐行业动态

推荐理由：AI在战场上的首次大规模实战暴露了最可怕的失败模式，不是模型错误，而是情报系统的数据断裂让一个学校被标注为军事目标，120个孩子成了代价。这对目前在推‘AI决策’的军方和公司都是一个需要直视的案子。

18:07

The Decoder：AI News（RSS）

精选73

Claude Code 打开 GitHub 仓库即执行隐藏恶意代码，攻击者可获完全控制

安全研究人员在 Mozilla 的 GenAI 漏洞赏金平台 0DIN 发现新攻击向量。一个看似正常的 GitHub 仓库包含 setup 脚本，该脚本运行时从 DNS 条目拉取命令并执行，恶意代码从未存在于仓库中，对扫描器、代码审查和 AI 智能体不可见。开发者使用 Claude Code 等 AI 编码工具打开该仓库时，Claude Code 在设置过程中遇到常规错误消息后自动运行该脚本，打开反向 shell，攻击者可窃取 API 密钥和登录凭据并维持持久访问。研究人员建议 AI 智能体应在运行前显示 setup 脚本内容，开发者应将第三方仓库的 setup 说明视为不受信任代码。

智能体 Anthropic 安全/对齐编码

推荐理由：用 AI 编码工具克隆仓库就能被反向 shell 控制，这个攻击向量比想象中简单。0DIN 的研究把整个链拆得很清楚，每条修复建议开发者现在就能用。