# OpenAI 高薪招聘安全研究员，聚焦AI自我改进防御与自动化目标

- 来源：IT之家（RSS）
- 发布时间：2026-05-23 23:49
- AIHOT 分数：50
- AIHOT 链接：https://aihot.virxact.com/items/cmpijo6pj0xnjsljw4pg48nn6
- 原文链接：https://www.ithome.com/0/954/455.htm

## AI 摘要

OpenAI 正为其 Preparedness 安全团队招聘安全研究员，年薪高达 29.5 万至 44.5 万美元。该岗位旨在寻找能够支持递归式自我改进准备工作的技术专家，要求具备对未来潜在问题进行推理的“良好品味和策略”。研究员将重点研究防御“数据投毒”攻击、开发模型推理过程解释工具，并追踪技术岗位自动化进展。此次招聘与 OpenAI 的长期目标呼应，即实现AI研发自动化，包括在2028年前推出“真正的自动化AI研究员”。

## 正文

IT之家 5 月 23 日消息，据《商业内幕》23 日（今天）下午报道，OpenAI 发布了安全研究员的招聘信息，研究当 AI 能够训练出自己的“更强版本”时可能出现的问题。

职位聚合网站显示，这则招聘信息面向 OpenAI Preparedness 安全团队，本月上线。该岗位年薪高达 29.5 万至 44.5 万美元（IT之家注：现汇率约合 200.8 万至 303 万元人民币），目标是寻找“能够支持递归式自我改进准备工作的强大技术执行者”。

招聘信息写道：“这项工作依赖于对未来可能存在、但当前未必已经存在的问题进行推理。因此，这一岗位尤其需要具备良好品味和策略（tasteful and strategic）的人才。”

当前，OpenAI 正着眼于实现自身研究工作的自动化的目标。去年 10 月，CEO 奥尔特曼曾表示，OpenAI 的目标是在今年 9 月前利用数十万枚芯片运行“自动化 AI 研究实习生”，并在 2028 年 3 月前实现“真正的自动化 AI 研究员”。他补充说，“我们完全有可能无法实现这一目标。但考虑到潜在影响极其巨大，我们认为公开说明这些目标符合公众利益。”

Anthropic 今年 4 月发布研究，尝试利用 AI 模型监督更强大的 AI 模型，并取得了有限但积极的结果。今年 5 月，Anthropic 联合创始人兼政策主管杰克 · 克拉克提出观点：到 2028 年底前，AI 研发完全脱离人类参与的概率“大约为 60%”。

OpenAI 的这则招聘信息提到，研究员预计需要重点研究如何防御“数据投毒”攻击，即攻击者通过训练数据破坏 AI 模型的行为；需要开发用于解释模型推理过程的工具，或通过实验理解模型的安全性与潜在风险；需要“追踪技术岗位自动化进展”，其中包括衡量 AI 编程工具的使用情况。