OpenAI Daybreak 计划更新,推出 Codex 安全插件和专属 GPT-5.5-Cyber 模型,实现从漏洞发现到补丁生成的自动闭环,将以往数周乃至数月的修复时间压缩至数小时。该模型已为 Linux 内核、FreeBSD、cURL、Go、Python、Sigstore、pyca/cryptography 等关键项目发现并生成补丁。GPT-5.5-Cyber 仅限经验证的防御者进行授权渗透测试。此举大幅压缩零日漏洞攻击窗口,但 AI 补丁可能引入新问题,未来或需更高阶 AI 监督修复进程。
We're accelerating patching, in addition to vuln finding, with new tools and models in OpenAI Daybreak. Our models are n...
We're expanding OpenAI Daybreak to help democratize patching vulnerable software at machine speed: - Codex Security plug...
We're expanding OpenAI Daybreak to help democratize patching vulnerable software at machine speed: - Codex Security plug...
OpenAI 宣布扩展 Daybreak 项目,以机器速度民主化修补易受攻击的软件。具体包括:推出 Codex Security 插件,可在 Codex 内查找、验证和修复漏洞;发布完整版 GPT-5.5-Cyber 模型,专为可信防御者设计;启动 Cyber Partner Program,支持领先安全公司基于 OpenAI 最佳网络能力构建产品;以及 Patch the Planet,与维护者合作保护关键开源项目。
五眼联盟(Five Eyes)网络机构警告,能够显著升级针对政府和企业的网络攻击的前沿AI模型可能仅需数月(而非数年)就能实现。该机构称前沿AI模型预计将超出当前行业预期,从根本上改变攻防网络能力。此前美国已禁止外国人访问Anthropic的Fable模型,担忧Mythos和Fable等系统可能同时改变进攻性和防御性网络安全。
Holy Sh*t: that changes the whole Fable 5 story completely: On June 11, the very same day Amazon reportedly uncovered th...
同一事件,精选展示《NSA局长:Mythos数小时内攻破其几乎所有机密系统》This now widely circulated claim is based on a line I wrote last week (https://economist.com/briefing/2026/06/14/donald-...
Mythos cracked MacOS in 5 days WHY THIS MATTERS: - It takes Google Project Zero - the most prestigious bug-finding team ...
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)诺贝尔化学奖得主、AlphaFold 团队负责人 John Jumper 宣布离开 Google DeepMind,加入 Anthropic(休息一段时间后)。他在 GDM 工作近 9 年,博士毕业仅 6 个月便被 Demis Hassabis 委以重任领导 AlphaFold,实现了蛋白质结构预测突破。此前已有大批 OpenAI 核心研究员流入 Anthropic,Jeff Dean 也开始公开互动。评论称 Anthropic 在“收集无限宝石”。这位蛋白质科学家跨界 AI 安全与大模型,暗示下一个重大突破可能出现在意料之外的方向。
A bit of news: After nearly 9 years, I have decided to leave Google DeepMind and join Anthropic (after taking some time ...
同一事件,精选展示《AlphaFold 负责人 John Jumper 离职 Google DeepMind,加入 Anthropic》OpenAI 发布的新论文太有趣了,有点探索人性底层原理的意味。 业界研究发现在对齐大模型的时候,有个很糟糕的现象叫 emergent misalignment(涌现失调): 一个模型如果在训练时被教着做一件坏事,比如写不安全的代码,它会自...
there is no question, none at all, that china has full access to all of openai & anthropic's github/slack/docs today no ...
⚠️ NEW on The Axios Show: President Trump tells @MarcACaputo that a week ago, he might've considered Anthropic a nationa...
6月20日早报聚焦:Anthropic发布Claude Fable 5,限制开发者构建竞争性LLM,还曾降低疑似研究者输出质量;美国商务部下出口管制,全球禁用访问权,Andrew Ng批评此举加速多国AI主权讨论。Spring I/O上Brian Vermeer演示LLM攻防,通过路径穿越污染RAG知识库、SQL注入伪造聊天记忆、拆分提问套取数据,强调最小权限工具与纵深防御。另有文章称软件工程50年未真正工程化,大模型首次实现“耗能换高阶认知”,但幻觉等问题仍待解决。
Anthropic对Claude Fable 5增加竞品研究限制,并疑似降低同行研究者输出质量;美国出口管制迫使Fable全球下线。DeepSWE等新基准显示智能体编程能力未触顶。Nvidia发布Nemotron 3 Ultra混合架构开源模型。Spring I/O演讲演示LLM应用攻防:路径穿越污染RAG、SQL注入越权、拆分追问绕过护栏,强调授权与可观测性。TypeScript 7.0 RC将编译器移植Go,实现约10倍性能提升。Andrew Ng认为限制措施加速全球AI主权投资。
http://x.com/i/article/2068133950955085826
特朗普对Anthropic的态度在一天内反转:此前将其视为国家安全威胁,但会见CEO Dario Amodei后改口称其“聪明、好人、反应很负责任”。被问是否用国防生产法管制AI时,他表示“可能但似乎大家都很负责任”。特朗普还透露,举报Anthropic的是其竞争对手兼部分股东——Amazon。这一事件暴露了AI监管的真实逻辑:出口管制等重大决策可能取决于与总统的面谈效果。
🚨BREAKING: TRUMP ON ANTHROPIC REPORTER: Do you view Anthropic and to a degree its CEO, Dario Amodei, as a threat to nat...
Even before Mythos I was getting asked more and more what Anthropic's deal is, and why tf they're acting the way they're...
http://x.com/i/article/2067652729913114624
新研究对Anthropic Fable 5和Opus 4.8进行自动化红队攻击,持续改写有害提示词直至模型拒绝或生成坏答案。Fable 5最差攻击成功率6.1%,Opus 4.8为11.5%,证明最强LLM也无法完全免疫越狱——即便微小失败率,规模化自动化攻击仍可产生大量有害内容。旧式编码/角色扮演型越狱已非主要威胁,新弱点在于上下文:自适应攻击者在被拒后不断改写请求,寻找模型视为合法而非危险的框架。白宫与Anthropic正转向基于基准的测试框架,通过评分绕过程度、暴露能力、攻击可重复性及实际后果来量化越狱风险,而非追求不现实的完美免疫。
The White House and Anthropic may have found the first serious path to restore Mythos and Fable access without pretendin...
白宫与Anthropic正合作制定正式技术评估框架,用于量化AI模型越狱攻击的严重性,并建立标准化评估方法论。框架将开发通用基准,评估防护被绕过程度、暴露的能力、攻击可重复性及实际运营后果。双方认识到完全免疫越狱并非可行目标。近期红队研究表明,强化后的前沿模型Fable 5比Opus 4.8更鲁棒,但在持续自动化攻击下仍产生有害输出。新框架每次以相同问题衡量风险,被视为更务实的监管路径。
NEW: White House and Anthropic are working to create a formal technical assessment framework that can quantify the sever...
OpenAI 将前沿健康 AI 能力从 premium 推理模型迁移至免费版 GPT-5.5 Instant,使其健康评估表现接近 Thinking 模型。每周超 2.3 亿用户通过 ChatGPT 咨询健康问题。OpenAI 采用知识蒸馏:由更强教师模型与 260+ 名医生(覆盖 60 国、49 种语言、26 专科)审查超 70 万条模型响应,训练学生模型学习临床回答模式。训练结合监督微调与偏好训练,重点提升“不确定性下的行为”(如主动询问年龄、症状等缺失信息)。真实健康流量中事实性问题减少 71%。GPT-5.5 Instant 已向全体免费用户开放。
GPT-5.5 Instant is now on par with our frontier Thinking models for health-related questions. Every week, more than 230 ...
关联讨论 3 条The Decoder:AI News(RSS)X:Greg Brockman (@gdb)OpenAI:官网动态(RSS · 排除企业/客户案例)New research on beneficial RL: models trained on a small amount of beneficial trait data improve on a wide range of alig...
Nypost: Anthropic is trying to get Washington to reverse the US block on its most powerful Mythos Anthropic has proposed...
OpenAI 最新研究显示,在真实人类情境中进行强化学习(RL)训练,可使模型将安全、有用行为迁移到未训练的任务。关键发现是跨领域迁移:仅用健康数据训练,模型在抵制敲诈、代码奖励黑客和欺骗测试等非健康行为上也得到改善。模型可能学到通用行为习惯——先核实再断言、被纠正时让步、不奉承用户、避免看似有用实则破坏任务的捷径。即使训练数据中移除健康与科学内容,模型在健康评估上仍表现更好。训练后的模型更难被引导向有害行为,同时保持对有益指令的响应,实现了安全研究期待的非对称性。OpenAI 表示,希望模型在承担更长、更高风险任务时,能将有益安全行为带入新领域并在压力下保持。
As AI takes on longer, higher-stakes tasks, we want models to carry beneficial and safe behavior into new domains beyond...
OpenAI探索逆向对齐思路:训练模型做好事是否能像坏事一样泛化?研究人员使用涉及诚实、认知谦逊、可纠正性等特质的对话数据,覆盖健康、教育等领域,通过RL训练。实验发现:训练域内模型更诚实;在44个未见测试中,欺骗、谄媚、有害建议等均下降;面对对抗提示或恶意微调,模型更有韧性,且不损失正常指令能力。表明RL可强化道德底层逻辑。
In 2025, attackers stole corporate data from Microsoft 365 Copilot. The victim clicked nothing. They got an email. The A...
I am pleased and honored to announce that, on July 6, I'll be joining @OpenAI as leader of a new team called Strategic F...
Let's get ready, my friends. Negotiations with Trump appear to be going well, and Anthropic is confident that Fable 5 wi...
🚨 BREAKING: Anthropic is "confident that in the coming days [Fable 5] will become available again" - Anthropic's Intern...
Trump administration officials tell WIRED that if Anthropic wants to rerelease Fable 5, it will need to ensure the model...
Z.ai 推出 GLM 5.2 模型,1M 上下文窗口、MIT 许可开源权重,面向长周期编码智能体。Tensordyne 宣布推理系统,机架吞吐量达 NVIDIA NVL72 GB300 的 13 倍。MIT 研究显示代码量激增 300% 但产出仅增 30%。Google 发布 DiffusionGemma,26B MoE 仅激活 3.8B。Anthropic CEO Dario Amodei 呼吁紧急政策改革。OpenAI 收购 Ona,为 Codex 智能体提供安全云桌面。美国商务部长致信 Anthropic,就禁止外国用户使用 Mythos 和 Fable 做出说明。
Trump administration officials tell WIRED that if Anthropic wants to rerelease Fable 5, it will need to ensure the model...
Some recent articles have created a misleading narrative that I did not take Mythos seriously or tried to downplay the c...