Berryxia.AI@berryxia

2026-05-27 20:52·36天前

AI 摘要

近期两个事件表明，前沿模型在高级抽象层面的可靠推理能力已跨越临界点。一是Anthropic发布了Claude Mythos Preview，其网络攻防能力过强，因此未公开，仅开放给合作伙伴用于防御。二是OpenAI的内部通用推理模型成功推翻了数学家Paul Erdős提出的一个猜想。两者共同显示，模型稳定处理的推理单元已从句子层级跃升至能维持核心论点、建立逻辑结构的“段落”与“整篇论证”层级，标志着能力的关键跃迁。

这次AI 跨过了一个"奇点"！

最近有两个事件值得重点关注：

•2026 年 4 月 7 日：Anthropic 发布了 Project Glasswing，同时推出了 Claude Mythos Preview。这是一个尚未正式公开的前沿模型，其网络攻防能力已经强到一定程度。

以至于 Anthropic 没有选择公开，而是只开放给合作伙伴，用于防御性用途。

•2026 年 5 月 20 日：OpenAI 宣布，其内部的一个通用推理模型，成功推翻了数学家 Paul Erdős 在 1946 年提出的一个平面单位距离问题猜想。

这两件事看起来没什么关系，但其实指向了同一个现象：前沿模型在更高抽象层面的可靠推理能力，已经迈过了一个临界点。

我说的这个"门槛"，指的是模型能够稳定处理的推理单元在不断上移。

简单来说，语言的抽象层级大致是这样的：字符 → 词语 → 短语 → 句子 → 段落 → 整篇文章 → 完整知识体系。

以前的模型可能连句子都组织不好，现在的顶级模型已经能稳定地处理"段落"和"整篇论证"了。

写一篇文章不只是接龙下一个句子，而是要维持一个核心观点、挑选合适的例子、建立逻辑连接，并让每一部分都服务于整体结构。

Anthropic 的 Mythos 和 OpenAI 的内部模型，正是这种能力跃迁的代表。

它们不再只是针对单个漏洞或单个数学引理进行操作，更是能够把这些零散的片段串起来，形成完整的攻击链或数学证明。

Claude Mythos Preview 是目前 Anthropic 最强、规模也可能是最大的模型，在编码能力上表现非常突出，多数基准测试都超过了 OpenAI 最新的 GPT-5.5。

但最值得注意的是它的网络安全能力，在进攻性安全评测中表现过于亮眼，导致 Anthropic 最终决定不公开这个模型，作为仅提供给关键基础设施企业用于防御。

Lisan al Gaibhttp://x.com/i/article/2058529613370802177

Anthropic OpenAI 大佬观点安全/对齐

在 X 查看原推导出 Markdown

Berryxia.AI@berryxia · X

60导出 Markdown