近期两个事件表明,前沿模型在高级抽象层面的可靠推理能力已跨越临界点。一是Anthropic发布了Claude Mythos Preview,其网络攻防能力过强,因此未公开,仅开放给合作伙伴用于防御。二是OpenAI的内部通用推理模型成功推翻了数学家Paul Erdős提出的一个猜想。两者共同显示,模型稳定处理的推理单元已从句子层级跃升至能维持核心论点、建立逻辑结构的“段落”与“整篇论证”层级,标志着能力的关键跃迁。
这次AI 跨过了一个"奇点"!
最近有两个事件值得重点关注:
•2026 年 4 月 7 日:Anthropic 发布了 Project Glasswing,同时推出了 Claude Mythos Preview。 这是一个尚未正式公开的 前沿模型,其网络攻防能力已经强到一定程度。
以至于 Anthropic 没有选择公开,而是只开放给合作伙伴,用于防御性用途。
•2026 年 5 月 20 日:OpenAI 宣布,其内部的一个通用推理模型,成功推翻了数学家 Paul Erdős 在 1946 年提出的一个平面单位距离问题猜想。
这两件事看起来没什么关系,但其实指向了同一个现象:前沿模型在更高抽象层面的可靠推理能力,已经迈过了一个临界点。
我说的这个"门槛",指的是模型能够稳定处理的推理单元在不断上移。
简单来说,语言的抽象层级大致是这样的: 字符 → 词语 → 短语 → 句子 → 段落 → 整篇文章 → 完整知识体系。
以前的模型可能连句子都组织不好,现在的顶级模型已经能稳定地处理"段落"和"整篇论证"了。
写一篇文章不只是接龙下一个句子,而是要维持一个核心观点、挑选合适的例子、建立逻辑连接,并让每一部分都服务于整体结构。