5月22日

00:00

Anthropic：Research（发表成果 · 网页）

精选83

Anthropic 联合研究者测量 Claude Mythos Preview 漏洞利用能力

Anthropic 与 ExploitBench、ExploitGym 和 SCONE-bench 的研究者合作，测量了 Claude Mythos Preview 的漏洞利用能力。在 ExploitBench 的 V8 基准（41 个已修复漏洞）上，Mythos Preview 是唯一能可靠突破 V8 沙箱（从 T3 到 T2）的模型，并在超过一半的环境中实现突破；在 Baseline 和 Nudged 变体中共完成 21 个 CVEs 的任意代码执行（ACE），而其他所有模型的 ACE 数为零。Mythos Preview 还实现了近一半测试环境中的控制流劫持（T1）。该模型通过 Project Glasswing 谨慎发布，尚未开放通用访问。

Anthropic 安全/对齐论文/研究评测/基准

关联讨论 3 条

推荐理由：Mythos Preview 在三大漏洞基准上碾压式领先，第一次展示了前沿模型能端到端开发漏洞，安全基线从此改写，做安全的该认真读。

5月21日

22:42

Ethan Mollick@emollick

在科学领域，AI在寻找值得解决的有趣问题方面仍然表现不佳，尤其是在那些没有已知问题清单的领域。这一直是博士培养中最难教授的能力：否则你只能找到小问题，或是那些无法推动领域发展、无法泛化的问题等。

大佬观点论文/研究

17:03

Orange AI@oran_ge

AI自主破解80年数学难题，里程碑式突破

OpenAI未公开的内部通用推理模型，自主解决了数学家Erdős于1946年提出的平面单位距离问题，颠覆了近80年来学界对解法结构的普遍预期。该模型通过125页思维链，创新运用代数数论工具解决离散几何问题，实现了跨领域方法论突破。更值得注意的是，该模型并非专攻数学训练，其成果表明通用推理能力达到一定阈值后可能自然催生创造性，标志着AI在基础科学领域迈出了关键一步。

OpenAI: Today, we share a breakthrough on the planar unit distance problem, a famous open question first posed by Paul Erdős in ...

OpenAI 推理论文/研究

关联讨论 10 条

15:57

Greg Brockman@gdb

AI在数学领域实现了新知识生成的里程碑式突破。OpenAI模型解决了组合几何中悬而未决的著名难题--平面单位距离问题（Erdos 1946），首次证明通过AI方法可将该问题中单位距离对的数量提升至超线性规模（n^{1+δ}），超越了以往所有人类已知的线性构造。这标志着AI从解决已知问题迈向发现新数学的重要进展。该突破引发了研究者"难以入睡"的强烈反响，被视为AGI时代临近的信号。

Alex Dimakis: A breakthrough by OpenAI in a very famous Combinatorics problem, the Planar Unit Distance problem by Erdos 1946. The pro...

OpenAI 推理论文/研究

关联讨论 10 条

15:26

Rohan Paul@rohanpaul_ai

AI通用推理突破80年数学猜想

OpenAI的通用推理模型自主解决了一个自1946年以来未解的著名数学难题——平面单位距离问题。该模型没有采用专门为数学设计的定定理证明引擎，而是通过推理时增强计算能力，发现了优于传统网格结构的新构造方案。这标志着AI首次自主解决一个数学领域的核心开放问题。更重要的是，该模型能将几何问题与代数数论等深层理论连接，展示了通用人工智能在跨领域研究和拓宽人类认知边界方面的巨大潜力。

OpenAI: Today, we share a breakthrough on the planar unit distance problem, a famous open question first posed by Paul Erdős in ...

OpenAI 推理论文/研究

关联讨论 10 条