2024年6月:最新的通用大模型无法数清“strawberry”里有几个r。 2025年7月:最新的通用大模型在国际数学奥林匹克竞赛中获得金牌。 2026年5月:最新的通用大模型解决了“组合几何学中最著名的问题之一”。
June 2024: The latest general-purpose LLMs could not count the r's in strawberry. July 2025: The latest general-purpose LLMs get gold in the International Math Olympiad. May 2026: The latest general-purpose LLM solve one of the "best-known questions in combinatorial geometry"