Anthropic示警:AI执行力逼近甚至超过人类,方向把控等方面人类仍具优势
阅读原文· ithome.comAnthropic于6月5日发布博文称,AI正加速自身研发,走向递归自我改进。能力上,Claude独立完成任务时长约每4个月翻倍:Claude Opus 3(2024年3月)约4分钟,Sonnet 3.7(2025年3月)约1.5小时,Opus 4.6(2026年3月)达12小时;Mythos Preview连续工作至少16小时。SWE-bench成绩2年内从个位数逼近饱和。截至2026年5月,Anthropic超80%合入代码由Claude编写,工程师人均日代码量较2024年增8倍。2026年4月Claude完成超800项修复,将一类API错误压至1/1000。文章强调人类优势仍在研究判断与方向把控,AI执行逼近甚至超过人类。
IT之家 6 月 10 日消息,Anthropic 于 6 月 5 日发布博文,指出人工智能(AI)已开始加速 AI 本身研发,正迈步走向递归自我改进。
IT之家注:递归自我改进(recursive self-improvement)是指 AI 系统能够自主设计、训练、评估并迭代自己的下一代版本,形成“自己改进自己”的闭环。
这一概念被视为 AI 发展中的关键分水岭,一旦闭环成立,技术进步速度可能更多取决于算力、基础设施与验证机制,而不再主要受限于人工研发节奏。
该博文强调这一阶段尚未到来,也并非必然发生,但相关信号已比多数机构准备得更早、更强。
首先是能力加速。Anthropic 援引公开基准称,AI 可稳定独立完成任务的时长约每 4 个月翻倍:
2024 年 3 月,Claude Opus 3 可完成约 4 分钟的软件任务;
2025 年 3 月,Claude Sonnet 3.7 可处理约 1.5 小时任务;
2026 年 3 月,Claude Opus 4.6 已能处理 12 小时任务。