不再只是给AI换提示词,SIA框架连模型自己的权重都更新了,在三个任务里分别提升了56%、502%和91%加速,开源出来会让整个Agent开发范式重新思考。
hexoai开源了SIA(自我改进AI)框架。该框架展示了AI智能体不仅能优化其外部工作流(harness),还能通过任务反馈直接更新自身的模型权重,从而在领域知识和能力上实现自主提升,而非仅依赖人类提供的提示或工具改进。论文报告显示,SIA在LawBench基准上性能提升56.6%,在GPU kernels运行上耗时减少91.9%,在单细胞RNA去噪任务中相比基线提升502%。
重大发布——来自 @hexoai 的开源自改进框架。
它展示出,AI 智能体可以在看到自身任务结果后,同时改进自身的工作方式以及内部所掌握的知识。 也就是说,通过反复训练自身任务反馈,而不是依赖人类手动编写每一条策略。
今天的大多数智能体都是冻结的工人:你可以给它们更好的提示词、更好的工具、更好的重试规则和更好的代码,但实际的模型通常保持不变。
SIA(自改进 AI 框架)改变了外部工作流(称为 harness),也改变了模型的权重——即存储所学模式的内部设置。这意味着任务反馈会改变模型的内部参数,推动其向领域知识靠近。
该论文报告了在 LawBench 上 56.6% 的提升、GPU 内核运行时减少 91.9%,以及单细胞 RNA 降噪相较于基准线提升了 502%。