AI 摘要
开发者澄清该测试并非让大模型模拟数据库,而是要求其从零编写代码实现高性能向量数据库,重点考验体系结构、数据库、索引性能调优及 Agent 等编程能力。评测框架 vector-db-bench 已开源,详细测评视频即将发布。
不是的哈, 并不是让大模型模拟数据库, 而是让大模型从0写代码实现一个高性能向量数据库, 主要考验大模型对体系结构, 数据库, 索引性能调优, Agent 等各项编程方面的能力. 还在剪视频, 一会我放出详细测评. 可以看评测框架repo,开源的:https://github.com/KCORES/vector-db-bench
@karminski3 你这只是在测试recall和记忆力啊 agi真正需要的是推理能力,思考能力,原创能力,解决问题的能力 现在还没有人可以超过claude