karminski-牙医@karminski3

2026-03-30 13:48·94天前

AI 摘要

开发者澄清该测试并非让大模型模拟数据库，而是要求其从零编写代码实现高性能向量数据库，重点考验体系结构、数据库、索引性能调优及 Agent 等编程能力。评测框架 vector-db-bench 已开源，详细测评视频即将发布。

不是的哈，并不是让大模型模拟数据库，而是让大模型从0写代码实现一个高性能向量数据库，主要考验大模型对体系结构，数据库，索引性能调优， Agent 等各项编程方面的能力. 还在剪视频，一会我放出详细测评. 可以看评测框架repo，开源的：https://github.com/KCORES/vector-db-bench

勃勃OC@karminski3 你这只是在测试recall和记忆力啊 agi真正需要的是推理能力,思考能力,原创能力,解决问题的能力现在还没有人可以超过claude

智能体数据/训练编码评测/基准

在 X 查看原推导出 Markdown

karminski-牙医@karminski3 · X

导出 Markdown

2026-03-30 13:48·94天前

在 X 看原推· x.com

AI 摘要

勃勃OC@karminski3 你这只是在测试recall和记忆力啊 agi真正需要的是推理能力,思考能力,原创能力,解决问题的能力现在还没有人可以超过claude

智能体数据/训练编码评测/基准

在 X 查看原推