OCTOPUS:基于八面体参数化与最优平方误差量化的Transformer优化KV缓存 · AI HOT