ThriftAttention:用于长上下文FP4注意力的选择性混合精度 · AI HOT