STARE:基于惊喜度的Token级优势重加权实现策略熵稳定 · AI HOT