RNG-Bench:多模态大语言模型在可控非马尔可夫游戏中的评估基准 · AI HOT