五款前沿大型语言模型在1000条现实世界事实核查声明中,有67%的结论存在分歧 · AI HOT