网络规模LLM预训练语料库叙事特征研究——基于Dolma与NarraBERT · AI HOT