使用 Swift 训练大型语言模型(LLM),第一部分:将矩阵乘法性能从 Gflop/s 提升至 Tflop/s · AI HOT