中昊芯英发布新一代全自研 TPU 芯片「须臾」,单芯片混合精度浮点算力 896 TFLOPS,为上一代「刹那」3 倍;8-bit 推理算力 1792 TOPS。单卡功耗 600W,较传统芯片降低 50%。同步推出智算底座「泰则 2.0」,搭载两路 CPU 与 8 片 TPU,混合精度算力 7.168P,整机能耗为传统 GPU 服务器 80%。平台原生支持 PyTorch、vLLM、SGLang 等框架,已完成 Qwen、DeepSeek、GLM 等数十款大模型适配,满足政务、金融等行业安全合规要求。