# 单芯片混合精度浮点算力达 896TFLOPS，中昊芯英新一代 TPU 芯片「须臾」发布

- 来源：IT之家（RSS）
- 发布时间：2026-06-30 22:51
- AIHOT 分数：46
- AIHOT 链接：https://aihot.virxact.com/items/cmr0rzu7j04l1slolxz3ztu8w
- 原文链接：https://www.ithome.com/0/970/774.htm

## AI 摘要

中昊芯英发布新一代全自研 TPU 芯片「须臾」，单芯片混合精度浮点算力 896 TFLOPS，为上一代「刹那」3 倍；8-bit 推理算力 1792 TOPS。单卡功耗 600W，较传统芯片降低 50%。同步推出智算底座「泰则 2.0」，搭载两路 CPU 与 8 片 TPU，混合精度算力 7.168P，整机能耗为传统 GPU 服务器 80%。平台原生支持 PyTorch、vLLM、SGLang 等框架，已完成 Qwen、DeepSeek、GLM 等数十款大模型适配，满足政务、金融等行业安全合规要求。

## 正文

IT之家 6 月 30 日消息，中昊芯英今天宣布推出新一代全自研高性能 TPU AI 专用芯片「须臾」，软硬件一体化智算底座「泰则 2.0」也在今天同步亮相。

据介绍，须臾的单芯片混合精度浮点算力可达 896 TFLOPS，性能是上一代芯片「刹那」的 3 倍；8-bit 推理算力可达 1792TOPS，适配海量词元高并发推理场景。须臾的显存、芯片内部互联速率均有大幅提升，支持超长上下文。单卡额定功耗 600W，相比传统算力芯片功耗降低 50%，助力低碳数据中心建设。

同时，须臾的芯片 IP 核、专属指令集、底层算子加速库、整机系统软件均是完整自主研发，无海外核心技术依赖。满足政务、金融、电网等行业的安全合规要求。

而「泰则 2.0」则是高性能智算平台中标准的最小计算单元，它搭载两路高性能 CPU 处理器与 8 片高性能 TPU 处理单元，从物理形态上形成 1 台通用的 CPU 服务器外接 1 台高性能 TPU 算力加速设备，算力达 7.168P（IT之家注：混合精度），同等任务下整机能耗仅为传统 GPU 服务器的 80%。

此外，该平台从软件层面实现了全主流 AI 框架兼容，原生支持 PyTorch、vLLM、SGLang 等开发工具，训练场景适配 DeepSpeed、Megatron-LM 分布式套件；已完成 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言、多模态模型深度适配，开发者可快速完成模型迁移。