Tenstorrent 发布 RISC-V CPU 内核 TT-Ascalon S,单位面积性能达旗舰 IP 的 140%
阅读原文· ithome.comTenstorrent 发布 RISC-V CPU 内核 TT-Ascalon S,以旗舰核心 Ascalon X 一半面积实现其 70% 性能,单位面积性能达 1.4 倍。该内核为乱序超标量 4 宽解码,符合 RVA23 配置文件,IPC 每 GHz 在 SPECint2006 中得 15 分,单集群可扩展至 8 核。面向代理式 AI,优化智能体混合执行模式。在 Kimi K2.6 上达 900 Token/s/user(GPU 三倍),DeepSeek-R1-0528 671B 达 400+ Token/s/user,LTX 2.3 Fast 视频生成速度为 GPU 四倍。
IT之家 7 月 1 日消息,由知名芯片设计师 Jim Keller 领导的 Fabless 企业 Tenstorrent 当地时间昨日在日本东京举行的 TT-Deploy JP 大会上发布了 RISC-V CPU 内核设计 TT-Ascalon S,这一 IP 兼顾性能与面积优化。

作为 Ascalon RISC-V 处理器家族的最新成员,TT-Ascalon S 以旗舰核心 Ascalon X 一半的面积实现了后者 70% 的性能,带来了 1.4 倍的单位面积性能。
该 IP 是一款乱序超标量 4 宽解码内核,符合 RVA23 配置文件,具备单个 256b 矢量单元,拥有 32KB 指令缓存和 64KB 数据缓存,IPC 方面每 GHz 在 SPECint2006 中可得到 15 分。单个 TT-Ascalon S 集群可扩展到 8 个内核,拥有可配置的共享 L2 缓存。
Tenstorrent 表示 TT-Ascalon S 面向代理式 AI,针对智能体运行时那种混合型、分支密集、工具关联的典型执行模式进行了优化,有助于实现更可预测的执行;同时也可满足高能效服务器、网络与存储 SoC、数据中心边缘部署等场景的需求。

Tenstorrent 在本次大会上还展示了其 Galaxy Blackhole“超级集群”的实力:其在 Kimi K2.6 上可实现 900 Token/s/user,是 GPU 的三倍;在 DeepSeek-R1-0528 671B 上达到 400+ Token/s/user;对于 LTX 2.3 Fast,能以 GPU 四倍的速度生成 6 秒 24fps 视频。