# 英特尔携手 AMD 发布 ACE 架构提升 AI 性能，x86 矩阵计算密度提升 16 倍

- 来源：IT之家（RSS）
- 发布时间：2026-04-30 14:55
- AIHOT 分数：51
- AIHOT 链接：https://aihot.virxact.com/items/cmol58enb0091slc5xt7uukd2
- 原文链接：https://www.ithome.com/0/945/427.htm

## AI 摘要

英特尔与AMD联合发布人工智能计算扩展（ACE）白皮书，将其确立为x86架构的标准矩阵加速方案。该扩展旨在突破现有SIMD扩展在计算密度与扩展性上的局限，通过引入基于外积运算的矩阵加速机制，无缝集成AVX10。据白皮书数据，在消耗相同数量输入向量的前提下，ACE的计算密度比等效的AVX10乘加运算高出16倍。它支持INT8、FP8、BF16等主流AI数据格式，并计划适配PyTorch、TensorFlow等机器学习框架，目标是为从笔记本电脑到超级计算机的全场景提供高效的矩阵加速支持。

## 正文

IT之家 4 月 30 日消息，科技媒体 Wccftech 昨日（4 月 29 日）发布博文，报道称英特尔和 AMD 联合发布人工智能计算扩展（ACE）白皮书，将其定位为 x86 架构的标准矩阵加速方案。

现有 AVX10 等 SIMD 扩展虽能处理矩阵运算，但在计算密度与扩展性上存在局限，ACE 正是为突破这一瓶颈而生。

ACE 作为 x86 指令集的关键扩展，核心目标是大幅提升矩阵乘法性能、扩展性与能效。矩阵乘法作为神经网络与大语言模型的核心计算模块，其效率直接决定 AI 工作负载的表现。

技术层面，ACE 引入基于外积运算（outer product operation）的矩阵加速机制，无缝集成 AVX10。白皮书数据显示，在消耗相同数量输入向量的前提下，ACE 外积运算的计算密度比等效的 AVX10 乘加运算（multiply-accumulate operation）高出 16 倍。

ACE 在底层计算方面，支持 INT8、OCP FP8、BF16 等主流 AI 数据格式，其设计兼顾灵活性与扩展性，旨在构建覆盖笔记本电脑到超级计算机的全场景矩阵加速框架。

在软件生态方面，ACE 集成低精度 GEMM 等深度学习和高性能计算库，并启动适配 NumPy、SciPy 等 Python 库以及 PyTorch、TensorFlow 等主流机器学习框架。

IT之家附上参考地址

The AI Compute Extensions (ACE) for x86
