英特尔发布锐炫A系列独显：相比核显游戏性能大幅升级，内容创作效率翻倍增加

发布时间：2022-03-31 00:11:55 所属栏目：手机新闻来源：网络整理

导读：3月30日23点，英特尔正式公布了首批亮相的锐炫显卡详细信息。英特尔表示，锐炫A系列高性能移动端独立显卡包括覆盖主流游戏的锐炫3系列、性能游戏的锐炫5系列以及硬核性能游戏的锐炫7系列。

由此也可以看出，Xe HPG微架构拥有很强的灵活性，英特尔可以通过叠加渲染切片来构建不同的SoC，最大可以做到8个，从而针对不同产品线提供丰富的产品。与此前的Xe LP微架构相比，Xe HPG每瓦性能提升了1.5倍。同时，渲染切片支持DX12 Ultimate，其中包括对所有图形固定功能块的改进，并且还有支持微软DXR和Vulkan RT的专用硬件光追单元。每个切片还配备了4个硬件光追加速器，用来支持实时光线追踪技术，能够显著提升3A大作的游戏画面表现和光影效果。

Xe HPG的核心是Xe内核，作为Xe HPG微架构的组成模块，取代了此前集成显卡中EU(执行单元)。Xe内核包括16个256位宽的SIMD矢量引擎，为传统图形着色器执行大部分运算。矢量引擎主要负责传统图像处理的计算任务。而由于AI算法核心几乎完全围绕着一系列大型矩阵乘法和累加算法，英特尔在每个Xe内核构建了专用矩阵引擎来进行硬件加速。Xe内核包含16个矩阵引擎，每个引擎都是1024位宽。

矩阵引擎专为加速AI运算而生。同时为了满足矩阵、矢量和光线追踪单元的高带宽需求，英特尔在每个Xe内核中构建了一个192KB的大型本地内存。它可以根据每个工作负载的需要在L1缓存和共享本地内存(SLM) 之间动态分配。

英特尔借助数据如何通过每个引擎流动，介绍了矩阵引擎的优势和规模。MAC是图形中使用的基本SIMD矢量指令，是矢量引擎的核心。 Xe-HPG执行8次并行运算乘法，然后执行8次并行加法（每个时钟总共16个Ops）。途中前排和后排的方框代表操作数，上下的方框代表累积的源和结果。DP4a是针对不需要32 位精度的AI计算所做的优化，工作原理是将所有32位输入分成8位块，然后独立的乘以这些块，总共是32次并行乘法（由紫色方块显示）。接下来是32次累加或每个周期总共64次操作（比标准SIMD MAC性能提高了4倍）。矩阵引擎通过将乘法累加4深度流水线化，将其提升到一个新的水平。与DP4a一样，每个操作数都被分成4个块，这些块被独立的相乘和累加——每个阶段64个操作（由紫色图块显示）。通过4个阶段，每个时钟产生256次操作（比传统的32位SIMD MAC性能增加了16倍）。

（编辑：186手机网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/4

首页

尾页

苹果2023年新品预测：	iOS 16.1 Beta 2：电池
苹果新专利显示折叠式	iPhone 15系列除了“大