加入收藏 | 设为首页 | 会员中心 | 我要投稿 186手机网 (https://www.186shouji.cn/)- 手机推荐、手机管家、手机助手、手机壁纸、5G!
当前位置: 首页 > 资讯 > 手机新闻 > 正文

英特尔发布锐炫A系列独显:相比核显游戏性能大幅升级,内容创作效率翻倍增加

发布时间:2022-03-31 00:11:55 所属栏目:手机新闻 来源:网络整理
导读:3月30日23点,英特尔正式公布了首批亮相的锐炫显卡详细信息。英特尔表示,锐炫A系列高性能移动端独立显卡包括覆盖主流游戏的锐炫3系列、性能游戏的锐炫5系列以及硬核性能游戏的锐炫7系列。

  由此也可以看出,Xe HPG微架构拥有很强的灵活性,英特尔可以通过叠加渲染切片来构建不同的SoC,最大可以做到8个,从而针对不同产品线提供丰富的产品。与此前的Xe LP微架构相比,Xe HPG每瓦性能提升了1.5倍。同时,渲染切片支持DX12 Ultimate,其中包括对所有图形固定功能块的改进,并且还有支持微软DXR和Vulkan RT的专用硬件光追单元。每个切片还配备了4个硬件光追加速器,用来支持实时光线追踪技术,能够显著提升3A大作的游戏画面表现和光影效果。

  Xe HPG的核心是Xe内核,作为Xe HPG微架构的组成模块,取代了此前集成显卡中EU(执行单元)。Xe内核包括16个256位宽的SIMD矢量引擎,为传统图形着色器执行大部分运算。矢量引擎主要负责传统图像处理的计算任务。而由于AI算法核心几乎完全围绕着一系列大型矩阵乘法和累加算法,英特尔在每个Xe内核构建了专用矩阵引擎来进行硬件加速。Xe内核包含16个矩阵引擎,每个引擎都是1024位宽。 

  矩阵引擎专为加速AI运算而生。同时为了满足矩阵、矢量和光线追踪单元的高带宽需求,英特尔在每个Xe内核中构建了一个192KB的大型本地内存。它可以根据每个工作负载的需要在L1缓存和共享本地内存(SLM) 之间动态分配。

  英特尔借助数据如何通过每个引擎流动,介绍了矩阵引擎的优势和规模。MAC是图形中使用的基本SIMD矢量指令,是矢量引擎的核心。 Xe-HPG执行8次并行运算乘法,然后执行8次并行加法(每个时钟总共16个Ops)。途中前排和后排的方框代表操作数,上下的方框代表累积的源和结果。DP4a是针对不需要32 位精度的AI计算所做的优化,工作原理是将所有32位输入分成8位块,然后独立的乘以这些块,总共是32次并行乘法(由紫色方块显示)。 接下来是32次累加或每个周期总共64次操作(比标准SIMD MAC性能提高了4倍)。矩阵引擎通过将乘法累加4深度流水线化,将其提升到一个新的水平。 与DP4a一样,每个操作数都被分成4个块,这些块被独立的相乘和累加——每个阶段64个操作(由紫色图块显示)。 通过4个阶段,每个时钟产生256次操作(比传统的32位SIMD MAC性能增加了16倍)。

(编辑:186手机网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读