早期的igpu采用Gen 9架构,集成在整个cpu的基管芯上。Gen9是非常经典的架构,它的设计思想一直延续到Gen11 Gen12。即使是最近两年英特尔新发布的dgpuSG1ARC系列显卡和Flex GPU系列,其核心架构思路也都是继承自Gen9,无非是多加了EU或者一些媒体和渲染硬件。
EU是最终指令执行的单位,但EU不是最小的执行粒度。EU执行SIMD指令,即具有多个数据的单个指令。
然而,在EU提取的执行期间,在单个时钟周期中只能发出四个指令,即对应于两个FPU单元,发送和分支预测。FPU相当于ALU,支持SIMD,可以同时计算多个GRF中的数据。
数据端口负责从L3缓存读取数据,
L3缓存用于存储GDDR的数据。在Gen9中,SLM是L3的一部分。在最新的Gen12中,SLM与L3分离,并具有单独的SLM存储单元。
一般GPU通过GTI硬件接口与外部存储相连。当然,最新的GPU架构中也出现了HBM传输结构,以实现GDDR和GPU之间的高速互联。
发表评论