gk104
英伟达开发的一个显卡架构
gk104是英伟达开发的一个显卡架构,中文名开普勒架构。
介绍
开普勒架构会使用和费米架构截然不同的流处理器设计,但同时又保留类似的“等级制度”,从而确保更高的并行度,强化通用计算能力。看来,NVIDIA的确是认准了并行计算这条路,准备坚定不移地走下去。
根据说法,GK104 SIMD体系设计中有4个图形处理集群(GPC),每个集群内划分为2个流式处理器阵列(SM),然后每个阵列内包含192个流处理器(CUDA),这就是总共192×2×4=1536个流处理器。
纹理和几何方面,每个SM阵列中配备8个纹理单元,总计128个,ROP光栅单元则是整个核心32个。 显存方面和之前说的一样,256-bit位宽,2GB GDDR5容量。
再看频率,核心与流处理器同步定在950MHz,不再像这么多年来那样异步运行,而显存频率比费米时代有所改进但还是没AMD那么快,等效为5000MHz,带宽160GB/s——相比于Radeon HD 7970 264GB/s差了不少。
浮点性能上,GK104单精度最高2.9TFlops,双精度最高486GFlops,二者比例大约为6:1。相比之下,Radeon HD 7970的单双精度浮点性能分别为3.79TFlops、947GFlops,基本上是4:1。
最后,同样采用28nm工艺的GK104核心面积估计约为340平方毫米,但具体晶体管数量未知(传闻多达60亿个但太离谱了)——AMD Tahiti核心晶体管43.1亿个,面积365平方毫米。
参考资料
最新修订时间:2020-06-19 20:42
目录
概述
参考资料