三级缓存是为读取二级缓存后未命中的
数据设计的—种
缓存,在拥有三级缓存的
CPU中,只有约5%的数据需要从内存中调用,这进一步提高了CPU的效率。其运作原理在于使用较快速的
储存装置保留一份从慢速储存装置中所读取数据且进行拷贝,当有需要再从较慢的储存体中读写数据时,缓存(cache)能够使得读写的动作先在快速的
装置上完成,如此会使系统的响应较为快速。
缓存介绍
电脑缓存是当cpu在读取数据的时候,先是从缓存文件中查找,然后找到之后会自动读取,再输入到cpu进行处理,当然如果没有在缓存中找到对应的缓存文件的话,那么就会从内存中读取并且传输给cpu来处理。当然这样的话需要一定的时间所以会很慢。等cpu处理之后,就很快把这个数据所在的数据块保存在缓存文件中,这样的话在以后读取这项数据的时候就直接在缓存中进行,不要重复在内存中调用并读取数据了。
缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是出于CPU芯片面积和成本的因素来考虑,缓存都很小。
缓存分类
一级缓存都内置在CPU内部并与CPU同速运行,可以有效的提高CPU的运行效率。一级缓存越大,CPU的运行效率越高,但受到CPU内部结构的限制,一级缓存的容量都很小。
二级缓存,它是为了协调一级缓存和内存之间的速度。cpu调用缓存首先是一级缓存,当处理器的速度逐渐提升,会导致一级缓存就供不应求,这样就得提升到二级缓存了。二级缓存它比一级缓存的速度相对来说会慢,但是它比一级缓存的空间容量要大。主要就是做一级缓存和内存之间数据临时交换的地方用。
三级缓存是为读取二级缓存后未命中的数据设计的—种缓存,在拥有三级缓存的CPU中,只有约5%的数据需要从内存中调用,这进一步提高了CPU的效率。其运作原理在于使用较快速的储存装置保留一份从慢速储存装置中所读取数据并进行拷贝,当有需要再从较慢的储存体中读写数据时,缓存(cache)能够使得读写的动作先在快速的装置上完成,如此会使系统的响应较为快速。
三级缓存分类
Cache(三级缓存),分为两种,早期的是外置,以后的升级产品都是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低
内存延迟,同时提升大数据量计算时
处理器的性能。降低内存延迟和提升大数据量计算能力对游戏软件都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。如具有较大L3缓存的配置利用
物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。
其实最早的L3缓存被应用在
AMD发布的K6-III
处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和
系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是
英特尔为服务器市场所推出的
Itanium处理器。接着就是P4EE和
至强MP。Intel还打算推出一款9MB L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心Itanium2处理器。
但基本上L3缓存对
处理器的性能提高显得不是很重要,如配备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。
二级缓存价格
首先来算一笔小账(2009年02月),关于Intel处理器的二级缓存:
二级缓存512K的赛扬双核E1200只要270元,二级缓存1M的
奔腾双核E2140售价为370元,需要花费100元来购买这额外的512K缓存;二级缓存2M的酷睿2 E4300或者奔腾双核E5200的售价在550元以上,这就意味着得再出200元来购买这额外的1M二级缓存;二级缓存3M的酷睿2E7200售价750元,又得掏出200元来购买这额外的1M二级缓存;二级缓存4M/6M的酷睿2系列处理器依次类推……
不管酷睿2、奔腾双核还是赛扬双核,它们的核心架构其实是完全相同的,频率可以随意更改,唯一不同的就是二级缓存。可以毫不夸张地说,Intel就是在卖二级缓存,200块钱1M。
事实上历年来Intel都是通过二级缓存的大小来划分产品线,初期只有奔腾和赛扬两种规格,到了酷睿2时代Intel达到了登峰造极的境界:仅仅是双核产品就拥有512K、1M、2M、3M、4M、6M多达六个版本,四核产品也有4M、6M、8M、12M四个版本,令人眼花缭乱!Intel细分产品线的策略在每个价位都提供了优秀的产品,但也给广大用户制造了前所未有的困惑:到底多大二级缓存才够用?
二级缓存发展
纵观英特尔处理器的发展,且不论核心架构如何改变,以级数增长的二级缓存是最直观的。奔腾4时代0.18微米工艺的Willamette拥有256K二级缓存,0.13微米的
Northwood核心拥有512K,后期0.09微米的Prescott一度增大到1M。到了酷睿时代,在架构发生了翻天覆地的变化的同时,65纳米工艺让二级缓存再次翻倍,即便是刚推出时低端酷睿的代表Allendale核心,二级缓存也达到了2M,高端酷睿更是拥有4M的二级缓存。进入45nm工艺后,二级缓存的容量进一步加大,高端E8X00系列二级缓存达到了惊人的6M,低端E7X00也达到了3M之多,至此Intel从512K到6M甚至12M实现了二级缓存的“无缝衔接”。
市场中没有永远的落后者,当AMD进入45nm时代,Phenom II的到来,AMD也能通过核心数量和缓存的搭配,设计出定位不同市场的CPU。
对性能的影响
而三级缓存对性能影响时高时低。在游戏方面,提升三级缓存的容量对游戏的性能影响很大,虽然对一般家用机没有什么用,但是如果是网吧机或者是发烧机提升三级缓存的容量还是会有显著的性能提升的。虽然三级缓存也能为PC带来显著的性能提升,但毕竟三级缓存是作用于服务器的,对PC来说,三级缓存还是只能做个辅助作用,在其他参数相同的情况下,三级缓存容量越大,则性能更好,如果其他参数不相同的话,这时三级缓存的作用就不明显了。
不管三级缓存的作用大不大,它毕竟也是为电脑发展作出贡献的参数之一。
发展历程
最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MBL3缓存的Itanium2处理器,和以后24MBL3缓存的双核心Itanium2处理器。
但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MBL3缓存的XeonMP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比单纯增加缓存带来更有效的性能提升。
纵观AMD
Phenom处理器的发展,核心架构的改进相对有限,而三级缓存的变化是最直观的。从早期Phenom的2MB三级缓存,猛增至Phenom II的6MB三级缓存,而为了市场的需要,又推出了采用Phenom II架构但没有三级缓存的Athlon X4。而
AMD处理器独有的双核、
三核、
四核架构,加上缓存的不同搭配,一时间,
AMD处理器呈现出门丁兴旺的景象。
对于AMD的用户来说,多是追求性价比的用户,而AMD
处理器这样的现象,对用户既是好事也是坏事,好是用户的选择更多了,坏的是用户对CPU的选择无所适从。而细细观察,AMD处理器百龙争宠的现象,无外乎是核心与缓存搭配的结果。
与65nm Phenom相比,新一代
45nmPhenom II最大的变化就是升级到了45nm SOI沉浸式光刻生产工艺,好处就是主频更高、功耗更低、
集成度更高,特别是三级缓存从2MB猛增到了6MB!
三级缓存翻了三倍,自然需要付出一定的代价,通过Phenom和Phenom II芯片示意图的对比,就能略知一二了:
Brcelona/Agena集成了4.68亿个晶体管,核心(Die)面积大约285平方毫米,Shanghai/Deneb的晶体管增加了62%,多达7.58亿个,但核心面积却减小了9.5%,只有258平方毫米,新工艺的好处可见一斑。
晶体管数量增加如此之多主要就是因为三级缓存的大幅
扩容,这部分在整个核心里的面积比例也从大约六分之一提高到了足有三分之一。
其它
AMD关于三级缓存的态度
第一,三级缓存容量在
服务器领域的作用更明显,不过如果服务器和桌面
处理器采用不同的架构,必然会提高生产难度和成本,故而带到了桌面上;
第二,在桌面上,三级缓存从2MB增加到6MB可以带来大约5%的性能提升,实际测试也证明了这一点;
第三,从前边的数据看出,三级缓存增加了两倍,但得益于生产工艺的改进,核心面积反而更小了,成本也更低。
熟悉Intel
NehalemCore i7(
酷睿i7)处理器的人一定想到了,Intel也使用了同样的大容量共享三级缓存设计,且容量多达8MB,也占据了整个核心面积的三分之一左右,不同之处在于Core i7每核心
一级缓存和
二级缓存只有64KB和256KB,都比Phenom/Phenom II少一半。
有趣的是,同样基于
45nm工艺的Core i7集成了7.31亿个晶体管,比Phenom II略少,但核心面积却稍大一些,为263平方毫米。
从成本的角度来算一笔帐,通过Phenom II X4的芯片结构示意图可以看出,三级缓存所占芯片面积比两颗核心以及L1L2加起来还要多,如此一来即便是
屏蔽了一颗核心的Phenom II X3,其成本也并不低,这对于主打性价比路线的AMD来说,利润损失会比较大。
于是,AMD在发布Phenom II X4、X3
处理器之后,也在积极准备定位主流中低端的产品,用以取代征战多年的Athlon 64 X2系列。由于L3成本较高,因此AMD把Phenom II X4的三级缓存彻底删去(注意不是屏蔽),Athlon X4便与大家见面了。
如此一来,人们就可以通过对比评测,轻松了解到AMD的Phenom II架构处理器中,6M L3对性能的贡献有多大,也能提前了解拥有完整L3但却少一颗核心的Phenom II X3强呢,还是没有L3的但却有四颗核心的Athlon X4强?相信很多朋友都会挺感兴趣的。
AMD已上市的Phenom II 920(6M L3)和Phenom 9850(2M L3),还有一颗神秘的没有L3的Athlon X4工程样品,让他们都工作在200*14=2.8GHz频率下,这样就能直观的对比6M/2M/0M三级缓存所造成的性能差异。
另外还加入了刚刚发布的Phenom II X3 720
处理器,它拥有完整的6M三级缓存,但少一颗核心,这样可以反映出多一颗核心的贡献大还是6M L3的贡献更大?测试结果表明,从CPU架构上看,缓存对性能的影响很大,但Athlon X4的表现,尤其是在大量运算过程中,力压上代拥有完整3级缓存的9850,
内存带宽的优势不言而喻。
Intel6(16MB三级缓存)核处理器
首先推向市场的是高端桌面PC处理器品牌酷睿i7和针对高能效服务器市场的Nehalem-EP,预计2009年第四季度即可上市。随后,新架构产品会陆续推出,包括针对可扩展服务器市场的Nehalem-EX,桌面市场的Havendale和Lynnfield,移动市场的Auburndale和Clarksfield,预计都在2009年下半年登场。
下一代
Core微架构(Nehalem)处理器均从4核起跳,但同时采用了Hyper-Threading技术,可同时处理8个线程。Core i7支持Turbo Mode和Power Gates技术,在不需要多线程运算时,可令闲置核心完全关闭。各个核心可以工作在不同的电压/频率下,单独提高某一核心频率的Turbo Mode模式可显著提升单线程应用性能。
Intel还同时发布了首款6核心处理器,针对多路服务器市场的“Dunnington”Xeon X7460,内建16MB L3缓存,在2008年9月上市,是Intel在转向Nehalem微架构之前的最后一颗45nm酷睿2微架构处理器。采用该处理器的服务器机型已经打破了多项世界纪录,包括8路48核的IBM System x3950 M2服务器在TPC Benchmark C数据库测试中首次突破100万tpmC,4路系统惠普Proliant DL580 G5打破TPC-C纪录,戴尔PowerEdge R900打破TPC-E纪录,Sun Fire X4450打破SPECjbb 2005纪录,富士通西门子PRIMERGY RX600 S4打破SPECint_rate2006纪录。[1]
无三级缓存AMD 45nm处理器
在工艺进步、技术完善后,AMD的45nm新桌面处理器将拥有齐全的五个子系列,其中拥有三级缓存的属于Phenom II品牌,精简掉三级缓存的则仍沿用Athlon(不知道为何不是Athlon II)。至于Sempron,很快就会淘汰了。
最高端的“Phenom II X4 900/800”系列四核心代号Deneb,二级缓存4×512KB,三级缓存前者6MB、后者精简到4MB。这两个系列都将于明年1月份率先发布,其中首批两款AM2+接口的Phenom II X4 940/920会在1月8日的CES 2009大展上首发,之后的全部改用AM3接口。
三核心系列“Phenom II X3 700”代号Heka,二级缓存3×512KB,三级缓存为完整的6MB,将在明年2月份跟进。
除了这两个系列,AMD还准备了没有三级缓存的版本,而且在设计之初就没有加入三级缓存,而不是简单的屏蔽版本,不会造成浪费。
其中四核心将是“Athlon X4 600”系列,代号Propus,二级缓存4×512KB,三核心是“Athlon X3 400”系列,代号Rana,二级缓存3×512KB,二者都会在明年4月份登场。
最后是代号Regor的“Athlon X2 200”系列双核心,二级缓存2×1MB,比其它系列多出一倍,不过发布时间也最晚,要到明年6月才会推出,目的是避免和现有的旧架构型号产生冲突。
芯片组方面,现在的AMD 7系列主板在更新BIOS就能支持新处理器,具体视主板厂商的技术支持而定。另外AMD将在2009年上半年推出新的8系列
整合芯片组,其中RS880和RS880C搭配SB750南桥,RS880D和RS890搭配下一代SB800。[2]
一级、二级和三级缓存谁更重要
一级最重要,但是现在CPU的
一级缓存几乎都一样,所以忽略。
二级缓存的话对于Intel的CPU是很重要的,Intel的CPU的二级缓存越大性能提升非常明显,而AMD的CPU虽然二级缓存也很重要,但是二级缓存大小对AMD的CPU的性能提升不是很明显。
三级缓存其实只是做了个辅助的作用,除了服务器,其实对大多数家庭机没什么用的,内存还是很重要的,但如果运行大型程序或游戏来说三级缓存就显得重要了,目前新型CPU已经有三级缓存了。
所以说现在衡量CPU性能除了频率外,还有一个核心数量,再到缓存的大小, 从理论上讲,二级缓存越大
处理器的性能越好,但这并不是说
二级缓存容量加倍就能够处理器带来成倍的性能增长。2006年,CPU处理的绝大部分数据的大小都在0-256KB之间,小部分数据的大小在256KB-512KB之间,只有极少数数据的大小超过512KB。到2009年已经有1M,2M的了。所以只要处理器可用的一级、
二级缓存容量达到256KB以上,那就能够应付正常的应用;512KB容量的二级缓存已经足够满足绝大多数应用的需求。
主频、二级缓存和三级缓存哪个更重要
缓存的工作原理是当CPU要读取一个数据时,首先从缓存中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不必再调用内存。
正是这样的读取机制使CPU读取缓存的命中率非常高(大多数CPU可达90%左右),也就是说CPU下一次要读取的数据90%都在缓存中,只有大约10%需要从内存读取。这大大节省了CPU直接读取内存的时间,也使CPU读取数据时基本无需等待。总的来说,CPU读取数据的顺序是先缓存后内存。
cpu的二级缓存和三级缓存的大小,并不是衡量cpu的性能的唯一标准,还得看cpu的主频,制做流程,比如说45纳米的就比65纳米的好,还要稍微注意一下它支持的指令集,还得看是谁的产品,二级缓存对于intel的产品来说很重要但二级缓存对于AMD来说就不像intel那么重要,因为AMD除了有二级缓存之外还有三级缓存。
要说主频、二级缓存和三级缓存哪个更重要,这个问题完全还要看你使用电脑追求什么了,主要执行什么任务。主频高运算速度快,二级缓存(L2)和三级缓存(L3)起到内存和CPU之间的缓冲作用,缓解内存和CPU速度不匹配问题会影响到CPU执行的效率。所以大的L2、L3在CPU长时间大量数据处理的时候效率会比较高。高主频在短时间内少量数据的处理上会比较快,其实3项这都很重要 ,哪一项达不到一定标准都会出现瓶颈效应。
IntelXeon 7100系列CPU(16MB三级缓存)
Intel正式发布了针对高端服务器的最新双核
Xeon处理器,代号Tulsa的Xeon 7100系列。该处理器依然基于上一代NetBurst架构,但在性能和功耗表现方面都有不小的改进。
Xeon 7100系列CPU配置
Xeon 7100系列CPU核心代号为Tulsa,双核心设计,每个核心配备了1MB L2(二级)缓存,16MB L3(三级)缓存。该处理器还支持超线程(HT : Hyper-Threading)、虚拟化(Intel Virtualization Technology)以及Intel缓存安全技术(Cache Safe Technology),3.0GHz主频以上的Xeon 7100系列处理器TDP功耗为150W,3.0GHz以下的TDP为95W。
Xeon 7100系列CPU规格
CPU编号主频FSBL2缓存L3缓存 千颗价格
7140M 3.40GHz 800MHz 2×1MB 16MB 1980
7140N 3.33GHz 667MHz 2×1MB 16MB 1980
7130M 3.20GHz 800MHz 2×1MB 8MB 1391
7130N 3.16GHz 667MHz 2×1MB 8MB 1391
7120M 3.00GHz 800MHz 2×1MB 4MB 1177
7120N 3.00GHz 667MHz 2×1MB 4MB 1177
7110M 2.60GHz 800MHz 2×1MB 4MB 856
7110N 2.60GHz 667MHz 2×1MB 4MB 856
Xeon 7100系列处理器支持667和800MHz PSB总线,与8501芯片组兼容,现有的服务器平台可以很轻松的升级到新处理器。此外Intel公司表示,65nm工艺发展的十分顺利,目前65nm产品的出货比例已经超越90nm