北方群岛
Radeon HD 6000系列产物
Radeon HD 6000系列是一次妥协的产物,仍旧使用R600以来的核心架构体系,制造工艺也还是40nm,不过在诸多内部细节和技术特性方面进行了广泛的增强,无论性能还是功能都大大优于Radeon HD 5000系列,而且产品良率也完全不再是问题。
命名解析
Radeon HD 6000系列的来历可以说是相当曲折。按照AMD最早的计划,Radeon HD 5000系列之后要转向新的核心架构,代号“南方群岛”(Southern Islands),制造工艺也会更新,但是无奈负责代工的台积电40nm工艺花了很长时间才成熟起来,又突然决定取消32nm工艺而直奔28nm,AMD随之被迫更改了产品研发和发布计划,于是就有了新的“北方群岛”(Northern Islands),也就是Radeon HD 6000系列。
但是在产品编号上,AMD耍了一个小小的花招。尽管还是一目了然的四位数字,但并不只是简单地把首位从5换成6。上代首发的Radeon HD 5800系列面向的是高端市场,而现在所谓的Radeon HD 6800系列并不完全与之对应,从市场区间划分上来说其实是Radeon HD 5700系列的后辈。等到下个月,AMD还会推出更高端型号Radeon HD 6970、Radeon HD 6950,开发代号“Cayman”,继续稳固高端市场地位;年底的时候,我们就将看到新的旗舰型单卡双芯产品Radeon HD 6990,开发代号“Antilles”。这一次,AMD同样打算速战速决,不给对手任何喘息之机。
这种新的命名方式一方面源于AMD在显卡市场上掌握着绝对的主动权,有充足的空间按照自己的意愿调整产品线,另一方面也是因为新系列产品的性能表现有了长足的进步,有足够的资本将自己提升一个档次。
Barts
定位解析:直击GTX460
Radeon HD 5000/6000系列高端产品的性能顺序可以排列为:6990>5970>6970>6950>5870>6870>5850>6850>5770>5750。它也直接证明新的编号体系并非只是个数字游戏而已。
Radeon HD 6870的性能其实稍弱于Radeon HD 5870,但是价格上也要便宜很大一个档次,因此性价比同样再次有了明显的提高,延续了AMD高端显卡近年来的一贯趋势。
Barts: Radeon HD 6800系列、Cayman: Radeon HD 6900系列将会共同取代Cypress:Radeon HD 5800系列,以更丰富的产品型号对市场进行细化,满足不同价位消费则会的需要;Radeon HD 5700系列则并不会立即消失,而是将伴随新系列继续销售,有消息称可能会改名为Radeon HD 6700系列,但是AMD还没有做出最终决定。
架构与规格:延续传统、全面增强
架构方面之前曾有各种各样的传闻,但是受到各方面限制,特别是台积电代工工艺的落后,Radeon HD 6800系列所属的“北方群岛”家族并没有在核心架构方面进行大规模的重新设计,而是基本沿用了R600以来的4D+1D式SIMD流处理器结构,并在诸多细节上做了优化和增强,AMD称之为“第二代DX11设计”。总的来说,北方群岛更像是一次承前启后的过渡,再往后的下一代我们才会看到基于28nm新工艺的新架构,不出意外就是同样风传了很久的“南方群岛”。
按照AMD的说法,Radeon HD 6000系列架构重点有五大方面的进步:
1、更强的单位面积性能,比上代提升最多35%;
2、第二代DX11设计,更快的曲面细分和几何吞吐;
3、新的和改进的画质功能,包括抗锯齿和各向异性过滤
4、增强的多媒体加速,包括UVD3硬件解码引擎、AMD APP并行异构计算技术、蓝光3D立体技术;
5、下一代显示技术,包括Eyefinity+多屏输出、HDMI 1.4a规范、DisplayPort 1.2规范。
Radeon HD 6800系列对内核设计做了重新配置,单精度浮点性能最高能够突破2TFlops(每秒2万亿次计算)大关,每秒钟能够处理的像素也能超过240亿,同时曲面细分单元进行了特别增强(第七代),光栅器(Rasterizer)也配备了两个,Hub部分有PCI-E 2.1总线控制器、UVD3硬件解码引擎、CrossFireX管理引擎、Eyefinity显示控制器等,显存控制器则依然是四个64-bit,总位宽256-bit,继续搭配高速GDDR5显存颗粒。
新核心集成了17亿个晶体管,核心面积为255平方毫米。Radeon HD 6870/6850分别有14个、12个SIMD引擎,每个引擎还是80个流处理器,总共1140个、960个,纹理单元56个、48个,ROP光栅单元都是32个。
Radeon HD 6870被AMD称为“市场甜点的轻松赢家”,核心频率900MHz,单精度浮点性能2.0TFlops,搭载1GB GDDR5显存,等效频率4200MHz,整卡空闲功耗19W、满载功耗151W,使用双插槽散热器和双六针辅助供电接口,输出接口两个DVI、两个mini DisplayPort、一个HDMI。
Radeon HD 6870国内官方建议零售价1899-1999元人民币,直接竞争对手最初被定为GeForce GTX 460 1GB,官方测试数据显示平均超出25-30%,最多可超过50%,不过在最后关头,AMD将对手提高到了GeForce GTX 470,显示了充足的自信心。
Radeon HD 6850则号称是“DX11性能、功耗和价格的新典范”,核心频率775MHz,单精度浮点性能1.5TFlops,同样搭载1GB GDDR5显存,但是等效频率降至4000MHz,整卡空闲功耗仍是19W,但是满载功耗降低到127W,只需单六针辅助供电,不过公版散热器也是双插槽设计,另外输出接口同为两个DVI、两个mini DP、一个HDMI。
Radeon HD 6850国内官方建议零售价1299-1399元人民币,直接竞争对手最初定为GeForce GTX 460 768MB,官方测试数据显示平均超出也有30%左右,最多可超过60%,最后时刻又改成了GeForce GTX 460 1GB。
现在我们就对比一下Radeon HD 6870、Radeon HD 5850。后者核心面积和晶体管规模要大不少(334平方毫米和21.5亿个),流处理器、纹理单元分别多出120个、16个,显存带宽甚至也稍高一些(153.6GB/s和134.4GB/s),但是根据AMD提供的数据,二者3DMark Vantage得分分别为X7730、X7403,也就是说Radeon HD 6870以更小的核心规模实现了更高的性能,单位面积的性能自然更是高出一大截,而且更喜人的是满载功耗保持在同样的水平(151W),空闲功耗更是降低了8W,按幅度计算就是30%,显然新卡的性能功耗比也要好得多。
另外值得一提的是,重新设计的新核心在几何吞吐能力方面也有显著进步,Radeon HD 6870达到了每秒钟9亿个三角形,Radeon HD 5850则是7.25亿个。这可以看作是对NVIDIA宣传几何性能的一个回应。
新特性:强化画质
消费级显卡最主要的使命自然是提供更好的3D游戏性能和画面,而提升画质最传统、最广泛的方法当属抗锯齿(AA)和各向异性过滤(AF)。Radeon HD 6800在这两方面都有所革新,还特别简化了相关用户界面,方便使用。
Radeon HD 6800支持新的形态抗锯齿(Morphological Anti-Aliasing),简称MLAA。该技术由Intel提出,不过此前是基于CPU运算的,AMD则将其移植到了GPU上,使用后期处理过滤技术结合DirectCompute进行加速,全面支持DX9/10/11应用程序。AMD宣称,MLAA可提供全场景抗锯齿,而不限于多边形边缘、Alpha测试表面,速度也要比超级采样,性能上接近于可编程过滤抗锯齿(CFAA)。
MLAA抗锯齿属于一种后期处理效果,换言之就是首先正常渲染每一帧,然后再进行一次着色器处理来执行过滤,这不同于传统的多重采样抗锯齿(MSAA)和超级采样抗锯齿(SSAA),后者都是在帧渲染的同时执行过滤。事实上,MLAA也能用来消除静态图像的锯齿,只不过用在动态画面上效果更好。
MLAA中,过滤器会首先按照不同的像素尺寸样式检测高对比度边缘(锯齿产生的主要原因),假设它们应该是与像素边缘不切合的直线,然后消除每个边缘理想线的长度和角度,根据边缘旁边每个像素的较深和较浅颜色确定符合比例的覆盖范围,最终实现抗锯齿。
由于边缘检测步骤需要频繁的对相邻像素颜色进行采样和重采样,数据重新使用的几率很高。AMD使用LDS(本地数据共享)硬件避免冗余数据预取、显著提升性能。
各向异性过滤也有所改进,尤其是算法方面,还保持了全面的性能和角度独立性。
配合新技术,催化剂控制中心的3D部分同样有了变化,可在此开启MLAA抗锯齿,还有全新的Catalyst A.I.滑块,能够直接控制纹理过滤和优化。
新特性:高效曲面细分
DX11带来了诸多新特性、新技术,曲面细分(Tessellation)按说只是其中的一种,但因为显卡厂商的种种不同宣传而备受关注,也引发了不少争议,比如按照NVIDIA的说法,他们的Fermi架构才是真正的DX11架构,因为设计了专门的曲面细分单元,高负载下性能更好。
事实上,当年ATI在Radeon 8500上就首次试验了这种技术的雏形,使用了固顶功能的PN三角形。虽然当时的技术还极不成熟,游戏应用也未普及,但ATI并未放弃,此后每一代产品都在进行更新和完善,比如Xbox 360 GPU上加入了位移映射和自适应曲面细分,Radeon HD 2000、3000两代产品分别支持DX10、DX10.1,Radeon HD 4000系列又增强了性能,但直到Radeon HD 5000系列上才借着DX11的东风修成正果,成为业界标准规范的一部分。Radeon HD 6000系列针对曲面细分又做了深入优化,重点改进了线程管理和缓冲。
AMD提供的数据显示,Radeon HD 6870相比于Radeon HD 5870在曲面细分性能上有了最多一倍的增加,不过具体取决于曲面细分因子,1-13的时候普遍都能超过50%,其中5-10的时候效果是最好的。
AMD还特意讲解了部署曲面细分的正确方法,包括将最重要的细节添加到场景中,同时有效压缩几何;专注于最有效的使用模式,理想情况下每个多边形16个像素,取得画质和性能的最佳平衡;自适应曲面细分非常有效,只有在接近观众的物体、边缘轮廓、高细节区域才使用高级别的曲面细分,反之则使用低级别。
AMD声称,过量使用曲面细分并不会有太好的画质效果,反而会让显卡失去效率,比如阴影过多、抗锯齿处理多边形边缘过多等等,暴力使用只是一种无谓的浪费。
新特性:改进影音多媒体
影音播放一贯是A卡的优势,近年来在这方面的投入力度也是越来越强,对HTPC玩家的吸引力也越来越强,源码输出、催化剂画质增强都广为津津乐道。
Radeon HD 6800上又提出了“EyeSpeed”视觉加速技术,包括两大方面:一是GPU并行计算,基于开放的OpenCL、DirectCompute 11标准规范;二是高清视频的解码、输出与播放,支持蓝光3D立体技术,并整合了第三代UVD 3.0视频解码硬件引擎。
UVD 3.0对高清玩家来说尤其诱人。相比前两代,它增加了MPEG-2、MPEG-4 Part 2 (DivX/XviD)、Blu-Ray 3D (MVC)等编码格式的全程硬件解码,用户可以将更多视频解码工作交给GPU处理,进一步减轻CPU负担。篇幅所限,有关UVD3等视频播放新特性日后会专文深入介绍。
AMD还提到了Radeon HD 6800系列精确的色彩校正技术。借助色域映射引擎,AMD可以在广色域液晶面板上精确地再现原始色彩,并在整个管线内保存色彩细节。
先进的硬件技术自然需要广泛的应用软件支持。经过广泛深入的合作,AMD已经拉上了多家知名的多媒体播放与编辑厂商,Radeon HD 6800尚未发布就获得了大量播放器、编辑器的辅佐,包括ArcSoftTotalMedia Theatre、TotalMediaShowBiz,Corel WinDVD Pro 2010、DigitalStudio 2010,CyberLinkPowerDVD 10 Mark II,DDD TriDef (3D),DivX Plus等等。
新特性:灵活多屏输出Eyefinity+
Eyefinity(宽域)多显输出技术是Radeon HD 5000系列最闪亮的地方之一,只要一块显卡就可以组建最多六屏系统,大大降低了多屏架设的成本,既极大地拓宽了游戏玩家的视野,也非常适合办公、渲染、展示等专业场合。现在,Radeon HD 6000系列又进一步提升,带来了增强版的“Eyefinity+”。
Eyefinity+技术的精髓是DisplayPort 1.2标准规范。相比于此前的1.1a版本,最新的 1.2版本将数据带宽从10.8Gbps翻番到21.6Gbps,视频输出率也从8.64Gbps翻番到17.28Gbps,60Hz 24bpp下的最大分辨率支持提升到2560×2048之上,而且特别支持多流输出(MTS)。
得益于此,Eyefinity+获得了更高的传输带宽,再加上带内立体3D信号,就为支持3D立体技术打开了方便之门,而且尤其是支持单接口多数据流、多显示输出,通俗地说就是一个接口可以连接多台显示器,因而只需要两个DisplayPort接口就能连接六台显示器。
而此前的Eyefinity只能一个接口对应一台显示器,想组建六屏系统就得同时使用六个接口,所以才有了Radeon HD 5870 Eyefinity 6特别版。
Radeon HD 6800系列公版都配备了多大五个输出接口,包括两个mini DisplayPort、两个DVI、一个HDMI,组建多屏系统的方式也非常灵活。
第一种方法:只使用两个mini DisplayPort接口,其一通过MTS Hub转接来连接三台显示器,其二通过菊花链方式依次连接三台显示器,这就完成了六屏系统。
第二种方法:同样只使用两个mini DisplayPort接口,分别连接一台MTS Hub,再分别接上三台显示器,六屏搞定。
第三种方法:其中一个mini DisplayPort接口连接MST Hub之后扩展四台显示器,另外两个DVI接口分别连接一台,同样是六屏。
MTS Hub还可以连接多种不同分辨率的显示器,全高清、高清、高清+可以并存。
努力拓展产业生态系统支持也是Eyefinity技术的重中之重。迄今为止,DisplayPort接口显示产品在市面上已经超过35款,Eyefinity认证游戏超过45款、兼容游戏数百款,不久前AMD还与显卡厂商合作推出了相对廉价的DisplayPort转单链接DVI适配器。
性能方面,AMD给出的数据是3×1920×1080水平模式下,Radeon HD 6850/6850单卡在所有主流游戏中都能获得30FPS以上的稳定帧率,部分还可达到甚至超过60FPS。
配合Eyefinity、CrossFireX技术,AMD双卡互连的执行效率也是越来越搞,号称两块Radeon HD 6850相比单卡的性能提升幅度最高可达惊人的99%(《Far Cry 2》),少的也能超过80%。
3×1920×1080三屏模式下,同为双卡的Radeon HD 6870 CrossFireX相比于GeForce GTX 460 1GB SLI的优势也是非常明显,领先幅度少则接近20%,多则达到80%。当然了,这些都是官方宣传数据,仅供参考。
新特性:3D立体
现如今,3D立体已经成为不可阻挡的大势所趋,NVIDIA 3D Vision技术都已经获得了上千件产品的支持,AMD自然也不能落后,此番推出了“HD3D”(高清立体)技术。
不过不同于对手的捆绑式方案,AMD选择了与业界合作的开放态度,灵活提供多种解决方案,给用户自主选择的机会,成本也更低。
AMD的3D立体方案中,自己只提供Radeon HD 6000系列显卡硬件,中间件可选Dynamic Digital Depth(DDD)、iZ3D等供应商合作伙伴的方案(前者的就是TriDef),视频和蓝光3D播放软件来自ArcSoft、Corel、CyberLink、Roxio,眼镜及发射器来自Bit Cauldron、XpanD、RealD,至于3D电视、投影仪、显示器等显示设备就广泛多了,某些厂商也正在专门针对AMD方案开发和发布相关显示设备。
为了支持3D立体,Radeon HD 6800系列配备的HDMI接口都已经升级支持HDMI 1.4a规范,支持新款3D立体电视和HDMI帧包装格式。
3D游戏方面,AMD Radeon HD 6000支持DX9/10/11四缓冲,配合DDD、iZ3D的转换软件可为400多款游戏带来立体效果,2011年还会有原生的3D立体游戏。
性能上AMD也给出了一些数据。Radeon HD 6870配合iZ3D中间件在优派的120Hz 3D显示器上以1080p全高清分辨率运行3D立体游戏,平均帧率不低于35FPS,高可接近70FPS。
Cayman
定位解析:避开GTX580
Radeon HD 6900系列当然是面向高端游戏市场的,将会取代现在的Radeon HD 5800系列,而与Radeon HD 6800/5700系列并肩打江山。当然了,这里不可避免地得重新解释一下AMD的产品型号命名策略。根据最初的计划,Barts、Cayman核心应该分别叫作Radeon HD 6700/6800系列而替代Radeon HD 5700/5800系列,但是首先AMD自然为Barts核心非常优秀,配得上更高的地位,其次Radeon HD 5700系列在主流市场上非常热门、广为追捧,直接就这么拿下实在可惜,于是AMD就玩儿了一个从市场策略上看很聪明、从消费角度看很混乱的做法:Barts、Cayman核心分别提升一个档次,命名为Radeon HD 6800/6900系列,Radeon HD 5700系列则继续留在市场上笼络中端用户,而新的单卡双芯型号则被挤到了顶,只能叫Radeon HD 6990。AMD这么做自然有其充分的理由,毕竟厂商的目标是利用各种可能的手段赚尽可能多的钱,也就是追求利润最大化。AMD在DX11市场上居于领先地位,也有一定的空间和余地按照自己的意愿去部署产品线,作为消费者就只能被动接受了。不管怎么说,Radeon HD 6000系列毕竟是新核心新产品,总比直接改名的马甲好得多。
按照AMD最后时刻敲定的策略,Radeon HD 6970在国内的官方建议零售价为2999-3099元人民币,Radeon HD 6950则是2299-2399元人民币,远远低于此前预计的3999元、2999元。至于竞争对手,AMD延续了田忌赛马的策略,Radeon HD 6900系列避开锋芒毕露的GeForce GTX 580(3999元)而携手杀向刚刚诞生的GeForce GTX 570(2999元),或者更确切地说主要由Radeon HD 6970去对付GeForce GTX 570,Radeon HD 6950则暂时没有很直接的对手,因为往下的GeForce GTX 460、GeForce GTS 450分别交给了Radeon HD 6800系列、5700系列。
当然了,GeForce GTX 580也不会被放任自流,因为AMD仍有迄今为止地球上最快的显卡Radeon HD 5970,还会更新为Radeon HD 6990,继续二打一的策略。
全新内核架构:4D图形与计算
无论开发什么新产品,设计人员总要首先设定一些预期目标,然后通过技术上的努力去实现,从而满足市场和用户的需要。可以说,只有合理的目标与顺利的执行有机结合才能诞生一款优秀的产品。
在Cayman Radeon HD 6900系列身上,AMD就提出了四大目标:高效的图形与计算架构、强大的几何性能、新的画质技术、新的能效与功耗管理。下边我们就从这四个方面着手,细细品位Radeon HD 6900的内核架构与技术精髓。
为了实现高效的图形与计算架构,AMD该用了重新定义的VLIW4架构,同时还引入了双图形引擎、更多SIMD引擎与纹理单元、升级的渲染后端、更高的显存带宽、新的GPU计算技术。
VLIW全称为Very Long Instruction Word,意思是超常指令字架构,是一种非常长的指令组合,通过把许多条指令连在一起来增加运算的速度。从第一代DX10 R600内核开始,AMD就一直使用VLIW5方式,又称5D式,也就是五个流处理器编为一组,但并非所有流处理器都是相同的,其中四个较小、较简单,另一个较大、较复杂做为特殊单元。这种架构设计在硬件方面看有着很高的效率和很深的潜力,但是结构比较复杂,对应的软件编程就很困难,始终难以真正发挥全部实力。
如今AMD终于在内核层面翻新为VLIW4方式(4D式),每个编组由四个流处理器、一个分支单元、一个通用目的寄存器组成,其中四个流处理器的整数、浮点执行功能完全相同(不再有T-Unit),可以执行四路并行发射,但是特殊功能占据四个发射位中的三个。
AMD宣称,VLIW4架构有着更好的利用率,能将性能与核心面积比提高10%,简化调度与寄存器管理,逻辑核心也可以很好地重复使用。
除了前端,渲染器后端也进行了升级,支持写入操作合并,16位整数操作提速两倍,32位浮点操作也快了两到四倍。
GPU并行计算方面,新内核最大的亮点就是增加了一个全局异步寄存器,从而支持异步分配,可以同时执行多个计算内核,每个内核都有自己的命令队列与受保护虚拟寻址域。此外还有两个双向DMA引擎(更快的系统内存读写速度)、着色器读取操作合并、LDS(本地数据存储)直接预取、流控制改进、更快双精度操作(单精度的1/5提高到1/4)。
全新内核架构:曲面细分性能
在NVIDIA所谓真DX11的大肆宣传下,几何性能特别是曲面细分性能的地位被提高到了一个夸张的地步,但事实上AMD在这方面早已经历了多个时代的进化,现在更是发展到了第八代曲面细分单元——Radeon HD 6800、5000系列分别是第七代和第六代。
Radeon HD 6900配备了两个独立又合作的图形引擎,每时钟周期内都能处理两个原语(Primitive),具备基于区块的负载均衡,转换和隐面消除率翻番。每个图形引擎内都有一个光栅器与一个第八代曲面细分单元,前者每时钟周期内可处理最多32个像素,后者结合用于更高曲面细分等级的片外缓冲,可实现最多三倍于Radeon HD 5870的曲面细分性能,至少也会有1.5倍。《异形大战铁血战士》、《地铁2033》、《失落的星球2》、《潜行者:普里皮亚季的呼唤》、Unigine Heaven等一系列NVIDIA宣传自己曲面细分性能强劲的游戏和测试程序中,Radeon HD 6970相比于Radeon HD 5870能带来30-69%的大幅性能提升。
不过我们还是想唠叨一句:曲面细分是个好技术,但终究只是DX11技术群中的一份子而已,并不是唯一,多线程、计算着色器、纹理压缩等技术的重要性丝毫不比它弱。AMD、NVIDIA都完全实现了对DX11技术的支持,只不过因为发展思路和策略不同,具体方式和执行效率有所差异,不存在什么真假之说。
全新内核架构:AA、AF增强画质
画质增强技术方面,AMD每一代新产品都会加入新功能,此番除了形态抗锯齿(MLAA)之外还有增强画质抗锯齿(EQAA)、增强各向异性过滤与纹理过滤。
EQAA其实并不是全新的抗锯齿技术,而是属于多重采样抗锯齿(MSAA)的一种新模式,每像素最多16个覆盖采样点,双倍于标准的MSAA,而且色彩与覆盖采样点的数量可以独立控制,并能够自定义采样模式与过滤器。有趣的是,EQAA兼容自适应抗锯齿(AAA)、超级采样抗锯齿(SSAA)、MLAA,换言之就是能够同时使用,共同改善画质。
AMD宣称,EQAA可以在同等量的显存消耗下带来更好的画质,对性能的影响也最多不过5%左右。
MLAA就不再重复介绍了,只看看AMD举的一个例子,照此说来MLAA、MSAA搭档合作效果最佳。
全新内核架构:全新功耗管理
说起高端显卡,除了强大的性能之外往往还伴随着恐怖的高功耗,以及随之而来的复杂散热器、烦人噪音、巨额电费。GeForce GTX 580引入了硬件电源监控电路,Radeon HD 6900则在Radeon HD 5000/6800系列的基础上又祭出了全新技术“PowerTune”(电源调节),灵活性上远胜历史悠久的ATI PowePlay。
首先必须解释一个很常见的名字:TDP(热设计功耗)。和微处理器(CPU)一样,GPU图形核心也会在运行中消耗能量,并将其转换成热量,再散发出去,能量消耗的速度受限于系统提供能量、挥发热量的双重能力。为此GPU厂商就向系统制造商提供了热设计功耗这么一个参数,代表稳定运行所需要的最大能量消耗值,方便他们合理地设计系统,而且该参数受电压、核心频率、工作负载、漏电率、环境温度等多种因素的影响。
ATI PowerPlay只是简单地指定了显卡核心与显存频率的两三个等级,分别对应待机、日常负载、游戏和拷机负载等应用,一旦确定就不可再更改。AMD PowerTune则利用显卡上集成的控制处理器来实时监视GPU负载、内部计算GPU功耗,藉此实时动态调整运行频率,从而在满足热设计功耗限制的前提下带来更高的性能,特别是允许GPU在高负载状态下运行于更高的频率。
换句话说,GPU以往只有中间状态、最高状态等几种僵死的P-State性能等级,现在加入AMD PowerTune技术后就有了几乎无数种状态并能实时调节转换,允许最高状态下的核心频率更高,同时仍然满足热设计功耗要求,而那些受热设计功耗限制的应用程序也可以从这种更高频率中获益。
除此之外,Radeon HD 6900系列还支持直接控制GPU功耗,不需要再绕过频率和电压调节,并支持AMD OverDrive工具。
技术上讲解和理解起来都很晦涩,但看看下边的典型应用实例你就会明白了。首先大家需要知道的是,显卡实际功耗在不同环境下是相差很大的,FurMark、3DMark、OCCT等测试和拷机软件往往能将显卡功耗发挥到很高水平甚至达到极致,但主流3D游戏中其实都是比较低的。这就是AMD PowerTune技术进一步发威的前提。
Radeon HD 6950在默认功耗设置下运行3DMark Vantage柏林噪音测试,GPU核心频率在700MHz上下的较大范围内实时动态调整,程序运行帧率则稳定保持在接近150FPS。
然后在催化剂控制中心的OverDrive页面内,拖动功耗控制(Power Control)的滑杆,范围从-20%到+20%,代表显卡功耗的降低和增加范围。
同样的测试中,默认功耗下GPU核心频率在很大范围内调节,但极少超过750MHz,此时平均帧率140FPS;增加5%的功耗空间后,核心频率大部分时间都在750MHz之上,而且是不是达到800MHz,此时帧率升至155FPS;增加10%的功耗空间时核心频率就一直运行在额定的800MHz,帧率继续升至162FPS。
转到《异形大战铁血战士》这样的普通游戏,默认设置下帧率超过55FPS,很流畅,都功耗也超过了250W,相当费电;于是将功耗空间降低10%,帧率仍有55FPS左右,实际功耗降至250W之下;再降低20%呢,帧率跌至50FPS,依然足够流畅,功耗却大幅降低至220W多一点,从而在保证游戏体验的前提下节省耗电量。
另外除了功耗控制技术的改进,Radeon HD 6900系列的散热设计同样毫不含糊,和Radeon HD 6800系列一样使用了第五代真空腔均热板(Vapor Chamber)技术,由涡轮风扇、大面积纯铜底座、纯铜热管、密集散热鳍片等部分组成。
Antilles
定位解析:完美接任HD5970
虽然台积电28nm工艺非常不给力,致使AMD野心勃勃的南方群岛计划流产,但是AMD依旧迅速变招拿出了B计划,开始推出第二代DX11 Radeon HD 6000系列家族,而且在市场策略、核心架构方面都有了相当大的变化,比如Radeon HD 6800系列地位提升、Radeon HD 6900系列改用VLIW4 4D式流处理器单元。虽然所谓全新架构的处子秀不算很惊艳,没有撼动GeForce GTX 580的市场地位,但这也正好符合AMD的一贯策略,即以小核心占领性能级市场,然后再双芯并联去争夺发烧级市场。后边这一步,正是要靠Radeon HD 6990去努力。
Radeon HD 6990开发代号Antilles,原计划在2010年底发布,但因为种种原因拖延至今。GeForce GTX 590至今神龙见首不见尾,虽说按道理性能应该更恐怖,但是看样子还得登上一段时间(NVIDIA的下一步是本月中旬的GeForce GTX 550 Ti)。就这样,Radeon HD 6990在并无多大压力的情况下得以顺利接过前辈的枪、荣登卡皇宝座,再次成为地球上最快的显卡。不管你是否认同这种单卡双芯的形式,它都是无可争议的性能王者。当然了,这也标志着Radeon HD 5970完美的一生开始结束,老卡皇可以笑着退休了。
规格解析:双芯并联+超频
Radeon HD 6990使用了两颗Cayman Radeon HD 6900图形核心并使用PLX桥接芯片内部连,因此在架构上就没什么好说的了,完全继承了Radeon HD 6970/6950的诸多新特性,包括VLIW 4D流处理器单元、升级的渲染器后端、增强的GPU计算、双图形引擎与两个第八代曲面细分单元、EQAA增强画质抗锯齿、PowerTune功耗管理技术等等。当然了,Radeon HD 6870/6850以来引入的大量功能特性也都延续了下来,包括MLAA形态抗锯齿、改进的各向异性过滤、UVD3视频解码引擎、增强的多屏输出Eyefinity等等。无论从哪方面看,Radeon HD 6990都完全称得上是集大成者,综合了AMD迄今为止最优秀的图形和视频技术。
Radeon HD 6990拥有多达52.8亿个晶体管,3072个流处理器、192个纹理单元、64个ROP单元,显存位宽2×256-bit,显存容量多达4GB,都是Radeon HD 6970/6950的两倍,不过受散热、功耗的限制,预设频率并没有达到Radeon HD 6970的级别,但也高于Radeon HD 6950,其中核心为830MHz,显存等效为5GHz。
Radeon HD 6990的浮点计算能力因此高达惊人的单精度5.1TFlops、双精度1.27TFlops,分别符合IEEE754-SP、IEEE754-DP标准,另外纹理填充率159.4GT/s、像素填充率53.1GP/s、显存带宽320GB/s。
更恐怖的是,Radeon HD 6990还有相当大的超频空间。首先,它和Radeon HD 6970/6950一样配备了双BIOS和切换开关,因此提供两种模式:默认模式下核心电压1.12V,频率如上;超频模式下核心电压加至1.175V,频率直接也拉升到880MHz,显存频率不变,基本相当于两块Radeon HD 5970。这时候的Radeon HD 6990将拥有5.4TFlops单精度浮点运算能力,纹理、像素填充率也都有进一步增加。
如果游戏玩家和发烧友们还不满足,可以再借助催化剂控制中心、AMD OverDrive或者第三方软件进一步超频。核心频率可以轻松超过900MHz,借助更强的散热器乃至液氮等等超过1GHz也是小菜一碟,甚至催化剂控制中心预设的最高值就达到了史无前例的1200MHz。显存频率也能很轻易地提升到5.5GHz乃至6GHz,基本上已经是GDDR5显存颗粒的极限了。
如此彪悍的规格自然会带来不可小觑的发热量和功耗。Radeon HD 6990在空闲情况下的功耗为37W,秉承了近两代优秀的待机功耗控制能力,不过在典型游戏状态下整卡功耗会飙升至350W,拷机时候的峰值功耗更实惠接近375W,不得不使用了两个八针辅助供电接口,每一个都可以供电150W。
软硬兼施: 6990双重手段控制功耗
在硬件设计上,AMD工程师的目标是做一块即使功耗达到450W也依然能够应付的超级显卡,对付Radeon HD 6990的350W左右自然就没什么问题了。为此,AMD在这块卡上使用了极其奢华的电路设计,完全不计成本。供电方面是第二代数字可编程Volterra供电控制器,专为VDDC电压控制器开发的大型附属设备,相比之前使用的效率明显提升,可增大电流、降低温度和功耗。
PCB布局方面也发生了很大的变化,抛弃了以往GPU核心在左、供电电路在右的传统,改而将供电部分设计在PCB中央,位于两颗GPU核心之间,紧挨着PLX桥接芯片。AMD宣称这种设计能够为每颗GPU核心与相关的显存芯片提供更高效率的供电。
电路板本身也是精挑细选的,只为保证更高的速度、更低的漏电率。
散热器外部看上去和Radeon HD 6800/6900系列非常相似,但是内部已经根据PCB的变化做了相应调整。全封闭的外壳中,每颗GPU核心对应一个真空均热板散热模块,中间供电电路对应涡轮风扇,还特别加入了相变导热材料(TIM),声称可将散热性能提升8%,综合起来散热能力比Radeon HD 5970增加了20%之多,足以对付450W的功耗和发热
最为难得的是,相比于前辈Radeon HD 5970,Radeon HD 6990的PCB长度、散热器体积都没有增大,其中PCB还是11.5英寸(292毫米)。虽然握在手里依然形如超大型板砖,但至少没有更加变态。
Radeon HD 6970/6950身上开始实践的PowerTune技术这次终于到了真正发挥作用的时刻。
PowerTune是此前PowerPlay技术的进化版本,而且不仅仅是用于节能,更用于加速。它利用显卡上集成的控制处理器来实时监视GPU负载、内部计算GPU功耗,藉此实时、动态地调整运行频率。
一方面,PowerTune技术下显卡的核心、显存频率都不再局限于寥寥几种状态,而是能够根据实际负载无缝地调节与切换,尽可能地不造成任何能耗上的浪费。另一方面,PowerTune技术能够让显卡在高负载应用种自动加速,从而获得更高的运行频率和更好的游戏性能,但又不会超过热设计功耗的限制范围,以避免在极限测试和拷机测试中造成硬件损坏。从一定程度上讲,这有些类似AMD、Intel处理器上使用的动态加速技术Turbo Core、Turbo Boost(睿频)。
可以说,有了PowerTune技术之后显卡就变得非常智能了,会随时根据实际负载来调节自己的运行状态。负载要求低的时候就逐渐降下来,省电节能降噪;负载要求高的时候就看情况加速上去,根据不同的要求自动超频,带来更好的性能。
按照AMD给出的测试数据,Radeon HD 6990结合PowerTune技术能将最大功耗控制在375W,游戏速度普遍有20-30FPS的提升,FurMark、OCCT等非游戏类的拷机测试中也能适当地小幅加速,达到性能与功耗的兼顾与平衡,而不像NVIDIA GeForce GTX 500系列那样碰到拷机测试就自动降频,看起来功耗低了,但只是一种被动的保护措施而已。
支持单卡垂直五屏
Radeon HD 6990的输出接口配置也很特别,一个双链接DVI,四个mini DisplayPort 1.2,搭配MTS Hub转接器或者采用菊花链串联形式同样可以支持最多六屏输出。至于为什么这么安排,自然有其特殊理由,马上你就可以看到了。
为了方便玩家组建多屏系统并降低成本,AMD将随卡附送三个转接头,分别可以将mini DP转接为被动式单链接DVI、主动式单链接DVI、被动式HDMI。
迄今为止,AMD已经发布了21款DX11显卡,全部支持Eyefinity多屏输出技术,而且有数十种不同的多屏配置方式,单卡最多可连接六台显示器。与此同时,通过认证或者准备就绪的Eyefinity兼容游戏、应用软件也达到了69款。
而除了传统的各种多屏模式,Radeon HD 6990又带来一种视野广阔、环绕效果更为震撼的新模式:五台显示器垂直并列,分辨率支持5×900×1600、5×1080×1920、5×1200×1920等等。
参考资料
最新修订时间:2024-05-22 00:21
目录
概述
命名解析
参考资料