南方群岛是AMD出产的GPU处理器架构。
显卡命名
AMD的下一代
显卡“南方群岛”(Southern Islands)已经流片成功了,很可能会在NVIDIA新系列布局完毕之前就抢先登场。
据报道,南方群岛(SI)芯片已经在最近流片,并移交代工厂台积电。据AMD声称,AMD将在10月12日正式发布“南方群岛”,显卡商计划将在11月份开始销售。
根据此前消息,南方群岛是基于下一代全新架构“北方群岛”(Northern Islands)和当前架构Evergreen的混合设计产物,而制造工艺方面因为台积电取消了32nm,更高级的28nm HKMG得等到明年,所以南方群岛仍然选择了已经逐渐成熟起来的40nm,不过按照AMD官方的说法,北方群岛就会改用GlobalFoundries 28nm HKMG工艺了。
最新曝料显示,南方群岛使用了北方群岛的一些非核心部分,并对Evergreen的流处理器进行了小幅度的升级,显存方面北方群岛计划使用升级版GDDR5+,但由于显存厂商还没有准备好,南方群岛仍旧还是GDDR5。
谍报一:HD6750/6770详细规格透露
在此之前,我们曾多次为大家报导过有关于AMD下一代DX11产品Radeon HD 6000系列显卡的相关信息。而近日,我们从chiphell得到了一份PPT页面,该页面详细的介绍了有关于Barts核心产品的详细规格参数,这份PPT上的信息貌似比之前曝光的消息更为可信,下面,我们就一起来看看吧。
我们可以看出,上图中透露出的信息与之前曝光的消息有不小的出入,之前曾有消息称,Barts核心的产品将会被AMD命名为Radeon HD 6800系列,而在上图中则显示为HD6770/50。AMD最终到底如何命名我们暂且先不讨论,这种事情不到产品最终发布我们都无法确定。先让我们来看一看两款Barts核心的规格参数吧。
从上图中我们可以看出,Barts XT核心的产品最终将会拥有1280个流处理单元,64个纹理单元以及32个光栅处理器,默认核心频率高达900MHz。显存方面不出意外的搭载了GDDR5显存,默认频率为4200MHz。满载功耗在146W左右,而待机功耗则仅有23W左右。
基于Barts Pro核心的产品将会拥有1120个流处理单元,56个纹理单元以及32个光栅处理器,默认核心频率为725MHz,比Barts XT低一些。显存方面同样为GDDR5显存,频率方面同样相比Barts XT核心的产品稍低,为4000MHz。满载功耗在114W左右,待机功耗在20W左右。
从此次透露出的规格信息来看,“Radeon HD 6770”的处理能力已高达2.304 TFlops,比Radeon HD 5850的2.088 TFlops还要高。看来最终“HD 6770”的性能极有可能超越HD 5850,如果真是这样的话,AMD的这一代产品相当值得期待。
谍报二:传AMD 5700系列将更名6700
【转载自PCPOP】
有关AMD即将推出的Radeon HD 6000系列显卡,近一段时间可谓是众说纷纭。甚至连它们的代号究竟是“北方群岛”还是“南方群岛”都有不少争议。德国媒体最新传出的消息是,Radeon HD 6000系列中的中端性能级产品HD 6700,实际上将是目前HD 5700系列的更名之作。
根据一张泄露出来的内部幻灯片截图,AMD为HD 6000系列准备了两套命名方案。其中一套是一一对应的升级,即Caicos对应HD 6400,Turks对应HD 6600/6500,Barts对应HD 6700,Cayman对应HD 6800,Antilles对应HD 6900。
但新的命名计划则是,最先推出的Barts直接命名为HD 6870/6850。由于Barts实际上是Juniper(桌面HD 5700系列/移动HD 5800)的升级版本,它晋级升入HD 6800系列后,199美元以下的HD 6700系列市场由谁来继承呢?
答案就是更名,原有的Juniper HD 5770/5750将直接更名为HD 6770/6750。而Barts以上的GPU则会水涨船高各晋一级,Cayman成为HD 6970/6950,双芯Antilles只有叫做HD 6990了。
据称AMD已经确认选择了这种新的命名方式。至于HD 6700究竟会以怎样的形式出现,是提高频率、增加功能还是直接更名,恐怕只有等产品发布才会知晓了。
谍报三:6870/50实物照片+测试成绩曝光
发布前的最后时刻,围绕着AMD Radeon HD 6000系列规格特性的疑问却越来越多。首先是涉及改版更新还是升级换代,北方群岛还是南方群岛的争论。再后来又出现了Radeon HD 5700系列直接更名为Radeon HD 6700系列的说法。
目前已经基本确认,之前一直被视为Radeon HD 6700系列的“Barts”最终推出时将以Radeon HD 6800系列示人,即Barts Pro对应HD 6850,Barts XT对应HD 6870。昨天,有台湾网站就曝出了Barts Radeon HD 6800系列的实测成绩,其中还包括Barts Pro HD 6850的实物照片。
据称,Barts XTRadeon HD 6870将提供1120个
流处理单元,核心频率900MHz,256bit 1050MHz GDDR5显存,3DMark Vantage的得分为P16270和X7538,3DMark06 成绩为19480。
Barts ProRadeon HD 6850则为960个流处理单元,核心频率775MHz,256bit 1000MHz GDDR5显存。3DMark Vantage得分P14872、X6549,3DMark 06成绩为18750。
同条件下的各款显卡性能排位(3DMark Vantage/3DMark 06得分)如下:NVIDIA
GeForce GTX 480: P18376/19671
GeForce GTX 460 (256bit 1GB): P13623/18601
GeForce GTX 460 (192bit 768 MB): P13386/18259
GeForce GTS 450: P9792/15793
AMD
ATI Radeon HD 5870: P17924/19433
AMD Radeon HD 6870: P16270/19480
ATI Radeon HD 5850: P15593/18762
AMD Radeon HD 6850: P14872/18750
ATI Radeon HD 5830: P14014/17298
ATI Radeon HD 5770: P11017/16358
ATI Radeon HD 5750: P9124/14966
看起来HD 6870/6850的性能还不如HD 5870/5850,似乎有些说不过去,但这其中也应该有新卡驱动尚未完善的原因。
HD6800系列产品官方资料及核心图曝光
Radeon HD 6800系列
显卡核心代号为Barts,从曝光的核心测量图显示,其核心面积为171.09*134.61mm=230.30mm2;而Radeon HD 5800系列的Cypress核心面积为184.18*183.49mm=337.95mm2。由此看来,Barts核心面积仅为Cypress的68.15%左右。
● 下面我们再来仔细看看HD 6800系列产品的官方资料:
首先是产品路线图,核心代号为Barts XT的HD 6870以及Barts Pro的HD 6850将会在本月发布;
11月下旬会有Cayman XT/Pro核心的Radeon HD 6970/6950显卡出炉;而12月则有Antilles核心的新双核产品Radeon HD 6990登场。
新产品市场定位图显示,Barts核心对应的是
NVIDIA最热门的GeForce GTX 460显卡;而Juniper则坚守中端市场,打压GeForce GTS 450;Cayman核心产品以GeForce GTX 480/470为竞争对手;至于最顶级的Antilles双核心显卡则接过Radeon HD 5970的皇冠成为新一代双核王者。
● Northern Islands新特性:
HD 6800系列显卡的DX11性能将会得到提升(AMD称之为第二代DX11);
新的显示输出标准,支持DP 1.2以及HDMI 1.4规范;
通过HDMI 1.4以及DP 1.2接口,可支持3D立体视频以及游戏;
采用UVD 3.0引擎,支持MPEG-2/DivX/BluRay3D MVC硬解。
HD 6000系列产品将配备双DVI、HDMI以及双mini DisplayPort共5个输出接口。mini DP接口为1.2规范,可支持多视频流,使用两个接口即可实现6屏输出。从右表可看出,HD 6870(Barts XT)将搭配双6pin供电接口,TDP大于150w;而HD 6850(Barts Pro)则仅具备单6pin供电接口即可,TDP在150w以下。
Cayman XT/Pro核心产品将会在11月底发布,前者需要6pin+8pin供电接口,TDP在300w以下;而后者则具备双6pin供电接口,TDP少于225w。
两者均搭配1GB GDDR5显存,其中前者规格更高,速度可达6Gbps,而后者则为5Gbps。
HD6970/6950规格曝光
昨天,国外网站Xtreview曝光了基于Cayman XT/Pro核心的Radeon HD 6970/6950显卡部分规格参数。目前,我们可以知道Radeon HD 6970/6950显卡的信息包括PCB、散热系统、功耗、频率以及显存容量等。 Radeon HD 6970/6950都将配备1GB GDDR5显存,根据两者的市场定位,HD 6950将拥有5000MHz的频率,而HD 6970则拥有高达7000MHz的显存频率。
HD 6970在散热方面,只搭配了涡轮风扇,功耗为300W,配备了一个6pin和一个8pin供电接口。HD 6950不仅可以搭配涡轮风扇,也可以选择其他类型的风扇,功耗则为225W,配备了两个6pin供电接口。 输出接口方面,Radeon HD 6970/6950均为2×DVI+HDMI+2×mini-DisplayPort。
Radeon HD 6970/6950预计将于11月底发布,其目标显然是GeForce GTX 480/470。
公版HD6870 PCB谍照首度曝光
今天,国外媒体曝光了一组Radoen HD 6870公版产品的PCB照片。从图片上来看,这组图片应该是来自中国香港。从照片上来看,HD6870公版产品将会配备双6pin外接供电接口,两个个
DVI接口、一个
HDMI接口和两个mini DisplayPort接口。与之前曝光的消息保持了一致。从左图中我们可以了解到,Radeon HD 6870采用了4相供电设计,与以往不同的是,供电部分位于核心的左侧。PCB正面搭载了8颗GDDR5显存颗粒,组成了1GB/256bit的显存规格。
这张图片则显示出了Barts核心仍然采用了小核心设计,核心为长方形,在香港硬币的旁边尺寸显得非常小。另外,据此前消息称,Radeon HD 6870将会与下周发布,核心内建960个流处理单元,默认运行频率为900MHz。拥有1GB容量的GDDR5显存默认工作在4200MHz。预计售价将会在250美元左右。
HD6800最终规格全曝光
近日,techpowerup曝光了来自chiphell的Radeon HD 6800系列最终版官方PPT,即将发布的两款新品的最终详细规格及参数也终于水落石出。下面,赶快让我们来一睹为快吧。
从第一张曝光的PPT页面简单的介绍了一下经过改良后架构的一些基本信息,我们可以看出,首先是在性能方面,这一代新品将会比上代产品在每平方毫米的芯片面积上有35%的性能提升,并且在DirectX 11的关键因素tessellation上及几何吞吐量上做了进一步的改进。此外还加入了全新的改进画质功能,在反锯齿及
各向异性过滤方面有所提高。最后还加入了UVD3、AMD APP、蓝光3D的加速技术以及新一代的AMD Eyefinity、HDMI 1.4a和DisplayPort 1.2等新技术。
而第二张PPT则显示出了HD6800系列的逻辑架构图及一些相关信息,我们可以了解到HD 6800系列将会拥有最高2.0 TFLOPs的浮点运算能力。另外在架构上增强了tessellation单元,配备双光栅引擎以及256bit GDDR5显存控制器。将能够在比HD 5850节省25%核心面积的的前提下性能较前者有更佳的表现。
接下来的这两张曝光的PPT页面则显示出了玩家们最为关心的产品规格方面的信息。我们可以看到,HD6870拥有2.0 TFLOPs的浮点运算能力,拥有1120个
流处理单元、32个光栅处理器。默认核心频率为900MHz。搭配了1GB容量的GDDR5显存,拥有256bit显存位宽,默认显存频率为4200MHz。满载及待机功耗方面分别为151W和19W。提供了双6pin外接供电接口。输出接口方面则提供了2个DVI、2个mini DP及1个
HDMI接口。
而HD6850则会拥有1.5 TFLOPs的浮点运算能力,相对HD6870来说有所下降。将会搭载960个流处理单元和32个光栅处理器。默认核心频率为775MHz。同样搭配了1GB容量的GDDR5显存和256bit显存位宽,默认显存频率为4000MHz。满载及待机功耗方面为127W和19W,仅提供了单6pin外接供电接口。接口方面的配备与HD6870保持了一致。
从最后的这张PPT页面中我们可以了解到,Radeon HD 6800系列由于支持DisplayPort 1.2技术,可实现多数据流传输,单张显卡通过两个mini DisplayPort接口便可实现多达6屏的显示输出效果。
最后,笔者要说的是,AMD下一代DX11新品Radeon HD 6800系列将于2010年10月22日正式发布,也就是本周五,届时我们也将在第一时间推出相关产品的首发评测文章,敬请关注!
显卡架构解析
HD6800依然沿用R600架构
下图为AMD官方公布的Bart(HD6870/6850)核心架构图,看上去和Cypress(HD5870/5850)并无太大区别,整体依然沿用了自R600(HD2900XT)以来的SIMD(单指令多数据流)架构,
流处理器部分没有太多改进,历代产品的改进都是集中在周边控制模块上面。
从Cypress到Barts最明显的改变就是,SIMD阵列从原来的20组降为14组,这样
流处理器数量就从1600(20x16x5)个减至1120(14x16x5)个,正好与现有HD5830的流处理器数量相等。
也就是说Barts相比Cypress,流处理器数量是70%,晶体管规模是79%,
芯片面积是68%。
可以看出,HD6870的理论性能和规格,其实还不如HD5850,而HD6850也不如上代的HD5830,那么其优势到底在哪呢?
两个超线程分配处理器
我们知道,
NVIDIA从GF100到GF104,虽然CUDA核心方面的改进不大,但对SM(流处理器簇)整体架构进行了重新的排列组合,部分指令分配单元和特殊功能单元被增强。
NVIDIA的MIMD(多指令多数据流)架构将并行指令的调度单元、分配单元都和特殊功能模块设计在了
GPC(图形处理器集群)或者SM(流处理器簇)内部。而
AMD的SIMD(单指令多数据流)架构则是整颗GPU共享单一的控制单元,自R600以来都是如此。
但随着晶体管规模和
流处理器数量的迅速膨胀,单一的控制单元已经无法满足大规模并行指令分配的需要,因此从Cypress开始,AMD采用了“双核心”的设计,将SIMD阵列一分为二,也就是类似于NVIDIA GPC的设计。与此相对应的,图形装配引擎虽然只有一个,内部却设计了两个Hierarchical Z(分层消影器)和Rasterizer(光栅器),但是其它的特殊功能模块均只有一个。
Barts和Cypress一样,依然保持了双核心设计,图形装配引擎也只有一个,内部的功能模块并没有太多变化。但是Ultra-Treaded Dispatch Processor(超线程分配处理器)却变成了两个,相对应的,超线程分配处理器的指令缓存也变成了两份。
我们知道,Barts的流处理器数量是Cypress的70%,按理说线程分配压力有所下降,那么设计两个线程分配处理器的目的只有一个,那就是提升效率。在DX11时代,几何着色再加上曲面细分单元引入之后,图形装配引擎会产生更多的并行线程及指令转交SIMD进行处理,因此分配效率成为了新的瓶颈。
SIMD架构的优势就是可以用较少的晶体管制造成庞大的流处理器规模,拥有恐怖的理论运算能力;但缺点就是流处理器执行效率比MIMD架构低,其效率高低完全依赖于分配单元的派发效率。因此Barts这种双线程分配处理器的设计意义重大!
曲面细分性能翻倍
在Barts核心的图形装配引擎内部,还有一个毫不起眼的变化,那就是Tessellator(曲面细分单元)升级到了第七代,那么这一代到底有什么改进呢?
我们知道,
NVIDIAGF100核心内部拥有多达16个曲面细分单元,GF104核心也有8个之多,而
AMD的HD5000全系列都只有1个曲面细分单元,现如今HD6000系列还是维持全局共享1个的设计不变,其低下的曲面细分性能成为了
NVIDIA攻击AMD最充分的理由。
HD6000系列可以说是半代改进的架构,既然数量上维持不变,就只能从改进效率的方面考虑了。而改进的内容就是加强线程管理和缓冲,也就是上页我们介绍过的“双倍的超线程分配
处理器和指令缓存”。
根据AMD官方提供的数据来看,HD6870的曲面细分性能最多可达HD5870的两倍,这种情况出现在10级左右的中等细分程度,当曲面细分达到20级以上的时候,那么它们的性能就基本上没有区别了。
由此可见,Barts核心当中的Tessellator单元本身在性能方面应该没有改进,其性能提升主要源于两颗超线程分配处理器。中等级别的曲面细分在指令分配方面是瓶颈,Barts改进的架构消除了这一瓶颈,所以性能提升十分显著,但如果细分级别特别高时,Tessellator本身的运算能力将成为瓶颈,此时线程派遣器的效率再高,也无济于事
曲面分太细没有意义
通过前文的分析我们可以知道,HD6000在曲面细分方面的改进其实与双线程分配
处理器是一回事,性能提升也是在特定的情况下才会出现。但总的来说还是能有1.5倍-2倍的提升,这对于消除A卡在Tessellation方面的瓶颈还是很有意义的。
不过,
AMD还是坚持认为当今的GPU和游戏尚不需要特别强悍的曲面细分能力,简而言之就是“曲面分得太细并不能让图形画质变得更好,但却会造成图形性能大幅下降”。其实,笔者也认同这种观点,但曲面细分性能也不能太弱。
下面我们就看图说话,笔者选择了目前曲面细分级别最高的一款DX11 Benchmark程序和
NVIDIA官方曲面细分演示Demo进行说明:
Heaven是款不错的DX11 Benchmark程序,其1.0版本是基于HD5000而开发的,Tessellation只有Normal级别。在GTX480发布之后,很快就诞生了2.0版本,其测试场景并没有太大变化,最核心的内容就是将Tessellation提升至Extreme级别,大家可以发现,片面提升曲面细分的结果就是:除了FPS暴降之外很难看出画面有什么提升!
然后通过测试成绩我们就可以发现,Heaven 1.0的成绩是很正常的,四款
显卡的性能表现完全在意料之中。而在Heaven 2.0当中,局势完全被逆转,GTX480超越了双核的HD5970,GTX470都大幅领先与HD5870。这组成绩确实证明了GTX480和GTX470在重度曲面细分环境下拥有非常出色的效能,而HD5000将会出现严重瓶颈导致效能大降,但实际上却没有多少实际意义,因为加重曲面细分级别并没有带来画质改善,那么我们凭什么非要开到Extreme级别呢?
综上所述,通过两款曲面细分的代表Demo截图我们就会发现,当今的游戏其实并不需要把曲面分得太细,只要将插值顶点的数目控制在一定的范围之内,画面就非常精细了,盲目提高插值级别的做法没有太大意义,可谓是得不偿失。
事实上,当今所有的DX11都是这么做的,虽然使用了Tessellation技术,但都只是蜻蜓点水、适可而止,即便如此已经可以让游戏画面得到很大的改善。游戏不同于技术演示Demo或者SDK,而是本着实用化的原则,追求高效率运行,而不是专门用来刁难显卡的。
也就是说,以现有HD5000的Tessellation运算能力,是完全足以胜任今后较长一段时间内DX11游戏的需要。GTX480/470虽然拥有N倍于HD5000的Tessellation运算能力,但除了能够在为数不多的几款Demo当中蹂躏A卡外,似乎并没有其它用途。等到未来游戏真正需要更强的曲面细分性能时,当今的顶级显卡可能几百块钱处理都处理不掉了,未来的游戏同样需要更强的浮点运算能力,而不是片面注重某一特定技术的性能。
改进AA和AF画质效率
从G80时代开始,
NVIDIA不满足于业界标准MSAA(多重采样抗锯齿),推出了自己的CSAA(CoverageSamplingAnti-Aliasing,覆盖采样抗锯齿)标准,从而实现了更高的精度和更佳的效率。
而
AMD也不逞多让,争锋相对的推出了CFAA(Custom Filter Anti-Aliasing,定制过滤抗锯齿),实现了更高倍数的抗锯齿模式。但是这种CFAA并没有得到游戏厂商的认可,因为这种自定义扩大采样色彩采样范围的抗锯齿模式,会出现将物体边缘变模糊的现象。
从G80发布至今,
NVIDIA的CSAA技术得到了越来越多游戏开发商的认可,相信很多玩家都注意到了,现在不少游戏都直接在菜单中提供了CSAA选项,N卡用户不用进入驱动控制面板就能非常方便的调用。而AMD的CFAA虽然从HD2000时代已经沿用到了HD5000时代,但几乎无人问津。
终于到了HD6000时代,AMD抛弃了实用价值并不高的CFAA,开发了一种新的抗锯齿方案——Morphological AA,直译为形态抗锯齿。这种抗锯齿采用了DirectCompute计算技术来进行高效率的后
处理器过滤,
新的抗锯齿模式适用范围比传统的MSAA更广,而且精度最高可达24x,效率方面比SSAA(
超级采样抗锯齿)快很多,与最高精度的CFAA差不多,但画质要更好。
除此之外,HD6000系列还改进了AF(各项异性过滤)算法,使得纹理材质的清晰度和画质进一步提高,且不至于出现失真和变形。每一代新产品出现后NVIDIA和AMD都会强调AF画质和效率会更好,事实上它们前几代产品已经做得足够好了,新的改进除了用专业测试软件才能看出很小的区别外,在普通游戏中谁会注意到如此微不足道的变化呢?
UVD3.0支持DIVX/XVID硬解码
在3D引擎部分,Barts核心相对于Cypress的改进并不多,只有超线程分配
处理器、指令缓存、曲面细分模块和AA/AF算法这些。
从架构图中我们可以注意点,
AMD的UVD(Unified Video Decoder,通用视频解码器)引擎现在升级到了第三代:
上图非常直观的揭示了UVD三代引擎在功能方面的改进,UVD2主要是加入了对即将淘汰的MPEG-2编码的硬解支持,让
CPU占用率进一步下降,性能方面接近于
NVIDIAVP3引擎。
★ UVD3引擎改进之一:MPEG-2完全硬解码
UVD3的改进最为彻底,MPEG-2编码最复杂的熵解码部分也可以支持硬解了,从而实现了完全硬解码,达到了
NVIDIAVP3的水平。不过对于这种即将被淘汰的编码进行改进并不是UVD3的重点。
★ UVD3引擎改进之二:多屏、超高分辨率、多路视频流、3D蓝光硬解码
UVD3最有价值的改进就在于对与Eyefinity多屏应用模式下,超高分辨率视频解码的支持,以及多路视频流解码支持,还有3D蓝光硬解码支持。
★ UVD3引擎改进之三:加入了DivX/xVid视频硬解码支持
目前互联网上流行的很多盗版
电影都是采用了DivX压缩格式,主要集中在
DVDrip以及部分720p高清视频电影方面。另外新兴的XviD标准也因为更高的压缩率和画质在迅速成长。这两种由MPEG-4衍生出来的视频编码有着为数不少的影片(尤其是日本动作片)。
低分辨率的DivX/xVid视频码率并不高,对于
CPU要求较低。但近年来也有朝着高清发展的趋势,分辨率提高之后的影片由于其压缩率很高因此解码时的CPU占用率并不低。此次UVD3解码器对DivX和Xvid提供了支持,可谓是民心所向。
★ UVD3引擎改进之四:视频画质接近满分
根据AMD官方公布的数据来看,在HQV Benchmark 2.0测试中,HD6870几乎可以达到满分的成绩,远胜过NVIDIA最新的GTX460
显卡,和
Intel的整合
显卡不在一个档次。