XDR就是“eXtreme Data Rate”的缩写,这
是Rambus的黄石的最终名称。XDR将Rambus之前公布了一系列新技术集中到了一起,新技术不仅带来了新的
内存控制器设计和DRAM
模块设计,同时可以工作在相当高的频率,带来让人难以置信的带宽。
黄石计划
Rambus是一家位于美国加州洛斯拉图斯市的小公司,这家主要以知识产权作为核心的公司规模并不大,因为其并没有自己的工厂,但其当年凭借
RDRAM内存一炮打响从此受到人们的关心。这个公司曾经是Intel的主要支持厂商之一,RDRAM很长一段时间内一直作为Intel的推荐内存配置之一,不过由于RDRAM在一段时间内一直没有大的技术架构改进,效率提升并不明显,为此Intel也放弃了对RDRAM内存的支持,850E
芯片组+PC1066 RDRAM的组合成为Intel同RAMBUS公司的最后一次全力合作。
当然,RDRAM内存的失主要是因为
DDR内存的逐渐成熟有一定关系的,DDR内存相比原来的
SDRAM内存物理架构变化并不大,但性能却可以有很大提升,随着DDR内存频率的不断提升以及
双通道DDR内存方案的出现,一个高性能,低成本的内存解决方案已经彻底被DDR内存所占据。虽然Intel目前已经退出了RDRAM内存的使用,但还是有一些厂商在推广RDRAM内存,SIS是目前唯一同RAMBUS有亲密合作的主流
芯片组厂商,其新发布的SiS659芯片组是采用RDRAM内存的新产品。
其实客观的来看RDRAM内存,这还是一个非常不错的内存解决方案,并且其潜力是非常巨大的。目前的RDRAM即使只使用16bit的
位宽也可以获得相当惊人的传输速度,并且同处理器
总线保持一致的频率也让系统效率变得更加容易发挥。不过目前围绕着RAMBUS公司的情况确实非常的艰巨,高昂的成本以及很少的主力合作伙伴都让RAMBUS变得孤立无援,如果继续这样下去,RAMBUS公司前景不容乐观。值得庆幸的是7月10日,RAMBUS联合Toshiba(
东芝)以及Elpida推出了新一代的产品XDR内存解决方案,这种内存解决方案就是基于此前相当著名的黄石(YellowStone)计划。
黄石计划是于2001年的Rambus Developer Forum 2001会议上确立的发展计划,计划核心就是以全新的面貌来展现RDRAM内存,黄石计划从规划到正式提出花了三年的时间,正式启动也花了两年的时候。
技术前瞻
XDR的8倍数据传输率主要依靠以下技术实现。首先,
主板的
时钟信号提供了XDR上的时钟锁相环的基础信号,并把芯片内部时钟信号提高到1.6GHz,这是由RDRAM颗粒内部的时钟锁相环来实现的。而数据在这个
时钟信号的两端同时传输,因此它能达到3.2GHz的频率,是系统时钟频率的八倍。其实在1992年双倍时钟速率的RDRAM就已经推出,当时它的
工作频率是256MHz,而数据传输率是500MHz,它是通过在
时钟信号的上升延和下降延来传输信号,这样就把
时钟频率提高了一倍,这点和DDR SDRAM的工作原理是一样的。四倍RAMBUS信号模式可以使用更多级别的信号来在一
时钟周期内可以传输4bit数据,可以理解为在RAMBUS颗粒中使用了2倍的
时钟频率,然后通过在
时钟信号的上升延和下降延同时传输信号来达到4倍的数据传输率。现在8倍
数据传输率可以在400MHz的
系统总线频率下使用1.6GHz的频率,相当于每个
时钟周期传输8bit数据。对比一下,DDR SDRAM内存可以在一个时钟循环中传递2个Bit的数据,因此命名为“Double Data Rate”。按照这种命名方式,XDR也许可以称作
ODR了,也就是“
Octal Data Rate(八倍数据传输)”,这也是XDR产品如此高频率的关键。
现在的电脑似乎只有
双通道和四通道内存模式,不过XDR模块技术则官方宣布可以达到八通道模式(51.2GB/s带宽),在今后可以达到更高的标准。这样的规格表明XDR并没有(或者说不仅仅)面向PC市场,Rambus还希望它可以在控制台、网络设备等市场有所作为。
对于XDR内存来说还有几个特点是必须要指出的,首先就是Differential RSL(微分RSL传输):DSRL技术允许XDR使用标准的PCB板和标准阻抗,因此终结电阻可以设置到芯片内部,因此不需要额外的中结器,这对于RDRAM的发展来说是很重要的,可以大大简化RDRAM模组的使用和配置,并且可以降低系统的成本。而DDR主板需要花费成本和PCB板空间来安置终结电阻。而芯片内部的终结器是不需要花费什么成本的,它还可以提供更加干净的信号。
DRSL另外一个好处就是超低电压信号传输,它的信号阀值电压只有0.2V,而DDR的信号阀值电压从TTL的3.3V降到了SSTL的2.5V,而XDR内存的DRSL只有0.2V。LVTTL和SSTL并不是纯净的方波,信号幅度高低各不相同,而RSL和DRSL的信号电压很少。
不过,虽然内部工作原理同DDR内存有一些相似之处,但是真正要使用XDR内存却并不如现在的DDR内存那么简单,因为实际上的外部接口上来说XDR内存同DDR是完全不同的,相对而言XDR内存到和RDRAM内存比较相似,两者都采用了16位的
内存控制器,不过XDR做了一些改进来达到更高的
工作频率。
在XDR控制器的左侧和下部各有一个XMC。不过每个XDR内存模块的
工作频率都是3.2GHz,那么XDR内存就可以给我们带来12.8GB/s的带宽。XDR的每个内存通道都需要在尽头有自己的终结器(Termination),这个设计也是同RDRAM一样。XDR内存可以在实际的内存模块中包含这样的终结器,而不需要采用独立的终结模块(
C-RIMM的设计),不过由于串行的特点,总线还是需要终结器的。
我们在这里看到XDR内存和RDRAM内存最大区别就是XDR有独立的数据和地址/指令总线。Rambus的结构需要数据通过所有的
内存模块,这也造成了RDRAM的高延迟性(相对于DDR而言),XDR通过两条独立的总线解决的这一问题,其中地址/指令总线还是需要经过所有的内存模块,不过数据则可以由
内存控制器直接进入对应的模块。显然,XDR简洁的内部构架要比当时还在酝酿中的DDR3更为合理和先进。
和RDRAM一样,XDR也需要一个独立的频率发生器芯片。RDRAM的频率发生器是其能否在主板上
超频工作的关键,也决定了RDRAM能够以怎样的频率工作。如果RDRAM的频率发生器质量不够好,那么将会限制内存模块的性能发挥。不过这一切对于XDR而言都不是问题了,Cypress和ICS都已经签约为XDR制造频率发生器。
尽管Rambus会在第三方厂商设计自己的XDR
内存控制器时提供技术和人员的支持,不过让那些进入DDR领域的厂商重新设计内存控制器可不容易。比如说ATI和nVidia,两家公司都想设计出更高带宽的显卡显存系统,如果已经在DDR
内存控制器上投入了上百个工程师和无数的金钱之后,转到DDR II内存只需要一些小的改动,不过采用全新的XDR,恐怕并不容易。 XDR内存比较有意思,这次架构同目前实际使用的DDR、DDR II并没有太大的差别,但XDR却依旧拥有自己的知识产权。XDR在今年年内会有样品出现,明年中后期正式推广,同原来一样
三星依旧是RAMBUS的核心伙伴,另外
东芝和Elpida也将出现。
DDR和XDR之间最大的差别是就在
内存控制器和实际
内存芯片的接口上。这并不会让人感到奇怪,Rambus已经将自己定位成了一家“接口”公司,他们宣称中档的XDR内存也要比目前的DDR400内存快8倍,而最新款的XDR-II
内存速度已达到DDR667的16——20倍。
产品定位
目前具有一身本领XDR只能在
索尼的
PS3游戏机上显一把身手,尽管网络、桌面和
工作站领域对内存的要求越来越高,不过在这些领域都没有用到我们提供的全部
带宽。AMD和Intel的最新款
芯片组都可以提供6.4GB/s的带宽,不过我们没有发现这和3.2GB/s带宽系统在性能上有什么差别。既然这样,那么XDR内存的最大亮点“高带宽”在主流PC上就没有什么发挥的空间,当然这个仅指当前的电脑。
正因为这样,Rambus就将XDR内存的第一目标定在了显卡市场,这是一个意义重大、影响深远的举动。在显卡领域,
显存带宽是制约显示卡性能发挥的重要障碍。设计师们需要不断提高显存的接口
位宽来得到更高的
显存带宽,这样显然大大提升了显示卡的成本。如果用低成本、
针脚数少、带宽高的XDR内存来取代目前的256位DDR、DDR II内存,那么其带宽可以很好的满足GPU需要。
不过Rambus不准备将全部希望放在显卡上,他们会计划向高性能网络设备、移动PC、超级电脑等方面进军,当然还有游戏主机市场。Rambus在游戏主机市场成绩还是不错的,任天堂(N64)和Sony(PS 2)都采用的Rambus技术,同时Sony更具有Yellowstone的技术许可。Rambus在这片市场大有可为。
Rambus并没有放弃PC市场,仅仅是没有将其定位第一目标,目前也不是XDR进入的最佳时机。XDR的希望在今后的2、3年,CPU和I/O带宽将会对内存提出更高的要求,DDR和DDR II将无法满足其需要,而XDR将可能通过充分的准备成为PC领域的一种不错的选择。PCI-Express、SATA、Ultra640 SCSI等新技术以及5GHz以上的处理器将会对
内存带宽提出更好的要求,这就是XDR的机会。
而且Rambus已经对未来的PC内存模块做好的规划。由于之前的Rambus内存模块称为RIMM,这次使用XDR内存的模块就被称为XDIMM了。由于XDR是一项全新的技术,XDIMM的技术细节没有过多的公开,不过我们还是可以猜测到一些大概。
从Rambus提供的图片看来,XDIMM的外形和现在的16位RDRAM模块接近,XDIMM的图片表明其具有和RDRAM同样的尺寸以及相似的接口针脚设计。XDIMM的内部设计看起来就更像32位的RDRAM产品了,只是“T”(终结器)位于模块内部而不是独立存在。地址/指令
总线通过XDR模块和所有的XDR芯片,并在终止器结束,不过每个XDR芯片都有一个和
内存控制器的直接通道,正是这个区别带来了更高的效率、更小的延迟。
产品介绍
目前XDR的生产商主要有
东芝、
三星和
Elpida。
东芝早在2003年底就推出了频率高达3.20GHz容量为512Mb的XDR DRAMs工程样品,这在当时是世界上运行速度最快的
存储器,该版本样品编号为内存样品的编号为TC59YM916AMG32A、TC59YM916AMG32B和TC59YM916AMG32C。之后
三星与2005年初推出了256Mbit 4GHz的XDR DRAM内存。2005年3月,
东芝发布了运行速度高达4.8GHz的第二代XDR DRAM样本——TC59YM916BKG,其容量为512Mb,运行周期为40ns,而
三星则推出6.4GHz的产品。同年9月,Elpida的512Mbit 3.2GHz XDR DRAM产品正式量产。
内存技术
当年Intel力挺的Rambus在与DDR内存标准之争中被击溃之后,痛定思痛,今年再次以新一代的XDR内存来抗衡未来的DDR内存,并将它命名为XDR2。究竟高达8GHz
时钟频率的XDR2会对DDR3造成威胁吗?
【XDR2 Micro-Threaded架构】
XDR 2是Rambus推出的第二代高速内存技术,XDR2主要依靠降低内存回路干扰,再加入上一代XDR原有的FlexPhase和Micro-Threading内存架构等技术来提升效能。与此前的XDR的6.4GHz
时钟频率相比,这种XDR2内存的性能再次攀升,使它能提供8GHz的时钟速度。
XDR2内存拥有Micro-Threaded架构,这是它速度提升的一大动力。由于XDR2在设计之初就着眼于显卡应用领域,在这一技术领域上常用到的访问操作与在电脑上的主内存不大相同。因为显存经常会访问一些小容量的离散数据集合,所以就很有必要对这类应用进行优化。XDR2采用了Micro-Threaded架构,可以针对这一操作进行架构优化,Rambus把它称之为微线程架构。
因为此前在RDRAM内存上只有两个数据通道结构,并且每个通道
位宽只有8 bit。RDRAM的一个逻辑Bank由两个子Bank组成,每个子Bank各接有一个数据通道,因此共有16bit的位宽。当内存工作之时,两个子Bank同时寻址并将各自的数据传向数据通道A与数据通道B。 RDRAM核心在一次行访问间隔中至少要传输64字节的数据,而在一次列访问间隔中,至少要传输32字节的数据。不过在
显卡的应用中,这样大的颗粒度往往会造成带宽的浪费,因为在访问一个图形对象时,一般用不到如此大的数据量,这与图形应用的特点有很大的关系。面对这样的技术缺陷,新一代的XDR2可以依靠Micro-Threaded架构来更好地运用较高的
位宽。
【XDR2与XDR有何不同】
XDR2与XDR内存在整体的架构上差别不大,最主要表现在不同的系统时钟频率和数据传输频率继续攀升等相关总线速度设计之上。
XDR2将
系统时钟的频率从XDR的400MHz提高到500MHz,此外,在用于传输
寻址与控制命令的RQ总线上,传输频率从800MHz提升至2GHz,也就是XDR2系统时钟的4倍。另一方面,XDR2的数据传输频率由XDR的3.2GHz提高到8GHz,也即XDR2系统时钟频率的16倍,而XDR则为8倍。因此Rambus将XDR2的数据传输技术称为16位HDR数据速率。XDR2
内存芯片的标准设计
位宽为16bit,也可以像XDR那样动态地调整位宽,按每个数据引脚的传输率为8GHz计算,一颗XDR2芯片的数据
带宽就已经高达16GB/s的水平了。相比之下,目前速度最快的GDDR3-800的芯片即使
位宽达到32bit,但
数据传输率只为1.6Gbps,6.4GB/s的单芯片传输
带宽只有XDR2的40%水平,显然,两者的数据传输率差距相当大。
【XDR2的技术特点】
除了备受关注的Micro-Threaded内存架构设计之外,RAMBUS为了保证XDR2系统的稳定运行,同时又要让XDR更有效率,因此XDR2在继承了XDR的优点之后继续加入全新的辅助设计来提升效能。XDR2集成了多个重要技术,为了在内存子系统中减少对信号质量有影响的边缘效应,在XDR2上独有的FlexPhase电路设计可以在实时操作的情况下调整速度、电压和温度。XDR2还具备以下技术特点:
◎实现零刷新占用功能
在以往的DRAM进行刷新之时,它是对所有逻辑Bank的相同地址行进行刷新,当遇上其中某一Bank处于工作状态或者要访问某一Bank的时候,就很容易与刷新操作产生冲突了。然而,新的XDR2系统采用了特殊逻辑Bank设计,它可以采取交错控制进行刷新,实现了零刷新占用功能,从而避免了因刷新操作而影响正常寻址情况的发生。
具备动态位宽调整功能
XDR2跟XDR内存相似,具备了动态位宽调整的功能,它可以有2bit、4bit、8bit等动态调整接口的位宽选择,所带来的好处就是可提高XDR2设计的灵活性。当位宽改变之后,访问颗粒度就会随之改变,2bit、4bit、8bit时的列访问颗粒度分别对应为2字节、4字节和8字节,带宽也降至2GB/s、4GB/s和8GB/s的水平。
◎具备弹性相位控制自适应功能
当内存的速度不断攀升之时,XDR2的弹性相位(FlexPhase)同步电路就会发挥作用,它可进行补偿处理,实时应对电压与温度变化所产生的影响。在XDR2系统中,弹性相位控制这一功能是由XIO来完成的,精度可达2.5ps的水平。弹性相位技术可让信号具备数据/
时钟同步与自校准的能力,从而使外围有关时序跟踪的设计与布线变得非常简单,并有助于提高同步性,提高总线利用率。
【GDDR3的有力竞争者】
在应用领域方面,当前XDR2的目标依然是针对高端的显卡市场。现在NVIDIA与ATi两大图形芯片巨头的高端显卡均配备了GDDR3显存,XDR2的推出成为了GDDR3在这一领域中的主要竞争对手。就单颗芯片而言,现在当前最高速度的GDDR3的
带宽仅为6.4GB/s,而XDR2就已经高达16GB/s。如此一来,在保持相同访问效率的同时,XDR2性能至少是GDDR3的2.5倍,单就这一点来说,就有了很大的优势。显然,XDR2已经摆脱了Rambus内存长久以来在随机访问方面的劣势,这跟DDR的架构频率越高所需延迟周期越多密切相关。
在耗电方面,虽然GDDR3的标准设计是1.8V,但最高速的GDDR3-800已经攀升到2.0V,而XDR2-500仍可以保持在1.8V,与第一代XDR内存持平,这对
显卡减负能耗提供了一定的帮助。
未来发展
由于Rambus仅仅是一家纯技术的知识产权公司,也就是所有的XDR内存以及其他相关组件都需要由第三方厂家完成。目前Rambus已经找到了
三星、Elpida和Sony这样的合作伙伴,不过Intel的缺席给XDR的前途带来一些阴影。Intel会不会在今后的产品设计中加入XDR内存?现在谁也无法回答。很明显,Intel在过去和Rambus有过合作,但似乎不是很圆满。Intel认为RDRAM是一种不错的产品,不过没有用在恰当的地方。如果PC对
内存带宽的要求飞快提升,那么我们不会对Intel选择XDR感到奇怪。一切都需要时间来给予最终的解答。
Rambus如果可以找到合适的伙伴,他们可以完成在XDR上的各种承诺。当初他们推出800MHz的RDRAM产品时受到了广泛的怀疑,不过最终的产品打消了人们的疑虑,甚至推出了更高的1066MHz产品。现在的3.2GHz和4.0GHz
工作频率的XDR产品会面临散热的问题,不过Rambus对解决这样的问题充满信心,并认为不需要采用什么夸张的散热系统。当XDR进入生产阶段时,Rambus的合作厂商将可以采用0.11微米或0.10微米技术,这将使XDR产品比目前0.13、0.15微米制程的产品在散热上好的多。
XDR的不利因素就在于成本过高,它想要成功就会很难。在DDR先入为主的情况下,XDR只有在性能或售价上下一番工夫才行。
Rambus通过XDR的推出表明他们不会让DDR家族“一统江湖”,竞争对于普通用户而言总是一件好事,XDR和DDR之间的竞争越是激烈,我们就越是会从中获得好处。究竟DDR,XDR谁主沉浮,那就需要时间来证明了。