集群存储是将多台
存储设备中的存储空间聚合成一个能够给应用服务器提供统一访问接口和管理界面的存储池,应用可以通过该访问接口透明地访问和利用所有存储设备上的磁盘,可以充分发挥存储设备的性能和磁盘利用率。数据将会按照一定的规则从多台存储设备上存储和读取,以获得更高的并发访问性能。
定义
集群存储是指:由若干个“通用存储设备”组成的用于存储的集群,组成集群存储的每个
存储系统的性能和容量均可通过“集群”的方式得以叠加和扩展。
传统的
存储系统由于受到其物理组成(例如:控制器性能,总线性能,
磁盘驱动器的数量,所连接服务器的数量,内存大小,NAS头的性能等)的限制,以及功能上的局限(例如:支持文件系统的
容量,元数据和
数据处理通路的耦合,快照或复制的数量等),造成了存储系统瓶颈的出现。
一旦遇到
存储系统的瓶颈,就会有两种选择:一是:采用硬件更加强大的单个存储系统;二是:采用若干个普通性能的存储系统来组成“存储的集群”。“集群”作为一项已被广泛使用的
体系结构,如果采用到存储上组成“集群存储”,就可提供按比例增加的存储资源的性能、
容量、可靠性及可用性,突破了单机设备的种种限制。
诞生
集群存储是有别于传统的SAN和NAS的一种新的存储架构。传统的SAN与NAS分别提供的是数据块与文件两个不同级别的存储架构,而集群存储是主要面向文件级别的存储系统。因此,也常常被称为集群NAS。
SAN系统具有很高的性能,但是构建和维护起来很复杂。由于数据块和网络需求的原因,SAN系统也很难扩容。NAS系统的构建和维护虽然比较简单,但由于其聚合设备(又称为NAS头)是其架构上的瓶颈,造成其性能很有限。集群存储集中了SAN和NAS的优点,且具备它们不具有的优点。在大多数使用集群存储的案例中,随着存储系统的扩容,性能也随之提升,理论上,一个大的集群存储的性能往往胜过一个SAN系统,但是价格却比SAN更加具有优势。集群存储和NAS的概念是在文件系统层面上的,而SAN是在LUN层面上的,集群存储可以利用SAN环境实现。因此,集群存储与SAN解决的问题不同。如果一定要比较这两者的优缺点的话,可以说,SAN做到的是多个服务器节点可以同时看到SAN环境中的同一个LUN,还不能做到多服务器节点间的文件级共享。集群存储在性能、可靠性及扩展性等多个方面都远远优于传统的NAS。
主要特点
1. 开放式架构(高扩展性)
它针对集群存储内部构成元素而言。一般集群存储应该包括存储节点、前端网络、后端网络等三个构成元素,每个元素都可以非常容易地采用业界最新技术而不用改变集群存储的架构,且扩展起来非常方便,像搭积木一样进行存储的扩展。特别是对于那些对数据增长趋势较难预测的用户,可以先购买一部分存储,当有需求的时候,随时添加,而不会影响现有存储的使用。
2. 分布式操作系统
这是集群存储的灵魂所在。所有对集群存储的操作都经由分布式操作系统统一调度和分发,分散到集群存储各个存储节点上完成。使用分布式操作系统带来的好处是各节点之间没有任何区别,没有主次、功能上的区别,所有存储节点功能完全一致,这样才能真正做到性能最优。
3. 统一命名空间
统一命名空间在很多厂家的存储概念中都出现过。在集群存储中,统一命名空间强调的是同一个文件系统下的统一命名空间。它同样可以支持上PB级别的
存储空间。如果是通过将若干有空间上限的卷挂载到某一个根目录的方式来达到统一命名空间,其效率和出现存储热点时的性能将会大大低于把上PB级别的
存储空间置于同一个文件系统下管理的统一命名空间。
4. 易管理性
目前存储业界的管理方式都是通过各厂商的管理工具,或通过Web界面进行管理和配置,往往
客户端还需要安装相关软件才能访问到存储上的空间。随着需要管理的
存储空间逐渐增大,管理存储的复杂度和管理人员的数量也将会随之增加。而集群存储应该提供一种集中的、简便易用的管理方式,对
客户端没有任何影响,采用业界标准的访问协议(比如NFS,CIFS)访问集群存储。
集群存储通过分布式操作系统的作用,会在前端和后端都实现
负载均衡。前端访问集群存储的操作,通过几种
负载均衡策略,将访问分散到集群存储的各个存储节点上。后端访问数据,通过开放式的架构和后端网络,数据会分布在所有节点上进行存放和读取。
6. 高性能
关于高性能领域,目前对集群存储的讨论还仅局限在高带宽、高并发访问的应用模式下。毫无疑问,集群存储对于该类应用可以提供比传统存储架构更优的性能。但目前应用除了高带宽、高并发访问类的之外,还有高IOPS、随机访问、小文件访问以及备份归档等其他类的应用,集群存储应该在以上领域同样提供高性能的解决方案。
分类
块级集群存储系统
IBM XIV集群存储系统
3PAR Inserv-T800集群存储系统
EMC Symmetrix V-MAX集群存储系统
Dell EqualLogic 虚拟化存储系统
文件级集群存储系统
HP Ibrix集群存储系统
华赛 N8500集群NAS系统
龙存科技 LoongStore 集群存储系统
北京初志 CZSS 集群存储系统
Panasas 集群存储系统
联创信安 PanaStor集群存储系统
优势
传统的SAN与NAS分别提供的是
数据块与文件两个不同级别的存储服务,集群存储也分为提供数据块与文件两个不同级别存储服务的集群
存储系统。
集群存储的优势主要体现在提高并行或分区I/O的整体性能,特别是工作流、读密集型以及大型文件的访问,通过采用更低成本的服务器来降低整体成本。
SAN系统具有很高的性能,但是构建和维护起来很复杂。由于
数据块和网络需求的原因,SAN系统也很难扩容。NAS系统的构建和维护虽然比较简单,但是由于其聚合设备(又叫做NAS头)是其架构上的瓶颈,造成其性能很有限。集群存储提供了SAN和NAS结构的优点。在大多数使用集群存储的案例中,随着
存储系统的扩容,性能也随之提升。一个大的集群存储的性能往往胜过一个SAN系统,但是价格也会更高。集群
存储系统像NAS系统一样易于构建、操作和扩容。大多数集群
存储系统没有传统NAS系统的固有瓶颈。
集群存储有两种实现方式:一种是
硬件基础架构加上软件,典型代表是SAN架构+IBM GPFS;另一种是专用集群存储,典型代表是
Isilon、NetApp GX以及Panasas,其中NetApp GX是构建在NAS基础架构之上的,但是通过操作系统实现集群存储。从这个角度讲,集群存储与SAN或NAS不存在竞争关系,是实现不同存储需求的解决方案。”
集群存储和NAS的概念是在文件系统层面上的,而SAN是在LUN层面上的,集群存储可以利用SAN环境实现。因此,集群存储与SAN解决的问题不同。如果一定要比较这两者的优缺点的话,可以说SAN做到的是多个
服务器节点可以同时看到SAN环境中的同一个LUN,还不能做到多服务器节点间的文件级共享。
集群存储在性能、可靠性及扩展性等多个方面都远远优于 NAS。