数据中心
全球协作的特定设备网络
数据中心是全球协作的特定设备网络,用来在internet网络基础设施上传递、加速、展示、计算、存储数据信息。
内容简介
数据中心是全球协作的特定设备网络,用来在因特网络基础设施上传递、加速、展示、计算、存储数据信息。数据中心大部分电子元件都是由低直流电源驱动运行的。
数据中心的产生致使人们的认识从定量、结构的世界进入到不确定和非结构的世界中,它将和交通、网络通讯一样逐渐成为现代社会基础设施的一部分,进而对很多产业都产生了积极影响。不过数据中心的发展不能仅凭经验,还要真正的结合实践,促使数据中心发挥真正的价值作用,促使社会的快速变革。
价值
随着数据中心行业在全球的蓬勃发展,随着社会经济的快速增长,数据中心的发展建设将处于高速时期,再加上各地政府部门给予新兴产业的大力扶持,都为数据中心行业的发展带来了很大的优势。随着数据中心行业的大力发展,将来在很多城市中都会有很大的发展空间,一些大型的数据中心也会越来越多。2017年全球经历了前所未有的自然灾害之后,很多数据中心管理人员都在积极制定灾难恢复计划。例如就可以通过云计算工具对电力使用的功率进行限制,在遭遇停电时间时将允许以降低的功率继续运行,可以为电力企业的正常运行提供有效的保障。还可以利用数据中心指定备份计划,对服务器的操作进行拓展,就不需要通过关闭和重启服务器操作。
数据中心是与人力资源、自然资源一样重要的战略资源,在信息时代下的数据中心行业中,只有对数据进行大规模和灵活性的运用,才能更好的去理解数据,运用数据,才能促使我国数据中心行业快速高效发展,体现出国家发展的大智慧。海量数据的产生,也促使信息数据的收集与处理发生了重要的转变,企业也从实体服务走向了数据服务。产业界需求与关注点也发生了转变,企业关注的重点转向了数据,计算机行业从追求的计算能力转变为数据处理能力,软件业也将从编程为主向数据为主转变,云计算的主导权也将从分析向服务转变。
在信息时代下,数据中心的产生,更多的网络内容也将不再由专业网站或者特定人群所产生,而是由全体网民共同参与。随着数据中心行业的兴起,网民参与互联网、贡献内容也更加便捷,呈现出多元化。巨量网络数据都能够存储在数据中心,数据价值也会越来越高,可靠性能也在进一步加强。
常见故障
数据中心网络常见的通讯故障主要集中在:硬件故障、系统故障两个类别:
(1)硬件故障:
数据中心是通过无数计算机硬件组成的,硬件出现问题,就会导致部分功能无法正常发挥或运作。无论是设备、线路、端口,哪一点出现故障,都会导致网络通讯故障的出现。硬件方面的故障相对比较容易查找,例如线路故障,一般的成因就是线路明显的老化或者破损,而影响到了整体网络的运营;再比如,端口故障,计算机端口作为数据中心网络的重要环节,若出现接触不良、损坏等传输问题,就会影响到整体网络的运行。硬件故障只要进行逐一排查,就可以及时进行更换处理,相对比较好解决。
(2)系统故障:
数据中心是计算机领域比较热门的研究之一,因此研究技术十分成熟。计算机网络构成主要包括TREE、FAT-TREE、BCUBE、FICONN等,主要采用模块化、层次化、扁平化的设计思路与虚拟化的分割管理技术,将成千上万台设备,以单元为单位进行划分,逐一进行管理。通过分层、递归的结构进行联结,尽可能的避免了所谓“关键节点”的存在。这样组合也形成了良好的冗余与容错性,如果其中出现故障的某一个或某几个单元,没有被检测出来,也不至于影响数据中心的整体运行。但是如果超出一定比例,就会在影响数据中心网络的高速运行,拉慢网络通讯的速度,所以仍旧需要针对性的查找故障进行处理。
故障处理
(1)分析故障现象:
一般来说由于构成组件比较复杂,故障也呈现出不同的表现方式。因此想要对于故障进行分析,就要先了解故障的现象。例如,应用方面出现了支付系统支付不了,网页难以打开等问题,那么就要逐一检查相关的故障点,有哪几个故障是上述表现,如,线路故障,端口故障等,就要更换线路、端口等设备。因此,需要针对数据中心网络的几种常见的故障进行收集与整理,根据现象,进行检索、查找。
(2)测试并确认故障范围,进行故障点定位。
所有的应用业务是在这些物理硬件正常运行的基础上开展的,其中某些硬件出现问题就会导致故障。根据故障的表现,需要针对各个部分进行筛选检查,例如,对于服务器进行测试,检查网络设备等。针对问题表现,进行逐一排除,最终敲定故障点所在位置。
(3)如果以上硬件故障都已经排除,那么就是计算机系统的故障,这一故障需要建立故障模型进行诊断,根据PMC模型进行定义。通过分层测试的方法,查找问题单元,即正常单元测试正常单元、正常单元测试故障单元、故障单元测试故障单元、故障单元测试正常单元等四种。其中后三种的检测结果都是故障,因此就可以通过分层测量的方式,建立有限个单元,通过矩阵以及萤火虫算法重点FAFD算法对于其他单元进行诊断,最终确定故障的系统是哪个或者哪几个单元的。当然也可以通过镜像、流量统计、抓包等其他手段确定故障所在的设备范围,进而缩小范围,集中处理某一个或者几个设备。
(4)收集重要的数据信息。
在进行故障处理时,通过收集设备的日志、诊断、操作记录等信息资料,将这些数据资料进行汇总,条件允许的情况下,建立故障数据库,对于常见问题可以做到“出现即处理”,对于没有出现过的故障,可以继续收集进数据库。总之,必要的信息收集,有利于日后更好的查找故障原因,确保数据中心网络健康、平稳运行。
冷却技术
数据中心冷却技术的发展有以下趋势。
一、末端冷却设备贴近服务器
以前数据中心机房普通采用房间级空调,地板下送风的冷却方式。该方式建设成本低,机房利用率高,用于解决3~5kW的单机柜发热。但随着机架式、刀片式服务器在机房大量应用,单机柜内设备数量、功率密度、发热密度都有显著提高。传统的机房级空调已经不能解决IT设备的散热问题,行级空调、背板空调应运而生。这种新型的空调末端更贴近热源,能解决局部热点、高发热密度的问题,通过近距离的冷量传输,减小风机功耗,达到节能。不论房间级空调,还是行级空调、背板空调,都是先冷却空气,再通过冷空气与服务器的CPU进行热交换来降温。由于空气的换热效率、热流密度很低,空冷服务器有冷却能耗高、噪声大、设备密度低等问题。为解决超高功率密度IT设备散热难题,数据中心开始采用液冷技术,使用工作流体作为中间热量传输的媒介,将热量从发热区传递到远处再进行冷却。液冷技术冷却效率显著高于风冷散热,可有效解决高密度服务器的散热问题,降低冷却系统能耗而且减少噪声。
二、重视冷却系统节能
随着数据中心的竞争加剧,运营成本的压力增大,冷却系统的节能研究迫在眉睫。随着耐高温服务器的出现,越来越多的数据中心逐步尝试开发使用free-cooling(自然冷却)。自然冷源的利用主要有以下2种方向。
1、新风直接冷却
典型的案例就是Facebook在美国俄勒冈州普林维尔的数据中心。室外新风经过滤处理后,进行加湿降温,然后通过风扇墙送入机架的进风口,室外新风经服务器加热后排到室外。这种方式对室外空气质量的要求高,宁夏中卫的一些数据中心尝试应用了该技术。
2、利用深层湖水、江水冷却
典型的案例是湖南省资兴市东江湖数据中心。东江湖为我国中南地区最大的人工湖,冷水资源丰富。东江湖面积160平方千米,蓄水量8.12×109立方米。其下游小东江水温常年低于10℃,水流稳定且水质达到国家一级标准。全年90%的时间不需要机械制冷,采用江水直冷冷却,预计年平均PUE为1.15。
应用
一个数据中心的主要目的是运行应用来处理商业和运作的组织的数据。这样的系统属于并由组织内部开发,或者从企业软件供应商那里买。像通用应用有ERPCRM系统。一个数据中心也许只关注于操作体系结构或者也提供其他的服务。常常这些应用由多个主机构成,每个主机运行一个单一的构件。通常这种构件是数据库,文件服务器,应用服务器,中间件以及其他的各种各样的东西。数据中心也常常用于非工作站点的备份。公司也许预定被数据中心提供的服务。这常常联合备份磁带使用。备份能够将服务器本地的东西放在磁带上,然而,磁带存放场所也易受火灾和洪水的安全威胁。较大的公司也许发送他们的备份到非工作场所。这个通过回投而能够被数据中心完成。加密的备份能够通过Internet发送到另一个数据中心,安全保存起来。为了灾难恢复,各种大的硬件供应商开发了移动设备解决方案,能够安装并在短时间内可操作。供应商像思科系统,Sun微系统,IBM和HP开发的系统能够用于这个目的。
参考资料
最新修订时间:2024-12-05 10:41
目录
概述
内容简介
价值
参考资料