容错计算机系统
容错计算机系统
容错计算机系统(Fault-tolerant Computer System),是当计算机系统内的部件出现允许故障时,仍能正确执行所规定任务的一种计算机。
定义
容错计算机系统可靠性较高,具有一定容错能力的计算机。容错是指计算机在运行期间,软件或硬件出现故障时,系统能自动切换资源,采取补救措施,以保证系统继续正确执行任务。这种切换可以是切换到处于待用状态的设备,也可以是把大部分负载转给非饱和状况运行的设备,还可以是在计算机系统不停止运行 情况下,切换电源、冷却系统或其它部件。设计这种计算机采用了容错技术,如采用了纠错码、系统恢复技术、冗余技术、指令复执、程序复算、备件切换、系统降级重新组合、配置检查程序和诊断程序等。但当系统 出现了容错措施许可范围以外的故障时,计算机仍然不能继续正确运行。容错计算机多用于要求高可靠性、 高安全性的场合。如用于飞机自动驾驶的控制系统、航 天飞机操纵系统、卫星的星载系统等。
容错技术
容错技术是指当系统在运行时有错误被激活的情况下仍能保证不间断提供服务的方法和技术。在一些特殊应用场合,如航空航天、国防军事、核能电力、工业化工、卫生医疗急救等关键部门,一次计算机系统错误的发生就可能导致不可挽回的巨大损失,在这些关键系统的设计中必须采用大量的容错技术来保证运行中突发的计算机错误不会导致整个系统的失效。
应用
日前,我国首台高端容错计算机在金融示范应用系统成功启动上线测试,这标志着我国高端容错计算机系统研制实现重大突破.“第一台高端容错计算机样机研制完 成,意味着我国在金融、电信等关键领域高端计算机一直被国外垄断的现状即将被打破,并有望实现这类信息化建设重大装备的自主可控.”国家最高科技奖获得 者、中国工程院院士金怡濂表示.
高端容错计算机是面向高端商业应用的高性能、高可靠大型计算机,是金融、电信等关键业务系统的核心设备.但长期以来,该类产品市场为国外企业所垄断,以银行业为例,目前国内银行的核心业务采用的大型计算机全部是进口设备.研制国产高端容错计算机系统,并通过示范应用实现产业化推广,对于确保我国金融、电信等要害部门信息系统的自主可控、安全可信有重大意义.
在科技部“十一五”863 计划的支持下,浪潮集团联合国防科技大学、中国建设银行承担了“浪潮天梭高端容错计算机研制与示范应用”课题.经过数年技术攻关,课题组在高端容错计算机体系结构、系统总线协议设计、核心芯片组设计、系统BIOS设计以及容错操作系统核心等关键技术方面实现突破,完成了系统样机研制.
据863计划信息领域专家、浪潮集团高级副总裁王恩东介绍,浪潮天梭高端容错计算机项目自主研发的核心芯片接口速度达到10Gbps,性能达到国际领先水平.一系列自主研发的系统板卡,在集成度、聚合带宽等方面,也已经达到国际竞争对手的现有产品水平.
“此项目有三大意义:技术、经济和安全.”金怡濂说,“当初专家进行论证,最关心这项技术能否推广应用,与国外企业比较是否有竞争力.”自主创新成果成功走向产业化的关键在于应用.建设银行结合业务发展战略,在风险可控的前提下,大胆创新,积极主动承担了高端容错计算机在银行关键信息系统中应用示范的任务,以提高我国自主产品的成熟度,促进产业化.
今年8月15日,国产第一台浪潮天梭高端容错计算机进入建设银行新疆分行机房完成安装和测试.新疆分行组织强大的科研队伍在样机上进行业务软件移植,目前示范应用已经移植成功,并在样机上经过严格的功能和压力测试,运行情况平稳、正常,各项技术指标均达到了设计要求.
据悉,该系统可用度达到99.999%(即每年停机时间累计不超过5.26分钟),系统支持32颗处理器,2048GB内存,960GB/S输入输出处理能力.根据目前公开的数据和资料,该系统事务处理能力进入世界排名前十.
该项目由科技部组织论证立项,企业牵头,高校和科研机构参与,相关项目单位协调一致、职责明确、运转有效.它的实施对于推广军民融合、产学研用结合的创新模式具有示范效应.
“这只是部分完成了项目总体目标第一阶段的任务”,据科技部相关负责人介绍,预计到2012年年底,项目组将研制成功64路处理器(四核或四核以上)的高端容错计算机,可用度达到99.999%;形成系列产品,并在两个以上关键领域的生产性业务系统上实现规模化应用.
参考资料
最新修订时间:2022-08-25 12:25
目录
概述
定义
参考资料