蓝色基因是IBM公司设计的一款超级计算机。在计算机体系结构中,在必须编程和控制整体并行系统的软件中和我们在重要生物学的高级计算如
蛋白质折叠中应用。
基本情况
2003年,蓝色基因的原型机经过三年研发问世,当年11月登上超级计算机“TOP500”第73名。日本NEC公司的“地球模拟机” (Earth Simulator)在三年前曾是世界最快超级计算机,其计算能力达35.867万亿次
浮点运算速度,2004年11月被70万亿次浮点运算速度的蓝色基因超过。
IBM蓝色基因超级计算系统是全球速度最快的
超级计算机,代表系统是蓝色基因/L(Blue Gene/L)。在全球最著名的超级计算权威机构
TOP500榜单上,他的峰值
运算速度达到360 Teraflops(Linpark基准运算)。IBM的蓝色基因/L凭借空前的可持续计算性能,以每秒钟280.6万亿次
浮点运算速度夺得冠军位置。
架构设计
蓝色基因系统是由大量运算节点组成,每个节点的时钟频率相对来说都不很快,以节省电力和降低成本。蓝色基因采用IBM PowerPC
嵌入式处理器、嵌入式DRAM和系统芯片技术,并整合所有系统功能,其中包括计算处理器、通讯处理器、三层高速
缓存,在单一ASIC上有着复杂路径的多重
高速互联网络。因为处理器
时钟周期相比之下速度较为缓慢,因此就时钟周期而言,内存近似于处理器。这对减少耗电量来说是一项优点,还能将1024个计算节点(内含2颗
PowerPC嵌入式处理器)放在单一机架内进行密集封装。蓝色基因可以扩充到65536个计算节点(共计131072颗处理器),其峰值速度可达到367万亿次
浮点运算速度,除了
成本效益,还有低耗电、冷却效果好及节省占地面积等特色。
蓝色基因是由下列组件构成:每计算节点2个处理器,每计算卡上有2个计算节点、每
节点板上有16张计算卡、每机架有32个节点板、机架由上下两部分组成,中间有2个中间平面。
每个处理器在每个周期中可以执行4次浮点运算。依照在蓝色基因上所执行应用程序性质的不同,程序设计人员可以选择在单一运算节点上同时采用两个
处理器进行运算,或是以一个处理器专门处理通信。除了这些运算节点外,蓝色基因系统还提供了可弹性决定使用数量的双处理器I/O(输入/输出)节点,这些节点可以处理运算节点和其它系统间的通讯。
蓝色基因的计算节点是通过5种网络来互相连接,这5种网络分别是:1个
3D圆环面网络,用在计算节点间以
点对点的方式传输信息;1个总体集合网络,用于整个应用中的总体运行;1个总体障碍和中断网络;1个
千兆以太网,用来控制机器;还有另1个千兆
以太网,用来连接到其它系统。3D 圆环面网络让每个节点都能和最近的6个相邻节点以低延迟时间、高带宽互连,3D圆环面网络还支持一般的点对点通讯。圆环面网络在使用区域通讯的应用程序上特别有效。总体集合网络对提高平常使用的MPI总体通讯架构的速度相当有用。而总体障碍网络能够迅速地同步化系统内所有处理器的状态。
蓝色基因还需要一个服务节点,在这个节点上
系统管理员可以管理储存资料用的文件服务器。蓝色基因还能管理复杂的前端节点,在这些前端节点上
终端用户可以编译资料并发出工作指令。蓝色基因包含了多种设计创新,可以扩展到之前无法到达的性能水平,而且还能将客户系统的耗电量、散热量和可用的占用空间限制在合理范围内。
软件环境
在软件环境方面,蓝色基因也有特别设计,强调遵守下列三项基本原则:简单化、高效和广泛性。在软件设计时以简单化的原则进行开发,且能够利用硬件功能的优势,既保证高效又兼顾稳定和安全性。而依据熟悉且被广泛使用的程序语言、资料库、工作管理工具和并行文件系统所建立的编程和
管理环境,客户将能够从蓝色基因的创新设计要素中获益,而不用面对陡峭的学习曲线。
蓝色基因的前端节点是程序设计人员存取系统运算核心的入口。前端节点执行标准的SUSE SLES9版本
Linux,能提供使用者熟悉的操作平台,让使用者可以在该操作平台上
编辑程序、进行程序纠错等。支持蓝色基因系统的语言为用在Power PC上标准的IBM XL Fortran、C和
C++编辑器,这些还增加了一个能利用双
浮点运算单元优势的末端,而这个双浮点运算单元是蓝色基因所独有的。
程序设计人员可以运用广受欢迎的IBM工程及科学子程序资料库(Engineering and Scientific Subroutine Library,ESSL),这是一套最先进的资料库,收集了超过400个数学子程序,能给
Fortran、C或C++等语言所写成的浮点工程和科学应用程序提供最佳性能。这些程序中有许多都已经调整成适用于蓝色基因架构。
为了支持并行编写程序,蓝色基因还一并提供了一套MPI解决方案,这套解决方案可以利用美国Argonne
国家实验室的MPICH2数据库,可生成一个利用运算节点通讯技术的执行方案。
在工作任务及平衡工作量方面,IBM LoadLeveler对蓝色基因也提供支持。LoadLeveler已经过许多大规模集群客户的考验,能提供建立、提出和处理工作的设备,其设计是以可用资源来搭配应用程序处理过程中的需求。
蓝色基因中还包括了IBM General Parallel File System (一般并行文件系统,
GPFS),可以进一步强化蓝色基因的软件环境。GPFS是一个高性能的磁盘共享文件系统,它能从蓝色基因的所有节点中提供快速
数据存取功能。应用程序可以立即存取使用标准文件系统界面的共享文件,使用者将因此能从数个节点中存取同样的文件。
蓝色基因系统还包括一个让
系统管理员可以管理该系统的服务节点。管理员可使用的重要功能有系统设定、初始化、监督功能和运行。这些功能都已经整合到IBM Cluster Systems Management产品中,以提供额外的管理功能和在单一控制点上,在CSM支持的运行平台间进行管理。能在服务节点上执行的还有一个和
DB2相关的数据库,这个数据库是静态和动态状态的信息储存点。
总之,蓝色基因系统软件集合了诸多为用户考虑的因素,这些因素都为了达到高性能和高可靠性而加以调整,并符合许多现有集群客户所熟悉的特性。在这种情况下,客户将能够快速让蓝色基因发挥强大计算能力,还能从蓝色基因的结构功能中获益。
性能情况
2005年11月,IBM正式向业界宣布,安装在美国劳伦斯·利弗摩尔
国家实验室的蓝色基因/L超级计算机创造了每秒钟280.6万亿次运算的性能纪录,峰值速度甚至达到367万亿次。在同月发布的世界超级计算机500强排行榜(
TOP500)上,这台机器名列第一名,速度约是第二名的另一台蓝色基因的三倍。所以被称为上世界最快的计算机,IBM蓝色基因当之无愧。2005年12月1日,IBM蓝色基因的样机来到中国。
应用范围
IBM将这一系统称为eServerBlueGene,该系统的计算速度达到了每秒5.7万亿次,它的占地面积不到1平方米。该系统的售价为150万美元。用户也可以从IBM在美国或者欧洲的深度
按需计算中心租用该计算系统。
IBM旗下eServer部门的副总裁ColinParris表示,该系统的推出使得IBM商用计算机系统的性能跨上了一个台阶。在过去几年,IBM一直和其合作伙伴致力于BlueGene计算系统适合处理不同的科研计算任务,涉及的领域包括
生命科学、金融建模、流体力学、量子化学、天文学、气象建模以及
分子动力学。
此外,IBM还致力于将Blue Gene计算系统应用于更广泛的商业应用包括网格计算、商业智能、制造流程等等。
IBM耗费了5年的时间以及1亿美元的成本才开发出了Blue Gene超级计算机系统。
1.蓝色基因能帮助
美国国家大气研究中心的研究人员建立
大气模型,并且能确保该中心在业内处于领先地位。使用蓝色基因系统等超级计算机,美国国家大气研究中心将能更快地建立模型和分析资料,还能估算引起大气变化的天然因素和人类活动正如何影响气候。
2.荷兰ASTRON是领先的天文学组织。这个组织使用蓝色基因作为新型
射电望远镜的中央处理引擎。这款新型的射电望远镜叫做LOFAR,它能够研究宇宙形成后,最早期的
恒星和银河在萌芽阶段的状况。
3.
波士顿大学打算利用蓝色基因来设立处理艰深科学问题的主机,这些科学问题包括核物理学、
基因学、细胞生物学到宇宙气候和海洋系统的模型建立。例如,波士顿大学的研究人员打算利用蓝色基因来预测太阳表面上的活动(例如
太阳耀斑)是如何影响地球的辐射带、地球的上层大气层和
电离层。当许多科学家和研究人员将大规模集群运算应用到不同的问题组,并在类似计划发展中建立共同的专业知识时,蓝色基因的相关性就变得更加清楚。
研究成果
首次运用
蓝色基因计划在2000年第一次获得授权时,其目标就是发展能应用于
生物分子现象(例如
蛋白质折叠)研究的大型并行计算机。这些努力的成果将能通过大量的模拟,对蛋白质折叠的机制有更进一步的了解,此外还能探索在大型并行计算机架构和软件方面的创新想法。蓝色基因所能提供的性能等级能够大幅度提高模拟的规模,并远远超越其它超级计算机。在此规模上,成功的蛋白质折叠模拟研究可望在生物分子仿真的技术、模型和算法上能有更进一步的发展。
诸多不同应用层面的实践经验显示,蓝色基因架构适用于各学科间相互关联的作业。IBM与许多机构正共同努力,扩展蓝色基因架构上
高性能计算应用的名单,这些应用包括了生命科学、金融模型、流体力学、量子化学、
分子动力学、天文学和宇宙研究、
材料科学和气候模型。
模拟猫脑
据PhysOrg网站报道,IBM的研究人员通过一个称为“蓝色项目”的新计算程序绘制了人类大脑内部大脑皮层和皮层下组织节点的系统连接图。然后这个研究
团队建立了猫的大脑皮层模拟机构,其中包括10亿
脑细胞和10兆认知神经元
突触,信息的传递和连接就在这些神经元中间进行。猫脑数字模型的运行速度相当于
真猫大脑实际运行速度的1/100。
2007年06月,根据科技新闻社区
Slashdot援引IBM工程师Eric Van Hensbergen的消息,
Plan 9操作系统成功运行于IBM的蓝色基因(Blue Gene)超级计算机。
据TED(
网易公开课)报道,蓝色基因也在模拟
人脑。