“天河二号”是由
国防科学技术大学研制的
超级计算机系统,以峰值计算速度每秒5.49×1016次、持续计算速度每秒3.39×1016次
双精度浮点运算的优异性能位居榜首,成为2013年全球最快超级计算机。
研究历程
2009年,中国首台千万亿次计算机“天河一号”研制成功,运行“
核高基”专项支持研制的银河麒麟操作系统,名列当年的国际超级计算机TOP 500排行榜世界第五位、
亚洲第一位的排名,并使中国成为继美国之后世界上第二个能够研制千兆
次超级计算机的国家。
2010年时,我国研制的首台千兆次超级计算机“天河一号”曾在全球TOP 500超级
大型计算机排行榜中排名第一,但在2011年时被日本最新研发的超级计算机“
京”超越了。到了2012年,美国的“泰坦”又超越了日本的“京”。
“天河二号”由280人历时两年多研制完成,耗资约1亿美元。研发耗资约1亿美元,由国家科技部、
广东省人民政府、
广州市人民政府共同出资建设。
2013年下半年,它将在
广州超级计算中心投入运行,其先导系统已开始为生物医药、新材料等领域用户提供服务。
从2010年11月14日天河一号排名世界第一到2013年6月17日天河二号再登世界超算之巅,从天河一号4.7千兆次到天河二号5.49×1016次,从超级计算机由千兆(10×1015)次级迈入万兆(10×1016)次级计算速度,这是国防科技大学天河团队再次创造的“中国速度”。
2013年下半年,天河二号超级计算机在
国家超级计算广州中心已正式投入运行,为120多家用户提供了300多项典型应用计算。同时,为用户培训了一批超算
应用技术人才。
2015年5月,由
北京师范大学、国防科技大学、
加拿大理论天体
物理研究所、
北京大学、中科院高能物理研究所联合组成的宇宙
中微子数值模拟团队,经过一系列技术攻关,在“天河二号”上成功进行了3万亿
粒子数中微子和
暗物质的
宇宙学数值模拟,揭示了
宇宙大爆炸1600万年之后约137亿年的漫长演化进程。
2018年9月11日获悉,国防科技大学
吴俊杰团队与
上海交通大学金贤敏合作,在国际上最先开启了称霸标准的研究,被称为
量子霸权。
2019年11月4日,
国防科技大学计算机学院吴俊杰带领的
QUANTA团队,联合信息
工程大学等国内外
科研机构,提出了
量子计算模拟的新算法。该算法在“天河二号”超级计算机上的测试性能达到国际领先水平,
谷歌的工作也引用了这项结果的预印版论文。当地时间4日,
国际期刊《
物理评论快报》正式在线发表了该成果。
组成结构
天河2号由16000个节点组成,每个节点有2颗基于Ivy Bridge-E Xeon E5 2692处理器和3个
Xeon Phi,累计共有32000颗Ivy Bridge处理器和48000个Xeon Phi,总计有312万个计算核心。
每个Xeon Phi使用其中的57个核心,而不是使用全部的61个,因为使用61个在运算周期协调方面会有问题,而使用57个核心能够加速4个执行线程,并且在每个线程单周期可以达成4Gflops的运算量,运行在1.1GHz的Xeon Phi可以生产1.003 Tflops的
双精度运算能力。如果考虑
CPU,2 Ivy Bridge * 0.2112 Tflop/s + 3 Xeon Phi * 1.003 Tflop/s=3.431 Tflops,2个Ivy Bridge+9个Xeon Phi单个节点可以有3.431 Tflops运算能力,16000个节点总计可达54.9PFlops性能。每个运算节点有256GB
主存、而每个Xeon Phi
板载8GB内存,因此每个节点共有88GB内存,总计16000个节点一共有1.404 PB内存,而
外部存储器容量方面更是高达12.4PB.
在每个主板上有2个
计算节点,而每个框架则有16个主板,4个框架组成一个机柜,整个系统由125个机柜组成。每个计算节点主板分为两块,一块CPU一块
APU,CPU上有4核Ivy Bridge、内存和一个Xeon Phi
协处理器,而APU基板上则承载着5个Xeon Phi协处理器.CPU和APU之间有5个水平插入的链接口,由Ivy Bridge内置的
PCI-E 2.0进行连接,虽然Ivy Bridge内置为PCI Express 3.0接口,但Xeon Phi仅支持2.0,单个通路为10Gbps带宽。
计算节点的
前端处理器为4096个FT-1500处理器, FT-1500处理器是由国防科技大学为天河1研发,其可以说是天河1项目的最大收获,其为16核心的Sparc V9架构处理器,在40nm工艺情况下
运行频率为1.8Ghz,
峰值性能为144 Gflops/s,功耗为65W,但相比英特尔22nm 12核 2.2GHz 211Gflops/s性能的Ivy Bridge还是有明显差距。
天河2互联方面采用自主研发的 Express-2 内部
互联网络,其为有13个交换机,而每个交换机有576个端口。
连接介质为光电混合。具体控制器是名为NRC的
ASIC专用目的
集成电路,其采用90nm工艺,封装尺寸为17.16x17.16 mm,共有2577引脚。单个NRC的吞吐能力为2.56Tbps.而在终端方面
网络接口也采用类似结构的NIC,但规模稍小,为10.76x10.76 mm, 675 pin,其采用PCIE 2.0方式连接,
传输速率为6.36GB/s.并且在在12000节点的情况下延迟也很低,仅为85us.
而在
计算能力方面,使用14336个节点 总计50GB内存进行LINPACK测试,理论性能为49.19Pflops,而实际测试性能为30.65Pflops,效率为62.3%.这个效率并不算高,还有很大优化提升潜力。当然也可能是被Xeon phi仅支持
PCI Express 2.0带宽不足限制。
上面测试使用了16000个节点中的14336个,运用了90%的规模,基本可以代表天河2的整体性能表现。天河2的性能部件(处理器、内存、互联)整体功耗为17.6MW,而整体的运算能力为30.65PFlops,这样计算每瓦的性能为1.935Gflops,这个性能/功耗比可以排在超算TOP500的前五,其整体性能/功耗比十分出色。
系统的整体功耗为17.6 MW,并且这个功耗还不包括水冷这样的散热系统,如果考虑上整体功耗将高达24MW,广州国家超算中心将采用城市
供水系统构建高散热效能的
冷却系统,有能力可以提供80KW系统的散热能力。
天河二号超级计算机系统由170个机柜组成,包括125个计算机柜、8个服务机柜、13个通信机柜和24个存储机柜,占地面积720平方米,内存总容量1400万亿字节,存储总容量12400万亿字节,最大运行功耗17.8兆瓦。天河二号运算1小时,相当于13亿人同时用计算器计算一千年,其存储总容量相当于存储每册10万字的图书600亿册。相比此前排名世界第一的美国“泰坦”超级计算机,天河二号计算速度是“泰坦”的2倍,计算密度是“泰坦”的2.5倍,能效比相当。与该校此前研制的天河一号相比,二者占地面积相当,天河二号计算性能和计算密度均提升了10倍以上,能效比提升了2倍,执行相同计算任务的耗电量只有天河一号的三分之一。
技术参数
使用光电混合
传输技术(Optoelectronics Hybrid Transport Technology),使用自制的TH Express-2主干
拓扑结构网络连接,以13个大型路由器通过576个连接端口以光电
传输介质与各个运算节点互联,控制器名为NRC,使用90
纳米制程,单个控制器的数据
吞吐量2.56Tbps,终端
网络接口使用名为NIC的控制器,以
PCI-E 2.0接口链接,
数据传送速率6.36GB/s。
麒麟操作系统、基于SLURM(Simple Linux Utility for Resource Management,资源管理用单一Linux
公用程序)的全局资源管理。
Ubuntu Linux。(Ubuntu
OpenStack运行在256个高性能节点上,而且在接下来的数月将会增长至超过6400个节点。OpenStack和Ubuntu的编制工具Juju都将运行在天河二号上,使国防科技大学的合作伙伴和联盟机构能够快速部署和管理高性能
云环境)
整机功耗17,808千瓦,在搭载水冷散热系统以后,功耗将达到24兆瓦,无论水冷系统的搭载与否,都是超级计算机TOP500里功耗最大的
以6月17日公布的数据推算,每瓦性能为1.901
GFLOPS天河一号每瓦仅0.668GFLOPS都要高不少。
性能特点
天河二号是当今世界上
运算速度第二快的超级计算机,
综合技术处于国际领先水平。
它有五大特点:一是高性能,
峰值速度和
持续速度都创造了新的
世界纪录;二是
低能耗,
能效比为每瓦特19亿次,达到了世界先进水平;三是应用广,主打科学工程计算,兼顾了云计算;四是易使用,创新发展了异构融合
体系结构,提高了软件
兼容性和易编程性;五是性价比高。
2013年6月,天河二号以峰值速度(Rpeak)每秒54,902.4TFLOPS(万亿次
浮点运算)、持续速度(Rmax)33,862.7TFLOPS,超越泰坦超级计算机(Rpeak 27,112.5TFLOPS,Rmax 17,590.0TFLOPS),成为当今世界上最快的超级计算机。这个成绩于2013年6月17日提交至TOP500。实际上,在早前的
运行测试中,仅使用16,000个运算节点中的90%,亦即14,336个节点,LINPACK运算速度就达到30.65PFLOPS的性能水准,超过前任“泰坦”的74%。国际TOP500组织2013年11月18日公布了最新
全球超级计算机500强排行榜榜单,“天河二号”以比第二名美国的“泰坦”快近2倍的速度登上榜首。
同样在2013年6月,天河二号以2,061GTE
PS的成绩在Graph500上排名第六。Graph500是一个对
超级电脑的数据密集型运算处理性能进行的一个排行榜,在此榜单上排位第一的是
IBM红杉,成绩是15,363GTEPS。
“天河二号”的系统存储总容量相当于600亿册每册10万字的图书。假设每人每秒钟进行一次运算,“天河二号”运算一小时,相当于 13亿人同时用计算器算上1000年。
应用领域
天河二号已应用于
生物医药、新材料、
工程设计与仿真分析、
天气预报、
智慧城市、电子商务、云计算与大数据、数字媒体和
动漫设计等多个领域,还将广泛应用于
大科学、大工程、信息化等领域,为经济社会转型升级提供重要支撑。
天河二号逐步在
生命科学、
材料科学、
大气科学、
地球物理、宇宙、经济学,以及大型
基因组组装、
基因测序、
污染治理等一系列事关国计民生的大科学、大工程中“大显身手”。此外,国家超算广州中心积极推动国际交流与合作,利用天河二号为国外研究机构提供
高性能计算服务。
据悉,科技部近年不断加大对超算应用软件研发的投入。“十二五”以来的相关研发投入已超过2亿元。预计“
十三五”期间投入将进一步加大。
根据该专项“面向大规模
科学计算的高性能多核CPU”课题计划安排,2011年中国将采用FT-1500CPU构建全自主国产千万亿次计算机——“天河二号”。
借助天河二号的“计算神功”,国产
C919大型客机开展了高精度外流场气动计算;中科院上海药物研究所开展了75万个
小分子化合物的
结合亲和力评估,完成了600多个各类药物的体内外活性测试评价。天河二号适配了
广州市电子政务数据管理系统和
云盘存储系统等,为智慧城市建设搭建高效可靠的承载平台……
前景展望
目标是到2020年,形成中国
高端通用芯片和基础
软件产品的自主研发与产业体系。面向3G
移动通信网络的
智能手机嵌入式软件核高基所获荣誉
2010年,中国
国防科学技术大学研制的“
天河一号”曾在第三十六届超级计算机
TOP500榜单上名列第一,2011年时排名第二,2012年排名已下降至第五,我“天河二号”又重返冠军领奖台。
2013年,在德国
莱比锡举办的2013年度全球超级
计算机技术大会,负责调查有关全球各国研发大型超级计算机排行情况的国际大型超级计算机TOP 500组织,公布了最新全球超级计算机TOP 500强排行榜榜单;在本次大会上由中国政府国家科技部与中国国防科学技术大学共同研制的名为“天河二号(”又称银河2号)的大型超级计算机以每秒3.386×1016次的
浮点运算速度成为全球最快的超级计算机。
2014年6月,由
国防科技大学研制并落户
国家超级计算广州中心的天河二号超级计算机,23日再次荣登
全球超级计算机500强排行榜榜首,获得世界超算“
三连冠”。天河二号超级计算机是国防科技大学承担的国家“863”计划和“
核高基”
国家科技重大专项项目。
2014年11月,在美国
新奥尔良市召开的世界超级计算机大会上,天河二号在国际TOP500组织首次正式发布的超级计算机高性能测试排行榜上位居世界第一。此前,由该组织发布的第44届
世界超级计算机500强排行榜中,天河二号以峰值计算速度达每秒5.49×1016次、持续计算速度达每秒3.39×1016次位居榜首,获得“四连冠”。
2015年7月13日,国际TOP500组织在德国举行了2015年国际超级计算机大会,并在大会上发布全球超级计算机500强最新榜单,中国“天河二号”以每秒3.386×1016次的浮点运算速度第五次
蝉联冠军,获得“五连冠”。
2015年10月16日,新一期
全球超级计算机500强榜单在美国公布,“天河二号”超级计算机以每秒3.386×1016次连续第六度称雄。
2016年6月20日,新一期全球超级计算机500强榜单公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超算上榜总数量也有史以来首次超过美国名列第一。
据国际TOP500组织当天发布的榜单,“神威太湖之光”的浮点运算速度为每秒9.3×1016次,不仅
速度比第二名“天河二号”快出近两倍,其效率也提高3倍。更重要的是,与“天河二号”使用
英特尔芯片不一样,“神威太湖之光”使用的是中国
自主知识产权的芯片。
2016年11月,新一期全球超级计算机500强(TOP500)榜单,“天河二号”依然以每秒3.386×1016次的浮点运算速度排名第二。
2017年6月19日,全球超级计算机500强榜单公布,“天河二号”以每秒3.39×1016次的浮点运算速度排名第二。
2017年11月13日,新一期全球超级计算机500强榜单发布,中国超级计算机“
神威·太湖之光”和“天河二号”连续第四次分列冠亚军,且中国超级计算机上榜总数又一次反超美国,夺得第一。此次中国“神威·太湖之光”和“天河二号”再次领跑,其浮点运算速度分别为每秒9.3×1016次和每秒3.39×1016次。
2019年11月18日,全球超级计算机500强榜单发布,中国超算“天河二号”排名第四位。
第五名
2020年6月23日公布的2020年6月全球超级计算机Top500榜单,由中国国防科技大学(
NUDT)开发的天河2A排名第五。
存在问题
速度第一效率落后
天河二号的实用性、效率难令人满意。2014年6月公布的世界超算500强天河二号
计算效率为61.7%,效率排名第一的IBM nx360M4效率高达99.8%,速度排名第四的日本k计算机以93.2%效率排名效率第十八。
高性能处理器缺少
2015年4月9日,
美国商务部发布报告,决定拒绝
英特尔公司向中国的
国家超级计算广州中心出售
至强芯片用于天河二号系统升级的申请。
国家超级计算长沙中心、广州中心、
天津中心和
国防科技大学四家国家超算中心被列入
出口管制名单。
社会评价
电机
电子工程师学会认为天河二号的落成以及重登TOP500第一“标志着中国坚定承诺将在
超级电脑领域发起一轮
军备竞赛”。截至2020年06月23日,
中华人民共和国拥有226台
超级计算机,排名世界第一。
TOP500排行榜主要编撰人之一、美国
田纳西大学计算机学教授
杰克·唐加拉曾对新华社记者说:“‘天河二号’是一个非常强大的计算系统,它在第一名的位置上再占据一年时间,我也不会感到惊讶的。
世界纪录
世界上速度最快的
超级计算机:由中国国防科技大学研制的超级计算机“天河2号”是世界上速度最快的计算机,在Linpack基准上的
运算速度为每秒3.386×1016次。(
吉尼斯世界纪录)