天河一号

天河一号是国际上首台采用CPU+GPU异构计算的超级计算机系统,网络系统完全由国防科学技术大学自行研发,一期系统(TH-1)在2009年9月研制成功,二期系统(TH-1A),峰值性能达4700TFlops,在2010年11月的“世界超级计算机500强”排行榜中位列第一。天河一号主要运用于石油勘探、生物医药、航空航天装备研制、基础科学理论计算等方面。天河一号的研制成功,标志着中国超级计算机领域进入国际先进行列。

天河一号 - 简介

“天河一号”千万亿次超级计算机系统“天河一号”千万亿次超级计算机系统

“天河一号”是由中国国防科技大学研制的中国首台千万亿次超级计算机。它实现了中国自主研制超级计算机能力从百万亿次到千万亿次的跨越,使中国成为继美国之后世界上第二个能够研制千万亿次超级计算机的国家。

“天河一号”采用多阵列可配置协同并行体系结构,整个系统由103个机柜组成、占地面积近千平方米、总重量达155吨。它于2009年底至2010年全面部署于国家超级计算天津中心,被用于石油勘探数据处理、生物医药研究、航空航天装备研制、资源勘探卫星遥感数据处理、金融工程数据分析、环渤海生态动力和污染数值模拟、基础科学理论计算等方面。[1]


 

 

 

天河一号 - 研发升级

 

 

TOP500“天河一号”位列“世界超级计算机排名”第一位
作为中国高技术研究发展计划(863计划)中的一个重大项目,“天河一号”的设计始于2008年。整个项目工程分为两部分:

 

一期系统


一期系统(TH-1)于2009年9月研制成功,峰值速度为每秒1206万亿次双精度浮点运算(TFlops),持续速度为563.1TFlops(LINPACK实测值),是中国首台千万亿次超级计算机系统。这些数字意味着,“天河一号”每计算一天,一台配置Intel 双核CPU、主频为2.5GHz的微机就需要连续计算160年。就共享存储总容量而言,“天河一号”的存储量相当于4个藏书量为2700万册的国家图书馆[2]

二期系统


二期系统(TH-1A)于2010年8月在国家超级计算天津中心升级完成,峰值速度提升为4700TFlops,持续速度提升为2566TFlops(LINPACK实测值),部分采用了自主研制的飞腾-1000中央处理器。参加2010年11月世界超级计算机TOP500排名,位列世界第一,实现了从亚洲第一向世界第一的重大跨越,取得了中国自主研制超级计算机综合技术水平进入世界领先行列的历史性突破。[3]

天河一号 - 关键技术

“天河一号”安装于国家超级计算天津中心“天河一号”被安装于国家超级计算天津中心
对于高性能计算机而言,系统的效能绝不是各单元计算效能的简单叠加。为了实现整体效能的提高,“天河一号”采用了7项关键技术,包括:
 

 
1)多阵列可配置协同并行体系结构,融合了计算阵列加速阵列服务阵列,在超大规模高性能计算机体系结构方面有所突破。
 

2)高速率扩展互联通信技术,取得了40Gbps通信带宽、1.2微秒的延迟的高效通信性能。
 

3)高效异构协同计算技术,使用CPU+GPU的体系结构,GPU扮演加速器的作用,它加快了计算机的运行速度,却降低了功耗和成本。
 

4)基于隔离的安全控制技术,“天河”实现了不同用户间数据和工作信息的相互隔离。对用户来说,相当于到银行租个保险柜,钥匙掌握自己手里。 
 

5)虚拟化的网络计算支撑技术,简化了使用难度,提高了应用开发效率,并可进一步扩展并满足未来云计算的需求。
 

6)多层次的大规模系统容错技术,缓解了大规模系统固有可靠性低对用户应用运行的影响,使用户作业成功率得到很大提高。
 

7)系统能耗综合控制技术,虽然“天河一号”(一期工程)每年的电费可高达1800万元,但它依然算得上世界上最环保超级计算机之一。[4]
 

 

天河一号 - 配置指标

“天河一号”采用CPU和GPU相结合的异构融合计算体系结构,硬件系统由计算阵列、加速阵列、服务阵列以及互连通信子系统、I/O存储子系统和监控诊断子系统等六部分组成。软件系统由操作系统编译系统资源管理系统并行程序开发环境等部分组成。总体技术指标如下:
天河一号系统配置展示
天河一号系统配置展示

 

存储总容量

 

峰值速度4700TFlops,持续速度2566TFlops(LINPACK实测值),内存总容量262TB,存储总容量2PB。

计算处理系统

包含7168个计算结点和1024个服务结点。每个计算结点包含2路英特尔CPU和一路英伟达GPU,每个服务结点包含2路飞腾CPU。

全系统共计23552个微处理器,其中英特尔至强X5670 CPU(2.93GHz、6核)14336个、飞腾-1000 CPU(1.0GHz、8核)2048个、英伟达M2050 GPU(1.15GHz、14核/448个CUDA核)7168个,CPU核共计102400个,GPU核共计100352个。

互连通信系统

采用自主设计的高阶路由芯片NRC和高速网络接口芯片NIC,实现光电混合的胖树结构高阶路由网络,链路双向带宽160Gbps,延迟1.57us。

输入输出系统

采用Lustre全局分布共享并行I/O结构,6个元数据管理结点,128个对象存储结点,总容量2PB。

监控诊断系统

采用分布式集中管理结构,实现系统实时安全监测、控制和调试诊断。

基础架构系统

采用高密度双面对插组装结构,冷冻水空调密闭风冷散热。环境温度10℃~35℃,湿度10%~90%。

操作系统

64位麒麟Linux,面向高性能并行计算优化,支持能耗管理、高性能虚拟计算域等,可广泛支持第三方应用软件。

编译系统

支持C、C++、Fortran77/90/95、Java语言,支持OpenMPMPI并行编程,支持异构协同编程框架,高效发挥CPU和GPU的协同计算能力。

天河一号 - 应用领域

图为通过天河一号辅助设计飞机气动外形(终端用户入口界面)
图为通过天河一号辅助设计飞机气动外形(终端用户入口界面)

“天河一号”于2009年底至2010年在天津滨海新区落户,成为国家超级计算天津中心的业务主机。它主要用于石油勘探数据处理、生物医药研究、航空航天装备研制、资源勘探和卫星遥感数据处理、金融工程数据分析、环渤海生态动力和污染数值模拟、基础科学理论计算等方面。

国家超级计算天津中心还同天津市国际生物医药联合研究院南开大学等单位合作,建立了生物医药信息处理平台;与国家动漫产业综合示范园合作,构建了包括渲染中心、特效影棚、动作捕捉系统等在内的高速动漫设计平台;中心还建立了计算机辅助设计和仿真分析平台,为新能源、新材料、航空航天装备研制等新兴产业提供高性能计算服务。[5]

2012年3月27日,国家超算天津中心与全球最大的基因组研究机构深圳华大基因研究院签署合作协议,“天河一号”将首次涉足基因研究领域。[6]

编辑/发表时间:2012-03-28 08:09
编辑词条如何编辑词条?)                          历史版本

贡献者:
郝金刚