热门问题
时间线
聊天
视角

天河二号

来自维基百科,自由的百科全书

天河二号
Remove ads

天河二号(简称:TH-2),是一组由中国人民解放军国防科技大学研制的异构超级计算机,为天河一号超级计算机的后继。天河二号的组装和测试由国防科技大学和浪潮集团来负责,于2013年底入驻位于广东省广州市中山大学广州校区东校园内的国家超级计算广州中心并进行验收,2013年底交付使用后对外开放接受运算项目任务,用于实验、科研、教育、工业等领域。[2]天河二号造价达一亿美元[3][4]整个系统占地面积达720平方米[5]天河二号于2013年6月起至2016年6月之前,为世界上最快的超级计算机[6]。目前,天河二号由国防科技大学中山大学共同使用和维护。不过美国以担心“天河二号”进行核子研究为由,禁止英特尔出口芯片给中国,此后中国展开了自主设计道路。[7]

事实速览 激活时间, 承建商 ...
Remove ads

硬件配置

天河二号的型号为TH-IVB-FEP,使用中央处理器神威太湖之光协处理器天河二号的运算架构布局:[8][2][9][10]

天河二号共有16,000个运算节点,每节点配备两颗Xeon E5 12核心中央处理器、三个Xeon Phi 57核心的协处理器(运算加速卡)。累计32,000颗Xeon E5主处理器和48,000个Xeon Phi协处理器,共312万个计算核心。

处理器

  • 中央处理器英特尔提供的,运作主频为2.2GHz的Xeon E5-2692v2 12核心处理器,基于英特尔Ivy Bridge微架构(Ivy Bridge-EX核心),采用22纳米制程,峰值性能0.2112TFLOPS
  • 运算加速使用基于英特尔集成众核架构Xeon Phi 31S1P协处理器,运行时钟频率为1.1GHz,拥有57个x86核心(实际上拥有61个核心,因激活全部核心时会存在运算周期协调冲突之问题,因此先遮蔽4个x86核心),每个x86核心借由特殊的超线程技术能运作4个线程,产生峰值性能为1.003TFLOPS
    • 基于美国商务部限制中国的超算购买使用Xeon Phi的考虑,2017年开始使用自主研发的Matrix-2000代替Xeon Phi作为协处理器的升级计划。[11][12][13]

存储器

  • 内存
    • 每个节点拥有64GiB主存,而每个Xeon Phi协处理器板载8GiB内存,故每节点共88GiB内存,整体总计内存1,375TiB (1.34PiB)。
  • 外存

主板、机架、机柜、运算数组

  • 主板、机架与机柜均由浪潮集团制造,共有170个机柜,每个机柜容纳4个机框,每个机框容纳16块主板,每个主板设置有两个计算节点。每个机柜还装有负载指示灯,根据机柜内主机的运算负载变更发光二极管的发光颜色。[14]
    • 各运算数组中,每块主板上分为APU模块和CPM模块两部分,APU部分承载5块Xeon Phi,CPM部分承载1块Xeon Phi+4颗Xeon E5。
    • APU模块和CPM模块之间以CPU内部提供的PCI-E 3.0 16x接口进行连接,但实际由于Xeon Phi的硬件限制,仅支持至PCI-E 2.0 16x,单通道资料传输速率为10Gbps。

前端处理器

  • 计算节点前端处理器为4096颗中国国防科技大学研发的FT-1500 16核心SPARC V9架构的处理器,40纳米制程,运作主频1.8GHz,热设计功耗65瓦,峰值性能144GFLOPS。主要作运算任务调度管理之用。

连接性

  • 其高速互联架构使用光电混合传输技术(Optoelectronics Hybrid Transport Technology),以及自制的TH Express-2树形主干拓扑结构网络连线,以13个大型路由器通过576个连接端口以光电传输介质与各个运算节点互联,控制器名为NRC,使用90纳米制程,单个控制器的资料吞吐量2.56Tbps,终端网络接口使用名为NIC的控制器,以PCI-E 2.0接口链接,资料发送速率6.36GB/s。

能耗

  • 整机功耗17.808兆瓦,在搭载水冷散热系统以后,功耗将达到24兆瓦,无论水冷系统的搭载与否,都是目前TOP500里功耗最大的。尚未全速运行时一年的用电费用就高达1亿元人民币,全速运行的话更高达1.5亿元。[15]
  • 电源管理附带综合化能耗控制技术,也由国防科技大学负责开发。
  • 以6月17日公布的数据推算,每瓦性能为1.901GFLOPS,仍不及泰坦的每瓦2.143GFLOPS和IBM红杉每瓦2.177GFLOPS的成绩,但比“京”的每瓦0.830GFLOPS每和天河一号每瓦仅0.668GFLOPS都要高不少。

软件支持

  • 麒麟操作系统、基于SLURM(Simple Linux Utility for Resource Management,资源管理用单一Linux公用程序)的全局资源管理。
  • UbuntuOpenStack上运作的云计算系统、Ubuntu Juju云端服务调度引擎以及基于Ubuntu Server为中国客制的Kylin Cloud Linux操作系统。在2014年5月已分配256个节点运行,未来将扩展至超过6400个节点。[16]

除操作系统以外,均由国防科技大负责开发的并行编程模型与框架、系统容错设计与故障管理软件等。

性能

2013年6月,天河二号以峰值速度(Rpeak)每秒54,902.4TFLOPS(万亿次浮点运算)、持续速度(Rmax)33,862.7TFLOPS,超越泰坦超级计算机(Rpeak 27,112.5TFLOPS,Rmax 17,590.0TFLOPS),成为当时世界上最快的超级计算机。这个成绩于2013年6月17日提交至TOP500。[17]实际上,在早前的运行测试中,仅使用16,000个运算节点中的90%,亦即14,336个节点,LINPACK运算速度就达到30.65PFLOPS的性能水准,超过前任“泰坦”的74%。[8]国际TOP500组织2013年11月18日公布了最新全球超级计算机500强排行榜榜单,“天河二号”以比第二名美国的“泰坦”快近一倍的速度登上榜首。[18][17]

同样在2013年6月,天河二号以2,061GTEPS英语traversed edges per second的成绩在Graph500上排名第六。Graph500是一个对超级计算机的资料密集型运算处理性能进行的一个排行榜,在此榜单上排位第一的是IBM红杉,成绩是15,363GTEPS[19]

意义及用途

电机电子工程师学会认为天河二号的落成以及重登TOP500第一“标志着中国坚定承诺将在超级计算机领域发起一轮军备竞赛”。[20]在当时的TOP500中,中华人民共和国拥有66组超级计算机,仅次于美利坚合众国的252组系统。[21]TOP500排行榜主要编撰人之一、美国田纳西大学计算机学教授杰克·唐加拉对新华社记者说:“‘天河二号’是一个非常强大的计算系统,它在第一名的位置上再占据一年时间,我也不会感到惊讶。”[22]

就技术性意见而言,天河二号的工程新闻发言人李楠认为,因为中国大陆自家研发的处理器和英特尔的处理器存在软件兼容性问题,而且两者之间的性能差距有目共睹,因此运算节点仍不得不使用英特尔的处理器,而并发运算系统也需不时地进行优化改进。[3][4]

天河二号投入使用后将用于科学研究、工业设计等目的(包括计算化学[23]、生命科学、材料科学、大气科学、地球物理、宇宙、经济学、大型基因组分析组合、基因测序、环境污染治理等等),对外开放接受运算项目任务,主要为中国大陆、港澳地区等地提供高性能运算服务,[24][8]也会与国际上的其它科学研究机构合作并提供运算资源。[25]也会承接来自中华人民共和国政府的一些国家安全信息的处理任务。[26]

正式运行以后有120多家用户提供超过300项运算项目,其中有:[25]

Remove ads

参见

参考文献

外部链接

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads