问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

全球第一台性能超过十亿亿次的计算机:神威·太湖之光

创作时间:
作者:
@小白创作中心

全球第一台性能超过十亿亿次的计算机:神威·太湖之光

引用
1
来源
1.
https://chaosuanwiki.com/lingxianchaosuanpinpai/quan-qiu-di-yi-tai-xing-neng-chao-guo-shi-yi-yi-ci-de-ji-suan-ji-shen-wei-tai-hu-zhi-guang.html

神威·太湖之光超级计算机是中国自主研发的高性能计算系统,其峰值性能达到12.5亿亿次每秒,持续性能为9.3亿亿次每秒,性能功耗比为6051MFlops/W。作为全球第一台性能超过十亿亿次的计算机,神威·太湖之光在多个领域取得了重要突破,展现了中国在超级计算机领域的强大实力。

神威·太湖之光超级计算机是由国家并行计算机工程技术研究中心研制,安装在国家超级计算无锡中心的超级计算机。
主要性能为:峰值性能12.5亿亿次每秒,持续性能9.3亿亿次每秒,性能功耗比6051MFlops/W。[1]

研发背景

神威·太湖之光超级计算机作为国家863计划信息技术领域重大项目支持的课题之一,2014年由科技部立项,科技部的要求是建成全球一流的超级计算机和全球一流的超算中心。[2]

研发目标

旨在实现关键核心技术的自主可控,将创新主动权和发展主动权牢牢掌握在自己手中。

发展历程[3]

2016年6月,系统正式发布,并于2016年6月和2016年11月两次摘得世界高性能计算Top 500排名第一。它是全球第一台性能超过十亿亿次的计算机, 并且全部采用国产高性能众核处理器构建。其峰值运算性能、持续性能和系统能效比等三大技术指标同比大幅度领先,标志着我国超级计算机在自主可控、峰值速度、持续性能、绿色指标等方面实现了突破。

系统投入使用以来,清华大学、中科院软件所、国家海洋局第一研究所、中船重工702研究所等134家研究机构,依托这个平台开发出一系列跨越航空航天、天气气候、生物信息、材料科学、船舶工程、计算化学等领域和学科的高性能应用课题,其中18项课题实现了五百万核到上千万核的超大规模并行,取得了一批重要应用成果。

基于“神威·太湖之光”的“千万核可扩展全球大气动力学全隐式模拟”应用,获得2016年度“戈登·贝尔”奖,实现了我国在世界高性能计算应用领域这一最高奖项上的“零的突破”。

技术架构

神威·太湖之光系统由高速计算系统、辅助计算系统、高速计算互连网络、辅助计算互连网络、高速计算存储系统、辅助计算存储系统和相应的软件系统等组成,总体结构如图所示

硬件层面

处理器

神威·太湖之光搭载了中国自主设计的申威26010众核处理器。每个处理器包含4个运算核心(也称为“主核”),每个主核又内含64个运算单元(或称“微核”)。这种众核架构设计使得单个处理器拥有256个计算核心,极大地提升了并行计算能力。[4]

计算节点

计算机系统由40个计算柜组成,每个计算柜包含数百个计算节点。每个计算节点配备两块申威26010处理器,构成了庞大的计算阵列,提供了极高的浮点运算性能。[5]

高速互连网络

为了保证各个计算节点间的数据高效传输,神威·太湖之光采用了自主设计的高效网络互联架构——SW26010高带宽网络芯片。该网络芯片支持16路PCIe 3.0接口,提供高达102.4GB/s的双向带宽,确保了处理器之间的高速数据交换。[5]

内存系统

每个计算节点配备大量的DDR3内存,形成大规模、高带宽的内存系统,满足处理器对数据的高速访问需求。通过优化内存控制器设计和内存层次结构,有效提高内存访问效率,降低访存延迟。

存储系统

神威·太湖之光配备了大容量、高速度的并行文件系统和分布式存储设备。采用多级缓存机制和智能数据调度算法,确保海量数据的高效读写和快速存取。

冷却系统

超级计算机的散热问题至关重要。神威·太湖之光采用全液冷技术,通过液体冷却板直接接触处理器和内存等发热元件,迅速吸收热量并传送到外部冷却系统,实现高效散热。这种冷却方式有助于降低系统能耗,提高能效比,同时保持运行环境稳定。

软件层面

操作系统

神威·太湖之光运行基于Linux内核定制的国产操作系统,如麒麟操作系统(Kylin OS)等。这些操作系统针对申威处理器进行了深度优化,提供了稳定、高效、安全的操作环境。

编译器与工具链

配备了针对申威处理器架构优化的编译器、汇编器、链接器等开发工具,支持Fortran、C/C++、OpenMP、MPI等多种编程语言和并行编程模型,方便用户编写和调试高性能计算代码。

并行编程环境

支持主流的并行编程环境,如OpenMP、MPI(Message Passing Interface)、SHMEM(Shared Memory)等,使得开发者能够充分利用处理器的众核特性,编写高效并行程序。

科学计算库与应用软件

集成了丰富的科学计算库,如BLAS、LAPACK、FFT等,为数值计算、线性代数、信号处理等任务提供高效计算支持。同时,预装或支持各类高性能计算应用软件,如天气预报模型、分子动力学模拟软件等,满足不同领域的科研和工程计算需求。

管理系统与监控工具

配备了完善的系统管理和监控工具,如作业调度系统、资源监控系统、性能分析工具等,帮助管理员高效调度计算任务,实时监控系统状态,优化系统性能,确保超级计算机稳定、高效运行。

所获奖项

连续四次蝉联世界top 500list超级计算机冠军,具体时间分别为2016年6月20日、2016年11月14日、2017年6月19日、2017年11月13日

2016年7月15日,吉尼斯世界纪录大中华区总裁罗文在北京向国家超级计算机无锡中心主任杨广文颁发吉尼斯世界纪录认证书,宣布中国自主研制的超级计算机“神威·太湖之光”是“运算速度最快的计算机”。

神威·太湖之光”超级计算机在成果应用上也取得了重大进展。在试运行期间,清华大学、北京大学、中科院软件所、中船重工702所、国家计算流体力学实验室等三十多家用户单位,在天气气候、航空航天、海洋科学、新药创制、先进制造、新材料等领域,与超算无锡中心建立了应用合作关系。其中,有三个在“神威·太湖之光”超级计算机上开展的应用课题荣获“戈登贝尔奖”提名。设立于1987年的“戈登贝尔奖”,被喻为计算机高性能应用领域的“诺贝尔奖”。这是中国人在国产超级计算机上的应用课题首次入围“戈登贝尔奖”,这一重大突破标志着中国超级计算机的应用能力也达到了世界先进水平。

2016年11月,获第三届乌镇互联网大会“世界领先科技成果”,次年12月,获第四届乌镇互联网大会“世界领先科技成果”。[6]

应用案例

天气气候模拟

如全球大气非静力云分辨模拟,中科院软件所、清华大学、北京师范大学等单位的合作研发,利用神威·太湖之光超级计算机的强大算力,设计和开发了新的高可扩展非静力大气动力全隐求解器,有效开展了全球公里级大气动力学的数值模拟。[7]

航空航天工程

如天宫系列航天飞行器飞行状态模拟,中国航空、航天的相关研究机构与无锡超算合作进行C919大飞机多种飞行状态的模拟,天宫系列航天飞行器的飞行状态模拟。[8]

“黑科技”研究

如核聚变发电理论与实验模拟,神威·太湖之光已经被应用于代表未来“黑科技”发展方向的研究领域,包括“人造小太阳”,即核聚变发电的相关理论与实验方面的模拟。[9]

工业仿真服务

与中国移动成立国产超算并网实验室,力图攻克并网、传输、调度等方面的难题,降低普通用户使用超算的门槛。目前,中国移动江苏分公司与无锡超算已经完成运营层对接,并上线了首个云市场的超算产品——“神工坊”,为工业企业提供高计算精度、短设计周期、低实验成本的工业仿真服务。2023年,中国移动将重点建设超算并网调度平台,并推进该平台与移动自身的算网大脑的联调对接,最终实现算网大脑对超算资源的编排调度。[10]

研究机构介绍

神威·太湖之光是由中国国家并行计算机工程技术研究中心研制,而国家并行计算机工程技术研究中心是一家依托中国科学院计算技术研究所的中国计算机科学技术综合研究所,经国家科委批准,于1992年8月开始组建,1996年6月通过国家验收。

关于中国国家并行计算机工程技术研究中心

国家并行计算机工程技术研究中心(以下简称中心)经国家科委批准,于1992年8月开始组建,1996年6月通过国家验收。中心总部设在北京市高新技术产业开发试验区内,中心主任为国内知名计算机专家、中国工程院院士金怡濂教授。

中心组建的目的是开发商品化的并行计算机系统,逐步形成我国的高性能并行计算机产业,并将产品推向国内、国际两个市场。

中心依托中国科学院计算技术研究所。中国科学院计算技术研究所始建于50年代,是计算机科学技术综合研究所,一直处于国内的领先地位。在发展我国的并行计算机技术方面,计算所作出了重要的贡献。

关于中国科学院计算技术研究所

研究所概况:中国科学院计算技术研究所(简称计算所)创建于1956年,是中国第一个专门从事计算机科学技术综合性研究的学术机构。计算所研制成功了我国第一台通用数字电子计算机,并形成了我国高性能计算机的研发基地,我国首枚通用CPU芯片也诞生在这里。计算所是我国计算机事业的摇篮。伴随着计算所的发展,先后为国家培养了几百名我国最早的计算技术专业人员,在这里工作或学习过的院士有二十余位。随着学科与技术发展,从计算所陆续分离出西安微电子所、计算中心、软件所、网络中心、微电子所和信工所等多个研究机构,孵化了联想、曙光、龙芯、寒武纪等高技术企业。六十多年来,计算所在科学研究和科技成果等方面取得了显著成就。

延展了解

除了全球超算Top500榜单所展示的前沿(Frontier)和神威·太湖之光等顶级通用超级计算机之外,其实还存在一类致力于解决特定问题的专用超级计算机,例如美国安腾超级计算机(Anton),这是一种专门针对解决特定问题而定制开发的超级计算机,与通用超算采取的CPU、GPU等通用芯片架构不同,专用超算通常会采用ASIC专用芯片架构,来解决CPU和GPU等通用芯片在特定场景下无法满足的算力性能和功耗的问题。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号