雷锋网消息,intel今天宣布,它将和cray公司一起为美国能源部的阿贡国家实验室建造第一台性能为1 exaflops的超级计算机,即每秒可执行百亿亿次浮点运算,比目前的最强超级计算机summit快5倍以上,预计2021年交付。
intel表示,这台价值5亿美元的超级计算机名为aurora,专门为传统的高性能计算和人工智能设计,它的研制和使用将显著推进科学研究和发现。
实际上,这台aurora已经是升级过的第二版方案,此前intel原计划于2018年在阿贡国家实验室部署一台基于第三代knights hill xeon phi协处理器的超级计算机,峰值性能约180 petaflops(每秒18亿亿次),但在中国宣布计划2020年前建立百亿亿次级超级计算机后,感受到来自东方神秘力量的intel放弃了这一计划,将设计目标也提升至对位的百亿亿次级。
aurora是能源部百亿亿级计算项目的产物,该项目是pathforward长期计划中的一项拨款计划,旨在加速在美国开发百亿亿次级超级计算机的研究。从2017年开始,该项目在三年的合同期内分配了近2.58亿美元的资金,除intel之外,amd、cray、hpe,ibm和nvidia等公司均被要求提供至少40%项目总成本的补充融资。
据雷锋网了解,自nvidia dgx2公布后,高性能计算界开始从纯粹追求高性能,转变为与ai寻求更好的结合,美国的summit超级计算机也不例外。随着summit重新夺回了中国占据多年的top500第一名,让采用cpu gpu这种异构体系结构的超级计算机成为了绝对主流。
中科院计算机网络信息中心副主任研究员迟学斌曾提到,summit这台机器让人印象特别深刻的一点是它的实测效率高达70%以上,这在已有的异构系统里应该是最高的一台。要发展更高的百亿亿次级超级计算机的话,其他途径很难实现,只能使用异构体系结构。
aurora的设计计划自然将继续发扬这一体系,其核心是intel下一代至强处理器、下一代xe gpu以及下一代傲腾存储器的搭配,将采用cray公司的shasta超级计算系统及其slingshot高性能互连,并完全支持intel的one api开发工具,可将计算引擎映射到各种cpu、gpu、fpga以及其他加速器。
阿贡国家实验室主任paul kearns表示,能源部、阿贡国家实验室、intel和cray公司等行业亚博平台app下载的合作伙伴的合作,对国家具有巨大的科学效益。aurora专为下一代人工智能而设计,通过结合高性能计算和人工智能,来解决诸如预测极端天气、大脑仿真、开发新材料等实际问题,从而加速科学发现,进一步了解宇宙。
雷锋网同时了解到,美国最近的大手笔不止aurora一个。此前,美国能源部向ibm、nvidia等公司提供了4.25亿美元的联邦资金,用于建造两台超级计算机:一台位于能源部的橡树岭,另一台位于劳伦斯利弗莫尔国家实验室。根据top500超级计算机性能排名,位于橡树岭的超级计算机可实现143~200 petaflops 的峰值性能,而位于劳伦斯利弗莫尔的红杉超级计算机峰值性能约为20 petaflops。
然而,即便intel和cray实现自己的承诺,将aurora打造成为美国超级计算机皇冠顶上的宝石,但它很可能仍然不是下一代超级计算机中最强大的一台。据悉,位于北京的中科院计算所(曙光超级计算机)、天津的国防科大超级计算机中心(天河超级计算机),以及济南的超级计算机济南中心(神威超级计算机)三个研发团队目前正在积极竞争,要在未来7个月内建造百亿亿次级超级计算机。
此外,日本的百亿亿次级超级计算机“后京”也计划于2020年完成部署,虽晚于中国但也要早于aurora。多方围剿之下,预计2021年完成部署的aurora很有可能面临的是后发后至的局面。(要不然你再回炉一次?)
如今的超级计算机领域已经成为中国和美国之间的竞争舞台。目前世界上最快的10台超级计算机中有五台在美国,其中summit和sierra均基于ibm最新的power9处理器和nvidia volta gv100加速卡打造,峰值性能分别为200 petaflops和126 petaflops,将占据hpc top500榜首多年的中国超级计算机神威太湖之光挤到了第三位。除此之外,其他三台还包括第六名的trinity、第九名的titan和第十名的sequoia。
top500榜单目前的前十名
位于中国无锡国家超级计算中心的神威太湖之光是目前我国最强的超级计算机,基于自主研发的申威sw26010处理器,峰值性能125 petaflops,曾在2015~2017年蝉联top500冠军。紧随神威太湖之光之后的是排名第四的天河2a,峰值性能100 petaflops。
在两年前的top500排名中,中国以202台的超级计算机数量首次超过美国的143台,且这一趋势在随后的一年里还有所加速。至2018年秋季 top500出炉时,中国上榜的超级计算机总数再次攀升到229台,而美国则进一步下降到108台。
不过,中国虽然在高性能计算领域的硬件上已经实现了超车,但在软件和应用层面上一直与国外有不小的差距,且这种差距并非依靠资金投入便能实现追赶,而是要持续不断的慢慢积淀。
以目前的最强超算summit为例,刚刚投入使用后不久,在去年的全球超级计算大会上便已有一些非常完美的应用展示了出来,例如由美国加州理工大学和国家实验室设计的项目,使用传统科学计算和ai计算相结合来预测地震的应用,整体计算使用了传统科学计算中的有限元,而在单点破坏严重的地方则使用了测量数据加ai推理,两者结合之下将summit这台机器应用到了完美,并据此得到了戈登·贝尔奖。
中科曙光副总裁何铁宁在参观了这些展示后表示,这些应用最值得学习的地方是如何让传统科学计算和ai计算这两者有机的结合起来,实现比较完美的负载均衡完全匹配。
据悉,国内几大超级计算中心现在也正向这一模式靠拢,在软件上的投入逐渐增加,努力完善生态体系。今年将会有更多的投入在生态建设上,让即将到来的三大百亿亿次级超算发挥出更强大的威力。