本篇文章5063字,读完约13分钟

【/h/】近日,不少美国媒体幸灾乐祸,认为中国的超级计算产业将受到致命打击,没有美国的cpu,中国将无法创建超级计算。这是事实吗?这项禁令对中国超级计算行业有什么影响?

据多家媒体报道,当地时间6月21日,美国商务部以国家安全为由,将5家中国实体列入进出口管制实体名单,并禁止其从美国供应商处购买零部件。相关决定于6月24日生效。这五个实体与中国超级计算行业三巨头中的两个有关,涉及曙光和神威超级计算。在这五个实体中,江南计算技术研究所是神威超级计算的R&D和制造单位。而其他四家实体,中科曙光、天津伊贡、成都伊贡IC、成都伊贡微电子技术,都与曙光系列超级计算有关。

【/h/】近日,不少美国媒体幸灾乐祸,认为中国的超级计算产业将受到致命打击,没有美国的cpu,中国将无法创建超级计算。这是事实吗?这项禁令对中国超级计算行业有什么影响?本文将对此问题进行详细分析。

首先,美国为什么要再次制裁我们的超级计算企业?

其实早在2015年初,美国商务部就把中国四大超级计算中心列入禁运名单。这源于美国长期以来的焦虑:在大约40年的时间里,中国的超级计算机行业完全进口了美国的产品,购买了美国的CPU来创建超级计算机,然后使用自己的CPU和加速器来创建超级计算机;从仅有的几台超级计算机来看,在世界超级计算机市场上不值一提,超级计算机数量世界第一,大大超过美国;从超计算性能低,排不上号,多年来一直称霸全球最快超计算榜单;中国的超级计算产业已经走上了一条完美的逆袭之路。

世界超级计算组织top500每六个月发布一次世界上最快的500台超级计算机的名单。最新的名单是今年6月刚刚发布的。世界上最快的500台超级计算机按国家分布如下:

【/h/】▲数据来自作者整理的top500.rog

在 500强榜单中,中国超级计算机数量达到219台,占世界44%,居世界第一;美国116台,占世界23%,远远落后于中国。

【/h/】要知道,就在一年前,2018年6月,中国还有206台在500强,美国还有124台。今年中国又进步了,美国又退步了。从趋势上看,中国的优势会越来越大。

因为超级计算在军事、科研、经济等方面的巨大作用,美国的焦虑是可以理解的。他们急于遏制中国的发展势头,所以他们仍然把商业诚信和公平贸易的原则放进下水道,提供禁运法。那么,这次禁运对中国的超级计算行业有什么影响呢?

【/h/】对中国正在开发的三台E级超级计算机影响不大

【/h/】2018年夏天,美国超级计算峰会终于排到了500强第一位,把中国太湖之光挤到了第二位,比太湖之光快了60%左右;然后美国的另一台超级计算机sierra投入使用,将太湖之光以微弱优势推到第三位。

美国媒体激动起来,改变了多年的沉默,开始吹嘘下一代E级超级计算机的威力。所谓E级超级计算是指每秒运行100亿次的超级计算机,比Summit快很多倍。美国E级超级计算机计划在2021年左右投入使用,而中国为E级超级计算机准备了三个方案,都使用国产cpu和加速器,也计划在2020年到2021年陆续投入使用。

这里,我们需要引入加速器。超级计算的核心组件不仅仅是cpu。因为超级计算进行密集的科学计算,所以cpu在执行这种计算任务时不是最有效的。拥有多个计算单元的加速器处理器效率更高。典型的加速器芯片是NVIDIA的通用gpu和英特尔的至强Phi处理器。

【/h/】近年来出现了超级计算的趋势,即采用一个cpu多加速器的架构,计算任务主要由加速器芯片完成,cpu主要负责协调、通信和任务分配。

那么,美国禁运对我们E级超算有什么影响?让我们仔细看看。

中国下一代E级超级计算机的三个解决方案都使用国产cpu和加速器芯片:

天河三号e级超算:

【/h/】2018年5月19日,国家超级计算天津中心展示天河三号样机,2018年底投入使用。天河三号配置齐全的主机计划在2020年投入使用,性能计划为1eflops。天河三号将使用国产腾飞ft2000plus或后续机型的cpu,以及国防科技大学matrix2000plus或后续机型的加速器芯片。

腾飞cpu采用arm架构。

Matrix 2000加速芯片是国防科大的通用dsp芯片,GPDSP,和NVIDIA GPUs一样,DSP(数字信号处理器)也有大量的运算单元。

神威e级超算:

神威系列是江南计算机研究所开发的。2018年7月,神威E级原型落户济南国家超级计算中心,历时约三年开发,将于2021年投入使用。神威的cpu肯定是神威系列的最新款,加速器也可能采用matrix2000plus或者其后续型号。

神威系列cpu诞生于DEC Alpha处理器架构。

曙光e级超算:

中科曙光主要使用x86 cpu。最新500强榜单中,曙光公司制造的超级计算机有63台。除了一台,其他62台都使用英特尔的至强cpu,部分超级计算机也使用NVIDIA的特斯拉加速器芯片。

【/h/】乍一看,似乎这个禁运对曙光公司是致命的打击。因为Intel和NVIDIA芯片以后都不会有了。但曙光公司早就有了本土化布局。秘密就在62站外的超级电脑里。

cpu:

这款tc8600超级计算机于2018年投入使用。其cpu采用天津广海公司的hygon dhyana处理器,32核,2 GHz频率。2016年初,天津广海公司从美国AMD获得第一代Zen2架构永久授权,起点相当高。应该知道AMD在2018年才推出第二代Zen2架构。广海3000系列cpu采用x86通用架构,完全支持windows10 pro、windows server2019、linux centos 7.x等主流操作系统,还有类似AMD EPYC的服务器版本,最大32核,64线程,基本频率2.0ghz,加速频率3.0ghz,覆盖4核到32核的多条产品线。

禁运宣布后,广海公司无法再获得AMD的新产品架构授权,但这并不影响已经获得的授权。广海公司成立了一支500多人的研发团队,有能力在已获得授权的基础上进一步开发新产品,提高cpu性能。这也意味着未来基于x86架构的cpu在中国可能会有一个硬叉,我们会和美国分道扬镳,走自己的路。

加速器芯片:

而曙光超级计算的这个加速器芯片更有意思:它的名字叫深度计算处理器。据公开新闻报道,曙光的加速器芯片是基于中国寒武纪公司的ai处理器架构开发的,在世界上独一无二。根据曙光公司的新闻稿,2017年11月,曙光率先推出基于寒武纪低功耗深度学习处理器的phaneron,引起业界广泛关注。时隔半年,寒武纪发布了性能更强大的mlu100,曙光同时升级了phaneron产品,发布了一系列搭载寒武纪mlu100的服务器产品,保持了在智能服务器领域的持续领先地位

这意味着曙光TC8600超级计算机应用到ai领域将会有很大的优势。

曙光公司未来的E级超级计算机应该是基于广海公司最新的cpu和曙光自己设计的最新版本的phaneron ai加速芯片。

【/h/】由此可见,美国商务部实施的禁运对曙光公司的E级超级计算机产品完全不会产生影响。

禁运可能会对曙光的商用超级计算机产品线造成很大影响

我们还需要看到曙光的主要产品线是基于Intel的cpu和NVIDIA的加速器芯片,这些产品线在禁运后是不可持续的。从商业角度来说,对曙光公司影响很大。但幸运的是,曙光拥有国产cpu和加速器芯片的替代产品。从排在第43位的曙光TC 8600和排在第88位的曙光TC 4600LP/W740L的测试数据可以看出一些细节:

表来自top500.org,作者对其进行了分析。

曙光TC4600LP是基于英特尔至强CPU和NVIDIA特斯拉加速器的产品。根据以上测试数据,使用国产cpu和加速器的tc8600超级计算机,在使用3倍以上的cpu核和5倍以上的加速器核的情况下,运行得分只增加到1.4到1.7倍。但是耗电量下降了不少,耗电效率提高了三倍多。

作者分析,这主要是因为TC8600使用的ai加速器不适合传统的浮点运算,但是在ai运算上有很大的优势。

这也意味着曙光公司缺乏合适的加速器芯片来提高系统的浮点运算能力。这可能会对曙光公司的商业发展产生不利影响。

也许曙光未来的销售重点会转向ai计算。但不排除曙光公司未来会基于国产Matrix 2000加速芯片开发产品。

这里我们必须解释一下为什么曙光公司不能放弃基于x86架构的cpu。

全球500强超级计算机100%使用不同发行版的Linux操作系统。这些版本针对其cpu和加速器芯片进行了优化。超级计算上运行的应用软件也会受到cpu架构的影响。

目前针对x86架构优化的Linux系统是最成熟的,应用软件最多,程序开发最容易,软件生态系统最成熟稳定。然而,国内的神威和腾飞cpu系统存在一些不足,如软件工具优化少、编程困难、系统漏洞多等。整个软件生态系统只有可用,离x86系统还有一定距离。

所以无论从国家战略还是曙光公司的商业前景来看,x86架构都应该坚持。

中国半导体制造技术的进步将极大提升国产超级计算cpu和加速器芯片的性能

中国的半导体制造业一直是我们最大的短板。在TSMC和三星电子大规模生产7纳米工艺,英特尔小规模生产10纳米工艺的时候,中国最先进的半导体制造工艺是SMIC的28纳米工艺。

【/h/】上面说的国产cpu要么使用了落后的国产技术,自主性可以保证,但是性能落后;或者找个半导体代工公司在海外生产,性能可以提高,但是自主性不能保证,说不定到时候会被掐。

但是这种状态很快就会结束。在2018年8月的第二季度行业报告中,SMIC宣布其14 nm生产工艺取得长足进步,第一代FinFET技术研发进入客户引进阶段。正式量产计划在2019年中期。因此,很快,我们将拥有自己的14纳米半导体生产工艺。

14nm有多厉害?要知道,现在所有的Intel台式机和服务器芯片都是14 nm。英特尔在刚刚过去的台北电脑展上宣布,将大规模生产10纳米技术的低压笔记本电脑处理器,并预计14纳米将在未来几年保持其主要技术。只有AMD,在TSMC的代工厂之下,刚刚宣布实现了7 nm工艺生产cpu。

如果国产超级计算cpu和加速器芯片采用SMIC的14纳米工艺生产,其性能将会有一个飞跃。

美国最终将搬起石头砸自己的脚

事实上,2015年美国对中国四大超级计算中心的禁运已经砸了自己的脚:英特尔的至强融核加速器芯片停产了。

▲图为美国《个人电脑》杂志当年封杀了中国在美国的四个超级计算中心,并禁止英特尔向其提供至强PHI加速器芯片

作者在这里列举了一些事实:

中国的天河二号超级计算机分别使用了32000个至强e5 cpu和48000个至强融核加速器。

关于至强融核的销量,英特尔首席执行官表示2016年的目标是10万台。

【/h/】可见光是中国的天河二号就能达到英特尔至强融核2016年销量的一半左右。

2015年4月9日,美国商务部宣布,将禁止中国四家超级计算中心使用英特尔的至强处理器和至强融核加速器芯片。

【/h/】2016年6月18日,至强融核7290/7250加速器价格直接减半。2017年8月24日,英特尔宣布,至强融核7200系列协处理器加速卡已进入停产退市流程。

【/h/】▲图为美国《个人电脑》杂志在当年的报道中也提到了中国市场对英特尔芯片的重要性,美国的禁令将给英特尔带来沉重打击

我毫不怀疑英特尔至强融核加速器芯片是因为对华禁运而停产的。这甚至影响了美国下一代E级超级计算机的发展。美国的E类超级计算,cpu可以选择Intel和amd的x86处理器,ibm的power处理器,而加速器芯片目前只有一个选择,就是NVIDIA的通用gpu。

美国商务部实施的禁运会有什么结果?我相信在我们自力更生的努力下,几年后世界上将会出现几个新的超级计算cpu生态系统,彻底打破美国的垄断。

其实无论是《纽约时报》还是《华尔街日报》都不认为美国政府针对中国超级计算的行动会阻碍中国的发展。两家媒体采访了几位不同的美国超级计算专家,表示虽然美国政府的行为可能会在短期内给中国的超级计算发展带来障碍,但也将增强中国发展本土技术取代美国技术的决心。

还有一件不可避免的事情会发生,那就是在2020年和2021年,中国将出现三台E级超级计算机,冲击500强排名,拉开美国超级计算机的序幕。让美国看看谁是超级计算领域的王者!