首页 > 科技 > PC端国产cpu(龙芯,申威,飞腾中国长城占比35%,第一大股东)

PC端国产cpu(龙芯,申威,飞腾中国长城占比35%,第一大股东)

消息:

日前,有媒体注意到,在中央国家机关发布的新采购名单中,服务器产品的技术要求格外引人注目,龙芯、申威、飞腾等国产CPU都被列入了政府采购名录;另一方面,在2018-2019年中央国家机关采购的台式机和笔记本还都要求预装国产LINUX操作系统。

政府采购发力国产芯片 龙芯、飞腾、申威进入采购名录

打开中央政府采购网,可以发现,在“征求意见公告”栏中,有一则发布于5月17日的《2018-2019年中央国家机关信息类产品(硬件)和空调产品协议供货采购项目征求意见公告》。

CPU 目前占主流市场的仍然是 Intel 和 AMD 两大公司。

指令集是存储在 CPU 内部,对 CPU 运算进行指导和优化的硬程序。一般将其分为两大体系结构,复杂指令集 CISC(Complex Instruction Set Computer)和精简指令集 RISC(Reduced Instruction Set Computer)

CPU 架构见表 1 所示。在 CISC 处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。RISC 是在 CISC 指令系统基础上发展起来的,其具有指令格式统一,寻址方式少,处理速度高等优点,目前在中高档服务器中普遍采用这一指令系统的 CPU。

其中 CISC 的代表架构是 x86,而 RISC 主要有 ARM、MIPS、SPARC、PowerPC 和 Alpha 等架构。

国产处理器的现状:

有自主知识产权的CPU:龙芯、申威

有部分知识产权的CPU:飞腾、华为

无自主知识产权的CPU:海光、宏芯、兆芯

其中,指令集和微结构这两种参数最重要,指令集相当于CPU的设计程序,

而微结构相当于CPU设计程序的实现,指令集相对简单,

微结构才是最有技术含量的东西。

龙芯3B4000和申威SW1621都采用了自有知识产权的指令集和微结构,但是两者的制造工艺都是最落后的,龙芯的主频和核数也是最低的,其长期合作的代工厂意法半导体位于欧洲和美国,严格来讲,龙芯属于中国设计,欧美制造。

申威有军方背景,其CPU必须是中国企业制造的。

CPU单核性能汇总

我们先用申威、飞腾ARM、以及VIA与大陆的合资公司的四核桌面芯片做比较。由于桌面芯片更加注重单线程性能——单核性能是基础,很多程序都依赖单进程的处理速度,

如果单核性能上不去,核心数再多也没用,这也是AMD 六核、八核芯片打不赢Intel 四核芯片的原因。另外,对于桌面芯片来说,日常使用中更加倚重定点性能。因此,在这里我们以单线程实际测试的定点成绩做比较。

在编译器为GCC的情况下,龙芯3A3000在1.5G主频下的SPEC2006定点成绩为11分,飞腾1500A在1.8G主频的定点成绩为10分。VIA在大陆的合资公司其产品ZX-A和ZX-C的定点成绩为8—10分。

Intel I5 4460在3.2G主频下SPEC2006的定点成绩为32分;在编译器为GCC4.4.7的情况下,龙芯3A3000在1.5G主频下的定点成绩为11分。诚然Intel在编译器上占有一定优势,这里为了方便比较就忽略编译器带来的差异了,就定点性能而已,龙芯3A3000的单线程性能大约为Intel I5 4460的三分之一。

国产CPU和Intel的差距,不仅仅是主频上的。

哪怕兆芯的ZX-C能到达3G以上主频,但因为微结构上的差距,依旧只有I5 4660性能的40%左右,因此微结构非常重要,可以说CPU的安全性、性能、功耗很大程度上取决于微结构,AMD的CPU在同主频下性能逊色于Intel,很大程度上也是因为微结构上的差距。

微结构差距的原因

因为宏芯、兆芯、海思、展讯目前并没有自主设计的微结构,就以龙芯、飞腾最新的两款产品和Intel做比较。以GS464E和IVY的差距而言,通过对比下表参数,就能发现原因。

如果将GS464E和IVY做对比就能发现,制约GS464E性能的最大的短板在定点发射队列和浮点发射队列上,相对于IVY的54项定点和浮点发射队列,GS464E只有16项定点发射队列,24项浮点发射队列。

龙芯对此也是心知肚明,将正在流片的3A3000,针对GS464E的瓶颈做了改进,将定点发射队列从16项提升到32项,将浮点发射队列从24项提升到32项,并提升了缓存和主频。很显然,虽然龙芯宣称TICK-TOCK,但3A3000相对于3A2000并非单纯的提升主频,定点发射队列和浮点发射队列的提升必然带来IPC的提升。

根据飞腾公布的Spec 2006的模拟器测试,整数为9.6/G。

9.6/G到底是什么水平呢?笔者以Intel作参照,关auto parallel的情况下,haswell使用GCC5.1的SPEC 2006的成绩为32分(@3.2G主频)。也就是说,“小米”能接近haswell?

这实在是太“惊悚”了,如果真能做到,就是科技大跃进了。那SPEC2006整数9.6/G的原因何在?根源在于开/关auto parallel。

开auto parallel会导致SEPC2006整数分数增益,因为其将原本单线程执行的程序并行化给多个处理器执行,增益效果取决于编译器、CPU的核心数量等因素。而相当部分常用的代码并不支持auto parallel。因此,目前auto parallel对SPEC跑分更有意义。而“小米”SPEC2006整数高达9.6/G,很有可能就是因为在测试中开auto parallel的结果,那么证据呢?

从上表中“小米”和IVY的对比中看,“小米”和IVY还是有不小的差距的,并且和GS464E一样存在定点发射队列和浮点发射队列相对IVY偏少的现状,因此在资源有限的情况下,做出达到haswell水平的概率非常小。

对比“小米”和GS464E,假定两者流水线效率相当的情况下,笔者认为“小米”可能是和GS464E一个等级的微结构,并强于ARM Cortex A57。当然,如果流水线效率不佳,“小米”也可能会逊色于GS464E。而“小米”32M的L2缓存,很有可能是因为针对服务器,甚至高性能计算的产物。

提一个潜力股,龙芯3A4000。

龙芯3A4000的潜力还有待挖掘,因为从图表中看出,龙芯3A4000是唯一一款依然采用28nm工艺的CPU。龙芯3A4000的微结构非常不错,即便CPU核不变或小改,直接换工艺,比如采用更先进的7nm工艺或16nm工艺,CPU的主频和性能都有望得到大幅增长。

据小道消息,3A5000将采用12/14/16nm工艺,并小改CPU核,单核成绩有望达到25至27分。如果将来采用7nm工艺,单核性能有望突破30分。参照龙芯3A2000到3A3000的研发进度,3A5000有望在2020年上半年流片。届时,龙芯又能获得一次性能提升。

总的来说,国产CPU进步明显,海光单核性能最强,华为多核最强,龙芯潜力很大,SPEC20006测试每G主频性能达到10分,在微结构设计水平上是国内数一数二的存在,其自主研发能力获得实践证实。申威3232虽然跳票,但性能值得期待。

有自主知识产权的CPU:龙芯、申威

中科龙芯

采用 MIPS 体系结构,具有自主知识产权,

“龙芯”系列芯片是由中国科学院中科技术有限公司设计研制的,

产品现包括龙芯 1 号小 CPU、龙芯 2 号中 CPU 和龙芯 3 号大 CPU 三个系列,此外还包括龙芯 7A1000 桥片

龙芯 3 号系列是面向高性能计算机、服务器和高端桌面应用的多核处理器,具有高带宽,高性能,低功耗的特征。龙芯 3A3000/3B3000 处理器采用自主微结构设计,主频可达到 1.5 GHz 以上;

计划 2019 年面向市场的龙芯 3A4000 为龙芯第三代产品的首款四核芯片,该芯片基于 28 nm 工艺,采用新研发的 GS464V 64 位高性能处理器核架构,并实现 256 位向量指令,同时优化片内互连和访存通路,集成 64 位 DDR3/4 内存控制器,集成片内安全机制,主频和性能将再次得到大幅提升。

最新一代的CPU是3A4000,这款处理器使用28nm工艺,是本文中盘点的处理器中,制造工艺最差的一款。虽然制造工艺相对落后,但3A4000的单核性能却并不比其他几家逊色。采用GCC编译器,SPEC20006定点和浮点成绩都在20左右(@2G主频)。

近些年,龙芯专注于微结构的提升,在制造工艺上普遍落后于同时期其他国产CPU,比如2015年前后问世的龙芯3A2000,工艺为40nm,而在此时,国内同行CPU的工艺大多为28nm。2019年问世的龙芯3A4000,制造工艺为28nm,国内同行的工艺普遍为7/16nm。

在制造工艺落后国内同行1至2代的情况下,龙芯能够把CPU性能做到同一档次水平,实属不易。从龙芯3B1500至龙芯3A4000,龙芯在制造工艺处于同一水平的情况下,通过自身设计能力,把CPU的性能翻了6倍,SPEC20006测试每G主频性能达到10分,在微结构设计水平上是国内数一数二的存在。

这充分体现了龙芯的CPU设计能力,折射出能力建设和培养比引进国外技术更重要,与一些高度依赖台积电先进工艺的厂商形成鲜明对比。

龙芯的桌面CPU做的非常不错,但在服务器CPU上由于核数较少,暂时落后于国产X86和ARM CPU。由于3A/B4000多路性能提升较大,龙芯将主推4路服务器。

客户:

做龙芯服务器的厂商为:

然后是龙芯服务器,龙芯服务器用的是龙芯3B3000,CPU内核为龙芯自主设计的GS464E。单核性能略低于SW1621,缺点是核心数太少,四核VS友商16核、32核的情况下,难免力有不逮。所以清华同方、宝德的服务器是直接上双路的,就是为了弥补核心数少的不足。

云海麒麟(1) | 五舟(1) | 宝德 PowerLeader(2) | 曙光(1) | 浪潮申泰(1) | 清华同方(1) | 瑞驰(1) | 百信云龙(1) | 联勤(富扬维鑫)(1) | 长城(1) |

台机:

上海申威

采用 Alpha 架构,具有完全自主知识产权,

申威处理器简称“SW 处理器”,出自于 DEC 的Alpha 21164,

其产品有单核 SW-1、双核 SW-2、四核 SW-410、十六核 SW-1600/SW-1610 等[6]。神威蓝光超级计算机使用了 8704 片 SW-1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。

SW由相关单位设计,在超算上非常成功,神威太湖之光曾经多次在TOP500上名列第一,即便现在依然位居第三。在超算上取得成功后,SW开始把服务器作为发力的方向,2019年会有SW3231问世,2020年SW3232会问世,比PPT上的规划时间晚一年。

就单核性能来说,SW3232采用14/16nm工艺,并且有极大概率单核性能达到25分(SPECint2006),多核性能600+是起步水平,实际性能会明显高于这个水平。

SW3232在单核与多核性能上着实不俗,申威用实践证明,独立自主与CPU高性能可以兼得,没必要一定依附于X86和ARM,中国人自主定义指令集完全走的通。

客户:

我们看来申威服务器,支持申威服务器的厂商为:

ZoomServer(1) | 云海麒麟(1) | 国威天成(2) | 宝德powerleader(1) | 方正(2) | 瑞驰(1) | 联想(1) |

厂商后面括弧内的数字为机型数量。联想能够支持申威,这个让人惊讶。铁流认为,这一方面是自主CPU性能不断提升的结果。另一方面,也折射出党政采购开始放量,由于有利可图,联想也就开始做申威的服务器了。

几款申威服务器的CPU都是申威1621,这款CPU采用28mn工艺,性能优于16核A57。

申威和兆芯入围笔记本,和台机

做申威的只有一家方正,而做兆芯的也只有一家联想。

有部分知识产权的CPU:飞腾、华为

天津飞腾

飞腾购买ARM指令集授权后,于2015年发布了自主设计的微结构和CPU。

产品主要有 FT-387SX、流处理器 YHFT64-2、FT-1000 系列、FT-1500 系列和 FT-2000 系列,其中 FT-1000 和 FT-1500 系列 CPU 已经成功应用于我国千万亿次服务器“天河一号”和“天河二号”。“天河二号”目前已经广泛应用于天文宇宙科学研究、大气海洋环境研究、工业设计制造、新能源新材料开发利用、生物医药与健康医疗等领域。

9月19日,飞腾发布了新一代桌面处理器FT-2000/4。

根据飞腾的官方介绍,FT-2000/4集成4个FTC663,16nm制程,主频2.6至3.0GHz,最大功耗10W,单核1GHz下芯片功耗降为3.8W。在专业CPU性能测试软件SPEC2006中,FT-2000/4全芯片实测整数计算得分61.1,浮点计算得分62.5,相比飞腾上一代桌面CPUFT-1500A/4提升近1倍,访存带宽提升3倍。

就单核性能来说,从FT1500A到FT2000,再到FT2000plus性能提升有限,因而无法判断FTC663相对于FTC662有多大的提升。根据测试成绩来看,FT2000的单核性能(定点)为12+(飞腾的PPT也有13分的),假设FT-2000/4与FT2000同主频性能处于同一水平,那么,2.6G至3G主频的FT-2000/4单核性能大约为16.5至19。

据悉,FT-2000/4在主频2.6GHZ下,单核定点16到17之间,多核整数55到57之间。

从定点成绩看,飞腾的FTC662和FTC663在同主频性能上差距微乎其微,基本上FTC663可以视为FTC662的“微小改动版”。

因此,FT-2000/4单核性能最好成绩(@3G主频)应该是18+,接近19分,或19出头一点,但到不了20分。

客户:

支持飞腾的服务器:

Estor鲸鲨(1) | 云海麒麟(1) | 五舟(1) | 天华星航THE(1) | 宝德 PowerLeader(2) | 柏科数据(Rorke)(1) | 浪潮申泰(1) | 清华同方(1) | 瑞驰(1) | 联勤(富扬维鑫)(1) | 联想(2) | 航星中云(1) | 超云(1) | 长城(1) |

台机:

华为

购买的ARMv8指令集,

由于美国政府的阻扰,华为有可能拿不到后续的ARM新版授权,可能被迫基于ARMv8指令集,去研发自己的指令集,也许对华为来说反而是好事。

最近,华为非常高调的再次亮相鲲鹏系列处理器。根据华为官方的PPT,鲲鹏920的多核性能非常强悍,搞到900+分。不过,华为没有公布鲲鹏920的单核性能,从华为的PPT上48核战平英特尔28核的情况看(主频相差不大的情况下),单核性能和微结构设计上与英特尔还是存在明显差距的。鲲鹏920在国产CPU中的优势有2个,一是核心数众多,高达64个核心,而目前国产CPU中核心数达到64个的只有飞腾。第二个是采用7nm工艺,在工艺上领先其他国产CPU。

客户:

服务器:华为(4) | 航天天域(1) |

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/172260.html