日前,“四十大盗”发布服务器CPU屠龙710。就“四十大盗”公司公布的数据来看,屠龙710是一款非常优秀的ARM芯片,在SPECInt2017基础测试中屠龙710跑分达到440分,超过行业标杆20%。不过,和以前FT、HW的ARM服务器CPU类似,屠龙710在性能对比中同样存在回避单核性能,“以多打少”比拼多核性能的情况,不知是“四十大盗”的宣传力量过于强大,还是因为媒体对于一款“强芯”的需求过于迫切,网络上铺天盖地的给予赞美之词,铁流认为,一些文章吹捧过头了。
总的来说,屠龙710是一款性能优越的商业芯片,如果国际大环境风平浪静,在“四十大盗”自产自销的模式下,前景是可以期待的。不过,当下最大的问题就在于国际环境风云变幻,这就给屠龙710的前景增添了很多变数。
屠龙710加速国产ARM CPU竞赛
近年来,ARM CPU性能可谓是突飞猛进,根据ARM官方消息,Cortex A78 CPU最高性能比5年前推出的Cortex A73 CPU提升2.5倍。ARM下一代的Matterhorn架构及Makalu架构会相对于X1/A78这一代保持30%以上的IPC性能提升,如果ARM的PPT不注水,那么,这基本上已经接近或达到X86主流水平。
多年前,ARM Cortex A57大致与X86阵营吊车尾的VIA nano性能相当,短短数年间,ARM公版架构就接近到X86主流水平,这种追赶速度让人深刻体会到ARM强悍的技术迭代能力。
相对于ARM公版架构在过去几年里突飞猛进,FT的Arm CPU的CPU核则进步缓慢,从2014年至2021年,其CPU IPC仅提升了20%左右,即便是以牙膏厂闻名遐迩的英特尔也只能自叹不如。必须说明的是英特尔基数高,哪怕提升5%,实际提升的性能也是可观的,而FT的国产ARM CPU的架构则依旧处于A57/A72的水平,由于基数低,IPC提升起来比英特尔容易的多,然而7年来的IPC实际提升让人大跌眼镜,很让人怀疑其自研CPU的技术来源和真实水平。
HW ARM 服务器CPU一共出了四款,第一款(1610)和第二款是A57(1612),第三款是A72(1616),这个属于买IP设计SoC,是ARM在技术迭代。第四款ARM CPU(1620)可以说是在没有前代CPU的情况下横空出世,号称自研,CPU核性能与A76处于同一水平,至于源码是从零开始一行一行写代码,还是拿现成的ARM核作参考修改,那就是一个谜了。
由于FT的ARM CPU IPC提升缓慢,HW因制裁原因下一代ARM CPU迟迟不见踪影,本次“四十大盗”的屠龙710可以说是刷新了国产ARM CPU的记录。屠龙710基于Arm最新的ARMv9架构设计,采用5nm工艺制造,单芯片容纳高达600亿晶体管,128个CPU核心,主频最高达到3.2GHz。根据PPT,屠龙710的性能超过业界标杆的20%。
此前,一些互联网公司曾经表示将开发ARM服务器CPU,本次“四十大盗”的成功可能会引发连锁反应。那就是其他互联网公司通过购买ARM公版架构,比如买X1或者更先进的CPU核设计SoC,然后使用更先进的台积电工艺,甚至个别IPC提升缓慢的国产ARM CPU也去购买ARM最新公版架构,以此提升CPU IPC。
一旦出现这种情况,将会掀起国产ARM CPU性能竞赛。有鉴于买ARM IP集成SoC流程上已经非常成熟,只要烧钱且花费一些时间,开发出基于ARM 公版架构的SoC并不存在多大障碍,这并非危言耸听,国外就有现成的例子,Ampere altra就是基于ARM Neoverse N1的IP开发的。
证明了有钱就能“攒”芯片
据媒体报道,“屠龙710是一颗从前端架构设计到后端物理实现都是自研的芯片”,以及各种标榜“自研”,潜台词是屠龙710是完全自主研发的CPU。但这种论调是值得商榷的。
首先,ARM官方并没有表示“四十大盗”购买了ARMv9指令集授权。屠龙710大概率是购买了ARMv9某一款IP,然后基于这款IP设计CPU。
其次,一款CPU走完设计制造封装测试到获得样片量产全流片,一般需要三年,这是行业一般规律,像英特尔、AMD、ARM那样每年出新品,都是几个设计团队车轮战,你方唱罢我登场,轮番推出自己的产品,有时候还存在推出一代新架构后,每年一小改,改几代用几年的情况。根据“四十大盗”官宣,屠龙710基于ARMv9指令集,而ARMv9是Arm于3与31日推出的。在ARM推出v9的半年后,“四十大盗”就推出所谓的基于ARMv9的“自研”屠龙710,这显然不可能是从头到尾全部由“四十大盗”完成的。
最后,技术发展都是迭代演进的,就像盖房子,都是一层一层的盖,每一代CPU改进的代码更换一般不会超过25%。像这种一口气吃成胖子的情况,不符合事物发展的客观规律,极大概率是从国外购买了成熟的IP,属于技术引进,而非自主研发。龙芯首席科学家胡伟武在公开讲座上就表示:“你给我一笔钱,叫我做一个芯片,我可以不用一个技术人员,只要行政助理,然后购买arm imagination的ip,委托第三方设计,然后给代工厂生产做出来......但你要我做一个A76级别的IP,(从零开始迭代演进)我可能要10年才能做出来”。
总而言之,所谓“自研”的论调是值得商榷的,一种最具可能性的情况是基于ARMv9公版架构设计了一款ARM CPU。
无法撼动X86 CPU在服务器市场的统治地位
虽然ARM和麾下诸多从事ARM服务器CPU开发的厂商一直在画大饼,但从过去这些年的实践来说,ARM 通用服务器基本没戏,也许只能在一些细分市场找到一席之地。
多年前,ARM服务器被业界炒的火热,被热炒的程度不亚于现在的RISC-V,ARM服务器CPU被诸多行业人士看好,并认为有希望取代X86,或侵蚀部分X86服务器CPU市场。AMD、高通、博通等一大批知名公司相继参与,仿佛ARM将在服务器领域复制在智能手机领域的成功。
然而,ARM服务器CPU的市场表现非常惨,用户对ARM服务器的反馈并不好,众多曾经押宝ARM的厂商也难以为继,在高通之前,博通、AMD以及一批名不见经传的小厂已经放弃ARM服务器CPU,AMD把重心转向X86 CPU,博通则把自己重金开发的ARM服务器CPU直接卖给了凯为。马维尔在收购凯为获得X2和X3之后,也对ARM服务器CPU团队进行了大裁员,大陆和印度团队都裁掉了,只在美国本土保留一个小团队,并宣布放弃ARM通用服务器CPU。另外,一些小厂在推出几款ARM服务器CPU之后,就听不到后续消息了。国内华芯通做了几年后也关门了。就全球范围来看,ARM服务器CPU正在退潮,只有少数有能力实现“自产自销”的厂商,比如亚马逊、“四十大盗”这样巨头才有实力和能力去“消化”自己设计的ARM服务器CPU。
实践证明,纯商业模式下,无论是X86进手机,还是ARM进服务器基本没戏。正是因为商业市场基本没戏,ARM服务器CPU只能在PPT上吊打英特尔、AMD,在商业市场被英特尔、AMD吊打,所以国外那些ARM CPU如果无法像亚马逊那样自产自销,就只能裁员或放弃。
同样是因为在商业市场没戏,国内这些ARM CPU如果不能实现自产自销,就只能宣传自主可控,卯足了劲往党政国企采购冲,一旦失去地方政府的支持,就只能关门倒闭,比如华芯通。
诚然,现在媒体上有一些报道ARM服务器如何如何,但这些归根结底都是政治任务,党政机关和国企事业单位因为行政命令采购ARM服务器。大公司的零星采购只是搞一个方案B,而且也是试一试的性质,而不是规模替换。什么时候像BATJ这样的互联网公司规模化采购,替换数据中心30%以上的X86服务器,那才可以称为对X86造成威胁。
结语
屠龙710是一款非常优秀的商业芯片,但也只是一款商业芯片,在设计和制造上都对境外技术有较强的依赖。铁流认为,屠龙710证明了ARM芯片从设计到制造的全球产业链在流程上已经非常成熟,证明了在全球分工的情况下,只要有钱就能设计出高性能ARM CPU,证明了国内SoC设计人才和技术水平已经达到国际主流水准。
屠龙710是一款由ARM提供技术授权,由大陆工程师完成SoC设计,由台积电完成制造的服务器CPU,是一款依靠全球产业链打造的ARM芯片,我们在为“四十大盗”取得成绩喝彩的同时,亦不宜过度吹捧,要清醒的认识到我们能做什么,我们还缺什么。
特别是在台积电于11月8日决定“交枪”、“下跪”的的背景下,我们必须予以警惕。
现在资本左右舆论,铁流就写一点科技评论,都是实话实说,而且随着贸易摩擦等事件,铁流的观点基本被实践印证。
某家网站编辑就说这篇文章如果不避讳铁定被封,所以只能用“四十大盗”、HW、FT、屠龙这些“为资本隐”。现在写点科技评论就弄得像文字狱一样,也是无语了。
幸好还有伟大的D压着,否则资本上位,变成韩国那样财阀政治才是老百姓的噩梦。