深度长文:AMD的崛起、衰落与复兴

来源:内容编译自「techspot」,谢谢。

AMD是最早的大型微处理器设计者之一,近50年来一直是技术爱好者之间争论的话题。它的历史构成了一个激动人心的故事——充满了英雄式的成功,愚蠢的错误。在其他半导体公司来来往往的时候,AMD在多个地方经受了许多风暴并进行了多场战斗。

在这篇文章里,我们将回顾该公司的过去,研究通向现在的曲折,并想知道这位硅谷资深人士的前景如何。

AMD的成名

要开始我们的故事,我们需要回溯岁月,前往1950年代后期的美国。在经历了第二次世界大战的艰辛岁月之后,那是你想要体验技术创新前沿的时间和地点。

当时,类似贝尔实验室,德州仪器(Texas Instruments)和飞兆半导体(Fairchild Semiconductor)等公司聘用了最好的工程师,并创造了无数的第一名。如双极结型晶体管,集成电路和MOSFET(金属氧化物半导体场效应晶体管)。

飞兆半导体的工程师,大约于1960年-戈登·摩尔位于最左端,罗伯特·诺伊斯位于中间位置

这些年轻的技术人员想研究和开发更多令人兴奋的产品,但是由于谨慎的高级管理人员和这个充满恐惧和不稳定时代的影响,这些充斥着挫败感的工程师渴望独自出击。

因此在1968年,飞兆半导体的两名员工Robert Noyce和Gordon Moore离开了公司,走上了自己的闯爷之路路,NM Electronics在那个夏天开业,几周后,这家公司更名为集成电子公司( Integrated Electronics :Intel)。

其他人也紧随其后。不到一年后,又有8个人离开,他们一起成立了自己的电子设计和制造公司:Advanced Micro Devices(AMD)。

这个团队由飞兆半导体前营销总监杰里·桑德斯(Jerry Sanders)领导,他们从重新设计飞兆半导体和美国国家半导体的零件开始,而不是试图直接与英特尔,摩托罗拉和IBM等公司竞争(后者在研究和开发上花费了大量资金开发新的集成电路)。

从这些不起眼的产品开始,公司也从圣塔克拉拉(Santa Clara)迁移到桑尼维尔(Sunnyvale)(加利福尼亚州硅谷),AMD提供的产品在短短几个月内就提高了效率和速度。这些微芯片的设计也符合美国军用质量标准,这对仍处于新兴的计算机行业来说,具有相当大的优势,因为计算机行业的可靠性和生产一致性差异很大。

AMD的第一个模仿CPU-Am9080

英特尔在1974年发布他们的第一个8位微处理器(8008)时,AMD是一家产品组合超过200种的公司,其中四分之一是他们自己设计的,当中包括RAM芯片,逻辑计数器和位移位器。第二年他们又推出了许多新型号:他们自己的Am2900集成电路(IC)系列和2 MHz 8位Am9080,这是Intel的8008继任者的反向工程版本。前者的组件在现在是完全集成到CPU和GPU中,但是35年前,算术逻辑单元和内存控制器都是独立的芯片。

按照现在的标准,公然剽窃英特尔设计绝对会引起轩然大波,但在微芯片起步的初期,这一做法可谓一帆风顺。在AMD和英特尔于1976年签署了交叉许可协议之后,该CPU仿制品最终被重命名为8080A。

这笔交易使AMD和英特尔可以把高利润的芯片推向市场,零售价为350多美元,是军队购买价格的两倍。随后是1977年的8085(3 MHz)处理器,并很快就推出了8086(8 MHz)。设计和制造方面的改进推动8088(5至10 MHz)于1979年出现,同年也开始在AMD德克萨斯州奥斯汀的工厂开始生产。

当IBM在1982年开始从大型机系统转移到所谓的个人计算机(PC)时,该公司决定外包零件而不是内部开发处理器,他们最终选择了英特尔的8086,这是有史以来的第一个x86处理器,同时,IBM还明确规定,AMD充当第二供应商,以确保IBM PC / AT的持续供应。

1981年的IBM 5150 PC

AMD与英特尔于当年2月签订了一份合同,前者生产8086、8088、80186和80188处理器。这些产品不仅是面向IBM,而且还面向众多激增的IBM克隆产品(康柏只是其中之一) 。AMD还在1982年底开始生产16位的Intel 80286——标记为Am286。

这是第一个真正重要的台式机PC处理器,而Intel的芯片频率通常在6到10 MHz的范围内,AMD的则从8 MHz开始,最高达到20 MHz。无疑,这标志着两个硅谷强“国”之间争夺CPU统治权的斗争的开始。对于英特尔的设计,AMD试图做得更好。

这一时期代表着刚刚起步的PC市场的巨大增长,并且注意到AMD Am286提供了比80286显着提高的速度,英特尔试图阻止AMD前进。并尝试通过将他们排除在获得下一代386处理器的许可证之外而实现。

为此AMD提起诉讼,但仲裁花了四年半的时间,最后的判决是英特尔没有义务将所有新产品转让给AMD,但更大的芯片制造商违反了默示的诚实信用盟约。

正是在IBM PC市场从55%激增到84%的时候,发生了英特尔许可证被拒的事件。由于无法获得新的处理器规格,AMD花了五年多的时间将80386反向到Am386中。在完成之后,就证明它不仅是英特尔芯片的仿制品。最初的386于1985年以12 MHz的频率首次亮相,后来又达到33 MHz,Am386DX的高端版本于1989年则以40 MHz的频率推出。

在Am386取得成功后,AMD在1993年发布具有高度竞争力的40 MHz Am486,并以相同的价格提供比Intel 33 MHz的 i486高20%的性能。这在整个486系列产品中重演。在英特尔486DX的频率达到100 MHz的时候,AMD提供了一个120 MHz的选择。为了更好地说明AMD在这段时期的实力,该公司的收入从1990年的10亿美元增加到1994年的20亿美元,翻了一番。

1995年,AMD推出了Am5x86处理器,作为486的后继产品,它可以对旧计算机进行直接升级。Am5x86 P75 +拥有150 Mhz的频率,“ P75”的参考性能与英特尔的Pentium 75相似。“ +”表示AMD芯片在整数运算方面比竞争对手略快。

为了解决这个问题,英特尔更改了命名约定,以其拉开他们与竞争对手和其他供应商与产品的距离。Am5x86从新销售和486计算机的升级中带来了可观的收入,。与Am286、386和486一样,AMD通过提供嵌入式解决方案继续扩大了这市场份额。

1996年3月,AMD推出了第一款完全自己工程师开发的处理器5k86,后来更名为K5。该芯片旨在与Intel Pentium和Cyrix 6x86竞争,该项目的强大执行力对AMD至关重要。按照介绍,该芯片具有比Cyrix强大的浮点单元,大约相当于Pentium 100,而整数性能则对标奔腾200。

K5芯片的彩色图像die

但最后,这给AMD带来了一道坎,因为该项目一直受到设计和制造问题的困扰。这些导致CPU无法满足频率和性能目标,并且上市时间晚了,导致其销售不佳。

而此时,AMD已经在NexGen上花费了8.57亿美元的股票,NexGen是一家小型无晶圆芯片(仅设计)公司,其处理器由IBM制造。AMD的K5和正在开发的K6在更高的时钟速度(〜150 MHz及更高)下存在缩放问题,而NexGen的Nx686已经展示了180 MHz的内核速度。买断后,Nx686成为AMD的K6。

K6架构则与英特尔的Pentium,Pentium II和(大部分重新贴标的)Pentium III对标。K6也造就了AMD的成功,这一切都归功于前英特尔员工Vinod Dham(“奔腾之父”),功,后者于1995年离开英特尔,投奔NexGen。

当K6在1997年投放市场时,它成为奔腾MMX的可行替代品。K6不断壮大,从最初的233 MHz速度发展到1998年1月的“ Little Foot”改版为300 MHz,1998年5月的“ Chomper” K6-2的频率达到350 MHz,令人惊讶的是AMD于1998年9月推出的“ Chomper Extended”修订版处理器的550 MHz频率。

伴随着K6-2的诞生,带来了AMD的3DNow!SIMD(单指令,多数据)指令集。从本质上讲,它与英特尔的SSE相同,它提供了一条访问CPU浮点功能的简便途径。不利的一面是,除了需要重写补丁和编译器以利用该功能之外,程序员还需要将新指令合并到任何新代码中。

与最初的K6一样,K6-2比其他竞争对手强得多,但价格通常是英特尔奔腾芯片的一半。K6的最终版本K6-III是一个更复杂的CPU,晶体管数量为2140万个,高于第一个K6的880万个和K6-II的940万个。

新的CPU集成了AMD的PowerNow !,可根据工作负载动态更改时钟速度。随着时钟速度最终达到570MHz,K6-III的生产相当昂贵,并且由于K7的到来而缩短了相对较短的使用寿命,K7更适合与Pentium III及其以后的产品竞争。

1999年是AMD的黄金时代的顶峰。因为在这一年,他们推出了K7处理器,并将其命名为速龙,这也表明他们不再便宜,也不是山寨选项。

也就是从500 MHz开始,Athlon CPU使用了新的Slot A(EV6)和DEC许可的新内部系统总线,该总线以200MHz的频率运行,超过了当时提供133MHz频率的英特尔。2000年6月,AMD推出了Athlon Thunderbird,这是一款因超频性能而倍受人们青睐的CPU,它集成了DDR RAM支持和全速2级片上高速缓存。

2 GHz的64位CPU性能

Thunderbird 及其后继者(Palomino, Thoroughbred, Barton和Thorton)在新千年的头五年中一直与英特尔的奔腾4竞争,其优势在于价格较低,但始终具有更好的性能。Athlon于2003年9月升级为K8(代号为ClawHammer),我们也称之为Athlon 64,因为它为x86指令集添加了64位扩展。

通常将此事件称为AMD的决定性时刻。因为在他们不断发展的同时,英特尔不惜一切代价研发的Netburst架构将要曝光。

这样一个相对较小的公司,从营收和收入水平来看,是不如英特尔的,但AMD充满了对成功的渴望。但是,我们也应该看到,当您处在高山最高峰的时候,你就需要花费所有的精力才能停留在那儿,这也是你唯一的额一条路。

失乐园

没有任何征兆表示AMD将挑战其地位。但在全球经济危机,内部管理不善,财务预测不佳和英特尔咄咄逼人的多重夹击下,一切都开始变了。

让我们看看2006年年初的情况如何。AMD和Intel都满足了CPU市场的多样化需求,但是前者拥有出色的基于K8的Athlon 64 FX系列。FX-60是双核2.6 GHz,而FX-57是单核,但运行在2.8 GHz。

正如当时的评论所显示,两者都是首屈一指的。它们非常昂贵,FX-60零售价超过1,000美元,但是英特尔的creme-de-la-creme也是3.46 GHz Pentium Extreme Edition 955。AMD似乎在工作站/服务器市场也占据上风,Opteron芯片的性能也优于英特尔的Xeon处理器。

英特尔面临的问题是他们的Netburst架构。据介绍,这样超深的流水线结构需要很高的时钟速度才能具有竞争力,但这反过来又增加了功耗和热量输出。换而言之,该设计已达到极限,不再需要重新设计,因此英特尔放弃了其开发,转而使用其较旧的Pentium Pro / Pentium M CPU体系结构来构建Pentium 4的后续产品。

该计划原本在2006年8月推出针对移动平台的Yonah设计,然后产生了针对台式机的双核Conroe架构。这是Intel的面子,他们将Pentium的名称降为低端预算型号,并用Core代替了,而他们积攒起来的13年品牌统治力也瞬间消失了。

英特尔向低功耗,高吞吐量芯片设计的过渡非常适合各种不断发展的市场,几乎在一夜之间,英特尔在主流和发烧友领域夺得了性能冠军。到2006年底,AMD已从CPU峰会上被坚决地撤离,但一个灾难性的管理决定将他们推向了高潮。

在英特尔发布Core 2 Duo的三天前,AMD公开宣布了一项举措,该举措已得到当时的首席执行官赫克托·鲁伊斯(Hector Ruiz)的完全认可(桑德斯(Sanders)于4年前退休)。那就是2006年7月24日,AMD宣布打算以54亿美元(包括43亿美元的现金和贷款,以及从5800万股筹集的11亿美元)收购图形卡制造商ATI Technologies。这笔交易是一场巨大的财务赌注,收购占当时AMD市值的50%,尽管这笔收购是合理的,但价格绝无仅有。

我们认为,ATI被严重高估了,因为它并没有(与Nvidia一样)带来相当的收入收入。ATI也没有生产基地,其价值几乎完全基于知识产权。由于高估了ATI的商誉价值,AMD吸收了26.5亿美元的减记,最终承认了这一错误。

缺乏管理前瞻性的是,ATI的手持图形部门Imageon也以微不足道的6,500万美元价格卖给了高通。该部门现名为Adreno,是“ Radeon”的字形,这个产品是Snapdragon SoC的组成部分。

Xilleon则是用于数字电视和电视电缆盒的32位SoC,以1.928亿美元的价格出售给Broadcom。

除了烧钱外,AMD对英特尔更新后的架构的最终反应显然也很差劲。在Core 2发布两周后,AMD总裁兼首席运营官Dirk Meyer宣布了AMD新K10 Barcelona处理器的定稿。这是他们在服务器市场上的决定性举动,因为它是成熟的四核CPU,而当时英特尔仅生产双核Xeon芯片。

新的Opteron芯片于2007年9月面世,但它并没有抢走英特尔的风头,而是随着一个bug的发现,而遭受打击。该错误在极少数情况下会涉及嵌套的缓存写入而导致锁定。到最后,TLB漏洞都终止了AMD K10的生产。其实BIOS补丁可以解决传出处理器上的问题,但这样做会损失大约10%的性能。修改后的“ B3步进式” CPU在6个月后交付时,但这已经给AMD造成了销售和声誉方面的损失。

一年后,也就是2007年末,AMD将四核K10设计推向了台式机市场。到那时,英特尔一直处于领先地位,并发布了现在著名的Core 2 Quad Q6600。在纸面上,K10是卓越的设计——所有四个核心都在同一个芯片中,而Q6600则在同一封装中使用了两个单独的芯片。但是,AMD一直在努力达到预期的时钟速度,而新CPU的最佳版本仅为2.3 GHz。尽管比Q6600慢了100 MHz,但速度较慢,但价格也较贵。

但最令人困惑的是,AMD决定推出一个新的型号名称:Phenom。英特尔之所以选择Core,是因为Pentium已成为过高的价格和功能的代名词,并且性能相对较差。另一方面,Athlon是计算机发烧友非常了解的名称,并且它的速度与它的声誉相称。Phenom的第一个版本实际上并不差劲,它不如Core 2 Quad Q6600(已经很容易获得的产品)好,而且Intel在市场上也提供了更快的产品。

奇怪的是,AMD似乎做出了有意识地放弃了广告,再加上他们在企业的软件方面毫无存在感。这就让我们对AMD这段时间的操作有点不能够了解的。但是,如果不考虑英特尔的反竞争行为,那么对AMD历史上这个时代的回顾是不完整的。在此关头,AMD不仅在与英特尔的芯片作斗争,而且还在与公司的垄断活动作斗争,其中包括向OEM支付巨款(总计数十亿美元)。这些积极的行动使AMD CPU原理了新计算机。

在2007年第一季度,英特尔向戴尔支付了7.23亿美元,继续成为戴尔唯一的处理器和芯片组供应商-占戴尔公司9.49亿美元总营业收入的76%。AMD稍后将在此事上赢得12.5亿美元的和解金,表面上令人惊讶地低,但可能由于以下事实而加剧:在英特尔任由恶作剧之时,AMD本身实际上无法为其现有客户提供足够的CPU。

这并不是说英特尔需要做任何事情。与AMD不同,它们具有严格的长期目标设定,以及更大的产品和IP多样性。他们也拥有无与伦比的现金储备:到新千年的第一个十年结束时,英特尔已经获得了超过400亿美元的收入和150亿美元的营业收入。这为营销,研究和软件开发以及为自己的产品和时间表量身定制的代工厂提供了大量预算。在这些因素影响下,AMD在争夺市场份额的时候举步维艰。

另一方面,ATI数十亿美元的超额付款以及随之而来的贷款利息,令人失望的K8的继任者,以及迟迟未能上市的有问题的芯片,都令人不快。这也事情将变得更糟。

向前迈出一步

到2010年,全球经济正努力从2008年的金融危机中反弹。几年前,AMD处理了了自己的闪存部门,并拆分其晶圆制造部部门,成立了GlobalFoundries,AMD仍将一些产品放在这些产线上。这些操作大约导致10%的员工被裁掉了,节省下来的资金和现金注入意味着AMD可以屈服并完全专注于处理器设计。

AMD并没有改善K10的设计,而是从新结构重新开始,并在2011年底推出了Bulldozer架构。在K8和K10是真正的多核,同时多线程(SMT)处理器的情况下,新布局被归类为“集群多线程”。

推土机的四个模块设计

AMD的Bulldozer采取了一种共享的模块化方法:每个集群(或模块)都包含两个整数处理核心,但是它们并不是完全独立的。他们共享了L1指令和L2数据缓存,获取/解码和浮点单元。通过简单地将第一个Bulldozer CPU命名为AMD FX,AMD甚至放弃了Phenom的名称,回到了Athlon FX辉煌的年代。

所有这些更改背后的想法是减小芯片的整体尺寸并使它们更加节能。较小的裸片将提高制造良率,从而提高利润率,而效率的提高将有助于提高时钟速度。可扩展的设计还将使其适合更广泛的市场。

FX-8510是 2011年10月发布的最佳机型,具有4个群集,但以8核8线程CPU的形式销售。在这个时代,处理器具有多种时钟速度,FX-8150的基本频率为3.6 GHz,turbo时钟为4.2 GHz。但是,该芯片的尺寸为315平方毫米,峰值功耗超过125W。此时,英特尔也已经发布了Core i7-2600K:它是传统的4核,8线程CPU,运行频率高达3.8 GHz。它比新的AMD芯片小得多,只有216平方毫米,并且功耗降低了30W。

从表面上看,新的FX应该占主导地位,但是它的性能却有点令人难以置信——有时,处理大量线程的能力会大放异彩,但是单线程性能通常并不比它要取代的Phenom范围更好,尽管时钟速度优越。

在向Bulldozer的研发投入了数百万美元之后,AMD肯定不会放弃设计,而对ATI的收购现在开始见效。在过去的十年中,AMD首次涉足CPU和GPU组合封装(称为Fusion)的上市时间很晚,而且表现令人失望。

但是该项目为AMD提供了应对其他市场的手段。2011年初,另一种名为Bobcat的新架构发布了。

PlayStation 4中的AMD定制CPU + GPU芯片

针对如嵌入式系统,平板电脑和笔记本电脑等低功耗应用,这也是与推土机截然相反的设计:只有少量管道,仅此而已。几年后,Bobcat收到了急需的更新,变成了Jaguar架构,并在2013年被Microsoft和Sony选为Xbox One和PlayStation 4的芯片。

尽管由于之际通常以尽可能低的价格制造,因此利润率相对较低,但两个平台的销量均达数百万美元,这凸显了AMD创建定制SoC的能力。

多年来,AMD继续修改推土机设计。打桩机排在第一位,为我们提供了FX-9550(220 W,5 GHz怪物),但Steamroller和最终版本Excavator(于2011年推出,产品使用了4年)后来)更着重于降低功耗,而不是提供特别新颖的功能。

到那时,至少可以说,CPU的命名结构变得令人困惑。Phenom长期辞职于历史书籍,而FX的声誉有些差。AMD放弃了这种命名法,只是将其Excavator台式机CPU标记为A系列。

该公司的图形部门负责Radeon产品的发展,其命运也同样喜忧参半。AMD保留了ATI品牌名称,直到2010年,将其替换为自己的品牌。随着Graphics Core Next(GCN)的发布,他们还完全重写了ATI在2011年末创建的GPU架构。该设计将持续近8年,并将其运用于主机,台式PC,工作站和服务器。今天,它仍被用作AMD所谓的APU处理器中的集成GPU。

Graphics Core Next的首次亮相-Radeon HD 7970

GCN处理器逐渐具有强大的计算性能,但要获得最好的结构并不是最容易的。AMD有史以来功能最强大的版本,即Radeon VII中的Vega 20 GPU,拥有13.4 TFLOP的处理能力和1024 GB / s的带宽,但在游戏中,它无法达到与Nvidia最好产品的相同高度。

Radeon产品通常以热,嘈杂且非常耗电而著称。为HD 7970供电的GCN的初始迭代在满负载时需要远远超过200 W的功率。这主要因为它是在相对较大的工艺节点(TSMC的28nm)上制造的。到GCN以Vega 10的形式完全成熟时,这些芯片是由GlobalFoundries在其14nm节点上制造的,但是对能源的要求并没有Radeon RX Vega 64之类的最大消耗近300的芯片更好。

尽管AMD拥有不错的产品选择,但他们却没有达到应有的水准,他们努力赚取足够的钱。

到2016年底,该公司的资产负债表已连续4年亏损(2012年的财务状况因7亿美元的GlobalFoundries最终冲销而受损)。即使出售其代工厂和其他分支机构,债务仍然很高,甚至Xbox和PlayStation上的系统软件包的成功也未能提供足够的帮助。

从表面上看,AMD似乎陷入了严重麻烦。

新星a-ryze

由于没有什么可出售的东西,也没有任何大笔资金来挽救它们,因此AMD只能做一件事:加倍进行投资并且重组。在2012年,AMD召集了两个人,他们在AMD的复兴中扮演了重要角色。

K8系列的前首席架构师Jim Keller在离开13年后回归,开始着手两个项目:一个是针对服务器市场的基于arm的设计,另一个是基于标准的x86架构,与其合作的是首席架构师是Mike Clark(他也领导过 Bulldozer的设计)。

同时加入的还有飞思卡尔半导体公司(Freescale Semiconductors)的高级副总裁兼总经理Lisa Su。她在AMD担任了同样的职位,人们普遍认为她和当时的总裁Rory Read共同推动了公司向个人电脑以外的市场发展,尤其是向主机市场的进军。

Lisa Su (中间) and Jim Keller (最右)

在Keller重返AMD研发部门工作两年后,首席执行官Rory Read辞职,高级副总裁/总经理升职。Su拥有MIT的电子工程博士学位,并且对SOI(绝缘体上硅)MOSFET 进行了研究,因此Su具有使AMD恢复辉煌的学术背景和行业经验。但在大规模处理器的世界里,什么都不是一蹴而就的——芯片设计最多要花好几年时间才能投入市场。在此类计划得以实现之前,AMD仍旧面临着风险。

在AMD继续挣扎的同时,英特尔却越来越强大。核心架构和制造流程节点已经非常成熟,到2016年底,它们的营收接近600亿美元。多年来,英特尔一直采用“ tick-tock ”方法进行处理器开发:“ tick ”将是一种新的体系结构,而“ tock ”将是一种过程改进,通常以更小的节点的形式出现。

然而,并非所有的事情都是在幕后进行的,尽管利润巨大,英特尔几乎占据了整个市场的主导地位。2012年,英特尔预计将在3年内发布10nm节点的CPU。但这个预计并没有如期实现。他们的第一个14nm CPU,使用Broadwell架构,出现在2015年,在后面的五年当中英特尔仍然在该节点和基本设计上徘徊。

代工厂的工程师反复遇到10nm的良率问题,迫使英特尔每年都要改进旧工艺和体系结构。时钟速度和功耗不断攀升,但没有新的设计问世;这或许是他们Netburst时代的回声。个人电脑用户面临着令人沮丧的选择:要么从强大的核心产品线中选择价格高昂的产品,要么选择较弱、较便宜的FX/ a系列产品。

但是AMD已经悄悄地制造了一套可以制胜的卡,在2016年2月的E3年度活动上他们推出了该产品。利用用户渴望已久的Doom reboot 作为发布平台,AMD全新的Zen架构开始在市场中亮相。

除了诸如“同步多线程”、“高带宽缓存”和“节能finFET设计”这样的短语之外,很少有人提及新的设计。在2016年台北国际电脑展(Computex 2016)上,AMD给出了更多细节,包括将 Excavator结构改进40%的目标。

说这是一个雄心勃勃的说法是保守的——尤其是考虑到AMD Bulldozer 每版设计修订版都提供了适度的10%的增长这一事实。

他们还需要再过12个月才能真正出现该芯片,但是当它出现时,AMD的长期计划终于明确了。

任何新的硬件设计都需要合适的软件来销售,但多线程CPU正面临着一场艰苦的战斗。尽管主机采用8核CPU,但大多数游戏在4核的情况下仍然可以运行的很好。主要原因是英特尔的市场主导地位,以及Xbox One和PlayStation 4中都采用了AMD芯片的设计。前者早在2010年就发布了他们的第一个6核CPU,但它非常昂贵(接近1100美元)。其他处理器很快就出现了,直至7年后,英特尔才推出了用户真正买得起的六核处理器Core i5-8400,它的价格不到200美元。

主机处理器的问题在于CPU布局是由同一裸片中的两个4核CPU组成,并且芯片的两个部分之间存在高延迟。因此,游戏开发人员倾向于将引擎的线程保持在其中一个部分上,而仅将另一部分用于一般的后台进程。仅在工作站和服务器领域,才需要使用真正的多线程CPU,直到AMD提出了不同的方式,这种做法才得以改变。

2017年3月,普通桌面用户可以用两个8核16线程cpu中的一个来升级他们的系统。一个全新的架构显然应该有一个新的名字,AMD没有用 Phenom和FX来为之命名,而是选用了Ryzen作为其全新架构的名字。

但这两个CPU都不是特别便宜:3.6 GHz(增强4 GHz)Ryzen 7 1800X的零售价为500美元,而0.2 GHz较慢的1700X的售价则低100美元。在某种程度上,AMD不想再被认为是廉价的选择,但这主要是因为英特尔的8核酷睿i7- 690k要价超过1000美元。

Zen从之前所有的设计中吸取了最好的,并将它们融合到一个结构中,使pipelines尽可能的繁忙;要做到这一点,就需要对pipelines和缓存系统进行重大改进。新的设计不再像Bulldozer那样共享L1/L2缓存,每个核心将完全独立,拥有更多的pipelines、更好的分支预测和更大的缓存带宽。

Ryzen的CPU让人想起微软和索尼的主机芯片,它也是一个系统芯片;唯一缺少的是GPU(后来的预算Ryzen机型包含了GCN处理器)。

这个die被划分为两个所谓的CPU综合体(CCX),每个都是4核8线程的。芯片中还装了一个Southbridge处理器——该CPU为PCI Express、SATA和USB提供控制器和链接。这意味着,从理论上讲,可以在没有SB的情况下制造主板,但几乎所有的主板都这样做了,只是为了扩大可能的设备连接数量。

如果Ryzen的表现不佳,这一切都将是毫无意义的,而在多年位居英特尔之后,AMD在这一领域有很多需要证明的地方。1800X和1700X并不完美:在专业应用方面他比英特尔的任何产品都好,但在游戏方面要慢一些。

AMD还有其他玩法:第一款Ryzen CPU投放市场一个月后,出现了6核和4核Ryzen 5型号,两个月后又出现了4核Ryzen 3芯片。与英特尔的产品相比,AMD的表现与规模更大的兄弟公司一样,但它们的成本效率明显更高。

然后是ace——16核32线程的Ryzen Threadripper 1950X(要价1000美元)和用于服务器的32核64线程EPYC处理器。这些庞然大物在同一封装中分别包含两个和四个Ryzen 7 1800X芯片,利用新的Infinity Fabric互连系统在芯片之间传输数据。

在6个月的时间里,AMD展示了他们正在利用他们的设计,有效地对标了x86桌面市场。

一年后,架构升级为Zen+,包括对缓存系统的微调,以及从GlobalFoundries的古老的14LPP流程(该节点是三星的)切换到更新的、更密集的12LP系统。CPU芯片的尺寸保持不变,但是新的制造方法允许处理器以更高的时钟速度运行。

之后又过了12个月,即2019年夏天,AMD推出了Zen 2。这次变化更加重要,术语“小芯片 ”风靡一时。工程师没有遵循单片构造,即CPU的每个部分都在同一块硅片上(Zen和Zen +就是这样做),而是在Core Complexs中将其与互连系统分开。

前者是由台积电(TSMC)使用其N7工艺制造的,最终形成了 full dies ——故名“ 核心复合裸片(CCD)”。输入/输出结构由GlobalFoundries制作,桌面Ryzen模型使用12LP芯片,而Threadripper和EPYC具有更大的14 nm版本。

Zen 2 Ryzen和EPYC的红外图像。CCD小芯片显然与I / O芯片分开。图片:Fritzchens Fritz

小芯片设计将针对Zen 3进行保留和完善,目前预计将在2020年末发布。我们不太可能看到CCD打破Zen 2的8核,16线程布局,相反,它将与通过Zen +可以看到(例如,缓存,电源效率和时钟速度的提高)。

值得总结一下AMD在Zen方面取得的成就。在8年的时间里,该体系结构从一张白纸变成了全面的产品组合,包括99美元的4核,8线程预算产品到4,000美元以上的64核,128线程服务器CPU。

AMD的财务状况也发生了巨大变化:从亏损和债务激增到数十亿美元,AMD现在有望在明年内清算其贷款并发布超过6亿美元的营业收入。虽然Zen可能不是公司财务复苏的唯一因素,但它却起到了极大的作用。

AMD的图形部门的命运也发生了类似的变化——2015年,该部门被赋予了完全的独立性,即Radeon Technologies Group (RTG)。他们的工程师最重要的发展来自RDNA,这是对GCN的重大改造。对缓存结构的更改,以及对计算单元大小和分组的调整,将体系结构的重点直接转移到了游戏上。

Radeon RX 5700系列是使用这种新架构的首批模型,并展示了该设计的巨大潜力。微软和索尼并没有忽视这一点,他们都选择了Zen 2和更新后的RDNA 2来支持即将推出的Xbox和PlayStation 5游戏机。

尽管Radeon Group尚未获得与CPU部门相同的成功水平,并且其显卡可能仍被视为“有价值的选择”,AMD在架构开发和技术创新方面已经回到了它在Athlon 64 days的水平。他们升到顶峰,从高处坠落,就像神话中的凤凰意一样,浴火重生。

展望

问一个关于AMD的简单问题是再合适不过了:他们还会回到产品低迷、没有钱的黑暗时代吗?

即使2020年被证明是AMD非常出色的一年,而且第一季度的财务业绩较上年增长了40%,94亿美元的营收仍落后于英伟达(2019年的107亿美元),距离英特尔(720亿美元)也相去甚远。当然,后者拥有更大的产品组合,以及自己的晶圆厂,而英伟达的收入几乎完全依赖显卡。

AMD的畅销产品

显然,为了完全稳定AMD的未来,收入和营业收入都需要增长——那么如何实现呢?他们的大部分收入来自他们所谓的“计算和图形”部分,即Ryzen和Radeon销售。毫无疑问,这种情况还会继续改善,因为Ryzen非常有竞争力,RDNA 2架构将为游戏提供一个通用平台,可以在pc上运行,就像在下一代主机上一样。

英特尔最新的台式机CPU 在游戏领域的领先优势不断下降。它们还缺乏Zen 3将提供的功能的广度。Nvidia保持了GPU性能的桂冠,但是在Radeons的中端市场依然要面临激烈的竞争。也许这只是巧合,但即使RTG是AMD的完全独立部门,其收入和营业收入仍与CPU部门归为一类——这表明它们的图形卡虽然很受欢迎,但销量却不像他们的Ryzen产品。

对AMD来说,更紧迫的问题可能是,他们的企业、嵌入式和半定制业务在2020年第一季度的营收中所占比例不到20%,而且还处于亏损状态。鉴于任天堂的成功转型以及微软和索尼即将推出的新机型,Xbox和PlayStation在这一时代的销量停滞不前,或许可以解释这一现象。英特尔还完全主宰了企业级市场,没有人会因为一个令人惊喜的新CPU的出现,就放弃一个数百万美元的数据中心。

Nvidia DGX A100,配备两个64核AMD EPYC处理器

但在接下来的几年里,这种情况可能会发生改变,部分原因是新的游戏机,但也有可能是一个意想不到的领域。在所有公司中,英伟达选择了AMD而不是英特尔来为其新的深度学习/AI计算集群DGX 100提供CPU。原因很简单:EPYC处理器拥有更多的核心和内存通道,PCI快速通道比英特尔提供的任何产品都要快。

如果英伟达乐意使用AMD的产品,其他公司肯定会效仿。AMD将不得不继续攀登一座陡峭的山,但今天看来他们已经有了攀爬这座高峰的正确工具。随着台积电继续调整和完善其N7工艺节点,所有使用该工艺生产的AMD芯片也将逐步变得更好。

展望未来,AMD内有一些领域可以使用真正的改进。这样的领域之一就是营销。“ Intel Inside”的流行语已经存在了30多年,虽然AMD花了一些钱来推广Ryzen,但最终他们还是需要戴尔、惠普和联想等生产商销售采用他们的处理器,像他们采用英特尔的一样

在软件方面,已经有很多人在开发增强用户体验的应用程序,比如Ryzen Master,但直到最近Radeon驱动才出现了普遍的问题。游戏驱动程序可能非常复杂,但它们的质量可能决定硬件的声誉。

AMD目前处于其51年历史中最强大的位置。由于雄心勃勃的Zen项目没有很快达到极限的迹象,该公司像凤凰一样的重生获得了巨大的成功。他们虽然不在巅峰,但也许更好。据说历史总是在重演,但是我们希望这不会过去。一个健康而有竞争力的AMD,完全能够正面迎战英特尔和英伟达,这会为用户带来更多的好处。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/487499.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构-使用两个栈实现一个队列

1:如何只使用stack实现queue呢?我们知道stack是先进后出的(FIFO),而queue是先进先出的(FIFO)。也就是说,stack进行了一次反向。如果进行两次反向,就能实现queue的功能&am…

5G时代下,边缘计算产品的未来展望

来源:北京物联网智能技术应用协会首发于人人都是产品经理。一、边缘计算市场潜力1. 5G基建如火如荼,万物互联互融将成为新战场2019年6月6号上午工信部宣布正式为中国移动、中国联通、中国电信、中国广电四家企业颁发5G牌照,中国正式进入5G元年…

使用Xcode进行iOS设备无线调试

设备环境:Mac OSX 10.12.5、iOS11、Xcode9PS:这是WWDC2017的新功能,iOS11以上,Xcode9这是刚性要求。这个功能不好找,就记下来了 手机连接上Xcode,打开Xcode菜单:Windows->Device and Simulators。找到连…

java 请求url 返回数据_java后台发起get请求获取响应数据|chu

本文实例为大家分享了java后台发起get请求获取响应数据,供大家参考,具体内容如下学习记录:话不多说直接上代码:package com.jl.chromeTest; import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.H…

Android Studio 设置字体

File->Settings->Editor->Colors & Fonts->Font->Editor Font 转载于:https://www.cnblogs.com/WJQ2017/p/7608370.html

这三个博弈论新趋势,正深刻影响深度强化学习

来源 | AI科技评论作者 | Jesus Rodriguez编译 | 亚尔曼•佩皮校对 | 丛末 & Camel博弈论在现代人工智能(AI)解决方案中正扮演着至关重要的角色,深度强化学习(DRL)正是积极拥抱博弈论的头等公民。从单智能体程序到…

美国再出半导体新法案!1800亿谋求芯片制造振兴

文章来源:EE Times、James E.Risch芯东西(ID:aichip001)编 | 董温淑芯东西7月1日消息,上周,多位美国两党议员共同提出《2020美国晶圆代工法案(AFA,The American Foundries Act Of 20…

stackexchange.mysql_.net core使用redis基于StackExchange.Redis

.net core使用redis基于StackExchange.Redis教程,具体如下一.添加引用包StackExchange.RedisMicrosoft.Extensions.Configuration二.修改配置文件 appsettings.json{"RedisConfig": {"Redis_Default": {"Connection": "127.0.0.…

Apache网站服务

Apache 下载地址: http://mirror.bit.edu.cn/apache/httpd/相关软件下载地址:http://mirror.bjtu.edu.cn/apache/apr/apr          http://mirror.bjtu.edu.cn/apache/apr/apr-utilApache 简介: 进程技术,高资源消耗&…

微积分的发展史

来源:数学中国早期萌芽时期:1、 古西方萌芽时期:公元前七世纪,泰勒斯对图形的面积、体积与的长度的研究就含有早期微积分的思想,尽管不是很明显。公元前三世纪,伟大的全能科学家阿基米德利用穷竭法推算出了…

c# mysql代码中写事务_代码中添加事务控制 VS(数据库存储过程+事务) 保证数据的完整性与一致性...

[c#]代码库代码中使用事务前提:务必保证一个功能(或用例)在同一个打开的数据连接上,放到同一个事务里面操作。首先是在D层添加一个类为了保存当前操作的这一个连接放到一个事务中执行,并事务执行打开同一个连接、事务完成关闭同一个连接的一个…

AI的“色差”与“纠偏”

来源:脑极体在美国学术界声援BLM(Black Lives Matter)之后,事情的走向有点难以预料。学术界的反种族歧视反省似乎没有了下文,但是如火如荼的BLM运动早已蔓延开来,这次将矛头指向了AI界。事情的起因是杜克大…

英伟达奔驰共同发布自动驾驶系统,还自带停车功能

大数据文摘出品来源:VB编译:白浩然最近,英伟达(Nvidia)宣布为了和奔驰(Mercedes-Benz)汽车紧密合作,计划从2024年开始推出一款车载计算系统和AI基础设施,该技术于去年1月…

Gartner发布2020年数据与分析领域的十大技术趋势

来源:Gartner公司近日,Gartner发布了数据与分析领域的十大技术趋势,为数据和分析领导者的新冠疫情(COVID-19)响应和恢复工作提供指导,并为疫情后的重启做好准备。数据和分析领导者如果希望在疫情后能持续创…

java2019 数据结构算法面试题_2019年JVM最新面试题,必须收藏它

1、JVN内存结构方法区和对是所有线程共享的内存区域;而java栈、本地方法栈和程序员计数器是运行是线程私有的内存区域。Java堆(Heap),是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一…

前沿科技 | 中科院科学家研究揭示灵活行动选择的神经机制

来源:中国科学院6月24日,中国科学院科学家团队——脑科学与智能技术卓越创新中心(神经科学研究所)、上海脑科学与类脑研究中心、神经科学国家重点实验室姚海珊研究组在eLife上在线发表了题为《次级运动皮层在灵活视觉分类行为中参…

中科院调查组成立!杨辉发表声明,并对举报信作出详细回应

左:加州大学圣地亚哥分校教授付向东。右:中科院神经所青年 PI 杨辉。图片来源:UCSD/一席演讲来源 BioArtReports 中科院神经所 等整理 科研圈7 月 2 日,网络消息称加州大学圣地亚哥分校细胞和分子医学系教授付向东发布实名举报信&…

java lookandfeel nimbus_动态改变LookAndFeel

LookAndFeel可以改变图形界面的风格,比如说可以将Java的默认界面改变成仿Windows,UNIX等其它风格的界面,主要有以下几种界面风格:metal(默认):"javax.swing.plaf.metal.MetalLookAndFeel"windows:"com.sun.java.sw…

盘点华为系工控企业——中国A股上市公司最多的创业体系

来源:OFweek工控别看今日华为风光无限,美国举国打压下更显华为雄厚实力;但早在2000年左右,全球IT产业泡沫破灭,作为通信设备商,华为也受累进入寒冬,任正非为了鼓励团队士气,写出了著…

秦川团队《科学》刊发研究:新冠感染恒河猴康复后不会再感染

来源:澎湃新闻新冠病毒(SARS-CoV-2)肺炎疫情全球大流行的背景下,恢复期患者是否有再次感染的风险目前尚不清楚。来自中国的最新科研成果表明,原发性新冠病毒感染可防止随后再感染,这对新冠患者的预后和下一…