尝试梳理下ARM处理器的发展历史

大家好,这篇文章是我的朋友Michael Yao写的,我觉得非常不错,分享给大家。

1. 前言

本文尝试简单梳理下ARM处理器的发展历史、架构的演进,包括不同处理器的应用方向,但我们重点还是围绕Cortex-A系列展开,也会介绍不同微架构处理器之间的继承关系,以及它们分别出自哪个设计团队等。不出意外,这将会是一个系列,分别是ARM处理器及架构发展概述、ARMV7-A架构以及微架构分析、ARMv8-A架构以及微架构分析,一些关键技术如Trustzone/big.LITTLE/NEON/AMBA、以及整个ARM软件生态的总体情况分析等。

2. ARM处理器发展历史及商业模式

364c7d1e4f8bd3cd14ee8dc2bf053102.png

ARM的前身是英国剑桥的Acorn Computers ,1990年正式成立,从1997年发布具有里程碑意义的ARM9后,从此进入快速发展的阶段。

34852eddd0bbed4c8088131d02dc8e38.png

ARM架构是当今世界上应用最广的RISC处理器架构之一,凭借其开放架构授权的商业模式,以低功耗为特点,是嵌入式和移动处理器领域绝对的霸主。除了CPU,ARM还会提供Mali GPU、符合AMBA协议的总线设计、一些常见外设IP,包括配套软件等一整套SoC解决方案。

ARM 的商业模式为IP授权,即通过知识产权授权的方式,收取一次性技术授权费用和版税提成。但ARM 只专注于设计CPU/GPU等IP的设计,代工或生产由被授权的客户自行解决。ARM收入包括前期授权费(license)版税(Royalty),其中版税是按照使用ARM的芯片的出货量,按比例抽成。

d788d6a2bcb8f7db6e88e1d21ed3b62c.pngARM提供授权的方式有这么几种:

  • 处理器授权:是最低的授权层级,指授权合作厂商使用ARM设计好的处理器,对方不能改变原有设计,但可以根据需要调整如产品的频率、功耗等。

  • POP(Processor Optimization Pack,处理器优化包)授权:处理器授权的高级形式, ARM出售优化后的处理器给授权合作厂商,方便其在特定工艺下设计、生产出性能有保证的处理器,如为三星、德州仪器、 博通、飞思卡尔、富士通等基于ARM处理器推出自己的芯片。

  • 架构/指令集层级授权:可以对 ARM架构或 ARM指令集进行改造以实现自行设计处理器,如高通的Krait架构和苹果的Swift架构等。

3. ARM处理器架构发展概述

9c953e181916cbf5dfe5dd85406141ea.png

ARMv6主要特性

  • Thumb-2:是对32位ARM指令集的扩充,它的目标是为了实现更高的代码密度;

  • TrustZone:安全扩展,将物理资源隔离,分为Secure word和nNormal word,处理器通过SMC指令,可以在两个世界之间切换。该扩展需要总线、MMU的支持,DDR、SRAM、外设等也需要不同的IP来做控制,以实现安全隔离;

  • SIMD:这一代SIMD指令集依赖的向量寄存器,复用了ARM本身的通用寄存器。支持8/16bit整数,可以实现4个8bit整数或者2个16bit整数的并行计算;

ARMv7主要特性

  • 高级SIMD:在ARM v7-A架构中,ARM进一步发展自身的SIMD指令集,并命名为NEON。这一代的指令集,有32个64bit的NEON向量寄存器,同时也支持单精度浮点;

  • VFPv3/v4:浮点体系结构 (VFP) 为半精度、单精度和双精度浮点运算中的浮点操作提供硬件支持,符合 IEEE-754 标准,VFPv4相当于VPPv3主要增加了half-precision extension和乘加的指令。ARM的vfp可以实现为32个或16个double-word register,分别以VFPv3-D32和VFPv3-D16来表示。当NEON和VFP同时实现时,VFP只可以实现为VFP-D32;

  • LPAE(Large Physical Address Extension):大地址扩展,一般为40位地址扩展,可以将寻址范围从2^32 4GB扩展到2^40 1TB,也有处理器后来扩展到44bit ;

  • Virtualization:在 Normal world 里面加入了一个新的CPU模式——HYP mode,需要MMU和GIC(中断控制器)分别提供IPA(Intermediate Physical Address)和虚拟中断的转发的支持。

ARMv8主要特性

  • Secure EL2:该特性Armv8.4-A引入,在Secure word增加了虚拟化支持;

  • PA(Pointer Authentication):v8.3引入,增强安全,函数指针检查,CPU在执行函数跳转时检查函数指针是否正确(使用MAC算法),防止跳转指针被修改;

  • BTI(Branch Target Identifiers):v8.5引入,对间接跳转的目标进行限制。与PA结合使用极大程度减少控制流攻击;

  • MTE(Memory Tagging Extension):v8.5引入,内存区域进行标记,对保护区域访问必须使用具有相同标记的指针。可检测溢出、UAF类漏洞;

  • Scalar Floating Point:aarch64提供32个128-bit寄存器用于SIMD vector and scalar floating-point支持;aarch32提供32个64-bit寄存器用于SIMD vector and scalar floating-point支持;

  • Enhanced Crypto:v8一开始就增加了cryptography 指令,包括AES, SHA-1/SHA-256 等算法实现,又在v8.4增加了"SHA3/SHA512/SM3/SM4"的支持;

  • bfloat:v8.2引入,增加FP16数据处理指令

  • Vector Extensions:v8.2引入,Scalable Vector Extension(SVE)是arm AArch64架构下的下一代SIMD指令集,旨在加速高性能计算,允许vector从28到2048 bit长度可变 。

  • Improved virtualization support:v8.4引入

ARMv9主要特性

Improved Security:主要是引入了全新的CCA(confidential compute architecture,机密计算架构 )架构。机密计算可以打造基于硬件的安全运行环境来执行计算,保护部分敏感数据和代码,甚至不受特权软件的影响,即使是具有最高权限的OS也无法影响。虽然OS可以决定何时运行,但应用程序位于独立的硬件保护内存区域,和系统中的一切是隔离的。这意味着就算应用感染了恶意软件,也不会传播给设备里的其他部分。

Digital Signal Processing & Machine Learning:在ARMv8.2中引入SVE,但它的问题在于,新的可变矢量长度SIMD指令集的第一次迭代的范围相当有限,并且更多地针对HPC工作负载,缺少了许多仍由NEON涵盖的更通用的指令。SVE2,旨在通过用所需指令补充新的可扩展SIMD指令集来解决此问题,以服务于类似DSP/ML等目前仍在使用NEON的工作负载。除了增加的各种现代SIMD功能外,SVE和SVE2的优势还在于其可变的向量大小,范围覆盖了128bits到2048bits,让其无论在什么硬件运行,都允许向量的可变粒度为128b。如果纯粹从向量处理和编程的角度来看,这意味着软件开发人员将只需要编译一次其代码,并且如果将来某个CPU带有本地的512b SIMD execution pipelines,该代码将能够充分利用单元的整个宽度。同样,相同的代码将能够在具有较低硬件执行宽度能力的保守设计上运行,这对于Arm设计从物联网、移动到数据中心的CPU而言至关重要。在保留Arm体系结构的32bits编码空间的同时,它还可以完成所有这些工作。然而类似X86这样的架构则需要根据矢量尺寸增加新的指令和扩展。

4. ARM处理器分类及应用领域

b87d1a00a37d243a6ee404a93882169b.png

ARM处理器现在产品线主要有Cortex-A、Cortex-R、Cortex-M、SecureCore、Neoverse等几个系列。

Cortex-A系列处理器

351d66f36ab1e48149c525169197517a.png

Application Processors(应用处理器),主要面向移动计算,智能手机领域,2011年引入big.LITTLE,至2017年演化为DynamIQ。该系列历经ARMv7、ARMv8和ARMv9(上图并没有列出全部ARMv8处理器和ARMv9处理器,后面会有介绍)。系列支持基于内存管理单元(MMU)的虚拟内存系统体系结构(VMSA)。ARMv8它支持A64、A32和T32指令集,ARMv9开始已不再支持32位指令集。

Cortex-R系列处理器

db39c52ac53129a684975c3e733422be.png

Real-time Processors(实时处理器),面向实时应用的高性能处理器系列,例如硬盘控制器,汽车传动系统和Modem基带等,该系列主要支持基于内存保护单元(MPU)的受保护内存系统体系结构(PMSA)。它支持A32和T32指令集。但最新的是Cortex-R82处理器,是64bit,带MMU,支持RichOS,支持NEON

Cortex-M系列处理器

d92d93197ff88d011eaefd78207b5db9.png

Microcontroller Processors(微控制器处理器),微控制器处理器通常设计成面积很小和能效比很高。通常这些处理器的流水线很短,最高时钟频率相对较低,它支持T32指令集的变种。主要面向IOT物联网领域。

SecureCore系列处理器

e7d381cdc468038ce1d0980661652caf.png

SecureCore,基于ARM-M架构,增强了嵌入式安全,主要有SC000和SC300,分别基于Cortex-M0 (v6-M)和Cortex-M3(v7-M)。

Neoverse系列处理器

b87e714248e159b1fd870377ffcf7c68.png

Neoverse(服务器端),面向云端到边缘的HPC、AI/ML加速等领域,是Cortex之外的另一条面向服务器和基础设施设备的核心IP。如初代发布即收获不错市场反响的Neoverse N1核心IP,亚马逊Graviton2、Ampere Altra是基于IP设计的产品。

ARM处理器的发展历史如下所示:

707ec2999a06b3607c70205ac9fb01ab.png

其他应用领域

ARM的汽车增强(AE)IP系列产品,于2018年推出Cortex-A76AE处理器,主要用于汽车ADAS(高级驾驶员辅助)系统,其支持Split-Lock分离-锁定技术,使得CPU核心可以运行在不同的模式下,分离模式下性能最大化,锁定模式下两个核心/线程可以互相锁定,最大程度确保安全。除了安全性能之外,Cortex-A65AE处理器还是ARM首个支持SMT多线程技术的,SMT为了提高数据吞吐率,因为ADAS除了安全和性能外,还需要处理大量传感器带来大计算负载及高吞吐量。据ARM宣称,Cortex-A65AE处理器在能效更高的情况下吞吐率比前代(Cortex-A53)提升3.5倍。2020年,ARM又推出了新的Cortex-A78AE,新产品带来了更高性能的CPU内核,还首次采用了AE级GPU Mali-G78AE 和ISP Mali-C71AE。新的Cortex-A78AE基于Cortex-A78微架构,与上一代Corex-A76AE相比,IPC提升了30%。

苹果在2020年11月,发布了基于ARM处理器的MAC便携机,该SoC芯片为M1。另外,根据网上资料,高通基于ARM处理器的PC芯片应该会在这两年推出。

5. ARM Cortex-A系列处理器

ARM Cortex-A系列处理器细分

5f50cf5c9559ce34437385bc5e567ceb.png

ARM Cortex-A系列处理器目前主要有超低功耗核、小核、大核、超大核4个系列,我们主要关注ARMv7、ARMv8和ARMv9这三代架构的处理器。

  • 超低功耗的处理器有:ARMv7架构的A5和A7,ARMv8架构的A35、A32和A34;

  • 作为小核的处理器有:ARMv7架构的A8和A9,ARMv8架构的A53和A55,以及ARMv9架构的A510;

  • 作为大核的处理器有:ARMv7架构的A15和A17,ARMv8架构的A57、A72、A73、A75、A76、A77和A78,以及ARMv9架构的A710和A715;

  • 作为超大核的处理器有:ARMv8架构的X1,以及ARMv9架构的X2和X3;

2011年有了big.LITTLE技术出来以后,ARMv7架构的A7可以作为小核和A15/17作为大核搭配;2012年ARMv8架构的A53作为小核和A57/A72/A73搭配使用;当然有了A35后,A53/A55也可以作为大核与A35作为小核搭配使用;2017年big.LITTLE进化为DynamIQ,大小核的搭配更为灵活多变,A75到A78都可以作为大核与A55进行搭配,此时出现了1+3+4(1个超大核、3个大核和4个小核)的搭配,一般用大核超频当做超大核用。

直到2020年ARM发布Cortex-X1,才有了真正意义上的超大核,定义是“可定制”移动平台,芯片商可以根据预算和需求向ARM提出要求,然后ARM再根据不同的应用场景调整各个模块的规格设计,当然也需要单独的授权。Cortex-X2/X3应该都是公版了(这块存疑)。最新的搭配可以有1个X3(超大核)+3个A715(大核)+4个A510(小核)这样的组合。

ARM Cortex-A系列处理器演进关系

7a0d78333021250b0919326ded4154e5.png

从整体演进关系我们可以看到A9分为:A5往下的系列CPU(超低功耗路线)、A15(大核和超大核)、A12/17(未演进?)、A7分支(小核)这么几个分支;其中大核从A77又分化成传统大核和Cotex-X系列的超大核。

be2f103b3b06455839b229ab3a363598.png

大核演进路线为:A8->A9->A15->A57->A72->A73 -> A75 ->A76> A77->A78->A710->A715

9179cf1e14ea8699bdd8ec04f51752a6.png

超大核是从A77这一支线分叉出来的,分别为 A77->X1->X2->X3

6aebcf4b9b2a56749459c43e1559ad95.png

小核的演进路线为:A9->A7->A53->A55>A73 -> A510

72e5a9db251a9e6e54f7e200de2eba01.png

超低功耗核的演进路线为:A9->A5->A35->A32/A34

ARM处理器设计团队

2c15a816b36e3398467a5ebe1bbbbf23.png

ARM处理器主要出自Austin、Sophia、Cambridge三个Team之手,主要处理器如下:

  • Austin (Texas)

    • Cortex-A8, Cortex-A15, Cortex-A57, Cortex-A72, Cortex-A76, Cortex-A77, Cortex-A78

    • Cortex-X1, Cortex-X2, Cortex-X3

    • Neoverse N1, Neoverse N2, Neoverse V1

  • Sophia-Antipolis (France)

    • ARM11, Cortex-A9, Cortex-A12, Cortex-A17, Cortex-A73, Cortex-A75

  • Cambridge (UK)

    • Cortex-A5, Cortex-A7, Cortex-A53, Cortex-A35, , Cortex-A55

另外,从网上公开资料看,Cortex-A76AE是美国ArizonaChandler design centre设计的,其他面向汽车领域的处理器如Cortex-A65E/A78E是否为该团队设计暂未可知。

全文完。

参考文章

  • https://en.wikichip.org/wiki/arm_holdings

  • https://en.wikipedia.org/wiki/AArch64

  • https://developer.arm.com/documentation/102378/0201/Armv8-x-and-Armv9-x-extensions-and-features

  • https://www.arm.com/zh-TW/architecture/security-features/arm-confidential-compute-architecture

  • https://broadgeek.com/2021/12/12/c8bf/

  • https://en.wikipedia.org/wiki/List_of_ARM_processors

  • https://www.anandtech.com/show/13727/arm-announces-cortex65ae-for-automotive-first-smt-cpu-core

  • https://www.anandtech.com/show/13398/arm-unveils-arm-safety-ready-initiative-cortexa76ae-processor

  • https://www.anandtech.com/show/16114/arm-announces-cortexa78ae-malig78ae-and-malic71ae-autonomous-system-ips

  • http://www.anandtech.com/show/10347/arm-cortex-a73-artemis-unveiled

  • ARM行业研究框架,太平洋证券

c1e31cf8238824b88335c4428ef93d5a.jpeg

1fe95eca5acf6cf68d5507cfbc69662a.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/463813.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux下的CPU、内存、IO、网络的压力测试

一、对CPU进行简单测试: 1、通过bc命令计算特别函数 例:计算圆周率 echo "scale5000; 4*a(1)" | bc -l -q MATH LIBRARY If bc is invoked with the -l option, a math library is preloaded and the default scale is set to 20.…

清空sql server日志

1、打开查询分析器,输入命令DUMP TRANSACTION 数据库名 WITH NO_LOG2、打开企业管理器--右键你要压缩的数据库--所有任务--收缩数据库--收缩文件--选择日志文件--在收缩方式里选择收缩至: ,这里会给出一个允许收缩到的最小M数,直接输入这个数,确定就可以了。3、在数…

find与grep的区别

find 功能:在目录结构中搜索文件,并执行指定的操作。此命令提供了相当多的查找条件,功能很强大。 语法: find 查找位置 匹配文件名 说明:find命令从指定的起始目录开始,递归地搜索其各个子目录,查找满足寻…

给你这张图,你能搜索到来历吗

如果我们想让搜索引擎帮我们找到这张图的来历,可能吗? 这是目前搜索引擎做不到的。如果能做到呢? 转载于:https://www.cnblogs.com/shangge/archive/2008/07/23/1249767.html

晚上读内核代码

最近因为要解决一个bug,需要在内核的f_hid.c里面做一些适配,需要把这部分代码研究透彻。在这几天之前我是根本不知道什么是In端点,Out端点,以及什么是endpoint 0的,而且最近的一段时间,我一直是在写应用方面…

我的家庭私有云计划-16

嗯,上午测试S2S的稳定性,改掉几个bug。还挺忙的。这会儿让机器跑测试去,腾出点时间,我们接着聊。 呵呵,昨天哪,已经有朋友批评我了,说我有点贪大求全,这个论坛什么的没必要自己实现&…

采用存储复制方式同步数据,实现数据库安全升级

2017年年初,海天起点为某省中行机房搬迁工作保驾护航。在机房搬迁过程中发现有多套数据库需要升级到11g,但由于有些数据库比较老旧,升级过程不能一次性完成,需要先升级到一个中间版本,再升级到最终目标版本。 但由于银…

【转】娱乐八卦——关于孙悟空的授业师傅的分析

一.《西游记》和《封神演义》联系密切  提起明朝著作《西游记》和《封神演义》,我想你一定不会陌生。从两部作品中派生出来的《孙悟空大闹天宫》、《哪吒闹海》等神话就更是家喻户晓,人人皆知了。两部小说虽然讲述的是不同朝代的故事&#…

为啥要xargs

转载:http://blog.csdn.net/yhcharles/article/details/44875865 为啥要xargs? 通常linux命令可以用|首尾相连,上一个命令的 stdout 连接到下一个命令的 stdin。但是有些命令,比如ls、rm等,是从命令行参数接受输入的。这时候如果…

Linux进程调度与性能优化 | 真货

作者简介:张毅峰,某主机厂架构师。一、eBPF安全可观测性的前景展望本次分享将从监控和可观测性、eBPF安全可观测性分析、内核安全可观测性展望三个方面展开。1.监控(Monitoring)vs可观测性(Observability)从上图可以看到,监控只是可观测性的冰…

教师生涯由此开始

招聘会时间:2012-03-28 09:00 招聘会地址:就业办507 为加强教师队伍建设,建设教育强县,经研究,我县决定面向全国“985”、“211”工程高等师范院校应届毕业生选聘普通高中和初中教师38名。现将有关事项公告如下&#x…

AutoCAD .net 二次开发官方教程及源码C#版(4)-(源码下载)

示例源码第4章 数据库基础2:添加自定义数据在这一章中,我们将创建一个新的字典对象,它用来表示我们雇员就职的 ‘Acme 公司‘(呵呵,当然是虚构的一家公司)的部门。这个“部门”字典对象将包含一个表示部门经理的记录。…

二叉树前序、中序、后序遍历非递归写法的透彻解析

前言 在前两篇文章二叉树和二叉搜索树中已经涉及到了二叉树的三种遍历。递归写法,只要理解思想,几行代码。可是非递归写法却很不容易。这里特地总结下,透彻解析它们的非递归写法。其中,中序遍历的非递归写法最简单,后序…

深夜看代码2

昨天的文章晚上读内核代码有人评论说好像说了一些什么,好像又没有说什么,所以我到底是在说什么呢?因为今天已经把内核修改好了,自己也测试了,所以这次好好说下,我到底是说了什么,又做了什么。—…

ecshop程序设置伪静态简单三步骤

ecshop相信很多做网站商城的站长朋友都会用到的程序,那么ecshop如何才能设置伪静态?之前本人在调整我这两个站时可费了我不少功夫;http://www.belle-china.com/;http://www.camel-hk.com/你们可以看到了吧我这两个站现在已经弄好了…

F#学习之路(2) 深刻理解函数(上)

函数在函数式编程语言中是一等公民,是函数式语言中最重要的基本组成元素,也是其名称的由来。 F# 中的函数之如C#中的类,是组织程序结构的最基本单元。是命令式编程语言中函数或OO编程语言中方法的超集。超集,有多强大&#xff1f…

TaskTResult 多线程 多参数 返回值

最近项目需求多线程,使用了线程池和Thread开启新线程,总不符合我的想要的,于是看了下新特性Task 废话不多说,直接贴代码,实验的demo 只作参考 1 internal class Program2 {3 private static void Main(st…

C++ 线程安全的单例模式

转载:https://www.cnblogs.com/ccdev/archive/2012/12/19/2825355.html 废话不多说,常用的代码积淀下来。 一、懒汉模式:即第一次调用该类实例的时候才产生一个新的该类实例,并在以后仅返回此实例。 需要用锁,来保证其…

写代码多就牛逼?

最近遇到了一些人、一些事,然后就想着拿出来总结总结,并谈谈自己的一些看法,所以就有了这篇文章。首先,我们来看看下面遇到过的两种情景。情景1:在工作中经常会遇到这样一些人:要他们实现一些功能&#xff…

Ubuntu16.04彻底删除MySQL5.7

彻底删除mysql5.7 删除mysql前 先删除一下 /var/lib/mysql 还有 /etc/mysql 下面命令依次执行 sudo rm /var/lib/mysql/ -R # 删除数据库目录 sudo rm /etc/mysql/ -R #删除启动脚本、配置文件等 sudo apt-get autoremove mysql* --purge # 卸载mysql所有文件 sudo apt-get rem…