Linux 从头学 01:CPU 是如何执行一条指令的?

摘自:Linux 从头学 01:CPU 是如何执行一条指令的?
作者:IOT物联网小镇
发布时间:2021-07-02 08:22:43
网址:https://blog.csdn.net/jchen1218/article/details/118404217?utm_source=app&app_version=4.10.0&code=app_1562916241&uLinkId=usr1mkqgl919blen

文章目录

    • 【Linux 从头学】是什么
    • 古老的 Intel8086 处理器
    • 主存储器是什么?
    • 寄存器是什么?
    • 三个总线
    • CPU 如何对内存进行寻址?
    • 我们是如何控制 CPU 的?
    • CPU 执行指令流程

【Linux 从头学】是什么

这两年多以来,我的本职工作重心一直是在 x86 Linux 系统这一块,从驱动到中间层,再到应用层的开发。

随着内容的不断扩展,越发觉得之前很多基础的东西都差不多忘记了,比如下面这张表(《深入理解 LINUX 内核》第 47 页):

这张表描述了 Linux 系统中几个段描述符信息。

数据段代码段,仔细看一下相关书籍就知道这些描述符代表什么意思,但是:

为什么这几个段的 Base 地址都是 0x00000000

为什么 Limit 都是 0xfffff

为什么它们的 Type 类型和优先级 DPL 又各不相同?

如果没有对 x86 平台的一些基础知识的理解,要啃完这本书真的是挺费力气的!

更要命的是,随着 Linux 内核代码的体积不断膨胀,最新的 5.13 版本压缩档已经是一百多兆了:

这么一个庞然大物,如何下手才能真正的学好 Linux 呢?!

即便是从 Linux 0.11 版本开始,其中的很多代码看起来也是非常费劲的!

周末在整理一些吃灰的书籍时,发现几本以前看过的好书: 王爽的《汇编语言》,李忠的《从实模式到保护模式》,马朝晖翻译的《汇编语言程序设计》等等。

都是非常-非常-老的书籍,再次翻了一下,真心觉得内容写得真好

对一些概念、原理、设计思路的描述,清晰而透彻。

Linux 系统中的很多关于分段、内存、寄存器相关的设计,都可以在这些书籍中找到基础支撑。

于是乎,我就有了一个想法:是否可以把这些书籍中,与 Linux 系统相关的内容进行一次重读和整理,但绝不是简单的知识搬运。

考虑了一下,大概有下面几个想法:

  1. 先确定最终目标的目标:学习 Linux 操作系统;

  2. 这几本书写的都是汇编语言,以及比较基础的底层知识。我们会淡化汇编语言部分,把重点放在与 Linux 操作系统有关联的原理部分;

  3. 不会严格按照书中的内容、顺序来输出文章,而是把几本书中内容相关的部分放在一起学习、讨论;

  4. 有些内容,可以与 Linux 2.6 版本中的相关部分进行对比分析,这样的话在以后学习 Linux 内核部分时,可以找到底层的支撑;

  5. 最后,希望我自己能坚持这个系列,也算是给自己的一个梳理吧。

一句话:以基础知识为主!

作为开篇第一章,本文将会描述下面这张图的执行步骤:

现在就开始吧!

古老的 Intel8086 处理器

8086Intel 公司的第一款 16 位处理器,诞生于 1978 年,应该比各位小伙伴的年龄都大一些。

Intel 公司的所有处理器中,它占有很重要的地位,是整个 Intel 32 位架构处理器(IA-32)的开山鼻祖

那么,问题来了,什么叫 16 位的处理器?

有些人会把处理器的位数与地址总线的位数搞混在一起!

我们知道,CPU 在访问内存的时候,是通过地址总线来传送物理地址的。

8086 CPU20 位的地址线,可以传送 20 位地址。

每一根地址线都表示一个 bit,那么 20bit 可以表示的最大值就是 2 的 20 次方

也就是说:最大可以定位到 1M 地址的内存,这称作 CPU寻址能力

但是,8086 处理器却是 16 位的,因为:

  1. 运算器一次最多可以处理 16 位的数据;

  2. 寄存器的最大宽度为 16 位;

  3. 寄存器和运算器之间的通路为 16 位;

也就是说:在 8086 处理器的内部,能够一次性处理、传输、暂时存储的最大长度是 16 位,因此,我们说它是 16 位结构的 CPU

主存储器是什么?

计算机的本质就是对数据的存储和处理,那么参与计算的数据是从哪里来的呢?那就是一个称作 存储器(Storage 或 Memory)的物理器件。

从广义上来说,只要能存储数据的器件都可以称作存储器,比如:硬盘、U盘等。

但是,在计算机内部,有一种专门与 CPU 相连接,用来存储正在执行的程序和数据的存储器,一般称作内存储器或者主存储器,简称:内存或主存

内存按照字节来组织,单次访问的最小单位是 1 个字节,这是最基本的存储单元

每一个存储单元,也就是一个字节,都对应着一个地址,如下图所示:

CPU 就通过地址总线来确定:对内存中的哪一个存储单元中的数据进行访问。

第 1 个字节的地址是 0000H,第 2 个字节的地址是 0001H,后面以此类推。

图中的这个内存,最大存储单元的地址是 FFFFH,换算成十进制就是 65535,因此这个内存的容量是 65536 字节,也就是 64 KB

这里有一个原子操作的问题可以考虑一下。

Linux 内核代码中,很多地方使用了原子操作,比如:互斥锁的实现代码。

为什么原子操作需要对变量的类型限制为 int 型呢?这就涉及到对内存的读写操作了。

尽管内存的最小组成单位是字节,但是,经过精心的设计和安排,不同位数的 CPU,能够按照字节、字、双字进行访问。

换句话说,仅通过单次访问,16 位处理器就能处理 16 位的二进制数,32 位处理器就能处理 32 位的二进制数。

寄存器是什么?

CPU 内部,一些都是代表 0 或 1 的电信号,这些二进制数字的一组电信号出现在处理器内部线路上,它们是一排高低电平的组合,代表着二进制数中的每一位。

在处理器内部,必须用一个称为寄存器的电路把这些数据锁存起来。

因此,寄存器本质上也属于存储器的一种。只不过它们位于处理器的内部CPU 访问寄存器比访问内存的速度更快。

处理器总是很忙的,在它操作的过程中,所有数据在寄存器里面只能是临时存在一小会,然后再被送往别处,这就是为什么它被叫做“寄存器”

8086 中的寄存器都是 16 位的,可以存放 2 个字节,或者说 1 个字。字节在前(bit8 ~ bit15),字节在后(bit0 ~ bit7)。

8086 中有下面这些寄存器:

刚才说了,这些寄存器都是 16 位的。由于需要与以前更古老的处理器兼容,其中的 4 个寄存器:AX、BX、CX、DX 还可以当成 2 个 8 位的寄存器来使用。

比如:AX 代表一个 16 位的寄存器,AH、AL 分别代表一个 8 位的寄存器。

mov AX, 5D  表示把 005D 送入 AX 寄存器(16 位)
mov AL, 5D  表示把 5D 送入 AL 寄存器(8 位)
  • 1
  • 2

三个总线

当我们启动一个应用程序的时候,这个程序的代码和数据都被加载到物理内存中。

CPU 无论是读取指令,还是操作数据,都需要与内存进行信息的交互:

  1. 确定存储单元的地址(地址信息);

  2. 器件的选择,读或写的命令(控制信息);

  3. 读或写的数据(数据信息);

在计算机中,有专门连接 CPU 和其他芯片的数据,称为总线

从逻辑上来分类,包括下面 3 种总线:

地址总线:用来确定存储单元的地址;
控制总线: CPU 对外部期间进行控制;
数据总线: CPU 与内存或其他器件之间传送数据;

8086 有 20 根地址线,称作地址总线的宽度,它可以寻址 2 的 20 次方个内存单元。

同样的道理,8086 数据总线的宽度是 16,也就是一次性可以传送 16 bit 的数据。

控制总线决定了 CPU 可以对外进行多少种控制,决定了 CPU 对外部器件的控制能力

CPU 如何对内存进行寻址?

Linux 2.6 内核代码中,编译器产生的地址叫做虚拟地址(也称作:逻辑地址),这个逻辑地址经过段转换之后,变成线性地址,线性地址再经过分页转换,就得到最终物理内存上的物理地址

还记得文章开头的那张段描述符的表格吗?

其中的代码段和数据段描述符的起始地址都是 0x00000000,也就是说: 在数值上虚拟地址和转换后的线性地址是相等的(稍后就会明白为什么是这样)。

我们再来看看一下 8086 中更简单的地址转换。

刚才说到,内存是一个线性的存储器件,CPU 依赖地址来定位每一个存储单元。

对于 8086 CPU 来说,它有 20 根地址线,可以传送 20 位地址,达到 1MB 的寻址能力。

但是 8086 又是 16 位的结构,在内部一次性处理、传输、暂时存储的地址只有 16 位

从内部结构来看,如果将地址从内部简单的发出到地址总线上,只能送出 16 位的地址,这样的话,寻址能力只有 64KB

那么应该怎么才能充分利用 20 根地址线呢?

8086 CPU 采用: 在内部使用两个 16 位地址合成的方法,来形成一个 20 位的物理地址,如下所示:

第一个 16 位的地址称为段地址,第二个 16 位的地址称为偏移地址

地址加法器采用下面的这个公式,来“合成”得到一个 20 位的物理地址

物理地址 = 段地址 x 16 + 偏移地址

例如:我们编写的程序,在加载到内存中之后,放在一个内存空间中。

CPU 在执行这些指令的时候,把 CS 寄存器当做寄存器,把 IP 寄存器当做偏移寄存器,然后计算 CS x 16 + IP 的值,就得到了指令的物理地址

从以上的描述中可以看出:8086 CPU 似乎是因为寄存器无法直接输出 20 位的物理地址,不得已才使用这样的地址合成方式。

其实更本质的原因是:8086 CPU 就是想通过 基地址 + 偏移量 的方式来对内存进行寻址(这里的基地址,就是段地址左移 4 位)。

也就是说,即使 CPU 有能力直接输出一个 20 位的地址,它仍然可能会采用 基地址 + 偏移量的方式来进行内存寻址。

想一下:我们在 Linux 系统中编译一个库文件的时候,一般都会在编译选项中添加 -fPIC 选项,表示编译出来的动态库是地址无关的,在被加载到内存时需要被重定位。

而基地址+偏移量的寻址模式,就为重定位提供了底层支撑

我们是如何控制 CPU 的?

CPU 其实是一个很纯粹、很呆板的一个东西,它唯一做的事情就是:到 CS:IP 这两个寄存器指定的内存单元中取出一条指令,然后执行这条指令:

当然了,还需要预先定义一套指令集,在内存中的指令区中,存储的都必须是合法的指令,否则 CPU 就不认识了。

每一条指令都是用某些特定的数(指令码)来指示 CPU 进行特定的操作。

CPU 认识这些指令,一看到这些指令码,CPU 就知道这个指令码后面还有几个字节的操作数、需要进行什么样的操作。

例如:指令码 F4H 表示让处理器停机,当 CPU 执行这条指令的时候,就停止工作。

(其实这里说 CPU 已经有点不准确了,因为 CPU 是囊括了很多器件的一个整体,也许这里说 CPU 中的执行单元会更准确些。)

另外有一点可以提前说一下:内存中的一切都是数据,至于把其中的哪一部分数据当做指令来执行,哪一部分数据当做被指令操作的“变量”,这完全是由操作系统的设计者来规划的。

在 8086 处理器的层面来说,只要是 CS:IP “指向”的内存区域,都被当做指令来执行。

从以上描述可以看出:在 CPU 中,程序员能够用指令读写的器件只有寄存器,我们可以通过改变寄存器中的内容,来实现对 CPU 的控制。

更直白的说就是:我们可以通过改变 CS、IP 寄存器中的内容,来控制 CPU 执行目标指令。

作为一名合格的嵌入式开发者,大家估计都配置过一些单片机里的寄存器,以达到一些功能定义、端口复用的目的,其实这些操作,都可以看做是我们对 CPU 的控制。

如果把 CPU 比作木偶,那么 寄存器就是控制木偶的绳索

我们再把 CPU工控领域的 PLC 编程进行类比一下。

我们在拿到一个新的 PLC 设备之后,其中只有一个运行时(runtime),这个运行时执行的本职工作就是:

  1. 扫描所有的输入端口,锁存在输入映象区;

  2. 执行一个运算、控制逻辑,得到一些列输出信号,锁存到输出映象区;

  3. 把输出映象区的信号,刷新到输出端口;

在一个全新的 PLC 中,其中第 2 个步骤中需要的运算、控制逻辑可能就不存在。

因此,单单一个 runtimePLC 是无法完成一件有意义的工作的。

为了让 PLC 完成一个具体的控制目标,我们还需要利用 PLC 厂家提供的上位机编程软件,开发一个运算、控制逻辑程序,编程语言一般都是梯形图居多。

当这个程序被下载到 PLC 中之后,它就可以控制运行时来做一些有意义的工作了。

我们可以简单的认为:梯形图就是用来控制 PLC 的运行时

对于 CPU 来说,想让它执行某个内存单元的指令,只要修改寄存器 CSIP 即可。

换句话说:只要对一个程序的内存布局足够的清楚,可以把 CPU 玩弄于股掌之间,让它执行哪里的代码都可以。

CPU 执行指令流程

现在我们已经明白了地址转换、内存的寻址,距离 CPU 执行一条指令需要的最小单元还剩下:指令缓冲区和控制电路

简单来说:指令缓冲区用来缓存从内存中读取的指令,控制电路用来协调各种器件对总线等资源的使用。

对于下面这张图来说,它一共有 4 条指令:

第一条指令来举例,它一共经过 5 个步骤:

  1. 把 CS:IP 内容送入地址加法器,计算得到 20 位的物理地址 20000H;

  2. 控制电路把 20 位的地址,送入到地址总线;

  3. 内存中 20000H 单元处的指令 B8 23 01,经过数据总线被送到指令缓冲区;

  4. 指令偏移寄存器 IP 的值要加 3,指向下一条等待被执行的偏移地址(因为指令码 B8 代表当前指令的长度是 3 个字节);

  5. 执行指令缓冲区中的指令: 把数值 0123H 送入寄存器 AX 中;

以上就是一条指令的执行最基本步骤,当然,现代处理器的指令执行流程,比这里的要复杂的多得多。


------ End ------

万丈高楼平地起!

这篇文章,仅仅描述了 CPU 执行一条指令所需要的最小知识点。

下一篇文章,我们再继续对内存的分段机制进行更进一步的窥探。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/265634.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python题目推荐_python题目

#1~100的奇数和&#xff0c;偶数和sum 0n 99while n > 0:sum sum nn n - 2print(sum)i1sum0while i<100:if i%20:sumii1else:i1print(sum)#偶数sum0for i in range(1,101):if i%20:sumiprint(sum)#奇数sum10for i in range(1,101):if i%2!0:sum1iprint(sum1)print(s…

两个主机通信过程

主机A与主机B通信,A Ping B,图:A-交换机-B,AB同一子网(1)ping数据包用的是ICMP协议&#xff0c;IP协议的一个子协议&#xff0c;位于三层&#xff0c;包含A的IP&#xff0c;B的IP,三层进行IP封装成包,进入二层(2)A,B处于相同子网,查看缓存中对与目的对应得B第2层mac地址,如果存…

积极拥抱.NET Core开源社区

潘正磊在上海的Tech Summit 2018 大会上给我们的.NET Core以及开源情况带来了最新信息。 .Net Core 开源后取得了更加快速的发展&#xff0c;目前越活跃用户高达400万人&#xff0c;每月新增开发者45万&#xff0c;在 GitHub 上的月度增长达到15%。目前有来自超过3,700家企业的…

内存:你跑慢点行不行?CPU:跑慢点你养我吗?内存:我不管!(内附超全思维导图)

摘自&#xff1a;内存&#xff1a;你跑慢点行不行&#xff1f;CPU&#xff1a;跑慢点你养我吗&#xff1f;内存&#xff1a;我不管&#xff01;&#xff08;内附超全思维导图&#xff09; 作者&#xff1a;程序员cxuan 发布时间&#xff1a;2020-03-09 13:43:11 网址&#xff1…

过期时间_2020年最新航空里程过期时间及避免过期方法总结

【2020.2 更新】近几年来主要有如下变化&#xff1a;UA 里程永不过期了&#xff0c;Southwest 里程永不过期了&#xff0c;Asia Miles 里程可以通过里程变动续命了&#xff0c;Flying Blue 里程变成24个月过期了&#xff0c;AV 里程变成12个月过期了。各大航空的里程过期政策辛…

Spring Boot 5:应用程序启动时初始化资源

需求&#xff1a;应用程序启动后&#xff0c;初始化基础数据、加密证书等操作。 可以使用CommandLineRunner接口来实现&#xff0c;在SpringBoot.run()之后完成资源的初始化工作。 注意&#xff1a;多个Runner需要顺序启动的话&#xff0c;可以使用Order注解 package sun.flowe…

怎么用python读取大文件_使用Python读取大文件的方法

背景准备试一试:f 开放(\u201C\/道路\/ \/文件\u201D,\u201Cr\u201D)打印()最后:如果f:()调用读()将读取所有文件的内容,如果文件有10 g,记忆会破灭,所以,为了安全起见,你可以反复调用read(大小)方法,每次最多读字节大小。此外,调用readline()一次读取一行,叫readline()阅读所有…

#10172. 「一本通 5.4 练习 1」涂抹果酱 题解

题目链接 一道三进制状压的好题。 题目描述: Tyvj 两周年庆典要到了&#xff0c;Sam 想为 Tyvj 做一个大蛋糕。蛋糕俯视图是一个 NM的矩形&#xff0c;它被划分成 NM个边长为 11的小正方形区域&#xff08;可以把蛋糕当成 N 行 M 列的矩阵&#xff09;。蛋糕很快做好了&#x…

全国计算机等级考试题库二级C操作题100套(第89套)

第89套&#xff1a; 给定程序中&#xff0c;函数fun的功能是:求出形参ss所指字符串数组中最长字符串的 长度&#xff0c;其余字符串左边用字符*补齐,使其与最长的字符串等长。字符串数组中共 有M个字符串&#xff0c;且串长<N。 请在程序的下划线处填入正确的内容并把下划线…

Android 调用相册 拍照 实现系统控件缩放 切割图片

android 下如果做处理图片的软件 可以调用系统的控件 实现缩放切割图片 非常好的效果 今天写了一个demo分享给大家。 package cn.m15.test;import java.io.ByteArrayOutputStream; import java.io.File; import android.app.Activity; import android.content.Intent; import a…

全国计算机等级考试题库二级C操作题100套(第88套)

第88套&#xff1a; 函数fun的功能是&#xff1a;把形参a所指数组中的最大值放在a[0]中&#xff0c;接着求出a所指数组中的最小值放在a[1]中&#xff1b;再把a所指数组元素中的次大值放在a[2]中&#xff0c;把a数组元素中的次小值放在a[3]中&#xff1b;其余以此类推。例如:若…

75: libreoj #10028 双向宽搜

$des$ 实现一个bfs $sol$ 写了一个双向bfs #include <bits/stdc.h>using namespace std;#define Rep(i, a, b) for(int i a; i < b; i )#define gc getchar() inline int read() {int x 0; char c gc;while(c < 0 || c > 9) c gc;while(c > 0 &&…

《MS SQL Server 2000管理员手册》系列——8. 管理 Microsoft SQL Server 服务

8. 管理 Microsoft SQL Server 服务SQL Server 服务组件 使用SQL Server服务管理员使用 Windows 2000 服务控制管理员使用 SQL Server Enterprise Manager本章总结当您安装好 Microsoft SQL Server 2000 之后就可以开始执行了。在使用Microsoft SQL Server 2000 存取数据前&…

中的 终端报错怎么看原因_《琅琊榜》中太子被封禁,高湛引皇上看桂花的真正原因是什么?...

《琅琊榜》中&#xff0c;高湛是一个非常经典的角色&#xff0c;他比夏江更懂梁帝的心&#xff0c;或者说&#xff0c;知梁帝者&#xff0c;莫过于高湛。当然&#xff0c;若不是如此&#xff0c;高湛也不能在梁帝身边待了那么些年。梁帝生病&#xff0c;喝下静妃娘娘配制的甜汤…

js获取当前域名、Url、相对路径和参数以及指定参数

用 Javascript 可以单独获取当前域名、Url、相对路径和参数&#xff0c;所谓单独攻取&#xff0c;即域名不包括网页文件的路径和参数、参数不包括域名和网页文件路径&#xff0c;下面分别介绍。 一、js获取当前域名有2种方法 1、方法一 var domain document.domain; 2、方法二…

STM32安装Keil5、芯片支持包、startup启动文件(启动过程、冷热启动)、建立工程、ST-LINK烧写步骤

参考&#xff1a;stm32入门之keil5的安装以及第一个工程的建立 作者&#xff1a;SKY丶丿平才 发布时间&#xff1a; 2020-12-06 17:08:30 网址&#xff1a;https://blog.csdn.net/weixin_48264057/article/details/110734596 目录使用的STM32F103C8T6一、Keil5的下载与安装1.下…

深度学习都是非凸问题_神经网络的损失函数为什么是非凸的?

Ian Goodfellow曾经给在quora回答过&#xff0c;以下是原文&#xff1a;There are various ways to test for convexity.One is to just plot a cross-section of the function and look at it. If it has a non-convex shape, you don’t need to write a proof; you have dis…

针对移动互联网应用的网络建设和优化

为什么80%的码农都做不了架构师&#xff1f;>>> 针对移动互联网应用的网络建设和优化 截至2013年3月,移动互联网的人均上网时长和PC互联网相比差距已经扩大了29%.PC互联网向移动端迁移的趋势进一步凸显.小米是一家专注于iPhone和Android等新一代智能手机软件…

STM32F103实现点灯(寄存器方式)

参考&#xff1a;STM32F103系列最简易版点灯程序 作者&#xff1a;一只青木呀 发布时间&#xff1a;2020-10-21 11:40:38 网址&#xff1a;https://blog.csdn.net/weixin_45309916/article/details/109196950 目录硬件软件点灯流程使能GPIO端口E和B对应的时钟找到GPIO对应的时钟…

rocketmq 消费方式_RocketMQ事务消费和顺序消费详解

一、RocketMq有3中消息类型1.普通消费2. 顺序消费3.事务消费顺序消费场景在网购的时候&#xff0c;我们需要下单&#xff0c;那么下单需要假如有三个顺序&#xff0c;第一、创建订单 &#xff0c;第二&#xff1a;订单付款&#xff0c;第三&#xff1a;订单完成。也就是这个三个…