计算机组成原理之计算机的性能指标

目录

计算机的性能指标

复习提示

1.计算机的主要性能指标

1.1机器字长

1.1.1与机器字长位数相同的部件

1.2数据通路带宽

1.3主存容量

1.4运算速度

1.4.1提高系统性能的综合措施

1.4.2时钟脉冲信号和时钟周期的相关概念

1.4.3主频和时钟周期的转换计算

1.4.4IPS的相关计算

1.4.5CPU执行时间的相关计算

1.4.6MIPS 相关的计算

1.4.7浮点数运算指标的概念

1.5基准程序

2.几个专业术语

知识回顾

3.本章小结

4.常见问题和易混淆知识点


计算机的性能指标

复习提示

本章是组成原理的概述,考查时易针对有关概念或性能指标出选择题,也可能综合后续章节的内容出有关性能分析的综合题。

掌握本章的基本概念,是学好后续章节的基础。

部分知识点在初学时理解不深刻也无须担忧,相信随着后续章节的学习,一定会有更为深入的理解。

学习本章时,请读者思考以下问题:

  • 1) 计算机由哪几部分组成? 以哪部分为中心?
  • 2) 主频高的 CPU 一定比主频低的 CPU 快吗? 为什么?
  • 3) 翻译程序、汇编程序、编译程序、解释程序有什么差别? 各自的特性是什么?
  • 4) 不同级别的语言编写的程序有什么区别? 哪种语言编写的程序能被硬件直接执行? 

请读者在学习本章的过程中寻找答案,本章末尾会给出参考案。

1.计算机的主要性能指标

1.1机器字长

1.1.1与机器字长位数相同的部件

命题追踪——与机器字长位数相同的部件(2020、2021)】

通常所说的“某 16 位或 32 位机器”,其中的 16、32 指的是机器字长,简称字长

字长是指计算机进行一次整数运算(即定点整数运算)所能处理的二进制数据的位数,通常与 CPU 的寄存器位数、ALU 有关。

因此,字长一般等于通用寄存器的位数或 ALU 的宽度,字长越长,数的表示范围越大,计算精度越高。

计算机字长通常选定为字节(8位)的整数倍。

注 意:机器字长、指令字长和存储字长的关系(见章末的常见问题3)

1.2数据通路带宽

数据通路带宽是指数据总线一次所能并行传送信息的位数

这里所说的数据通路宽度是指外部数据总线的宽度,它与 CPU 内部的数据总线宽度(内部寄存器的大小)有可能不同。

注 意:各个子系统通过数据总线连接形成的数据传送路径称为数据通路

1.3主存容量

主存容量是指主存储器所能存储信息的最大容量,通常以字节来衡量,也可用字数x字长(如512Kx16 位)来表示存储容量。

其中,MAR 的位数反映了存储单元的个数MDR 的位数反映了存储单元的字长

例如,MAR 为16 位,表示 2¹⁶=65536,即此存储体内有 65536 个存储单元(可称为 64K 内存,1K=1024),

若 MDR 为32 位,则表示存储容量为64Kx32 位。

1.4运算速度

1.4.1提高系统性能的综合措施

命题追踪——提高系统性能的综合措施(2010)】

(1) 吞吐量和响应时间

吞吐量。指系统在单位时间内处理请求的数量。

它取决于信息能多快地输入内存,CPU 能多快地取指令,数据能多快地从内存取出或存入,以及所得结果能多快地从内存送给一台外部设备。

几乎每步都关系到主存储器,因此系统吞吐量主要取决于主存储器的存取周期。

响应时间。指从用户向计算机发送一个请求,到系统对该请求做出响应并获得所需结果的等待时间。

通常包括 CPU 时间(运行一个程序所花费的时间)与等待时间(用于磁盘访问、存储器访问、I/O 操作、操作系统开销等的时间)。

(2) 主频和 CPU 时钟周期

1.4.2时钟脉冲信号和时钟周期的相关概念

命题追踪——时钟脉冲信号和时钟周期的相关概念(2019)】

CPU 时钟周期。机器内部主时钟脉冲信号的宽度,它是 CPU 工作的最小时间单位

时钟脉冲信号由机器脉冲源发出的脉冲信号经整形和分频 后形成。

时钟周期以相邻状态单元间组合逻辑电路的最大延迟为基准确定。

时钟周期也以指令流水线的每个流水段的最大延迟时间确定。

1.4.3主频和时钟周期的转换计算

命题追踪——主频和时钟周期的转换计算(2013)】

主频(CPU 时钟频率)。机器内部主时钟的频率,即时钟周期的倒数,它是衡量机器速度的重要参数。

对于同一个型号的计算机,其主频越高,完成指令的一个执行步骤所用的时间越短,执行指令的速度越快。

主频最直观的理解就是每秒有多少个时钟周期

注意:CPU 时钟周期 =1/主频,主频通常以 Hz(赫兹)为单位,10Hz表示每秒 10 次。

(3) CPI(Cycle Per Instruction)。

即执行一条指令所需的时钟周期数。

1.4.4IPS的相关计算

命题追踪——IPS的相关计算(2023)】 

不同指令的时钟周期数可能不同,因此对于一个程序或一台机器来说,

其 CPI 指该程序或该机器指令集中的所有指令执行所需的平均时钟周期数,此时CPI是一个平均值。

  • IPS(Instructions Per Second),即每秒执行多少条指令,IPS= 主频/平均 CPI。

(4) CPU 执行时间

指运行一个程序所花费的时间。

1.4.5CPU执行时间的相关计算

命题追踪——CPU执行时间的相关计算(2012、2013、2014、2017、2022、2023)】

CPU 执行时间 =CPU 时钟周期数/主频=(指令条数×CPI)÷主频

上式表明,CPU 的性能(CPU执行时间)取决于三个要素:主频、CPI 和指令条数

主频、CPI 和指令条数是相互制约的。

例如,更改指令集可以减少程序所含的指令条数,但同时可能引起 CPU 结构的调整,从而可能会增加时钟周期的宽度(降低主频)。

【例 1.1】

假定计算机 M1和 M2具有相同的指令集体系结构,M1的主频为 2GHz,程序P在M1 上的运行时间为 10s。

M2 采用新技术可使主频大幅提升,但平均 CPI 也增加到 M1 的 15 倍。
则 M2 的主频至少提升到多少才能使程序P在 M2 上的运行时间缩短为 6s?


  • 程序P在M1上的时钟周期数 = 指令条数×CPI = CPU执行时间×主频=10s×2GHz=2x10¹⁰ 。
  • M2 的平均 CPI为 M1 的 1.5 倍,因此程序 P 在 M2 上的时钟周期数 =1.5×2×10¹⁰=3x10¹⁰ 。
  • 要使程序 P在 M2 上的运行时间缩短到 6s,则 M2 的主频至少应为
  •                 程序P所含时钟周期数 ÷ CPU 执行时间 =3x10¹⁰ ÷ 6s = 5GHz

由此可见,M2 的主频是 M1的 2.5 倍,但 M2 的速度却只是 M1 的 1.67 倍。

(5)MIPS(Million Instructions Per Second)。

即每秒执行多少百万条指令。

1.4.6MIPS 相关的计算

命题追踪——MIPS 相关的计算(2012、2013)】

MIPS = 指令条数 ÷ (执行时间×10⁶)= 主频 ÷ (CPIx10⁶)。

MIPS 对不同机器进行性能比较是有缺陷的,因为不同机器的指令集不同,指令的功能也就不同。

比如在机器 M1 上某条指令的功能也许在机器 M2 上要用多条指令来完成;

不同机器的 CPI和时钟周期也不同,因而同一条指令在不同机器上所用的时间也不同。

(6) FLOPS(Floating-point Operations Per Second)

即每秒执行多少次浮点运算

1.4.7浮点数运算指标的概念

命题追踪——浮点数运算指标的概念(2011、2021)】

  • MFLOPS (Million FLOPS),即每秒执行多少百万(10⁶)次浮点运算。
  • GFLOPS (Giga FLOPS),即每秒执行多少十亿(10⁹)次浮点运算。
  • TFLOPS (Tera FLOPS),即每秒执行多少万亿(10¹²)次浮点运算。
  • PFLOPS (Peta FLOPS),即每秒执行多少千万亿(10¹⁵)次浮点运算。
  • EFLOPS (Exa FLOPS),即每秒执行多少百京(10¹⁸)次浮点运算(1京 =1亿亿 =10¹⁶)。
  • ZFLOPS (Zetta FLOPS),即每秒执行多少十万京(10²¹)次浮点运算。

注意

  • 在描述存储容量、文件大小等时,K、M、G、T通常用2的幂次表示,如 1Kb=2¹⁰b;
  • 在描述速率、频率等时,k、M、G、T通常用 10 的幂次表示,如 1kb/s=10³b/s。
  • 通常前者用大写的K,后者用小写的k,但其他前缀均为大写,表示的含义取决于所用的场景

1.5基准程序

基准程序 (Benchmarks) 是专门用来进行性能评价的一组程序,能够很好地反映机器在运行实际负载时的性能,

可以通过在不同机器上运行相同的基准程序来比较在不同机器上的运行时间,从而评测其性能。

对于不同的应用场合,应该选择不同的基准程序。

使用基准程序进行计算机性能评测也存在一些缺陷,因为基准程序的性能可能与某一小段的短代码密切相关,而硬件系统设计人员或编译器开发者可能会针对这些代码片段进行特殊的优化,使得执行这段代码的速度非常快,以至于得不到准确的性能评测结果。

2.几个专业术语

1) 系列机。具有基本相同的体系结构,使用相同基本指令系统的多个不同型号的计算机组成的一个产品系列。

2) 兼容。指软件或硬件的通用性,即运行在某个型号的计算机系统中的硬/软件也能应用于另一个型号的计算机系统时,称这两台计算机在硬件或软件上存在兼容性。

3) 固件。将程序固化在ROM 中组成的部件称为固件

固件是一种具有软件特性的硬件,吸收了软件/硬件各自的优点,其执行速度快于软件,灵活性优于硬件,是软/硬件结合的产物。

例如,目前操作系统已实现了部分固化(把软件永恒地存储于ROM 中)。

知识回顾

3.本章小结

本章开头提出的问题的参考答案如下。

1) 计算机由哪几部分组成?以哪部分为中心?

  • 计算机由运算器、控制器、存储器、输入设备及输出设备五大部分构成,现代计算机通常把运算器和控制器集成在一个芯片上,合称中央处理器。
  • 在微处理器面世之前,运算器和控制器分离,而且存储器的容量很小,因此设计成以运算器为中心的结构,其他部件都通过运算器完成信息的传递。
  • 随着微电子技术的发展,同时计算机需要处理、加工的信息量也与日俱增,大量 I/O 设备的速度和 CPU 的速度差距悬殊,因此以运算器为中心的结构不能满足计算机发展的要求。
  • 现代计算机已发展为以存储器为中心,使 I/O 操作尽可能地绕过 CPU,直接在 I/O 设备和存储器之间完成,以提高系统的整体运行效率。

2) 主频高的 CPU 一定比主频低的 CPU 快吗?为什么?

  • 衡量 CPU 运算速度的指标有很多,不能以单独的某个指标来判断 CPU的好坏。
  • CPU 的主频表示 CPU 内数字脉冲信号振荡的速度,主频和实际的运算速度存在一定的关系,但目前还没有一个确定的公式能够定量两者的数值关系,因为 CPU 的运算速度还要看 CPU 的流水线的各方面的性能指标(架构、缓存、指令集、CPU 的位数、Cache 大小等)。
  • 由于主频并不直接代表运算速度,因此在一定情况下很可能会出现主频较高的 CPU 实际运算速度较低的现象。

3) 翻译程序、汇编程序、编译程序、解释程序有什么差别?各自的特性是什么?

见常见问题和易混淆知识点 1。

4) 不同级别的语言编写的程序有什么区别?哪种语言编写的程序能被硬件直接执行?

  • 机器语言和汇编语言与机器指令对应,而高级语言不与指令直接对应,具有较好的可移植性。
  • 其中机器语言编写的程序可以被硬件直接执行。

4.常见问题和易混淆知识点

1.翻译程序、解释程序、汇编程序、编译程序的区别和联系是什么?

翻译程序有两种:

一种是编译程序,它将高级语言源程序一次全部翻译成目标程序,只要源程序不变,就无须重新翻译。

另一种是解释程序,它将源程序的一条语句翻译成对应的机器目标代码,并立即执行,然后翻译下一条源程序语句并执行,直至所有源程序语句全部被翻译并执行完。

所以解释程序的执行过程是翻译一句执行一句,并且不会生成目标程序。

汇编程序也是一种语言翻译程序,它把汇编语言源程序翻译为机器语言程序。

编译程序与汇编程序的区别:若源语言是诸如C、C++、Java 等“高级语言”,而目标语言是诸如汇编语言或机器语言之类的“低级语言",则这样的一个翻译程序称为编译程序。

若源语言是汇编语言,而目标语言是机器语言,则这样的一个翻译程序称为汇编程序。
 

2.什么是透明性?透明是指什么都能看见吗?

在计算机领域中,站在某类用户的角度,若感觉不到某个事物或属性的存在,即“看”不到某个事物或属性,则称为“对该用户而言,某个事物或属性是透明的”。

这与日常生活中的“透明”概念(公开、看得见)正好相反。

例如,对于高级语言程序员来说,浮点数格式、乘法指令等这些指令的格式、数据如何在运算器中运算等都是透明的;

而对于机器语言或汇编语言程序员来说,指令的格式、机器结构、数据格式等则不是透明的。

在 CPU 中,IR、MAR 和 MDR 对各类程序员都是透明的。

3.字、字长、机器字长、指令字长、存储字长的区别和联系是什么?

字长是指 CPU 内部用于整数运算的数据通路的宽度,因此字长等于 CPU 内部用于整数运算的运算器位数和通用寄存器宽度,它反映了计算机处理信息的能力。

字和字长的概念不同。字用来表示被处理信息的单位,用来度量数据类型的宽度,如x86 机器中将一个字定义为 16 位。

指令字长:一个指令字中包含的二进制代码的位数。

存储字长:一个存储单元存储的二进制代码的位数。

它们都必须是字节的整数倍。

指令字长一般取存储字长的整数倍,若指令字长等于存储字长的2倍,则需要2个访存周期来取出一条指令;

若指令字长等于存储字长,则取指令周期等于机器周期。

早期的存储字长一般与指令字长、字长相等,因此访问一次主存储器便可取出一条指令或一个数据。

随着计算机的发展,指令字长、字长都可变,但必须都是字节的整数倍

4.计算机体系结构和计算机组成的区别和联系是什么?

计算机体系结构是指机器语言或汇编语言程序员所看得到的传统机器的属性,包括指令集、数据类型、存储器寻址技术等,大都属于抽象的属性。

计算机组成是指如何实现计算机体系结构所体现的属性,它包含许多对程序员来说透明的硬件细节。

例如,指令系统属于结构的问题,但指令的实现即如何取指令、分析指令、取操作数、如何运算等都属于组成的问题。

因此,当两台机器的指令系统相同时,只能认为它们具有相同的结构,至于这两台机器如何实现其指令,则完全可以不同,即可以认为它们的组成方式是不同的。

例如,一台机器是否具备乘法指令是一个结构的问题,但实现乘法指令采用什么方式则是一个组成的问题。

许多计算机厂商提供一系列体系结构相同的计算机,而它们的组成却有相当大的差别,即使是同一系列的不同型号机器,其性能和价格差异也很大。
 

5.基准程序执行得越快说明机器的性能越好吗?

一般情况下,基准测试程序能够反映机器性能的好坏。但是,由于基准程序中的语句存在频度的差异,因此运行结果并不能完全说明问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/26153.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文写作革新:AI如何简化你的研究流程?

不知道大家有没有发现,随着人工智能技术的快速发展,AI工具正逐渐渗透到我们日常生活的各个方面,极大地提高了我们的工作和学习效率。无论是AI写作、AI绘画、AI思维导图,还是AI幻灯片制作,这些工具已成为我们不可或缺的…

学会python——文本分词(python实例一)

目录 1、认识Python 2、环境与工具 2.1 python环境 2.2 pycharm编译 3、对文本进行分词 3.1 代码构思 3.2 代码示例 3.3 运行结果 4、总结 1、认识Python Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。 Python 的设计具有很强的可读性&a…

C++面向对象程序设计 - 异常处理

在C发展后期,加了一些功能,作为工具来使用,其中主要有模板(包括函数模板和类模板)、异常处理、命名空间和运行时类型识别,以帮助程序设计人员更方便地进行程序设计和调试工作。 程序中常见的错误有两大类&a…

【天池科普】1. 为啥人人都要学AI

大家好!欢迎来到天池的AI科普系列课程,本期是第一期内容。在这个信息爆炸的时代,人工智能(AI)不仅是技术进步的标志,更是推动社会向前发展的强大引擎。无论你是AI领域的新手,还是有一定基础的学…

ER实体关系图与数据库模型图绘制

属性分析 1、用户表(user)、用户钱包表(user_wallet)(与user是1对1关系)、用户钱包交易日志表(user_wallet_log)(与user是1对多关系)。 user:用户表通常包含用户的基本信息,例如用户ID(主键)、用户名、密码(通常加密…

【Three.js】知识梳理二:Three.js引用和环境搭建

1.文件包下载和目录简介 1.1 文件包下载 a. 官方网站下载: 访问 Three.js 的官方网站(threejs.org/)并点击 "Download" 按钮,下载最新版本的文件包。 b. GitHub仓库下载: 访问 Three.js 的 GitHub 仓库&a…

家具板材ENF级甲醛释放量检测 板材甲醛含量测定

ENF级甲醛释放量检测 ENF级是指甲醛释放量非常低的板材,它代表了无醛添加的最高级别。根据最新的国家标准GB/T 39600-2021,ENF级板材的甲醛释放量不得超过0.025 mg/m。这个标准比欧洲的E1级(甲醛释放量≤0.124 mg/m)和美国的P2标准…

【Redis】解决 Redis 运行在 Protected Mode 下的 DENIED 错误:消除 Redis 受保护模式的完美方案

【Redis】解决 Redis 运行在 Protected Mode 下的 DENIED 错误:消除 Redis 受保护模式的完美方案 大家好 我是寸铁👊 总结了一篇【Redis】解决 Redis 运行在 Protected Mode 下的 DENIED 错误:消除 Redis 受保护模式的完美方案✨ 喜欢的小伙伴…

LangChain Agent(代理)技术分析与实践

LangChain代理是利用大语言模型和推理引擎执行一系列操作以完成任务的工具,适用于从简单响应到复杂交互的各种场景。它能整合多种服务,如Google搜索、Wikipedia和LLM。代理通过选择合适的工具按顺序执行任务,不同于链的固定路径。代理的优势在…

【YOLOv5进阶】——修改网络结构(以C2f模块为例)

一、站在巨人的肩膀上 这里我们借鉴YOLOv8源码: 上期说到,对于网络模块定义详情在common.py这个文件,如Conv、CrossConv、C3f等。本期要修改的需要参考YOLOv8里的C2f模块,它定义在YOLOv8的module文件夹的block.py文件里&#xf…

测试开发面经分享,面试七天速成

1. get、post、put、delete的区别 a. get请求: i. 用于从服务器获取资源。请求参数附加在URL的查询字符串中。 ii. 对服务器的请求是幂等的,即多次相同的GET请求应该返回相同的结果。 iii. 可以被缓存,可以被收藏为书签。 iv. 对于敏感数据不…

高考后的家庭移民新选择

随着高考的落幕,您是否在思考未来的更多可能性?移民,作为一种生活选择,为许多家庭提供了一个全新的生活和教育环境。我们理解,每个家庭都希望为自己的孩子提供最好的未来。 移民国家通常拥有多元和包容的教育体系&…

四川蔚澜时代电子商务有限公司抖音电商服务怎么样?

随着数字经济的蓬勃发展,电商行业已成为推动经济增长的重要引擎。在这个充满变革与机遇的时代,四川蔚澜时代电子商务有限公司凭借对抖音电商的深入理解和专业服务,迅速崛起为行业的佼佼者,引领着潮流营销的新风尚。 四川蔚澜时代…

ARM32开发--串口库封装(初级)

知不足而奋进望远山而前行 目录 文章目录 前言 目标 内容 开发流程 文件目录创建 分组创建 接口定义 完整代码 总结 前言 在嵌入式软件开发中,封装抽取流程和抽取封装策略是非常重要的技术,能够提高代码的复用性和可维护性。本文将介绍如何在文…

这可能是最清晰易懂的 G1 GC 资料

滑动验证页面 概述 G1 (Garbage-First) 于JDK 6u14版本发布,JDK 7u4版本发行时被正式推出,在JDK9时已经成了默认的垃圾回收器,算是CMS回收器的替代 方案(CMS在JDK9以后已经废弃) G1是一款分代的 (generational)&a…

如何使用C++ STL标准模板库中的算法函数(附源码)

目录 1、概述 2、调用sort函数对列表元素进行排序 3、调用count_if查找满足条件的元素个数 4、调用find_if函数找到目标元素的信息 5、调用remove_copy_if函数搜索满足条件的多个元素 6、总结 VC++常用功能开发汇总(专栏文章列表,欢迎订阅,持续更新...)https://blog.…

LeetCode刷题之HOT100之子集

2024/6/11 周二,闷热,很热。两天没有做题了,前天去附近一景点《十八重溪》游玩,去了才知道暂停开放,只能在附近转转了,瀑布是看不到了。昨天在宿舍呆了一天,今天早上起来就来了实验室。补三张图…

端午节,来看看这本应景的“龙舟书”吧!

大家端午安康呀图片~~ 端午节,不仅要吃粽子,还要看龙舟!图片 所以,今天就和大家分享一本“龙舟书”——《精进ChatGPT:高效应用实战88例》! 不仅和今天的端午节应景,还和当今的AI时代很配图片…

AI Agent 热门的10篇论文

人工智能代理领域广阔,涵盖广泛的主题,包括多代理系统、强化学习、上下文感知系统以及将大型语言模型 (LLMs) 集成到基于代理的系统中。以下是 arXiv 的一些顶级论文,涵盖了人工智能代理的各个方面: A Framework For Intelligent Multi Agent System Based Neural Network …