计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录.doc
1计算机系统结构第2版郑伟明汤志忠编著清华大学出版社习题解答21目录11第一章P331719(透明性概念),112118(AMDAHL定律),119、121、124(CPI/MIPS)12第二章P12423、25、26(浮点数性能),213、215(指令编码)13第三章P20233(存储层次性能),35(并行主存系统),315315加1题(堆栈模拟),319中3468问(地址映象/替换算法实存状况图)314第四章P25045(中断屏蔽字表/中断过程示意图),48(通道流量计算/通道时间图)15第五章P34359(流水线性能/时空图),515(2种调度算法)16第六章P39166(向量流水时间计算),610(AMDAHL定律/MFLOPS)17第七章P44673、729(互连函数计算),76714(互连网性质),74、75、726(多级网寻径算法),727(寻径/选播算法)418第八章P498812(SISD/SIMD算法)19第九章P562918(SISD/多功能部件/SIMD/MIMD算法)注每章可选12个主要知识点,每个知识点可只选1题。有下划线者为推荐的主要知识点。52例,习题21第一章P33例11,P10假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40,则采用加快措施后能使整个系统的性能提高多少解由题意可知FE04,SE10,根据AMDAHL定律SEFTOSN1564060N6例12,P10采用哪种实现技术来求浮点数平方根FPSQR的操作对系统的性能影响较大。假设FPSQR操作占整个测试程序执行时间的20。一种实现方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。另一种实现方法是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50。请比较这两种设计方案。解分别计算出这两种设计方案所能得到的加速比SEFTOSN1FEFPSQR020,SEFPSQR10FEFP050,SEFP23175025128FPFPSQRN7例13,P11如果FP操作的比例为25,FP操作的平均CPI40,其它指令的平均CPI为133,FPSQR操作的比例为2,FPSQR的CPI为20。假设有两种设计方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。试利用CPU性能公式比较这两种设计方案哪一个更好只改变CPI而时钟频率和指令条数保持不变。解NIIIICPCI1原系统的CPIFP40,25IFPCPI2133,125C2CPI原NIIII1CPIFPCPI2IFP40251337582方案1(使FPSQR操作的CPI为2)系统CPICPI原CPIFPSQR原CPIFPSQR新ICFPSQRICFPSQRCPI原(CPIFPSQR原CPIFPSQR新)IFPSQR22(202)164方案2(提高所有FP指令的处理速度,使FPSQR操作的CPI为2)CPICPI原CPIFP原CPIFP新ICFPIFPCPI原(CPIFP原CPIFP新)IFP225(42)15我们也可以根据以下公式计算出方案2系统(同求CPI原)CPI75133252159显然,提高所有FP指令处理速度的方案要比提高FPSQR处理速度的方案要好。方案2的加速比性能没有采用改进措施前的采用改进措施后的性能加速比2方案原系统时间时间CPUTOSN2II方案原系统时钟周期时钟周期2CP方案原系统2/15133例14假设两台机器的指令系统中,执行条件转移指令需2个时钟周期,而其它指令只需1个时钟周期。CPUA采用一条比较指令来设置相应的条件码,由紧随其后的一条转移指令对此条件码进行10测试,以确定是否进行转移。显然实现一次条件转移要执行比较和测试两条指令。条件转移指令占总执行指令条数的20。由于每条转移指令都需要一条比较指令,所以比较指令也将占20。CPUB采用比较功能和判别是否实现转移功能合在一条指令的方法,这样实现一条件转移就只需一条指令就可以完成。由于CPUB在转移指令中包含了比较功能,因此它的时钟周期就比CPUA要慢25。现在要问,采用不同转移指令方案的CPUA和CPUB,那个工作速度会更快些解CPIA02208112TCPUAICA12TA12ICATACPUB转移指令占20÷8025CPIB02520751125由于CPUB中没有比较指令,因此ICB08ICACPUB时钟周期就比CPUA要慢25TB125TATCPUBICBCPIBTB08ICA125125TA11125ICATATCPUATCPUB所以CPUB比CPUA运行得更快些。12例1A1计算PENTIUMII450IPC=2处理机的运算速度。解由于PENTIUMII450处理机的IPC=2或CPI=05FZ=450MHZ,MIPSPENTIUMII450=FZIPC=450MHZ2=900MIPS例1A2我国最早研制的小型计算机DJS130,定点16位,加法每秒50万次,但没有硬件乘法和除法指令,用软件实现乘法和除法,速度低100倍左右。求等效速度。解定点等效速度为6610CPIMIPS时钟频率执行时间指令条数等效指令速度()S/8520/1MIPS即每秒2万次,由于乘法和除法用软件实现,等效速度降低了25倍。13例1A3假设在程序中浮点开平方操作FPSQR的比例为2%,它的CPI为100;其他浮点操作FP的比例为23%,它的CPI=40;其余75%指令的CPI=133,计算该处理机的等效CPI。如果FPSQR操作的CPI也为40,重新计算等效CPI。解NIIIICPCI1等效CPI=100´2%+4´23%+133´75%=392等效CPI2=4´25%+133´75%=20011解释下列术语层次结构,计算机系统结构,计算机组成,计算机实现,透明性,由上而下设计,由下而上设计,由中间向两边设计,软件兼容,向上兼容,固件,系列机,兼容机,模拟,仿真,虚拟机,宿主机,指令流,数据流,单指令流单数据流,多指令流多数据流,AMDAHL定律,CPI,MIPS,MFLOPS。1412每一级为了执行一条指令需要下一级的N条指令解释,若执行第一级的一条指令需KNS,那么执行第2级、第3级、第4级的指令需要多少时间第1级1条1级指令KNS第2级1条2级指令N条1级指令1NKNSNKNS第3级1条3级指令N条2级指令1NNKNSN2KNS第4级1条4级指令N条3级指令1NNNKNSN3KNS14每一级指令能完成下一级的M条指令的工作量,且每一级指令需要下一级的N条指令解释,若执行第一级的一条指令需KNS,那么执行第2级、第3级、第4级的等效程序需要多少时间第1级1条1级指令KNS第2级等效程序为1/M条2级指令需N/M条1级指令解释N/MKNS第3级等效程序为1/M/M条3级指令需NN/M/M条1级指令解释N2/M2NS第4级等效程序为1/M/M/M条4级指令需NNN/M/M/M条1级指令解释N3/M3NS16试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与相互影响。15系统结构、组成和实现是三个不同的概念,它们各自包含不同