系统结构课后习题答案
(完整版)计算机系统结构(课后习题答案)
![(完整版)计算机系统结构(课后习题答案)](https://img.taocdn.com/s3/m/75335c657c1cfad6185fa76a.png)
第一章计算机系统结构的基本概念1.有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。
现若需第i级的N 条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks。
第3级上等效程序需运行:(N/M)*(N/M)*Ks。
第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。
note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。
而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。
所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。
答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。
但是实现的性能价格比,实现的难易程序不同。
在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件。
3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。
答:计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。
(1)计算机的系统结构相同,但可采用不同的组成。
如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。
从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。
其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。
计算机组成与系统结构课后答案免费版全(清华大学出版社 袁春风主编)
![计算机组成与系统结构课后答案免费版全(清华大学出版社 袁春风主编)](https://img.taocdn.com/s3/m/7fdaa66759fafab069dc5022aaea998fcc22409c.png)
计算机组成与系统结构课后答案免费版全(清华大学出版社袁春风主编)计算机组成与系统结构课后答案免费版全(清华大学出版社-袁春风主编)第一章练习答案5.若有两个基准测试程序p1和p2在机器m1和m2上运行,假定m1和m2的价格分别是5000元和8000元,下表给出了p1和p2在m1和m2上所花的时间和指令条数。
程序p1p2m1指令条数200×106300×103执行时间(ms)100003指令条数150×106420×103m2执行时间(ms)50006请回答下列问题:(1)对于p1,哪台机器的速度快?快多少?对于p2呢?(2)在m1上执行p1和p2的速度分别是多少mips?在m2上的执行速度又各是多少?从执行速度让我们看看,对于P2,哪台机器速度快?多快?(3)假设M1和M2的时钟频率分别为800 MHz和1.2 GHz,则P1在M1和M2上执行时的平均时钟周期期数cpi各是多少?(4)如果某个用户需要大量使用程序p1,并且该用户主要关心系统的响应时间而不是吞吐率,那么,当用户需要购买大量机器时,他应该选择M1还是M2?为什么?(注意:在性价比方面)(5)如果另一个用户也需要购买大量机器,但用户同样使用P1和P2,那么主要的问题是响应时间间,那么,应该选择m1还是m2?为什么?参考答案:(1)对于p1,m2比m1快一倍;对于p2,m1比m2快一倍。
(2)对于M1,P1的速度为200m/10=20mips;P2为300K/0.003=100mips。
对于m2,p1的速度为:150m/5=30mips;p2为420k/0.006=70mips。
就执行速度而言,对于P2,因为100/70=1.43倍,M1比m2快0.43倍。
(3)在M1上执行P1时的平均时钟周期数CPI为:10×800m/(200×106)=40在m2上执行p1时的平均时钟周期数cpi为:5×1.2g/(150×106)=40。
完整版计算机体系结构课后习题原版答案张晨曦著
![完整版计算机体系结构课后习题原版答案张晨曦著](https://img.taocdn.com/s3/m/f5173341195f312b3169a5a6.png)
第1章计算机系统结构得基本概念 (1)第2章指令集结构得分类 (4)第3章流水线技术 (6)第4章指令级并行 (16)第5章存储层次 (25)第6章输入输出系统 (31)第7章互连网络 (41)第8章多处理机 (45)第9章机群 (45)第1章计算机系统结构得基本概念1、1 解释下列术语层次机构:按照计算机语言从低级到高级得次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同得语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现得机器。
翻译:先用转换程序把高一级机器上得程序转换为低一级机器上等效得程序,然后再在这低一级机器上运行,实现程序得功能。
解释:对于高一级机器上得程序中得每一条语句或指令,都就是转去执行低一级机器上得一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所瞧到得计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在得事物或属性,但从某种角度瞧又好像不存在得概念称为透明性。
计算机组成:计算机系统结构得逻辑实现,包含物理机器级中得数据流与控制流得组成以及逻辑设计等。
计算机实现:计算机组成得物理实现,包括处理机、主存等部件得物理结构,器件得集成度与速度,模块、插件、底板得划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高得倍数。
Amdahl定律:当对一个系统中得某个部件进行改进后,所能获得得整个系统性能得提高,受限于该部件得执行时间占总执行时间得百分比。
程序得局部性原理:程序执行时所访问得存储器地址不就是随机分布得,而就是相对地簇聚。
包括时间局部性与空间局部性。
CPI:每条指令执行得平均时钟周期数。
测试程序套件:由各种不同得真实应用程序构成得一组测试程序,用来测试计算机在各个方面得处理性能。
(完整版)计算机系统结构课后习题答案
![(完整版)计算机系统结构课后习题答案](https://img.taocdn.com/s3/m/39f3a1a510661ed9ac51f374.png)
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机系统结构(第三版)张晨曦 课后答案
![计算机系统结构(第三版)张晨曦 课后答案](https://img.taocdn.com/s3/m/a5d910f7ba0d4a7302763a33.png)
fi Si
−1
式中,fi 为可加速部件 i 在未优化系统中所占的比例;Si 是部件 i 的加速比。
⎧ f ⎫ f f S = ⎨[1 − ( f1 + f 2 + f 3 )] + 1 + 2 + 3 ⎬ S S S 1 2 3⎭ ⎩
0.3 0.3 f 3 ⎫ ⎧ 10 = ⎨[1 − (0.3 + 0.3 + f 3 )] + + + ⎬ 30 20 30 ⎭ ⎩
课
45000 × 1 + 75000 × 2 + 8000 × 4 + 1500 × 2 = 1.776 129500
答
案 网
计算机体系结构 • 第一章 • 第4页
⎡ f ⎤ Te = To ⎢(1 − f e ) + e ⎥ S e⎦ ⎣
S=
1 (1 − f e ) +
fe Se
S=
i
1 (1 − ∑ f i ) + ∑
对于第三级而言,为了完成 IC 条指令的功能,第三级指令的条数为: 执行第三级
IC 。为了 M2
IC IC 条指令,需要执行 N 条第二级的指令对其进行解释。那么对第二级 2 M M2 IC IC + 2N 2 M M
而言,总的指令条数为:
N⎤ ⎡ = ⎢1 + ⎥ K ⎣ M⎦ N⎤ ⎡ T4 = ⎢1 + ⎥ K ⎣ M⎦
1.5 计算机系统有三个部件可以改进,这三个部件的加速比如下: 部件加速比 1=30; 部件加速比 2=20; 部件加速比 3=10; (1) 如果部件 1 和部件 2 的可改进比例为 30%,那么当部件 3 的可改进比例为多少时, 系统的加速比才可以达到 10? (2) 如果三个部件的可改进比例为 30%、30%和 20%,三个部件同时改进,那么系统 中不可加速部分的执行时间在总执行时间中占的比例是多少? 解:在多个部件可改进情况下 Amdahl 定理的扩展:
计算机体系结构课后答案
![计算机体系结构课后答案](https://img.taocdn.com/s3/m/6f485c7777232f60ddcca14d.png)
计算机体系结构课后答案【篇一:计算机体系结构习题(含答案)】1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。
对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。
(1)最大尾数(8)最小正数(2)最小正尾数(9)最大负数(3)最小尾数(10)最小负数(4)最大负尾数(11)浮点零(5)最大阶码(12)表数精度(6)最小阶码(13)表数效率(7)最大正数(14)能表示的规格化浮点数个数2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。
尾数用原码、纯小数表示,阶码用移码、整数表示。
(1) 设计这种浮点数的格式(2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。
3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。
(1) 选择合适的舍入方法。
(2) 确定警戒位位数。
(3) 计算在正数区的误差范围。
4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。
b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。
如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。
对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。
(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。
6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为6位。
计算机系统结构(中科院 胡伟武 2016)课后习题答案 第二章
![计算机系统结构(中科院 胡伟武 2016)课后习题答案 第二章](https://img.taocdn.com/s3/m/6d3d4ef4102de2bd96058825.png)
1.解:A为10MIPS,B为20MIPS,C为40MIPS。
三台机器实际性能相同。
2.解:加速比y与向量化比例x之间的关系是:y=1/((1-x)+x/8)=1/(1-7x/8)……(A) (1)(2) 在式(A)中令y=2,可解得x=4/7≈57.14%。
此时向量模式运行时间占总时间比例是((4/7)/8)/(3/7+((4/7)/8))=1/7=14.29% (3) 硬件方法,整体加速比为1/(1-0.7*(1-1/16))=2.91软件方法,设相同加速比下向量化比例为x,即1/(1-7x/8)=2.91, x=0.75所以推荐软件方法。
3.解:(1) MIPS EMUL=(I+F×Y)/(W×106);MIPS FPU=(I+F)/(B×106)(2) 120=(I+8×106×50)/(4×106) => I=80×106(3) 80=(80×106+8×106)/(B×106) => B=1.1(4) MFLOPS=F/((B-((W*I)/(I+F*Y))) ×106)≈18.46(5) 决策正确,因为执行时间缩短了,这才是关键标准。
4.解:(1) y=12.29386-0.18295x+0.0015x2(2) y=342.47443-6.36386x+0.02727x25.解:1.1V下静态功耗1.1*1.1/(1.05/0.5)=0.576W1.1V下1GHZ时动态功耗为1.1*2.5-0.576=2.174W1.1V下0.5GHZ功耗功耗为2.174*0.5/1=1.087W1.1V下0.5GHZ总功耗为1.087+0.576=1.663W6. 解:a) 先证明N=2k 时,正数1212()/N N N a a a N a a a +++≥。
对k 进行数学归纳法即可。
计算机系统结构——课后答案
![计算机系统结构——课后答案](https://img.taocdn.com/s3/m/4f42a38984868762caaed538.png)
习题一1、解释下列术语计算机系统的外特性:通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性,即由他们所看到的计算机的基本属性(概念性结构和功能特性)。
计算机系统的内特性:计算机系统的设计人员所看到的基本属性,本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。
模拟:模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。
可移植性:在新型号机出台后,原来开发的软件仍能继续在升级换代的新型号机器上使用,这就要求软件具有可兼容性,即可移植性。
可兼容性是指一个软件可不经修改或只需少量修改,便可由一台机器移植到另一台机器上运行,即同一软件可应用于不同环境。
Amdahl 定律:系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频度或占总执行时间的比例。
虚拟机(Virtual Machine ):指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。
6、7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%,为了增强该操作的性能,可采用两种不同的方法:一种是增加专门的硬件,可使求浮点数平方根操作的速度提高为原来的20倍;另一种方法是提高所有浮点运算指令的速度,使其为原来的2倍,而浮点运算指令的执行时间在总执行时间中占30%。
试比较这两种方法哪一种更好些。
答:增加硬件的方法的加速比23.120/2.0)2.01(11=+-=p S ,另一种方法的加速比176.12/3.0)3.01(12=+-=p S ,经计算可知Sp1>Sp2第一种方法更好些。
9、假设高速缓存Cache 的工作速度为主存的5倍,且Cache 被访问命中的概率为90%,则采用Cache 能使整个存储系统获得多高的加速比? 答:加速比%10)(%90'⨯++⨯==tc tm tc tmT T S ,其中tm=5tc ,代入公式,得到加速比S=3.33。
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录
![计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录](https://img.taocdn.com/s3/m/52be344d360cba1aa911da6d.png)
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。
高阶交错存储器具有扩展方便、存取效率低的优点。
低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。
(2)各种存储器的带宽与其工作频率有关。
不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。
(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。
3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。
计算机系统结构李学干课后标准答案
![计算机系统结构李学干课后标准答案](https://img.taocdn.com/s3/m/e82d887d0722192e4536f690.png)
计算机系统结构李学干课后答案【篇一:计算机系统结构李学干版+习题答案】级。
每一级为了执行一条指令需要下一级的n条指令解释。
若执行第1级的一条指令需k ns时间,那么执行第2、3、4级的一条指令各需要多少时间?答:执行第2、3、4级的一条指令各需kn ns、(n*n)*k ns、(n*n*n)*k ns的时间。
1-2操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接解释实现,而不必有操作系统自己来实现。
更具你对1- 1题的回答,你认为这样做有哪些好处?答:这样做,可以加快操作系统中操作命令解释的速度,同时也节省了存放解释操作命令这部分解释程序所占的存储空间,简化了操作系统机器级的设计,也有利于减少传统机器级的指令条数。
1- 3有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强m倍,即第i级的一条指令能完成第i-1级的m条指令的计算量。
现若需第i级的n条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(n/m)*ks。
第3级上等效程序需运行:(n/m)*(n/m)*ks。
第4级上等效程序需运行:(n/m)*(n/m)*(n /m)*ks。
1- 4硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。
答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。
但是实现的性能价格比,实现的难易程序不同。
例如,编译程序、操作系统等许多用机器语言软件子程序实现的功能完全可以用组合电路硬件或微程序固件来解释实现。
它们的差别只是软件实现的速度慢,软件的编制复杂,编程工作量大,程序所占的存储空间量较多,这些都是不利的;但是,这样所用硬件少,硬件实现上也就因此而简单容易,硬件的成本低,解题的灵活性和适应性较好,这些都是有利的。
计算机系统结构第一章课后题答案
![计算机系统结构第一章课后题答案](https://img.taocdn.com/s3/m/4c4566200a4c2e3f5727a5e9856a561252d32120.png)
1.3 典型习题和题例分析与解答题1.1 有一个经解释实现的计算机,可以按功能划分成4级。
每一级为了执行一条指令需要下一级的N 条指令解释。
若执行第1级的一条指令要K ns 时间,那么执行第2、第3、第4级的一条指令各需要用多少时间?[分析] 计算机按功能分成级时,最底层是第l 级,向上依次为第2、第3和第4级;解释方式的执行是在低级机器级上用它的一串语句或指令来仿真高一级机器级上的一条语 句或指令的功能,而且是通过对高级机器级程序中的每条语句或指令逐条加以解释来实现的。
[解答] 执行第2、第3、第4级的一条指令各需KN ns 、KN 2 ns 、KN 3 ns 的时间。
题1.2 操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接实现,而不必由操作系绕自己来实现。
你认为这样做有哪些好处?[解答] 这样做,可以加快操作系统中操作命令解释的速度,同时也节省了存放解释操作命令这部分解释程序所占的存贮空间,简化了操作系统机器级的设计,也有利于减少传统机器级的指令条数。
题1.3 有一个计算机系统可按功能分成4级,各级的指令都不相同,每一级的指令都比其下一级的指令在效能上强M 倍,即第i 级的一条指令能完成第i-1级的M 条指令的计算量。
现若需第i 级的N 条指令解释第i+l 级的一条指令,而有一段第l 级的程序需要运行的时间为K s ,问在第2、3和4级上一段等效的程序各需要运行多长时间?[分析] 因为从功能意义上讲,第i 级的一条指令能完成第i-1级的M 条指令的计算量,但第i 级的一条指令的执行,都是靠第i-1级的N 条指令的执行来解释完成。
已知,第1级的一段程序运行时间为K s 。
第2级的一段程序从功能等效上讲,所需的指令条数应当是第1级上指令数的1/M 。
而由第1级解释时又需要执行N 条指令,所以,第2级一段等效程序的运行就需要K ·s M N 的时间。
第3、4级则可依次类推。
计算机系统结构课后习题答案
![计算机系统结构课后习题答案](https://img.taocdn.com/s3/m/439660385727a5e9856a61e4.png)
计算机系统结构基本习题和答案填空题1、从(使用语言的)角度可以将系统看成是按(功能)划分的多个机器级组成的层次结构。
2、计算机系统结构的层次结构由高到低分别为(应用语言机器级,高级语言机器级,汇编语言机器级,操作系统机器级,传统机器语言机器级,微程序机器级)。
3、应用程序语言经(应用程序包)的(翻译)成高级语言程序。
4、高级语言程序经(编译程序)的(翻译)成汇编语言程序。
5、汇编语言程序经(汇编程序)的(翻译)成机器语言程序。
6、在操作系统机器级,一般用机器语言程序(解释)作业控制语句。
7、传统机器语言机器级,是用(微指令程序)来(解释)机器指令。
8、微指令由(硬件)直接执行。
9、在计算机系统结构的层次结构中,机器被定义为(能存储和执行相应语言程序的算法和数据结构)的集合体。
10、目前M0由(硬件)实现,M1用(微程序(固件))实现,M2到M5大多用(软件)实现。
以(软件)为主实现的机器成为虚拟机。
(虚拟机)不一定全用软件实现,有些操作也可用(固件或硬件)实现。
11、透明指的是(客观存在的事物或属性从某个角度看不到),它带来的好处是(简化某级的设计),带来的不利是(无法控制)。
12、计算机系统结构也称(计算机体系结构),指的是(传统机器级的系统结构)。
它是(软件和硬件/固件)的交界面,是机器语言汇编语言程序设计者或编译程序设计者看到的(机器物理系统)的抽象。
13、计算机组成指的是(计算机系统结构的逻辑实现),包括(机器级内的数据流和控制流)的组成及逻辑设计等。
计算机实现指的是(计算机组成的物理实现),它着眼于(器件)技术和(微组装)技术。
14、确定指令系统中是否要设乘法指令属于(计算机系统结构),乘法指令是用专门的高速乘法器实现还是用加法器实现属于(计算机组成),乘法器和加法-移位器的物理实现属于(计算机实现)。
15、主存容量与编址方式的确定属于(计算机系统结构),主存是否采用多体交叉属于(计算机组成),主存器件的选定属于(计算机实现)。
计算机系统结构(第2版(课后习题答案
![计算机系统结构(第2版(课后习题答案](https://img.taocdn.com/s3/m/dfadcc2e77232f60dccca141.png)
word文档下载后可自由复制编辑你计算机系统结构清华第2版习题解答word文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)1.2 第二章(P124)2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)1.3 第三章(P202)3.3(存储层次性能),3.5(并行主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法--实存状况图)word文档下载后可自由复制编辑1.4 第四章(P250)4.5(中断屏蔽字表/中断过程示意图),4.8(通道流量计算/通道时间图)1.5 第五章(P343)5.9(流水线性能/时空图),5.15(2种调度算法)1.6 第六章(P391)6.6(向量流水时间计算),6.10(Amdahl定律/MFLOPS)1.7 第七章(P446)7.3、7.29(互连函数计算),7.6-7.14(互连网性质),7.4、7.5、7.26(多级网寻径算法),7.27(寻径/选播算法)word文档下载后可自由复制编辑1.8 第八章(P498)8.12(SISD/SIMD算法)1.9 第九章(P562)9.18(SISD/多功能部件/SIMD/MIMD算法)(注:每章可选1-2个主要知识点,每个知识点可只选1题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例, 习题2.1 第一章(P33)例1.1,p10假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知:Fe=0.4, Se=10,根据Amdahl 定律SeFe Fe T To S n n +-==)1(1 56.164.01104.06.01≈=+=n Sword 文档 下载后可自由复制编辑例1.2,p10采用哪种实现技术来求浮点数平方根FPSQR 的操作对系统的性能影响较大。
计算机体系结构第五章课后习题答案
![计算机体系结构第五章课后习题答案](https://img.taocdn.com/s3/m/46aeb9638f9951e79b89680203d8ce2f006665a3.png)
第五章存储层次5.1名词解释1.存储层次——采用不同的技术实现的存储器,处在离CPU不同距离的层次上,目标是达到离CPU最近的存储器的速度,最远的存储器的容量。
2.全相联映象——主存中的任一块可以被放置到Cache中任意一个地方。
3.直接映象——主存中的每一块只能被放置到Cache中唯一的一个地方。
4.组相联映象——主存中的每一块可以放置到Cache中唯一的一组中任何一个地方(Cache分成若干组,每组由若干块构成)。
5.替换算法——由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。
这时,需要被迫腾出其中的某一块,以接纳新调入的块。
6.L RU——选择最近最少被访问的块作为被替换的块。
实际实现都是选择最久没有被访问的块作为被替换的块。
7.写直达法——在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。
8.写回法——只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。
9.按写分配法——写失效时,先把所写单元所在的块调入Cache,然后再进行写入。
10.不按写分配法——写失效时,直接写入下一级存储器中,而不把相应的块调入Cache。
11.写合并——在往缓冲器写入地址和数据时,如果缓冲器中存在被修改过的块,就检查其地址,看看本次写入数据的地址是否和缓冲器内某个有效块的地址匹配。
如果匹配,就将新数据与该块合并。
12.命中时间——访问Cache命中时所用的时间。
13.失效率——CPU访存时,在一级存储器中找不到所需信息的概率。
14.失效开销——CPU向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。
15.强制性失效——当第一次访问一个块时,该块不在Cache中,需要从下一级存储器中调入Cache,这就是强制性失效。
16.容量失效——如果程序在执行时,所需要的块不能全部调入Cache中,则当某些块被替换后又重新被访问,就会产生失效,这种失效就称作容量失效。
计算机系统结构__《张晨曦、王志英》课后习题参考答案
![计算机系统结构__《张晨曦、王志英》课后习题参考答案](https://img.taocdn.com/s3/m/d0709714376baf1ffc4faded.png)
计算机系统结构__《张晨曦、王志英》课后习题参考答案第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
计算机组成与系统结构课后答案全清华大学出版社袁春风主编
![计算机组成与系统结构课后答案全清华大学出版社袁春风主编](https://img.taocdn.com/s3/m/a871d631cf84b9d528ea7ae6.png)
第1章习题答案5.若有两个基准测试程序P1和P2在机器M1和M2上运行,假定M1和M2的价格分别是5000元和8000元,下表给出了P1和P2在M1和M2上所花的时间和指令条数。
请回答下列问题:(1)对于P1,哪台机器的速度快?快多少?对于P2呢?(2)在M1上执行P1和P2的速度分别是多少MIPS?在M2上的执行速度又各是多少?从执行速度来看,对于P2,哪台机器的速度快?快多少?(3)假定M1和M2的时钟频率各是800MHz和1.2GHz,则在M1和M2上执行P1时的平均时钟周期数CPI各是多少?(4)如果某个用户需要大量使用程序P1,并且该用户主要关心系统的响应时间而不是吞吐率,那么,该用户需要大批购进机器时,应该选择M1还是M2?为什么?(提示:从性价比上考虑)(5)如果另一个用户也需要购进大批机器,但该用户使用P1和P2一样多,主要关心的也是响应时间,那么,应该选择M1还是M2?为什么?参考答案:(1)对于P1,M2比M1快一倍;对于P2,M1比M2快一倍。
(2)对于M1,P1的速度为:200M/10=20MIPS;P2为300k/0.003=100MIPS。
对于M2,P1的速度为:150M/5=30MIPS;P2为420k/0.006=70MIPS。
从执行速度来看,对于P2,因为100/70=1.43倍,所以M1比M2快0.43倍。
(3)在M1上执行P1时的平均时钟周期数CPI为:10×800M/(200×106)=40。
在M2上执行P1时的平均时钟周期数CPI为:5×1.2G/(150×106)=40。
(4)考虑运行P1时M1和M2的性价比,因为该用户主要关心系统的响应时间,所以性价比中的性能应考虑执行时间,其性能为执行时间的倒数。
故性价比R为:R=1/(执行时间×价格)R越大说明性价比越高,也即,“执行时间×价格”的值越小,则性价比越高。
《计算机体系结构(张晨曦)》课后习题答案
![《计算机体系结构(张晨曦)》课后习题答案](https://img.taocdn.com/s3/m/83bdfee09ec3d5bbfd0a74db.png)
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高级语言等虚拟机器级 系列机:相同系统结构,不同组成和实现的一系列计算机 软件兼容:同一软件可应用于不同的环境 兼容机: 模拟:将微程序放在控存中并直接解释另一种机器的指令系统 仿真:将微程序放在主存中并直接解释另一种机器的指令系统 虚拟机: 宿主机: 指令流:机器执行的指令序列 数据流:由指令流调用的数据序列 Amdabl 定律:系统中某一部件由于采用更快的执行方式后,整个系统性能的提高与这种执行方式的使
Sn
1
1 19 20
Fe
Sn
20
1
0
1 Fe
1.13 上式中令 Sn=2,解出 Fe=10/19≈0.526
1.14 上式中令 Sn=10,解出 Fe=18/19≈0.947
1.14 在题 1.12 中,为获得采用向量方式最大加速比的半值(即 10)时,所需可向量化的百分比为多少? 解:
Sn 1 1 19 Fe 20
1.8 从机器(汇编)语言程序员看,以下哪些是透明的?
指令地址寄存器;指令缓冲器;时标发生器;条件寄存器;乘法器;主存地址寄存器;磁盘外设;先行进
位链;移位器;通用寄存器;中断字寄存器。
答:透明的有:指令缓冲器、时标发生器、乘法器、先进先出链、移位器、主存地址寄存器。
见下表,“√”为透明性概念,“P”表示相关课文页数。
1.7 什么是透明性概念?对计算机系统结构,下列哪些是透明的?哪些是不透明的? 存储器的模 m 交叉存取;浮点数据表示;I/O 系统是采用通道方式还是外围处理机方式;数据总线宽度; 字符行运算指令;阵列运算部件;通道是采用结合型还是独立型;PDP-11 系列的单总线结构;访问方式保 护;程序性中断;串行、重叠还是流水控制方式;堆栈指令;存储器最小编址单位;Cache 存储器。 答:透明指的是客观存在的事物或属性从某个角度看不到。
行”指令;指令缓冲寄存器。
答:系列机各档不同的数据通路宽度;虚拟存储器;Cache 存储器;程序状态字;“启动 I/O”指令;“执行”
指令;指令缓冲寄存器。
答:系列机各档不同的数据通路宽度、Cache 存贮器、指令缓冲寄存器属于计算机组成,对系统和程序员和
应用程序员都是透明的。虚拟存贮器、程序状态字、“启动 I/O”指令,对系统程序员是不透明的,而对应
指令地址寄存器,×,
指令缓冲器,√,
时标发生器,√,
条件码寄存器,×,
乘法器,√,
主存地址寄存器,√,
磁盘,×,
先行进位链,√,
移位器,√,
通用寄存器 ,×,
中断字寄存器,×,
1.9 下列哪些对系统程序员是透明的?哪些对应用程序员是透明的?
系统机各档不同的数据通路宽带;虚拟存储器;Cache 存储器;程序状态字;“启动 I/O”指令;“执
例 4(习题 19):用一台 40MHz 处理机执行标准测试程序,它包含的混和指令数和相应所需的时 钟周期如表 1-1 所示。求有效 CPI、MIPS 速率和程序的执行时间。
表 1-1 标准测试程序所含指令数与相应的 CPI
解:
n
CPIi Ii
根据 Amdahl 定律,加速比为:
Sn
1 (1 0.4)
0.4
1 0.64
1.56
10
例 2:假定要将某一执行部件改经后速度提高 10 倍,改经后被改经部件执行时间占系统总运行
时间的 50%。问改经后,获得的加速比 Sn 是多少?
解:由题意可知:Se=10, 根据 Amdahl 定律,加速比为:
不可以考虑的有:(2)(5)(8)。
1.12 如果某一计算机任务用向量方式求解比用标量方式求解要快 20 倍,称可用向量方式求解部分所花费 时间占总的时间的百分比为可向量化百分比。请画出加速比与可向量化比例两者关系的曲线。 解:已知 Se=20 , 求作 Fe-Sn 关系曲线。
将 Se 代入 Amdahl 定律得
1.1 解释下列术语 层次结构:计算机系统由硬件/器件和软件组成,按功能划分成多级层次的结构。 计算机系统结构:1.程序员所看到计算机系统的属性(概念性结构和结构)。 2.由软件、硬件和固件组成的 计算机组成:计算机系统结构的逻辑实现 计算机实现:计算机组成的物理实现 透明性:一种本来是存在的事物或属性,但从某种角度看似乎不存在 由上往下设计:首先确定用户级虚拟机器的基本特征、数据类型和基本命令等,而后再逐级向下设计,
Fe 10Tn
得:
2T 0
Sn
T0 Tn
1 (1 Fe)
Fe Se
由(1)式:
(4)式代入(1)式,得:
Sn T 0 5.5 Tn
Tn
((1
Fe)
Fe Se
)
T
0
由题意:
由(4)、 (5)式:
Fe 10 91% 11
50%Tn FeT 0 10
例 3:计算 PentiumIV 2GHz 处理机的指令执行速度。 解:由于 PentiumIV 2GHz 处理机的 IPC=4(或 CPI=0.25), Fz=2000MHz 因此,MIPSPentiumIV2G=Fz IPC=2000 4 =8000MIPS=8GIPS 即每秒钟 80 亿次(平均每秒钟执行 80 亿条指令)
Se
5
1.20 某工作站采用时钟频率为 15MHz、处理速率为 10MIPS 的处理机来执行一个已知混合程序。假定每次
存储器存取为 1 周期延迟、试问: (1)此计算机的有效 CPI 是多少? (2)假定将处理机的时钟提高到 30MHz,但存储器子系统速率不变。这样,每次存储器存取需要两
个时钟周期。如果 30%指令每条只需要一次存储存取,而另外 5%每条需要两次存储存取,还假定已知混合 程序的指令数不变,并与原工作站兼容,试求改进后的处理机性能。
着眼于器件技术和微组装技术。
(2)见下表,“√”为透明性概念,“P”表示相关课文页数。
模 m 交叉,√,
浮点数据,×,P4
总线宽度,√,
阵列运算部件,×,
单总线,√,
访问保护,×,
指令控制方式,√,
堆栈指令,×,
Cache 存储器,√,
通道与 I/O 处理机,×,P4 结合型与独立型通道,√, 中断,×, 最小编址单位,×,
透明的有:存储器的模 m 交叉存取;数据总线宽度;阵列运算部件;通道是采用结合型还是独立型; PDP-11 系列的单总线结构串行、重叠还是流水控制方式;Cache 存储器。
不透明的有:浮点数据表示;I/O 系统是采用通道方式还是外围处理机方式;字符行运算指令;访问 方式保护;程序性中断;;堆栈指令;存储器最小编址单位。
1 19 Fe 1 20 10
Fe 18 94.74% 19
1.16 某计算机的调整小容量存储器能存储 2000 条指令,假设其中 10%的指令承担了 90%的指令访问且对这 10%的指令的使用是均匀的(即其中每条指令的执行时间相同)。如果要执行的某程序共有 50000 条指令且 已知其中的 10%是频繁使用的,则该计算机执行该程序时,在调整小容量存储器中能访问到的指令会点距 多少百分比?
1.2 如有一个经解释实现的计算机,可以按功能划分成 4 级。每一级为了执行一条指令需要下一级的 N 条 指令解释。若执行第 1 级的一条指令需 K ns 时间,那么执行第 2、3、4 级的一条指令各需要多少时间? 答:执行第 2、3、4 级的一条指令各需 KN ns、(N*N)*K ns、(N*N*N)*K ns 的时间。
CPI f 15 1.5
答:(1)
MIPS 10
MIPSnew fnew
30
15.8MIPS
(2)
CPInew 0.31 0.05 2 1.5
1.24 假定你是一个计算机设计者,对高级语言结构的使用研究表明,过程调用 是最常用的操作之一。你 已设想一个优化设计方案,它能减少过程调用和返回所需的取/存指令次数。为了进行验证,对未加优化 和已优化的方案进行实验测试,假定所使用的是相同的优化编辑器。实验测得结果如下: (1)未优化方案的时钟周期比优化的快 5%; (2)未优化方案中的取/存指令数占总指令数的 30%; (3)优化方案的取/存指令数比未优化的少 1/3。对于其他指令,两种方案的动态执行数没有变化; (4)所有指令,包括取/存,均只需 1 个时钟周期。 要求你定量地判断,哪一种设计方案的计算机工作速度更快。 解:CPI = 1,则有: 方法一、 T 未 = IC × CPI × T(1 - 5%) = 0.95 IC×T T 优=IC×CPI×T(1 - 30%)+IC×CPI×T×30%(1-1/3)=0.9 IC×T 由于 T 优/T 未 = 0.9/0.95 = 0.947 方法二、 指令条数优化加速比: Sn = 1/((1 – Fe) + Fe/Se) = 1/((1 – 0.3) + 0.3/1.5) = 10/9 IC 未=10/9×IC 优 T 未= IC 未×(95/100×T)=10/9×IC 优×(95/100×T)=95/90×(IC 优×T)=95/90×T 优 所以,优化后的方案使计算机工作速度更快。
属于计算机系统结构的属性有:数据表示、寻址方式、寄存器组织、指令系统、存储组织、中断机构、 I/O 结构、保护机构等。
属于组成的属性有:数据通路宽度、专用部件设置、功能部件并行度、控制机构的组成方式,可靠性 技术等。它着眼于机器内各事件的排序方式,控制机构的功能及部件间的关系。
属于实现的属性有:部件的物理结构、器件、模块的划分与连接、微组装技术、信号传输技术等,它
答: 记 Tc ── 新方案时钟周期,已知 CPI = CPIi = 1 原时间 = CPI × IC × 0.95Tc = 0.95IC×Tc 新时间 = (0.3×2/3+0.7)× IC × Tc = 0.9IC×Tc 二者比较,新时间较短。