计算机系统结构教程课后答案
最新计算机体系结构课后习题原版答案-张晨曦著
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机系统结构课后习题答案
计算机系统结构课后习题答案第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
计算机系统结构课后答案
计算机系统结构课后答案第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语⾔从低级到⾼级的次序,把计算机系统按功能划分成多级层次结构,每⼀层以⼀种不同的语⾔为特征。
这些层次依次为:微程序机器级,传统机器语⾔机器级,汇编语⾔机器级,⾼级语⾔机器级,应⽤语⾔机器级等。
虚拟机:⽤软件实现的机器。
翻译:先⽤转换程序把⾼⼀级机器上的程序转换为低⼀级机器上等效的程序,然后再在这低⼀级机器上运⾏,实现程序的功能。
解释:对于⾼⼀级机器上的程序中的每⼀条语句或指令,都是转去执⾏低⼀级机器上的⼀段等效程序。
执⾏完后,再去⾼⼀级机器取下⼀条语句或指令,再进⾏解释执⾏,如此反复,直到解释执⾏完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种⾓度看⼜好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速⽐:对系统中某部分进⾏改进时,改进后系统性能提⾼的倍数。
Amdahl定律:当对⼀个系统中的某个部件进⾏改进后,所能获得的整个系统性能的提⾼,受限于该部件的执⾏时间占总执⾏时间的百分⽐。
程序的局部性原理:程序执⾏时所访问的存储器地址不是随机分布的,⽽是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执⾏的平均时钟周期数。
测试程序套件:由各种不同的真实应⽤程序构成的⼀组测试程序,⽤来测试计算机在各个⽅⾯的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器⼀旦启动,就能按照程序指定的逻辑顺序执⾏这些程序,⾃动完成由程序所描述的处理⼯作。
计算机系统结构课后答案
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机系统结构(课后习题答案)
第一章电脑系统结构的基本概念1.有一个电脑系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。
现假设需第i级的N 条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks。
第3级上等效程序需运行:(N/M)*(N/M)*Ks。
第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。
note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。
而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。
所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。
答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。
但是实现的性能价格比,实现的难易程序不同。
在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡〔硬件〕上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件。
3.试以实例说明电脑系统结构、电脑组成与电脑实现之间的相互关系与影响。
答:电脑系统结构、电脑组成、电脑实现互不相同,但又相互影响。
〔1〕电脑的系统结构相同,但可采用不同的组成。
如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。
从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。
其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。
计算机体系结构课后答案
第五章存储层次5.1名词解释1.存储层次——采用不同的技术实现的存储器,处在离CPU不同距离的层次上,目标是达到离CPU 最近的存储器的速度,最远的存储器的容量。
2.全相联映象——主存中的任一块可以被放置到Cache中任意一个地方。
3.直接映象——主存中的每一块只能被放置到Cache中唯一的一个地方。
4.组相联映象——主存中的每一块可以放置到Cache中唯一的一组中任何一个地方(Cache分成若干组,每组由若干块构成)。
5.替换算法——由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。
这时,需要被迫腾出其中的某一块,以接纳新调入的块。
6.L RU——选择最近最少被访问的块作为被替换的块。
实际实现都是选择最久没有被访问的块作为被替换的块。
7.写直达法——在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。
8.写回法——只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。
9.按写分配法——写失效时,先把所写单元所在的块调入Cache,然后再进行写入。
10.不按写分配法——写失效时,直接写入下一级存储器中,而不把相应的块调入Cache。
11.写合并——在往缓冲器写入地址和数据时,如果缓冲器中存在被修改过的块,就检查其地址,看看本次写入数据的地址是否和缓冲器内某个有效块的地址匹配。
如果匹配,就将新数据与该块合并。
12.命中时间——访问Cache命中时所用的时间。
13.失效率——CPU访存时,在一级存储器中找不到所需信息的概率。
14.失效开销——CPU向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。
15.强制性失效——当第一次访问一个块时,该块不在Cache中,需要从下一级存储器中调入Cache,这就是强制性失效。
16.容量失效——如果程序在执行时,所需要的块不能全部调入Cache中,则当某些块被替换后又重新被访问,就会产生失效,这种失效就称作容量失效。
计算机系统结构(课后习题答案)
第一章计算机系统结构的基本概念1.有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。
现若需第i级的N 条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks。
第3级上等效程序需运行:(N/M)*(N/M)*Ks。
第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。
note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。
而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。
所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。
答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。
但是实现的性能价格比,实现的难易程序不同。
在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件。
3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。
答:计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。
(1)计算机的系统结构相同,但可采用不同的组成。
如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。
从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。
其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。
计算机系统结构课后习题答案
计算机系统结构课后习题答案《计算机系统结构》习题解答⽬录第⼀章(P33)1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)第⼆章(P124)2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)第三章(P202)3.3(存储层次性能),3.5(并⾏主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法--实存状况图)第四章(P250)4.5(中断屏蔽字表/中断过程⽰意图),4.8(通道流量计算/通道时间图)第五章(P343)5.9(流⽔线性能/时空图),5.15(2种调度算法)第六章(P391)6.6(向量流⽔时间计算),6.10(Amdahl定律/MFLOPS)第七章(P446)7.3、7.29(互连函数计算),7.6-7.14(互连⽹性质),7.4、7.5、7.26(多级⽹寻径算法),7.27(寻径/选播算法)第⼋章(P498)8.12(SISD/SIMD算法)第九章(P562)9.18(SISD/多功能部件/SIMD/MIMD算法)(注:每章可选1-2个主要知识点,每个知识点可只选1题。
有下划线者为推荐的主要知识点。
)第⼀章(P33)1.7(1)从指定⾓度来看,不必要了解的知识称为透明性概念。
(2)见下表,“√”为透明性概念,“P ”表⽰相关课⽂页数。
1.8见下表,“√”为透明性概念,“P ”表⽰相关课⽂页数。
1.9见下表,“√”表⽰都透明,“应”表⽰仅对应⽤程序员透明,“×”表⽰都不透明。
1.12 已知Se=20 , 求作Fe-Sn 关系曲线。
将Se 代⼊Amdahl 定律得e1911-=1.13 上式中令Sn=2,解出Fe=10/19≈0.5261.14 上式中令Sn=10,解出Fe=18/19≈0.9471.15 已知两种⽅法可使性能得到相同的提⾼,问哪⼀种⽅法更好。
计算机系统结构课后答案
第1章部分习题参考答案1.1 解释下列术语⏹翻译:先用转换程序将上一级机器级上的程序整个地变换成下一级机器级上可运行的等效程序,然后再在下一级机器级上去实现的技术。
⏹解释:在下一级机器级上用它的一串语句或指令来仿真上一级机器级上的一条语句或指令的功能,通过对上一级机器语言程序中的每条语句或指令逐条解释来实现的技术。
⏹层次结构:将计算机系统由上往下依次划分为应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器级和微程序机器级。
对于一个具体的计算机系统,层次的多少会有所不同。
⏹计算机系统结构:传统机器级的程序员所看到计算机的基本属性,即计算机的概念性结构和功能特性。
简称为计算机的外特性。
⏹计算机组成:计算机系统结构的逻辑实现,也常称为计算机组织。
该组织包括机器级内的数据流和控制流的组成以及逻辑设计等。
⏹计算机实现:计算机组成的物理实现。
它包括处理机、主存等部件的物理结构,器件的集成度、速度和信号,器件、模块、插件、底板的划分与连接,专用器件的设计,电源、冷却、装配等技术。
⏹透明性:本来存在的事物或属性,但从某个角度看似乎不存在,称为透明性现象。
⏹固件:是一种具有软件功能的硬件。
如将软件固化在ROM中,就是一种固件。
⏹由上往下设计:先考虑如何满足应用要求,确定好面对使用者那级机器应有什么基本功能和特性,然后再逐级往下设计,每级都考虑怎样优化上一级实现。
这种方法适合于专用机设计。
⏹由下往上设计:根据现有的部件,并参照或吸收已有各种机器的特点,先设计出微程序机器级(如果采用微程序控制)及传统机器级,然后再为不同应用配置多种操作系统和编译系统软件,采用合适的算法来满足相应的应用。
这是20世纪60-70年代前常用的通用机设计思路。
⏹系列机:同一厂家生产的具有相同系统结构,但具有不同组成和实现的一系列的机器。
⏹软件兼容:同一软件可以不加修改地运行于系统结构相同的不同档次的机器上,而且它们所获得的结果一样,差别只是运行时间不同。
计算机系统结构教程课后解答
1.7某台主频为400MHz 的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:指令类型 指令执行数量 平均时钟周期数 整数 45000 1 数据传送 75000 2 浮点 8000 4 分支 1500 2求该计算机的有效CPI 、MIPS 和程序执行时间。
解:1(/)ni i i CPI CPI IC IC ==⨯∑(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (2)MIPS 速率=f/ CPI =400/1.776 =225.225MIPS (3)程序执行时间= (45000×1+75000×2+8000×4+1 500×2)/400=575s1.9 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?解:由题可知: 可改进比例Fe=40% = 0.4 部件加速比Se = 10根据()011 1.5625(10.4)0.4/101n n T S Fe T Fe Se ====-+-+ 1.10 计算机系统中有三个部件可以改进,这三个部件的部件加速比为: 部件加速比1=30; 部件加速比2=20; 部件加速比3=10 (1) 如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?(2) 如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少? 解:(1)在多个部件可改进情况下,Amdahl 定理的扩展:()011231123123n nT S Fe Fe Fe T Fe Fe Fe Se Se Se ==---+++ 已知S1=30,S2=20,S3=10,Sn =10,F1=0.3,F2=0.3,得: 得F3=0.36,即部件3的可改进比例为36%。
(完整版)计算机系统结构课后习题答案
第 1 章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl 定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机系统结构-课后答案
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机系统结构教程课后答案
1.7某台主频为400MHz 的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:指令类型 指令执行数量 平均时钟周期数 整数 45000 1 数据传送 75000 2 浮点 8000 4 分支 1500 2求该计算机的有效CPI 、MIPS 和程序执行时间。
解:1(/)ni i i CPI CPI IC IC ==⨯∑(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (2)MIPS 速率=f/ CPI =400/1.776 =225.225MIPS (3)程序执行时间= (45000×1+75000×2+8000×4+1 500×2)/400=575s1.9 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?解:由题可知: 可改进比例Fe=40% = 0.4 部件加速比Se = 10根据()011 1.5625(10.4)0.4/101n n T S Fe T Fe Se ====-+-+ 1.10 计算机系统中有三个部件可以改进,这三个部件的部件加速比为: 部件加速比1=30; 部件加速比2=20; 部件加速比3=10(1) 如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?(2) 如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少? 解:(1)在多个部件可改进情况下,Amdahl 定理的扩展:()011231123123n nT S Fe Fe Fe T Fe Fe Fe Se Se Se ==---+++ 已知S1=30,S2=20,S3=10,Sn =10,F1=0.3,F2=0.3,得: 得F3=0.36,即部件3的可改进比例为36%。
计算机系统结构课后习题答案
计算机系统结构课后习题答案第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语⾔从低级到⾼级的次序,把计算机系统按功能划分成多级层次结构,每⼀层以⼀种不同的语⾔为特征。
这些层次依次为:微程序机器级,传统机器语⾔机器级,汇编语⾔机器级,⾼级语⾔机器级,应⽤语⾔机器级等。
虚拟机:⽤软件实现的机器。
翻译:先⽤转换程序把⾼⼀级机器上的程序转换为低⼀级机器上等效的程序,然后再在这低⼀级机器上运⾏,实现程序的功能。
解释:对于⾼⼀级机器上的程序中的每⼀条语句或指令,都是转去执⾏低⼀级机器上的⼀段等效程序。
执⾏完后,再去⾼⼀级机器取下⼀条语句或指令,再进⾏解释执⾏,如此反复,直到解释执⾏完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种⾓度看⼜好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速⽐:对系统中某部分进⾏改进时,改进后系统性能提⾼的倍数。
Amdahl定律:当对⼀个系统中的某个部件进⾏改进后,所能获得的整个系统性能的提⾼,受限于该部件的执⾏时间占总执⾏时间的百分⽐。
程序的局部性原理:程序执⾏时所访问的存储器地址不是随机分布的,⽽是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执⾏的平均时钟周期数。
测试程序套件:由各种不同的真实应⽤程序构成的⼀组测试程序,⽤来测试计算机在各个⽅⾯的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器⼀旦启动,就能按照程序指定的逻辑顺序执⾏这些程序,⾃动完成由程序所描述的处理⼯作。
计算机系统结构课后习题答案
计算机系统结构课后习题答案MPP :即大规模并行处理,按照当前的标准,具有几百台~几千台处理机的任何机器都是大规模并行处理系统。
8.2 一个具有32台处理机的系统,对远程存储器访问时间是2000ns。
除了通信以外,假设计算中的访问均命中局部存储器。
当发出一个远程请求时,本地处理机挂起。
处理机的时钟周期时间是10ns,假设指令基本的CPI为1.0(设所有访存均命中Cache)。
对于下述两种情况:(1)没有远程访问;(2)0.5%的指令需要远程访问。
试问前者比后者快多少?解:已知远程访问率p = 0.5%,远程访问时间t = 2000ns,时钟周期T = 10ns 远程访问开销 C = t/T = 2000ns/10ns = 200(时钟周期数)有0.5%远程访问的机器的实际CPI2 为:CPI2 = CPI1 + p×C = 1.0 + 0.5%×200 = 2.0 只有局部访问的机器的基本CPI1 = 1.0 CPI2/ CPI1 = 2.0/1.0 = 2(倍)因此,没有远程访问状态下的机器速度是有0.5% 远程访问的机器速度的2 倍。
8.3 什么是多处理机的一致性?给出解决一致性的监听协议和目录协议的工作原理。
答:(1)对多个处理器维护一致性的协议称为Cache一致性协议。
(2)目录协议的工作原理:采用一个集中的数据结构——目录。
对于存储器中的每一个可以调入Cache的数据块,在目录中设置一条目录项,用于记录该块的状态以及哪些Cache 中有副本等相关信息。
目录协议根据该项目中的信息以及当前要进行的访问操作,依次对相应的Cache发送控制消息,并完成对目录项信息的修改。
此外,还要向请求处理器发送响应信息。
(3)监听协议的工作原理:每个Cache除了包含物理存储器中块的数据拷贝之外,也保存着各个块的共享状态信息。
Cache通常连在共享存储器的总线上,当某个Cache需要访问存储器时,它会把请求放到总线上广播出去,其他各个Cache控制器通过监听总线来判断它们是否有总线上请求的数据块。
计算机系统结构课后习题答案
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序.把计算机系统按功能划分成多级层次结构.每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级.传统机器语言机器级.汇编语言机器级.高级语言机器级.应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序.然后再在这低一级机器上运行.实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令.都是转去执行低一级机器上的一段等效程序。
执行完后.再去高一级机器取下一条语句或指令.再进行解释执行.如此反复.直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性.即概念性结构与功能特性。
在计算机技术中.把这种本来存在的事物或属性.但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现.包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现.包括处理机、主存等部件的物理结构.器件的集成度和速度.模块、插件、底板的划分与连接.信号传输.电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时.改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后.所能获得的整个系统性能的提高.受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的.而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序.用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中.机器一旦启动.就能按照程序指定的逻辑顺序执行这些程序.自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.7某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:指令类型指令执行数量平均时钟周期数整数450001数据传送750002浮点80004分支15002求该计算机的有效CPI、MIPS和程序执行时间解:nCPI 八(CPI j IC j/IC)i 4(1)CPI = (45000X 1 + 75000X 2+ 8000X 4+ 1500X 2) / 129500= 1.776(2)MIPS 速率=f/ CPI = 400/1.776 = 225.225MIPS(3)程序执行时间=(45000 X 1 + 75000X 2 + 8000 X 4+ 1500 X 2)/400=575s1.9将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?解:由题可知:可改进比例Fe=40% = 0.4 部件加速比Se = 10 S n=』= ------- — 1.5625根据「—_Fe 吏(1-°.4) °.4/—°Se1.10计算机系统中有三个部件可以改进,这三个部件的部件加速比为:部件加速比仁30; 部件加速比2=20; 部件加速比3=10(1) 如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?(2) 如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?解:(1)在多个部件可改进情况下,Amdahl定理的扩展:已知S1 = 30,S2= 20,S3= 10,Sn= 10,F1 = 0.3,F2 = 0.3,得:得F3= 0.36,即部件3的可改进比例为36%。
(2)设系统改进前的执行时间为T,则3个部件改进前的执行时间为:(0.3+0.3+0.2) T = 0.8T,不可改进部分的执行时间为1 - Fe1 - Fe2 - Fe3 =0.2T1 - Fe1 - Fe2 - Fe3Fe1 Fe2 Fe3 seise2 se3T n已知3个部件改进后的加速比分别为 S1 = 30, S2= 20, S3= 10,因此3个部件 改进后的执行时间为:F e 1 F e 2 F e 3改进后整个系统的执行时间为:Tn = 1_Fe1-Fe2—Fe3,竺•竺,竺7Sei se2 se3=0.045T+0.2T = 0.245T那么系统中不可改进部分的执行时间在总执行时间中占的比例是: 0.2/0.245=81.6%1.11假设浮点数指令 指令的比例为4% , 的平均CPI 为1.25 解:-FP 指令的比例为30%,其中浮点数平方根FPSQR 占全部 FP 操作的CPI 为5, FPSQR 操作的CPI 为20,其他指令 。
nCPI 八(CPI j IC j /IC)i 4改进前: CPI = 5 X 30% + 1.25 X (1 - 30%) = 2.375 设除FPSQR 外其余指令的平均CPI 为X则 2.375 = 20 X 4% + (1 - 4%)X ,解出 X = 1.6406252.11 解:万案1: 万案CPI1 = 3 CPI2 = 3 X 4% + 1.640625 X (1 - 4%) = 1.695 X 30% + 1.25 X (1 - 30%) = 1.77511 0.571 0.35 1 00.22 1 00.09 10.04 1 0.130.02 1 0 0 1 0043 SHR STP CIL STO JOM JMP SUB CLA ADD 欢迎有需要的朋友下载!!9L= ' 耐=0.43x1+0.22x2+0.13x3+0.07x5+0.06x5+0.05x5+0.02x6+0.01x7+0.01x7i 4=2.422.12.解:二地址指令的结构是(4位操作码0P),(6位地址码A1),(6位地址码A2)。
一地址指令的结构是(10位操作码0P),(6位地址码A)。
二地址指令,最多共16条二地址指令。
每少一条二地址指令,则多26条一地址指令,所以一地址指令最多有(16-A)*26条3.5在一台单流水线多操作部件的处理机上执行下面的程序,每条指令的取指令、指令译码需要一个时钟周期,MOVE、ADD和MUL操作分别需要2个、3个和4个时钟周期,每个操作都在第一个时钟周期从通用寄存器中读操作数,在最后一个时钟周期把运算结果写到通用寄存器中。
k:MOVE R1,R0;R1J(R0)k+1:MUL R0,R2,R1;R0 J(R2) X (R1)k+2:ADD R0,R2,R3;R0J(R2)+(R3)画出指令执行过程的流水线时空图,并计算完成这3条指令共需要多少个时钟周期?解:在程序实际执行过程中,二种数据相关会引起流水线停顿。
一是“先写后读” 相关,k指令对R1的写在程序执行开始后的第四个时钟;k+1指令对R1的读对指令本身是第三个时钟,但k+1指令比k指令晚一个时钟进入流水线,则在程序执行开始后的第四个时钟要读R1。
不能在同一时钟周期内读写同一寄存器,因此k+1指令应推迟一个时钟进入流水线,产生了流水线停顿。
二是“写一写” 相关,k+1指令对R0的写对指令本身是第六个时钟,而要求该指令进入流水线 应在程序执行开始后的第三个时钟,所以对R0的写是在程序执行开始后的第八 个时钟。
k+2指令对R0的写对指令本身是第五个时钟, 而k+2指令比k+1指令 晚一个时钟进入流水线,贝恠程序执行开始后的第四个时钟,所以对R0的写是在程序执行开始后的第八个时钟。
不能在同一时钟周期内写写同一寄存器,因 此k+2指令应推迟一个时钟进入流水线, 产生了流水线停顿。
另外,可分析“先 读后写”相关不会产生流水线的停顿。
该指令流水线由六个功能段取指、译码、取数、运一、运二和存数等组成, 则程序指令执行过程的流水线时空图如下图所示。
若3条指令顺序流动,共需3.6有一指令流水线如下所示(1) 求连续输入10条指令,该流水线的实际吞吐率和效率;(2)该流水线的 瓶颈”在哪一段?请采取两种不同的措施消除此瓶颈”。
对于你所给出的两种新的流水线,连续输入 10条指令时,其实际吞吐率和效率各是多少?解:(1)kT k 二't i (n T) t maxi ==(50 50 100 200) 9 200二 2200(ns)TP = % =煜。
*)出50ns 50ns 100ns 200nsn 't ii =1kk G 也L + (n- 1) max© t/ t 2」ll 』tQ-i =1- m、t ii 1 i400 5 =TP q TP45.45%k411(2)瓶颈在3、4段。
变成八级流水线(细分)3_2 — 4_150ns50ns__?4_4 _50 nskT k = 't i (n - 1) t maxi T=50 8 9 50二 850(ns)'二 tiy400 10 E 二 TP — =TP58.82%m817重复设置部件50ns 50 ns 50nsTP5 (ns 」)mE/°° 1°850 8 /°17®82%3.7有一个流水线由4段组成,其中每当流经第3段时,总要在该段循环一 次,然后才能流到第4段。
如果每段经过一次所需要的时间都是 4,问:(1) 当在流水线的输入端连续地每 t 时间输入任务时,该流水线会发生 什么情况?(2) 此流水线的最大吞吐率为多少?如果每 2 t 输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少?(3) 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理 10个任。
(2)TP 「Tkns')时间=23. tTpipeline:E 二TP 5 * =5°92,54.35%(3) 重复设置部件段込14.'tTP= “丁険咲"t5'止吞吐率提高倍数二 亠 =1.64%3.8有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、 5段,第3段的时间为2^t ,其余各段的时间均t ,而且流水线的输出可以 直接返回输入端或暂存于相应的流水寄存器中。
现要在该流水线上计 算|4(A - Bi),画出其时空图,并计算其吞吐率、加速比和效率。
i =112 3 4 5 6 7 8 91022 4 466 8 8 10101 1 3 35 57 7 991 23 456 7891012345678 9103 1 2 时间143 2 △t►2△t43_2 T pipeiine△t△t£2 1解:首先,应选择适合于流水线工作的算法。
对于本题,应先计算 A i + B i 、 A 2+ B 2> A 3 + B 3 和 A 4 + B 4;再计算(A i + B i ) X (A 2+ B 2)和(A 3 + B 3) X (A 4+ B 4); 然后求总的结果。
其次,画出完成该计算的时空图,如图所示,图中阴影部分表示该段在工如果不用流水线,由于一次求积需 3岀,一次求和需5岀,则产生上述7个 结果共需(4X5+3X3) △ =29At 。
所以加速比为:3.8有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5 段,第2段的时间为2At ,其余各段时间均为 岀,而且流水线的输出可以直接返 回输入端或暂存于相应的流水寄存器中。
若在该流水线上计算:4送(A9)i mS V6118. t该流水线的效率可由阴影区的面积和 5个段总时空区的面积的比值求得:4 5 3 35 18由图可见,它在18个岀时间中,给出了7个结果。
所以吞吐率为:TP7 18:= 0.322ABCDA XBC XD A X B X C X D2 1试计算其吞吐率、加速比和效率。
5 43输 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718入 A 1 A 2 A 3 A * ACA + BC + DA + BD A + B由图可见,它在18个岀时间中,给出了 7个结果。
所以吞吐率为:如果不用流水线,由于一次求积需 4岀,一次求和需4岀,则产生上述7个 结果共需(4M+3X4) △ =28岀。
所以加速比为:18:t该流水线的效率可由阴影区的面积和 5个段总时空区的面积的比值求得:E280.3115 184.5在CRAY-1机器上,按照链接方式执行下述4条向量指令(括号中给出了相应 功能部件的执行时间),如果向量寄存器和功能部件之间的数据传送需要 1拍, 试求此链接流水线的通过时间是多少拍?如果向量长度为 64,则需多少拍才能 得到全部结果?V 叶 存储器(从存储器中取数:7拍) V2— V0+V1 (向量加:3拍)V3— V2VA3 (按(A3)左移:4拍) Vk V3 A V4 (向量逻辑乘:2拍)解:通过时间就是每条向量指令的第一个操作数执行完毕需要的时间,也就是 各功能流水线由空到满的时间,在流水线充满之后,向量中后继操作数继续以 流水方式执行,直到整组向量执行完毕。