计算机系统结构习题课1(DOC)
(完整版)计算机系统结构(课后习题答案)
第一章计算机系统结构的基本概念1.有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。
现若需第i级的N 条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks。
第3级上等效程序需运行:(N/M)*(N/M)*Ks。
第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。
note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。
而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。
所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。
答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。
但是实现的性能价格比,实现的难易程序不同。
在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件。
3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。
答:计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。
(1)计算机的系统结构相同,但可采用不同的组成。
如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。
从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。
其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。
计算机组成与系统结构课后答案免费版全(清华大学出版社 袁春风主编)
计算机组成与系统结构课后答案免费版全(清华大学出版社袁春风主编)计算机组成与系统结构课后答案免费版全(清华大学出版社-袁春风主编)第一章练习答案5.若有两个基准测试程序p1和p2在机器m1和m2上运行,假定m1和m2的价格分别是5000元和8000元,下表给出了p1和p2在m1和m2上所花的时间和指令条数。
程序p1p2m1指令条数200×106300×103执行时间(ms)100003指令条数150×106420×103m2执行时间(ms)50006请回答下列问题:(1)对于p1,哪台机器的速度快?快多少?对于p2呢?(2)在m1上执行p1和p2的速度分别是多少mips?在m2上的执行速度又各是多少?从执行速度让我们看看,对于P2,哪台机器速度快?多快?(3)假设M1和M2的时钟频率分别为800 MHz和1.2 GHz,则P1在M1和M2上执行时的平均时钟周期期数cpi各是多少?(4)如果某个用户需要大量使用程序p1,并且该用户主要关心系统的响应时间而不是吞吐率,那么,当用户需要购买大量机器时,他应该选择M1还是M2?为什么?(注意:在性价比方面)(5)如果另一个用户也需要购买大量机器,但用户同样使用P1和P2,那么主要的问题是响应时间间,那么,应该选择m1还是m2?为什么?参考答案:(1)对于p1,m2比m1快一倍;对于p2,m1比m2快一倍。
(2)对于M1,P1的速度为200m/10=20mips;P2为300K/0.003=100mips。
对于m2,p1的速度为:150m/5=30mips;p2为420k/0.006=70mips。
就执行速度而言,对于P2,因为100/70=1.43倍,M1比m2快0.43倍。
(3)在M1上执行P1时的平均时钟周期数CPI为:10×800m/(200×106)=40在m2上执行p1时的平均时钟周期数cpi为:5×1.2g/(150×106)=40。
(完整版)计算机系统结构课后习题答案
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机系统结构复习题(附答案) (1)
计算机系统结构复习题和重点(附答案)一、单项选择题1.实现汇编语言源程序变换成机器语言目标程序是由()A.编译程序解释B.编译程序翻译C.汇编程序解释D.汇编程序翻译2.系列机软件必须保证()A.向前兼容,并向上兼容B.向前兼容,并向下兼容C.向后兼容,力争向上兼容D.向后兼容,力争向下兼容3.浮点数尾数基值r m=8,尾数数值部分长6位,可表示规格化正尾数的个数是()A.56个B.63个C.64个D.84个4.在IBM370系统中,支持操作系统实现多进程共用公用区管理最有效的指令是()A.“执行”指令B.“程序调用”指令C.“比较与交换”指令D.“测试与置定”指令5.关于非专用总线三种控制方式中,下列叙述错误..的是()A.集中式定时查询,所有部件共用同一条“总线忙”线B.集中式定时查询,所有部件都用同一条“总线请求”线C.集中式独立请求,所有部件都用同一条“总线请求”线D.集中式串行链接,所有部件都用同一条“总线请求”线6.磁盘外部设备适合于连接到()A.字节多路通道B.数组多路通道或选择通道C.选择通道或字节多路通道D.数组多路通道或字节多路通道7.在Cache存储器中常用的地址映象方式是()A.全相联映象B.页表法映象C.组相联映象D.段页表映象8.在指令级高度并行的超级处理机中,下列叙述正确的是()A.超标量处理机利用资源重复,要求高速时钟机制B.超流水线处理机利用资源重复,要求高速时钟机制C.超标量处理着重开发时间并行性,要求高速时钟机制D.超流水线处理机着重开发时间并行性,要求高速时钟机制9.间接二进制n方体网络是一种()A.多级立方体网络B.多级全排列网络C.单级立方体网络D.多级混洗交换网络10.多端口存储器适合于连接A.紧耦合多处理机B.松耦合多处理机C.机数很多的处理机D.机数可变的多处理机二、填空题11.多处理机实现的是___________、___________间的并行。
计算机系统结构(第三版)张晨曦 课后答案
fi Si
−1
式中,fi 为可加速部件 i 在未优化系统中所占的比例;Si 是部件 i 的加速比。
⎧ f ⎫ f f S = ⎨[1 − ( f1 + f 2 + f 3 )] + 1 + 2 + 3 ⎬ S S S 1 2 3⎭ ⎩
0.3 0.3 f 3 ⎫ ⎧ 10 = ⎨[1 − (0.3 + 0.3 + f 3 )] + + + ⎬ 30 20 30 ⎭ ⎩
课
45000 × 1 + 75000 × 2 + 8000 × 4 + 1500 × 2 = 1.776 129500
答
案 网
计算机体系结构 • 第一章 • 第4页
⎡ f ⎤ Te = To ⎢(1 − f e ) + e ⎥ S e⎦ ⎣
S=
1 (1 − f e ) +
fe Se
S=
i
1 (1 − ∑ f i ) + ∑
对于第三级而言,为了完成 IC 条指令的功能,第三级指令的条数为: 执行第三级
IC 。为了 M2
IC IC 条指令,需要执行 N 条第二级的指令对其进行解释。那么对第二级 2 M M2 IC IC + 2N 2 M M
而言,总的指令条数为:
N⎤ ⎡ = ⎢1 + ⎥ K ⎣ M⎦ N⎤ ⎡ T4 = ⎢1 + ⎥ K ⎣ M⎦
1.5 计算机系统有三个部件可以改进,这三个部件的加速比如下: 部件加速比 1=30; 部件加速比 2=20; 部件加速比 3=10; (1) 如果部件 1 和部件 2 的可改进比例为 30%,那么当部件 3 的可改进比例为多少时, 系统的加速比才可以达到 10? (2) 如果三个部件的可改进比例为 30%、30%和 20%,三个部件同时改进,那么系统 中不可加速部分的执行时间在总执行时间中占的比例是多少? 解:在多个部件可改进情况下 Amdahl 定理的扩展:
计算机体系结构课后答案
计算机体系结构课后答案【篇一:计算机体系结构习题(含答案)】1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。
对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。
(1)最大尾数(8)最小正数(2)最小正尾数(9)最大负数(3)最小尾数(10)最小负数(4)最大负尾数(11)浮点零(5)最大阶码(12)表数精度(6)最小阶码(13)表数效率(7)最大正数(14)能表示的规格化浮点数个数2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。
尾数用原码、纯小数表示,阶码用移码、整数表示。
(1) 设计这种浮点数的格式(2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。
3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。
(1) 选择合适的舍入方法。
(2) 确定警戒位位数。
(3) 计算在正数区的误差范围。
4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。
b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。
如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。
对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。
(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。
6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为6位。
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。
高阶交错存储器具有扩展方便、存取效率低的优点。
低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。
(2)各种存储器的带宽与其工作频率有关。
不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。
(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。
3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。
计算机系统(课后习题答案)
嵌入式系统:利用微控制器、数字信号处理器或通用微处理器,结合具体应用构成的 控制系统。
【1-6】冯·诺伊曼计算机的基本设计思想是什么? [答案]
采用二进制形式表示数据和指令。指令由操作码和地址码组成。 将程序和数据存放在存储器中,计算机在工作时从存储器取出指令加以执行,自动完 成计算任务。这就是“存储程序”和“程序控制”(简称存储程序控制)的概念。 指令的执行是顺序的,即一般按照指令在存储器中存放的顺序执行,程序分支由转移 指令实现。 计算机由存储器、运算器、控制器、输入设备和输出设备五大基本部件组成,并规定 了 5 部分的基本功能。
【2-6】将下列压缩 BCD 码转换为十进制数: (1)10010001 (2)10001001 (3)00110110
[答案] (1)91 (2)89 (3)36 (4)90
(4)10010000
【2-7】将下列十进制数用 8 位二进制补码表示: (1)0 (2)127 (3)-127 (4)-57
“计算机系统基础”习题解答
第 1 章 计算机系统概述
【1-1】简答题 (1)计算机字长(Word)指的是什么? (2)处理器的“取指-译码-执行周期”是指什么? (3)总线信号分成哪 3 组信号? (4)外部设备为什么又称为 I/O 设备? (5)Windows 的控制台窗口与模拟 DOS 窗口有什么不同? [答案] (1)处理器每个单位时间可以处理的二进制数据位数称计算机字长。 (2)指令的处理过程。处理器的“取指—译码—执行周期” 是指处理器从主存储器 读取指令(简称取指),翻译指令代码的功能(简称译码),然后执行指令所规定的操作 (简称执行)的过程。 (3)总线信号分成 3 组,分别是数据总线、地址总线和控制总线。 (4)因为外设以输入(Input)和输出(Output)形式与主机交换数据。 (5)Windows 的控制台窗口是基于 32/64 位 Windows 操作系统,模拟 DOS 窗口是基于 16 位 DOS 操作系统。
计算机系统结构——课后答案
习题一1、解释下列术语计算机系统的外特性:通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性,即由他们所看到的计算机的基本属性(概念性结构和功能特性)。
计算机系统的内特性:计算机系统的设计人员所看到的基本属性,本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。
模拟:模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。
可移植性:在新型号机出台后,原来开发的软件仍能继续在升级换代的新型号机器上使用,这就要求软件具有可兼容性,即可移植性。
可兼容性是指一个软件可不经修改或只需少量修改,便可由一台机器移植到另一台机器上运行,即同一软件可应用于不同环境。
Amdahl 定律:系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频度或占总执行时间的比例。
虚拟机(Virtual Machine ):指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。
6、7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%,为了增强该操作的性能,可采用两种不同的方法:一种是增加专门的硬件,可使求浮点数平方根操作的速度提高为原来的20倍;另一种方法是提高所有浮点运算指令的速度,使其为原来的2倍,而浮点运算指令的执行时间在总执行时间中占30%。
试比较这两种方法哪一种更好些。
答:增加硬件的方法的加速比23.120/2.0)2.01(11=+-=p S ,另一种方法的加速比176.12/3.0)3.01(12=+-=p S ,经计算可知Sp1>Sp2第一种方法更好些。
9、假设高速缓存Cache 的工作速度为主存的5倍,且Cache 被访问命中的概率为90%,则采用Cache 能使整个存储系统获得多高的加速比? 答:加速比%10)(%90'⨯++⨯==tc tm tc tmT T S ,其中tm=5tc ,代入公式,得到加速比S=3.33。
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。
高阶交错存储器具有扩展方便、存取效率低的优点。
低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。
(2)各种存储器的带宽与其工作频率有关。
不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。
(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。
3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。
计算机系统结构李学干课后标准答案
计算机系统结构李学干课后答案【篇一:计算机系统结构李学干版+习题答案】级。
每一级为了执行一条指令需要下一级的n条指令解释。
若执行第1级的一条指令需k ns时间,那么执行第2、3、4级的一条指令各需要多少时间?答:执行第2、3、4级的一条指令各需kn ns、(n*n)*k ns、(n*n*n)*k ns的时间。
1-2操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接解释实现,而不必有操作系统自己来实现。
更具你对1- 1题的回答,你认为这样做有哪些好处?答:这样做,可以加快操作系统中操作命令解释的速度,同时也节省了存放解释操作命令这部分解释程序所占的存储空间,简化了操作系统机器级的设计,也有利于减少传统机器级的指令条数。
1- 3有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强m倍,即第i级的一条指令能完成第i-1级的m条指令的计算量。
现若需第i级的n条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(n/m)*ks。
第3级上等效程序需运行:(n/m)*(n/m)*ks。
第4级上等效程序需运行:(n/m)*(n/m)*(n /m)*ks。
1- 4硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。
答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。
但是实现的性能价格比,实现的难易程序不同。
例如,编译程序、操作系统等许多用机器语言软件子程序实现的功能完全可以用组合电路硬件或微程序固件来解释实现。
它们的差别只是软件实现的速度慢,软件的编制复杂,编程工作量大,程序所占的存储空间量较多,这些都是不利的;但是,这样所用硬件少,硬件实现上也就因此而简单容易,硬件的成本低,解题的灵活性和适应性较好,这些都是有利的。
计算机系统结构(第2版(课后习题答案
word 文档下载后可自由复制编辑你计算机系统结构清华第 2 版习题解答word 文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9 (透明性概念),1.12-1.18 (Amdahl定律),1.19、1.21 、1.24 (CPI/MIPS)1.2 第二章(P124)2.3 、2.5 、2.6 (浮点数性能),2.13 、2.15 (指令编码)1.3 第三章(P202)3.3 (存储层次性能), 3.5 (并行主存系统),3.15-3.15 加 1 题(堆栈模拟),3.19 中(3)(4)(6)(8)问(地址映象/ 替换算法-- 实存状况图)word 文档下载后可自由复制编辑1.4 第四章(P250)4.5 (中断屏蔽字表/中断过程示意图),4.8 (通道流量计算/通道时间图)1.5 第五章(P343)5.9 (流水线性能/ 时空图),5.15 (2种调度算法)1.6 第六章(P391)6.6 (向量流水时间计算),6.10 (Amdahl定律/MFLOPS)1.7 第七章(P446)7.3 、7.29(互连函数计算),7.6-7.14 (互连网性质),7.4 、7.5 、7.26(多级网寻径算法),word 文档下载后可自由复制编辑7.27 (寻径/ 选播算法)1.8 第八章(P498)8.12 ( SISD/SIMD 算法)1.9 第九章(P562)9.18 ( SISD/多功能部件/SIMD/MIMD 算法)(注:每章可选1-2 个主要知识点,每个知识点可只选 1 题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例 , 习题2.1 第一章 (P33)例 1.1,p10假设将某系统的某一部件的处理速度加快到 10倍 ,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知: Fe=0.4, Se=10,根据 Amdahl 定律S n To T n1 (1Fe )S n 1 10.6 0.4100.64 Fe Se 1.56word 文档 下载后可自由复制编辑例 1.2,p10采用哪种实现技术来求浮点数平方根 FPSQR 的操作对系统的性能影响较大。
计算机系统结构习题课_mine
码,并计算这3种编码的平均码长。
• 可变长编码:最好的编码格式,可用最少的二进制表示目标代码。哈夫曼 编码,开始主要用于电报报文,比较适合在这种串行传输环境中解码。 (可写C程序对一段字符串进行字符频率统计,然后进行哈夫曼编码和解 码。检验哈夫曼编码在降低目标代码长度上的效果。)
• 固定长度编码:大部分RISC指令系统采用这种编码格式,降低译码复杂 度,提高译码速度。(ASCII)
哈夫曼编码的平均码长为:2.42位。 3-3-3扩展编码的平均码长为:2.52位。 2-7扩展编码的平均码长为:2.70位。
• 2.14 (补充题)模拟以下MIPS程序的单条指令运行方式,在表中用16进制 编码记录每一步产生的结果。
•
.data
• n: .word 3
;n和x是偏移地址
• x: .double 0.5
则 2.375 = 20 × 4% + (1 - 4%)X ,解出X = 1.640625 方案1: CPI1 = 3 × 4% + 1.640625 × (1 - 4%) = 1.695 方案2: CPI2 = 3 × 30% + 1.25 × (1 - 30%) = 1.775
结论: 方案1导致的新CPI更小,性能更好
T e
=
T o
(1
−
f) e
+
f e
S e
• 1.11 假设浮点数指令FP指令的比例为30%,其中浮点数平方根FPSQR 占全部指令的比例为4%,FP操作的CPI为5,FPSQR操作的CPI为20, 其他指令的平均CPI为1.25。
• 现有两种改进方案, 第一种:把FPSQR操作的CPI减至3 第二种:把所有的FP操作的CPI减至3 试比较两种方案对系统性能的提高程度。
计算机系统结构课后习题答案
计算机系统结构基本习题和答案填空题1、从(使用语言的)角度可以将系统看成是按(功能)划分的多个机器级组成的层次结构。
2、计算机系统结构的层次结构由高到低分别为(应用语言机器级,高级语言机器级,汇编语言机器级,操作系统机器级,传统机器语言机器级,微程序机器级)。
3、应用程序语言经(应用程序包)的(翻译)成高级语言程序。
4、高级语言程序经(编译程序)的(翻译)成汇编语言程序。
5、汇编语言程序经(汇编程序)的(翻译)成机器语言程序。
6、在操作系统机器级,一般用机器语言程序(解释)作业控制语句。
7、传统机器语言机器级,是用(微指令程序)来(解释)机器指令。
8、微指令由(硬件)直接执行。
9、在计算机系统结构的层次结构中,机器被定义为(能存储和执行相应语言程序的算法和数据结构)的集合体。
10、目前M0由(硬件)实现,M1用(微程序(固件))实现,M2到M5大多用(软件)实现。
以(软件)为主实现的机器成为虚拟机。
(虚拟机)不一定全用软件实现,有些操作也可用(固件或硬件)实现。
11、透明指的是(客观存在的事物或属性从某个角度看不到),它带来的好处是(简化某级的设计),带来的不利是(无法控制)。
12、计算机系统结构也称(计算机体系结构),指的是(传统机器级的系统结构)。
它是(软件和硬件/固件)的交界面,是机器语言汇编语言程序设计者或编译程序设计者看到的(机器物理系统)的抽象。
13、计算机组成指的是(计算机系统结构的逻辑实现),包括(机器级内的数据流和控制流)的组成及逻辑设计等。
计算机实现指的是(计算机组成的物理实现),它着眼于(器件)技术和(微组装)技术。
14、确定指令系统中是否要设乘法指令属于(计算机系统结构),乘法指令是用专门的高速乘法器实现还是用加法器实现属于(计算机组成),乘法器和加法-移位器的物理实现属于(计算机实现)。
15、主存容量与编址方式的确定属于(计算机系统结构),主存是否采用多体交叉属于(计算机组成),主存器件的选定属于(计算机实现)。
计算机组成与结构课后习题与解答第一章
第一章
问答题 1、解释下列术语 层次结构 计算机系统结构 计算机组成 计算 机实现 透明性 由上往下设计 由下往上设计 系列机 软件兼容 兼容机 模拟 仿真 虚拟机 宿主机 指令流 数据流 Amdahl定律 CPI MIPS MFLOPS
层次结构:计算机系统由硬件/器件和软件 组成,按功能划分成多级层次结构。从某 一层次的观察者看来,他只是通过该层次 的语言来了解和使用计算机,不必关心内 层的那些机器是如何工作和如何实现各自 功能的。
其中,R表示各种情况所占的比例。 根据加速比的计算公式,
4、如果某一计算任务用向量方式求解比用标 量方式求解要快20倍,称可用向量方式求 解部分所花费时间占总的时间的百分比为 可向量化百分比。请画出加速比与可向量 化比例两者关系的曲线。
设可向量化比例为Pvector,则加速比的计算 公式表示为:
计算机系统结构:作为计算机系统的软、硬 件的界面,主要研究软件、硬件功能分配 和对软件、硬件界面的确定,即哪些功能 由软件完成,哪些功能由硬件完成。
计算机组成:是计算机系统结构的逻辑实现,包括 机器内部的数据流和控制流的组成以及逻辑设计 等。
计算机实现:是指计算机组成的物理实现。它包括 处理机、主存等部件的物理结构,器件的集成度 和速度,信号传输,器件、模块、插件、底板的 划分与连接,专用器件的设计,电源、冷却、装 配等技术以及有关的制造技术和工艺等。
MIPS:它表示每秒百万指令条数。对于一个 给定的程序,MIPS 定义为:
MFLOPS:每秒百万次浮点操作次数,
2、想在系列中发展一种新型号机器,你认为下列哪些设想 是可以考虑的,哪些则是不行的?为什么? (1)新增加字符数据类型和若干条字符处理指令,以支 持事务处理程序的编译。 (2)为增强中断处理功能,将中断分析由原来的4级增加 到5级,并重新调整中断响应的优先次序。 (3)在CPU和主存之间增设Cache存贮器,以克服因主 存访问速率过低而造成的系统性能瓶颈。 (4)为解决计算误差较大,将机器中浮点数的下溢处理 方法由原来的恒置"1"法,改为增设用只读存贮器存放下 溢处理结果的查表舍入法。 (5)为增加寻址灵活性和减少平均指令字长,将原来全 部采用等长操作码的指令改成有3类不同码长的扩展操作 码;并将源操作数寻址方式由原来的操作码指明改成增加 一个如VAX-11那样的寻址方式位字段来指明。 (6)将CPU与主存之间的数据通路宽度由16位扩到32位, 以加快主机内部信息的传送。 (7)为了减少使用公用总线的冲突,将单总线改为双总 线。 (8)把原来的0号通用寄存器改作为专用的堆栈指示器。
计算机系统结构__《张晨曦、王志英》课后习题参考答案
计算机系统结构__《张晨曦、王志英》课后习题参考答案第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
计算机组成原理课后习题
计算机组成原理课后习题第1章计算机系统概述一、选择题1、CPU的组成中不包含 A 。
A.存储器 B.寄存器 C.控制器 D.运算器 2、电子计算机技术在半个世纪中虽有很大的进步,但至今其运行仍遵循着一位科学家提出的基本原理。
他就是 D 。
A.牛顿 B.爱因斯坦 C.爱迪生 D.冯・诺依曼 3、操作系统最先出现在 C 。
A.第1代计算机 B.第2代计算机 C.第3代计算机 D.第4代计算机 4、目前我们所说的个人台式商用机属于 D 。
A.巨型机 B.中型机 C.小型机 D.微型机 5、50多年来,计算机在提高速度、增加功能、缩小体积、降低成本和开拓应用等方面不断发展。
下面是有关计算机近期发展趋势的看法:①计算机的体积更小,甚至可以像钮扣一样大小。
②计算机的速度更快,每秒可以完成几十亿次基本运算。
③计算机的智能越来越高,它将不仅能听、能说,而且能取代人脑进行思考。
④计算机的价格会越来越便宜。
其中可能性不大的是 B 。
A.①和② B.③ C.①和③ D.④ 二、填空题。
1、第1代计算机的逻辑器件,采用的是电子管;第2代计算机的逻辑器件,采用的是晶体管;第3代计算机的逻辑部件,采用的是中、小规模集成电路;第4代计算机的逻辑部件,采用的是超大规模集成电路。
2、计算机的工作特点是速度快、通用性、准确性和逻辑性。
三、判断题。
1、利用大规模集成电路技术把计算机的运算部件和控制部件做在一块集成电路芯片上,这样的一块芯片叫做单片机。
(×) 2、兼容性是计算机的一个重要性能,通常是指向上兼容,即旧型号计算机的软件可以不加修改地在新型号计算机上运行。
系列机通常具有这种兼容性。
(×) 3、在微型计算机广阔的应用领域中,会计电算化属于科学计算方面的应用。
(×) 4、决定计算机计算精度的主要技术指标是计算机的字长。
(√) 5、计算机“运算速度”指标的含义是指每秒钟能执行多少条操作系统的命令。
(×)四、简答题一、按照冯若依曼原理,现代计算机应具备哪些功能1.输入/输入功能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、选择题系统多级层次中,从下层到上层,各级相对顺序正确的是(B )A 汇编语言机器级——操作系统机器级——高级语言机器级B 微程序机器级——传统机器语言机器级——汇编语言机器级C传统机器语言机器级——高级语言机器级——汇编语言机器级D汇编语言机器级——应用语言机器级——高级语言机器级2、汇编语言源程序变换成机器语言目标程序是经(D )来实现的。
A 编译程序解释B 汇编程序解释C 编译程序翻译D 汇编程序翻译3、对系统程序员不透明的应当是(D)A、CACHE存储器B、系列机各档不同的数据通路宽度C、指令缓冲寄存器D、虚拟存储器4、计算机系统结构不包括(A)A、主存速度B、机器工作状态C、信息保护D、数据表示5、系列机软件应做到(B )A 向前兼容,并向上兼容B 向后兼容,力争向上兼容C 向前兼容,并向下兼容D 向后兼容,力争向下兼容6、在计算机系统设计中,比较好的方法是(D)。
A、从上向下设计B、从下向上设计C、从两头向中间设计D、从中间开始向上、向下设计7、软件和硬件在实质上是完全不同的,但他们在( B)上是逻辑等价的。
A 性能B 功能C 系统结构D 价格8、在相同的机器字长和尾数位数的情况下,浮点数尾数基值取小,可使浮点数(B )A.运算过程中数的精度损失降低B.数在数轴上的分布变密C.可表示数的范围增大D.可表示数的个数增多9、浮点数尾数基值rm=8,尾数数值部分长6位,可表示的最小正尾数为(C )A.0.5 B. 0. 25 C. 0.125 D.1/6410、在尾数下溢处理方法中,平均误差最大的是(A )A.截断法 B. 舍入法C.恒置“1”法 D. ROM查表法11、IBM370系统中断响应优先级级别最低的是(D )A.机器校验中断 B. 外中断C.I/O中断 D. 重新启动中断12、不属于堆栈型替换算法的是(C )A.近期最少使用法 B.近期最久未用法C.先进先出法 D.页面失效频率法13、下列关于虚拟存贮器的说法,比较正确的应当是(D )A.访主存命中率随页面大小增大而提高B.访主存命中率随页面容量增加而提高C.更换替换算法能提高命中率D.在主存命中率低时,改用堆栈型替换算法,并增大主存容量,可提高命中率14、采用组相联映像的Cache存贮器,为提高其等效访问速度应(B )A.增大主存容量(Cache大小不变)B.增加Cache块数(块大小不变)C.减小组的大小(块大小不变)D.减小块的大小(组的大小不变)15、浮点数尾数基值rm=16,除尾符之外的尾数机器位数为8位时,可表示的规格化最大正尾数为(D )A.1/2 B. 15/16 C. 1/256 D. 255/25616、总线控制机构为解决N个部件使用总线时有限次序的裁决,集中式定时查询,需另外增加控制线根数为(C )log┐ D. N+2A.3 B. 2N+1 C. 2+┌N217、计算机组成设计不考虑( B )A.专用部件设置 B.功能部件的集成度C.控制机构的组成 D.缓冲技术18、属计算机系统结构考虑的应是(C )A.主存采用MOS还是TTL B.主存采用多体交叉还是单体C.主存容量和编址方式 D.主存频宽的确定19、与全相联相比,组相联映象的优点是(A )A 目录表小B 块冲突概率低C 命中率高D 主存利用率高20、同时性指两个或多个事件在同一时刻发生,并发性指两个或多个事件在(A)发生。
A、同一时间间隔B、同一时刻C、不同时刻D、不同时间间隔21、打印机适合连接到(B)A、选择通道B、字节多路通道C、数组多路通道D、任意一种通道22、与流水线最大吞吐率高低有关的是( C)A 各个子过程的时间B 最快子过程的时间C 最慢子过程的时间D 最后子过程的时间23、ILLIAC IV是一种(C)A、流水线处理机 B 指令重叠处理机 C 阵列处理机 D 多处理机24、BSP处理机属于(B )A、SISD系统B、SIMD系统 C 、MISD系统D、MIMD系统二、填空题1、实现软件移植的主要途径有统一高级语言、系列机、模拟和仿真。
2、操作级并行的阵列机,按指令流和数据流的多倍性划分属于SIMD类型的计算机。
3、自定义数据表示又可分为带标志符数据表示和数据描述符两类。
4、传统机器级所具有的属性是高级语言程序员所( 看不见)的,即对高级语言程序员是(透明)的。
5、标志符与每个数据相连,合存于同一存储单元,用于描述____单个数据__ 的类型特征6、计算机仿真用微程序解释,计算机模拟用__机器语言_______ 解释。
7、评价存储器性能的基本要求是大容量、高速度和低价格。
8、程序的局部性包括空间上的局部性和时间上的局部性9、输入输出控制器的管理方式有三种:程序控制I/O 、直接存储器访问DMA 和I/O处理机方式10、输入输出系统包括输入输出设备、设备控制器及与输入输出操作有关的软、硬件。
11、非专用总线控制方式中确定优先序可有串行链接、定时查询和独立请求等三种方式。
12、数据表示指能由机器硬件直接识别和引用的数据类型。
数据结构要通过软件映像变幻成机器中的各种数据表示来实现。
13、研究流水线调度主要针对非线性流水线14、异步流动流水线会出现顺序流动流水线不可能发生的“写-写”相关和“先读后写”相关。
15、向量机中对向量的各种运算常用的加工方式为横向加工、纵向加工和纵横向加工。
16、8个节点的混洗网络,其混洗函数为Shuffle(P2P1P0)= p0p1p2三、判断题(对的用R,错的用E)1、系统是否设浮点运算指令,对计算机系统结构是透明的。
(×)2、对概率不等的事件用Huffman编码,其具体编码不唯一,但平均码长肯定是唯一的,且是最短的。
(√)3、开发并行性的资源重复计数途径是开发时间的并行性,也是提高系统可靠性的有效措施。
(×)4、哈夫曼编码或扩展操作码,只要短码不是长码的前缀,就能够保证唯一地解码和立即解码。
(√)5、计算机仿真不适合在两种结构差距大的计算机运用(√)6、定时查询和独立请求均可用软件方法动态改变总线分配的优先级。
(√)7、SIMD 计算机的结构是指有n 个处理单元,按n 条不同指令的要求对多个数据流及其中间结果进行不同的处理,一个处理单元的输出作为另一个处理单元的输人。
(×)8、由于Cache 存储器的地址变换和块替换算法是用软件实现的,因此Cache 存储器对应用程序员是透明的,而且Cache 对处理机和主存间的信息交往也是透明的。
(×)9、在总线中,若按功能和传送方向实施线的组合能减少所需的线数,如性质相似、方向相反且不同时发生的两根单向线,可以用一根全双向线代替。
(×)10、中断系统的软、硬件功能分配,实际上是中断处理的软件和中断处理的硬件的功能分配。
(√)11、指令的重叠解释,既可加快程序的解释,又能加快指令的解释。
(×)12、要使线性流水线的实际吞吐率接近于理想的最大吞吐率,应将子过程数分得越多越好。
(×)13、流水机器处理中断应着眼于解决断点现场如何保存和恢复,并不在于如何缩短断流的时间,去追求流水的高吞吐率和高效率。
(√)14、组相联映像的cache存储器共分为256组,每组4块,用完全的比较对法实现cache块替换,替换算法为LRU,cache存储器总共需要设置的比较对触发器个数为1024个。
(×)15、多处理机中,两个程序段之间若同时有先写后读和先读后写二种相关,以交换数据为目的时,则必须并行执行,读写要完全同步,允许顺序串行和交换串行。
(×)四、简答题1、试以实例简要说明计算机系统结构,计算机组成,与计算机实现的相互关系与影响.P6结构相同,可用不同的组成。
如系列机中不同型号的机器结构相同,但高档机往往采用重叠流水等技术;组成相同,实现可不同。
如主存可用双极型,也可用MOS型等;结构不同组成不同,组成的进步会促进结构的进步,如微程序控制;结构的设计应结合应用和可能采用的组成。
组成上面决定于结构,下面受限于实现;组成与实现的权衡取决于性价比等,结构、组成、实现的内容不同时期会不同。
2、通道分为那3种类型?各适合连接什么类型的设备?满负荷时,设备对通道要求的实际流量与所连设备有什么关系?答案:通道分字节多路、数组多路、选择3类通道。
宇节多路通道适合于连接大量低速的字符设备。
满负荷时,设备对通道要求的实际流量应是所连各设备的流量之和。
数组多路通道适合于连接高速的设备。
满负荷时,设备对通道要求的实际流量应是所连各设备中,流量最大的那个。
选择通道适合于连接中、高速的高优先级的设备。
满负荷时,设备对通道要求的实际流量应是所连各设备中,流量最大的那个。
3、提高计算机系统并行性的技术途径有哪三个?简要解释并各举一系统类型的例子。
有时间重叠、资源重复、资源共享等三个途径。
时间重叠是让多个处理过程在实践上相互错开,轮流使用统一硬件设备的各个处理部分,以加快执行速度的方法。
如流水线处理机CRAY-1。
资源重复是通过重复设置硬件资源来提高性能。
如阵列处理机ILLIAC-Ⅳ。
资源共享是利用软件方法让多个用户共享同一套资源,来提高资源利用率和系统性能的。
如多道程序分时系统、多处理机、分布处理系统、计算机网等。
4、什么是流水线的速度瓶颈?消除流水线速度瓶颈的方法有哪两种?举例示意说明。
一个由若干段组成的流水线,在达到稳定状态后所获得的吞吐率与其中延迟最大的那一段长度有关,这一段就成为影响流水线速度的瓶颈。
消除流水线速度瓶颈的方法主要有两种:(1)尽量采取将瓶颈子过程再细分,使之接近于流水线其他段的工作速度。
(2)将多个瓶颈子过程并联。
5、简述SIMD阵列机的主要特征。
P208五、应用题1、N= —1.5,它的单精度格式表示为什么?2、有一个页式虚拟存贮器,若分配给该道程序的主存有3页,采用LRU替换算法表示这3页的使用和替换过程。
已知它在运行过程中访问程序空间的页地址流为: 2,3,2,1,5,2,4,5,3,2,5,2(p156)3、有一个Cache存储器。
主存共分8个块(0~7),Cache为4个块(0~3),采用组相联映象,组内块数为2块,替换算法为近期最少使用算法(LRU)。
(1)画出主存、Cache地址的各字段对应关系(标出位数)图;(2)画出主存、Cache空间块的映象对应关系示意图;(3)对于如下主存块地址流:1,2,4,1,3,7,0,1,2,5,4,6,4,7,2,如主存中内容一开始未装入Cache中,请列出Cache中各块随时间的使用状况;(4)对于(3),指出块失效又发生块争用的时刻;(5)对于(3),求出此期间Cache的命中率。
(P158)4、中断级屏蔽位“1”对应于开放,“0”对应于屏蔽,各级中断处理程序的中断级屏蔽位设置如下:(1)当中断响应优先次序为1→2→3→4时,其中断处理次序是什么?(2)如果所有的中断处理都各需3个单位时间,中断响应和中断返回时间相对中断处理时间少得多。