郑纬民版计算机系统结构答案

合集下载

计算机系统结构课后习题答案

计算机系统结构课后习题答案

计算机系统结构课后习题答案计算机系统结构课后习题答案计算机系统结构是计算机科学与技术领域中的一门重要课程,它主要研究计算机硬件和软件之间的关系,以及计算机系统的组成和工作原理。

在学习这门课程的过程中,我们经常会遇到一些习题,下面我将为大家提供一些计算机系统结构课后习题的答案,希望对大家的学习有所帮助。

1. 什么是计算机系统结构?计算机系统结构是指计算机硬件和软件之间的关系,以及计算机系统的组成和工作原理。

它包括计算机的组成部分、数据的存储和传输方式、指令的执行过程等内容。

2. 计算机系统结构有哪些主要组成部分?计算机系统结构主要包括中央处理器(CPU)、存储器、输入输出设备和总线等组成部分。

其中,中央处理器负责执行计算机指令,存储器用于存储程序和数据,输入输出设备用于与外部环境进行信息交换,而总线则负责连接各个组件。

3. 什么是指令集架构?指令集架构是计算机系统结构中的一个重要概念,它描述了计算机硬件支持的指令集和指令的执行方式。

常见的指令集架构有精简指令集(RISC)和复杂指令集(CISC)两种。

4. 什么是冯·诺依曼体系结构?冯·诺依曼体系结构是计算机系统结构的一种经典模型,它由冯·诺依曼于1945年提出。

冯·诺依曼体系结构的特点是将存储器和处理器分开,通过总线进行数据传输,程序和数据以二进制形式存储在存储器中,按照顺序执行。

5. 什么是存储器层次结构?存储器层次结构是计算机系统结构中的一个重要概念,它描述了计算机系统中不同层次的存储器之间的关系。

存储器层次结构一般由高速缓存、主存和辅助存储器等多级存储器组成,不同级别的存储器速度和容量各不相同。

6. 什么是流水线技术?流水线技术是一种提高计算机指令执行效率的方法,它将指令执行过程划分为多个子任务,并通过流水线的方式进行并行处理。

流水线技术可以提高指令的吞吐量,但也会引入一定的延迟。

7. 什么是指令级并行?指令级并行是一种提高计算机指令执行效率的方法,它通过同时执行多条指令来提高指令的吞吐量。

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。

高阶交错存储器具有扩展方便、存取效率低的优点。

低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。

(2)各种存储器的带宽与其工作频率有关。

不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。

(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。

3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。

高阶交错存储器具有扩展方便、存取效率低的优点。

低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。

(2)各种存储器的带宽与其工作频率有关。

不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。

(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。

3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。

计算机系统结构课后习题答案

计算机系统结构课后习题答案

计算机系统结构课后习题答案文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]第1章计算机系统结构的基本概念解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

计算机系统结构习题答案(郑伟民)

计算机系统结构习题答案(郑伟民)

第一章重点:1. P2 1.1.1计算机系统层次结构(1.1.2透明性概念)2. P9 1.2.1计算机系统设计的定量原理(Amdahl law及CPU性能公式)3. P22 1.4.1 Von Neumann结构(模拟与仿真)1.习题题1.5 硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。

[解答] 硬件和软件在逻辑功能上是等效的。

在原理上,用软件实现的功能完全可以用硬件或固件(微程序解释)来完成。

用硬件实现的功能也可以通过用软件进行模拟来完成,只是反映在速度、价格、实现的难易程度上,这两者是不同的。

例如,编译程序、操作系统等许多用机器语言软件子程序实现的功能完全可以用组合电路硬件或微程序固件来解释实现。

它们的差别只是软件实现的速度慢,软件的编制复杂,编程工作量大,程序所占的存贮空间量较多,这些都是不利的;但是,这样所花硬件少,硬件实现上也就因此而简单容易,硬件的成本低,解题的灵活性和适应性较好,这些都是有利的。

又如,乘除法运算可以经机器专门设计的乘法指令用硬件电路或乘除部件来实现,也可以通过执行一个使用相加、移位、比较、循环等机器指令组成的机器语言子程序来实现。

向量、数组运算在向量处理机中是直接使用向量、数组类指令和流水或阵列等向量运算部件的硬件方式来实现,但在标量处理机上也可以通过执行用标量指令组成的循环程序的软件方式来完成。

浮点数运算可以直接通过设置浮点运算指令用硬件来实现,也可以用两个定点数分别表示浮点数的阶码和尾数,通过程序方法把浮点数阶码和尾数的运算映象变换成两个定点数的运算,用于程序软的方式来实现。

十进制数的运算可以通过专门设置十进制运算类指令和专门的十进制运算部件硬的方式来完成,或者通过设置BCD数的表示和若干BCD数运算的校正指令来软硬结合地实现,也可以先经10转2的数制转换子程序将十进制数转成二进制数,再用二进制运算类指令运算,所得结果又调用2转10的数制转换子程序转换成十进制数结果,用全软的方式实现。

郑纬民版计算机系统结构答案

郑纬民版计算机系统结构答案

1.17
Sn
1 0.1 0.9 5

5 3.57 1.4
1.18 记 f ── 时钟频率,T=1/f ── 时钟周期,B ── 带宽(Byte/s) 。
1 4 4 f ( Byte / s) T 75% 2 25% 1 方案二: B2 4 3.5 f ( Byte / s) 2T
3.5 已知 K n

1 (1 g ) n g
,其中 g=0.1
依题意有 K n 1
1 (1 g ) n1 1 (1 g ) n K n 0.2 0.2 g g
4
整理得 0.9 ≥0.2,解出 n
n

lg 0.2 15.28 ,向下取整,得 15; lg 0.9
-52 -23
(2) Nmax = 1.7×10 ,-|N|min = -1.47×10 δ ≤ 5.96×10 2.6 (1) 0.2 = 0.333333H×16
0 6 -8
38
-39
≈ 10
-7.22
,η = 100%
设阶码为移-63 码(即-2 +1,原题未指明) 0.2 = 0.110011001100110011001101B×2 (其中最高有效位需隐藏) 阶码为移-127 码(即-2 +1)
平均码长 L 信息冗余量 R 2.15 (1) 15 条/63 条/64 条 (2) 14 条/126 条/128 条
第三章(P202) 3.3 直接代公式计算存储层次性能指标。 (1)74ns,38ns,23.6ns (2)0.258,0.315,0.424 (3)T256K < T128K < T64K c256K > c128K > c64K (4)19.092,11.97,10.0064。答案是 256K 方案最优。

计算机系统结构课后习题答案

计算机系统结构课后习题答案

第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序.把计算机系统按功能划分成多级层次结构.每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级.传统机器语言机器级.汇编语言机器级.高级语言机器级.应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序.然后再在这低一级机器上运行.实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令.都是转去执行低一级机器上的一段等效程序。

执行完后.再去高一级机器取下一条语句或指令.再进行解释执行.如此反复.直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性.即概念性结构与功能特性。

在计算机技术中.把这种本来存在的事物或属性.但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现.包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现.包括处理机、主存等部件的物理结构.器件的集成度和速度.模块、插件、底板的划分与连接.信号传输.电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时.改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后.所能获得的整个系统性能的提高.受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的.而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序.用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中.机器一旦启动.就能按照程序指定的逻辑顺序执行这些程序.自动完成由程序所描述的处理工作。

系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

清华大学郑纬民老师的计算机体系结构chpt9

清华大学郑纬民老师的计算机体系结构chpt9

PDF 文件使用 "FinePrint pdfFactory Pro" 试用版本创建
9.3 多处理机实例
(3) MPP (massively parallel processing)大 规模并行处理机 如Intel Paragon, CM-5, Cray T3D (4) Cluster 机群系统(NOW或COM) 9.3.1 大规模并行处理机(MPP) 9.3.2 对称多处理机(SMP) 9.3.3 机群系统(Cluster)
PDF 文件使用 "FinePrint pdfFactory Pro" 试用版本创建
9.3 多处理机实例
多处理机系统主要有四大类: (1) 多向量处理机系统: 如CRAY YMP-90, NEC SX-3 和FUJITSU VP-2000 (2) SMP (Symmetry MultiProcessors)对称 多处理机; SMP (Shared Memory MulptiProcessors)共享存储多处理机 如SGI Challenge Sun SparcCenter 2000
9.2 多处理机性能模型
引起峰值性能下降的原因是: (1) 因处理机间通信而产生的延迟 (2) 一台处理机与其它处理机同步 所需的开销 (3) 当没有足够多任务时,一台或 多台处理机处于空闲状态 (4) 由于一台或多台处理机执行无 用的工作 (5) 系统控制和操作调度所需开销
PDF 文件使用 "FinePrint pdfFactory Pro" 试用版本创建
PDF 文件使用 "FinePrint pdfFactory Pro" 试用版本创建
CPU MAP
CPU MAP

计算机系统结构(课后习题答案)

计算机系统结构(课后习题答案)

第一章计算机系统结构的基本概念1.有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。

现若需第i级的N 条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks。

第3级上等效程序需运行:(N/M)*(N/M)*Ks。

第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。

note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。

而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。

所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。

答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。

但是实现的性能价格比,实现的难易程序不同。

在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件。

3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。

答:计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。

(1)计算机的系统结构相同,但可采用不同的组成。

如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。

从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。

其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。

计算机系统结构课后习题答案)

计算机系统结构课后习题答案)

第一章计算机系统结构的基本概念1.有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。

现若需第i级的N条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks。

第3级上等效程序需运行:(N/M)*(N/M)*Ks。

第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。

note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。

而现在第i级有N 条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。

所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。

答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。

但是实现的性能价格比,实现的难易程序不同。

在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件。

3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。

答:计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。

(1)计算机的系统结构相同,但可采用不同的组成。

如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。

从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。

其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。

计算机系统结构课后答案

计算机系统结构课后答案

第1章部分习题参考答案1.1 解释下列术语⏹翻译:先用转换程序将上一级机器级上的程序整个地变换成下一级机器级上可运行的等效程序,然后再在下一级机器级上去实现的技术。

⏹解释:在下一级机器级上用它的一串语句或指令来仿真上一级机器级上的一条语句或指令的功能,通过对上一级机器语言程序中的每条语句或指令逐条解释来实现的技术。

⏹层次结构:将计算机系统由上往下依次划分为应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器级和微程序机器级。

对于一个具体的计算机系统,层次的多少会有所不同。

⏹计算机系统结构:传统机器级的程序员所看到计算机的基本属性,即计算机的概念性结构和功能特性。

简称为计算机的外特性。

⏹计算机组成:计算机系统结构的逻辑实现,也常称为计算机组织。

该组织包括机器级内的数据流和控制流的组成以及逻辑设计等。

⏹计算机实现:计算机组成的物理实现。

它包括处理机、主存等部件的物理结构,器件的集成度、速度和信号,器件、模块、插件、底板的划分与连接,专用器件的设计,电源、冷却、装配等技术。

⏹透明性:本来存在的事物或属性,但从某个角度看似乎不存在,称为透明性现象。

⏹固件:是一种具有软件功能的硬件。

如将软件固化在ROM中,就是一种固件。

⏹由上往下设计:先考虑如何满足应用要求,确定好面对使用者那级机器应有什么基本功能和特性,然后再逐级往下设计,每级都考虑怎样优化上一级实现。

这种方法适合于专用机设计。

⏹由下往上设计:根据现有的部件,并参照或吸收已有各种机器的特点,先设计出微程序机器级(如果采用微程序控制)及传统机器级,然后再为不同应用配置多种操作系统和编译系统软件,采用合适的算法来满足相应的应用。

这是20世纪60-70年代前常用的通用机设计思路。

⏹系列机:同一厂家生产的具有相同系统结构,但具有不同组成和实现的一系列的机器。

⏹软件兼容:同一软件可以不加修改地运行于系统结构相同的不同档次的机器上,而且它们所获得的结果一样,差别只是运行时间不同。

计算机系统结构课后习题答案(老师划过重点得)

计算机系统结构课后习题答案(老师划过重点得)

第1章计算机系统结构的基本概念1.1 解释下列术语层次结构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

计算机系统结构课后习题答案

计算机系统结构课后习题答案

第一章计算机系统结构的基本概念1.有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。

现若需第i级的N条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答: ????第2级上等效程序需运行:(N/M)*Ks。

第3级上等效程序需运行:(N/M)*(N/M)*Ks。

第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。

note: ????由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。

而现在第i级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。

所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。

答:?软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。

但是实现的性能价格比,实现的难易程序不同。

????在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件。

3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。

答: ?计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。

????(1)计算机的系统结构相同,但可采用不同的组成。

如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。

从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。

其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1
第一章(P33) 1.7 (1)从指定角度来看,不必要了解的知识称为透明性概念。 (2)见下表, “√”为透明性概念, “P”表示相关课文页数。 模 m 交叉,√, 总线宽度,√, 单总线,√, 指令控制方式,√, Cache 存储器,√, 浮点数据,×,P4 阵列运算部件,×, 访问保护,×, 堆栈指令,×, 通道与 I/O 处理机,×,P4 结合型与独立型通道,√, 中断,×, 最小编址单位,×,
7 -2
1位 0
7位 0111111
6位 333333
1位 0
8位 01111101
23 位 10011001100110011001101
(2) 符号位不变, (阶码 – 63)×4 + 127;尾数左规,除去最高位; (3) 符号位不变, (阶码 – 127)/ 4 + 63;尾数补最高位,按除法余数右移若干位,左补 0。 2.13 已知 10 条指令使用频度,求 3 种编码方法的平均码长与信息冗余量。 (1)此问中的“最优 Huffman 编码法”实际是指码长下限,即信源的平均信息量──熵,代公式得 H=2.9566。 (2)Huffman 编码性能如下表; (3)2/8 扩展编码是 8/64/512 法的变种,第一组 2 条指令,码长为 2(1 位扩展标志,1 位编码),第二组 8 条指令,码长为 4(1 位 扩展标志,与第一组区别,加 3 位编码) ,编码性能如下表; (4)3/7 扩展编码是 15/15/15 法的变种,第一组 3 条指令,码长为 2(共有 4 种组合,其中 3 种组合分别代表 3 条指令,留 1 种组 合作为扩展前缀标志),第二组 7 条指令,码长为 5(2 位固定的前缀扩展标志,与第一组区别,加 3 位编码,只用其中 7 种组合) , 编码性能如下表。 Huffman 编码 2.99 1.10% 2/8 扩展编码 3.1 4.61% 3/7 扩展编码 3.2 7.59%
方案一: B1

2
1.19 由各种指令条数可以得到总条数,以及各百分比,然后代公式计算。
IC ICi 10 5
i 1
4
(1) CPI
(CPI i
i 1
4
ICi ) 1 0.45 2 0.32 2 0.15 2 0.08 1.55 IC
平均码长 L 信息冗余量 R 2.15 (1) 15 条/63 条/64 条 (2) 14 条/126 条/128 条
第三章(P202) 3.3 直接代公式计算存储层次性能指标。 (1)74ns,38ns,23.6ns (2)0.258,0.315,0.424 (3)T256K < T128K < T64K c256K > c128K > c64K (4)19.092,11.97,10.0064。答案是 256K 方案最优。

√ √

√ √
0 0 2 4
5
P2 =
1 1
2 2 1
3 3 2 1
4 4 3 2 1
2 2 4 3 1
2 2 4 3 1 √ √ √ √
3 3 2 4 1
3 3 2 4 1 √ √ √ √
命中次数 N(2)
n2= 1 n2= 2 n2= 3 n2= 4 将两图结果综合,得到 4 个分配方案的命中率情况表如下 6 1 2 3 4 n1 5 0 0 2 4 N(1) 4 3 4 3 2 1 n2 2 4 4 2 2 N(2) 1 1+4 4 4 4 6 N(1)+N(2) 2; (2)命中次数之和最大的方案是 n1= 4 而 n2= 1。 3.19 中(3)(4)(6)(8)问 (3)
1.8 见下表, “√”为透明性概念, “P”表示相关课文页数。 指令地址寄存器,×, 条件码寄存器,×, 磁盘,×, 通用寄存器 ,×, 指令缓冲器,√, 乘法器,√, 先行进位链,√, 中断字寄存器,×, 时标发生器,√, 主存地址寄存器,√, 移位器,√,
1.9 见下表, “√”表示都透明, “应”表示仅对应用程序员透明, “×”表示都不透明。 数据通路宽度,√, 程序状态字,×, 指令缓冲寄存器,√, 虚拟存储器,应, “启动 I/O”指令,应, Cache 存储器,√, “执行”指令,×,
(1)用硬件组方法,已知 Se=40,Fe=0.7,解出 Sn=40/12.7≈3.1496(两种方法得到的相同性能) (2)用软件组方法,已知 Se=20,Sn=40/12.7,解出 Fe=27.3/38≈0.7184(第二种方法的百分比) (3)结论:软件组方法更好。因为硬件组需要将 Se 再提高 100%(20→40) ,而软件组只需将 Fe 再提高 1.84%(0.7→0.7184) 。
1.17
Sn
1 0.1 0.9 5

5 3.57 1.4
1.18 记 f ── 时钟频率,T=1/f ── 时钟周期,B ── 带宽(Byte/s) 。
1 4 4 f ( Byte / s) T 75% 2 25% 1 方案二: B2 4 3.5 f ( Byte / s) 2T
按另一种题意理解是向上取整,得 16,也对。 3.15 欲知可能的最高命中率及所需的最少主存页数,较好的办法是通过“堆栈模拟法” ,求得命中次数随主存页数变化的函数关系。 下图就是“堆栈模拟图” ,其中“√”表示命中。 P= 4 4 5 5 4 3 3 5 4 2 2 3 5 4 5 5 2 3 4 1 1 5 2 3 4 3 3 1 5 2 4 2 2 3 1 5 4 3 3 2 1 5 4 5 5 3 2 1 4 1 1 5 3 2 4 3 3 1 5 2 4 命中次数
《计算机系统结构》习题解答
目录 第一章(P33) 1.7-1.9(透明性概念) ,1.12-1.18(Amdahl 定律) ,1.19、1.21、1.24(CPI/MIPS) 第二章(P124) 2.3、2.5、2.6(浮点数性能) ,2.13、2.15(指令编码) 第三章(P202) 3.3(存储层次性能) ,3.5(并行主存系统) ,3.15-3.15 加 1 题(堆栈模拟) ,3.19 中(3)(4)(6)(8)问(地址映象/替换算法--实存 状况图) 第四章(P250) 4.5(中断屏蔽字表/中断过程示意图) ,4.8(通道流量计算/通道时间图) 第五章(P343) 5.9(流水线性能/时空图) ,5.15(2 种调度算法) 第六章(P391) 6.6(向量流水时间计算) ,6.10(Amdahl 定律/MFLOPS) 第七章(P446) 7.3、7.29(互连函数计算) ,7.6-7.14(互连网性质) ,7.4、7.5、7.26(多级网寻径算法) ,7.27(寻径/选播算法) 第八章(P498) 8.12(SISD/SIMD 算法) 第九章(P562) 9.18(SISD/多功能部件/SIMD/MIMD 算法) (注:每章可选 1-2 个主要知识点,每个知识点可只选 1 题。有下划线者为推荐的主要知识点。)
第二章(P124) 2.3(忽略 P124 倒 1 行 ~ P125 第 8 行文字,以简化题意)已知 2 种浮点数,求性能指标。 此题关键是分析阶码、尾数各自的最大值、最小值。 原图为数据在内存中的格式,阶码的小数点在其右端,尾数的小数点在其左端,遵守规格化要求。 由于尾数均为原码,原码的绝对值与符号位无关,所以最大正数与最小负数的绝对值相同,可用“±最大绝对值”回答;最小正 数与最大负数的绝对值相同,可用“±最小绝对值”回答。 第 1 小问中,阶码全部位数为 8,作无符号数看待真值为 0~255,作移-127 码看待真值为-127~+128;尾数(不计符号位)有 23 位小数,另加 1 位整数隐藏位,所以尾数绝对值为 1.0~2.0 – 2 ,有效位数 p=24; 第 2 小问中,阶码全部位数为 11,作无符号数看待真值为 0~2047,作移-1023 码看待真值为-1023~+1024;尾数(不计符号位) 有 52 位小数,另加 1 位整数隐藏位,所以尾数绝对值为 1.0~2.0 – 2 ,有效位数 p=53。 最大绝对值为最大阶码与最大尾数绝对值的组合,最小绝对值为最小阶码与最小尾数绝对值的组合。代入相关公式后得最终结果 如下表。 ±最大绝对值 ±最小绝对值 表数精度δ 表数效率η 2.5 (1) rm = 2,re = 2,p = 24(隐藏最高位),q = 7。 3 32 位 -24 129 ±(1-2 )·2 -127 ±2 -24 2 100% 64 位 -53 1025 ±(1-2 )·2 -1023 ±2 -53 2 100%
1.12 已知 Se=20 , 求作 Fe-Sn 关系曲线。 将 Se 代入 Amdahl 定律得
Sn 20
Sn
1 19 1 Fe 20
1 0 1 Fe
1.13 上式中令 Sn=2,解出 Fe=10/19≈0.526 1.14 上式中令 Sn=10,解出 Fe=18/19≈0.947 1.15 已知两种方法可使性能得到相同的提高,问哪一种方法更好。
(2) MIPS
ቤተ መጻሕፍቲ ባይዱ

f 40 10 6 17.86 CPI 10 6 2.24 10 6
1.24 记 Tc ── 新方案时钟周期,已知 CPI = CPIi = 1 原时间 = CPI × IC × 0.95Tc = 0.95IC×Tc 新时间 = (0.3×2/3+0.7)× IC × Tc = 0.9IC×Tc 二者比较,新时间较短。
(2) MIPS

f 40 10 6 40 25.806 6 6 1.55 CPI 10 1.55 10
(3) T

IC 1.55 0.003876 (秒) 6 400 MIPS 10
1.21 (1) CPI
1 0.6 2 0.18 4 0.12 8 0.1 2.24
相关文档
最新文档