计算机系统结构三四章作业及答案

合集下载

(完整版)计算机系统结构课后习题答案

(完整版)计算机系统结构课后习题答案

第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

计算机系统结构第3章部分习题参考答案

计算机系统结构第3章部分习题参考答案

第3章 部分习题参考答案3.2 (题目略)【解】overlap o i cpu T T T T -+=/,其中T overlap 的最大值为T cup 。

由题意可得当CPU 速度提高4倍后,T =30/4+20-30/4=20(s)。

(注:T overlap 为CPU 和I/O 重叠执行的时间)3.7 (题目略)【解】(1)处理机响应各中断源的中断请求的先后次序与它们的中断优先级一样:D 1D 2D 3D 4D 5;实际的中断处理次序为:D 1D 2D 3D 4D 5。

(2)处理机响应各中断源的中断请求的先后次序与它们的中断优先级一样:D 1D 2D 3D 4D 5;实际的中断处理次序为: D 4D 5 D 3 D 2D 1。

(3)处理机响应各中断源的中断服务请求和实际运行中断服务程序过程的示意图如下:(4)处理机响应各中断源的中断服务请求和实际运行中断服务程序过程的示意图如下:3.9 (题目略)【解】字节多路通道适用于连接大量像光电机等字符类低速设备。

这些设备传送一个字中断请求D 3,D 4,D 5时间tD 1, D 2 中断请求主程序中断服务程序 D 1,D 2,D 3,D 4,D 5 时间t符(字节)的时间很短,但字符(字节)间的等待时间很长。

通道“数据宽度”为单字节,以字节交叉方式轮流为多台设备服务,使效率提高。

字节多路通道可有多个子通道,同时执行多个通道程序。

数组多路通道适合于连接多台像磁盘等高速设备。

这些设备的传送速率很高,但传送开始前的寻址辅助操作时间很长。

通道“数据宽度”为定长块,多台设备以成组交叉方式工作,以充分利用并尽量重叠各台高速设备的辅助操作时间。

传送完K个字节数据,就重新选择下个设备。

数组多路通道可有多个子通道,同时执行多个通道程序。

选择通道适合于连接像磁盘等优先级高的高速设备,让它独占通道,只能执行一道通道程序。

通道“数据宽度”为可变长块,一次将N个字节全部传送完,在数据传送期只选择一次设备。

(完整版)计算机系统结构课后习题答案

(完整版)计算机系统结构课后习题答案

第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

计算机体系结构三四章作业

计算机体系结构三四章作业

1. 三种通过软件(编译器)来减少分支延迟的方法为()、()、()1.预测分支失败2.预测分支成果3.延迟分支2.消除流水线的瓶颈段的方法有()和()2种。

1.细分瓶颈段2.重复设置瓶颈段3. 衡量流水线的主要性能指标是()、()和()。

N段不等长的流水线中,其结果的输出速度取决于处理时间()的子过程1.吞吐率2.加速比3.效率4.时间最长4. 流水线中的冲突主要分为以下3种类型:()、()和(),其中数据冲突又分为如下3类:()、()和()。

1.结构冲突2.数据冲突3.控制冲突:(1)写后读RAW冲突(2)写后写WAW冲突(3)读后写WAR冲突5. 相关有三种类型,即(),()和()。

其中()相关还包括输出相关和反相关两种。

1.数据相关2.名相关3.控制相关4.名相关6. 简述流水寄存器的作用。

流水寄存器的作用:1.将各段的工作隔开,使得他们不会相互干扰。

流水寄存器是边沿触发写入的,这点非常重要。

2.保存相应段的处理过程。

3.向后传递后面段将会用的数据和控制信息。

选择题:1. 与线性流水线最大吞吐率有关的是()(2.0分)A.第一个功能段的执行时间B.最快那一段的执行时间C.最慢那一段的执行时间D.最后的功能段的执行时间2. 以下哪种方法不能用于解决数据冲突()。

(2.0分)A.链接技术B.定向技术C.流水线互锁机制D.编译器指令调度3. 非线性流水线的特征是()。

(2.0分)A.一次运算中使用流水线中的多个段B.一次运算中要多次使用流水线中的某些功能段C.流水线的各个功能段在不同运算中可以有不同的连接D.流水线中某些功能段在各次运算中的作用不同4. 评价流水线的性能指标是()。

(2.0分)A.吞吐率、流水线的加速比和执行程序所需要的时钟周期数B.吞吐率、流水线的加速比和所执行的指令条数C.吞吐率、流水线的加速比和CPID.吞吐率、流水线的加速比和效率5. 寄存器换名技术可以减少如下冲突带来的暂停:()(2.0分)A.读后写冲突;B.结构冲突;C.写后读相关;D.控制相关。

计算机系统结构_第三章练习 答案

计算机系统结构_第三章练习 答案

第三章练习题(1)一、单项选择题在下面各题的4个备选答案中,只有一个答案是正确的,请把正确答案的标号(A~D)填入题后面的括号中。

1.程序员编写程序时使用的访存地址是()。

A.物理地址B.有效地址C.逻辑地址D.主存地址2.虚拟存储器通常采用的地址映像是(D )。

A.全相联、组相联和直接映像B.直接映像C.组相联映像D.全相联映像3.不属于堆栈型替换算法是()。

A.近期最少使用替换算法B.先进先出替换算法C.最优替换算法D.近期最久未使用替换算法4.确保提高虚拟存储器的主存命中率的途径是()。

A.采用LFU替换算法并增大页面数B.采用FIFO替换算法并增大页面C.采用FIFO替换算法并增大页面数D.采用LRU替换算法并增大页面5.虚拟存储器主要是为了解决()问题。

A.便于程序的“访存操作”B.扩大存储系统的容量和提高存储系统的速度C.提高存储系统的速度D.扩大存储系统的容量6.与虚拟存储器的等效访问速度无关的是()。

A.辅存的容量B.主存的容量C.页面替换算法D.访存页地址流二、填空题1.使二级存储系统的等效访问速度接近于第一级存储器访问速度的依据是程序的(局部性原理),它包括(时间局部性)和(空间局部性)两个方面。

2.程序的空间局部性是指程序通常是(顺序)存储和执行的,程序使用的数据通常是(簇聚或集中)存储的。

3.假设T1和T2分别是CPU访问到M1和M2中信息所需要的时间,H为命中M1的概率,则由M1和M2构成的二级存储系统的等效访问时间应当表示为(H*T1+(1-H)*T2)。

4.存储器速度性能可以采用存储器的(频宽)衡量,它是存储器单位时间能够访问的信息量。

5.虚拟存储器的存储管理方式有(页式)、(段式)和(段页式)三种。

6.页式虚拟存储器把(程序“虚拟”)空间和(主存储器“物理实”)空间都分成相同大小的页。

7.当两个虚拟空间的页面要求装入同一个主存页面的位置,称为(实页冲突或页面争用)。

操作系统 第三章,第四章,第九章课后习题整理

操作系统   第三章,第四章,第九章课后习题整理

第3章进程描述和控制复习题:什么是指令跟踪?答:指令跟踪是指为该进程而执行的指令序列。

通常那些事件会导致创建一个进程?答:新的批处理作业;交互登录;操作系统因为提供一项服务而创建;由现有的进程派生。

(详情请参考表3.1)对于图3.6中的进程模型,请简单定义每个状态。

答:运行态:该进程正在执行。

就绪态:进程做好了准备,只要有机会就开始执行。

阻塞态:进程在某些事件发生前不能执行,如I/O操作完成。

新建态:刚刚创建的进程,操作系统还没有把它加入到可执行进程组中。

退出态:操作系统从可执行进程组中释放出的进程,或者是因为它自身停止了,或者是因为某种原因被取消。

抢占一个进程是什么意思?答:处理器为了执行另外的进程而终止当前正在执行的进程,这就叫进程抢占。

什么是交换,其目的是什么?答:交换是指把主存中某个进程的一部分或者全部内容转移到磁盘。

当主存中没有处于就绪态的进程时,操作系统就把一个阻塞的进程换出到磁盘中的挂起队列,从而使另一个进程可以进入主存执行。

为什么图3.9(b)中有两个阻塞态?答:有两个独立的概念:进程是否在等待一个事件(阻塞与否)以及进程是否已经被换出主存(挂起与否)。

为适应这种2*2的组合,需要两个阻塞态和两个挂起态。

列出挂起态进程的4个特点。

答:1.进程不能立即执行。

2.进程可能是或不是正在等待一个事件。

如果是,阻塞条件不依赖于挂起条件,阻塞事件的发生不会使进程立即被执行。

3.为了阻止进程执行,可以通过代理把这个进程置于挂起态,代理可以是进程自己,也可以是父进程或操作系统。

4.除非代理显式地命令系统进行状态转换,否则进程无法从这个状态中转移。

对于哪类实体,操作系统为了管理它而维护其信息表?答:内存、I/O、文件和进程。

列出进程控制块中的三类信息。

答:进程标识,处理器状态信息,进程控制信息。

为什么需要两种模式(用户模式和内核模式)?答:用户模式下可以执行的指令和访问的内存区域都受到限制。

这是为了防止操作系统受到破坏或者修改。

计算机系统结构智慧树知到答案章节测试2023年同济大学

计算机系统结构智慧树知到答案章节测试2023年同济大学

第一章测试1.在计算机的多级层次结构中,级别最高的是()A:传统机器级B:应用语言虚拟机C:高级语言虚拟机D:汇编语言虚拟机答案:B2.对于机器语言程序设计员来说,()是透明的。

A:寻址方式B:数据表示C:乘法器D:乘法指令答案:C3.最早的冯·诺依曼结构计算机是以()为中心的。

A:控制器B:I/O设备C:运算器D:存储器答案:C4.计算机系统结构不包括()A:信息保护B:数据表示C:主存速度D:机器工作状态答案:C5.计算机系统结构是指机器语言程序员所看到的机器属性,即()A:编程所要了解的硬件组织B:计算机软件所要完成的功能C:计算机硬件的全部组成D:计算机各部件的硬件实现答案:A6.摩尔定律指出集成电路芯片上所集成的晶体管数目每隔()就翻一番。

A:12个月B:20个月C:18个月D:15个月答案:C7.同构型多处理机所采用的提高并行性的主要技术途径是()A:时间重叠B:系列机C:资源共享D:资源重复答案:D8.程序的局部性原理包括()两方面。

A:物理局部性B:时间局部性C:虚拟局部性D:空间局部性答案:BD9.虚拟机是指由软件实现的机器。

A:错B:对答案:B10.向前兼容是指按某个时期投入市场的某种型号机器编制的程序,不加修改地就能运行于在它之后投入市场的机器。

A:对B:错答案:B第二章测试1.不需要编址的数据存储空间是()A:CPU中的通用寄存器B:I/O接口中的寄存器C:主存储器D:堆栈答案:D2.()不是设计RISC机器时应当遵循的原则。

A:采用多种复杂的寻址方式B:采用load-store结构C:采用简单而又统一的指令格式D:大多数指令都采用硬连逻辑来实现答案:A3.()不属于MIPS的寻址方式。

A:偏移量寻址B:变址寻址C:寄存器间接寻址D:立即数寻址答案:BC4.CPU中用来存储操作数的存储单元主要有()A:累加器B:寄存器C:主存D:堆栈答案:ABD5.常用的数据表示有()A:浮点数B:定点数C:堆栈D:数组答案:AB6.指令中表示寻址方式的方法有()A:设置专门的地址描述符B:由专用的寄存器描述C:编码在操作码中D:由操作数描述答案:AC7.寄存器的访问速度比存储器慢。

计算机系统结构第三章(习题解答)

计算机系统结构第三章(习题解答)

1. 什么是存储系统?对于一个由两个存储器M 1和M 2构成的存储系统,假设M1的命中率为h ,两个存储器的存储容量分别为s 1和s 2,存取时间分别为t 1和t 2,每千字节的成本分别为c 1和c 2。

⑴ 在什么条件下,整个存储系统的每千字节平均成本会接近于c 2? ⑵ 该存储系统的等效存取时间t a 是多少?是多少?⑶ 假设两层存储器的速度比r=t 2/t 1,并令e=t 1/t a 为存储系统的访问效率。

试以r 和命中率h 来表示访问效率e 。

⑷ 如果r=100,为使访问效率e>0.95,要求命中率h 是多少?是多少?⑸ 对于⑷中的命中率实际上很难达到,对于⑷中的命中率实际上很难达到,假设实际的命中率只能达到假设实际的命中率只能达到0.96。

现在采用一种缓冲技术来解决这个问题。

采用一种缓冲技术来解决这个问题。

当访问当访问M 1不命中时,不命中时,把包括被访问数把包括被访问数据在内的一个数据块都从M 2取到M 1中,并假设被取到M 1中的每个数据平均可以被重复访问5次。

请设计缓冲深度(即每次从M 2取到M 1中的数据块的大小)。

答:答:⑴ 整个存储系统的每千字节平均成本为:整个存储系统的每千字节平均成本为:12s 1s 2c 2s 1s 1c 2s 1s 2s 2c 1s 1c c ++´=+´+´=不难看出:当s1/s2非常小的时候,上式的值约等于c2。

即:s2>>s1时,整个存储器系统的每千字节平均成本会接近于c2。

⑵ 存储系统的等效存取时间t a 为:为:2t )h 1(1t hta´-+´=⑶r)h 1(h 1t )h 1(t h t t t e 211a1´-+=´-+´==⑷ 将数值代入上式可以算得:h>99.95% ⑸通过缓冲的方法,我们需要将命中率从0.96提高到0.9995。

计算机系统结构 第四章自考练习题答案

计算机系统结构 第四章自考练习题答案
34.虚拟存储器发生页面失效时,需要进行虚地址到(辅存实地址)的外部地址变换,以便去辅存中(调页)。
35.虚拟存储器外部地址变换的概率远比内部地址变换发生的概率要(低),因此,应采用(软)件实现。
36.在软硬件实现上,虚拟存储器内部地址变换宜用(硬)件实现,外部地址变换宜用(软)件实现。
37.页面替换是发生在页面(失效),同时又发生页面(争用)的时候。
13.页虚拟存储器中,影响命中率的因素有(替换)算法、程序地址流及分配给该程序的(实页)数等。
14.FIFO、OPT、LRU算法中,属堆栈型算法的是(LRU)和(OPT)法。
15.页面失效频率(PFF)法是通过动态调节分配给各道程序的实页数来提高系统效率的,其依据是LRU替换算法,它属于(堆栈)型的替换算法,有命中率H随分配的实页数增大而(单调上升)这一特点。
9.Cache存储器是从主存(速度)满足不了要求提出的(Cache-主存)二级存储层次。
10.Cache存储器是增加辅助(硬)件,使之速度接近于Cache的,容量是(主)存的。
11.虚拟存储器对(应用)程序员是透明的,对(系统)程序是不透明的。
12.Cache存储器对应用程序是(透明)的,对系统程序员是(透明)的。
28.段式虚拟存储器,程序的起点处于主存中(任意)位置上,段页式虚拟存储器要求段的起点必须是在主存中(页面)的起点位置上。
29.段页式虚拟存储器在访问时,遇到段表中某行装入位为0时,将产生(段失效)故障,请求调入(页表)。
30.段页式虚拟存储器在访问时,遇到页表中某行装入位为0时,将产生(页面失效)故障,请求调入(程序页面)。
16.页面失效不能按中断对待,应按(故障)对待,必须(立即)响应和处理。
17.为提高页式虚拟存储器内部地址变换的速度,可将其内部映象表又分成由(快)表和(慢)表组成的一个二级表层次。

计算机体系结构各章简答题及答案

计算机体系结构各章简答题及答案

计算机体系结构各章简答题及答案第⼀章计算机体系结构的基本概念1. 什么是计算机系统的多级层次结构?2. 硬件和软件在什么意义上是等效的在什么意义上是不等效的?3. 经典计算机系统结构的实质是什么?4. 语⾔实现的两种基本技术是什么?5. 对于通⽤寄存器型机器来说,机器语⾔程序设计者所看到的计算机的属性主要有哪些?6. 什么是软件兼容软件兼容有⼏种其中哪⼀种是软件兼容的根本特征?7. 什么是系列机它的出现较好地解决了什么⽭盾?8. 对计算机发展⾮常关键的实现技术有哪些?9. 实现软件移植的主要途径有哪些?10. 试以系列机为例,说明计算机系统结构、计算机组成和计算机实现三者之间的关系。

11. 存储程序计算机在系统结构上的主要特点是什么?12. 从系统结构的发展情况看,新型系统结构的设计主要从哪两⽅⾯着⼿?13. 软件技术两个最重要的发展趋势是什么?14. 计算机系统设计⼈员的技术挑战主要来⾃哪⼏个⽅⾯?15. ⼀种计算机系统结构的⽣命周期是怎样的?16. 商品的标价(价格)由哪些因素构成?17. 对计算机系统成本产⽣影响的主要因素有哪些?18. ⽤户CPU时间由哪三个因素决定?19. ⽬前常⽤的测试程序分为哪五类?20. 什么叫测试程序组件在评价计算机系统设计时最常见的测试程序组件是哪个?21. SPEC2000测试程序组件中包括哪⼏个测试程序组件?22. 测试基于Microsoft公司的Windows系列操作系统平台的最常⽤测试组件有哪些?23. 常⽤的专门的性能指标测试程序有哪些?24. 计算机系统结构设计和分析中最经常使⽤的三条基本原则是什么25. 根据Amdahl定律,系统加速⽐由哪两个因素决定?26. 从执⾏程序的⾓度看,并⾏性等级从低到⾼可分为哪⼏级?27. 从处理数据的⾓度,并⾏性等级从低到⾼可以分为哪⼏级?28. 计算机系统中提⾼并⾏性的技术途径有哪三种?29. 多机系统的耦合度可以分为哪⼏类?30. 单机系统和多机系统中,都是按哪三种技术途径分别发展为哪三类多处理机?31. 三种类型的多处理机(同构型多处理机、异构型多处理机、分布处理系统)的主要区别是什么1. 什么是计算机系统的多级层次结构从计算机语⾔的⾓度,把计算机系统按功能划分成以下多级层次结构:2. 硬件和软件在什么意义上是等效的在什么意义上是不等效的硬件和软件在功能实现上是等效的,即⼀种功能可以由软件实现,也可以由硬件实现。

微机原理作业及答案

微机原理作业及答案
PUSH AX PUSH DX MOV AX, BUF MOV DX, BUF+2 MOV CX, 32 LP: SHL AX, __ 1 ADC BX, 0
LP LOOP __
MOV BYTE PTR SRLT, ___ BL
POP DX ____ POP AX ___
RET XHZY ENDP
1 RCL DX,__
一、二、三、四章
作业
第一章 作业
1、简述微型计算机的硬件系统结构,并说明其主要功能。 2、试利用一个字节的字长,将十进制-115转换为相应的二 进制的原码、反码和补码。 [解]: (-115)原=(11110011)2 (-115)反=(10001100) (-115)补=(10001101) 3、已知[X]补=1100111,则[X]原= , [2X]补= ,并判断结果 是否溢出。 [解]:题目没有特殊说明,将最高为(第六位作为符号位) [X]反=[X]补-1=1100110,则[X]原=1011001 [2X]补=[X]补+ [X]补=1100111+1100111=1 1001110 C6· C5=1· 1=0,不溢出 另外,可以补齐第七位为0或者1,再进行计算获得。
第三章 作业
1、8086/8088操作数是从哪里来的?
答:来源有3种:立即数、寄存器、存储器操作数 指令中直接给出参加操作数; 参与操作的数存放在CPU的某个寄存器中; 参与操作的数存放在内存单元中,需要寻找相应的物理地址。 2、指出下列指令的错误 1)MOV AX, [SI][DI] 2) MOV [BX],[SI] 3) ADD BYTE, PTR[BX] (不能同时使用两个变址寄存器) (原操作数和目的操作数不能同时为存储器)
第三章 作业

计算机系统结构第四章(习题解答)

计算机系统结构第四章(习题解答)

1. 假设一条指令的执行过程分为“取指令”、“分析”和“执行”三段,每一段的时间分别是△t 、2△t 和3△t 。

在下列各种情况下,分别写出连续执行n 条指令所需要的时间表达式。

⑴ 顺序执行方式。

⑵ 仅“取指令”和“执行”重叠。

⑶ “取指令”、“分析”和“执行”重叠。

答:⑴ 顺序执行方式12 ......1 2 12T =∑=++n1i i i i )t t t (执行分析取址=n(△t +2△t +3△t)=6n △t⑵ 仅“取指令”和“执行”重叠12 ......1 212T =6△t +∑=+1-n 1i i i )t t (执行分析=6△t +(n-1)(2△t +3△t)=(5n +1)△t⑶ “取指令”、“分析”和“执行”重叠12 34 ......1 2 3 41234△t2△t3△t△t2△t3△t△t2△t3△tT =6△t +∑=1-n 1i i )t (执行=6△t +(n-1)(3△t)=(3n +3)△t2. 一条线性流水线有4个功能段组成,每个功能段的延迟时间都相等,都为△t 。

开始5个任务,每间隔一个△t 向流水线输入一个任务,然后停顿2个△t ,如此重复。

求流水线的实际吞吐率、加速比和效率。

答:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15...1 2 3 4 5 6 7 8 9 10 11 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1 2 3 4 56 7 8 9 10 11 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23我们可以看出,在(7n+1)Δt 的时间内,可以输出5n 个结果,如果指令的序列足够长(n →∞),并且指令间不存在相关,那么,吞吐率可以认为满足:)n (t75t )n /17(5t )1n 7(n 5TP ∞→∆=∆+=∆+=加速比为:)n (720n /17201n 7n 20t )1n 7(t 4n 5S ∞→=+=+=∆+∆⨯=从上面的时空图很容易看出,效率为:)n (75n /1751n 7n 5t )1n 7(4t 4n 5E ∞→=+=+=∆+⨯∆⨯=3. 用一条5个功能段的浮点加法器流水线计算∑==101i i A F 。

最全计算机系统结构课后的习题答案打印版.doc

最全计算机系统结构课后的习题答案打印版.doc

第1章计算机系统结构的基本概念1.1解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

计算机系统结构(课后习题答案)

计算机系统结构(课后习题答案)

第一章计算机系统结构的基本概念1。

有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。

现若需第i级的N 条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks.第3级上等效程序需运行:(N/M)*(N/M)*Ks。

第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。

note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。

而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。

所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。

答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。

但是实现的性能价格比,实现的难易程序不同。

在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件.3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。

答:计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。

(1)计算机的系统结构相同,但可采用不同的组成。

如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。

从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。

其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。

计算机系统结构(课后习题答案)

计算机系统结构(课后习题答案)

第一章计算机系统结构的基本概念1.有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。

现若需第i级的N 条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks。

第3级上等效程序需运行:(N/M)*(N/M)*Ks。

第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。

note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。

而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。

所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。

答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。

但是实现的性能价格比,实现的难易程序不同。

在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件。

3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。

答:计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。

(1)计算机的系统结构相同,但可采用不同的组成。

如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。

从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。

其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。

计算机系统结构课后答案

计算机系统结构课后答案

第1章部分习题参考答案1.1 解释下列术语⏹翻译:先用转换程序将上一级机器级上的程序整个地变换成下一级机器级上可运行的等效程序,然后再在下一级机器级上去实现的技术。

⏹解释:在下一级机器级上用它的一串语句或指令来仿真上一级机器级上的一条语句或指令的功能,通过对上一级机器语言程序中的每条语句或指令逐条解释来实现的技术。

⏹层次结构:将计算机系统由上往下依次划分为应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器级和微程序机器级。

对于一个具体的计算机系统,层次的多少会有所不同。

⏹计算机系统结构:传统机器级的程序员所看到计算机的基本属性,即计算机的概念性结构和功能特性。

简称为计算机的外特性。

⏹计算机组成:计算机系统结构的逻辑实现,也常称为计算机组织。

该组织包括机器级内的数据流和控制流的组成以及逻辑设计等。

⏹计算机实现:计算机组成的物理实现。

它包括处理机、主存等部件的物理结构,器件的集成度、速度和信号,器件、模块、插件、底板的划分与连接,专用器件的设计,电源、冷却、装配等技术。

⏹透明性:本来存在的事物或属性,但从某个角度看似乎不存在,称为透明性现象。

⏹固件:是一种具有软件功能的硬件。

如将软件固化在ROM中,就是一种固件。

⏹由上往下设计:先考虑如何满足应用要求,确定好面对使用者那级机器应有什么基本功能和特性,然后再逐级往下设计,每级都考虑怎样优化上一级实现。

这种方法适合于专用机设计。

⏹由下往上设计:根据现有的部件,并参照或吸收已有各种机器的特点,先设计出微程序机器级(如果采用微程序控制)及传统机器级,然后再为不同应用配置多种操作系统和编译系统软件,采用合适的算法来满足相应的应用。

这是20世纪60-70年代前常用的通用机设计思路。

⏹系列机:同一厂家生产的具有相同系统结构,但具有不同组成和实现的一系列的机器。

⏹软件兼容:同一软件可以不加修改地运行于系统结构相同的不同档次的机器上,而且它们所获得的结果一样,差别只是运行时间不同。

计算机系统结构课后答案unit3

计算机系统结构课后答案unit3

计算机系统结构课后答案unit3第一篇:计算机系统结构课后答案unit3第3章总线、中断与输入输出系统3.1.简要举出集中式串行链接,定时查询和独立请求3种总线控制方式的优缺点。

同时分析硬件产生故障时通讯的可靠性。

答:集中式串行链连接方式。

其过程为:①所有部件都经公共的“总线请求”线向总线控制器发使用总线申请。

②当“总线忙”信号未建立时,“总线请求”才被总线控制器响应,送出“总线可用”信号,它串行地通过每个部件。

③如果某部件未发过“总线请求”,则它将“总线可用”信号往下一部件转,如果某部件发过“总线请求”,则停止“总线可用”信号的传送。

④该部件建立“总线忙”,并除去“总线请求”,此时该部件获得总线使用权,准备传送数据。

⑤数据传送期间,“总线忙”维持“总线可用”的建立。

⑥传送完成后,该部件去除“总线忙”信号和“总线可用”信号。

⑦当“总线请求”再次建立时,就开始新的总线分配过程。

优点:①选择算法简单;②控制总线数少;③可扩充性好;④可靠性高。

缺点:①对“总线可用”线及其有关电路失效敏感,②不灵活;③总线中信号传送速度慢。

集中式定时查询方式,过程:①总线上每个部件通过“总线请求”发请求。

②若“总线忙”信号未建立,则计数器开始计数,定时查询个部件,以确定是谁发的请求。

③当查询线上的计数值与发出请求的部件号一致时,该部件建立“总线忙”,计数停止,查询也停止。

除去“总线请求”,该部件获得总线使用权。

④“总线忙”维持到数据传送完毕。

⑤数据传送完,去除“总线忙”。

⑥当“总线请求”线上有新的请求,就开始下一个总线分配过程。

优点:①优先次序灵活性强;②可靠性高。

缺点:①控制线数较多;②扩展性较差;③控制较为复杂;④总线分配受限于计数信号,不能很高。

集中式独立请求方式,过程:①每个部件有一对“总线请求”和“总线准许”线。

②每个部件使用“总线请求”发中请,当“总线已分配”无信号时,总线控制器根据某种算法对同时送来的多个请求进行仲裁,以确定哪个部件使用总线,信号从“总线准许”送回该部件,去除该部件的“总线请求”,建立总线已分配”。

计算机体系结构1-6章习题答案

计算机体系结构1-6章习题答案

1 2 3 4 5 6
8 16 24 32 40 48
1*82
2*82 3*82 4*82 5*82 6*82 7*82
4/8 5/8 6/8
7/8
7
56
2)规格化浮点数表: rm=2时,规格化浮点数共有4*8=32个 rm=8时,规格化浮点数共有7*8=56个,在[0.5,112]中, 有数19个(上表中红的数字表示)。
§4通道(CH)
一、CH的基本工作原理 CH执行CH程序的过程 CH的任务 二、CH流量计算和时空图绘制 CH的类型 CH流量计算 字节多路CH响应处理时空图的绘制 1)计算每个子CH提供一个字节时间(1/f) 2)画出一个完整申请周期时空图 3)计算字节多路CH对每个字节响应的最长用时
第一章参考答案: 1.应用语言级 高级语言级 汇编语言级 操作系统级 机器语言级 微程序语言级。 2. 从上而下 从下到上 专用机 通用机 3. 软、硬件交界面 计算机系统的性能/价格比 4 . 1 T FLOPS 的计 算能力 1 TBy te 的 主存容量 1 TByte/s 的I/O带宽 5. 虚拟机 实际机器 6. 统一高级语言 模拟 仿真 系列机 7. 控制流 数据流 SISD SIMD MISD MIMD 8. 汇编语言程序员 9. 任务单一化 操作重叠化 吞吐匹配化 程序多道 化
嵌套
中断处理程序 一 二 三 响② 嵌套 四 五
t
返回主程序
例4 解 (1)处理顺序为 2-3-1-5-4 (2)中断响应处理时空图 中断请求 主程序 ①③ ②③④⑤
嵌套
中断处理程序 一 二 三 四 五
响① 嵌套
t
返回主程序
1 分别利用两级描述符和三级描述符描述下列阵列数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

简述流水线技术的特点。

(1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。

因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。

(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。

(3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。

(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。

(5) 流水线需要有通过时间和排空时间。

在这两个时间段中,流水线都不是满负荷工作。

解决流水线瓶颈问题有哪两种常用方法答:细分瓶颈段与重复设置瓶颈段 有一条指令流水线如下所示:
(1)求连续输入10条指令的情况下,该流水线的实际吞吐率和效率。

(2)该流水线的瓶颈在哪一段请采用两种不同的措施消除此瓶颈。

对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少解:(1)
2200(ns)2009200)10050(50t )1n (t T max
m
1
i i pipeline =⨯++++=∆-+∆=∑=
)(ns 220
1T n
TP 1pipeline
-==
45.45%11
5
4400TP m
t
TP E m
1
i i
≈=⋅
=∆⋅
=∑= (2)瓶颈在3、4段。

变成八级流水线(细分)
850(ns)
509850t 1)(n t T max
m
1
i i pipeline =⨯+⨯=∆-+∆=∑=
)(ns 85
1
T n
TP 1pipeline
-== 58.82%17
10
8400TP m
ti
TP E m
1
i ≈=⋅
=∆⋅
=∑= 重复设置部件
50ns 50ns 100ns 200ns 1 2 3 4 1
2
3_1
3_2
4_1
4_4


)(ns 85
1
T n
TP 1pipeline
-==
58.82%17
10
8
85010
400E ≈=⨯⨯=
有一个流水线由4段组成,其中每当流过第三段时,总要在该段循环一次,然后才能流到第4段。

如果每段经过一次所需的时间都是△t ,问:
(1)当在流水线的输入端连续地每△t 时间输入一个任务时,该流水线会发生什么情况 (2)此流水线的最大吞吐率为多少如果每2△t 输入一个任务,连续处理10个任务时,其实际吞吐率和效率是多少

54.35%
92
5045TP E 2310
T n
Tp 23T 21TP pipeline
pipeline max ≈=∆⋅=∆∆==∆=∆=t t
t t
(3)重复设置部件
t t
∆⋅=∆⋅==75
1410
T n
TP pipeline
吞吐率提高倍数=
t
t ∆∆2310
75=
有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2
段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。

现在该流水线上计算∏=+4
1
)(i i i
B A
,画出时空图,并计算其吞吐
率、
解:首先,应选择适合于流水线工作的算法。

对于本题,应先计算A 1+B 1、A 2+B 2、A 3
+B 3和A 4+B 4;再计算(A 1+B 1) ×(A 2+B 2)和(A 3+B 3) ×(A 4+B 4);然后求总的结果。


t
∆ 14
其次,画出完成该计算的时空图,如图所示,图中阴影部分表示该段在工作。

由图可见,它在18个△t 时间中,给出了7个结果。

所以吞吐率为:
t
TP ∆=817
如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。

所以加速比为:
该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得:
在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如
下所示。

(1)画出流水线任务调度的状态转移图。

(2)求流水线的最有调度策略和流水线的最大吞吐率。

(3)按最优调度策略连续输入6个任务,流水线的实际吞吐率是多少
时间
段输 入
A 1
B 1 A 2 B 2 A 3 B 3 A 4 B 4
A B C
D
A ×
B
C ×D
61
.18192=∆∆=t
t S 22
3.01853
354=⨯⨯+⨯=E
述3种向量处理方式,它们对向量处理机的结构的要求有何不同
采用哪些方法来提高向量处理机的性能
用链接技术时,向量指令能够链接执行必须满足哪些条件
CRAY-l机器上,按照链接方式执行下述4条向量指令(括号中给出了相应功能部件时间),如果向量寄存器和功能部件之间的数据传送需要1拍,试求此链接流水线的通过时间是多少拍如果向量长度为64,则需多少拍才能得到全部结果。

V0←存储器(从存储器中取数:7拍)
V2←V0+V1 (向量加:3拍)
V3←V2<A3 (按(A3)左移:4拍)
V5←V3∧V4 (向量逻辑乘:2拍)
量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。

采用类似CRAY-1的链接技术,先计算(A+B)×C,在流水线不停的情况下,接着计算(D+E)×F。

(1)求此链接流水线的通过时间是多少拍(设寄存器出入各需1拍)
(2)假如每排时间为50ns,完成这些计算并把结果存进相应寄存器,此处理部件的时间吞吐率为多少MFLOPS。

相关文档
最新文档