计算机组成原理第5章习题参考答案
《计算机组成原理》各章练习参考答案
《计算机组成原理》各章练习题参考答案第一章思考练习题一.填空1.电子数字计算机可以分为专用计算机和通用计算机两类。
2.硬件采用LSI或VLSI的电子计算机属于计算机发展过程中的第四代。
3.存储器中存放数据和程序。
4.一台计算机包括运算、存储、控制、输入及输出五个单元。
5.完成算术运算和逻辑运算的部件是运算器(或ALU);运算器的核心是加法器;控制、指挥程序和数据的输入、运行以及处理运算结果的部件是控制器。
6.CPU内部连接各寄存器及运算部件之间的总线是内部总线;CPU同存储器、通道等互相连接的总线是系统总线;中、低速I/O设备之间互相连接的总线是I/O总线。
7.在多总路线结构中,CPU总线、系统总线和高速总线相连通过桥实现。
8.计算机软件一般分为系统软件和应用软件。
9.完整的计算机系统由硬件系统和软件系统构成。
10.机器字长是指一台计算机一次所能够处理的二进制位数量。
11.数据分类、统计、分析属于计算机在数据处理方面的应用。
12.计算机是一种信息处理机,它最能准确地反映计算机的主要功能。
13.个人台式商用机属于微型机。
14.对计算机软硬件进行管理,是操作系统的功能。
15.用于科学技术的计算机中,标志系统性能的主要参数是MFLOPS。
16.通用计算机又可以分为超级机、大型机、服务器、工作站、微型机和单片机六类。
17.“存储程序控制”原理是冯.诺依曼提出的。
18.运算器和控制器构成CPU,CPU和主存构成主机。
19.取指令所用的时间叫取指周期,执行指令所用的时间叫执行周期。
20.每个存储单元都有一个编号,该编号称为地址。
21.现代计算机存储系统一般由高速缓存、主存和辅存构成。
22.计算机能够自动完成运算或处理过程的基础是存储程序和程序控制原理。
二.单选1.存储器用来存放( C )。
A.数据B.程序C.数据和程序D.正在被执行的数据和程序2.下面的描述中,正确的是( B )A.控制器能够理解、解释并执行所有的指令及存储结果。
计算机组成原理第五章答案
计算机组成原理第五章答案1. 概述本文档为计算机组成原理第五章的答案总结,主要涵盖了第五章的核心概念和问题解答。
本章主要讨论了计算机的存储器层次结构和存储管理的相关内容。
2. 存储器层次结构存储器层次结构指的是一系列不同速度、容量和成本的存储设备,按照存储访问时间的大小排列成一种层次结构。
通常由以下几个层次组成:1.高速缓存(Cache):位于CPU内部,容量较小但速度非常快,用来暂时存放从内存中读取的指令和数据。
2.主存储器(Main Memory):位于CPU外部,容量较大但速度相对较慢,用来存放程序运行时需要的指令和数据。
3.辅助存储器(Auxiliary Storage):位于计算机外部,包括硬盘、磁带等设备,容量较大但速度较慢,用来长期存储大量的数据和程序。
4.寄存器(Register):位于CPU内部,容量非常小但速度非常快,用来存储CPU正在执行的指令和数据。
存储器层次结构的设计原则是利用成本较低的存储器来提供更大的容量,同时保证需要最频繁访问的数据能够在速度最快的存储器中找到。
3. 存储管理存储管理是指对计算机中的存储器进行组织和管理的过程,主要包括内存分配、地址映射和存储保护等方面。
3.1 内存分配内存分配是指将程序运行所需的内存空间分配给程序的过程。
常用的内存分配方式包括静态分配和动态分配。
•静态分配:在程序编译或装载时确定程序所需的内存空间大小,并为其分配相应的内存空间。
静态分配的优点是效率高,但缺点是浪费内存资源,不能适应较大程序的需求。
•动态分配:在程序运行时根据需要动态的分配和释放内存空间。
常见的动态分配方式有堆和栈两种方式。
堆分配是通过一些内存管理函数来进行的,栈分配则是通过操作系统提供的栈实现的。
动态分配的优点是灵活性高,适应性强,但容易产生内存泄漏等问题。
3.2 地址映射地址映射是指将程序中的逻辑地址(虚拟地址)转换成物理地址的过程。
常见的地址映射方式有两级映射和页式映射。
《计算机组成原理》课后题答案_清华大学出版_秦磊华_吴非··
1、l 解释下列名词摩尔定律:对集成电路上可容纳的晶体管数目、性能与价格等发展趋势的预测,其主要内容就是:成集电路上可容纳的晶体管数量每18个月翻一番,性能将提高一倍,而其价格将降低一半。
主存: 计算机中存放正在运行的程序与数据的存储器,为计算机的主要工作存储器,可随机存取。
控制器:计算机的指挥中心,它使计算机各部件自动协调地工作。
时钟周期:时钟周期就是时钟频率的倒数,也称为节拍周期或T周期,就是处理操作最基本的时间单位。
多核处理器:多核处理器就是指在一枚处理器中集成两个或多个完整的计算引擎(内核)。
字长:运算器一次运算处理的二进制位数。
存储容量: 存储器中可存二进制信息的总量。
CPI:指执行每条指令所需要的平均时钟周期数。
MIPS:用每秒钟执行完成的指令数量作为衡量计算机性能的一个指标,该指标以每秒钟完成的百万指令数作为单位。
CPU时间:计算某个任务时CPU实际消耗的时间,也即CPU真正花费在某程序上的时间。
计算机系统的层次结构:计算机系统的层次结构由多级构成,一般分成5级,由低到高分别就是:微程序设计级,机器语言级,操作系统级,汇编语言级,高级语言级。
基准测试程序:把应用程序中使用频度最高的那那些核心程序作为评价计算机性能的标准程序。
软/硬件功能的等价性:从逻辑功能的角度来瞧,硬件与软件在完成某项功能上就是相同的,称为软/硬件功能就是等价的,如浮点运算既可以由软件实现,也可以由专门的硬件实现。
固件:就是一种软件的固化,其目的就是为了加快软件的执行速度。
可靠性:可靠性就是指系统或产品在规定的条件与规定的时间内,完成规定功能的能力。
产品可靠性定义的要素就是三个“规定”:“规定条件”、“规定时间”与“规定功能”。
MTTF:平均无故障时间,指系统自使用以来到第一次出故障的时间间隔的期望值。
MTTR:系统的平均修复时间。
MTBF:平均故障间隔时间,指相邻两次故障之间的平均工作时间。
可用性:指系统在任意时刻可使用的概率,可根据MTTF、MTTR与MTBF等指标计算处系统的可用性。
计算机组成原理习题答案第五章
对阶之后,尾数相加和相减。
相加:11.011110
+11.100001
10.111111
需右规一次,[X+Y]浮=0110;1.011111
所以X+Y=2110×(-0.100001)
相减:11.011110
+00.011111
11.111101
需左规4次,[X-Y]浮=0001;1.010000
④
15
16
17
18
1911000
11001
11010
11011
1110010101
10110
10111
11000
11001
若A≥5,B≥5,
则+3校正
①和在0~4范围内,不用校正,结果正确。
②和在6~9范围内,当A<5,B<5,需+3校正,而当A<5,B≥5或A≥5,B<5
时,不需校正。故校正函数为:
1/4X补=1.1111001,[4X]补=1.0011000
(4)1.0000111
1/4X补=1.1100001,[4X]补=1.0011100
5.证明在全加器里,进位传递函数P=A i+Bi=Ai⊕Bi。
解:并行加法器中的每一个全加器都有一个从低位送来的进位和一个传送给较高位
的进位。进位表达式为
相加:00.010110
+11 .011000
11.101110
需左规一次,[X+Y]浮=1011;1.011100
所以X+Y=2-101×(-0.100100)
相减:00.010110
+00.101000
00.111110
所以X-Y=2-100×0.111110
(3)X=2-011×0.101100,Y=2-001×(-0.111100)
计算机组成原理第5章部分习题参考答案
第五章部分习题参考答案【5-10】一个1K * 8的存储芯片需要多少根地址线,数据输入输出线?解:1024 = 10 根。
由于一次可读写8位数据,所以需要8根数据输入输出线。
n = log2【5-11】某计算机字长32位,存储容量64KB,按字编址的寻址范围是多少?若主存以字节编址,试画出主存字地址和字节地址的分配情况?解:因为字长32位,所以64KB = 16KW,要表示16K个存储单元,需要14根地址线。
所以按字编址的寻址范围是0000H ~ 3FFFH 。
若按字节编址,假设采用PC机常用的小端方案,则主存示意图如下:【5-13】现有1024×1的存储芯片,若用它组成容量为16K×8的存储器。
试求:(1)实现该存储器所需芯片数量(2)若将这些芯片分装在若干块板上,每块板的容量是4K×8,该存储器所需的地址线的总位数是多少?其中几位用于选板?几位用于选片?几位用作片内地址?解:(1)需要16组来构成16K,共需芯片16×8 = 128片(2)需要的地址线总位数是14位。
因为共需4块板,所以2位用来选板,板内地址12位,片内地址10位。
每块板的结构如下图4块板共同组成16K×8存储器的结构图【5-15】某半导体存储器容量16K×8,可选SRAM芯片的容量为4K ×4;地址总线A15~A0(A0为最低位),双向数据总线D7~D0,由R/W线控制读写。
设计并画出该存储器的逻辑图,并注明地址分配、片选逻辑和片选信号的极性。
解:注:采用全译码方式方案4组不同的4K的RAM芯片。
可以写出片选逻辑表达式【5-17】用容量为16K×1的DRAM芯片构成64KB的存储器(1)画出该存储器的结构框图(2)设存储器的读写周期均为0.5微秒,CPU在1微秒内至少要访存一次,试问采用哪种刷新方式比较合理?相邻两行之间的刷新间隔是多少?对全部存储单元刷新一遍所需的实际刷新时间是多少?解:(1)结构框图如下(若看不清可以从”视图”菜单中调整显示比例)(2)由于存储器芯片规格为16K×1,所以,其芯片内部的存储矩阵是128×128的存储矩阵。
计算机组成原理第5章习题参考答案
第5 章习题参考答案第5 章习题参考答案1.请在括号内填入适当答案。
在CPU 中:(1)保存当前正在执行的指令的寄存器是(IR);(2)保存当前正在执行的指令地址的寄存器是(AR)(3)算术逻辑运算结果通常放在(DR)和(通用寄存器)。
2.参见图 5.15 的数据通路。
画出存数指令“ STO Rl, (R2)”的指令周期流程图,其含义是将寄存器Rl 的内容传送至(R2)为地址的主存单元中。
标出各微操作信号序列。
解:STO R1, (R2)的指令流程图及为操作信号序列如下:STO R1, (R2)(PC)→ARPC O, G, AR i(M) → DR R/W=R(DR) → IR DR O , G, IR i(R2) → AR R2O , G, AR i(R1) → DR R1O , G, DR i(DR) → M R/W=W~3.参见图 5.15 的数据通路,画出取数指令“LAD (R3),R0”的指令周期流程图,其含义是将 (R3)为地址主存单元的内容取至寄存器 R2 中,标出各微操作控制信号序列。
解:LAD R3, (R0) 的指令流程图及为操作信号序列如下:LAD (R3), R0(PC)→ AR PC O, G, AR i(M) → DR R/W=R(DR) → IR DR O , G, IR i(R3) → AR R3O , G, AR i(M) → DR R/W=R(DR) → R0DR O , G, R0i~4.假设主脉冲源频率为 10MHz,要求产生 5 个等间隔的节拍脉冲,试画出时序产生器的逻辑图。
解:5.如果在一个 CPU 周期中要产生 3 个节拍脉冲;T l=200ns,T2=400ns,T3=200ns,试画出时序产生器逻辑图。
解:取节拍脉冲 T l、 T2、T3的宽度为时钟周期或者是时钟周期的倍数即可。
所以取时钟源提供的时钟周期为 200ns,即,其频率为 5MHz. ;由于要输出 3 个节拍脉冲信号,而 T3的宽度为 2 个时钟周期,也就是一个节拍电位的时间是 4 个时钟周期,所以除了 C4外,还需要 3 个触发器—— C l、C2、C3;并令T1C 1C2;T1C 2C3;T3C1 C 3,由此可画出逻辑电路图如下:6.假设某机器有 80 条指令,平均每条指令由 4 条微指令组成,其中有一条取指微指令是所有指令公用的。
《计算机组成原理》课后题答案_清华大学出版_秦磊华_吴非··
1.l 解释下列名词摩尔定律:对集成电路上可容纳的晶体管数目、性能和价格等发展趋势的预测,其主要内容是:成集电路上可容纳的晶体管数量每18个月翻一番,性能将提高一倍,而其价格将降低一半。
主存:计算机中存放正在运行的程序和数据的存储器,为计算机的主要工作存储器,可随机存取。
控制器:计算机的指挥中心,它使计算机各部件自动协调地工作。
时钟周期:时钟周期是时钟频率的倒数,也称为节拍周期或T周期,是处理操作最基本的时间单位。
多核处理器:多核处理器是指在一枚处理器中集成两个或多个完整的计算引擎(内核)。
字长:运算器一次运算处理的二进制位数。
存储容量: 存储器中可存二进制信息的总量。
CPI:指执行每条指令所需要的平均时钟周期数。
MIPS:用每秒钟执行完成的指令数量作为衡量计算机性能的一个指标,该指标以每秒钟完成的百万指令数作为单位。
CPU时间:计算某个任务时CPU实际消耗的时间,也即CPU真正花费在某程序上的时间。
计算机系统的层次结构:计算机系统的层次结构由多级构成,一般分成5级,由低到高分别是:微程序设计级,机器语言级,操作系统级,汇编语言级,高级语言级。
基准测试程序:把应用程序中使用频度最高的那那些核心程序作为评价计算机性能的标准程序。
软/硬件功能的等价性:从逻辑功能的角度来看,硬件和软件在完成某项功能上是相同的,称为软/硬件功能是等价的,如浮点运算既可以由软件实现,也可以由专门的硬件实现。
固件:是一种软件的固化,其目的是为了加快软件的执行速度。
可靠性:可靠性是指系统或产品在规定的条件和规定的时间内,完成规定功能的能力。
产品可靠性定义的要素是三个“规定”:“规定条件”、“规定时间”和“规定功能”。
MTTF:平均无故障时间,指系统自使用以来到第一次出故障的时间间隔的期望值。
MTTR:系统的平均修复时间。
MTBF:平均故障间隔时间,指相邻两次故障之间的平均工作时间。
可用性:指系统在任意时刻可使用的概率,可根据MTTF、MTTR和MTBF等指标计算处系统的可用性。
计算机组成原理第五章部分课后题答案
计算机组成原理第五章部分课后题答案常用的I/O编址方式有两种:I/O与内存统一编址和I/O独立编址·I/O与内存统一编址方式的I/O地址采用与主存单元地址完全一样的格式,I/O设备与主存占用同一个地址空间,CPU可像访问主存一样访问I/O设备,不需要安排专门的I/O指令。
·I/O独立编址方式时机器为I/O设备专门安排一套完全不同于主存地址格式的地址编码,此时I/O地址与主存地址是两个独立的空间,CPU需要通过专门的I/O指令来访问I/O地址空间。
I/O设备与主机交换信息时,共有哪几种控制方式?简述它们的特点。
·程序直接控制方式:也称查询方式,采用该方式,数据在CPU和外设间的传送完全靠计算机程序控制,CPU的操作和外围设备操作同步,硬件结构简单,但由于外部设备动作慢,浪费CPU时间多,系统效率低。
·程序中断方式:外设备准备就绪后中断方式猪肚通知CPU,在CPU相应I/O设备的中断请求后,在暂停现行程序的执行,转为I/O 设备服务可明显提高CPU的利用率,在一定程度上实现了主机和I/O设备的并行工作,但硬件结构负载,服务开销时间大·DMA方式与中断方式一样,实现了主机和I/O设备的并行工作,由于DMA 方式直接依靠硬件实现贮存与I/O设备之间的数据传送,传送期间不需要CPU程序干预,CPU可继续执行原来的程序,因此CPU利用率和系统效率比中断方式更高,但DMA方式的硬件结构更为复杂。
比较程序查询方式、程序中断方式和DMA方式对CPU工作效率的影响。
·程序查询方式:主要用于CPU不太忙且传送速度不高的情况下。
无条件传送方式作为查询方式的一个特例,主要用于对简单I/O设备的控制或CPU明确知道外设所处状态的情况下。
·中断方式:主要用于CPU的任务比较忙的情况下,尤其适合实时控制和紧急事件的处理· DMA方式(直接存储器存取方式):主要用于高速外设进行大批量数据传送的场合。
计算机组成原理课后习题答案第五版
6. 字节9648
32*)13*80(=+ 取指微指令除外,每条机器指令对应三条微指令构成的微程序,因此控制存储器中共有80*3+1条微指令,每条微指令占32位,即4Byte
8. 经分析,(d, i, j )和(e, f, h )为两组相斥性微命令(在全部8条微指令中,组内任意两个微命令没有同时出现),可将(d, i, j )编码表示,使用两位二进制表示三个相斥性微命令,编码00表示空操作,即三个微命令都不出现,(e, f, h )作类似处理,剩下的a, b, c, g 四个微命令信号可进行直接控制,其整个控制字段组成如下:
a b c g 01d
10 i 10 f
11 j 11 h
13. (1)
1 2 3 4 51 2 3 4 5
1 2 3 4 5
1 2 3 4 51 2 3 4 5
0 t 1 t 2 t 3 t 4 t 5 t 6 t 7 t 8 t 9 t 19 t 20 1 2 3 4 5 15 16
…
时间T
空间S WB MEM
EX ID IF
(2)流水线的实际吞吐
率为秒条/10*33.810*100*)1205(20
)1(69=-+=-+=-τn k n
H (3)加速比17.415205
*20)1(=-+=-+==ττ
n k nk Tp Ts
S
流水线有k 个过程段,k=5。
16.(1)写后读 RAW
(2)读后写 W AR
(3)写后读 和 写后写 RA W WAW
1、
8.C
9.B、A、C
10.A
11.D
12.A。
计算机组成原理第五章答案
10. 什么是I/O接口?它与端口有何区别?为 什么要设置I/O接口?I/O接口如何分类? 解: I/O接口一般指CPU和I/O设备间的连 接部件; I/O端口一般指I/O接口中的各种寄存器。 I/O接口和I/O端口是两个不同的概念。一 个接口中往往包含若干个端口,因此接口地址 往往包含有若干个端口地址。
若为输出,除数据传送方向相反以外,其他操作 与输入类似。工作过程如下: 1)CPU发I/O地址地址总线接口设备选择 器译码选中,发SEL信号开命令接收门; 2)输出: CPU通过输出指令(OUT)将数据放 入接口DBR中; 3)CPU发启动命令 D置0,B置1 接口向设 备发启动命令设备开始工作; 4)CPU等待,输出设备将数据从 DBR取走; 5)外设工作完成,完成信号接口 B置0,D 置 1; 6)准备就绪信号控制总线 CPU,CPU可通 过指令再次向接口DBR输出数据,进行第二次传送。
2. 简要说明CPU与I/O之间传递信息可采用 哪几种联络方式?它们分别用于什么场合? 答: CPU与I/O之间传递信息常采用三种联 络方式:直接控制(立即响应)、 同步、异步。 适用场合分别为: 直接控制适用于结构极简单、速度极慢的 I/O设备,CPU直接控制外设处于某种状态而无须 联络信号。 同步方式采用统一的时标进行联络,适用于 CPU与I/O速度差不大,近距离传送的场合。 异步方式采用应答机制进行联络,适用于 CPU与I/O速度差较大、远距离传送的场合。
启动
I/O准备 就绪
DMA请求
数据传送: 响应, 让出一个 MM周期
现行程序
准备下 个数据
现行程序 A
DMA请求 总线请求
就绪
D
B
CPU
DMAC
C
I/O
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第5章习题参考答案1.请在括号内填入适当答案。
在CPU中:(1)保存当前正在执行的指令的寄存器是(IR );(2)保存当前正在执行的指令地址的寄存器是(AR )(3)算术逻辑运算结果通常放在(DR )和(通用寄存器)。
2.参见图的数据通路。
画出存数指令“STO Rl,(R2)”的指令周期流程图,其含义是将寄存器Rl的内容传送至(R2)为地址的主存单元中。
标出各微操作信号序列。
解:STO R1, (R2)的指令流程图及为操作信号序列如下:STO R1, (R2)R/W=RDR O, G, IR iR2O, G, AR iR1O, G, DR iR/W=W3.参见图的数据通路,画出取数指令“LAD (R3),R0”的指令周期流程图,其含义是将(R3)为地址主存单元的内容取至寄存器R2中,标出各微操作控制信号序列。
解:LAD R3, (R0)的指令流程图及为操作信号序列如下:PC O , G, AR i R/W=R DR O , G, IR iR 3O , G, AR i DR O , G, R 0iR/W=R LAD (R3), R04.假设主脉冲源频率为10MHz ,要求产生5个等间隔的节拍脉冲,试画出时序产生器的逻辑图。
解:5.如果在一个CPU 周期中要产生3个节拍脉冲;T l =200ns ,T 2=400ns ,T 3=200ns ,试画出时序产生器逻辑图。
解:取节拍脉冲T l 、T 2、T 3的宽度为时钟周期或者是时钟周期的倍数即可。
所以取时钟源提供的时钟周期为200ns ,即,其频率为5MHz.;由于要输出3个节拍脉冲信号,而T 3的宽度为2个时钟周期,也就是一个节拍电位的时间是4个时钟周期,所以除了C 4外,还需要3个触发器——C l 、C 2、C 3;并令211C C T *=;321C C T *=;313C C T =,由此可画出逻辑电路图如下:6.假设某机器有80条指令,平均每条指令由4条微指令组成,其中有一条取指微指令是所有指令公用的。
已知微指令长度为32位,请估算控制存储器容量。
解:80条指令,平均每条指令由4条微指令组成,其中有一条公用微指令,所以总微指令条数为80 (4-1)+1=241条微指令,每条微指令32位,所以控存容量为:24132位7.某ALU器件是用模式控制码M S3 S2 S1 C来控制执行不同的算术运算和逻辑操作。
下表列出各条指令所要求的模式控制码,其中y为二进制变量,φ为0或l 任选。
试以指令码(A,B,H,D,E,F,G)为输入变量,写出控制参数M,S3,S2,S l,C的逻辑表达式。
指令码M S3S2S1CA, B H, D E F G 0111111111111yy解:由表可列如下逻辑方程M=GS3=H+D+FS2=A+B+D+H+E+F+GS1=A+B+F+GC=H+D+Ey+Fy8.某机有8条微指令I1—I8,每条微指令所包含的微命令控制信号如下表所示。
a—j分别对应10种不同性质的微命令信号。
假设一条微指令的控制字段仅限为8解:因为有10种不同性质的微命令信号,如果采用直接表示法则需要10位控制字段,现控制字段仅限于8位,那么,为了压缩控制字段的长度,必须设法把一个微指令周期中的互斥性微命令组合在一个小组中,进行分组译码。
经分析,(e,f,h)和(b,i,j)、或(d,i,j)和(e,f,h)、或(g,b,j)和(i,f,h)均是不可能同时出现的互斥信号,所以可将其通过2:4译码后输出三个微命令信号(00表示该组所有的微命令均无效),而其余四个微命令信号用直接表示方式。
因此可用下面的格式安排控制字段。
e f h b i je f h d i jf h i bg j9.微地址转移逻辑表达式如下:μA8 = P1·IR6·T4μA7 = P1·IR5·T4μA6 = P2·C·T4其中μA 8—μA 6为微地址寄存器相应位,P 1和P 2为判别标志,C 为进位标志,IR 5和IR 6为指令寄存器的相应位,T 4为时钟周期信号。
说明上述逻辑表达式的含义,画出微地址转移逻辑图。
解:μA 8 = P 1·IR 6·T 4 表示微地址的第8位在P 1有效时,用IR 6设置 μA 7 = P 1·IR 5·T 4 表示微地址的第7位在P 1有效时,用IR 5设置μA 6 = P 2·C ·T 4 表示微地址的第6位在P 2有效时,用进位标志C 设置, 地址转移逻辑图如下:T P IR μA 8μA 7μA 610.某计算机有如下部件,ALU ,移位器,主存M ,主存数据寄存器MDR ,主存地址寄存器MAR ,指令寄存器IR ,通用寄存器R 0R 3,暂存器C 和D 。
(1)请将各逻辑部件组成一个数据通路,并标明数据流动方向。
(2)画出“ADD R1,R2”指令的指令周期流程图。
解:(1) 设该系统为单总线结构,暂存器C 和D 用于ALU 的输入端数据暂存,移位器作为ALU 输出端的缓冲器,可对ALU 的运算结果进行附加操作,则数据通路可设计如下:(2) 根据上面的数据通路,可画出“ADD R1,R2”(设R1为目的寄存器)的指令周期流程图如下:ADD R1, R211.已知某机采用微程序控制方式,控存容量为512*48位。
微程序可在整个控存中实现转移,控制微程序转移的条件共4个,微指令采用水平型格式,后继微指令地址采用断定方式。
请问;(1)微指令的三个字段分别应为多少位(2)画出对应这种微指令格式的微程序控制器逻辑框图。
解:(1) 因为容量为512*48位,所以下址字段需用9位,控制微程序转移的条件有4个,所以判别测试字段需4位或(3位译码),因此操作控制字段的位数48-9-4=35位(或48-9-3=36位)(2)微程序控制器逻辑框图参见教材图12.今有4级流水线,分别完成取指、指令译码并取数、运算、送结果四步操作。
今假设完成各步 操作的时间依次为100ns ,100ns ,80ns ,50ns 。
请问; (1)流水线的操作周期应设计为多少(2)若相邻两条指令发生数据相关,而且在硬件上不采取措施,那么第2条指令要推迟多少时间进行(3)如果在硬件设计上加以改进,至少需推迟多少时间 答:(1) 流水操作周期为max(100,100,80,50)=100ns(2)若相邻两条指令发生数据相关,而且在硬件上不采取措施,那么在第1条指令“送结果”步骤完成后,第2条指令的“取数”步骤才能开始,也就是说,第2条指令要推迟两个操作周期,即200ns 才能进行。
(3) 如果在硬件设计上加以改进,采用定向传送的技术,则只要第1条指令完成“运算”的步骤,第2条指令就可以“取数”了,因此至少需推迟100ns 。
13.指令流水线有取指(IF)、译码(ID)、执行(EX)、访存(MEM)、写回寄存器堆(WB)五个过程段,共有20条指令连续输入此流水线。
(1)画出流水处理的时空图,假设时钟周期为100ns 。
(2)求流水线的实际吞吐率(单位时间里执行完毕的指令数)。
(3)求流水线的加速比。
解:(1) 流水处理的空图如下,其中每个流水操作周期为100ns :空间I 20EX ID IF时间T(2) 流水线的实际吞吐量:执行20条指令共用5+119=24个流水周期,共2400ns ,所以实际吞吐率为:秒百万条指令/333.8102400209≈⨯- (3) 流水线的加速比为 : 设流水线操作周期为τ,则n 指令串行经过k 个过程段的时间为n*k*τ ;而n 条指令经过可并行的k 段流水线时所需的时间为(k+n-1)*τ; 故20条指令经过5个过程段的加速比为:()17.4195520≈⨯+⨯⨯ττ14.用时空图法证明流水计算机比非流水计算机具有更高的吞吐率。
解:设流水计算机的指令流水线分为4个过程段:IF 、ID 、EX 、WB ,则流水计算机的时空图如下:空间T非流水计算机的时空图:空间I 2时间T由图中可以看出,同样的8个操作周期内,流水计算机执行完了5条指令,而非流水计算机只执行完了2条指令;由此,可看出流水计算机比非流水计算机具有更高的吞吐率。
15.用定量描述法证明流水计算机比非流水计算机具有更高的吞吐率。
证明:设流水计算机具有k 级流水线,每个操作周期的时间为,执行n 条指令的时间为:()τ⨯-+=1n k T ; 吞吐率为:()τ⨯-+=11n k nH而非流水计算机,执行n 条指令的时间为:τ⨯⨯=k n T ;吞吐率为:τ⨯⨯=k n nH 2()1121-+⨯=⨯-+⨯⨯=n k kn n k k n H H ττ 当n=1时,21H H =;当n>1时,21H H >,即:流水计算机具有更高的吞吐率。
16.判断以下三组指令中各存在哪种类型的数据相关(1) I 1 LAD R1,A ; M(A)→R1,M(A)是存储器单元 I 2 ADD R2,Rl ; (R2)+(R1)→R2 (2) I 1 ADD R3,R4 ; (R3)+(R4)→R3 I 2 MUL R4,R5 ; (R4)(R5)→R4(3) I 1 LAD R6,B ; M(B)→R6,M(B)是存储器单元I 2 MUL R6,R7 ; (R6) (R7)→R6 解:(1) I 1的运算结果应该先写入R 1,然后再在I 2中读取R 1的内容作为操作数,所以是发生RAW (“写后读”)相关 (2) WAR(3) RAW 和WAW 两种相关17.参考图所示的超标量流水线结构模型,现有如下6条指令序列: I 1 LAD R1,B ; M(B)→R1,M(B)是存储器单元 I 2 SUB R2,Rl ; (R2)-(R1)→R2 I 3 MUL R3,R4 ; (R3)*(R4)→R3 I 4 ADD R4,R5 ; (R4)+(R5)→R4I 5 LAD R6,A ; M(A)→R6,M(A)是存储器单元I6ADD R6,R7 ;(R6)+(R7)→R6请画出:(1)按序发射按序完成各段推进情况图。
(2)按序发射按序完成的流水线时空图。
解:(1)按序发射按序完成各段推进情况图如下(仍设F、D段要求成对输入;F、D、W段只需1个周期;加需要2个周期;乘需要3个周期;存/取数需要1个周期;执行部件内部有定向传送,结果生成即可使用):取/存加法器乘法器(2) 按序发射按序完成的流水时空图如下:II。