计算机组成原理第5章习题参考答案分解

合集下载

计算机组成原理第5章习题参考答案讲解

计算机组成原理第5章习题参考答案讲解

第5章习题参考答案1.请在括号内填入适当答案。

在CPU中:(1)保存当前正在执行的指令的寄存器是(IR );(2)保存当前正在执行的指令地址的寄存器是(AR )(3)算术逻辑运算结果通常放在(DR )和(通用寄存器)。

2.参见图5.15的数据通路。

画出存数指令“STO Rl,(R2)”的指令周期流程图,其含义是将寄存器Rl的内容传送至(R2)为地址的主存单元中。

标出各微操作信号序列。

解:STO R1, (R2)的指令流程图及为操作信号序列如下:STO R1, (R2)R/W=RDR O, G, IR iR2O, G, AR iR1O, G, DR iR/W=W3.参见图5.15的数据通路,画出取数指令“LAD (R3),R0”的指令周期流程图,其含义是将(R3)为地址主存单元的内容取至寄存器R2中,标出各微操作控制信号序列。

解:LAD R3, (R0)的指令流程图及为操作信号序列如下:PC O , G, AR i R/W=R DR O , G, IR iR 3O , G, AR i DR O , G, R 0iR/W=R LAD (R3), R04.假设主脉冲源频率为10MHz ,要求产生5个等间隔的节拍脉冲,试画出时序产生器的逻辑图。

解:5.如果在一个CPU 周期中要产生3个节拍脉冲;T l =200ns ,T 2=400ns ,T 3=200ns ,试画出时序产生器逻辑图。

解:取节拍脉冲T l 、T 2、T 3的宽度为时钟周期或者是时钟周期的倍数即可。

所以取时钟源提供的时钟周期为200ns ,即,其频率为5MHz.;由于要输出3个节拍脉冲信号,而T 3的宽度为2个时钟周期,也就是一个节拍电位的时间是4个时钟周期,所以除了C 4外,还需要3个触发器——C l 、C 2、C 3;并令211C C T *=;321C C T *=;313C C T =,由此可画出逻辑电路图如下:6.假设某机器有80条指令,平均每条指令由4条微指令组成,其中有一条取指微指令是所有指令公用的。

计算机组成原理第5章习题参考答案

计算机组成原理第5章习题参考答案

倍? [解] (1)主存容量为 4MB,按字节编址,主存地址为 22 位,地址格式如下图所示: 区号 (8 位) Cache 的地址格式为 组号 (7 位) 组内块号 (2 位) 块内地址 (5 位) (2)由于每个字块有8个字,故主存第0、1、2、⋯、99号字单元分别在字块0~12 中,但 Cache 起始为空,Cache 与主存是以块为单位交换,所以第一次读时每一块中的 第一个单元没命中,但后面7次每个单元均可以命中 命中率=Nc/(Nc+Nm)=(100-13+7×100)/(8×100)=98.4% (3)设 Cache 的存取周期为 T,则主存的存取周期为6T。 有 Cache 的访存时间=H×Tc+(1-H)×(Tm+Tc)=Tc+(1-H)×Tm =T+(1-98.4%)×6T=1.096T 无 Cache 的访存时间为6T,所以速度提高倍数=6÷1.096=5.47 倍。 5-27 已知采用页式虚拟存储器,某程序中一条指令的虚地址是:000001111111100000。该程 序的页表起始地址是 0011,页面大小1K,页表中有关单元最末四位(实页号)见下表: 组号 (7 位) 组内块号 (2 位) 块内地址 (5 位)
_
A12 0 1 0 1
A11~A0 --------------------
第一组 第二组 第三组 第四组
CS 0 A13 A12 CS1 A13 A12 CS 2 A13 A12
CS 3 A13 A12
存储器的逻辑图如图 1 所示。 5-16.现有如下存储芯片:2K×1 的 ROM、4K×1 的 RAM、8K×1 的 ROM。若用它们组成容量为 16KB 的存储器,前 4KB 为 ROM,后 12KB 为 RAM,CPU 的地址总线 16 位。 (1)各种存储芯片分别用多少片? (2)正确选用译码器及门电路,并画出相应的逻辑结构图。 (3)指出有无地址重叠现象。 [解]: (1) 需要用 2K×1 的 ROM 芯片 16 片,4K×1 的 RAM 芯片 24 片。不能用 8K×1 的 ROM 芯片,因为大于 ROM 应有的空间。 (2) 各存储芯片的地址跟配如下: A15 A14 A13 A12 A11 A10~A0 X X 0 0 0 ----- 2KB ROM X X 0 0 1 ------ 2KB ROM X X 0 1 ----------------- 4KB RAM X X 1 0 ----------------- 4KB RAM X X 1 1 ----------------- 4KB RAM 相应的逻辑结构图如图 2 示。 (3)有地址重叠现象。因为地址线 A15、A14 没有参加译码

计算机组成原理—习题解答(第五章)

计算机组成原理—习题解答(第五章)

第五章题解计算机组成原理习题解答5.15.1 什么是总线主模块?什么是总线从模块?试说明下列情况中谁是主模块、谁是从模块?(1)CPU执行程序;(2)CPU与I/O设备交换数据;(3)高速I/O设备与主存交换数据。

题解:主模块指对总线具有控制能力的模块;而从模块是指只能被动地响应主模块发来的总线命令的模块,从模块对总线没有控制权。

(1)CPU是主模块,存储器是从模块;(2)CPU是主模块,I/O设备是从模块;(3)高速I/O设备是主模块,主存是从模块。

5.35.3 某总线在一个总线周期中并行传送8个字节的信息,假设一个总线周期等于一个总线时钟周期,总线频率为70MHz,求总线带宽和数据传输率各是多少?题解:总线带宽= 70MHz×8B =560MBps总线数据传输率= 560MBps =4480bps5.45.4 请计算总线性能参数:(1)对于某32位总线,如果总线时钟频率为33MHz,若一个总线周期等于3个总线时钟周期,那么总线带宽和数据传输率各是多少?(2)如果总线时钟频率升至66MHz,总线宽度扩展为64位,总线周期缩短为2个总线时钟周期,那么总线带宽和数据传输率又各是多少?题解:⑴总线宽度=32位/8 =4B总线带宽= 33MHz×4B=132MBps总线数据传输率= 33MHz×4B/3=44MBps⑵总线宽度=64位/8 =8B总线带宽= 66MHz×8B=528MBps总线数据传输率=66MHz×8B/2=264MBps5.55.5 异步通信方式和同步通信方式的实质性区别是什么?对于采用异步通信方式的总线来说,发送者和接收者按照各自的速度处理数据传送,那么它们之间是否需要进行时间上的协调?为什么?答:异步通信和同步通信的实质性区别在于是否采用统一的时标进行控制。

对于采用异步通信方式的总线来说,发送者和接收者按照各自的速度处理数据传送,它们之间需要进行时间上的协调,采用应答方式取得联系,否则无法配合完成操作。

计算机组成原理习题答案第五章

计算机组成原理习题答案第五章
[Y]浮′=0101;1.100001
对阶之后,尾数相加和相减。
相加:11.011110
+11.100001
10.111111
需右规一次,[X+Y]浮=0110;1.011111
所以X+Y=2110×(-0.100001)
相减:11.011110
+00.011111
11.111101
需左规4次,[X-Y]浮=0001;1.010000

15
16
17
18
1911000
11001
11010
11011
1110010101
10110
10111
11000
11001
若A≥5,B≥5,
则+3校正
①和在0~4范围内,不用校正,结果正确。
②和在6~9范围内,当A<5,B<5,需+3校正,而当A<5,B≥5或A≥5,B<5
时,不需校正。故校正函数为:
1/4X补=1.1111001,[4X]补=1.0011000
(4)1.0000111
1/4X补=1.1100001,[4X]补=1.0011100
5.证明在全加器里,进位传递函数P=A i+Bi=Ai⊕Bi。
解:并行加法器中的每一个全加器都有一个从低位送来的进位和一个传送给较高位
的进位。进位表达式为
相加:00.010110
+11 .011000
11.101110
需左规一次,[X+Y]浮=1011;1.011100
所以X+Y=2-101×(-0.100100)
相减:00.010110
+00.101000
00.111110
所以X-Y=2-100×0.111110
(3)X=2-011×0.101100,Y=2-001×(-0.111100)

计算机组成原理第五章答案90051

计算机组成原理第五章答案90051

5 .4 教材习题解答1.如何区别存储器和寄存器?两者是一回事的说法对吗?解:存储器和寄存器不是一回事.存储器在CPU 的外边,专门用来存放程序和数据,访问存储器的速度较慢。

寄存器属于CPU 的一部分,访问寄存器的速度很快。

2.存储器的主要功能是什么?为什么要把存储系统分成若干个不同层次?主要有哪些层次?解:存储器的主要功能是用来保存程序和数据。

存储系统是由几个容量、速度和价存储系统和结构第5章129 格各不相同的存储器用硬件、软件、硬件与软件相结合的方法连接起来的系统。

把存储系统分成若干个不同层次的目的是为了解决存储容量、存取速度和价格之间的矛盾。

由高速缓冲存储器、主存储器、辅助存储器构成的三级存储系统可以分为两个层次,其中高速缓存和主存间称为Cache -主存存储层次(Cache 存储系统);主存和辅存间称为主存—辅存存储层次(虚拟存储系统) 。

3.什么是半导体存储器?它有什么特点?解:采用半导体器件制造的存储器,主要有MOS 型存储器和双极型存储器两大类.半导体存储器具有容量大、速度快、体积小、可靠性高等特点.半导体随机存储器存储的信息会因为断电而丢失。

4.SRAM 记忆单元电路的工作原理是什么?它和DRAM 记忆单元电路相比有何异同点?解:SRAM 记忆单元由6个MOS 管组成,利用双稳态触发器来存储信息,可以对其进行读或写,只要电源不断电,信息将可保留.DRAM 记忆单元可以由4个和单个MOS管组成,利用栅极电容存储信息,需要定时刷新。

5.动态RAM 为什么要刷新?一般有几种刷新方式? 各有什么优缺点?解:DRAM 记忆单元是通过栅极电容上存储的电荷来暂存信息的,由于电容上的电荷会随着时间的推移被逐渐泄放掉,因此每隔一定的时间必须向栅极电容补充一次电荷,这个过程就叫做刷新。

常见的刷新方式有集中式、分散式和异步式3种。

集中方式的特点是读写操作时不受刷新工作的影响,系统的存取速度比较高;但有死区,而且存储容量越大,死区就越长。

最新计算机组成原理第五章答案

最新计算机组成原理第五章答案

第5章习题参考答案1.请在括号内填入适当答案。

在CPU中:(1)保存当前正在执行的指令的寄存器是(IR );(2)保存当前正在执行的指令地址的寄存器是(AR )(3)算术逻辑运算结果通常放在(DR )和(通用寄存器)。

2.参见图5.15的数据通路。

画出存数指令“STO Rl,(R2)”的指令周期流程图,其含义是将寄存器Rl的内容传送至(R2)为地址的主存单元中。

标出各微操作信号序列。

解:STO R1, (R2)的指令流程图及微操作信号序列如下:STO R1, (R2)R/W=RDR O, G, IR iR2O, G, AR iR1O, G, DR iR/W=W3.参见图5.15的数据通路,画出取数指令“LAD (R3),R0”的指令周期流程图,其含义是将(R3)为地址主存单元的内容取至寄存器R2中,标出各微操作控制信号序列。

解:LAD R3, (R0)的指令流程图及为操作信号序列如下:PC O , G, AR i R/W=R DR O , G, IR iR 3O , G, AR i DR O , G, R 0iR/W=R LAD (R3), R04.假设主脉冲源频率为10MHz ,要求产生5个等间隔的节拍脉冲,试画出时序产生器的逻辑图。

解:5.如果在一个CPU 周期中要产生3个节拍脉冲;T l =200ns ,T 2=400ns ,T 3=200ns ,试画出时序产生器逻辑图。

解:取节拍脉冲T l 、T 2、T 3的宽度为时钟周期或者是时钟周期的倍数即可。

所以取时钟源提供的时钟周期为200ns ,即,其频率为5MHz.;由于要输出3个节拍脉冲信号,而T 3的宽度为2个时钟周期,也就是一个节拍电位的时间是4个时钟周期,所以除了C 4外,还需要3个触发器——C l 、C 2、C 3;并令211C C T *=;321C C T *=;313C C T =,由此可画出逻辑电路图如下:6.假设某机器有80条指令,平均每条指令由4条微指令组成,其中有一条取指微指令是所有指令公用的。

计算机组成原理第五章部分课后题答案

计算机组成原理第五章部分课后题答案

计算机组成原理第五章部分课后题答案常用的I/O编址方式有两种:I/O与内存统一编址和I/O独立编址·I/O与内存统一编址方式的I/O地址采用与主存单元地址完全一样的格式,I/O设备与主存占用同一个地址空间,CPU可像访问主存一样访问I/O设备,不需要安排专门的I/O指令。

·I/O独立编址方式时机器为I/O设备专门安排一套完全不同于主存地址格式的地址编码,此时I/O地址与主存地址是两个独立的空间,CPU需要通过专门的I/O指令来访问I/O地址空间。

I/O设备与主机交换信息时,共有哪几种控制方式?简述它们的特点。

·程序直接控制方式:也称查询方式,采用该方式,数据在CPU和外设间的传送完全靠计算机程序控制,CPU的操作和外围设备操作同步,硬件结构简单,但由于外部设备动作慢,浪费CPU时间多,系统效率低。

·程序中断方式:外设备准备就绪后中断方式猪肚通知CPU,在CPU相应I/O设备的中断请求后,在暂停现行程序的执行,转为I/O 设备服务可明显提高CPU的利用率,在一定程度上实现了主机和I/O设备的并行工作,但硬件结构负载,服务开销时间大·DMA方式与中断方式一样,实现了主机和I/O设备的并行工作,由于DMA 方式直接依靠硬件实现贮存与I/O设备之间的数据传送,传送期间不需要CPU程序干预,CPU可继续执行原来的程序,因此CPU利用率和系统效率比中断方式更高,但DMA方式的硬件结构更为复杂。

比较程序查询方式、程序中断方式和DMA方式对CPU工作效率的影响。

·程序查询方式:主要用于CPU不太忙且传送速度不高的情况下。

无条件传送方式作为查询方式的一个特例,主要用于对简单I/O设备的控制或CPU明确知道外设所处状态的情况下。

·中断方式:主要用于CPU的任务比较忙的情况下,尤其适合实时控制和紧急事件的处理· DMA方式(直接存储器存取方式):主要用于高速外设进行大批量数据传送的场合。

计算机组成原理第五章答案

计算机组成原理第五章答案

10. 什么是I/O接口?它与端口有何区别?为 什么要设置I/O接口?I/O接口如何分类? 解: I/O接口一般指CPU和I/O设备间的连 接部件; I/O端口一般指I/O接口中的各种寄存器。 I/O接口和I/O端口是两个不同的概念。一 个接口中往往包含若干个端口,因此接口地址 往往包含有若干个端口地址。
若为输出,除数据传送方向相反以外,其他操作 与输入类似。工作过程如下: 1)CPU发I/O地址地址总线接口设备选择 器译码选中,发SEL信号开命令接收门; 2)输出: CPU通过输出指令(OUT)将数据放 入接口DBR中; 3)CPU发启动命令 D置0,B置1 接口向设 备发启动命令设备开始工作; 4)CPU等待,输出设备将数据从 DBR取走; 5)外设工作完成,完成信号接口 B置0,D 置 1; 6)准备就绪信号控制总线 CPU,CPU可通 过指令再次向接口DBR输出数据,进行第二次传送。
2. 简要说明CPU与I/O之间传递信息可采用 哪几种联络方式?它们分别用于什么场合? 答: CPU与I/O之间传递信息常采用三种联 络方式:直接控制(立即响应)、 同步、异步。 适用场合分别为: 直接控制适用于结构极简单、速度极慢的 I/O设备,CPU直接控制外设处于某种状态而无须 联络信号。 同步方式采用统一的时标进行联络,适用于 CPU与I/O速度差不大,近距离传送的场合。 异步方式采用应答机制进行联络,适用于 CPU与I/O速度差较大、远距离传送的场合。
启动
I/O准备 就绪
DMA请求
数据传送: 响应, 让出一个 MM周期
现行程序
准备下 个数据
现行程序 A
DMA请求 总线请求
就绪
D
B
CPU
DMAC
C
I/O

计算机组成原理第5章部分习题参考答案

计算机组成原理第5章部分习题参考答案

第五章部分习题参考答案【5-10】一个1K * 8的存储芯片需要多少根地址线,数据输入输出线?解:1024 = 10 根。

由于一次可读写8位数据,所以需要8根数据输入输出线。

n = log2【5-11】某计算机字长32位,存储容量64KB,按字编址的寻址范围是多少?若主存以字节编址,试画出主存字地址和字节地址的分配情况?解:因为字长32位,所以64KB = 16KW,要表示16K个存储单元,需要14根地址线。

所以按字编址的寻址范围是0000H ~ 3FFFH 。

若按字节编址,假设采用PC机常用的小端方案,则主存示意图如下:【5-13】现有1024×1的存储芯片,若用它组成容量为16K×8的存储器。

试求:(1)实现该存储器所需芯片数量(2)若将这些芯片分装在若干块板上,每块板的容量是4K×8,该存储器所需的地址线的总位数是多少?其中几位用于选板?几位用于选片?几位用作片内地址?解:(1)需要16组来构成16K,共需芯片16×8 = 128片(2)需要的地址线总位数是14位。

因为共需4块板,所以2位用来选板,板内地址12位,片内地址10位。

每块板的结构如下图4块板共同组成16K×8存储器的结构图【5-15】某半导体存储器容量16K×8,可选SRAM芯片的容量为4K ×4;地址总线A15~A0(A0为最低位),双向数据总线D7~D0,由R/W线控制读写。

设计并画出该存储器的逻辑图,并注明地址分配、片选逻辑和片选信号的极性。

解:注:采用全译码方式方案4组不同的4K的RAM芯片。

可以写出片选逻辑表达式【5-17】用容量为16K×1的DRAM芯片构成64KB的存储器(1)画出该存储器的结构框图(2)设存储器的读写周期均为0.5微秒,CPU在1微秒内至少要访存一次,试问采用哪种刷新方式比较合理?相邻两行之间的刷新间隔是多少?对全部存储单元刷新一遍所需的实际刷新时间是多少?解:(1)结构框图如下(若看不清可以从”视图”菜单中调整显示比例)(2)由于存储器芯片规格为16K×1,所以,其芯片内部的存储矩阵是128×128的存储矩阵。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第5章习题参考答案1.请在括号内填入适当答案。

在CPU中:(1)保存当前正在执行的指令的寄存器是(IR );(2)保存当前正在执行的指令地址的寄存器是(AR )(3)算术逻辑运算结果通常放在(DR )和(通用寄存器)。

2.参见图5.15的数据通路。

画出存数指令“STO Rl,(R2)”的指令周期流程图,其含义是将寄存器Rl的内容传送至(R2)为地址的主存单元中。

标出各微操作信号序列。

解:STO R1, (R2)的指令流程图及为操作信号序列如下:STO R1, (R2)R/W=RDR O, G, IR iR2O, G, AR iR1O, G, DR iR/W=W3.参见图5.15的数据通路,画出取数指令“LAD (R3),R0”的指令周期流程图,其含义是将(R3)为地址主存单元的内容取至寄存器R2中,标出各微操作控制信号序列。

解:LAD R3, (R0)的指令流程图及为操作信号序列如下:PC O , G, AR i R/W=R DR O , G, IR iR 3O , G, AR i DR O , G, R 0iR/W=R LAD (R3), R04.假设主脉冲源频率为10MHz ,要求产生5个等间隔的节拍脉冲,试画出时序产生器的逻辑图。

解:5.如果在一个CPU 周期中要产生3个节拍脉冲;T l =200ns ,T 2=400ns ,T 3=200ns ,试画出时序产生器逻辑图。

解:取节拍脉冲T l 、T 2、T 3的宽度为时钟周期或者是时钟周期的倍数即可。

所以取时钟源提供的时钟周期为200ns ,即,其频率为5MHz.;由于要输出3个节拍脉冲信号,而T 3的宽度为2个时钟周期,也就是一个节拍电位的时间是4个时钟周期,所以除了C 4外,还需要3个触发器——C l 、C 2、C 3;并令211C C T *=;321C C T *=;313C C T =,由此可画出逻辑电路图如下:6.假设某机器有80条指令,平均每条指令由4条微指令组成,其中有一条取指微指令是所有指令公用的。

已知微指令长度为32位,请估算控制存储器容量。

解:80条指令,平均每条指令由4条微指令组成,其中有一条公用微指令,所以总微指令条数为80⨯ (4-1)+1=241条微指令,每条微指令32位,所以控存容量为:241⨯32位7.某ALU器件是用模式控制码M S3 S2 S1 C来控制执行不同的算术运算和逻辑操作。

下表列出各条指令所要求的模式控制码,其中y为二进制变量,φ为0或l任选。

试以指令码(A,B,H,D,E,F,G)为输入变量,写出控制参数M,S3,S2解:由表可列如下逻辑方程M=GS3=H+D+FS2=A+B+D+H+E+F+GS1=A+B+F+GC=H+D+Ey+Fy8.某机有8条微指令I1—I8,每条微指令所包含的微命令控制信号如下表所示。

a—j分别对应10种不同性质的微命令信号。

假设一条微指令的控制字段仅限为8解:因为有10种不同性质的微命令信号,如果采用直接表示法则需要10位控制字段,现控制字段仅限于8位,那么,为了压缩控制字段的长度,必须设法把一个微指令周期中的互斥性微命令组合在一个小组中,进行分组译码。

经分析,(e,f,h)和(b,i,j)、或(d,i,j)和(e,f,h)、或(g,b,j)和(i,f,h)均是不可能同时出现的互斥信号,所以可将其通过2:4译码后输出三个微命令信号(00表示该组所有的微命令均无效),而其余四个微命令信号用直接表示方式。

因此可用下面的格式安排控制字段。

e f h b i je f h d i jf h i bg j9.微地址转移逻辑表达式如下:μA8 = P1·IR6·T4μA7 = P1·IR5·T4μA6 = P2·C·T4其中μA 8—μA 6为微地址寄存器相应位,P 1和P 2为判别标志,C 为进位标志,IR 5和IR 6为指令寄存器的相应位,T 4为时钟周期信号。

说明上述逻辑表达式的含义,画出微地址转移逻辑图。

解:μA 8 = P 1·IR 6·T 4 表示微地址的第8位在P 1有效时,用IR 6设置 μA 7 = P 1·IR 5·T 4 表示微地址的第7位在P 1有效时,用IR 5设置μA 6 = P 2·C ·T 4 表示微地址的第6位在P 2有效时,用进位标志C 设置, 地址转移逻辑图如下:T P IR μA 8μA 7μA 610.某计算机有如下部件,ALU ,移位器,主存M ,主存数据寄存器MDR ,主存地址寄存器MAR ,指令寄存器IR ,通用寄存器R 0 R 3,暂存器C 和D 。

(1)请将各逻辑部件组成一个数据通路,并标明数据流动方向。

(2)画出“ADD R1,R2”指令的指令周期流程图。

解:(1) 设该系统为单总线结构,暂存器C 和D 用于ALU 的输入端数据暂存,移位器作为ALU 输出端的缓冲器,可对ALU 的运算结果进行附加操作,则数据通路可设计如下:(2) 根据上面的数据通路,可画出“ADD R1,R2”(设R1为目的寄存器)的指令周期流程图如下:ADD R1, R211.已知某机采用微程序控制方式,控存容量为512*48位。

微程序可在整个控存中实现转移,控制微程序转移的条件共4个,微指令采用水平型格式,后继微指令地址采用断定方式。

请问;(1)微指令的三个字段分别应为多少位?(2)画出对应这种微指令格式的微程序控制器逻辑框图。

解:(1) 因为容量为512*48位,所以下址字段需用9位,控制微程序转移的条件有4个,所以判别测试字段需4位或(3位译码),因此操作控制字段的位数48-9-4=35位(或48-9-3=36位)(2)微程序控制器逻辑框图参见教材P.147图5.2312.今有4级流水线,分别完成取指、指令译码并取数、运算、送结果四步操作。

今假设完成各步操作的时间依次为100ns ,100ns ,80ns ,50ns 。

请问; (1)流水线的操作周期应设计为多少?(2)若相邻两条指令发生数据相关,而且在硬件上不采取措施,那么第2条指令要推迟多少时间进行?(3)如果在硬件设计上加以改进,至少需推迟多少时间? 答:(1) 流水操作周期为max(100,100,80,50)=100ns(2)若相邻两条指令发生数据相关,而且在硬件上不采取措施,那么在第1条指令“送结果”步骤完成后,第2条指令的“取数”步骤才能开始,也就是说,第2条指令要推迟两个操作周期,即200ns 才能进行。

(3) 如果在硬件设计上加以改进,采用定向传送的技术,则只要第1条指令完成“运算”的步骤,第2条指令就可以“取数”了,因此至少需推迟100ns 。

13.指令流水线有取指(IF)、译码(ID)、执行(EX)、访存(MEM)、写回寄存器堆(WB)五个过程段,共有20条指令连续输入此流水线。

(1)画出流水处理的时空图,假设时钟周期为100ns 。

(2)求流水线的实际吞吐率(单位时间里执行完毕的指令数)。

(3)求流水线的加速比。

解:(1) 流水处理的空图如下,其中每个流水操作周期为100ns :空间I 20EX ID IF123456⋯192021222324时间T(2) 流水线的实际吞吐量:执行20条指令共用5+1⨯19=24个流水周期,共2400ns ,所以实际吞吐率为:秒百万条指令/333.8102400209≈⨯- (3) 流水线的加速比为 : 设流水线操作周期为τ,则n 指令串行经过k 个过程段的时间为n*k*τ ;而n 条指令经过可并行的k 段流水线时所需的时间为(k+n-1)*τ; 故20条指令经过5个过程段的加速比为:()17.4195520≈⨯+⨯⨯ττ14.用时空图法证明流水计算机比非流水计算机具有更高的吞吐率。

解:设流水计算机的指令流水线分为4个过程段:IF 、ID 、EX 、WB ,则流水计算机的时空图如下:空间T非流水计算机的时空图:空间I 212345678时间T由图中可以看出,同样的8个操作周期内,流水计算机执行完了5条指令,而非流水计算机只执行完了2条指令;由此,可看出流水计算机比非流水计算机具有更高的吞吐率。

15.用定量描述法证明流水计算机比非流水计算机具有更高的吞吐率。

证明:设流水计算机具有k 级流水线,每个操作周期的时间为τ,执行n 条指令的时间为:()τ⨯-+=1n k T ; 吞吐率为:()τ⨯-+=11n k nH而非流水计算机,执行n 条指令的时间为:τ⨯⨯=k n T ;吞吐率为:τ⨯⨯=k n nH 2()1121-+⨯=⨯-+⨯⨯=n k kn n k k n H H ττ 当n=1时,21H H =;当n>1时,21H H >,即:流水计算机具有更高的吞吐率。

16.判断以下三组指令中各存在哪种类型的数据相关?(1) I 1 LAD R1,A ; M(A)→R1,M(A)是存储器单元 I 2 ADD R2,Rl ; (R2)+(R1)→R2 (2) I 1 ADD R3,R4 ; (R3)+(R4)→R3 I 2 MUL R4,R5 ; (R4)⨯(R5)→R4(3) I 1 LAD R6,B ; M(B)→R6,M(B)是存储器单元I 2 MUL R6,R7 ; (R6)⨯ (R7)→R6 解:(1) I 1的运算结果应该先写入R 1,然后再在I 2中读取R 1的内容作为操作数,所以是发生RAW (“写后读”)相关 (2) WAR(3) RAW 和WAW 两种相关17.参考图5.39所示的超标量流水线结构模型,现有如下6条指令序列: I 1 LAD R1,B ; M(B)→R1,M(B)是存储器单元 I 2 SUB R2,Rl ; (R2)-(R1)→R2 I 3 MUL R3,R4 ; (R3)*(R4)→R3 I 4 ADD R4,R5 ; (R4)+(R5)→R4I 5 LAD R6,A ; M(A)→R6,M(A)是存储器单元I6ADD R6,R7 ;(R6)+(R7)→R6请画出:(1)按序发射按序完成各段推进情况图。

(2)按序发射按序完成的流水线时空图。

解:(1)按序发射按序完成各段推进情况图如下(仍设F、D段要求成对输入;F、D、W段只需1个周期;加需要2个周期;乘需要3个周期;存/取数需要1个周期;执行部件内部有定向传送,结果生成即可使用):取/存加法器乘法器(2) 按序发射按序完成的流水时空图如下:II。

相关文档
最新文档