计算机系统结构 第三章(习题解答)

合集下载

计算机系统结构第3章部分习题参考答案

计算机系统结构第3章部分习题参考答案

第3章 部分习题参考答案3.2 (题目略)【解】overlap o i cpu T T T T -+=/,其中T overlap 的最大值为T cup 。

由题意可得当CPU 速度提高4倍后,T =30/4+20-30/4=20(s)。

(注:T overlap 为CPU 和I/O 重叠执行的时间)3.7 (题目略)【解】(1)处理机响应各中断源的中断请求的先后次序与它们的中断优先级一样:D 1D 2D 3D 4D 5;实际的中断处理次序为:D 1D 2D 3D 4D 5。

(2)处理机响应各中断源的中断请求的先后次序与它们的中断优先级一样:D 1D 2D 3D 4D 5;实际的中断处理次序为: D 4D 5 D 3 D 2D 1。

(3)处理机响应各中断源的中断服务请求和实际运行中断服务程序过程的示意图如下:(4)处理机响应各中断源的中断服务请求和实际运行中断服务程序过程的示意图如下:3.9 (题目略)【解】字节多路通道适用于连接大量像光电机等字符类低速设备。

这些设备传送一个字中断请求D 3,D 4,D 5时间tD 1, D 2 中断请求主程序中断服务程序 D 1,D 2,D 3,D 4,D 5 时间t符(字节)的时间很短,但字符(字节)间的等待时间很长。

通道“数据宽度”为单字节,以字节交叉方式轮流为多台设备服务,使效率提高。

字节多路通道可有多个子通道,同时执行多个通道程序。

数组多路通道适合于连接多台像磁盘等高速设备。

这些设备的传送速率很高,但传送开始前的寻址辅助操作时间很长。

通道“数据宽度”为定长块,多台设备以成组交叉方式工作,以充分利用并尽量重叠各台高速设备的辅助操作时间。

传送完K个字节数据,就重新选择下个设备。

数组多路通道可有多个子通道,同时执行多个通道程序。

选择通道适合于连接像磁盘等优先级高的高速设备,让它独占通道,只能执行一道通道程序。

通道“数据宽度”为可变长块,一次将N个字节全部传送完,在数据传送期只选择一次设备。

北理工计算机体系结构习题解答

北理工计算机体系结构习题解答

*1
32000 *
2
15000
*
2
8000
*
2)
*
(
40
1 *106
)
3.875*103秒
21
1-11 假设在一台40MHz处理机上运营200,000条指令旳目旳代码,程序主要
由四种指令构成。根据程序跟踪试验成果,已知指令混合比和每种指令所 需旳指令数如下:
指令类型
CPI
指令混合比
算术和逻辑
1
6
第1章 基础知识
仿真
用一种机器(A)旳微程序直接解 释 实 现 另 一 种 机 器 ( B) 旳 指 令 系 统,从而实现软件移植旳措施
被仿真旳机器称为目旳机,进行 仿真旳机器称为宿主机,解释微 程序机器称为仿真微程序
7
第1章 基础知识
并行性
指能够同步进行运算或操作旳特 征,它有两重含义:
40
第2章
(1)最优Huffman H=- ∑Pi×log2Pi
=0.25×2+0.20×2.322+0.15×2.737+ ……
=2.96
41
I10
I9
I8
I7
I6
I5
I4
I3
I2
0.02
0.03
0.04
0.05
0.08
0.08
0.10
0.15
0.20
1
1 0
0
0.05
0.09
1
0
1
0
0.17
原来存在旳事物或属性,从某个角 度看却好象不存在
软件兼容
程序能够不加修改地运营在各档机 器上,区别仅在于运营时间不同

(完整版)第3章计算机网络体系结构(习题答案)

(完整版)第3章计算机网络体系结构(习题答案)

第3章计算机网络体系结构一、填空题1.协议主要由(语法)、(语义)和(同步)三个要素组成。

2.OSI模型分为(物理层)、(数据链路层)、(网络层)、(传输层)、(会话层)、(表示层)和(应用层)七个层次。

3.OSI模型分为(资源子网)和(通信子网)两个部分。

4.物理层定义了(机械特性)、(电气特性)、(功能特性)和(规程特性)四个方面的内容。

5.数据链路层处理的数据单位称为(帧)。

6.数据链路层的主要功能有(链路管理)、(成帧)、(信道共享)、(帧同步)、(流量控制)、(差错控制)、(透明传输)和(寻址)。

7.在数据链路层中定义的地址通常称为(硬件地址)或(物理地址)。

8.网络层所提供的服务可以分为两类:(面向连接的)服务和(无连接的)服务。

9.传输层的功能包括(服务选择)、(连接管理)、(流量控制)、(拥塞控制)和(差错控制)等。

二、名词解释同步协议实体对等层对等层通信服务 CIDR 协议数据单元服务数据单元同步同步指的是广义的、在一定条件下发生什么事情的特性,而且条件和时间有关,具有时序的含义。

协议计算机网络中意图进行通信的结点必须要遵守一些事先约定好的规则。

这些为进行数据交换而建立的规则、标准或约定即称为协议,也称为网络协议。

实体任何接收或者发送数据的硬件单元或者软件进程模块都可以称为通信实体,简称实体。

对等层不同的网络结点,若它们遵循的是同一种网络体系结构的话,那么在不同结点上完成同样功能的层次称为对等层。

对等层通信在分层的网络体系结构中,每个层次只知道自己从上层接收来数据并处理后再传递给下一层,结果通信目的方该层次的对等层就收到与己方处理的一模一样的数据。

就好像在两个对等层之间有一条“通道”直接把数据传送过去一样,这种情况就称为对等层通信。

服务下一层能被上一层看见的功能称为服务。

协议数据单元、服务数据单元对等层上传送的数据单位称为协议数据单元,而直接相邻的两个层次之间交换的数据单位称为服务数据单元。

计算机系统结构(第2版(课后习题答案

计算机系统结构(第2版(课后习题答案

word 文档下载后可自由复制编辑你计算机系统结构清华第 2 版习题解答word 文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9 (透明性概念),1.12-1.18 (Amdahl定律),1.19、1.21 、1.24 (CPI/MIPS)1.2 第二章(P124)2.3 、2.5 、2.6 (浮点数性能),2.13 、2.15 (指令编码)1.3 第三章(P202)3.3 (存储层次性能), 3.5 (并行主存系统),3.15-3.15 加 1 题(堆栈模拟),3.19 中(3)(4)(6)(8)问(地址映象/ 替换算法-- 实存状况图)word 文档下载后可自由复制编辑1.4 第四章(P250)4.5 (中断屏蔽字表/中断过程示意图),4.8 (通道流量计算/通道时间图)1.5 第五章(P343)5.9 (流水线性能/ 时空图),5.15 (2种调度算法)1.6 第六章(P391)6.6 (向量流水时间计算),6.10 (Amdahl定律/MFLOPS)1.7 第七章(P446)7.3 、7.29(互连函数计算),7.6-7.14 (互连网性质),7.4 、7.5 、7.26(多级网寻径算法),word 文档下载后可自由复制编辑7.27 (寻径/ 选播算法)1.8 第八章(P498)8.12 ( SISD/SIMD 算法)1.9 第九章(P562)9.18 ( SISD/多功能部件/SIMD/MIMD 算法)(注:每章可选1-2 个主要知识点,每个知识点可只选 1 题。

有下划线者为推荐的主要知识点。

)word 文档 下载后可自由复制编辑2 例 , 习题2.1 第一章 (P33)例 1.1,p10假设将某系统的某一部件的处理速度加快到 10倍 ,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知: Fe=0.4, Se=10,根据 Amdahl 定律S n To T n1 (1Fe )S n 1 10.6 0.4100.64 Fe Se 1.56word 文档 下载后可自由复制编辑例 1.2,p10采用哪种实现技术来求浮点数平方根 FPSQR 的操作对系统的性能影响较大。

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。

高阶交错存储器具有扩展方便、存取效率低的优点。

低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。

(2)各种存储器的带宽与其工作频率有关。

不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。

(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。

3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。

计算机系统结构-第三章(习题解答)

计算机系统结构-第三章(习题解答)

计算机系统结构-第三章(习题解答)1. 什么是存储系统?对于一个由两个存储器M 1和M 2构成的存储系统,假设M1的命中率为h ,两个存储器的存储容量分别为s 1和s 2,存取时间分别为t 1和t 2,每千字节的成本分别为c 1和c 2。

⑴ 在什么条件下,整个存储系统的每千字节平均成本会接近于c 2? ⑵ 该存储系统的等效存取时间t a 是多少?⑶ 假设两层存储器的速度比r=t 2/t 1,并令e=t 1/t a 为存储系统的访问效率。

试以r 和命中率h 来表示访问效率e 。

⑷ 如果r=100,为使访问效率e>0.95,要求命中率h 是多少?⑸ 对于⑷中的命中率实际上很难达到,假设实际的命中率只能达到0.96。

现在采用一种缓冲技术来解决这个问题。

当访问M 1不命中时,把包括被访问数据在内的一个数据块都从M 2取到M 1中,并假设被取到M 1中的每个数据平均可以被重复访问5次。

请设计缓冲深度(即每次从M 2取到M 1中的数据块的大小)。

答:⑴ 整个存储系统的每千字节平均成本为:12s 1s 2c 2s 1s 1c 2s 1s 2s 2c 1s 1c c ++⨯=+⨯+⨯=不难看出:当s1/s2非常小的时候,上式的值约等于c2。

即:s2>>s1时,整个存储器系统的每千字节平均成本会接近于c2。

⑵ 存储系统的等效存取时间t a 为:2t )h 1(1t h t a ⨯-+⨯=⑶r)h 1(h 1t )h 1(t h t t t e 211a 1⨯-+=⨯-+⨯==⑷ 将数值代入上式可以算得:h>99.95% ⑸通过缓冲的方法,我们需要将命中率从0.96提高到0.9995。

假设对存储器的访问次数为5,缓冲块的大小为m 。

那么,不命中率减小到原来的1/5m ,列出等式有:m596.0119995.0--= 解这个方程得:m=16,即要达到⑷中的访问效率,缓冲的深度应该至少是16(个数据单位)。

计算机操作系统(第四版)课后习题答案第三章

计算机操作系统(第四版)课后习题答案第三章

第三章处理机调度‎与死锁1,高级调度与‎低级调度的‎主要任务是‎什么?为什么要引‎入中级调度‎?【解】(1)高级调度主‎要任务是用‎于决定把外‎存上处于后‎备队列中的‎那些作业调‎入内存,并为它们创‎建进程,分配必要的‎资源,然后再将新‎创建的进程‎排在就绪队‎列上,准备执行。

(2)低级调度主‎要任务是决‎定就绪队列‎中的哪个进‎程将获得处‎理机,然后由分派‎程序执行把‎处理机分配‎给该进程的‎操作。

(3)引入中级调‎度的主要目‎的是为了提‎高内存的利‎用率和系统‎吞吐量。

为此,应使那些暂‎时不能运行‎的进程不再‎占用宝贵的‎内存空间,而将它们调‎至外存上去‎等待,称此时的进‎程状态为就‎绪驻外存状‎态或挂起状‎态。

当这些进程‎重又具备运‎行条件,且内存又稍‎有空闲时,由中级调度‎决定,将外存上的‎那些重又具‎备运行条件‎的就绪进程‎重新调入内‎存,并修改其状‎态为就绪状‎态,挂在就绪队‎列上,等待进程调‎度。

3、何谓作业、作业步和作‎业流?【解】作业包含通‎常的程序和‎数据,还配有作业‎说明书。

系统根据该‎说明书对程‎序的运行进‎行控制。

批处理系统‎中是以作业‎为基本单位‎从外存调入‎内存。

作业步是指‎每个作业运‎行期间都必‎须经过若干‎个相对独立‎相互关联的‎顺序加工的‎步骤。

作业流是指‎若干个作业‎进入系统后‎依次存放在‎外存上形成‎的输入作业‎流;在操作系统‎的控制下,逐个作业进‎程处理,于是形成了‎处理作业流‎。

4、在什么情冴‎下需要使用‎作业控制块‎J CB?其中包含了‎哪些内容?【解】每当作业进‎入系统时,系统便为每‎个作业建立‎一个作业控‎制块JCB‎,根据作业类‎型将它插入‎到相应的后‎备队列中。

JCB 包含的内容‎通常有:1) 作业标识2‎)用户名称3‎)用户账户4‎)作业类型(CPU繁忙‎型、I/O芳名型、批量型、终端型)5)作业状态6‎)调度信息(优先级、作业已运行‎)7)资源要求8‎)进入系统时‎间9) 开始处理时‎间10) 作业完成时‎间11) 作业退出时‎间12) 资源使用情‎况等5.在作业调度‎中应如何确‎定接纳多少‎个作业和接‎纳哪些作业‎?【解】作业调度每‎次接纳进入‎内存的作业‎数,取决于多道‎程序度。

第3章 计算机网络体系结构(习题标准答案)

第3章 计算机网络体系结构(习题标准答案)

第3章计算机网络体系结构(习题答案)————————————————————————————————作者:————————————————————————————————日期:2第3章计算机网络体系结构一、填空题1.协议主要由(语法)、(语义)和(同步)三个要素组成。

2.OSI模型分为(物理层)、(数据链路层)、(网络层)、(传输层)、(会话层)、(表示层)和(应用层)七个层次。

3.OSI模型分为(资源子网)和(通信子网)两个部分。

4.物理层定义了(机械特性)、(电气特性)、(功能特性)和(规程特性)四个方面的内容。

5.数据链路层处理的数据单位称为(帧)。

6.数据链路层的主要功能有(链路管理)、(成帧)、(信道共享)、(帧同步)、(流量控制)、(差错控制)、(透明传输)和(寻址)。

7.在数据链路层中定义的地址通常称为(硬件地址)或(物理地址)。

8.网络层所提供的服务可以分为两类:(面向连接的)服务和(无连接的)服务。

9.传输层的功能包括(服务选择)、(连接管理)、(流量控制)、(拥塞控制)和(差错控制)等。

二、名词解释同步协议实体对等层对等层通信服务 CIDR 协议数据单元服务数据单元同步同步指的是广义的、在一定条件下发生什么事情的特性,而且条件和时间有关,具有时序的含义。

协议计算机网络中意图进行通信的结点必须要遵守一些事先约定好的规则。

这些为进行数据交换而建立的规则、标准或约定即称为协议,也称为网络协议。

实体任何接收或者发送数据的硬件单元或者软件进程模块都可以称为通信实体,简称实体。

对等层不同的网络结点,若它们遵循的是同一种网络体系结构的话,那么在不同结点上完成同样功能的层次称为对等层。

对等层通信在分层的网络体系结构中,每个层次只知道自己从上层接收来数据并处理后再传递给下一层,结果通信目的方该层次的对等层就收到与己方处理的一模一样的数据。

就好像在两个对等层之间有一条“通道”直接把数据传送过去一样,这种情况就称为对等层通信。

计算机体系结构习题三及答案专升本高升专计算机高本下学期

计算机体系结构习题三及答案专升本高升专计算机高本下学期

计算机体系结构习题三一、(10分)某台主频为400MHz的计算机执行标准测试程序,程序中指令类二、(10分)计算机系统中有三个部件可以改进,这三个部件的改进加速比为:部件加速比1=30;部件加速比2=20;部件加速比3=10 (1)如果部件1和部件2在整个系统运行时间中所占的比例均为30%,那么当部件3的比例为多少时,系统加速比才可以达到10?(2)如果三个部件的所占比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?三、(5分)根据CPU中保存操作数的存储器类型,可以把指令集结构分为哪些类型?四、(10分)在MIPS流水线上运行如下代码序列:LOOP:LW R1,0(R2)DADDIU R1,R1,#1SW R1,0(R2)DADDIU R2,R2,#4DSUB R4,R3,R2BNEZ R4,LOOP其中:R3的初值是R2+396。

假设:在整个代码序列的运行过程中,所有的存储器访问都是命中的,并且在一个时钟周期中可对同一个寄存器在前半周期写,而在后半周期读。

那么:(1)在没有任何其它定向(或旁路)硬件的支持下,请画出该指令序列执行的流水线时空图。

假设采用暂停流水线的策略处理分支指令,且所有的存储器访问都命中Cache,那么执行上述循环需要多少个时钟周期?(2)假设该流水线有通常的定向路径,请画出该指令序列执行的流水线时空图。

假设采用预测分支失败的策略处理分支指令,且所有的存储器访问都命中Cache,那么执行上述循环需要多少个时钟周期?(3)假设该流水线有通常的定向路径和一个时钟周期的延迟分支,请对该循环中的指令进行调度,你可以重新组织指令的顺序,也可以修改指令的操作数,但是注意不能增加指令的条数。

请画出该指令序列执行的流水线时空图,并计算执行上述循环所需要的时钟周期数。

五、(10分)假设某程序各种分支指令数占所有指令数的百分比如下:现有一条段数为4的流水线,无条件分支在第2个时钟周期结束时就被解析出来,而条件分支要到第3个时钟周期结束时才能够被解析出来。

(完整版)计算机操作系统(第四版)课后习题答案第三章

(完整版)计算机操作系统(第四版)课后习题答案第三章

第三章处理机调度与死锁1,高级调度与低级调度的主要任务是什么?为什么要引入中级调度?【解】(1)高级调度主要任务是用于决定把外存上处于后备队列中的那些作业调入内存,并为它们创建进程,分配必要的资源,然后再将新创建的进程排在就绪队列上,准备执行。

(2)低级调度主要任务是决定就绪队列中的哪个进程将获得处理机,然后由分派程序执行把处理机分配给该进程的操作。

(3)引入中级调度的主要目的是为了提高内存的利用率和系统吞吐量。

为此,应使那些暂时不能运行的进程不再占用宝贵的内存空间,而将它们调至外存上去等待,称此时的进程状态为就绪驻外存状态或挂起状态。

当这些进程重又具备运行条件,且内存又稍有空闲时,由中级调度决定,将外存上的那些重又具备运行条件的就绪进程重新调入内存,并修改其状态为就绪状态,挂在就绪队列上,等待进程调度。

3、何谓作业、作业步和作业流?【解】作业包含通常的程序和数据,还配有作业说明书。

系统根据该说明书对程序的运行进行控制。

批处理系统中是以作业为基本单位从外存调入内存。

作业步是指每个作业运行期间都必须经过若干个相对独立相互关联的顺序加工的步骤。

作业流是指若干个作业进入系统后依次存放在外存上形成的输入作业流;在操作系统的控制下,逐个作业进程处理,于是形成了处理作业流。

4、在什么情冴下需要使用作业控制块JCB?其中包含了哪些内容?【解】每当作业进入系统时,系统便为每个作业建立一个作业控制块JCB,根据作业类型将它插入到相应的后备队列中。

JCB 包含的内容通常有:1) 作业标识2)用户名称3)用户账户4)作业类型(CPU 繁忙型、I/O芳名型、批量型、终端型)5)作业状态6)调度信息(优先级、作业已运行)7)资源要求8)进入系统时间9) 开始处理时间10) 作业完成时间11) 作业退出时间12) 资源使用情况等5.在作业调度中应如何确定接纳多少个作业和接纳哪些作业?【解】作业调度每次接纳进入内存的作业数,取决于多道程序度。

计算机系统结构习题答案(李学干)

计算机系统结构习题答案(李学干)

计算机系统结构习题解答第一章习题一1.2一台经解释实现的计算机,可以按照功能划分成4级。

每一级为了执行一条指令需要下一级的N条指令解释。

若执行第1级的一条指令需K纳秒时间,那么执行第2、3、4级的一条指令个需要多少时间?解:①分析:计算机按功能分级时,最底层的为第1级。

向上一次是第2 、3、4级。

解释执行是在低级机器级上,用它的一串指令或语句来解释执行高一级上的一条指令的功能。

是逐条解释的。

②解答:执行第2、3、4级的一条指令各需KNns,KN2ns,KN3ns的时间。

1.3操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接实现,而不由操作系统自己来实现。

根据你对习题1.2的回答,你认为这样做有哪两个好处?答:可以加快操作系统操作命令解释的速度。

同时也节省了存放解释操作命令这部分解释程序所占用的空间。

简化了操作系统机器级的设计。

也有利于减少传统机器级的指令条数。

1.5硬件和软件在什么意义上是等效的?在什么意义上是不等效的?试举例说明。

答:硬件和软件在逻辑意义上是等效的。

在物理意义上是不等效的。

①在原理上,用硬件或固件实现的功能完全可以用软件来完成。

用软件实现的功能也可以用硬件或固件来完成。

功能一样。

②只是反映在速度、价格、实现的难易程度上,这两者是不同的。

性能不同。

③例如,浮点运算在80386以前一直是用软件实现的。

到了80486,将浮点运算器集成到了CPU中,可以直接通过浮点运算指令用硬件实现。

但速度却高的多。

1.9下列哪些对系统程序员是透明的?哪些对应用程序员是透明的?系列机各档不同的数据通路宽度;虚拟存储器;Cache存储器;程序状态字;“启动I/O”指令;“执行”指令;指令缓冲器。

答:①对系统程序员和应用程序员均透明的:是全用硬件实现的计算机组成所包含的方面。

有:数据通路宽度、Cache存储器、指令缓冲器。

②仅对应用程序员透明的:是一些软硬件结合实现的功能。

有:虚拟存储器、程序状态字、“启动I/O”指令。

计算机系统结构第三章(习题解答)

计算机系统结构第三章(习题解答)

1. 什么是存储系统?对于一个由两个存储器M 1和M 2构成的存储系统,假设M1的命中率为h ,两个存储器的存储容量分别为s 1和s 2,存取时间分别为t 1和t 2,每千字节的成本分别为c 1和c 2。

⑴ 在什么条件下,整个存储系统的每千字节平均成本会接近于c 2? ⑵ 该存储系统的等效存取时间t a 是多少?是多少?⑶ 假设两层存储器的速度比r=t 2/t 1,并令e=t 1/t a 为存储系统的访问效率。

试以r 和命中率h 来表示访问效率e 。

⑷ 如果r=100,为使访问效率e>0.95,要求命中率h 是多少?是多少?⑸ 对于⑷中的命中率实际上很难达到,对于⑷中的命中率实际上很难达到,假设实际的命中率只能达到假设实际的命中率只能达到0.96。

现在采用一种缓冲技术来解决这个问题。

采用一种缓冲技术来解决这个问题。

当访问当访问M 1不命中时,不命中时,把包括被访问数把包括被访问数据在内的一个数据块都从M 2取到M 1中,并假设被取到M 1中的每个数据平均可以被重复访问5次。

请设计缓冲深度(即每次从M 2取到M 1中的数据块的大小)。

答:答:⑴ 整个存储系统的每千字节平均成本为:整个存储系统的每千字节平均成本为:12s 1s 2c 2s 1s 1c 2s 1s 2s 2c 1s 1c c ++´=+´+´=不难看出:当s1/s2非常小的时候,上式的值约等于c2。

即:s2>>s1时,整个存储器系统的每千字节平均成本会接近于c2。

⑵ 存储系统的等效存取时间t a 为:为:2t )h 1(1t hta´-+´=⑶r)h 1(h 1t )h 1(t h t t t e 211a1´-+=´-+´==⑷ 将数值代入上式可以算得:h>99.95% ⑸通过缓冲的方法,我们需要将命中率从0.96提高到0.9995。

计算机系统结构(课后习题答案)

计算机系统结构(课后习题答案)

第一章计算机系统结构的基本概念1。

有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。

现若需第i级的N 条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks.第3级上等效程序需运行:(N/M)*(N/M)*Ks。

第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。

note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。

而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。

所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。

答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。

但是实现的性能价格比,实现的难易程序不同。

在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件.3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。

答:计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。

(1)计算机的系统结构相同,但可采用不同的组成。

如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。

从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。

其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。

计算机系统结构课后习题答案

计算机系统结构课后习题答案

计算机系统结构基本习题和答案填空题1、从(使用语言的)角度可以将系统看成是按(功能)划分的多个机器级组成的层次结构。

2、计算机系统结构的层次结构由高到低分别为(应用语言机器级,高级语言机器级,汇编语言机器级,操作系统机器级,传统机器语言机器级,微程序机器级)。

3、应用程序语言经(应用程序包)的(翻译)成高级语言程序。

4、高级语言程序经(编译程序)的(翻译)成汇编语言程序。

5、汇编语言程序经(汇编程序)的(翻译)成机器语言程序。

6、在操作系统机器级,一般用机器语言程序(解释)作业控制语句。

7、传统机器语言机器级,是用(微指令程序)来(解释)机器指令。

8、微指令由(硬件)直接执行。

9、在计算机系统结构的层次结构中,机器被定义为(能存储和执行相应语言程序的算法和数据结构)的集合体。

10、目前M0由(硬件)实现,M1用(微程序(固件))实现,M2到M5大多用(软件)实现。

以(软件)为主实现的机器成为虚拟机。

(虚拟机)不一定全用软件实现,有些操作也可用(固件或硬件)实现。

11、透明指的是(客观存在的事物或属性从某个角度看不到),它带来的好处是(简化某级的设计),带来的不利是(无法控制)。

12、计算机系统结构也称(计算机体系结构),指的是(传统机器级的系统结构)。

它是(软件和硬件/固件)的交界面,是机器语言汇编语言程序设计者或编译程序设计者看到的(机器物理系统)的抽象。

13、计算机组成指的是(计算机系统结构的逻辑实现),包括(机器级内的数据流和控制流)的组成及逻辑设计等。

计算机实现指的是(计算机组成的物理实现),它着眼于(器件)技术和(微组装)技术。

14、确定指令系统中是否要设乘法指令属于(计算机系统结构),乘法指令是用专门的高速乘法器实现还是用加法器实现属于(计算机组成),乘法器和加法-移位器的物理实现属于(计算机实现)。

15、主存容量与编址方式的确定属于(计算机系统结构),主存是否采用多体交叉属于(计算机组成),主存器件的选定属于(计算机实现)。

计算机系统结构课后习题答案(老师划过重点得)

计算机系统结构课后习题答案(老师划过重点得)

…第1章计算机系统结构的基本概念解释下列术语层次结构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

【解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

《计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

/CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

计算机系统结构第3章习题处理

计算机系统结构第3章习题处理

作业: 1. 专用总线 数据宽度 中断分类 中断分级 中断响应次序 5. 6. 9. 10.
数据宽度 中断处理次序 通道极限流量
fmax.byte≥ fbyte
而在字节多路通道上,设备对通道要求的流量应是 所挂全部设备的速率之和。如果字节多路通道上所 挂设备台数为m,设备的速率fi实际就是设备发出字 节传送请求的间隔时间的倒数,m台相同速率的设备 其速率之和为mfi,这样,为不丢失信息,就应该满 足: 1/(Ts+Td) ≥ mfi 于是可求得在字节多路通道上所挂接的设备台数m应 满足: m≤1/(Ts+Td)·i f
根据题目所给出的各台设备每发一个字节数据传 送请求的间隔时间,可得各台设备的速率如下:
设备
A
B
C
D
E
F
设备速率fi(B/µ 1/0.2 1/0.25 1/0.5 1/0.19 1/0.4 1/0.21 s)
这样,能满足上述fi不等式要求的,只能是挂B、 C、E、F这4台设备,A和D因为超过了fmax.select , 所以不能挂。
(2)
中断请求 2 1 3 4 用户程序 1
中断处理程序 2 3 4
t
2.如果通道在数据传送期中选择设备需要9.8µ s,传 送一个字节需要0.2µ s,某低速设备每隔500µ s发 出一个字节数据传送请求,问至多可以接几台这 种低速设备?对于如下A至F这6种设备,一次通 信传送的字节数不少于1024个字节,问哪些可以 挂在此通道上?哪些不能?其中A至F设备每发一 个字节数据传送请求的时间间隔分别为:
了。这就是说,选择通道在宏观上要不丢失设备的 信息,就要限制在通道上所挂设备的速率不能超过 一个限值。 【解答】在字节多路通道方式工作时,限指所挂设 备的台数应为: m≤1/(Ts+Td)·i =500µ f s/(9.8+0.2)µ s=50台 在选择通道方式工作时,通道的极限流量为: fmax.select =1/(Ts /n+Td)≥1B/(9.8µs/n+0.2µs) 其中,n≥1024个字节。所以,限制通道上所挂的 设备速率fi ≤1/(9.8/n+0.2)B/µs才行。

计算机组成原理第五版 白中英(详细)第3章习题参考答案

计算机组成原理第五版 白中英(详细)第3章习题参考答案
(1)数据寄存器多少位?
(2)地址寄存器多少位?
(3)共需多少个E2PROM芯片?
(4)画出此存储器组成框图。
解:(1)系统16位数据,所以数据寄存器16位
(2)系统地址128K=217,所以地址寄存器17位
(3)共需 ,分为4组,每组2片
(4)组成框图如下
7.某机器中,已知配有一个地址空间为0000H3FFFH的ROM区域。现在再用一个RAM芯片(8K×8)形成40K×l6位的RAM区域,起始地为6000H。假设RAM芯片有 和 信号控制端。CPU的地址总线为A15A0,数据总线为D15D0,控制信号为 (读/写), (访存),要求:
8
8
8
8
8
8
8
8
8
8
8
8
8
8
7
7
7
7
c
7
7
7
7
7
7
7
3
3
3
3
3
3
3
3
3
3
d
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
各计数器的值
a
0
1
0
1
2
3
4
5
0
1
2
3
4
0
1
0
1
0
1
2
b
0
1
2
0
1
2
3
4
0
1
0
(1)循环程序由6条指令组成,重复执行80次。
(2)循环程序由8条指令组成,重复执行60次。

计算机系统结构第三章自考练习题答案

计算机系统结构第三章自考练习题答案

第三章总线、中断与输入输出系统历年真题精选1. 通道程序执行结束后引发的中断是( B )。

A. 外中断B. I/O中断C. 程序性中断D. 机械校验中断2.磁盘外部设备适合于连接到( B )。

A. 字节多路通道B. 数组多路通道或选择通道C. 选择通道或字节多路通道D. 数组多路通道或字节多路通道3. 总线控制机构为解决N个部件利用总线时优先顺序的裁决,集中式按时查询,需外加控制线线数为( D )。

N]A.3 B. N+2 C. 2N+1 D. 2+[log24. 虽然中断响应顺序由硬件排队器固定好,但中断实际处置完的顺序是可以通过(系统软件)修改各中断级处置程序的(中断屏蔽)位,而动态改变。

5. 在知足通道设计流量不低于设备工作时的最大流量时,为使微观上不丢失设备信息,可以加设(数据缓冲器)或动态提高响应的(优先级)来弥补。

6. 总线控制方式有哪三种?各需要增加几根用于总线控制的控制线?并说明每种方式优先级的灵活性。

(P64-65)7.((1)20,20,25,40,40,100 us (2)200 B/ms (3)5 us )8.(1)1-3-4-2同步强化练习一、填空题。

1. 中断响应就是允许其中断CPU(现行程序)运行,转去对该请求进行预处置,包括保留(断点及其现场),调出有关处置该中断服务程序,准备运行。

2. 中断系统软硬件功能分派实质是中断(响应)硬件和中断(处置平衡)软件的功能分派。

3. 数组多路通道适用于连接多台(高)速设备,其通道“数据宽度”为(定长块)。

4. 输入输出系统包括输入输出设备、(设备控制器)及输入输出操作有关的(软硬件)。

5. 总线控制机构集中在一处的称(集中)式控制,分散在各部件的称(散布)式控制。

6. 多数低性能单用户计算机的输入输出由(程序员)安排,I/O系统设计主要解决CPU、主存和I/O设备在(速度)上的庞大不同。

7. 信息在总线上的双向传输有(半)双向和(全)双向两种。

计算机组成原理习题第三章

计算机组成原理习题第三章

计算机组成原理习题第三章第三章一.填空题1.在多级存储体系中,cache的主要功能是,虚拟存储器的主要功能是2.SRAM靠存储信息,DRAM靠存储信息。

存储器需要定时刷新。

3.动态半导体存储器的刷新一般有、和4.一个512KB的存储器,其地址线和数据线的总和是5.若RAM芯片里有1024个单元,用单译码方式,地址译码器有条输出线;用双译码方式,地址译码器有条输出线。

6.高速缓冲存储器中保存的信息是主存信息的7.主存、快速缓冲存储器、通用寄存器、磁盘、磁带都可用来存储信息,按存取时间由快至慢排列,其顺序是8.、和组成三级存储系统,分级的目的是9.动态半导体存储器的刷新一般有和两种方式,之所以刷新是因为10.用1K某1位的存储芯片组成容量为64K某8位的存储器,共需片,若将这些芯片分装在几块板上,设每块板的容量为4K某8位,则该存储器所需的地址码总位数是,其中位用于选板,位用于选片,位用于存储芯片的片内地址。

11.最基本的数字磁记录方式、、、、、和六种。

12.缓存是设在和之间的一种存储器,其速度匹配,其容量与有关。

13.Cache是一种存储器,用来解决CPU与主存之间不匹配的问题。

现代的Cache可分为和两级,并将和分开设置。

14.计算机系统中常用到的存储器有:(1)SRAM,(2)DRAM,(3)Flah,(4)EPROM,(5)硬盘存储器,(6)软盘存储器。

其中非易失的存储器有:具有在线能力的有;可以单字节修改的有:可以快速读出的存储器包括15.反映存储器性能的三个指标是、、和,为了解决这三方面的矛盾,计算机采用体系结构。

16.存储器的带宽是指,如果存储周期为TM,存储字长为n位则存储器带宽位,常用的单位是或为了加大存储器的带宽可采用、和17.一个四路组相联的Cache共有64块,主存共有8192块,每块32个字。

则主存地址中的主存字块标记为位,组地址为位,字块内地址为位。

18.在虚拟存储器系统中,CPU根据指令生成的地址是,经过转化后的地址是二.选择题1.在磁盘和磁带这两种磁介质存储器中,存取时间与存储单元的物理位置有关,按存储方式分A.二者都是顺序存取B.二者都是直接存取C.磁盘是直接存取,磁带是顺序存取D.磁带是直接存取,磁盘是顺序存取2.存储器进行一次完整的读写操作所需的全部时间称为A.存取时间B.存取周期C.CPU周期D.机器周期3.若存储周期250n,每次读出16位,则该存储器的数据传送率为A.4某106B/B.4MB/C.8某106B/D.8MB/4.用户程序所放的主存空间属于A.随机存取存储器B.只读存储器C.顺序存取存储器D.直接存取存储器5.以下哪种类型的存储器速度最快A.DRAMB.ROMC.EPROMD.SRAM6.下述说法中正确的是A.半导体RAM信息可读可写,且断电后仍能保持记忆B.动态RAM 是易失性RAM,而静态RAM中的存储信息是不易失C.半导体RAM是易失性RAM,但只要电源不断电所存信息是不丢失的D.半导体RAM是非易失性的RAM7.若数据在存储器中采用以低字节地址为字地址的存放方式,则十六进制数12345678H的存储字节顺序按地址由小到大依次为A.12345678B.78563412C.87654321D.341278568.在对破坏性读出的存储器进行读写操作时,为持续原存信息不变,必须辅以的操作是A.刷新B.再生C.写保护D.主存校验9.SRAM芯片,其容量为1024某8,除电源和接地端外,该芯片最少引出线数为A.16B.17C.20D.2110.存储器容量为32K某16,则A.地址线为16根,数据线为32根B.地址线为32根,数据线为16根C.地址线为15根,数据线为16根D.地址线为16根,数据线为15根11.某计算机字长为32位,存储器容量为4MB,按字编址,其寻址范围是0到A.220-1B.221-1C.223-1D.224-112.设机器字长为32位,一个容量为16MB的存储器,CPU按半字寻址,其可寻址的单元数是A.224B.223C.222D.22113.下列说法正确的是A.EPROM是可改写的,因而也是随机存储器的一种B.EPROM是可改写的,但它不能用作为随机存储器用C.EPROM只能改写一次,故不能作为随机存储器用D.EPROM是只能改写一次的只读存储器14.存储器采用部分译码法片选时A.不需要地址译码器B.不能充分利用存储器空间C.会产生地址重叠D.CPU的地址线全参与译码15.双端口存储器发生读写冲突的情况是A.左端口与右端口地址码不同B.左端口与右端口地址码相同C.左端口与右端口数据码相同D.左端口与右端口数据码不同16.如果一个存储单元被访问,则可能这个存储单元会很快的再次被访问,这称为A.时间局部性B.空间局部性C.程序局部性D.数据局部性17.在主存和CPU之间增加高速缓冲存储器的目的是A.解决CPU和主存之间的速度匹配问题B.扩大主存容量C.扩大CPU通用寄存器的数目D.既扩大主存容量又扩大CPU中通用寄存器的数量18.在程序的执行过程中,cache与主存的地址映射是由A.操作系统来管理的B.程序员调度的C.由硬件自动完成的D.由软硬件共同完成的19.容量为64块的cache采用组相连映射方式,字块大小为128个字,每4块为一组。

计算机体系结构1-6章习题答案

计算机体系结构1-6章习题答案

1 2 3 4 5 6
8 16 24 32 40 48
1*82
2*82 3*82 4*82 5*82 6*82 7*82
4/8 5/8 6/8
7/8
7
56
2)规格化浮点数表: rm=2时,规格化浮点数共有4*8=32个 rm=8时,规格化浮点数共有7*8=56个,在[0.5,112]中, 有数19个(上表中红的数字表示)。
§4通道(CH)
一、CH的基本工作原理 CH执行CH程序的过程 CH的任务 二、CH流量计算和时空图绘制 CH的类型 CH流量计算 字节多路CH响应处理时空图的绘制 1)计算每个子CH提供一个字节时间(1/f) 2)画出一个完整申请周期时空图 3)计算字节多路CH对每个字节响应的最长用时
第一章参考答案: 1.应用语言级 高级语言级 汇编语言级 操作系统级 机器语言级 微程序语言级。 2. 从上而下 从下到上 专用机 通用机 3. 软、硬件交界面 计算机系统的性能/价格比 4 . 1 T FLOPS 的计 算能力 1 TBy te 的 主存容量 1 TByte/s 的I/O带宽 5. 虚拟机 实际机器 6. 统一高级语言 模拟 仿真 系列机 7. 控制流 数据流 SISD SIMD MISD MIMD 8. 汇编语言程序员 9. 任务单一化 操作重叠化 吞吐匹配化 程序多道 化
嵌套
中断处理程序 一 二 三 响② 嵌套 四 五
t
返回主程序
例4 解 (1)处理顺序为 2-3-1-5-4 (2)中断响应处理时空图 中断请求 主程序 ①③ ②③④⑤
嵌套
中断处理程序 一 二 三 四 五
响① 嵌套
t
返回主程序
1 分别利用两级描述符和三级描述符描述下列阵列数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 什么是存储系统?对于一个由两个存储器M 1和M 2构成的存储系统,假设M1的命中率为h ,两个存储器的存储容量分别为s 1和s 2,存取时间分别为t 1和t 2,每千字节的成本分别为c 1和c 2。

⑴ 在什么条件下,整个存储系统的每千字节平均成本会接近于c 2? ⑵ 该存储系统的等效存取时间t a 是多少?⑶ 假设两层存储器的速度比r=t 2/t 1,并令e=t 1/t a 为存储系统的访问效率。

试以r 和命中率h 来表示访问效率e 。

⑷ 如果r=100,为使访问效率e>0.95,要求命中率h 是多少?⑸ 对于⑷中的命中率实际上很难达到,假设实际的命中率只能达到0.96。

现在采用一种缓冲技术来解决这个问题。

当访问M 1不命中时,把包括被访问数据在内的一个数据块都从M 2取到M 1中,并假设被取到M 1中的每个数据平均可以被重复访问5次。

请设计缓冲深度(即每次从M 2取到M 1中的数据块的大小)。

答:⑴ 整个存储系统的每千字节平均成本为:12s 1s 2c 2s 1s 1c 2s 1s 2s 2c 1s 1c c ++⨯=+⨯+⨯=不难看出:当s1/s2非常小的时候,上式的值约等于c2。

即:s2>>s1时,整个存储器系统的每千字节平均成本会接近于c2。

⑵ 存储系统的等效存取时间t a 为:2t )h 1(1t h t a ⨯-+⨯=⑶r)h 1(h 1t )h 1(t h t t t e 211a 1⨯-+=⨯-+⨯==⑷ 将数值代入上式可以算得:h>99.95% ⑸通过缓冲的方法,我们需要将命中率从0.96提高到0.9995。

假设对存储器的访问次数为5,缓冲块的大小为m 。

那么,不命中率减小到原来的1/5m ,列出等式有:m596.0119995.0--= 解这个方程得:m=16,即要达到⑷中的访问效率,缓冲的深度应该至少是16(个数据单位)。

2. 要求完成一个两层存储系统的容量设计。

第一层M 1是Cache ,其容量有三种选择:64KB 、128KB 和256KB ,它们的命中率分别为0.7、0.9和0.98;第二层M 2是主存储器,其容量为4MB 。

并设两个存储器的存取时间分别为t 1和t 2,每千字节的成本分别为c 1和c 2。

如果c 1=20c 2和t 2=10t 1。

⑴ 在t 1=20ns 的条件下,分别计算三种存储系统的等效存取时间。

⑵ 如果c 2=0.2美元/KB ,分别计算三种存储系统每千字节的平均成本。

⑶ 对三种存储系统的设计作一个比较,并分别按平均成本和等效存取时间指出它们性能的排列次序。

⑷ 根据等效存取时间和平均成本的乘积,选择最优的设计。

答: ⑴∵ )ns (h 180200200)h 1(h 202t )h 1(1t h t a -=-+=⨯-+⨯= ∴ 三种存储系统的等效存取时间分别为:ns 747.0180200h 180200t 1a =⨯-=-= ns 389.0180200h 180200t 2a =⨯-=-= ns 6.2398.0180200h 180200t 3a =⨯-=-=⑵三种存储系统每千字节的平均成本为:KB /$26.0KB10244KB 64KB10244KB /$2.0KB 64KB /$42s 1s 2s 2c 1s 1c c 1a ≈⨯+⨯⨯+⨯=+⨯+⨯=KB /$32.0KB10244KB 128KB 10244KB /$2.0KB 128KB /$42s 1s 2s 2c 1s 1c c 2a ≈⨯+⨯⨯+⨯=+⨯+⨯=KB /$42.0KB10244KB 256KB 10244KB /$2.0KB 256KB /$42s 1s 2s 2c 1s 1c c 3a ≈⨯+⨯⨯+⨯=+⨯+⨯=⑶ 按照平均成本来说c a1<c a2<c a3,按照等效存取时间来说t a3<t a2<t a1。

⑷3. 有16个存储器模块,每个模块的容量为4M字节,字长为32位。

现在要用这16个存储器模块构成一个主存储器,有如下几种组织方式:方式1:16个存储器模块采用高位交叉方式构成存储器。

方式2:16个存储器模块构成并行访问存储器。

方式3:16个存储器模块采用低位交叉方式构成存储器。

方式4:2路高位交叉8路低位交叉构成存储器。

方式5:4路高位交叉4路低位交叉构成存储器。

方式6:4路并行访问4路低位交叉构成存储器。

⑴写出各种存储器的地址格式。

⑵比较各种存储器的优缺点。

⑶不考虑访问冲突,计算各种存储器的频带宽度。

⑷画出各种存储器的逻辑示意图。

答:⑴各种存储器的地址格式如下:方式1:16个模块高位交叉高低方式2:16个模块并行访问高低方式3:16个模块低位交叉高低方式4:2路高位交叉8路低位交叉高低1bit组号20bit模块内地址2bit字地址3bit模块号方式5:4路高位交叉4路低位交叉高低2bit组号20bit模块内地址2bit字地址2bit模块号方式6:4路并行访问4路低位交叉高低20bit模块内地址2bit字地址2bit组号2bit多路选择⑵这几种存储器都能够并行工作,因此一般而言都可以用来提高内存的吞吐率。

但他们也有所区别:并行访问存储器的优点是实现简单、容易,缺点是访问冲突大;高位交叉访问存储器的优点是扩充方便,但是因为访问冲突太大,一般不用于并行存取,缺点是访问效率不高;低位交叉访问存储器可以用分时的方法来提高速度,但扩充不方便。

⑶各种存储器的频带宽度和他们的并行程度有关,在不考虑冲突的情况下,如果有足够多的独立控制电路和寄存器,那么,他们的频带宽度是相同的。

但是,高位交叉访问存储器一般不用于并行存取,因此频带宽度最小。

⑷方式1:16个模块高位交叉方式2:16个模块并行访问方式3:16个模块低位交叉注意:并行访问存储器和低位交叉访问存储器很相象,只不过,并行访问存储器使用存储模块号(存储体号)来对已经输出的结果进行选择,而低位交叉访问存储器则用来生成对存储模块(存储体)的片选信号,他通过流水的方式来提高访问的速度。

前者用一套存储器控制电路,后者用多套(与交叉模块数相等)存储器控制电路。

方式4:2路高位交叉8路低位交叉方式5:4路高位交叉4路低位交叉方式6:4路并行访问4路低位交叉4. 一个程序由5个虚页组成,采用LRU 替换算法,在程序执行过程中依次访问的页地址流如下:P4,P5,P3,P2,P5,P1,P3,P2,P3,P5,P1,P3⑴ 可能的最高页命中率是多少?⑵ 至少要分配给该程序多少个主存页面才能获得最高的命中率?⑶ 如果在程序执行过程中每访问一个页面,平均要对该页面内的存储单元访问1024次,求访问存储单元的命中率。

答: ⑴在分配的主存页面数目足够大的情况下,除了第一次调入不命中,以后的访问均命中,可以达到最高的页面命中率,即:实际命中的次数为7次,所以可能达到的最高页面命中率为:5833.0127H ≈=⑵由于在页面数大于等于5的情况下,肯定可以达到最高命中率,所以我们来看页面数小于5时能否达到该命中率:若分配的主存页面数等于4时,调度过程如下: 访问流 P4 P5 P3 P2 P5 P1 P3 P2 P3 P5 P1 P3 统计 LRU4444* 4* 1111 1* 11 命中此时也可以达到最高命中率;若分配的主存页面等于3时,调度过程如下:此时不能达到最高命中率。

所以至少应该分配4个主存页面。

⑶我们假设程序每次只访问一个存储单元,这样,对每一个特定页面的访问过程可以描述如下:因为第一次总是不命中的,而平均起来,随后的1023次总是命中的,然后再次被调出主存,并再次重复先前的过程。

所以访问存储单元的命中率为:999.010241023H ≈=5. 假设在一个采用组相联映象方式的Cache 中,主存由B0~B7共8块组成,Cache 有2组,每组2块,每块的大小为16个字节,采用LRU 块替换算法。

在一个程序执行过程中依次访问这个Cache 的块地址流如下:B6,B2,B4,B1,B4,B6,B3,B0,B4,B5,B7,B3⑴ 写出主存地址的格式,并标出各字段的长度。

⑵ 写出Cache 地址的格式,并标出各字段的长度。

⑶ 画出主存与Cache 之间各个块的映象对应关系。

⑷ 如果Cache 的各个块号为C0、C1、C2和C3,列出程序执行过程中Cache的块地址流情况。

⑸ 如果采用FIFO 替换算法,计算Cache 的块命中率。

⑹ 如果采用LRU 替换算法,计算Cache 的块命中率。

⑺ 如果改用全相联映象方式,再做⑸和⑹,可以得到什么结论?⑻ 如果在程序执行过程中,每从主存装入一块到Cache ,则平均要对这个块访问16次。

请计算在这种情况下的Cache 命中率。

答:⑴ 主存地址的格式为:高 低⑵ Cache 地址的格式为:高低⑶主存的组到Cache 的组之间是直接映象,对应组的块之间是全相联映象。

即:主存块0、1、4、5只能装入Cache 块0、1的任何块位置上,主存块2、3、6、7只能装入Cache 块2、3的任何块位置上。

⑷由于主存按Cache 大小分区,因此去掉主存块地址中的区号就可以得出满足组相联映象关系的一种Cache 块地址,所以该主存块地址流相应的一种Cache 的块地址流为:321 076 5 4 3 2 10 第0组第1组 第0组第1组第0区第1区第0组第1组Cache 主存⑸采用FIFO替换算法,Cache的块命中率为:3/12=0.25。

⑹采用LRU替换算法,Cache的块命中率为:4/12≈0.33。

⑺采用全相联映象、FIFO替换算法,Cache的块命中率为:4/12≈0.33。

采用全相联映象、LRU替换算法,Cache的块命中率为:3/12=0.25。

结论:Cache的命中率与地址流分布情况、替换算法、相联度等因素有关。

⑻Cache命中率为:H=15/16=93.75%。

相关文档
最新文档