2022年东北师范大学计算机科学与技术专业《计算机系统结构》科目期末试卷A(有答案)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2022年东北师范大学计算机科学与技术专业《计算机系统结构》科目
期末试卷A(有答案)
一、选择题
1、下列关于虚拟存贮器的说法,比较正确的应当是( )
A.访主存命中率随页面大小增大而提高
B.访主存命中率随主存容量增加而提高
C.更换替换算法能提高命中率
D.在主存命中率低时,改用堆栈型替换算法,并增大主存容量,可提高命中率
2、浮点数尾数基值rm=8,尾数数值部分长6位,可表示的规格化最小正尾数为( )
A.0.5
B.0.25
C.0.125
D.1/64
3、"一次重叠"中消除"指令相关"最好的方法是( )。

A.不准修改指令
B.设相关专用通路
C.推后分析下条指令
D.推后执行下条指令
4、“启动I/O”指令是主要的输入输出指令,是属于()。

A.目态指令
B.管态指令
C.目态、管态都能用的指令
D.编译程序只能用的指令
5、对机器语言程序员透明的是()
A.中断字
B.主存地址寄存器
C.通用寄存器
D.条件码
6、除了分布处理、MPP和机群系统外,并行处理计算机按其基本结构特征可分为流水线计算机,阵列处理机,多处理机和()四种不同的结构。

A.计算机网络
B.控制流计算机
C.机群系统
D.数据流计算机
7、计算机系统结构不包括( )。

A.主存速度
B.机器工作状态
C.信息保护
D.数据
8、在多用户机器上,应用程序员不能使用的指令是()
A.“执行”指令
B.“访管”指令
C.“启动IO”指令
D“测试与置定”指令
9、Cache存贮器常用的地址映象方式是( )。

A.全相联映象
B.页表法映象
C.组相联映象
D.段页表映象
10、从计算机系统结构上讲,机器语言程序员所看到的机器属性是()
A.计算机软件所要完成的功能
B.计算机硬件的全部组成
C.编程要用到的硬件组织
D.计算机各部件的硬件实现。

11、传统机器语言机器级,是用()来()机器指令。

A.硬件,翻译
B.编译程序,翻译
C.微指令程序,解释
D.微指令程序,翻译
12、IBM360/91对指令中断的处理方法是()
A.不精确断点法
B.精确断点法
C.指令复执法
D.对流水线重新调度
13、输入输出系统硬件的功能对()是透明的。

A.操作系统程序员
B.应用程序员
C.系统结构设计人员
D.机器语言程序设计员
14、开发并行的途径有(),资源重复和资源共享。

A.多计算机系统
B.多道分时
C.分布式处理系统
D.时间重叠
15、计算机组成设计不考虑()
A.专用部件设置
B.功能部件的集成度
C.控制机构的组成
D.缓冲技术
二、填空题
16、就目前的通用机来说,计算机系统结构的属性主要包括数据表示,________寄存器组织,________,存储系统。

17、开发并行性是为了并行处理,并行性又包括有________和________二重含义。

18、目前已有的向量处理机结构主要采用________和________两种结构。

19、在一般标量流水线处理机中,通常把一条指令的执行过程分解为取指令、________和
________、写回结果4级流水线,每一级的执行时间为个基本时钟周期。

20、解决Cache与主存不一致性的方法有________和________
21、存储器速度可以用________、________、频宽来描述。

22、虚拟存贮器主要是为解决主存________满足不了要求发展出来的。

23、系列机软件兼容必须做到向________兼容,尽可能争取向________兼容。

24、要实现两条指令在时间上重叠解释,首先需要付出________,其次,要处理好指令之
间可能存在的________
25、在理想情况下,超标量超流水线处理机执行程序的速度是________和________的乘积。

三、判断题
26、在存贮体系中,地址的映象与地址的变换没有区别。

()
27、主存空间数相关是相间隔的两条指令之间出现对主存同一单元要求先写而后读的关联。

()
28、OPT是STACK型替换算法。

()
29、要实现两条指令在时间上重叠解释,首先需要付出空间代价,其次,要处理好指令之间可能存在的关联。

()
30、页面失效请求可以在每条指令执行到末尾时检测,以便在此时看是否调页。

()
31、只要将子过程进一步细分,就可以使流水线吞吐率进一步提高。

()
32、与重叠机器一样,流水机器在遇到转移指令,尤其是条件转移指令时,效率也会显著下降。

()
33、快表和主存也构成一个两级层次,一般快表的替换算法为PFF。

()
34、采用LRU替换的Cache存贮器,分配给程序的Cache容量一定时,块的大小增大,Cache的命中率将先上升,到一定时候又会逐渐降低。

()
35、软硬功能分配时,提高软件功能的比例会提高系统灵活性,也会提高解题速度。

()
四、名词解释
36、计算机系统结构:
37、程序的局部性原理:
38、分布式共享多处理机:
39、半性能向量长度:
40、换名技术:
41、非故障性预取:
五、简答题
42、通常有哪几种指令格式,请简述其适用范围。

43、根据CPU性能公式简述RISC指令集结构计算机和CISC指令集结构计算机的性能特点。

44、在标准的栅栏同步中,设单个处理器的通过时间(包括更新计数和释放锁)为C,求N个处理器一起进行一次同步所需要的时间。

45、机群系统有什么特点?
46、计算机系统结构的Flynn分类法是按什么来分类的?共分为哪几类?
六综合题
47、写出三级Cache的平均访问时间的公式。

48、某向量处理机有16个向量寄存器,其中V0~V5中分别放有向量A、B、C、D、E、F,向量长度均为8,向量各元素均为浮点数;处理部件采用两条单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。

采用类似于CARY-1的链接技术,先计算(A+B)*C,在流水线不停流的情况下,接着计算(D+E)*F。

(1)求此链接流水线的通过时间?(设寄存器入、出各需1拍)
(2)假如每拍时间为50ns,完成这些计算并把结果存进相应寄存器,此处理部件的实际吞吐率为多少MFLOPS?
49、对于两路超标量处理器,从存储器取数据有两拍附加延迟,其它操作均有1拍附加延迟,对于下列代码,请按要求进行指令调度。

LW R4,(R5)
LW R7,(R8)
DADD R9,R4,R7
LD R10,(R11)
DMUL R12,R13,R14
DSUB R2,R3,R1
SW R15,(R2)
DMUL R21,R4,R7
SW R23,(R22)
SW R21,(R24)
(1)假设两路功能部件中同时最多只有一路可以是访问存储器的操作,同时也最多只有
一路可以是运算操作,指令顺序不变。

(2)假设两路功能部件均可以执行任何操作,指令顺序不变。

(3)假设指令窗口足够大,指令可以乱序(out-of-order)流出,两路功能部件均可以
执行任何操作。

50、设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段,每个阶段所需的时间分别为△t、△t和2△t 。

分别求出下列各种情况下,连续执行N条指令所需的时间。

(1)顺序执行方式;
(2)只有“取指令”与“执行指令”重叠;
(3)“取指令”、“分析指令”与“执行指令”重叠。

参考答案
一、选择题
1、【答案】D
2、【答案】C
3、【答案】A
4、【答案】B
5、【答案】B
6、【答案】D
7、【答案】A
8、【答案】C
9、【答案】C
10、【答案】C
11、【答案】C
12、【答案】A
13、【答案】B
14、【答案】D
15、【答案】B
二、填空题
16、【答案】寻址方式指令系统
17、【答案】同时性并发性
18、【答案】存储器一存储器结构寄存器一寄存器结构
19、【答案】译码执行
20、【答案】写直达法写回法
21、【答案】访问时间存储周期
22、【答案】容量
23、【答案】后上
24、【答案】空间代价、关联
25、【答案】超标量处理机超流水线处理机执行程序速度
三、判断题
26、【答案】错
27、【答案】错
28、【答案】对
29、【答案】对
30、【答案】错
31、【答案】错
32、【答案】对
33、【答案】对
34、【答案】错
35、【答案】错
四、名词解释
36、答:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

37、答:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

38、答:它的共享存储器分布在各台处理机中,每台处理机都带有自己的本地存储器,组成一个“处理机-存储器”单元。

但是这些分布在各台处理机中的实际存储器又合在一起
统一编址,在逻辑上组成一个共享存储器。

这些处理机存储器单元通过互连网络连接在
一起,每台处理机除了能访问本地存储器外,还能通过互连网络直接访问在其他处理机
存储器单元中的“远程存储器”。

39、答:向量处理机的性能为其最大性能的一半时所需的向量长度。

40、答:名相关的两条指令之间并没有数据的传送,只是使用了相同的名。

可以把其中一条指令所使用的名换成别的,以此来消除名相关。

41、答:在预取时,若出现虚地址故障或违反保护权限,不发生异常。

五、简答题
42、答:
(1)变长编码格式。

如果系统结构设计者感兴趣的是程序的目标代码大小,而不是性能,就可以采用变长编码格式。

(2)固定长度编码格式。

如果感兴趣的是性能,而不是程序的目标代码大小,则可以选
择固定长度编码格式。

(3)混合型编码格式。

需要兼顾降低目标代码长度和降低译码复杂度时,可以采用混合
型编码格式。

43、答:CPU性能公式:CPU时间=IC×CPI×T其中,IC为目标程序被执行的指令条数,CPI为指令平均执行周期数,T是时钟周期的时间。

相同功能的CISC目标程序的指令条
数ICCISC 少于RISC的ICRISC,但是CISC的CPICISC和TCISC都大于RISC的CPIRISC和TRISC,因此,CISC目标程序的执行时间比RISC的更长。

44、答:
我们忽略读写锁的时间。

N个处理器中的每一个都需要C个时钟周期来锁住与栅栏相关的计数器,修改它的值,然后释放锁。

考虑最坏情况,所有N个处理器都要对计数器加锁
并修改它的值,由于锁只能顺序访问计数器,在同一时间,只能有一个处理器修改计数器
的数据。

所以,总共要花NC个时钟周期使得所有的处理器都到达数据栅栏。

45、答:(1)系统开发周期短。

由于机群系统大多采用商品化的PC机、工作站作为结点,并通过商用网络连接在一起,系统开发的重点在于通信子系统和并行编程环境上,这
大大节省了研制时间。

(2)可靠性高。

机群中的每个结点都是独立的PC机或工作站,某个结点的失效并不会
影响其它结点的正常工作,而且它的任务还可以传递给其它结点完成,从而有效地避免由
于单结点失效引起的系统可靠性降低的问题。

(3)可扩放性强。

机群的计算能力随着结点数量的增加而增大。

这主要是得益于机群结
构的灵活性,由于结点之间以松耦合方式连接,机群的结点数量可以增加到成百上千。

另外,机群系统的硬件容易扩充和替换,可以灵活配置。

(4)性能价格比高。

由于生产批量小,传统并行计算机系统的价格均比较昂贵,往往要
几百万到上千万美元。

而机群的结点和网络都是商品化的计算机产品,能够大批量生产,
成本相对较低,因而机群系统的性能价格比更好。

与相同性能的传统并行计算机系统相比,机群的价格要低1~2个数量级。

(5)用户编程方便。

机群系统中,程序的并行化只是在原有的C、C++或Fortran串行
程序中插入相应的通信原语,对原有串行程序的改动有限。

用户仍然使用熟悉的编程环境,无需适用新的环境。

46、答:Flynn分类法是按照指令流和数据流的多倍性进行分类。

把计算机系统的结构分为:
(1)单指令流单数据流SISD
(2)单指令流多数据流SIMD
(3)多指令流单数据流MISD
(4)多指令流多数据流MIMD
六综合题
47、解:平均访存时间=命中时间+失效率×失效开销
只有第I层失效时才会访问第I+1。

设三级Cache的命中率分别为H L1、 H l2、 H L3,失效率分别为M l1、M l2、M L3,第三级Cache的失效开销为P L3。

平均访问时间T A =H L1+M l1{H l2+M l2(H L3+M L3×P L3)}
48、解:(1)我们在这里假设A+B的中间结果放在V6中,(A+B)×C地最后结果放在V7中,D+E地中间结果放在V8中,(D+E)×F的最后结果放在V9中。

具体实现参考下图:
通过时间应该为前者((A+B)×C)通过的时间:
T通过= (1+2+1)+(1+3+1) =9(拍)
(2)在做完(A+B)×C之后,作(C+D)×E就不需要通过时间了。

V6←A+B
V7←V6×C
V8←D+E
V9←V 8×F
49、解:(1)
(2)
S 26.67MFLOP T
32TP 1200(ns)
24818T T ====+=(拍))-+(通过
(3)
50、解:(1)每条指令的执行时间为:△t+△t+2△t=4△t
连续执行N条指令所需的时间为:4N△t
(2)连续执行N条指令所需的时间为:4△t+3(N-1)△t=(3N+1)△t (3)连续执行N条指令所需的时间为:4△t+2(N-1)△t=(2N+2)△t。

相关文档
最新文档