2022年华东师范大学数据科学与大数据技术专业《计算机系统结构》科目期末试卷A(有答案)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2022年华东师范大学数据科学与大数据技术专业《计算机系统结构》
科目期末试卷A(有答案)
一、选择题
1、下列关于虚拟存贮器的说法,比较正确的应当是( )
A.访主存命中率随页面大小增大而提高
B.访主存命中率随主存容量增加而提高
C.更换替换算法能提高命中率
D.在主存命中率低时,改用堆栈型替换算法,并增大主存容量,可提高命中率
2、计算机系统的层次结构按照由高到低的顺序分别为()。
A.高级语言机器级,汇编语言机器级,传统机器语言机器级,微程序机器级
B.高级语言机器级,应用语言机器级,汇编语言机器级,微程序机器级
C.应用语言机器级,传统机器语言机器级,汇编语言机器级,操作系统机器级
D.应用语言机器级,操作系统机器级,微程序机器级,传统机器语言机器级
3、下列说法正确的是()
A."一次重叠"是一次解释一条指令
B."一次重叠"是同时解释相邻两条指令
C.流水方式是同时只能解释两条指令
D."一次重叠"是同时可解释很多条指令
4、组相联映象、LRU替换的Cache存贮器,不影响Cache命中率的是( )
A.增加Cache中的块数
B.增大组的大小
C.增大主存容量
D.增大块的大小
5、推出系列机的新机器,不能更改的是( )
A.原有指令的寻址方式和操作码
B.系统总线的组成
C.数据通路宽度
D.存贮芯片的集成度
6、与流水线最大吞吐率高低有关的是( )
A.各个子过程的时间
B.最快子过程的时间
C.最慢子过程的时间
D.最后子过程的时间
7、不同系列的机器之间,实现软件移植的途径不包括( )
A.用统一的高级语言
B.用统一的汇编语言
C.模拟
D.仿真
8、1TFLOPS计算机能力,1TBYTE/S的I/O带宽和()称为计算机系统的3T性能目标。
A,1TBYTE 硬盘容量
B.1TBYTE 软盘容量
C.1TBYTE 主存容量
D.A和B
9、计算机中优化使用的操作码编码方法是( )。
(书上为扩展编码法)
A哈夫曼编码
B ASCII码
C BCD码
D扩展操作码
10、计算机系统结构不包括( )。
A.主存速度
B.机器工作状态
C.信息保护
D.数据
二、填空题
11、指令系统是软件设计人员与硬件设计人员之间的一个主要________,也是他们之间互相沟通的一座桥梁。
在计算机系统的设计过程中,________的设计是非常关键的,它必须由软件设计人员和硬件设计人员共同来完成。
12、一个程序在计算机上运行,花费的CPU时间为CPU的时钟周期乘以该程序所有机器指令使用CPU的时钟周期数,即CPU时间=________×________
13、向量指令可分为________和________
14、浮点数阶码位数影响数的可表示 ________大小,尾数位数影响数的可表示________大小。
15、开发并行性是为了并行处理,并行性又包括有________和________二重含义。
16、一种机器的系统结构上实现另一种机器的指令系统,一般可采用________方法或
________方法。
17、流水有部件、处理机、系统等不同等级,多个处理机之间的流水属________级流水,
也称________流水。
18、Cache存贮器采用组相联的映象规则是组间________映象,组内各块间________映象。
19、Cache存贮器是为解决主存________满足不了要求发展出来的。
20、虚拟存贮器主要是为解决主存________满足不了要求发展出来的。
三、判断题
21、流水机器处理中断应着眼于解决断点现场如何保存和恢复,并不在于如何缩短断流的时间,去追求流水的高吞吐率和高效率。
()
22、总线仲裁算法有:静态优先级算法、固定时间片算法、动态优先级算法和先来先去服务算法。
()
23、超标量功能流水线能完成执行多种指令的功能。
()
24、多数I/O系统的结构应面向操作系统设计,考虑如何在操作系统与I/O系统之间进行合理的软、硬件功能分配。
()
25、单功能流水线只能完成一种固定功能。
()
26、异构机群的负载均衡任务优化调度问题可以描述为:寻找一个映射关系,将任务图TG映射到机群图PC,使作业时间最短。
()
27、重叠寄存器窗口技术是RISC最关键的技术。
()
28、采用LRU替换的Cache存贮器,分配给程序的Cache容量一定时,块的大小增大,Cache的命中率将先上升,到一定时候又会逐渐降低。
()
29、在一段时间内相继发射多个任务,体现了并发性概念。
()
30、低速打印机,在总线上传送数据时,其"数据宽度"宜用可变长块。
()
31、二进制数表示数据信息较之二一十进制数表示,其存贮空间利用率低,运算速度要快。
()
32、虚拟存贮器内部地址映象方式的选择,依据于是否有高的主存命中率,而不是高的实页冲突概率。
()
33、指令间的读写相关是全局相关。
()
34、多处理机中,两个程序段之间若同时有先写后读和先读后写2种相关,以交换数据为目的时,则必须并行执行,读写要完全同步,允许顺序串行和交换串行。
()
35、要使线性流水线的实际吞吐率接近于理想的最大吞吐率,应将子过程数分得越多越好。
()
四、名词解释
36、旋转锁:
37、异步I/O:
38、多级存储层次:
39、结构冲突:
40、读后写冲突:
41、存储程序计算机:
五、简答题
42、说明IBM SP2的体系结构特点。
43、计算机系统结构的Flynn分类法是按什么来分类的?共分为哪几类?
44、机群系统有什么特点?
45、简述CISC指令集结构功能设计的主要目标。
从当前的计算机技术观点来看,CISC 指令集结构的计算机有什么缺点?
46、在“Cache—主存”层次中,主存的更新算法有哪两种?它们各有什么特点?
六综合题
47、某向量处理机有16个向量寄存器,其中V0~V5中分别放有向量A、B、C、D、E、F,向量长度均为8,向量各元素均为浮点数;处理部件采用两条单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。
采用类似于CARY-1的链接技术,先计算(A+B)*C,在流水线不停流的情况下,接着计算(D+E)*F。
(1)求此链接流水线的通过时间?(设寄存器入、出各需1拍)
(2)假如每拍时间为50ns,完成这些计算并把结果存进相应寄存器,此处理部件的实际吞吐率为多少MFLOPS?
48、假设有一条长流水线,仅仅对条件转移指令使用分支目标缓冲。
假设分支预测错误的开销为4个时钟周期,缓冲不命中的开销为3个时钟周期。
假设:命中率为90%,预测精度为90%,分支频率为15%,没有分支的基本CPI为1。
(1)求程序执行的CPI。
(2)相对于采用固定的2个时钟周期延迟的分支处理,哪种方法程序执行速度更快?49、一个字节多路通道连接有6台设备,它们的数据传输率如下表所示。
(1)计算该通道的实际工作流量。
(2)若通道的最大流量等于实际工作流量,求通道的工作周期Ts+TD。
50、计算机系统中有三个部件可以改进,这三个部件的部件加速比为:
部件加速比1=30;部件加速比2=20;部件加速比3=10
(1)如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?
(2)如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么
系统中不可加速部分的执行时间在总执行时间中占的比例是多少?
参考答案
一、选择题
1、【答案】D
2、【答案】A
3、【答案】В
4、【答案】C
5、【答案】A
6、【答案】C
7、【答案】B
8、【答案】C
9、【答案】D
10、【答案】A
二、填空题
11、【答案】分界面指令系统
12、【答案】CPU时钟周期数,时钟周期
13、【答案】基于寄存器-寄存器的向量指令基于存储器-存储器的向量指令
14、【答案】范围精度
15、【答案】同时性并发性
16、【答案】仿真,模拟
17、【答案】系统宏
18、【答案】直接全相联
19、【答案】速度
20、【答案】容量
三、判断题
21、【答案】错
22、【答案】对
23、【答案】对
24、【答案】对
25、【答案】对
26、【答案】对
27、【答案】错
28、【答案】错
29、【答案】对
30、【答案】错
31、【答案】错
32、【答案】错
33、【答案】错
34、【答案】错
35、【答案】错
四、名词解释
36、答:处理机环绕一个锁不停地旋转而请求获得该锁。
37、答:允许进程在发出I/O请求后继续执行,直到该进程真正访问这些数据而它们又尚未就绪时,才被挂起。
38、答:采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存储器之间
一般满足包容关系,即任何一层存储器中的内容都是其下一层(离CPU更远的一层)存
储器中内容的子集。
目标是达到离CPU最近的存储器的速度,最远的存储器的容量。
39、答:因硬件资源满足不了指令重叠执行的要求而发生的冲突。
40、答:考虑两条指令i和j,且i在j之前进入流水线,指令j的目的寄存器和指令i的
源操作数寄存器相同,而且j在i读取该寄存器之前就先对它进行了写操作,导致i读到
的值是错误的。
41、答:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处
理工作。
五、简答题
42、答:SP2机群是异步的MIMD,具有分布式存储器系统结构。
它的每个结点都是一
台RS/6000工作站,带有自己的存储器和本地磁盘。
结点中采用的处理器是一台6流出
的超标量处理机,每个时钟周期可以执行6条指令。
SP2的结点数可以从2个到512个不等,每个结点配有一套完整的AIX操作系统(IBM
的UNIX),结点间的互连网络接口是松散耦合的,通过结点本身的I/O微通道(MCC)
接到网络上。
SP2的结点都有1个指令Cache,1个数据Cache,1个分支指令和转移控制部件,2个
整数部件和2个浮点部件,但它们在存储器容量、数据宽度和I/O总线插槽个数上有所不同。
系统采用标准的工作站部件,仅在标准技术不能满足性能要求时才使用专用软件和硬件。
SP2的I/O系统基本上是围绕着HPS建立的,并可以用一个LAN网关同SP2系统外的
其他计算机连接。
SP2中设置了一个专门的系统控制台用以管理整个系统,系统管理人员可以通过这个系统控制台从单一地点对整个系统进行管理。
43、答:Flynn分类法是按照指令流和数据流的多倍性进行分类。
把计算机系统的结构分为:
(1)单指令流单数据流SISD
(2)单指令流多数据流SIMD
(3)多指令流单数据流MISD
(4)多指令流多数据流MIMD
44、答:(1)系统开发周期短。
由于机群系统大多采用商品化的PC机、工作站作为结点,并通过商用网络连接在一起,系统开发的重点在于通信子系统和并行编程环境上,这
大大节省了研制时间。
(2)可靠性高。
机群中的每个结点都是独立的PC机或工作站,某个结点的失效并不会
影响其它结点的正常工作,而且它的任务还可以传递给其它结点完成,从而有效地避免由
于单结点失效引起的系统可靠性降低的问题。
(3)可扩放性强。
机群的计算能力随着结点数量的增加而增大。
这主要是得益于机群结
构的灵活性,由于结点之间以松耦合方式连接,机群的结点数量可以增加到成百上千。
另外,机群系统的硬件容易扩充和替换,可以灵活配置。
(4)性能价格比高。
由于生产批量小,传统并行计算机系统的价格均比较昂贵,往往要
几百万到上千万美元。
而机群的结点和网络都是商品化的计算机产品,能够大批量生产,
成本相对较低,因而机群系统的性能价格比更好。
与相同性能的传统并行计算机系统相比,机群的价格要低1~2个数量级。
(5)用户编程方便。
机群系统中,程序的并行化只是在原有的C、C++或Fortran串行
程序中插入相应的通信原语,对原有串行程序的改动有限。
用户仍然使用熟悉的编程环境,无需适用新的环境。
45、答:主要目标是增强指令功能,把越来越多的功能交由硬件来实现,并且指令的数量也是越来越多。
缺点:
(1) CISC结构的指令集中,各种指令的使用频率相差悬殊。
(2) CISC结构指令的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。
(3) CISC结构指令集的复杂性给VLSI设计增加了很大负担,不利于单片集成。
(4) CISC结构的指令集中,许多复杂指令需要很复杂的操作,因而运行速度慢。
(5) 在CISC结构的指令集中,由于各条指令的功能不均衡性,不利于采用先进的计算机体系结构技术(如流水技术)来提高系统的性能。
46、答:
(1)写直达法。
易于实现,而且下一级存储器中的数据总是最新的。
(2)写回法。
速度快,“写”操作能以Cache存储器的速度进行。
而且对于同一单元的多个写最后只需一次写回下一级存储器,有些“写”只到达Cache,不到达主存,因而所使用的存储器频带较低。
六综合题
47、解:(1)我们在这里假设A+B的中间结果放在V6中,(A+B)×C地最后结果放在V7中,D+E地中间结果放在V8中,(D+E)×F的最后结果放在V9中。
具体实现参考下图:
通过时间应该为前者((A+B)×C)通过的时间:
T 通过= (1+2+1)+(1+3+1) =9(拍)
(2)在做完(A +B )×C 之后,作(C +D )×E 就不需要通过时间了。
V6←A +B
V7←V 6×C
V8←D +E
V9←V 8×F
48、解:(1)程序执行的CPI = 没有分支的基本CPI (1) + 分支带来的额外开销
分支带来的额外开销是指在分支指令中,缓冲命中但预测错误带来的开销与缓冲没有命中带来的开销之和。
分支带来的额外开销= 15% * (90%命中×10%预测错误×4 + 10%没命中×3)= 0.099 所以,程序执行的CPI = 1 + 0.099 = 1.099
(2)采用固定的2 个时钟周期延迟的分支处理CPI = 1 + 15%×2 = 1.3
由(1)(2)可知分支目标缓冲方法执行速度快。
49、解:(1)通道实际流量为
ms B f f i i byte /2001025254050506
1=+++++==∑=
(2)由于通道的最大流量等于实际工作流量,即有
ms B T T f D
S byte /2001m ax =+=- 可得,通道的工作周期Ts+T D = 5μs 。
S 26.67MFLOP T
32TP 1200(ns)
24818T T ====+=(拍))-+(通过
50、解:(1)在多个部件可改进情况下,Amdahl 定理的扩展:
∑∑+-=i i
i n S F F S )1(1
已知S 1=30,S 2=20,S 3=10,S n =10,F 1=0.3,F 2=0.3,得:
)
()(10/20/0.330/0.30.30.3-111033F F +++++= 得F 3=0.36,即部件3的可改进比例为36%。
(2)设系统改进前的执行时间为T ,则3个部件改进前的执行时间为:(0.3+0.3+0.2)T = 0.8T ,不可改进部分的执行时间为0.2T 。
已知3个部件改进后的加速比分别为S 1=30,S 2=20,S 3=10,因此3个部件改进后的执行时间为:
T T T T T n 045.010
2.020
3.0303.0'=++= 改进后整个系统的执行时间为:Tn = 0.045T+0.2T = 0.245T
那么系统中不可改进部分的执行时间在总执行时间中占的比例是:
82.0245.02.0=T T。