中南民族大学计算机系统结构试卷
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2010年 A 卷
1. 计算机系统的多层结构从高到低可以分为应用语言虚拟机 , ,操作系统机器级,传统机器级和 。 2.并行性包含 和 二重含义。 3.系列机软件必须保证 兼容。
4.某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的20倍,而系统运行某一程序的整体性能提高到原来的5倍,则该程序中浮点操作所占的比例是 。系统加速比是 。
5.由软件实现的机器称为 。在一个计算机系统中,低层机器的属性对高层机器的程序员往往是的 。
1、 高级语言虚拟机 , 汇编语言虚拟机 , 微程序机器级;
2、 同时性 , 并发性 ;
3、 向后;
4、 84.2% , 5;
5、 虚拟机 , 透明的 ;
三、计算机系统有三个部件可以改进,这三个部件的加速比如下: 部件1加速比=6; 部件2加速比=4; 部件3加速比=5;
(1) 如果部件1和部件2的可改进比例为30%和20%,那么当部件3的可改
进比例为多少时,系统的加速比才可以达到2?(9分)
(2) 如果三个部件的可改进比例为30%、10%和12.5%,三个部件同时改进,
那么系统加速比是多少?(6分) (1)
∑
∑+-=
i
i
i i
i S f f S )1(1
(3分)
1
332211321)](1[-⎭⎬
⎫⎩⎨⎧+++++-=S f S f
S f f f f S (1分) 1
330.30.22[1(0.30.2)]645f f -⎧
⎫=-+++++⎨⎬⎩⎭
(2分)
312.5%f = (3分)
(2)
3
12123123
1
(1)S f f f f f f S S S =
---+++
(2分)
1
0.30.10.125
(10.30.10.125)645
S =
---+++
(1分)
1 1.740.575S ==
四、假设某应用程序中有4类操作,通过该进,各操作获得了不同的性能提高。
(2)各类操作单独改进后,程序获得的加速比分别是多少?(6分)
(3)4类操作均改进后,整个程序的加速比是多少(用加速比的定义求解)?(6分)
(1)该进后,各类操作的加速比分别是:
1221S == 220210
S == 34
41
S =
= (1分) (2)各类操作单独改进后,程序获得的加速比分别是: 操作1单独改进后,程序获得的加速比是:
111
1
1/1
10.040.04/21.02
S f f S =-+=
-+= (2分)
操作2单独改进后,程序获得的加速比是:
222
1
1/1
10.80.8/21.67
S f f S =-+=
-+= (2分)
操作3单独改进后,程序获得的加速比是:
333
1/1
10.160.16/41.14
S f f S =-+=
-+= (2分)
(3)4类操作均改进后,整个程序的加速比是(没有用定义求解,该小题0分):
1022020204
10120102012.17S ⨯+⨯+⨯=
⨯+⨯+⨯= (6分)
五、现有3段流水线,各段经过的时间依次为△t ,3△t ,△t ,
(1)分别计算在连续输入3条指令时和30条指令时的吞吐率和效率。(5分) (2)采用瓶颈段细分的方式改进该流水线,改进后同时输入3条指令和30条指令时分别计算其吞吐率和效率。(5分)
(3)通过对(1),(2)两小题的计算比较可得出什么结论?(5分) (1)1
(1)m
i
j
i n
TP t n t
==
∆+-∆∑ (j t ∆为瓶颈段时间)
1
1
[(1)]
m
i
i m
i j i n t m t n t η==⨯∆=
⨯∆+-∆∑∑ (1分)
当连续输入3条指令时
33
52311TP t t t =
=
∆+⨯∆∆ (1分)
3545%
311t
t
η⨯∆=
=⨯∆ (1分) 当连续输入30条指令时
3015529346TP t t t =
=
∆+⨯∆∆ (1分)
30554%
392t
t
η⨯∆=
=⨯∆ (1分) (2)将第二段细分为3个子段,每个子段均为t ∆
1
(1)m
i
i
i TP t n t
==
∆+-∆∑
1
1
[(1)]
m
i
i m
i i i n t m t n t η==⨯∆=
⨯∆+-∆∑∑ (1分)
当连续输入3条指令时
33
527TP t t t =
=
∆+∆∆ (1分)
3543%
57t
t
η⨯∆=
=⨯∆ (1分) 当连续输入30条指令时
301552917TP t t t =
=
∆+∆∆ (1分)
30588%
534t
t
η⨯∆=
=⨯∆ (1分) (3)结论:在流水线中,无论瓶颈段是否被消除(2分),只有当连续输入流水线的指令越多时,流水线的实际吞吐率和效率才会提高。 (3分) 六、设向量长度为64,在CRAY-1机上所用浮点功能部件的执行时间分别为:
相加 6拍,相乘 7拍,求倒数 14拍,从存储器读数6拍,打入寄存器及启动功能部件各 1 拍。问下列各指令组,组内的哪些指令可以链接?哪些指令不能链接?不能链接的原因是什么?分别计算出各指令组全部完成所需要的拍数。 (1) V0←存储器 V1←V2+V3
V4←V5*V6 (7分) (2) V0←存储器
V1←1/V0 V3←V1*V2
V5←V4+V3 (8分)
(1)3条向量指令之间,既没有发生源Vi 冲突,也没有Vi 的先写后读相关(1分),又没有功能部件的使用冲突(1分),所以这3条指令可以同时并行流水(1分)。计算指令组全部完成所需要的拍数时,只需要取这3条向量指令完成时所需要最多的拍数即可。