中南民族大学计算机系统结构试卷

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2010年 A 卷

1. 计算机系统的多层结构从高到低可以分为应用语言虚拟机 , ,操作系统机器级,传统机器级和 。 2.并行性包含 和 二重含义。 3.系列机软件必须保证 兼容。

4.某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的20倍,而系统运行某一程序的整体性能提高到原来的5倍,则该程序中浮点操作所占的比例是 。系统加速比是 。

5.由软件实现的机器称为 。在一个计算机系统中,低层机器的属性对高层机器的程序员往往是的 。

1、 高级语言虚拟机 , 汇编语言虚拟机 , 微程序机器级;

2、 同时性 , 并发性 ;

3、 向后;

4、 84.2% , 5;

5、 虚拟机 , 透明的 ;

三、计算机系统有三个部件可以改进,这三个部件的加速比如下: 部件1加速比=6; 部件2加速比=4; 部件3加速比=5;

(1) 如果部件1和部件2的可改进比例为30%和20%,那么当部件3的可改

进比例为多少时,系统的加速比才可以达到2?(9分)

(2) 如果三个部件的可改进比例为30%、10%和12.5%,三个部件同时改进,

那么系统加速比是多少?(6分) (1)

∑+-=

i

i

i i

i S f f S )1(1

(3分)

1

332211321)](1[-⎭⎬

⎫⎩⎨⎧+++++-=S f S f

S f f f f S (1分) 1

330.30.22[1(0.30.2)]645f f -⎧

⎫=-+++++⎨⎬⎩⎭

(2分)

312.5%f = (3分)

(2)

3

12123123

1

(1)S f f f f f f S S S =

---+++

(2分)

1

0.30.10.125

(10.30.10.125)645

S =

---+++

(1分)

1 1.740.575S ==

四、假设某应用程序中有4类操作,通过该进,各操作获得了不同的性能提高。

(2)各类操作单独改进后,程序获得的加速比分别是多少?(6分)

(3)4类操作均改进后,整个程序的加速比是多少(用加速比的定义求解)?(6分)

(1)该进后,各类操作的加速比分别是:

1221S == 220210

S == 34

41

S =

= (1分) (2)各类操作单独改进后,程序获得的加速比分别是: 操作1单独改进后,程序获得的加速比是:

111

1

1/1

10.040.04/21.02

S f f S =-+=

-+= (2分)

操作2单独改进后,程序获得的加速比是:

222

1

1/1

10.80.8/21.67

S f f S =-+=

-+= (2分)

操作3单独改进后,程序获得的加速比是:

333

1/1

10.160.16/41.14

S f f S =-+=

-+= (2分)

(3)4类操作均改进后,整个程序的加速比是(没有用定义求解,该小题0分):

1022020204

10120102012.17S ⨯+⨯+⨯=

⨯+⨯+⨯= (6分)

五、现有3段流水线,各段经过的时间依次为△t ,3△t ,△t ,

(1)分别计算在连续输入3条指令时和30条指令时的吞吐率和效率。(5分) (2)采用瓶颈段细分的方式改进该流水线,改进后同时输入3条指令和30条指令时分别计算其吞吐率和效率。(5分)

(3)通过对(1),(2)两小题的计算比较可得出什么结论?(5分) (1)1

(1)m

i

j

i n

TP t n t

==

∆+-∆∑ (j t ∆为瓶颈段时间)

1

1

[(1)]

m

i

i m

i j i n t m t n t η==⨯∆=

⨯∆+-∆∑∑ (1分)

当连续输入3条指令时

33

52311TP t t t =

=

∆+⨯∆∆ (1分)

3545%

311t

t

η⨯∆=

=⨯∆ (1分) 当连续输入30条指令时

3015529346TP t t t =

=

∆+⨯∆∆ (1分)

30554%

392t

t

η⨯∆=

=⨯∆ (1分) (2)将第二段细分为3个子段,每个子段均为t ∆

1

(1)m

i

i

i TP t n t

==

∆+-∆∑

1

1

[(1)]

m

i

i m

i i i n t m t n t η==⨯∆=

⨯∆+-∆∑∑ (1分)

当连续输入3条指令时

33

527TP t t t =

=

∆+∆∆ (1分)

3543%

57t

t

η⨯∆=

=⨯∆ (1分) 当连续输入30条指令时

301552917TP t t t =

=

∆+∆∆ (1分)

30588%

534t

t

η⨯∆=

=⨯∆ (1分) (3)结论:在流水线中,无论瓶颈段是否被消除(2分),只有当连续输入流水线的指令越多时,流水线的实际吞吐率和效率才会提高。 (3分) 六、设向量长度为64,在CRAY-1机上所用浮点功能部件的执行时间分别为:

相加 6拍,相乘 7拍,求倒数 14拍,从存储器读数6拍,打入寄存器及启动功能部件各 1 拍。问下列各指令组,组内的哪些指令可以链接?哪些指令不能链接?不能链接的原因是什么?分别计算出各指令组全部完成所需要的拍数。 (1) V0←存储器 V1←V2+V3

V4←V5*V6 (7分) (2) V0←存储器

V1←1/V0 V3←V1*V2

V5←V4+V3 (8分)

(1)3条向量指令之间,既没有发生源Vi 冲突,也没有Vi 的先写后读相关(1分),又没有功能部件的使用冲突(1分),所以这3条指令可以同时并行流水(1分)。计算指令组全部完成所需要的拍数时,只需要取这3条向量指令完成时所需要最多的拍数即可。

相关文档
最新文档