系统结构作业解答

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4. 考虑下图所示的4级加法流水线,其中X和Y为流水输入线,Z 为流水输出线。流水线输出端有一个寄存器R,用来暂存中 间结果并在适当的时刻反馈到S1,输入X和Y分别与输出R和 Z经相应多路开关接到S1的两个输入端。假设向量A的所有元 素,以每个周期一个元素的速率,通过输入端X送入流水线。 N ① 若要计算有N个元素的向量A的累加和 S = ∑I =1 A(I ) ,最少 需要多少个时钟周期?约定若无操作数输入,就认为是 将一个0值送入流水线,而且流水线的设置时间可忽略不 计。 ② 设τ是该流水加法器的时钟周期,若现在有一个等效的非 流水线加法器,它的通过延迟为4τ,当N=64时,计算上 述流水对非流水线加法器的加速比S4(64)以及效率E4(64)。 ③ 计算当N趋向无穷大时的最大渐近加速比S4(∞)和效率 E4(∞)。 ④ 计算为达到最大渐近性能的半值,所需的最少向量长度 N1/2应为多少。
题4
解: CPI=∑(CPIi×ICi/IC) =1×0.6+2×0.18+4×0.12+8×0.1 =2.24
时钟频率 40 × 10 6 MIPS = = = 17.86 6 6 CPI × 10 2.24 × 10


5.如果某计算机系统有3个部件可以改进。这3个部件改进 后达到的加速比分别为S1=30,S2=20,S3=10。 1. 如果部件1和部件2改进前的这些数据占整个系统执 行时间的比例都为30%,那么,部件3改进前的执行 时间占整个系统执行时间的比例为多少,才能使3 个部件都改进后的整个系统的加速比Sn达到10? 2. 如果3个部件改进前执行时间占整个系统执行时间 的比例分别是30%、30%和20%,那么3个部件改进 后系统的加速比是多少?未改进部件执行时间在改 进后的系统执行时间中占的比例是多少?
6. 设高速缓存Cache的工作速度为主存的5倍,且Cache被访 问的命中率为90%,那么,采用Cache后能使整个存储系 统获得多高的加速比? 解:方法一,设CPU运行程序的访存次数为IC,CPU访问主 存一次所需平均周期数为CPIM ,CPU访问Cache一次所需平 均 周 期 为 CPIC , 已 知 Cache 的 工 作 速 度 是 主 存 的 5 倍 , 即 CPIC=CPIM/5。若不采用Cache,所有的访存都是直接访问主 存,则CPU完成IC次访存所需时间为T0=CPIM×IC。 若采用Cache,且已知Cache被访问命中的概率为90%,即 0.9IC次访存能通过访问Cache完成,另有0.1IC次需通过访问 主存完成,则CPU完成IC次访问所需时间为 Tn=CPIC×0.9IC+CPIM×0.1IC=0.28CPIM×IC 故采用Cache后,存储系统的加速比为 Sn=T0/Tn=3.57
1
X7,3,8,4,
5,1,6,2
X7,3,8,4, 5,1,6,2 X7,3,8,4, 5,1,6,2 X7,3,8,4 X7,3,8,4 X7,3,8,4 输出
2
平均时间间隔 (2+2+5)∆t/3=3∆t (2+5)∆t/2=3.5∆t 4∆t (4+5)∆t/2=4.5∆t 5∆t
(2)由状态有向图得出不发生段争用冲突的调度策略 及其平均时间间隔,如下。
由表得出,允许不等时间间隔调度的最优调度策略 是(2,2,5)。最大吞吐率为TPmax=1/(3∆t)=0.33∆t。 等时间间隔调度的最优调度策略是(4)。最大吞吐率 为TPmax=1 /(4∆t)=0.25∆t
1
2
3
4
5
1
6 X6,
2
7 X7,
3
8 X8,
4
9
10 X5,1,6,2
11
12 X7,3,8,4
13
S1 X1 X2 X3 X4 X5, S2 S3 S4 R S1 S2 S3 S4 R X5,1,6,2 X7,3,8,4 X7,3,8,4 X5,1,6,2 14 X1 X2 X3 X1 X2 X1 15 X4 X3 X2
题 6
方法二,直接使用Amdahl定律:
Sn = T0 1 = Tn (1 − Fe ) + Fe / Se
其中,Se为被改进部分在改进前的执行时间与改进后的执行 时间的比值,即被改进部分改进后获得的加速比,已知采用 Cache后访存速度提高5倍,即Se=5。Fe为被改进部分的执行 时间相对T0的百分比,已知Cache的命中率为90%,即90%的 访存通过Cache完成,通过Cache访存的执行时间(次数)占 全部访存执行时间(次数)的比例为90%,即Fe=0.9。故
2. 在一个各段执行时间均为∆t的5段流水线处理机 上,其预约表如下。 (1)画出流水线调度的状态有向图。 (2)分别求出允许不等时间间隔调度的两种最优 调度策略,以及这两种调度策略的流水线最大 吞吐率。 t1 √ t2 √ √ √ √ √ √ t3 t4 t5 √ √ t6 t7 √
S1 S2 S3 S4 S5
X5,
1
X6,
2
X7,
3
X8,
4
X5,1,6,2 X8,4 X7,3 18 X6,2 X8,4 X7,3 19 X8,4 X5,1,6,2
X7,3,8,4
X4 X3
X5,
1
X6,
2Baidu Nhomakorabea
X7,
3
X4
X5,
1
X6,
2
X5,1,6,2 X20 8,4
X1 16 2 X3 X X7,3,8,4,
5,1,6,2
17 X4 X5,
Sn = 1 1 = = 3.57 (1 − Fe ) + Fe / Se (1 − 0.9) + 0.9 / 5
7. 一台计算机有10条指令I1~I10,它们的使用频率分别为: 0.25、0.2、0.15、0.1、0.08、0.08、0.05、0.04、0.03、 0.02。若用Huffmann编码对它们的操作码进行编码,其操 作码的平均码长为多少? 解:(1)由给出的使用频率计算操作码编码的最短平均码长。 H=-∑pilog2pi =-(0.25log20.25+0.20log20.20+0.15log20.15+0.10log20.10+ 0.08log20.08+0.08log20.08+0.05log20.05+0.04log20.04+ 0.03log20.03+ 0.02log20.02 =2.96位 (2)根据频率,构造Huffmann树。 Huffmann树的结构可能不 同。生成Huffmann编码,然后计算平均码长。可知Huffmann 编码尽管不是唯一的,但是平均码长却是唯一的。
MPX X Y S1 MPX MPX:多路开关 S2 S3 S4 R
Z
解:本题为四段非线性流水线,附加寄存器R,内有两条反 馈连线。向量A的所有元素,以每个周期一个元素的速率, 通过输入端X送入流水线。寄存器R在适当的时刻反馈到S1 。 N 求解 S = ∑I=1 A(I ) 以8个元素的向量为例考虑流水线的实现如下: X1+0→ X2+0 → X3+0 → X4+0 → X1+X5 → X2+X6 →X3+X7 → X4+X8 →R(X1+X5)+ X2+X6 →等待一拍→R(X3+X7) + X4+X8 → 等待一拍→R(X1+X5 + X2+X6 )+X3+X7 + X4+X8 →等待三拍→ 输出。


4. 假 定 要 在 一 个 时 钟 速 率 为 指令所占 CPI 指令类型 40MHz的标量处理机上执行 比例 20万条目标代码指令的程序, ALU 1 60% 该程序中含有4种主要类型 指令,每种指令类型所占的 LOAD/STOR 比例及CPI数如右表所示。 E指令 (Cache 2 18% 计算: 命中时) ① 在单处理机上执行该程 4 12% Branch指令 序的平均CPI。 ② 根 据 ① 所 得 的 CPI 值 计 访 存 指 令 算相应的MIPS速率 8 10% (Cache 不 命 中时)

2
解:(1)由预约表得出禁止表F={6,3,1},初始冲 突向量C0={100101}。 由冲突向量和后继状态冲突向量的计算规则 Cj=SHR(k)(Ci)∨C0 得出状态有向图如下:
5 (100101) 5 2 (101101) 2 (101111) 5 4 5 (100111)

调度策略 (2, 2, 5) (2, 5) (4) (4, 5) (5)
解:1.在多个部件同时改进的情况下,因为re为采用 增强功能措施比不采用增强功能可加快执行的倍数, 在这里就是Si。所以 Amdahl定律表示如下:
已知S1=30,S2=20,S3=10,Sn=10,f1=0.3,f2=0.3。 代入上式,得:
求得f3=0.36。
2.设整个系统改进前执行时间为T,则3个部件改进前的执 行时间为(0.3+0.3+0.2)T=0.8T。则其他部件的执行时间 为(1-0.8)T=0.2T。 已知3个部件改进后达到的加速比分别为S1=30,S2=20, S3=10。因此, 3个部件改进后的执行时间 T'n=0.3T/30+0.3T/20+0.2T/10=0.045T 其他部件没有改进,执行时间仍为0.2T,故改进后的系 统执行时间为 Tn=0.045T+0.2T=0.245T 从而改进后系统的加速比为 Sn=T/Tn=1/0.245=4.1 未改进部件执行时间在改进后的整个系统的执行时间中 占的比例为0.2T/0.245T=0.82
相关文档
最新文档