计算机系统结构 第五章(习题)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 向量流水机的工作方式可分为哪两大类?它们的主要特点是什么?
2. 向量的加工方法有哪几种?各有什么特点?试从加工速度、需用中间变量
等方面加以比较。
3. 在CRAY1机上,V为向量寄存器,设向量长度均为32,s为标量寄存器,
所用浮点功能执行部件的执行时间分别为:加法需6拍,相乘需7拍,从存储器读数需6拍,求倒数近似值需14拍,打入寄存器及启动功能部件(包括寄存器)各需1拍。问下列各指令组中的哪些指令可以链接?哪些指令可以并行执行?试说明其原因并分别计算出各指令组全部完成所需的拍数。
(1)V0←存储器
V1←V2+V3
V4←V5*V6 (2)V2←V0*V1
V3←存储器
V4←V2+V3
(3)V0←存储器
V3←V1+V2
V4←V0*V3
V6←V4+V5 (4)V0←存储器
V1←1/V0
V3←V1+V2
V5←V3*V4
(5)V0←存储器
V1←V2+V3
V4←V5*V6
s0←s1+s2 (6)V3←存储器
V2←V0+V1
s0←s2+s3
V3←V1*V4
(7)V3←存储器
V2←V0+V1
V4←V2*V3
存储器←V4 (8)V0←存储器
V2←V0+V1
V3←V2*V1
V5←V3*V4
4. 在CRAYl机上,按链接方式执行下述4条向量指令(括号中给出相应功能
部件时间),如果向量寄存器和功能部件之间的数据传送需1拍,试求此链
接流水线的流过时间为多少拍?如果向量长度为64,则需多少拍能得到全部结果?
V0←存储器(存储器取数:7拍)
V2←V0+Vl (向量加:3拍)
V3←V2<A3 (按(A3)左移:4拍)
V5←V3∧V4 (向量逻辑乘:2拍)
5. 若某个向量机其向量方式的执行速率Rv=10MFLOPS,标量方式的执行速
率Rs=1MFLOPS,设α是程序中可向量化的百分比。要求:
⑴推导该向量机的平均执行速率Ra的公式。
⑵画出在(0,1)范围内,Ra与α的关系图。
⑶为使平均执行速率Ra=7.5MFlOPS,则α应取何值?
⑷假定Rs=1MFLOPS,α=0.7,则为使Ra=2MFLOPS,Rv应取何值?