系统结构例题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简单循环:状态图中每个冲突向量只经过 一次的启动循环。 (3)最小启动循环 (1,7)和 (3,5) 平均启动距离:4 (4)启动距离最小的恒定循环(5)
11:有如下3条向量指令: 1: V3 ← A 2: V2 ← V0+V1 3: V4 ← V2×V3 第1、2条指令没有冲突,可以同时开始执行 第3条指令与第1、2条指令均存在写读冲突, 可以链接执行
0#区
1#区
1#块 … 511#块
主存地址04011H在 2#区,故不命中
63#区
… 0#块 1#块 … 511#块
7
某Cache存储系统采用直接映像方式, Cache有8块,CPU送出的主存块地址流依 次为14、18、14、18、8、4、8、10。求每 次访问后Cache地址分配情况和操作状态。
1、某浮点数系统使用的阶码位数p=2(阶 码基值rp=2),尾数基值rm=10,以rm为基 的尾数位数m‘=1,试计算在非负阶、正尾 数、规格化情况下的最小尾数值、最大尾 数值、最大阶值、可表示的最小值和最大 值以及可表示数的个数。 说明:尾数的机器位数为m
m m'= ⎡log 2 rm ⎤
最小尾数值 rm-1 = 0.1 最大尾数值 1-rm-m’ = 0.9 最大阶值 2p-1= 3 可表示的最小值 rm-1 = 0.1 2p-1 •(1-r -m’ ) = 900 可表示的最大值 rm m 可表示数的个数 2p × rmm’ × (rm-1) / rm =36
Cache块号 3位
块内地址 4位
主存块号 8位
块内地址 4位
5H
0#块 1#块 … 5#块 6#块 7#块 Cache
8H
33H
0#块 1#块
8H
…
33H#块 … FFH#块 主存
6
某Cache存储系统采用直接映像方式,其容量为 8KB,每块内有16B,主存容量为512KB (1)主存有多少块?多少个区? (2)该Cache可容纳多少个块?Cache字地址有多少 位?块号和块内地址各多少位? (3)主存字地址多少位?区号、区内块号和块内地 址各多少位? (4)主存中的第i块映像到Cache中的哪个块中? (5)将主存的第513块调入Cache,对应Cache块号 是多少?区号标志是多少? (6)CPU访问主存地址04011H是否命中?
m
m
m
m
10
(1) (2) (3) (4)
一条4功能段的非线性流水线,每个功能段的延 迟时间都相等,预约表如下。 写出流水线的禁止向量和初始冲突向量 画出调度流水线的状态图 求最小启动循环和最小平均启动距离 求平均启动距离最小的恒定循环
101111右移5位之后:000001V101010 = 101011 101111右移3位之后:000101V101010 = 101111 001011右移5位之后:000001V101010 = 101011
Cache地址 组号 块号 块内地址
主存地址 区号 组号 块号 块内地址
1位
第0组 第1组
2位
0#块 1#块 2#块 3#块 Cache
4位
1位 1位
0#块 1#块 2#块 3#块 0#块 1#块 2#块 3#块 主存 第1组 第0组
2位
4位
0#块 1#块 2#块 3#块 4#块
0#区 第1组 第0组 1#区
使用频率 0.52 0.14 0.12 0.07 0.06 0.05 0.02 0.01 0.01
哈夫曼编码 2-4-6扩展码 0 00 100 01 110 10 1010 1100 1011 1101 1110 1110 11110 111100 111110 111101 111111 111110
5#块 6#块 7#块
主存块地址流 1 Cache 内容 0 5
2 5 1 2 7 替 换
4 4 1 2 7 替 换
1 4 1 2 7 命 中
3 4 1 2 3 替 换
7 4 1 7 3 替 换
0 0 1 7 3 替 换
1 0 1 7 3 命 中
2 0 1 7 2 替 换
5 5 1 7 2 替 换
块地址序列
14
18
14
18
8
4
8
10
14
18
18
18
18
18
18
10
14
14
14
14
4
4
4
14
14
14
调入
调入
命中
命中
调入
调入
命中
替换
8
某Cache存储系统,主存有0~7共8个块。Cache有 4个块,每块16B,采用组相联映像,分2组。假设 Cache已预取进来主存的第5、1、3、7块,现访存 块地址流为1、2、4、1、3、7、0、1、2、5、4、 6时: (1)写出主存地址格式,并标出各字段的长度 (2)写出Cache地址格式,并标出各字段的长度 (3)画出主存与Cache之间各块的映像对应关系图; (4)画出用LRU替换算法,Cache内各块的实际替 换过程图,并标出命中和替换时刻; (5)求出此时的Cache命中率。
哈夫曼编码平均码长=2.24 扩展码平均码长=2.52
3
如果一个Cache存储系统中,主存容量为12MB, Cache容量为400KB,则该存储系统的总容量为 (12MB) 解答:Cache的存储容量较小(最新的微处理器中 Cache容量可以达到1M),价格较高。主存容量大, 价格比Cache便宜得多。这两种存储器组成的存储系 统,由于在一定的程序执行时间段内,CPU需要的数 据大都能在Cache中访问到,因此,这个存储系统的 存取速度与Cache非常接近。对于程序员来说,由于 “看不到”Cache,所以认为访问的都是主存储器,因 此,存储系统的容量就是主存储器的容量。在整个 存储系统中,Cache所占的比例很小,因此,每单位 的平均价格与主存储器很接近。
4
在Cache存储系统中,当程序正在执行时,由 (B)完成地址变换。 程序员 硬件 硬件和软件 操作系统
A. B. C. D.
解答:Cache存储系统的管理全部由硬件实现,无需 程序员干预,即它对软件开发设计人员是透明的(一 个实际存在的部件看起来好像不存在,称为“透明”)
5
某Cache存储系统采用全相联映像,主存容 量为16字×256块,Cache容量为16字×8块。 如果原先已经依次装入5块信息,问字地址 为338H所在的主存块将装入Cache中的哪个 块(块号)以及在Cache中的字地址?
浮点加 123456 浮点乘 1234567 Mem V0 Vቤተ መጻሕፍቲ ባይዱ 123456 V2 V3 V4
1: V3 ← A 2: V2 ← V0+V1 3: V4 ← V2×V3
三种执行方式比较: (1) 如果向量长度为N,三条指令采用串行方法 执行的时间为: [(1+6+1)+N-1]+[(1+6+1)+N-1]+[(1+7+1)+N-1] = 3N+22 拍 (2) 如果前两条指令并行执行,第三条指令串行 执行,则执行时间为: [(1+6+1)+N-1]+[(1+7+1)+N-1] = 2N+15 拍 (3) 如果采用链接技术,则执行时间为: (1+6+1)+(1+7+1)+(N-1)=17+N-1 = N+16 拍 每拍为一个时钟周期
2、经统计,某机器共有9条指令,使用频率 如下表所示。分别求出等长码、哈夫曼码和 2-4-6扩展哈夫曼码这三种编码方式的操作码 平均码长。
指令 I1 I2 I3 I4 I5 I6 I7 I8 I9
使用频率 0.52 0.14 0.12 0.07 0.06 0.05 0.02 0.01 0.01
指令 I1 I2 I3 I4 I5 I6 I7 I8 I9
执行
分析
取指
5 相对于标量流水处理机的加速比=14/5=2.8
Δt
超长指令字处理机时空图
执行 分析 取指 5 相对于标量流水处理机的加速比=14/5=2.8 Δt
超流水线处理机时空图
执行
分析
取指
5.75
Δt
相对于标量流水处理机的加速比=14/5.75=2.435
12
设指令流水线由取指令、分析指令和执行 指令3个部件组成,每个部件经过的时间为 Δt,连续流入12条指令。分别画出标量流 水处理机以及ILP均为4的超标量处理机、 VLIW、超流水处理机的时空图,并分别计 算它们相对于标量流水处理机的加速比。
执行 分析 取指 14 Δt 标量流水处理机时空图
超标量流水处理机时空图
4 5 4 7 2 替 换
6 5 4 6 2 替 换
组 1 1 3
组 7 命中情况 命 中
命中率H=3/12=0.25
9 有一条浮点加法流水线,由求阶差、对阶、尾数加和规格化4 个功能段完成,每段的延迟时间均为Δt,现要完成以下运算, 画出该流水线完成此运算的时空图,并求流水线的吞吐率、加速 比和效率
Cache地址 Cache块号 块内地址 区号
主存地址 区内块号 块内地址
9位
0#块 1#块 … 511#块 Cache
4位
6位
9位
0#块 1#块 … 511#块 0#块
4位
0#块 1#块 … 511#块 512#块 513#块 … 1023#块 … 32255#块 32256#块 … 32767#块 主存