第一章作业答案概要

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

010
011 100 101 110 111 3.00
1、假设在一个采用组相联映象方式的 Cache中,主 存由 B0~B7 共 8 块组成, Cache 有 2组,每组 2 块,每块的大小 为16个字节,采用LFU块替换算法。在一个程序执行过程 中依次访问这个Cache的块地址流如下: 6,2,4,1,4,6,3,0,4,5,7,3 (1) 写出主存地址的格式,并标出各字段的长度。 (2) 写出Cache地址的格式,并标出各字段的长度。 (3) 画出主存与Cache之间各个块的映象对应关系。 (4) 如果 Cache 的各个块号为 C0、C1、C2 和 C3,列出程 序执行过程中Cache的块地址流情况。 (5) 如果采用FIFO替换算法,计算Cache的块命中率。 (6)采用LFU替换算法,计算Cache的块命中率。
来自百度文库
=18.84ns
合适。
1、若有一静态多功能流水线分为6段,如下图所示, 其中乘法流水线由1、2、3、6段组成,加法流水线由1、 4、5、6段组成。使用流水线时,要等某种功能(如加 法)操作都处理完毕后才能转换成另一种功能(如乘 法)。 若要计算:A×B=(a1+b1)×(a2+b2)×(a3+b3) 问:(1)在上述流水方式下,完成A×B需多少时间? 画出时空图并计算此流水线的使用效率和吞吐率。 (2)与顺序运算方式相比,加速比为多少?
解:
6 5
组号 5 (2) 缓存地址: 组号 3 区号Ei 4 块号 2 块号Bi
4
块号 3
3
块内地址
0
(1)主存地址:
区号
0 块内地址
相关存储器的格式:
1 缓存块号bi
0 装入位
相关存储器的容量,应与缓存的块数相同,
即: 组数×组内块数=22 = 2×2=4个存储单元。 (3)对应关系: 主存 Cache 0145 0 1 2367 2 3
霍夫曼编码
霍夫曼扩展 编码
普通编码
000 001
00 01
00 01
I3
I4 I5 I6 I7 I8 ∑PiLi
0.20
0.10 0.05 0.02 0.02 0.01
10
110 1110 11110 111110 111111 2.38 减少0.62
10
11111 11110 11101 11100 11011 2.6 减少0.40
块地址流 6 C0 C1 C2 6
4 3 7
C3
FIFO
6 2
6 2
2
2
2
调 调 调 调 命 命 进 进 进 进 中 中 命中3次
替 换
替 替 换 换
替 换
替 换
命 中
命中率H=3/12=25%
2、假设机器的时钟周期为10ns,Cache失效时的访存时 间为20个时钟周期,Cache的访问时间为一个时钟周 期。 (1) 设失效率为 0.05 ,忽略写操作时的其它延迟, 求机器的平均访存时间。 (2) 假设通过增加Cache容量一倍而使失效率降低 到 0.03 ,但使得 Cache 命中时的访问时间增加到了 1.2时钟周期(即12ns),指出这样的改动设计是否 合适? (3) 如果时钟周期取决于Cache的访问时间(也就是用 延长时钟周期的方法),上述改动设计是否合适?
1、某模型机有8条指令,使用频率分别为:0.3,0.3,0.2, 0.1,0.05,0.02,0.02,0.01。试分别用霍夫曼编码和扩 展编码对其操作码进行编码,限定扩展编码只能有两种 长度。则它们的平均编码长度各比定长操作码的平均编 码长度减少多少?
指令Ii
I1 I2
频率Pi
0.30 0.30
替 换
替 命 换 中
替 换
替 换
命 中
Cache的块地址流情况: C2 C3 C0 C1 C0 C2 C3 C1 C0 C1 C2 C3
时间t
1
2
2
3
4 4
4
1 4 1 6 2
5
4 4 1 6 2
6
6 4 1 6
7
3 4 1 3 2
8
0 0 1 3 2
9
4 0 4 3
10 11 12
5 5 4 3 7 5 3 5 4 3 7
T=IN×CPI×Tc
=105×1.55×(1/40×106) =3.875ms
2、假定要在一个时钟速率为40MHz处理机上执 行200000条指令的目标代码,程序主要由四种 指令组成。根据程序跟踪实验结果,已知指令 混合比和每种指令所需的指令数如下:
指令类型 算术和逻辑 高速缓存命中的加载/存储 转移 高速缓存缺失的存储器访问 CPI 1 2 4 8 指令混合比 60% 18% 12% 10%
时间t
1
2
2
3
4 4
4
1 4 1 6 2
5
4 4 1 6 2
6
6 4 1 6
7
3 4 1 6 3
8
0 4 0 6 3
9
4 4 0 6
10 11 12
5 4 5 6 7 4 3 4 5 7 3
块地址流 6 C0 C1 C2 6
5 7 3
C3
LFU
6 2
6 2
2
3
3
调 调 调 调 命 命 进 进 进 进 中 中 命中4次 命中率H=4/12=33.3%
第一章
1 、用一台40MHz处理机执行标准测试 程序,它含的混合指令数和相应所需的 时钟周期数如下:
指令类型 整数运算 数据传送 浮点 控制传送 指令数 45 32 15 8 000 000 000 000 时钟周期数 1 2 2 2
求有效CPI、MIPS速率和程序的执行时间
解:CPI=1×45%+2×32%+2×15%+2×8% =1.55时钟周期 MIPS=Rc/(CPI*106)=(40*106)/ )=25.81(百万次/秒) (1.55*106
答案: (1)机器的平均访存时间 T=TcHc+(1-Hc)Tm=0.95×10+0.05×20×10
=19.5ns
(2)T=TcHc+(1-Hc)Tm =0.97×10×1.2+0.03×20×10 =17.64ns 这种改动合适,使机器的平均访存时间降低。 (3)T=TcHc+(1-Hc)Tm =0.97×10×1.2+0.03×20×10×1.2
要求计算: (1) 在单处理机上用上述跟踪数据运行程序的平均CPI。
(2) 根据(1)所得到的CPI值,计算相应的MIPS速率。
答案: Rc=40*106 IN =2* 105条
(1) CPI=1*0.6+2*0.18+4*0.12+8*0.1=2.24
(2) MIPS= Rc/(CPI*106)=(40*106 )/ (2.24*106 )=17.86(百万次/秒)
相关文档
最新文档