北理工计算机体系结构习题解答
北理工计算机体系结构习题解答共141页
北理工计算机体系结构习题解答
1、合法而稳定的权力在使用得当时很 少遇到 抵抗。 ——塞 ·约翰 逊 2、权力会使人渐渐失去温厚善良的美 德。— —伯克
3、最大限度地行使权力总是令人反感 ;权力 不易确 定之处 始终存 在着危 险。— —塞·约翰逊 4、权力会奴化一切。——塔西佗
5、虽然权力是一头固执的熊,可是金 子可以 拉着它 的鼻子ห้องสมุดไป่ตู้走。— —莎士 比
谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利
计算机系统结构习题解答
1. 假设一条指令的执行过程分为“取指令”、“分析”和“执行”三段;每一段的时间分别是△t 、2△t 和3△t..在下列各种情况下;分别写出连续执行n 条指令所需要的时间表达式.. ⑴ 顺序执行方式..⑵ 仅“取指令”和“执行”重叠.. ⑶ “取指令”、“分析”和“执行”重叠.. 答:⑴ 顺序执行方式12......12 12T =∑=++n1i i i i )t t t (执行分析取址=n △t +2△t +3△t =6n △t⑵ 仅“取指令”和“执行”重叠12......12 12T =6△t +∑=+1-n 1i i i )t t (执行分析=6△t +n-12△t +3△t =5n +1△t⑶ “取指令”、“分析”和“执行”重叠△2△t3△t△2△t3△t1 2 34......1 234 1234T =6△t +∑=1-n 1i i )t (执行=6△t +n-13△t =3n +3△t2. 一条线性流水线有4个功能段组成;每个功能段的延迟时间都相等;都为△t..开始5个任务;每间隔一个△t 向流水线输入一个任务;然后停顿2个△t;如此重复..求流水线的实际吞吐率、加速比和效率.. 答:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15...1 2 3 4 56 7 8 9 1011 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 151 2 3 4 56 7 8 9 1011 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23我们可以看出;在7n+1Δt 的时间内;可以输出5n 个结果;如果指令的序列足够长n →∞;并且指令间不存在相关;那么;吞吐率可以认为满足:加速比为:从上面的时空图很容易看出;效率为:3. 用一条5个功能段的浮点加法器流水线计算∑==101i i A F ..每个功能段的延迟时间均相等;流水线的输出端与输入端之间有直接数据通路;而且设置有足够的缓冲寄存器..要求用尽可能短的时间完成计算;画出流水线时空图;计算流水线的实际吞吐率、加速比和效率..答:首先需要考虑的是“10个数的和最少需要做几次加法”;我们可以发现;加法的次数是不能减少的:9次;于是我们要尽可能快的完成任务;就只有考虑如何让流水线尽可能充满;这需要消除前后指令之间的相关..由于加法满足交换律和结合律;我们可以调整运算次序如以下的指令序列;我们把中间结果寄存器称为R;源操作数寄存器称为A;最后结果寄存器称为F;并假设源操作数已经在寄存器中;则指令如下:I1:R1←A1+A2I2:R2←A3+A4I3:R3←A5+A6I4:R4←A7+A8I5:R5←A9+A10I6:R6←R1+R2I7:R7←R3+R4I8:R8←R5+R6I9:F←R7+R8这并不是唯一可能的计算方法..假设功能段的延迟为Δt..时空图如下图中的数字是指令号:1234567891234567891234567891234567891 2 3 4 5 6 7891 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21整个计算过程需要21Δt;所以吞吐率为: 加速比为: 效率为:4. 一条线性静态多功能流水线由6个功能段组成;加法操作使用其中的1、2、3、6功能段;乘法操作使用其中的1、4、5、6功能段;每个功能段的延迟时间均相等..流水线的输出端与输入端之间有直接数据通路;而且设置有足够的缓冲寄存器..用这条流水线计算向量点积i 60i i b a B A ⨯=⨯∑=;画出流水线时空图;计算流水线的实际吞吐率、加速比和效率.. 答:我们安排运算次序如下:把中间结果寄存器称为R;源操作数寄存器称为A 、B;最后结果寄存器称为F;并假设源操作数已经在寄存器中;则指令如下:I1: R0←A0B0 I8: R7←R0+R1 I2: R1←A1B1 I9:R8←R2+R3I3: R2←A2B2 I10: R9←R4+R5 I4: R3←A3B3 I11: R10←R6+R7 I5: R4←A4B4 I12: R11←R8+R9 I6: R5←A5B5I13: F ←R10+R11I7: R6←A6B6假设功能段的延迟为Δt..时空图如下图中的数字是指令号:1 2 3 4 5 6 7 8 9 101112131 2 3 4 5 6 71 2 3 4 5 6 78 9 10 11 12138 9 1011 12131 2 3 4 5 6 78 9 10 11 12131 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 整个计算过程需要24Δt;所以吞吐率为: 加速比为: 效率为:5. 一条有三个功能段的流水线如下图..每个功能段的延迟时间均相等;都为△t..其中功能段S 2的输出要返回到它自己的输入端循环一次..⑴ 如果每间隔一个△t 向流水线的输入端连续输入新任务;问这条流水线会发生什么情况⑵ 求这条流水线能够正常工作的最大吞吐率、加速比和效率.. ⑶ 有什么办法能够提高这条流水线的吞吐率;画出新的流水线.. 答:△t △t △t⑴如果每间隔一个△t向流水线的输入端连续输入新任务;流水线S2功能段存在资源冲突..见下表:⑵每间隔两个△t向流水线的输入端连续输入新任务如见下表所示可获得最佳性能..我们可以看出:在2n+2Δt的时间内;可以输出n个结果;如果指令的序列足够长n→∞;并且指令间不存在相关;那么;吞吐率为:加速比为:效率为:⑶如要提高这条流水线的吞吐率;可采用:将功能段S2重复设置一次;见下图:6. 一条有4个功能段的非线性流水线;每个功能段的延迟时间都相等;都为20ns;它的预约表如下:⑴ 写出流水线的禁止向量和初始冲突向量.. ⑵ 画出调度流水线的状态图..⑶ 求流水线的最小启动循环和最小平均启动距离.. ⑷ 求平均启动距离最小的恒定循环.. ⑸ 求流水线的最大吞吐率..⑹ 按照最小启动循环连续输入10个任务;求流水线的实际吞吐率.. ⑺ 画出该流水线各功能段之间的连接图.. 答: ⑴禁止向量F=6;4;2;冲突向量C=101010..输入△t⑵⑶∴流水线的最小启动循环为:1;7或3;5或5;3;最小平均启动距离为4..⑷由上表可知:平均启动距离最小的恒定循环为5..⑸采用最小平均启动距离为4的最小启动循环可获得流水线的最大吞吐率;以1;7为例:其他类似;最大吞吐率皆相同当任务数为偶数2n 时: 当任务数为奇数2n+1时: ∴ 流水线的最大吞吐率为:)s /(M 5.12ns2041t 41任务=⨯=∆ ⑹10个任务的实际吞吐率:利用上式可得偶数个任务TP 10=1/4△t=12.5M 任务/s.. ⑺该流水线的连接图为:7.一条由4个功能段组成的非线性流水线的预约表如下;每个功能段的延迟时间都为10ns..47⑴ 写出流水线的禁止向量和初始冲突向量.. ⑵ 画出调度流水线的状态图..⑶ 求流水线的最小启动循环和最小平均启动距离..⑷ 在流水线中插入一个非计算延迟功能段后;求该流水线的最佳启动循环及其最小平均启动距离..⑸ 画出插入一个非计算延迟功能段后的流水线预约表5行8列.. ⑹ 画出插入一个非计算延迟功能段后的流水线状态变换图.. ⑺ 分别计算在插入一个非计算延迟功能段前、后的最大吞吐率.. ⑻ 如果连续输入10个任务;分别计算在插入一个非计算延迟功能段前、后的实际吞吐率.. 答: ⑴禁止向量F=5;2;1;冲突向量C=10011..⑵⑶i=466最小启动循环为3;最小平均启动距离为3..⑷插入一个非计算延迟功能段后;最小平均启动距离为2因为预约表中每行至多2个×;相应地可改进最小启动循环为2..⑸⑹流水线的禁止向量为1;3;7;流水线的冲突向量为1000101;流水线的状态图如下:6C0-C065C0-C2-C255;4C0-C2 4.55;6C0-C2 5.5流水线的最小启动循环为2;最小平均启动距离为2..⑺插入前:插入后:⑻连续输入10个任务;插入前的实际吞吐率为:连续输入10个任务;插入后的实际吞吐率为:8. 在流水线处理机中;有独立的加法操作部件和乘法操作部件各一个;加法操作部件为4段流水线;乘法操作部件6段流水线;都在第一段从通用寄存器读操作数;在最后一段把运算结果写到通用寄存器中..每段的时间长度都相等;都是一个时钟周期..每个时钟周期发出一条指令..问可能发生哪几种数据相关写出发生相关的指令序列;分析相关发生的原因;并给出解决相关的具体办法..答:可能的数据相关性有:⑴“先写后读”RAW相关Read After 加法写..原因:还没有写好就已经读取寄存器中的数据了..DADD R1;R2;R3 ;R2+R3→R1DSUB R4;R1;R5 ;R1-R5→R4Read After 乘法写..原因:还没有写好已经读取寄存器中的数据了..DMUL R1;R2;R3 ;R2×R3→R1DSUB R4;R1;R5 ;R1-R5→R4本相关在流水线顺序执行和乱序执行时都可能发生..解决的方法是:利用编译程序调整指令的次序方法;延迟执行是避免数据相关最简单的方法;建立寄存器之间的专用路径..⑵“写—写”WAW相关Write After 乘法写..原因:后写的反而早执行乘法所化的时间长;后面一个写任务反而先完成;使最后写入的内容不正确..DMUL R1;R2;R3 ;R2×R3→R1DSUB R1;R4;R5 ;R4-R5→R1本相关只有在流水线乱序执行时才可能发生..解决的方法是:寄存器换名..⑶“先读后写”WAR相关Write After 任何读..原因:前面的读操作因为某种原因被推迟;要读的内容被后面的写操作修改了..DSUB R4;R1;R5 ;R1-R5→R4DADD R1;R2;R3 ;R2+R3→R1本相关只有在流水线乱序执行时才可能发生..解决的方法是:寄存器换名..9. 在下列不同结构的处理机上运行8×8的矩阵乘法C=A×B;计算所需要的最短时间..只计算乘法指令和加法指令的执行时间;不计算取操作数、数据传送和程序控制等指令的执行时间..加法部件和乘法部件的延迟时间都是3个时钟周期;另外;加法指令和乘法指令还要经过一个“取指令”和“指令译码”的时钟周期;每个时钟周期为20ns;C 的初始值为“0”..各操作部件的输出端有直接数据通路连接到有关操作部件的输入端;在操作部件的输出端设置有足够容量的缓冲寄存器..⑴处理机内只有一个通用操作部件;采用顺序方式执行指令..⑵单流水线标量处理机;有一条两个功能的静态流水线;流水线每个功能段的延迟时间均为一个时钟周期;加法操作和乘法操作各经过3个功能段..⑶多操作部件处理机;处理机内有独立的乘法部件和加法部件;两个操作部件可以并行工作..只有一个指令流水线;操作部件不采用流水线结构..⑷单流水线标量处理机;处理机内有两条独立的操作流水线;流水线每个功能段的延迟时间均为一个时钟周期..⑸超标量处理机;每个时钟周期同时发射一条乘法指令和一条加法指令;处理机内有两条独立的操作流水线;流水线的每个功能段的延迟时间均为一个时钟周期..⑹超流水线处理机;把一个时钟周期分为两个流水级;加法部件和乘法部件的延迟时间都为6个流水级;每个时钟周期能够分时发射两条指令;即每个流水级能够发射一条指令..⑺超标量超流水线处理机;把一个时钟周期分为两个流水级;加法部件和乘法部件延迟时间都为6个流水级;每个流水级能够同时发射一条乘法指令和一条加法指令..答:要完成上面的矩阵乘法;需要完成的乘法数目为8×8×8=512次;需要完成的加法数目为8×8×7=448次;下面分析处理机的结构会给性能带来什么样的影响..⑴通用操作部件采用顺序方式执行顺序执行时;每个乘法和加法指令都需要5个时钟周期取指令、指令分析、指令执行;所以所需要的时间为:⑵单流水线标量处理机;有一条两个功能的静态流水线因为有足够的缓冲寄存器;所以我们可以首先把所有的乘法计算完;并通过调度使加法流水线不出现停顿;所以所需要的时间为:123456785135145155165175189639649659661=①+②、2=1+③、3=2+④、4=3+⑤、5=4+⑥、6=5+⑦、7=6+⑧⑶多操作部件处理机;只有一条指令流水线由于只有一条指令流水线;所以只能一个时钟周期发射一条指令;由于操作部件不采用流水线;对于结果C矩阵的第一个元素;首先执行2次乘法;然后乘法和加法并行执行7次;此时C矩阵的第一个元素出来了;然后加法运算停顿3个时钟周期;再开始与乘法并行执行运算7次;如此下去;直到C的64个元素都出来..故执行时间为:⑷单流水线标量处理机;处理机内有两条独立的操作流水线由于只有一条指令流水线;所以只能一个时钟周期发射一条指令;对于乘法运算不存在数据相关;对于加法运算有数据相关;由于存在足够的缓冲寄存器;我们可以通过合适的调度消除加法的数据相关..因此;最佳情况下的执行时间为:12345678910111213141516171819202122 1=①+②、2=1+③、3=2+④、4=3+⑤、5=4+⑥、6=5+⑦、7=6+⑧⑸超标量处理机同一时钟周期可以有一条乘法指令和一条加法指令同时发射;对于乘法运算不存在数据相关性;对于加法运算有数据相关性;由于存在足够的缓冲寄存器;当运算完所有的乘法运算后;还要做一次加法运算..因此执行时间为:12345678910111213141516171819202122 1=①+②、2=1+③、3=2+④、4=3+⑤、5=4+⑥、6=5+⑦、7=6+⑧⑹超流水线处理机每个时钟周期发射两条指令;加法部件和乘法部件都为6个流水级..事实上相当于将时钟周期变成了10ns;而加法和乘法流水线变成了6级..因此执行时间为:⑺超标量超流水线处理机一个时钟周期分为两个流水级;加法部件和乘法部件都为6个流水级;每个流水级能同时发射一条加法和一条乘法指令..综合⑸和⑹的分析;我们可以知道;执行时间为:。
北京理工大学数据结构试题与答案
return false; // 查找失败
else {
if (item==BST->data){
item=BST->data;// 查找成功
return ___________;} else if(item<BST->data)
return Find(______________,item);
else return Find(_______________,item);
(B) 3, 2, 5, 8,6
(C) 3,2, 5, 6, 8
(D) 2 ,3, 6, 5, 8
二、填空题 (24 分)
1. 为了能有效地应用 HASH 查找技术,必须解决的两个问题是 __________________________ 。
____________________ 和
2. 下面程序段的功能实现数据 x 进栈,要求在下划线处填上正确的语句。
}
3. 中序遍历二叉排序树所得到的序列是 ___________序列(填有序或无序) 。
4. 快速排序的最坏时间复杂度为 ___________,平均时间复杂度为 __________ 。 5. 设某棵二叉树中度数为 0 的结点数为 N 0,度数为 1 的结点数为 N 1,则该二叉树中度数
为 2 的结点数为 _________;若采用二叉链表作为该二叉树的存储结构,则该二叉树中
9. 假定一个线性表为 (12,23,74,55,63,40,) 若按 Key % 4 条件进行划分,使得同一余数的元
素 成 为 一 个 子 表 , 则 得 到 的 四 个 子 表 分 别 为 ____________________________ 、 ___________________ 、_______________________ 和 __________________________ 。
计算机体系结构课后答案
计算机体系结构课后答案【篇一:计算机体系结构习题(含答案)】1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。
对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。
(1)最大尾数(8)最小正数(2)最小正尾数(9)最大负数(3)最小尾数(10)最小负数(4)最大负尾数(11)浮点零(5)最大阶码(12)表数精度(6)最小阶码(13)表数效率(7)最大正数(14)能表示的规格化浮点数个数2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。
尾数用原码、纯小数表示,阶码用移码、整数表示。
(1) 设计这种浮点数的格式(2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。
3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。
(1) 选择合适的舍入方法。
(2) 确定警戒位位数。
(3) 计算在正数区的误差范围。
4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。
b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。
如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。
对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。
(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。
6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为6位。
北理工计算机体系结构习题解答
第1章 基础知识
• 并行性
–指可以同时进行运算或操作的特 性,它有两重含义:
• 同时性:同一时刻发生 • 并发性:同一时间间隔内发生
8
圈中人保险资料库收集整理制作,未经授权请勿转载
第1章 基础知识
• 系列机
– 同一厂家生产的具有相同系统结构、但有不同 组成和实现的一系列不同型号的机器
13
圈中人保险资料库收集整理制作,未经授权请勿转载
第1章 基础知识
(2)不可以。中断的分级和中断的响应次序 等中断机构都属于计算机系统结构的内容。 中断分级由原来的4级增加到5级应当还是 允许的,关键是重新调整了中断响应的优 先次序,这就使原有程序的中断响应次序 发生了改变,会影响原有程序工作的正确 性。
10
圈中人保险资料库收集整理制作,未经授权请勿转载
第1章 基础知识
• 1-1
第4级 N3/M3 *K秒
第3级 N2/M2 *K秒 (同理)
第2级
N/M*K秒 (X/M * N*1/X*K=N/M*K秒)
第1级
K秒(设为X条,每条需要 1/X*K秒)
11
圈中人保险资料库收集整理制作,未经授权请勿转载
1-9 如果某一计算任务用向量方式求解比 用标量方式求解要快20倍,称可用向量 方式求解部分所花费时间占总的百分比 为可向量化百分比。请写出加速比与可 向量化比例两者的关系曲线。
解:
S
1
20
(1 F) F / 20 20 19 F
18
圈中人保险资料库收集整理制作,未经授权请勿转载
出发,计算机系统结构指层次结构中传
统机器级的系统结构,研究的是软、硬件之间 的功能分配,以及对传统机器级界面的定义
北理工计算机体系结构习题解答
*1
32000 *
2
15000
*
2
8000
*
2)
*
(
40
1 *106
)
3.875*103秒
21
1-11 假设在一台40MHz处理机上运营200,000条指令旳目旳代码,程序主要
由四种指令构成。根据程序跟踪试验成果,已知指令混合比和每种指令所 需旳指令数如下:
指令类型
CPI
指令混合比
算术和逻辑
1
6
第1章 基础知识
仿真
用一种机器(A)旳微程序直接解 释 实 现 另 一 种 机 器 ( B) 旳 指 令 系 统,从而实现软件移植旳措施
被仿真旳机器称为目旳机,进行 仿真旳机器称为宿主机,解释微 程序机器称为仿真微程序
7
第1章 基础知识
并行性
指能够同步进行运算或操作旳特 征,它有两重含义:
40
第2章
(1)最优Huffman H=- ∑Pi×log2Pi
=0.25×2+0.20×2.322+0.15×2.737+ ……
=2.96
41
I10
I9
I8
I7
I6
I5
I4
I3
I2
0.02
0.03
0.04
0.05
0.08
0.08
0.10
0.15
0.20
1
1 0
0
0.05
0.09
1
0
1
0
0.17
原来存在旳事物或属性,从某个角 度看却好象不存在
软件兼容
程序能够不加修改地运营在各档机 器上,区别仅在于运营时间不同
计算机系统结构 第四章(习题解答)
1. 假设一条指令的执行过程分为“取指令”、“分析”和“执行”三段,每一段的时间分别是△t 、2△t 和3△t 。
在下列各种情况下,分别写出连续执行n 条指令所需要的时间表达式。
⑴ 顺序执行方式。
⑵ 仅“取指令”和“执行”重叠。
⑶ “取指令”、“分析”和“执行”重叠。
答:⑴ 顺序执行方式12 ......1 2 12T =∑=++n1i i i i )t t t (执行分析取址=n(△t +2△t +3△t)=6n △t⑵ 仅“取指令”和“执行”重叠12 ......1 212T =6△t +∑=+1-n 1i i i )t t (执行分析=6△t +(n-1)(2△t +3△t)=(5n +1)△t⑶ “取指令”、“分析”和“执行”重叠12 34 ......1 2 3 41234△t2△t3△t△t2△t3△t△t2△t3△tT =6△t +∑=1-n 1i i )t (执行=6△t +(n-1)(3△t)=(3n +3)△t2. 一条线性流水线有4个功能段组成,每个功能段的延迟时间都相等,都为△t 。
开始5个任务,每间隔一个△t 向流水线输入一个任务,然后停顿2个△t ,如此重复。
求流水线的实际吞吐率、加速比和效率。
答:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15...1 2 3 4 5 6 7 8 9 10 11 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1 2 3 4 56 7 8 9 10 11 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23我们可以看出,在(7n+1)Δt 的时间内,可以输出5n 个结果,如果指令的序列足够长(n →∞),并且指令间不存在相关,那么,吞吐率可以认为满足:)n (t75t )n /17(5t )1n 7(n 5TP ∞→∆=∆+=∆+=加速比为:)n (720n /17201n 7n 20t )1n 7(t 4n 5S ∞→=+=+=∆+∆⨯=从上面的时空图很容易看出,效率为:)n (75n /1751n 7n 5t )1n 7(4t 4n 5E ∞→=+=+=∆+⨯∆⨯=3. 用一条5个功能段的浮点加法器流水线计算∑==101i i A F 。
计算机系统结构-第三章(习题解答)
计算机系统结构-第三章(习题解答)1. 什么是存储系统?对于一个由两个存储器M 1和M 2构成的存储系统,假设M1的命中率为h ,两个存储器的存储容量分别为s 1和s 2,存取时间分别为t 1和t 2,每千字节的成本分别为c 1和c 2。
⑴ 在什么条件下,整个存储系统的每千字节平均成本会接近于c 2? ⑵ 该存储系统的等效存取时间t a 是多少?⑶ 假设两层存储器的速度比r=t 2/t 1,并令e=t 1/t a 为存储系统的访问效率。
试以r 和命中率h 来表示访问效率e 。
⑷ 如果r=100,为使访问效率e>0.95,要求命中率h 是多少?⑸ 对于⑷中的命中率实际上很难达到,假设实际的命中率只能达到0.96。
现在采用一种缓冲技术来解决这个问题。
当访问M 1不命中时,把包括被访问数据在内的一个数据块都从M 2取到M 1中,并假设被取到M 1中的每个数据平均可以被重复访问5次。
请设计缓冲深度(即每次从M 2取到M 1中的数据块的大小)。
答:⑴ 整个存储系统的每千字节平均成本为:12s 1s 2c 2s 1s 1c 2s 1s 2s 2c 1s 1c c ++⨯=+⨯+⨯=不难看出:当s1/s2非常小的时候,上式的值约等于c2。
即:s2>>s1时,整个存储器系统的每千字节平均成本会接近于c2。
⑵ 存储系统的等效存取时间t a 为:2t )h 1(1t h t a ⨯-+⨯=⑶r)h 1(h 1t )h 1(t h t t t e 211a 1⨯-+=⨯-+⨯==⑷ 将数值代入上式可以算得:h>99.95% ⑸通过缓冲的方法,我们需要将命中率从0.96提高到0.9995。
假设对存储器的访问次数为5,缓冲块的大小为m 。
那么,不命中率减小到原来的1/5m ,列出等式有:m596.0119995.0--= 解这个方程得:m=16,即要达到⑷中的访问效率,缓冲的深度应该至少是16(个数据单位)。
计算机系统结构第三章(习题解答)
1. 什么是存储系统?对于一个由两个存储器M 1和M 2构成的存储系统,假设M1的命中率为h ,两个存储器的存储容量分别为s 1和s 2,存取时间分别为t 1和t 2,每千字节的成本分别为c 1和c 2。
⑴ 在什么条件下,整个存储系统的每千字节平均成本会接近于c 2? ⑵ 该存储系统的等效存取时间t a 是多少?是多少?⑶ 假设两层存储器的速度比r=t 2/t 1,并令e=t 1/t a 为存储系统的访问效率。
试以r 和命中率h 来表示访问效率e 。
⑷ 如果r=100,为使访问效率e>0.95,要求命中率h 是多少?是多少?⑸ 对于⑷中的命中率实际上很难达到,对于⑷中的命中率实际上很难达到,假设实际的命中率只能达到假设实际的命中率只能达到0.96。
现在采用一种缓冲技术来解决这个问题。
采用一种缓冲技术来解决这个问题。
当访问当访问M 1不命中时,不命中时,把包括被访问数把包括被访问数据在内的一个数据块都从M 2取到M 1中,并假设被取到M 1中的每个数据平均可以被重复访问5次。
请设计缓冲深度(即每次从M 2取到M 1中的数据块的大小)。
答:答:⑴ 整个存储系统的每千字节平均成本为:整个存储系统的每千字节平均成本为:12s 1s 2c 2s 1s 1c 2s 1s 2s 2c 1s 1c c ++´=+´+´=不难看出:当s1/s2非常小的时候,上式的值约等于c2。
即:s2>>s1时,整个存储器系统的每千字节平均成本会接近于c2。
⑵ 存储系统的等效存取时间t a 为:为:2t )h 1(1t hta´-+´=⑶r)h 1(h 1t )h 1(t h t t t e 211a1´-+=´-+´==⑷ 将数值代入上式可以算得:h>99.95% ⑸通过缓冲的方法,我们需要将命中率从0.96提高到0.9995。
计算机系统结构第二章(习题解答)
计算机系统结构第⼆章(习题解答)1. 数据类型、数据表⽰和数据结构之间是什么关系?在设计⼀个计算机系统时,确定数据表⽰的原则主要有哪⼏个?答:略2. 假设有A 和B 两种不同类型的处理机,A 处理机中的数据不带标志位,其指令字长和数据字长均为32位。
B 处理机的数据带有标志位,每个数据的字长增加⾄36位,其中有4位是标志符,它的指令条数由最多256条减少⾄不到64条。
如果每执⾏⼀条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。
对于⼀个由1000条指令组成的程序,分别计算这个程序在A 处理机和B 处理机中所占⽤的存储空间⼤⼩(包括指令和数据),从中得到什么启发?答:我们可以计算出数据的总数量:∵程序有1000条指令组成,且每条指令平均要访问两个操作数∴程序访问的数据总数为:1000×2=2000个∵每个数据平均访问8次∴程序访问的不同数据个数为:2000÷8=250对于A 处理机,所⽤的存储空间的⼤⼩为:bit4000032250321000MemMemMemdataninstructio A=?+?=+=对于B 处理机,指令字长由32位变为了30位(条数由256减少到64),这样,所⽤的存储空间的⼤⼩为:bit3900036250301000MemMemMemdataninstructio B=?+?=+=由此我们可以看出,由于数据的平均访问次数要⼤于指令,所以,采⽤带标志符的数据表⽰不会增加总的存储空间⼤⼩。
3. 对于⼀个字长为64位的存储器,访问这个存储器的地址按字节编址。
假设存放在这个存储器中的数据中有20%是独⽴的字节数据(指与这个字节数据相邻的不是⼀个字节数据),有30%是独⽴的16位数据,有20%是独⽴的32位数据,另外30%是独⽴的64位数据;并且规定只能从⼀个存储字的起始位置开始存放数据。
⑴计算这种存储器的存储空间利⽤率。
⑵给出提⾼存储空间利⽤率的⽅法,画出新⽅法的逻辑框图,并计算这种⽅法的存储空间利⽤率。
计算机系统结构(第2版(课后习题答案
word文档下载后可自由复制编辑你计算机系统结构清华第2版习题解答word文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)1.2 第二章(P124)2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)1.3 第三章(P202)3.3(存储层次性能),3.5(并行主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法--实存状况图)word文档下载后可自由复制编辑1.4 第四章(P250)4.5(中断屏蔽字表/中断过程示意图),4.8(通道流量计算/通道时间图)1.5 第五章(P343)5.9(流水线性能/时空图),5.15(2种调度算法)1.6 第六章(P391)6.6(向量流水时间计算),6.10(Amdahl定律/MFLOPS)1.7 第七章(P446)7.3、7.29(互连函数计算),7.6-7.14(互连网性质),7.4、7.5、7.26(多级网寻径算法),7.27(寻径/选播算法)word文档下载后可自由复制编辑1.8 第八章(P498)8.12(SISD/SIMD算法)1.9 第九章(P562)9.18(SISD/多功能部件/SIMD/MIMD算法)(注:每章可选1-2个主要知识点,每个知识点可只选1题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例, 习题2.1 第一章(P33)例1.1,p10假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知:Fe=0.4, Se=10,根据Amdahl 定律SeFe Fe T To S n n +-==)1(1 56.164.01104.06.01≈=+=n Sword 文档 下载后可自由复制编辑例1.2,p10采用哪种实现技术来求浮点数平方根FPSQR 的操作对系统的性能影响较大。
计算机系统结构课后答案uint6
计算机系统结构课后答案uint6第六章课后题1.画出16台处理器仿ILLIAC Ⅳ的模式进行互连的互连结构图,列出PE0分别只经一步、二步和三步传送能将信息传送到的各处理器号。
答:6台处理器仿ILLIAC Ⅳ处理单元的互连结构如图所示:图中第个PU中包含PE、PEM和MLU。
PE0(PU0)经一步可将信息传送至PU1、PU4、PU12、PU15。
PE0(PU0)至少需经二步才能将信息传送至PU2、PU3、PU5、PU8、PU11、PU13、PU1 4。
PE0(PU0)至少需经三步步才能将信息传送至PU6、PU7、PU9、PU10。
2.编号为0、1、...、15的16个处理器,用单级互连网互连。
当互连函数分别为(1)Cube3(2)PM2+3(3)PM2-0(4)Shuffle(5)Shuffle(Shuffle)时,第13号处理器各连至哪一个处理器?解答:(1)5号处理器(2)5号处理器(3)12号处理器(4)11号处理器(5)7号处理器剖析:由题意知,有16个处理器,即N=16,n=log2(N)=log2(16)=4。
Cube3(13)=Cube3(1101)=0101=5PM2+3(13)=(13+2^3)mod16=5PM2-0(13)=(13-2^0)mod16=12Shuffle(13)=Shuffle(1101)=1011=11Shuffle(Shuffle)=Shuffle(11)=Shuffle(1011)=0111=73.编号分别为0、1、2、...、F的16个处理器之间要求按下列配对通信:(B、1),(8、2),(7、D),(6、C),(E、4),(A、0),(9、3),(5、F)。
试选择所用互连网络类型、控制方式,并画出该互连网络的拓补结构和各级交换开关状态图。
解答:采用4级立方体网络,级控制。
该互连网络的拓补结构和各级交换开关状态图如下图所示:剖析:从处理器号的配对传送关系可以转成处理器二进制编号的配对传送关系:(B,1) (1011,0001)(8,2) (1000,0010)(7,D) (0111,1101)(6,C) (0110,1100)(E,4) (1110,0100)(A,0) (1010,0000)(9,3) (1001,0011)(5,F) (0101,1111)不难得出其一般规律是:二进制编号为P3P2P1P0的处理器与( ̄P3)P2( ̄P1)P0的处理器配对交换数据。
计算机系统结构第一章(习题解答)
1. 如有一个经解释实现的计算机,可以按功能划分成4级。
每一级为了执行一条指令需要下一级的N条指令解释。
假设执行第一级的一条指令需要K ns时间,那么执行第2、3、4级的一条指令各需要用多少时间?解:可以分情况进展讨论●情况一执行第2级的一条指令需要NK纳秒,执行第3级的一条指令需要N2K纳秒,执行第4级的一条指令需要N3K纳秒。
●情况二执行第2级的一条指令需要K/N纳秒,执行第3级的一条指令需要K/N2纳秒,执行第4级的一条指令需要K/N3纳秒。
2. 实现软件移植的主要途径有哪些?它们存在什么问题?适用于什么场合?答:略3. 想在系列中开展一种新型号机器,你认为以下哪些设想是可以考虑的,哪些那么是行不通的?为什么?⑴新增加字符数据类型和假设干条字符处理指令,以支持事务处理程序的编译。
⑵ 为增强中断处理功能,将中断分析由原来的4级增加到5级,并重新调整中断响应的优先次序。
⑶ 在CPU 和主存之间增设Cache 存储器,以抑制因主存访问速率过低而造成的系统性能瓶颈。
⑷ 为解决计算误差较大的问题,将机器中浮点数的下溢处理方法由原来的恒置“1〞法,改为增设用只读存储器存放下溢处理结果的查表舍入法。
⑸ 为增加寻址灵敏性和减少平均指令字长,将原来全部采用等长操作码的指令改成有3类不同码长的扩展操作码;并将源操作数寻址方式由原来的操作码指明改成增加一个如V AX-11那样的寻址方式位字段来指明。
⑹ 将CPU 与主存之间的数据通路宽度由16位扩展到32位,以加快主机内部信息的传送。
⑺ 为了减少使用公用总线的冲突,将单总线改为双总线。
⑻ 把原来的0号通用存放器改作为专用的堆栈指示器。
答:⑵、⑸、⑻不可以,其它都可以。
⑵ 不可以,对系列机可以增加新功能,但是不能改变原来的功能。
⑸ 不可以,改变了指令的格式和功能。
⑻ 不可以,0号通用存放器变成堆栈指示器,0号通用存放器不能用了。
4. 假设某一计算任务用向量方式求解比用标量方式求解要快20倍,称可用向量方式求解部分所花费时间占总时间的百分比为可向量化百分比。
计算机体系结构第四章练习题参考解答
计算机体系结构第四章练习题参考解答第四章4.52 浮点数系统使⽤的阶码基值r e =2,阶值位数q=2,尾数基值r m =10,尾数位数p ′=1,即按照使⽤的⼆进制位数来说,等价于p=4。
计算在⾮负阶、正尾数、规格化情况下的最⼩尾数值、最⼤尾数值、最⼤阶值、可表⽰的最⼩值和最⼤值及可表⽰数的个数。
解: 最⼩尾数值:r m -1 = 10-1 = 0.1最⼤尾数值:1- r m -p ′ =1-10-1 = 0.9 最⼤阶值:2q -1=3可表⽰数的最⼩值:1×r m -1 = 10-1 = 0.1 可表⽰数的最⼤值:r m 2q-1×(1- r m -p ′)=103(1-10-1)= 900可表⽰数的个数:2q ×r m p ′(r m -1)/r m = 22×101(10-1)/10 = 364.53 ⼀台机器要求浮点数的字长的精度不低于10-7.2,表数的范围正数不⼩于1038,且正负对称。
尾数⽤原码、纯⼩数表⽰,阶码⽤移码、整数表⽰。
设计这种浮点数的格式。
解依题意,取表数范围N =1038,表数精度δ=10-7.2。
由式(4-4)得:37log(log10log 21)log 2q +> = 6.99,上取整,得到阶码字长q=7。
由式(4-5)得:16log1053.2log 2p -->=,上取整,得到尾数字长p=24。
从⽽加上⼀个尾数符号位和⼀个阶码符号位,浮点数的总字长为:p+q+2=24+7+2=33。
实际浮点数总字长应为8的倍数,故取浮点数总字长为40位。
多出的7位可以加到尾数字长p 中⽤于提⾼浮点数的表数精度,也可以加到阶码字长q 中来扩⼤浮点数的表数范围。
暂且让p 增加6位,q 增加1位,即p=30,q=8。
如图4-8所⽰是设计出来的浮点数格式。
图4-8 例4.2浮点数的设计格式4.58 ⽤于⽂字处理的某专⽤机,每个⽂字符⽤4位⼗进制数字(0~9)编码表⽰,空格⽤︼表⽰。
北理工《计算机网络》期末考试必备通关指导5
[试题分类]: 66计算机网络1. 什么是网络体系结构?答案: 计算机网络采用层次型体系结构。
将如何分层以及每层协议的集合称为网络体系结构。
题型:问答题知识点: 计算机网络的体系结构难度:22. 什么是网络拓扑结构?答案: 指网络中各组件(计算机等)连接的形式和形状。
题型:问答题知识点: 计算机网络的分类难度:23. 什么是网络协议?答案: 网络中相互通信的计算机所遵守的共同的约定。
题型:问答题知识点: 什么是计算机网络难度:14. 什么是局域网?答案: 覆盖较小的有限地理范围的网络。
其传输率很高,误码率很低,通常属于一个单位私有。
题型:问答题知识点: 局域网概述难度:15. 什么是数据通信?答案: 数字计算机或其他数字终端装置之间的通信。
题型:问答题知识点: 数据通信的基础知识难度:16. 什么是频分多路复用?答案: 将物理信道的有效带宽划分成若干频段,每个频段作为一个独立的信道分别分配给用户,从而实现在一条物理信道上同时传输多个用户的数据的技术。
题型:问答题知识点: 传输技术难度:27. 什么是路由选择?答案: 根据一定的算法和策略,选择一条从源到目的的最佳路由。
题型:问答题知识点: 路由选择难度:28. WAN的中文含义是什么?答案: 广域网。
题型:问答题知识点: 计算机网络的分类难度:19. ISO/OSI的中文含义是什么?答案: 国际标准化组织/开放系统互连。
题型:问答题知识点: 计算机网络的体系结构难度:110. WWW的中文含义是什么?答案: 万维网。
题型:问答题知识点: Internet的发展及其应用难度:111. TCP/IP的中文含义是什么?答案: 传输控制协议/网际协议。
题型:问答题知识点: 计算机网络的体系结构难度:1CD的中文含义是什么?答案: 载波侦听多路访问/冲突检测。
题型:问答题知识点: CSMA/CD和标准难度:113. ATM的中文含义是什么?答案: 异步传输模式。
2022年北京理工大学计算机科学与技术专业《计算机系统结构》科目期末试卷B(有答案)
2022年北京理工大学计算机科学与技术专业《计算机系统结构》科目期末试卷B(有答案)一、选择题1、组相联映象、LRU替换的Cache存贮器,不影响Cache命中率的是( )A.增加Cache中的块数B.增大组的大小C.增大主存容量D.增大块的大小2、系列机软件应做到( )。
A.向前兼容,并向上兼容B.向后兼容,力争向上兼容C.向前兼容,并向下兼容D.向后兼容,力争向下兼容3、以下说法中,不正确的是,软硬件功能是等效的,提高硬件功能的比例会:( )A.提高解题速度B.提高硬件利用率C.提高硬件成本D.减少所需要的存贮器用量4、"一次重叠"中消除"指令相关"最好的方法是( )。
A.不准修改指令B.设相关专用通路C.推后分析下条指令D.推后执行下条指令5、流水机器对全局性相关的处理不包括( )A.猜测法B.提前形成条件码C.加快短循环程序的执行D.设置相关专用通路6、与流水线最大吞吐率高低有关的是( )A.各个子过程的时间B.最快子过程的时间C.最慢子过程的时间D.最后子过程的时间7、Cache存贮器常用的地址映象方式是( )。
A.全相联映象B.页表法映象C.组相联映象D.段页表映象8、IBM360/91属于()A.向量流水机B.标量流水机C.阵列流水机D.并行流水机9、CRAY-I的流水线是( )A.多条单功能流水线B.一条单功能流水线C.多条多功能流水线D.一条多功能流水线10、计算机系统的层次结构按照由高到低的顺序分别为()。
A.高级语言机器级,汇编语言机器级,传统机器语言机器级,微程序机器级B.高级语言机器级,应用语言机器级,汇编语言机器级,微程序机器级C.应用语言机器级,传统机器语言机器级,汇编语言机器级,操作系统机器级D.应用语言机器级,操作系统机器级,微程序机器级,传统机器语言机器级11、对汇编语言程序员透明的是()A.I/O方式中的DMA访问B.浮点数据表示C.访问方式保护D.程序性中断12、下列说法正确的是( )A.Cache容量一般不大,命中率不会很高B.Cache芯片速度一般比CPU的速度慢数十倍C.Cache本身速度很快。
2022年北京理工大学计算机应用技术专业《计算机系统结构》科目期末试卷A(有答案)
2022年北京理工大学计算机应用技术专业《计算机系统结构》科目期末试卷A(有答案)一、选择题1、设16个处理器编号分别为0,1,2,...,15用Cube,互联函数时,第10号处理机与第()号处理机相联。
A.11B.8C.14D.22、在计算机系统设计中,比较好的方法是()。
A.从上向下设计B.从下向上设计C.从两头向中间设计D.从中间开始向上、向下设计3、下列关于标量流水机的说法不正确的是()A.可对标量数据进行流水处理B.没有向量数据表示C.不能对向量数据进行运算D.可以对向量、数组进行运算4、浮点数尾数基值rm=8,尾数数值部分长6位,可表示的规格化最小正尾数为( )A.0.5B.0.25C.0.125D.1/645、虚拟存储器常用的地址映象方式是( )A.全相联B.段相联C.组相联D.直接6、计算机组成设计不考虑()A.专用部件设置B.功能部件的集成度C.控制机构的组成D.缓冲技术7、非线性流水线是指( )A.一次运算中使用流水线中的多个功能段B.一次运算中要多次使用流水线中的某些功能段C.流水线中某些功能段在各次运算中的作用不同D.流水线的各个功能段在各种运算中有不同的组合8、在流水机器中,全局性相关是指( )。
A.先写后读相关B.先读后写相关C.指令相关D.由转移指令引起的相关9、直接执行微指令的是( )A.汇编程序B.编译程序C.硬件D.微指令程序10、Cache存贮器常用的地址映象方式是( )。
A.全相联映象B.页表法映象C.组相联映象D.段页表映象二、判断题11、按弗林(Michael J.Flynn)的观点,计算机系统可分为单指令流单数据流、单指令流多数据流、多指令流单数据流和多指令流多数据流四大类。
()12、分布系统以分布为特征,用真实处理机替代虚拟处理机,其并行性是属于并发性。
()13、指令的重叠解释,既可加快程序的解释,又能加快指令的解释。
()14、在存贮体系中,地址的映象与地址的变换没有区别。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
111000 111001 111010 111011 111100 111101 111110
0.04 0.03 0.03 0.02 0.02 0.01 0.01
35
第2章
指令系统
平均码长为 ∑Pi*Li = (0.15+0.15+0.14+0.13 + 0.12+0.11+0.04)×3 + (0.04+0.03+0.03+0.02 + 0.02+0.01+0.01)×6 =3.48
引入时间概念,让多个处理过程轮流使
用同一套硬件设备的各部分,基本上不 需要重复设置硬件设备
10
第1章
1-1
基础知识
第4级 N3/M3 *K秒 第3级 N2/M2 *K秒 (同理) N/M*K秒 (X/M * 第2级 N*1/X*K=N/M*K秒) K秒(设为X条,每条需要 第1级 1/X*K秒)
15
第1章
基础知识
(5)不可以。指令的操作码、字段 格式、寻址方式等都是计算机系统 结构的内容。如果将它们改变,就 会直接影响以前编写的程序不能正 确运行。 (6)可以。数据通路宽度是计算机 组成的内容。
16
第1章
基础知识
(7)可以。单总线改为多总线是计算机 组成的内容。 (8)不可以。通用寄存器的使用是属于 计算机系统结构的内容。0号通用寄存 器改为堆栈指示器,将使原先程序中0 号寄存器中的内容改变直接影响到堆 栈指针的位置发生变化,造成程序无 法正常工作。
11
第1章
1-6 透明的是: 指令缓冲器 时标发生器 乘法器 主存地址寄存器 先行进位链 移位器
基础知识
12
第1章
1-8
基础知识
(1)可以。因为它虽然是属于计算 机系统结构的内容。新增加的数据 类型和指令,不会影响到已有指令 所写的程序正确运行,只是现在用 新增加的指令来写程序,会使计算 机的性能和效率变得更好。
基础知识
本来存在的事物或属性,从某个角
度看却好象不存在
软件兼容
程序可以不加修改地运行在各档机
器上,区别仅在于运行时间不同 它分为向上兼容和向下兼容,以及 向前兼容和向后兼容
5
第1章
模拟
基础知识
用一种机器 (A) 的机器语言解释
实现另一种机器 (B) 的指令系统, 使 A 具有 B 的指令系统,从而实 现软件移植的方法。被模拟的机 器称为虚拟机,模拟用的机器称 为宿主机,解释程序称为模拟程 序
36
3-5位操作码编码如下:
编码 指令 使用 频度 编码 指令使用频度
000 001 010 011 100 101
0.15 0.15 0.14 0.13 0.12 0.11
11000 11001 11010 11011 11100 11101 11110 11111
0.04 0.04 0.03 0.03 0.02 0.02 0.01 0.01
0
0.05
0.09 1 1 0.13 1 0.23 0 0
0.17
1 0 0.32 1 1 0.43 1 0 0 0.57 0
0
1.00
42
(2) 采用最小概率合并法 H’=∑Pi×Li =0.25×2+0.20×2+0.15×3+0.10×3+ 0.08×4+0.08×4+0.05×5+0.04×5+ 0.03×5+0.02×5 =2.99 信息冗余=1-2.96/2.99=1%
39
(1)计算这10条的操作码最短平均长度。 (2)采用Huffman编码法编写这10条指令的 操作码,并计算操作码的平均长度和信息冗 余量。 (3)采用2/8扩展编码法编写这10条指令的 操作码,并计算操作码的平均长度和信息冗 余量。 (4)采用3/7扩展编码法编写这10条指令的 操作码,并计算操作码的平均长度和信息冗 余量。
17
1-9 如果某一计算任务用向量方式求解比
用标量方式求解要快 20 倍,称可用向量
方式求解部分所花费时间占总的百分比
为可向量化百分比。请写出加速比与可
向量化比例两者的关系曲线。
解:
1 20 S (1 F ) F / 20 20 19 F
18
在习题1-9中,为达到加速比2,可向
31
第2章
0.43
指令系统
1.00 0.57
0.19
0.08 0.04
0.11 3
0.24
0.12 0.05
0.02 5 0.03 5
0.27
0.13 3 0.07 0.04 5 0.14 3
0.3
0.15 3 0.15 3
0.12 3
0.04 4 0.02 5 0.01 6
0.02
0.01 6
0.03 5
3
第1章
基础知识
计算机系统结构
程序员所看到的计算机的属性,即
程序员为编写出能在机器上正确运 行的程序所必须了解到的机器的概 念性结构和功能特性。从层次结构 出发,计算机系统结构指层次结构 中传统机器级的系统结构,研究的 是软、硬件之间的功能分配,以及 对传统机器级界面的定义
4
第1章
透明性
29
第2章
指令系统
数据结构是通过软件映像成机器所具 有的各种数据表示实现的 数据表示是数据结构的组成元素 数据表示为数据结构提供不同程度的 支持,反映在效率和方便程度的不同 因此,数据结构与数据表示是软、硬 交界面
30
第2章
指令系统
习题2-4 1、等长二进制编码 平均码长为 [log214] + 1 = 4 2、Huffman编码 首先构造Huffman树
13
第1章
基础知识
(2)不可以。中断的分级和中断的 响应次序等中断机构都属于计算机 系统结构的内容。中断分级由原来 的4级增加到5级应当还是允许的, 关键是重新调整了中断响应的优先 次序,这就使原有程序的中断响应 次序发生了改变,会影响原有程序 工作的正确性。
14
第1章
基础知识
(3)可以。Cache存储器属于计算机组 成,它不会改变原有的系统程序和应 用程序,不会影响到它们的正确性。 只是有了它之后,系统的性能会显著 的提高。 (4)可以。浮点数尾数的下溢处理不属 于计算机系统结构,而是计算机组成 设计所需要考虑的内容。
动态再定位
动态再定位采用基址寻址方法。当把程
序装入主存时,对程序不做任何修改 (变换),直接装入主存,同时将程序 在主存中的起始地址a存入对应该道程序 的基址寄存器。在执行指令时,通过地 址加法器将逻辑地址加上基址寄存器的 内容(程序基点地址),形成物理地址, 然后访存
25
第2章
指令系统
功能型指令
6
第1章
仿真
基础知识
用一种机器 (A) 的微程序直接解
释实现另一种机器 (B) 的指令系 统,从而实现软件移植的方法 被仿真的机器称为目标机,进行 仿真的机器称为宿主机,解释微 程序机器称为仿真微程序
7
第1章
并行性
基础知识
指可以同时进行运算或操作的特
性,它有两重含义:
同时性:同一时刻发生 并发性:同一时间间隔内发生
37
第2章
指令系统
平均码长为 ∑Pi*Li = (0.15+0.15+0.14+0.13 + 0.12+0.11)×3 + (0.04+0.04 +0.03+0.03+0.02 + 0.02+0.01+0.01)×5 =3.40
38
2-5 一个处理机共有10条指令,各指令在程序中出 现的概率如下: 指令 概率 Huffman 2/8扩展 3/7扩展 I1 0.25 I2 0.20 I3 0.15 I4 0.10 I5 0.08 I6 0.08 I7 0.05 I8 0.04 I9 0.03 I10 0.02
20
[解答] CPI=
n
i) ( CPI * i IC i 1 =(45000*1+32000*2+15000*2+8000*2)/
I
(45000+32000+15000+8000) = 1.55周期/指令
6 6 6
速率MIPS f /(CPI *10 ) 40 *10 /(1.55*10 ) 25.81
32
第2章
指令系统
平均码长为 ∑Pi*Li = (0.01+0.01)×6 + (0.02+0.02+0.03+0.03+0.04)×5 + 0.04×4 + (0.11 + 0.12 + 0.13 + 0.14 + 0.15+0.15)×3 =3.38
33
第2章
指令系统
3 、只有两种码长的扩展操作码编
40
第2章
(1)最优Huffman H=- ∑Pi×log2Pi
=0.25×2+0.20×2.322+0.15×2.737+ …… =2.96
41
I10 0.02 1
I9 0.03
I8.08
I4 0.10
I3 0.15
I2 0.20
I1 0.25
27
第2章
RISC
指令系统
减少指令总数,简化指令功能,以
降低硬件设计的复杂度,提高指令 的执行速度。按这种途径和方向发 展,会使机器的指令系统精炼简单, 因此称采用这种途径设计而成的 CPU的计算机为精简指令集计算机 RISC