计算机系统结构 第五章(习题)
第五章计算机操作系统概论复习资料习题答案
第五章计算机操作系统概论复习资料习题答案第五章复习题一、单项选择题1.文件按用途分类,不包括(D)。
A.系统文件B.库文件C.用户文件D.档案文件2.一种既方便顺序存取又适合随机存取的文件存储结构是(C)。
A.顺序文件B.链接文件C.索引文件D.串联文件3.若把文件以顺序结构的方式存放到磁盘上,则存在的缺点是(B)。
A.目录结构复杂B.磁盘空间利用率低C.计算地址困难D.读写速度低4磁带上的每个文件组成部分不包括(C)。
A.文件头标B.文件信息C.文件正文D.文件尾标5.文件的信息按逻辑上独立的含义划分信息单位后就构成了记录式文件,这种划分信息的工作是(A)时完成的。
A.用户组织文件B.系统转储文件C.系统装入文件D.外设存取文件6.UNI某系统调用unlink的作用是(B)。
A.为一个文件再取一个新文件名B.删除文件的一个文件名C.请求读一个已经打开的文件D.建立两个文件的链接7.下面对目录结构描述错误的是(A)。
A.一级目录结构解决了文件的重名问题B.树形目录结构解决了文件的重名问题C.树形目录结构能进行存取权限的控制C.树形目录结构有利于文件分类8.读一个文件信息时,应依次调用(A)。
A.打开文件、读文件、关闭文件B.建立文件、读文件、关闭文件C.建立文件、读文件、写文件D.读文件、保存文件、关闭文件9.若允许用户按各自定义的文件名访问某个共享文件夹,则该系统应(C)。
A.为每个用户复制一份文件B.设置命名转换机制C.采用多级目录结构D.使该文件有多种物理结构形式10.文件的存储结构采用哪种形式是与(C)有关。
A.文件的逻辑结构B.存储空间的管理方式C.存储介质的类型D.文件的长度11.下列选项中属于存储介质的是(C)。
A.磁带机B.磁盘驱动器C.软磁盘片D.卡片机12.实现记录的成组与分解能提高磁盘空间的利用率,但必须设置主存缓冲区,该缓冲区的长度应根据(A)来确定。
A.磁盘块的大小B.成组的记录数C.逻辑记录的长度D.文件的长度13.对记录式文件,操作系统为用户存取文件信息的最小单位是(C)。
计算机系统结构(第2版(课后习题答案
word 文档下载后可自由复制编辑你计算机系统结构清华第 2 版习题解答word 文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9 (透明性概念),1.12-1.18 (Amdahl定律),1.19、1.21 、1.24 (CPI/MIPS)1.2 第二章(P124)2.3 、2.5 、2.6 (浮点数性能),2.13 、2.15 (指令编码)1.3 第三章(P202)3.3 (存储层次性能), 3.5 (并行主存系统),3.15-3.15 加 1 题(堆栈模拟),3.19 中(3)(4)(6)(8)问(地址映象/ 替换算法-- 实存状况图)word 文档下载后可自由复制编辑1.4 第四章(P250)4.5 (中断屏蔽字表/中断过程示意图),4.8 (通道流量计算/通道时间图)1.5 第五章(P343)5.9 (流水线性能/ 时空图),5.15 (2种调度算法)1.6 第六章(P391)6.6 (向量流水时间计算),6.10 (Amdahl定律/MFLOPS)1.7 第七章(P446)7.3 、7.29(互连函数计算),7.6-7.14 (互连网性质),7.4 、7.5 、7.26(多级网寻径算法),word 文档下载后可自由复制编辑7.27 (寻径/ 选播算法)1.8 第八章(P498)8.12 ( SISD/SIMD 算法)1.9 第九章(P562)9.18 ( SISD/多功能部件/SIMD/MIMD 算法)(注:每章可选1-2 个主要知识点,每个知识点可只选 1 题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例 , 习题2.1 第一章 (P33)例 1.1,p10假设将某系统的某一部件的处理速度加快到 10倍 ,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知: Fe=0.4, Se=10,根据 Amdahl 定律S n To T n1 (1Fe )S n 1 10.6 0.4100.64 Fe Se 1.56word 文档 下载后可自由复制编辑例 1.2,p10采用哪种实现技术来求浮点数平方根 FPSQR 的操作对系统的性能影响较大。
吉林大学计算机系统结构题目整合第五章
第五章存储层次知识点汇总存储器层次结构、存储层次性能参数(平均每位价格、命中率、平均访存时间)、存储层次4个问题、CPU 访存地址分割、全相联映像、直接映像、组相联映像、查找方法、替换算法(随机、先进先出、最近最少使用法)、写直达法、写回法、按写分配、不按写分配、Cache性能分析、3C失效(强制失效、容量失效、冲突失效)、Victim Cache、伪相联映像Cache、硬件预取、编译器优化(数组合并、内外循环交换、循环融合、分块)、写缓冲合并、单字宽存储器、多字宽存储器、多体交叉存储器、存储体、虚拟存储器(页式、段式)、快表(TLB)简答题1.单级存储器的主要矛盾是什么?通常采取什么方法来解决?(知识点:多级存储器)答:主要矛盾:(1) 速度越快,每位价格就越高。
(2) 容量越大,每位价格就越低。
(3) 容量越大,速度越慢。
采取多级存储层次方法来解决。
2.“Cache-主存”和“主存-辅存”层次的主要区别是什么?(知识点:存储层次)3.在存储层次中应解决哪四个问题?(知识点:存储层次的四个问题)答:(1)映像规则:当把一个块调入高一层存储器时,可以放到哪些位置上。
(2)查找算法:当所要访问的块在高一层存储器中时,如何找到该块。
(3)替换算法:当发生失效时,应替换哪一块。
(4)写策略:当进行写访问时,应进行哪些操作。
4.地址映像方法有哪几种?它们各有什么优缺点?(知识点:地址映像)(1)全相联映像。
实现查找的机制复杂,代价高,速度慢。
Cache空间的利用率较高,块冲突概率较低,因而Cache的失效率也低。
(2)直接映像。
实现查找的机制简单,速度快。
Cache空间的利用率较低,块冲突概率较高,因而Cache 的失效率也高。
(3)组相联映像。
组相联是直接映像和全相联的一种折中。
5.Cache的3C失效是哪三种失效?针对每种失效给出一种降低失效率的方法。
(知识点:3C失效)答:强制性失效、容量失效、冲突失效。
计算机系统结构(高教版)张晨曦 习题答案 第五章
5.1 解释下列术语多级存储层次:由若干个采用不同实现技术的存储器构成的存储器系统,各存储器处在离CPU不同距离的层次上。
使得靠近CPU的存储器速度较快,容量较小。
整个存储系统的速度接近与离CPU最近的存储器的速度,而容量和每位价格接近于最低层次的容量和价格。
全相联映像:指主存中的任一块可以被放置到Cache中的任意一个位置。
直接映像:指主存中的每一块只能被放置到Cache中唯一的一个位置。
组相联映像:指主存中的每一块可以被放置到Cache中固定的一个组中的任意位置。
替换算法:由于主存中的块比Cache中的块多,所以当要从主存中调入一个块到Cache中时,会出现该块所映像的Cache块位置已经被占用的情况。
替换算法即解决如何选择替换块的问题。
LRU:最近最少使用法。
选择近期最少被访问的块作为被替换的块。
写直达法:在执行“写”操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。
写回法:只把信息写入Cache中相应的块,该块只有在被替换时才被写回主存。
按写分配法:在写失效时,先把所写单元所在的块从主存调入Cache,然后再进行写入。
不按写分配法:写失效时,直接写入下一级存储器而不将相应的块调入Cache。
命中时间:CPU所要访问的块在Cache中,确认并取走所花费的时间开销。
失效率:CPU一次访存不命中的概率。
失效开销:CPU一次访存不命中,而额外增加的访存开销。
强制性失效:当第一次访问一个块时,该块不在Cache中,需从下一级存储器中调入Cache。
容量失效:如果程序执行执行时所需的块不能全部调入Cache中,则当某些快被替换后,若又重新被访问,就会发生失效。
冲突失效:在组相联或直接映像Cache中,若不多的块映像到同一组中,则会出现该组中某个块被别的块替换,然后又重新被访问的情况。
2:1 Cache经验规则:大小为N的直接映像Cache的失效率约等于大小为N/2的2路组相联Cache的失效率。
1-3-4-5计算机组成原理课后习题答案
第一章计算机系统概论习题答案1、答:计算机系统由硬件和软件两大部分组成。
硬件即指计算机的实体部分,它由看得见摸的着的各种电子元器件,各类光电、机设备的实物组成,如主机、外设等。
软件时看不见摸不着的,由人们事先编制成具有各类特殊功能的信息组成,用来充分发挥硬件功能,提高机器工作效率,便于人们使用机器,指挥整个计算机硬件系统工作的程序集合。
软件和硬件都很重要。
2、答:从计算机系统的层次结构来看,它通常可有五个以上的不同级组成,每一个上都能进行程序设计。
由下至上可排序为:第一级微程序机器级,微指令由硬件直接执行;第二级传统机器级,用微程序解释机器指令;第三级操作系统级,一般用机器语言程序解释作业控制语句;第四级汇编语言机器级,这一级由汇编程序支持和执行;第五级高级语言机器级,采用高级语言,由各种高级语言编译程序支持和执行,还可以有第六级应用语言机器级,采用各种面向问题的应用语言。
3、答:机器语言由0、1代码组成,是机器能识别的一种语言。
汇编语言是面向机器的语言,它由一些特殊的符号表示指令,高级语言是面向用户的语言,它是一种接近于数学的语言,直观,通用,与具体机器无关。
4、答:计算机组成是指如何实现计算机体系结构所体现的属性,它包含了许多对程序员来说是透明的硬件细节。
计算机体系结构是指那些能够被程序员所见到的计算机系统的属性,即概念性的结构与功能特性,通常是指用机器语言编程的程序员所看到的传统机器的属性,包括指令集、数据类型、存储器寻址技术、I/O机理等等,大都属于抽象的属性。
5、答:特点是:(1) 计算机由运算器、存储器、控制器和输入设备、输出设备五大部件组成(2) 指令和数据以同等的地位存放于存储器内,并可以按地址寻访(3) 指令和数据均可以用二进制代码表示(4) 指令由操作码和地址码组成,操作码用来表示操作的性质,地址码用来表示操作数所在存储器中的位置(5) 指令在存储器内按顺序存放。
通常,指令是顺序执行的,在特定情况下,可根据运算结果或根据设定的条件改变执行顺序(6) 机器以运算器为中心,输入输出设备与存储器的数据传送通过运算器。
第五章课后习题答案
5.10 假设对指令Cache 的访问占全部访问的75%;而对数据Cache 的访问占全部访问的25%。
Cache 的命中时间为1个时钟周期,失效开销为50 个时钟周期,在混合Cache 中一次load 或store 操作访问Cache 的命中时间都要增加一个时钟周期,32KB 的指令Cache 的失效率为0.39%,32KB 的数据Cache 的失效率为4.82%,64KB 的混合Cache 的失效率为1.35%。
又假设采用写直达策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。
试问指令Cache 和数据Cache 容量均为32KB 的分离Cache 和容量为64KB 的混合Cache 相比,哪种Cache 的失效率更低?两种情况下平均访存时间各是多少?解:(1)根据题意,约75%的访存为取指令。
因此,分离Cache 的总体失效率为:(75%×0.15%)+(25%×3.77%)=1.055%;容量为128KB 的混合Cache 的失效率略低一些,只有0.95%。
(2)平均访存时间公式可以分为指令访问和数据访问两部分:平均访存时间=指令所占的百分比×(读命中时间+读失效率×失效开销)+ 数据所占的百分比×(数据命中时间+数据失效率×失效开销)所以,两种结构的平均访存时间分别为:分离Cache 的平均访存时间=75%×(1+0.15%×50)+25%×(1+3.77%×50)=(75%×1.075)+(25%×2.885)=1.5275混合Cache 的平均访存时间=75%×(1+0.95%×50)+25%×(1+1+0.95%×50)=(75%×1.475)+(25%×2.475)=1.725因此,尽管分离Cache 的实际失效率比混合Cache 的高,但其平均访存时间反而较低。
计算机组成原理第5章部分习题参考答案
第五章部分习题参考答案【5-10】一个1K * 8的存储芯片需要多少根地址线,数据输入输出线?解:n = log1024 = 10 根。
由于一次可读写8位数据,所以需要8根数据输入输出线。
2【5-11】某计算机字长32位,存储容量64KB,按字编址的寻址范围是多少?若主存以字节编址,试画出主存字地址和字节地址的分配情况?解:因为字长32位,所以64KB = 16KW,要表示16K个存储单元,需要14根地址线。
所以按字编址的寻址范围是0000H ~ 3FFFH 。
若按字节编址,假设采用PC机常用的小端方案,则主存示意图如下:【5-13】现有1024×1的存储芯片,若用它组成容量为16K×8的存储器。
试求:(1)实现该存储器所需芯片数量(2)若将这些芯片分装在若干块板上,每块板的容量是4K×8,该存储器所需的地址线的总位数是多少?其中几位用于选板?几位用于选片?几位用作片内地址?解:(1)需要16组来构成16K,共需芯片16×8 = 128片(2)需要的地址线总位数是14位。
因为共需4块板,所以2位用来选板,板内地址12位,片内地址10位。
1每块板的结构如下图24块板共同组成16K×8存储器的结构图【5-15】某半导体存储器容量16K×8,可选SRAM芯片的容量为4K ×4;地址总线A15~A0(A0为最低位),双向数据总线D7~D0,由R/W线控制读写。
设计并画出该存储器的逻辑图,并注明地址分配、片选逻辑和片选信号的极性。
解:注:采用全译码方式方案片内地片A0A1A3A2A8A9A7A6A5A4A12A15A14A13A11A1000000000000000004K111111100001111100001000000000004K10001111111111114K00000000100000001 1 1 1 1 1 1 1 1 1 1 1 0 0 1 00 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 4K11111111111111时分别选定,11,为A1200,0110,,恒为,由以上真值表可知,采用全译码方式,A15A140A13 RAM芯片。
第5章现代计算机复杂环境下程序执行练习题答案解析
精品文档第 5 章现代计算机:复杂环境下程序执行1、关于现代计算机系统,下列说法正确的是 _____。
(A)计算机就是一个主机箱、一个显示器、一个键盘和一个鼠标;(B)计算机不仅仅是主机箱、显示器、键盘和鼠标,还包括扫描仪、打印机、各种数码设备;(C)计算机不仅仅是如(B)一样的硬件设备,其最重要的部分是软件,安装在该计算机的各种各样的软件才能体现出该计算机功能的强弱;(D)人们认为,计算机不仅仅包括硬件和软件,还包括网络和数据,很多的软件都可通过网络来使用,人们的注意力已经从关注软硬件转移为关注各种各样的数据;(E)上述都不正确。
答案: D解释:本题考核现代计算机系统相关知识;计算机不仅仅包括硬件 (主机箱、显示器、键盘和鼠标,还包括扫描仪、打印机、各种数码设备) 和软件,还包括网络和数据,很多的软件都可通过网络来使用,人们的注意力已经从关注软硬件转移为关注各种各样的数据。
所以 D 正确。
具体内容请参考第五章视频之“现代计算机系统的构成”以及第五章课件。
2、关于普通计算机的主机箱中有什么,下列说法正确的是 _____。
(A)主机箱中有电源,还有一块电路板 -- 即主板。
主板上有一个微处理器(CPU);(B)主机箱中有电源和主板。
主板上有微处理器和内存 (条);(C)主机箱中有电源和主板。
主板上有微处理器和内存(条);还有各种磁盘驱动器被连接到主板上进而接受 CPU 的控制;(D)主机箱中有电源,主板。
主板上有微处理器和内存 (条);还有各种磁盘驱动器被连接到主板上进而接受 CPU 的控制;主板上还有若干个插槽,这些插槽可用于各种外部设备的接口电路板与主板的连接;主板上也有若干已做好的接口,直接用于连接各种外部设备。
答案: D解释:本题考核计算机的主机箱相关内容;主机箱中有电源,主板。
主板上有微处理器和内存 (条);还有各种磁盘驱动器被连接到主板精品文档.精品文档上进而接受 CPU 的控制;主板上还有若干个插槽,这些插槽可用于各种外部设备的接口电路板与主板的连接;主板上也有若干已做好的接口,直接用于连接各种外部设备。
计算机系统结构习题答案(李学干)
计算机系统结构习题解答第一章习题一1.2一台经解释实现的计算机,可以按照功能划分成4级。
每一级为了执行一条指令需要下一级的N条指令解释。
若执行第1级的一条指令需K纳秒时间,那么执行第2、3、4级的一条指令个需要多少时间?解:①分析:计算机按功能分级时,最底层的为第1级。
向上一次是第2 、3、4级。
解释执行是在低级机器级上,用它的一串指令或语句来解释执行高一级上的一条指令的功能。
是逐条解释的。
②解答:执行第2、3、4级的一条指令各需KNns,KN2ns,KN3ns的时间。
1.3操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接实现,而不由操作系统自己来实现。
根据你对习题1.2的回答,你认为这样做有哪两个好处?答:可以加快操作系统操作命令解释的速度。
同时也节省了存放解释操作命令这部分解释程序所占用的空间。
简化了操作系统机器级的设计。
也有利于减少传统机器级的指令条数。
1.5硬件和软件在什么意义上是等效的?在什么意义上是不等效的?试举例说明。
答:硬件和软件在逻辑意义上是等效的。
在物理意义上是不等效的。
①在原理上,用硬件或固件实现的功能完全可以用软件来完成。
用软件实现的功能也可以用硬件或固件来完成。
功能一样。
②只是反映在速度、价格、实现的难易程度上,这两者是不同的。
性能不同。
③例如,浮点运算在80386以前一直是用软件实现的。
到了80486,将浮点运算器集成到了CPU中,可以直接通过浮点运算指令用硬件实现。
但速度却高的多。
1.9下列哪些对系统程序员是透明的?哪些对应用程序员是透明的?系列机各档不同的数据通路宽度;虚拟存储器;Cache存储器;程序状态字;“启动I/O”指令;“执行”指令;指令缓冲器。
答:①对系统程序员和应用程序员均透明的:是全用硬件实现的计算机组成所包含的方面。
有:数据通路宽度、Cache存储器、指令缓冲器。
②仅对应用程序员透明的:是一些软硬件结合实现的功能。
有:虚拟存储器、程序状态字、“启动I/O”指令。
计算机组成和系统结构习题解答
(4) [x]原 = 1.0110000 [x]补 = 1.1010000
[x]反 = 011010100 [x]移 = 111010100 [x]反 = 0.1010000 [x]移无定义 [x]反 = 101010011 [x]移 = 001010100 [x]反 = 1.1001111 [x]移 无定义
(4) C7F0000016 = 1 10001111 111000000000000000000002 = (-1)1×216×(1 + 1/2 + 1/4 + 1/8) = -122880 = -1.875×216 = -15×213
计算机组成和系统结构习题解答
第二章 第16题
2.16 设浮点数的格式为:符号位:b15;阶码: b14-b8,采用补码表示;尾 数: b7-b0,与符号位一起采用规格化的补码表示,基数为2。问: (1) 它能表示的数值范围是什么? (2) 它能表示的最接近于0的正数和负数分别是什么? (3) 它共能表示多少个数值? 请用十进制数2的幂次表示。
计算机组成和系统结构
习题解答
计算机组成和系统结构习题解答
第一章 第6题
6. 某计算机系统采用图形协处理器后使图形运算速度提 高到原来的20倍,而系统运行某一程序的速度提高到 原来的5倍,问该程序中图形运算所占的比例。
答: 根据Arhmdal定律,有
5 1 1r
r
20
所以r=16/19= 0.8421052631579
(4) [x+y]补=1.00001+0.11011=1.11100 [x-y]补=1.00001+1.00101=0.00110(溢出)
计算机系统结构课后习题答案(老师划过重点得)
…第1章计算机系统结构的基本概念解释下列术语层次结构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
【解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
《计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
/CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
第五章习题及答案
第五章设备管理1.试说明设备控制器的组成。
答:由设备控制器与处理机的接口,设备控制器与设备的接口与I/O逻辑组成。
2.为了实现CPU与设备控制器间的通信,设备控制器应具备哪些功能?答:接收和识别命令;数据交换;标识和报告设备状态;地址识别;数据缓冲;差错控制。
3.什么是字节多路通道?什么是数组选择通道和数组多路通道?答:(1)字节多路通道。
按字节交叉方式工作的通道。
通常含有许多非分配型子通道,数量从几十到数百个,每个子通道连接一台I/O 设备,控制其I/O 操作。
子通道按时间片轮转方式共享主通道。
(2)数组选择通道。
按数组方式传送数据,传输速率很高,每次只允许一个设备数据。
(3)数组多路通道。
将数组选择通道传输速率高和字节多路通道的各子通道分时并行操作的优点结合而成。
含有多个非分配型子通道,具有很高的数据传输率和通道利用率。
4.如何解决因通道不足而产生的瓶颈问题?答:解决问题的有效方法是增加设备到主机间的通路而不增加通道,把一个设备连到多个控制器上,控制器又连到多个通道上,这种多通路方式解决了“瓶颈”问题,提高了系统可靠性,个别通道或控制器的故障不会使设备和存储器之间没有通路。
5.试对VESA 及PCI两种总线进行比较。
答:VESA总线的设计思想是以低价占领市场。
总线带宽32位,最高传输速率132Mb/s。
广泛用于486微机。
缺点是能连接的设备数仅为2~4 台,控制器中无缓冲,难于适应处理器速度的提高,不支持Pentium机。
PCI总线在CPU和外设间插入了复杂的管理层,协调数据传输和提供一致接口。
管理层中配有数据缓冲,放大了线路的驱动能力,最多支持10种外设,支持高时钟频率的CPU运行,最大传输速率132Mb/s。
可连接ISA、EISA 等传统总线,又支持Pentium的64位系统,是基于奔腾等新一代微处理器而发展的总线。
6.试说明推动I/O控制发展的主要因素是什么?答:推动I/O 控制发展的主要动力在于尽量减少主机对I/O 控制的干预,把主机从繁杂的I/O控制事务中解脱出来,用更多的时间和精力去完成其数据处理任务。
计算机体系结构第五章课后习题答案
第五章存储层次5.1名词解释1.存储层次——采用不同的技术实现的存储器,处在离CPU不同距离的层次上,目标是达到离CPU最近的存储器的速度,最远的存储器的容量。
2.全相联映象——主存中的任一块可以被放置到Cache中任意一个地方。
3.直接映象——主存中的每一块只能被放置到Cache中唯一的一个地方。
4.组相联映象——主存中的每一块可以放置到Cache中唯一的一组中任何一个地方(Cache分成若干组,每组由若干块构成)。
5.替换算法——由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。
这时,需要被迫腾出其中的某一块,以接纳新调入的块。
6.L RU——选择最近最少被访问的块作为被替换的块。
实际实现都是选择最久没有被访问的块作为被替换的块。
7.写直达法——在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。
8.写回法——只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。
9.按写分配法——写失效时,先把所写单元所在的块调入Cache,然后再进行写入。
10.不按写分配法——写失效时,直接写入下一级存储器中,而不把相应的块调入Cache。
11.写合并——在往缓冲器写入地址和数据时,如果缓冲器中存在被修改过的块,就检查其地址,看看本次写入数据的地址是否和缓冲器内某个有效块的地址匹配。
如果匹配,就将新数据与该块合并。
12.命中时间——访问Cache命中时所用的时间。
13.失效率——CPU访存时,在一级存储器中找不到所需信息的概率。
14.失效开销——CPU向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。
15.强制性失效——当第一次访问一个块时,该块不在Cache中,需要从下一级存储器中调入Cache,这就是强制性失效。
16.容量失效——如果程序在执行时,所需要的块不能全部调入Cache中,则当某些块被替换后又重新被访问,就会产生失效,这种失效就称作容量失效。
计算机操作系统(第四版)课后习题答案第五章
人形容高尔夫的18洞就好像人生,障碍重重,坎坷不断。
然而一旦踏上了球场,你就必须集中注意力,独立面对比赛中可能出现的各种困难,并且承担一切后果。
也许,常常还会遇到这样的情况:你刚刚还在为抓到一个小鸟球而欢呼雀跃,下一刻大风就把小白球吹跑了;或者你才在上一个洞吞了柏忌,下一个洞你就为抓了老鹰而兴奋不已。
第五章7.试比较缺页中断机构与一般的中断,他们之间有何明显的区别?答:缺页中断作为中断,同样需要经历保护CPU现场、分析中断原因、转缺页中断处理程序进行处理、恢复CPU现场等步骤。
但缺页中断又是一种特殊的中断,它与一般中断的主要区别是:( 1)在指令执行期间产生和处理中断信号。
通常,CPU都是在一条指令执行完后去检查是否有中断请求到达。
若有便去响应中断;否则继续执行下一条指令。
而缺页中断是在指令执行期间,发现所要访问的指令或数据不在内存时产生和处理的。
(2)一条指令在执行期间可能产生多次缺页中断。
例如,对于一条读取数据的多字节指令,指令本身跨越两个页面,假定指令后一部分所在页面和数据所在页面均不在内存,则该指令的执行至少产生两次缺页中断。
8.试说明请求分页系统中的页面调入过程。
答:请求分页系统中的缺页从何处调入内存分三种情况:(1)系统拥有足够对换区空间时,可以全部从对换区调入所需页面,提高调页速度。
在进程运行前将与该进程有关的文件从文件区拷贝到对换区。
(2)系统缺少足够对换区空间时,不被修改的文件直接从文件区调入;当换出这些页面时,未被修改的不必换出,再调入时,仍从文件区直接调入。
对于可能修改的,在换出时便调到对换区,以后需要时再从对换区调入。
(3)UNIX 方式。
未运行页面从文件区调入。
曾经运行过但被换出页面,下次从对换区调入。
UNIX 系统允许页面共享,某进程请求的页面有可能已调入内存,直接使用不再调入。
19.何谓工作集?它是基于什么原理确定的?答:工作集:在某段时间间隔里,进程实际所要访问页面的集合。
计算机体系结构----第五章
采用先行控制方式时一个程序的执行情况:
指令地址 „„ k-i-1 k-i „„ k-1 k k+1 „„ k+j k+j+1 „„ k+j+n k+j+n+1 k+j+n+2 „„ k+j+n+m k+j+n+m+1 „„ 指令执行情况 已经执行完成的指令 在后行写数栈中等待把结果写到主存储器中的指令 正在指令执行部件中执行的指令 已经由指令分析器预处理完成,存放在先行操作栈中的 RR*型指令,指令所需要的操作数已经读到先行读数栈中 已经由指令分析器预处理完成, 存放在先行操作栈中, 指 令所需要的操作数还没有读到先行读数栈中 正在指令分析器中进行分析和预处理的指令 已经从主存储器中预取到先行指令缓冲栈中的指令 还没有进入处理机的指令
(2)先行操作栈 指令分析器对已经存放在先行指令缓冲栈里的指令进 行预处理,把处理之后的指令送入先行操作栈。 处于指令分析器和运算控制器之间,使指令分析器和 运算器能够各自独立工作。
对于无条件转移及条件转移指令等程序控制指令,一般在 指令分析器中就能直接执行 各种运算型指令、移位指令、数据传送指令等都要先处理 成RR型指令,送入先行操作栈 经过指令分析器预处理之后送到先行操作栈中等待运算器 执行的指令就都变成了统一格式的RR型指令 执行这种指令所需的操作数都存放在通用寄存器或先行读 数栈中
2.解决访存冲突的方法: (1)两个独立的存储器:指令存储器和数据存储器。 如果再规定,执行指令阶段产生的运算结果只写到 通用寄存器,则取指令、分析指令和执行指令就可 以同时进行。 许多高性能计算机具有独立的指令Cache和数据 Cache结构,称为哈佛结构。 (2)采用低位交叉存取方式: 这种方法不能根本解决冲突问题。
计算机组织与系统结构第五章习题答案
第 5 章习题答案3.假定某计算机中有一条转移指令,采用相对寻址方式,共占两个字节,第一字节是操作码,第二字节是相对位移量(用补码表示),CPU每次从内存只能取一个字节。
假设执行到某转移指令时PC的内容为200,执行该转移指令后要求转移到100开始的一段程序执行,则该转移指令第二字节的内容应该是多少?参考答案:因为执行到该转移指令时PC为200,所以说明该转移指令存放在200单元开始的两个字节中。
因为CPU每次从内存只能取一个字节,所以每次取一个字节后PC应该加1。
该转移指令的执行过程为:取200单元中的指令操作码并译码→PC+1→取201单元的相对位移量→PC+1→计算转移目标地址。
假设该转移指令第二字节为Offset,则100=200+2+Offset,即Offset = 100–202 = –102 = 10011010B(注:没有说定长指令字,所以不一定是每条指令占2个字节。
)4.假设地址为1200H的内存单元中的内容为12FCH,地址为12FCH的内存单元的内容为38B8H,而38B8H单元的内容为88F9H。
说明以下各情况下操作数的有效地址和操作数各是多少?(1)操作数采用变址寻址,变址寄存器的内容为12,指令中给出的形式地址为1200H。
(2)操作数采用一次间接寻址,指令中给出的地址码为1200H。
(3)操作数采用寄存器间接寻址,指令中给出的寄存器编号为8,8号寄存器的内容为1200H。
参考答案:(1)有效地址EA=000CH+1200H=120CH,操作数未知。
(2)有效地址EA=(1200H)=12FCH,操作数为38B8H。
(3)有效地址EA=1200H,操作数为12FCH。
5.通过查资料了解Intel 80x86微处理器和MIPS处理器中各自提供了哪些加法指令,说明每条加法指令的汇编形式、指令格式和功能,并比较加、减运算指令在这两种指令系统中不同的设计方式,包括不同的溢出处理方式。
计算机组成原理第五章答案
第5章习题参考答案1.请在括号内填入适当答案。
在CPU 中:(1)保存当前正在执行的指令的寄存器是( IR ); (2)保存当前正在执行的指令地址的寄存器是( AR )(3)算术逻辑运算结果通常放在( DR )和( 通用寄存器 )。
2.参见图5.15的数据通路。
画出存数指令“STO Rl ,(R2)”的指令周期流程图,其含义是将寄存器Rl 的内容传送至(R2)为地址的主存单元中。
标出各微操作信号序列。
解:STO R1, (R2)的指令流程图及微操作信号序列如下:3.参见图5.15的数据通路,画出取数指令“LAD (R3),R0”的指令周期流程图,其含义是将(R3)为地址主存单元的内容取至寄存器R2中,标出各微操作控制信号序列。
解:LAD R3, (R0)的指令流程图及为操作信号序列如下:4.假设主脉冲源频率为10MHz ,要求产生5个等间隔的节拍脉冲,试画出时序产生器的逻辑图。
解:5.如果在一个CPU 周期中要产生3个节拍脉冲;T l =200ns ,T 2=400ns ,T 3=200ns ,试画出时序产生器逻辑图。
解:取节拍脉冲T l 、T 2、T 3的宽度为时钟周期或者是时钟周期的倍数即可。
所以取时钟源提供的时钟周期为200ns ,即,其频率为5MHz.;由于要输出3个节拍脉冲信号,而T 3的宽度为2个时钟周期,也就是一个节拍电位的时间是4个时钟周期,所以除了C 4外,还需要3个触发器——C l 、C 2、C 3;并令211C C T *=;321C C T *=;313C C T =,由此可画出逻辑电路图如下:6.假设某机器有80条指令,平均每条指令由4条微指令组成,其中有一条取指微指令是所有指令公用的。
已知微指令长度为32位,请估算控制存储器容量。
解:80条指令,平均每条指令由4条微指令组成,其中有一条公用微指令,所以总微指令条数为80? (4-1)+1=241条微指令,每条微指令32位,所以控存容量为:241?32位 7.某ALU 器件是用模式控制码M S 3 S 2 S 1 C 来控制执行不同的算术运算和逻辑操作。
计算机体系结构1-6章习题答案
1 2 3 4 5 6
8 16 24 32 40 48
1*82
2*82 3*82 4*82 5*82 6*82 7*82
4/8 5/8 6/8
7/8
7
56
2)规格化浮点数表: rm=2时,规格化浮点数共有4*8=32个 rm=8时,规格化浮点数共有7*8=56个,在[0.5,112]中, 有数19个(上表中红的数字表示)。
§4通道(CH)
一、CH的基本工作原理 CH执行CH程序的过程 CH的任务 二、CH流量计算和时空图绘制 CH的类型 CH流量计算 字节多路CH响应处理时空图的绘制 1)计算每个子CH提供一个字节时间(1/f) 2)画出一个完整申请周期时空图 3)计算字节多路CH对每个字节响应的最长用时
第一章参考答案: 1.应用语言级 高级语言级 汇编语言级 操作系统级 机器语言级 微程序语言级。 2. 从上而下 从下到上 专用机 通用机 3. 软、硬件交界面 计算机系统的性能/价格比 4 . 1 T FLOPS 的计 算能力 1 TBy te 的 主存容量 1 TByte/s 的I/O带宽 5. 虚拟机 实际机器 6. 统一高级语言 模拟 仿真 系列机 7. 控制流 数据流 SISD SIMD MISD MIMD 8. 汇编语言程序员 9. 任务单一化 操作重叠化 吞吐匹配化 程序多道 化
嵌套
中断处理程序 一 二 三 响② 嵌套 四 五
t
返回主程序
例4 解 (1)处理顺序为 2-3-1-5-4 (2)中断响应处理时空图 中断请求 主程序 ①③ ②③④⑤
嵌套
中断处理程序 一 二 三 四 五
响① 嵌套
t
返回主程序
1 分别利用两级描述符和三级描述符描述下列阵列数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 向量流水机的工作方式可分为哪两大类?它们的主要特点是什么?
2. 向量的加工方法有哪几种?各有什么特点?试从加工速度、需用中间变量
等方面加以比较。
3. 在CRAY1机上,V为向量寄存器,设向量长度均为32,s为标量寄存器,
所用浮点功能执行部件的执行时间分别为:加法需6拍,相乘需7拍,从存储器读数需6拍,求倒数近似值需14拍,打入寄存器及启动功能部件(包括寄存器)各需1拍。
问下列各指令组中的哪些指令可以链接?哪些指令可以并行执行?试说明其原因并分别计算出各指令组全部完成所需的拍数。
(1)V0←存储器
V1←V2+V3
V4←V5*V6 (2)V2←V0*V1
V3←存储器
V4←V2+V3
(3)V0←存储器
V3←V1+V2
V4←V0*V3
V6←V4+V5 (4)V0←存储器
V1←1/V0
V3←V1+V2
V5←V3*V4
(5)V0←存储器
V1←V2+V3
V4←V5*V6
s0←s1+s2 (6)V3←存储器
V2←V0+V1
s0←s2+s3
V3←V1*V4
(7)V3←存储器
V2←V0+V1
V4←V2*V3
存储器←V4 (8)V0←存储器
V2←V0+V1
V3←V2*V1
V5←V3*V4
4. 在CRAYl机上,按链接方式执行下述4条向量指令(括号中给出相应功能
部件时间),如果向量寄存器和功能部件之间的数据传送需1拍,试求此链
接流水线的流过时间为多少拍?如果向量长度为64,则需多少拍能得到全部结果?
V0←存储器(存储器取数:7拍)
V2←V0+Vl (向量加:3拍)
V3←V2<A3 (按(A3)左移:4拍)
V5←V3∧V4 (向量逻辑乘:2拍)
5. 若某个向量机其向量方式的执行速率Rv=10MFLOPS,标量方式的执行速
率Rs=1MFLOPS,设α是程序中可向量化的百分比。
要求:
⑴推导该向量机的平均执行速率Ra的公式。
⑵画出在(0,1)范围内,Ra与α的关系图。
⑶为使平均执行速率Ra=7.5MFlOPS,则α应取何值?
⑷假定Rs=1MFLOPS,α=0.7,则为使Ra=2MFLOPS,Rv应取何值?。