计算机系统结构_第五章练习 答案
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。
高阶交错存储器具有扩展方便、存取效率低的优点。
低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。
(2)各种存储器的带宽与其工作频率有关。
不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。
(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。
3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。
第五章计算机操作系统概论复习资料习题答案
第五章计算机操作系统概论复习资料习题答案第五章复习题一、单项选择题1.文件按用途分类,不包括(D)。
A.系统文件B.库文件C.用户文件D.档案文件2.一种既方便顺序存取又适合随机存取的文件存储结构是(C)。
A.顺序文件B.链接文件C.索引文件D.串联文件3.若把文件以顺序结构的方式存放到磁盘上,则存在的缺点是(B)。
A.目录结构复杂B.磁盘空间利用率低C.计算地址困难D.读写速度低4磁带上的每个文件组成部分不包括(C)。
A.文件头标B.文件信息C.文件正文D.文件尾标5.文件的信息按逻辑上独立的含义划分信息单位后就构成了记录式文件,这种划分信息的工作是(A)时完成的。
A.用户组织文件B.系统转储文件C.系统装入文件D.外设存取文件6.UNI某系统调用unlink的作用是(B)。
A.为一个文件再取一个新文件名B.删除文件的一个文件名C.请求读一个已经打开的文件D.建立两个文件的链接7.下面对目录结构描述错误的是(A)。
A.一级目录结构解决了文件的重名问题B.树形目录结构解决了文件的重名问题C.树形目录结构能进行存取权限的控制C.树形目录结构有利于文件分类8.读一个文件信息时,应依次调用(A)。
A.打开文件、读文件、关闭文件B.建立文件、读文件、关闭文件C.建立文件、读文件、写文件D.读文件、保存文件、关闭文件9.若允许用户按各自定义的文件名访问某个共享文件夹,则该系统应(C)。
A.为每个用户复制一份文件B.设置命名转换机制C.采用多级目录结构D.使该文件有多种物理结构形式10.文件的存储结构采用哪种形式是与(C)有关。
A.文件的逻辑结构B.存储空间的管理方式C.存储介质的类型D.文件的长度11.下列选项中属于存储介质的是(C)。
A.磁带机B.磁盘驱动器C.软磁盘片D.卡片机12.实现记录的成组与分解能提高磁盘空间的利用率,但必须设置主存缓冲区,该缓冲区的长度应根据(A)来确定。
A.磁盘块的大小B.成组的记录数C.逻辑记录的长度D.文件的长度13.对记录式文件,操作系统为用户存取文件信息的最小单位是(C)。
计算机体系结构试题及答案
计算机体系结构试题及答案12008年01月23日22:211、计算机高性能发展受益于:(1)电路技术的发展;(2)计算机体系结构技术的发展。
2、层次结构:计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。
第六级:应用语言虚拟机-> 第五级:高级语言虚拟机-> 第四级:汇编语言虚拟机-> 第三级:操作系统虚拟机-> 第二级:机器语言(传统机器级) ->第一级:微程序机器级。
3、计算机体系结构:程序员所看到的计算机的属性,即概括性结构与功能特性。
For personal use only in study and research; not for commercial use4、透明性:在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的概念称为透明性。
5、Amdahl提出的体系结构是指机器语言级程序员所看见的计算机属性。
6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定,也就是指令集的设计,该界面之上由软件的功能实现,界面之下由硬件和固件的功能来实现。
7、计算机组织是计算机系统的逻辑实现;计算机实现是计算机系统的物理实现。
8、计算机体系结构、计算机组织、计算机实现的区别和联系?答:一种体系结构可以有多种组成,一种组成可以有多种物理实现,体系结构包括对组织与实现的研究。
9、系列机:是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。
10、软件兼容:即同一个软件可以不加修改地运行于系统结构相同的各机器,而且它们所获得的结果一样,差别只在于运行时间的不同。
11、兼容机:不同厂家生产的、具有相同体系结构的计算机。
12、向后兼容是软件兼容的根本特征,也是系列机的根本特征。
13、当今计算机领域市场可划分为:服务器、桌面系统、嵌入式计算三大领域。
14、摩尔定律:集成电路密度大约每两年翻一番。
15、定量分析技术基础(1)性能的评测:(a)响应时间:从事件开始到结束之间的时间;计算机完成某一任务所花费的全部时间。
计算机系统结构(第2版(课后习题答案
word 文档下载后可自由复制编辑你计算机系统结构清华第 2 版习题解答word 文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9 (透明性概念),1.12-1.18 (Amdahl定律),1.19、1.21 、1.24 (CPI/MIPS)1.2 第二章(P124)2.3 、2.5 、2.6 (浮点数性能),2.13 、2.15 (指令编码)1.3 第三章(P202)3.3 (存储层次性能), 3.5 (并行主存系统),3.15-3.15 加 1 题(堆栈模拟),3.19 中(3)(4)(6)(8)问(地址映象/ 替换算法-- 实存状况图)word 文档下载后可自由复制编辑1.4 第四章(P250)4.5 (中断屏蔽字表/中断过程示意图),4.8 (通道流量计算/通道时间图)1.5 第五章(P343)5.9 (流水线性能/ 时空图),5.15 (2种调度算法)1.6 第六章(P391)6.6 (向量流水时间计算),6.10 (Amdahl定律/MFLOPS)1.7 第七章(P446)7.3 、7.29(互连函数计算),7.6-7.14 (互连网性质),7.4 、7.5 、7.26(多级网寻径算法),word 文档下载后可自由复制编辑7.27 (寻径/ 选播算法)1.8 第八章(P498)8.12 ( SISD/SIMD 算法)1.9 第九章(P562)9.18 ( SISD/多功能部件/SIMD/MIMD 算法)(注:每章可选1-2 个主要知识点,每个知识点可只选 1 题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例 , 习题2.1 第一章 (P33)例 1.1,p10假设将某系统的某一部件的处理速度加快到 10倍 ,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知: Fe=0.4, Se=10,根据 Amdahl 定律S n To T n1 (1Fe )S n 1 10.6 0.4100.64 Fe Se 1.56word 文档 下载后可自由复制编辑例 1.2,p10采用哪种实现技术来求浮点数平方根 FPSQR 的操作对系统的性能影响较大。
吉林大学计算机系统结构题目整合第五章
第五章存储层次知识点汇总存储器层次结构、存储层次性能参数(平均每位价格、命中率、平均访存时间)、存储层次4个问题、CPU 访存地址分割、全相联映像、直接映像、组相联映像、查找方法、替换算法(随机、先进先出、最近最少使用法)、写直达法、写回法、按写分配、不按写分配、Cache性能分析、3C失效(强制失效、容量失效、冲突失效)、Victim Cache、伪相联映像Cache、硬件预取、编译器优化(数组合并、内外循环交换、循环融合、分块)、写缓冲合并、单字宽存储器、多字宽存储器、多体交叉存储器、存储体、虚拟存储器(页式、段式)、快表(TLB)简答题1.单级存储器的主要矛盾是什么?通常采取什么方法来解决?(知识点:多级存储器)答:主要矛盾:(1) 速度越快,每位价格就越高。
(2) 容量越大,每位价格就越低。
(3) 容量越大,速度越慢。
采取多级存储层次方法来解决。
2.“Cache-主存”和“主存-辅存”层次的主要区别是什么?(知识点:存储层次)3.在存储层次中应解决哪四个问题?(知识点:存储层次的四个问题)答:(1)映像规则:当把一个块调入高一层存储器时,可以放到哪些位置上。
(2)查找算法:当所要访问的块在高一层存储器中时,如何找到该块。
(3)替换算法:当发生失效时,应替换哪一块。
(4)写策略:当进行写访问时,应进行哪些操作。
4.地址映像方法有哪几种?它们各有什么优缺点?(知识点:地址映像)(1)全相联映像。
实现查找的机制复杂,代价高,速度慢。
Cache空间的利用率较高,块冲突概率较低,因而Cache的失效率也低。
(2)直接映像。
实现查找的机制简单,速度快。
Cache空间的利用率较低,块冲突概率较高,因而Cache 的失效率也高。
(3)组相联映像。
组相联是直接映像和全相联的一种折中。
5.Cache的3C失效是哪三种失效?针对每种失效给出一种降低失效率的方法。
(知识点:3C失效)答:强制性失效、容量失效、冲突失效。
计算机系统结构(高教版)张晨曦 习题答案 第五章
5.1 解释下列术语多级存储层次:由若干个采用不同实现技术的存储器构成的存储器系统,各存储器处在离CPU不同距离的层次上。
使得靠近CPU的存储器速度较快,容量较小。
整个存储系统的速度接近与离CPU最近的存储器的速度,而容量和每位价格接近于最低层次的容量和价格。
全相联映像:指主存中的任一块可以被放置到Cache中的任意一个位置。
直接映像:指主存中的每一块只能被放置到Cache中唯一的一个位置。
组相联映像:指主存中的每一块可以被放置到Cache中固定的一个组中的任意位置。
替换算法:由于主存中的块比Cache中的块多,所以当要从主存中调入一个块到Cache中时,会出现该块所映像的Cache块位置已经被占用的情况。
替换算法即解决如何选择替换块的问题。
LRU:最近最少使用法。
选择近期最少被访问的块作为被替换的块。
写直达法:在执行“写”操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。
写回法:只把信息写入Cache中相应的块,该块只有在被替换时才被写回主存。
按写分配法:在写失效时,先把所写单元所在的块从主存调入Cache,然后再进行写入。
不按写分配法:写失效时,直接写入下一级存储器而不将相应的块调入Cache。
命中时间:CPU所要访问的块在Cache中,确认并取走所花费的时间开销。
失效率:CPU一次访存不命中的概率。
失效开销:CPU一次访存不命中,而额外增加的访存开销。
强制性失效:当第一次访问一个块时,该块不在Cache中,需从下一级存储器中调入Cache。
容量失效:如果程序执行执行时所需的块不能全部调入Cache中,则当某些快被替换后,若又重新被访问,就会发生失效。
冲突失效:在组相联或直接映像Cache中,若不多的块映像到同一组中,则会出现该组中某个块被别的块替换,然后又重新被访问的情况。
2:1 Cache经验规则:大小为N的直接映像Cache的失效率约等于大小为N/2的2路组相联Cache的失效率。
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。
高阶交错存储器具有扩展方便、存取效率低的优点。
低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。
(2)各种存储器的带宽与其工作频率有关。
不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。
(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。
3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。
计算机体系结构各章简答题及答案
计算机体系结构各章简答题及答案第⼀章计算机体系结构的基本概念1. 什么是计算机系统的多级层次结构?2. 硬件和软件在什么意义上是等效的在什么意义上是不等效的?3. 经典计算机系统结构的实质是什么?4. 语⾔实现的两种基本技术是什么?5. 对于通⽤寄存器型机器来说,机器语⾔程序设计者所看到的计算机的属性主要有哪些?6. 什么是软件兼容软件兼容有⼏种其中哪⼀种是软件兼容的根本特征?7. 什么是系列机它的出现较好地解决了什么⽭盾?8. 对计算机发展⾮常关键的实现技术有哪些?9. 实现软件移植的主要途径有哪些?10. 试以系列机为例,说明计算机系统结构、计算机组成和计算机实现三者之间的关系。
11. 存储程序计算机在系统结构上的主要特点是什么?12. 从系统结构的发展情况看,新型系统结构的设计主要从哪两⽅⾯着⼿?13. 软件技术两个最重要的发展趋势是什么?14. 计算机系统设计⼈员的技术挑战主要来⾃哪⼏个⽅⾯?15. ⼀种计算机系统结构的⽣命周期是怎样的?16. 商品的标价(价格)由哪些因素构成?17. 对计算机系统成本产⽣影响的主要因素有哪些?18. ⽤户CPU时间由哪三个因素决定?19. ⽬前常⽤的测试程序分为哪五类?20. 什么叫测试程序组件在评价计算机系统设计时最常见的测试程序组件是哪个?21. SPEC2000测试程序组件中包括哪⼏个测试程序组件?22. 测试基于Microsoft公司的Windows系列操作系统平台的最常⽤测试组件有哪些?23. 常⽤的专门的性能指标测试程序有哪些?24. 计算机系统结构设计和分析中最经常使⽤的三条基本原则是什么25. 根据Amdahl定律,系统加速⽐由哪两个因素决定?26. 从执⾏程序的⾓度看,并⾏性等级从低到⾼可分为哪⼏级?27. 从处理数据的⾓度,并⾏性等级从低到⾼可以分为哪⼏级?28. 计算机系统中提⾼并⾏性的技术途径有哪三种?29. 多机系统的耦合度可以分为哪⼏类?30. 单机系统和多机系统中,都是按哪三种技术途径分别发展为哪三类多处理机?31. 三种类型的多处理机(同构型多处理机、异构型多处理机、分布处理系统)的主要区别是什么1. 什么是计算机系统的多级层次结构从计算机语⾔的⾓度,把计算机系统按功能划分成以下多级层次结构:2. 硬件和软件在什么意义上是等效的在什么意义上是不等效的硬件和软件在功能实现上是等效的,即⼀种功能可以由软件实现,也可以由硬件实现。
计算机组成习题5,6,8,9章答案
0002H:000AH0007H:000AH
0003H:0002H0008H:0002H
0004H:0007H0009H:0003H
0005H:0004H000AH:0009H
0006H:0005H000BH:0008H
指令为双字长指令,格式如下:
操作码,寻址方式码,寄存器号(16位)
10.什么是中断嵌套?它解决了什么问题?如何才能实现中断嵌套?
略
11.中断源可以分为哪几类?各自有何特点?
略
12.有哪几种中断优先级排队方法?比较它们的优缺点。
略
13.解释下列名词:
(1)中断向量(2)中断隐指令(3)DMA(4)通道
(5)多重中断(6)单重中断(7)中断类型号(8)菊花链电路
略
14.假设有4个中断源A、B、C、D,硬件排队后,中断优先级从高到低依次为A→B→C→D。现在需要将4个中断源得到CPU响应的次序更改为C→A→D→B,写出各个中断源的中断服务程序中应该设置的中断屏蔽字。
答:EBH, 0AH.
6.13某机器内共有16个32位的通用寄存器,设计一种有60种操作,8种寻址方式的指令系统。假设指令字长等于机器字长,机器字长为32位,请回答:
(1)若主存可直接寻址或间接寻址,采用“寄存器-存储器”型指令,能寻址最大存储空间是多少?画出指令格式并说明各字段的含意。
(2)若采用通用寄存器作基址寄存器,则“寄存器-存储器”型指令的指令格式是怎样? 能寻址最大存储空间是多少?
答:B
6.10某机16位字长指令格式如下:
OP
M
D
其中:D是形式地址,采用补码表示(包括一位符号位);
M是寻址方式
M=0立即寻址;
计算机系统结构课后习题答案(老师划过重点得)
…第1章计算机系统结构的基本概念解释下列术语层次结构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
【解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
《计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
/CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
第五章 多媒体计算机硬件及软件系统结构
(3)重放声波信号 (4)用midi技术合成音乐
(a)(1)(3)(4) (b)(2)(3)(4) (c)(1)(2)(3) (d)全部
答:(d)
82750pb象素处理器具有较宽的指令字长(48位),直接连到vram的随机或并行通道,由于不同指令字的不同字段分别控制硬件机构,所以这些指令可以同时执行多种操作,它包括两个分开并对称的内插16位数据总线、为8位象素计算专门分开的alu操作;在解压缩时为运动补偿设计了象素插值器,解压缩编码数据流设计了统计解码器;以及为了同dvi的vram传输数据所设计的四个先进先出(fifo)数据缓冲区。82750pb象素处理器运行较小的微码译码器,它定时询问在vram中的命令表。由计算机建立主命令表,微码命令由主机直接引导加载到82750pb微码存储器中,当命令表指出某些操作需要运行时,如解码操作,微码译码器从vram中将一个微码块加载到82750pb内部的微码存储器中,并且执行它。这些解码是由主计算机设计并加载到vram中的。
第五章 多媒体计算机硬件及软件系统结构
单项选择题1-8:
1、组成多媒体系统的途径有哪些:
(1)直接设计和实现 (2)增加多媒体升级套件进行扩展
(3)cpu升级 (4)增加cd-da
(a)仅(1) (b)(1)(2) (c)(1)(2)(3) (d)全部
2.音频子系统
音频子系统由音频信号处理器、数字到模拟的转换硬件以及模拟滤波器组成。它与视频子系统并行操作、解决音频信号的压缩、编码和解码,还解决音频信号的a/d、d/a转换以及音响声效的特技处理。
音频子系统的核心器件是ad(analog device)公司的ad-2105数字信号处理器(dsp),通过它完成所有音频信号的压缩和解压缩任务。dvi系统采用自适应预测编码(adpcm)算法将16位的采样数据压缩编码成4位码,最后将压缩的音频数据输出到d/a转换器,dsp的垂直消隐中断出现在每个显示帧的场逆程,以此来解决视频数据流和音频数据流的同步问题。数字到模拟量的转换器是由burr-brown公司生产的pcm66p单片立体声16位串行接口组成。跟着d/a变换器是双通道的模拟滤波器,其截止频率近似固定在17khz,并且有5个极点。
计算机系统结构复习试题及答案(非计算)
一.名词解释计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
同构型多处理机系统:由多个同类型或至少担负同等功能的处理机组成,它们同时处理同一作业中能并行执行的多个任务。
堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。
累加器型机器:CPU 中存储操作数的单元是累加器的机器。
通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。
数据相关:考虑两条指令i 和j,i 在j 的前面,如果下述条件之一成立,则称指令j 与指令 i 数据相关:(1)指令j 使用指令i 产生的结果;(2)指令j 与指令k 数据相关,而指令k 又与指令i 数据相关。
定向:用来解决写后读冲突的。
在发生写后读相关的情况下,在计算结果尚未出来之前,后面等待使用该结果的指令并不见得是马上就要用该结果。
如果能够将该计算结果从其产生的地方直接送到其它指令需要它的地方,那么就可以避免停顿。
向量处理机:指令级并行:简称ILP。
是指指令之间存在的一种并行性,利用它,计算机可以并行执行两条或两条以上的指令。
指令的动态调度:是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。
是由硬件在程序实际运行时实施的。
指令的静态调度:是指依靠编译器对代码进行静态调度,以减少相关和冲突。
它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。
失效率:CPU 访存时,在一级存储器中找不到所需信息的概率。
失效开销:CPU 向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。
强制性失效:当第一次访问一个块时,该块不在Cache 中,需要从下一级存储器中调入Cache,这就是强制性失效。
容量失效:如果程序在执行时,所需要的块不能全部调入Cache 中,则当某些块被替换后又重新被访问,就会产生失效,这种失效就称作容量失效。
计算机组成原理课后习题答案
第1章计算机组成原理考试大纲第一章计算机体系结构和计算机组成冯。
诺伊曼体系的特点Amdahl定律第二章数制和数制转换各种码制的表示和转换浮点数的表示补码加减法布思算法浮点数的加减法海明码的计算练习:5,6,7,8,101、已知X=19,Y=35,用布思算法计算X×Y和X×(-Y)。
2、使用IEEE 754标准格式表示下列浮点数:-5,,1/16,-6,384,-1/32。
3、已知X=×2-111,Y=×2-100。
试计算X+Y,X-Y,X×Y和X/Y。
4、某浮点数字长12位,其中阶符1位,阶码数值3位,尾符1位,尾数数值7位,阶码和尾数均用补码表示。
它所能表示的最大正数是多少最小规格化正数是多少绝对值最大的负数是多少5、求有效信息位为01101110的海明码校验码。
第三章练习:5解释下列概念:PROM,EPROM,E2PROM,Flash memory,FPGA,SRAM和DRAM。
第四章总线的分类总线操作周期的四个传输阶段总线仲裁的概念及其分类异步通信方式的种类总线的最大传输率第五章存储器的分类存储容量的扩展RAID的概念、特点以及分类Cache的地址映射Cache的写策略Cache的性能分析3C练习:4,5,71.一个容量为16K×32位的存储器,其地址线和数据线的总和是多少用下列存储芯片时,各需要多少片1K×4位,2K×8位,4K×4位,16K×l位,4K×8位,8K×8位2.现有1024×l的存储芯片,若用它组成容量为16K×8的存储器。
(1)实现该存储器所需的芯片数量(2)若将这些芯片分装在若干块板上,每块板的容量为4K×8,该存储器所需的地址线总数是多少几位用于选片几位用作片内地址(3)画出各芯片的连接逻辑图。
3.设某机主存容量为4MB,Cache容量为16KB,每块包含8个字,每字32位,设计一个4路组相联映射(即Cache每组内共有4个块)的Cache组织,要求:(1)画出主存地址字段中各段的位数。
计算机系统结构第1-8章部分作业答案
第一章1.6 某台主频为400MHz 的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:求该计算机的有效CPI 、MIPS 和程序执行时间。
解:(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (或259460) (2)MIPS 速率=f/ CPI =400/1.776 =225.225MIPS (或2595180MIPS) (3)程序执行时间= (45000×1+75000×2+8000×4+1500×2)/400=575μs1.9 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。
具体数据(1)改进后,各类操作的加速比分别是多少?(2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少? 解:根据Amdahl 定律SeFeFe S n +-=)1(1可得4类操作均改进后,整个程序的加速比:2.16)1(1≈+-=∑∑iii n S F F S1.10 第二章变长编码,哈夫曼编码第三章3.12 有一条指令流水线如下所示:(1)求连续输入10条指令的情况下,该流水线的实际吞吐率和效率。
(2)该流水线的瓶颈在哪一段?请采用两种不同的措施消除此瓶颈。
对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)本题主要考察对各功能段用时不等的线性流水线的性能计算公式的掌握情况。
2200(ns)2009200)10050(50t n t T maxki i =⨯++++=∆-+∆=∑=)1(1流水 )(ns 2201T nTP 1-==流水45.45%1154400TP ktTP E k1i i≈=⋅=∆⋅=∑= 注意:对于公式不能死记硬背,需要充分理解,注意公式的适用条件。
计算机体系结构----第五章
采用先行控制方式时一个程序的执行情况:
指令地址 „„ k-i-1 k-i „„ k-1 k k+1 „„ k+j k+j+1 „„ k+j+n k+j+n+1 k+j+n+2 „„ k+j+n+m k+j+n+m+1 „„ 指令执行情况 已经执行完成的指令 在后行写数栈中等待把结果写到主存储器中的指令 正在指令执行部件中执行的指令 已经由指令分析器预处理完成,存放在先行操作栈中的 RR*型指令,指令所需要的操作数已经读到先行读数栈中 已经由指令分析器预处理完成, 存放在先行操作栈中, 指 令所需要的操作数还没有读到先行读数栈中 正在指令分析器中进行分析和预处理的指令 已经从主存储器中预取到先行指令缓冲栈中的指令 还没有进入处理机的指令
(2)先行操作栈 指令分析器对已经存放在先行指令缓冲栈里的指令进 行预处理,把处理之后的指令送入先行操作栈。 处于指令分析器和运算控制器之间,使指令分析器和 运算器能够各自独立工作。
对于无条件转移及条件转移指令等程序控制指令,一般在 指令分析器中就能直接执行 各种运算型指令、移位指令、数据传送指令等都要先处理 成RR型指令,送入先行操作栈 经过指令分析器预处理之后送到先行操作栈中等待运算器 执行的指令就都变成了统一格式的RR型指令 执行这种指令所需的操作数都存放在通用寄存器或先行读 数栈中
2.解决访存冲突的方法: (1)两个独立的存储器:指令存储器和数据存储器。 如果再规定,执行指令阶段产生的运算结果只写到 通用寄存器,则取指令、分析指令和执行指令就可 以同时进行。 许多高性能计算机具有独立的指令Cache和数据 Cache结构,称为哈佛结构。 (2)采用低位交叉存取方式: 这种方法不能根本解决冲突问题。
计算机组成原理第五章答案
10. 什么是I/O接口?它与端口有何区别?为 什么要设置I/O接口?I/O接口如何分类? 解: I/O接口一般指CPU和I/O设备间的连 接部件; I/O端口一般指I/O接口中的各种寄存器。 I/O接口和I/O端口是两个不同的概念。一 个接口中往往包含若干个端口,因此接口地址 往往包含有若干个端口地址。
若为输出,除数据传送方向相反以外,其他操作 与输入类似。工作过程如下: 1)CPU发I/O地址地址总线接口设备选择 器译码选中,发SEL信号开命令接收门; 2)输出: CPU通过输出指令(OUT)将数据放 入接口DBR中; 3)CPU发启动命令 D置0,B置1 接口向设 备发启动命令设备开始工作; 4)CPU等待,输出设备将数据从 DBR取走; 5)外设工作完成,完成信号接口 B置0,D 置 1; 6)准备就绪信号控制总线 CPU,CPU可通 过指令再次向接口DBR输出数据,进行第二次传送。
2. 简要说明CPU与I/O之间传递信息可采用 哪几种联络方式?它们分别用于什么场合? 答: CPU与I/O之间传递信息常采用三种联 络方式:直接控制(立即响应)、 同步、异步。 适用场合分别为: 直接控制适用于结构极简单、速度极慢的 I/O设备,CPU直接控制外设处于某种状态而无须 联络信号。 同步方式采用统一的时标进行联络,适用于 CPU与I/O速度差不大,近距离传送的场合。 异步方式采用应答机制进行联络,适用于 CPU与I/O速度差较大、远距离传送的场合。
启动
I/O准备 就绪
DMA请求
数据传送: 响应, 让出一个 MM周期
现行程序
准备下 个数据
现行程序 A
DMA请求 总线请求
就绪
D
B
CPU
DMAC
C
I/O
计算机组织与系统结构第五章习题答案
第 5 章习题答案3.假定某计算机中有一条转移指令,采用相对寻址方式,共占两个字节,第一字节是操作码,第二字节是相对位移量(用补码表示),CPU每次从内存只能取一个字节。
假设执行到某转移指令时PC的内容为200,执行该转移指令后要求转移到100开始的一段程序执行,则该转移指令第二字节的内容应该是多少?参考答案:因为执行到该转移指令时PC为200,所以说明该转移指令存放在200单元开始的两个字节中。
因为CPU每次从内存只能取一个字节,所以每次取一个字节后PC应该加1。
该转移指令的执行过程为:取200单元中的指令操作码并译码→PC+1→取201单元的相对位移量→PC+1→计算转移目标地址。
假设该转移指令第二字节为Offset,则100=200+2+Offset,即Offset = 100–202 = –102 = 10011010B(注:没有说定长指令字,所以不一定是每条指令占2个字节。
)4.假设地址为1200H的内存单元中的内容为12FCH,地址为12FCH的内存单元的内容为38B8H,而38B8H单元的内容为88F9H。
说明以下各情况下操作数的有效地址和操作数各是多少?(1)操作数采用变址寻址,变址寄存器的内容为12,指令中给出的形式地址为1200H。
(2)操作数采用一次间接寻址,指令中给出的地址码为1200H。
(3)操作数采用寄存器间接寻址,指令中给出的寄存器编号为8,8号寄存器的内容为1200H。
参考答案:(1)有效地址EA=000CH+1200H=120CH,操作数未知。
(2)有效地址EA=(1200H)=12FCH,操作数为38B8H。
(3)有效地址EA=1200H,操作数为12FCH。
5.通过查资料了解Intel 80x86微处理器和MIPS处理器中各自提供了哪些加法指令,说明每条加法指令的汇编形式、指令格式和功能,并比较加、减运算指令在这两种指令系统中不同的设计方式,包括不同的溢出处理方式。
计算机体系结构1-6章习题答案
1 2 3 4 5 6
8 16 24 32 40 48
1*82
2*82 3*82 4*82 5*82 6*82 7*82
4/8 5/8 6/8
7/8
7
56
2)规格化浮点数表: rm=2时,规格化浮点数共有4*8=32个 rm=8时,规格化浮点数共有7*8=56个,在[0.5,112]中, 有数19个(上表中红的数字表示)。
§4通道(CH)
一、CH的基本工作原理 CH执行CH程序的过程 CH的任务 二、CH流量计算和时空图绘制 CH的类型 CH流量计算 字节多路CH响应处理时空图的绘制 1)计算每个子CH提供一个字节时间(1/f) 2)画出一个完整申请周期时空图 3)计算字节多路CH对每个字节响应的最长用时
第一章参考答案: 1.应用语言级 高级语言级 汇编语言级 操作系统级 机器语言级 微程序语言级。 2. 从上而下 从下到上 专用机 通用机 3. 软、硬件交界面 计算机系统的性能/价格比 4 . 1 T FLOPS 的计 算能力 1 TBy te 的 主存容量 1 TByte/s 的I/O带宽 5. 虚拟机 实际机器 6. 统一高级语言 模拟 仿真 系列机 7. 控制流 数据流 SISD SIMD MISD MIMD 8. 汇编语言程序员 9. 任务单一化 操作重叠化 吞吐匹配化 程序多道 化
嵌套
中断处理程序 一 二 三 响② 嵌套 四 五
t
返回主程序
例4 解 (1)处理顺序为 2-3-1-5-4 (2)中断响应处理时空图 中断请求 主程序 ①③ ②③④⑤
嵌套
中断处理程序 一 二 三 四 五
响① 嵌套
t
返回主程序
1 分别利用两级描述符和三级描述符描述下列阵列数
计算机系统结构-第五章自考练习题答案
(效率:3/8△t 效率:3/8)同步强化练习一.单项选择题。
1. 重叠机器局部相关的处理方法有两类:推后后续指令对相关单元的读和〔 C 〕。
A.异步流动B.采用顺序流动C.设置相关直接通路D.调整指令流动的顺序2. CRAY-1的流水线是〔 C 〕。
A. 多条单功能流水线B.一条单功能流水线C.一条多功能流水线D.多条多功能流水线3. 指令间的“一次重叠〞是指〔 B 〕。
A.“K 执行〞与“1+K 取指〞重叠B.“1+K 分析〞与“K 执行〞重叠C.“1+K 取指〞与“K 分析〞重叠D. “K 分析〞与“1+K 执行〞重叠4. 指令缓冲器的容量越大,发生指令相关的概率将〔 A 〕。
A.增大B.降低C.不变D.不定5. “取指〞、“分析〞、“执行〞之间的流水属于〔 B 〕。
A.系统级流水B.处理机级流水C.部件级流水D.作业级流水6. 非线性流水线是指〔 B 〕。
A.流水线中某些功能段在各次运算中的作用不同B.一次运算中要屡次使用流水线中的某些功能段C.一次运算中使用流水线的多个功能段D.流水线的各个功能段在各种运算中有不同的组合7. 关于标量流水机的说法有错的是〔 B 〕。
A.没有向量数据表示B.不能对向量数据进展运算C.可对标量数据进展流水处理D.可以对向量、数组进展运算8. 与流水线最大吞吐率有关的是〔 D 〕。
A.最后子过程的时间B.各个子过程的时间C.最快子过程的时间D.最慢子过程的时间9. 在流水线的相关处理中,会发生“写一写〞相关和“先读后写〞相关的是〔 C 〕。
A.猜想法B.顺序流动C.异步流动D.相关专用通路10. 在流水机器中,全局性相关是指〔 D 〕。
A.先读后写相关B.指令相关C.先写后读相关D.由转移指令引起的相关11. IBM360/91机对指令中断的处理方法是〔 A 〕。
A.不准确断点法B.指令复执法C.准确断点法D.对流水线重新调度12. CRAY-1机的两条向量指令V1←V2+V3V4←V1*V5属于〔 B 〕。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章练习
1、描述计算机系统流水线的性能指标有哪些?其定义和定量表达式是什么?
指标主要有吞吐率、加速比、效率。
(1)吞吐率:在单位时间内流水线所完成的任务数量或输出的结果数量。
基本公式:TP=n/Tk,其中,n是任务数,Tk是处理完成n个任务所用的时间。
各个功能段执行时间均相等,输入连续n个任务的一条k段线性流水线的实际吞吐率为:TP=n/[(k+n-1) ∆t]
(2)加速比:完成一批任务,不使用流水线所用的时间与使用流水线所用的时间之比。
基本公式:S=T0/Tk,其中,T0为不使用流水线所用的时间,Tk为使用流水
线的执行时间。
各个功能段执行时间均相等的一条K段流水线完成n个连续任务时的实际加速比为:s=k*n*∆t/[(k+n-1) ∆t]=k*n/( k+n-1).
(3)效率:指流水线的设备利用率。
在时空图上,流水线的效率定义为n个任务占用的时空区与k个功能段总的时空区之比。
即:E=T0/(k*Tk)
各个功能段执行时间均相等,输入连续n个任务的一条k段线性流水线的效率为:E=n/(k+n-1)
2、假设某个流水线由4个功能部件组成,每个功能部件的执行时间都为∆t。
当
连续输入10个数据后,停顿5∆t,又连续输入10个数据,如此重复。
画出时空图,计算流水线的实际吞吐率,加速比和效率。
总时间:Tk=[(4+10-1)+2] *∆t*n =15n*∆t
实际吞吐率:TP=N/Tk=10n/(15n*∆t)=2/(3∆t)
不使用流水线所用的时间为T0=4*N*∆t =40n*∆t
加速比:S=T0/Tk=2.67
效率:E=T0/(k*Tk)=0.67。