计算机系统结构 课后习题答案(第2版)
计算机组成原理第二版课后习题答案
计算机组成原理第二版课后习题答案第1章计算机系统概论1.什么是计算机系统、计算机硬件和计算机软件?硬件和软件哪个更重要?解:硬件和软件在计算机系统中相互依存,缺一不可,因此同样重要。
2.如何理解计算机的层次结构?答:计算机硬件、系统软件和应用软件构成了计算机系统的三个层次结构。
(1)硬件系统是最内层的,它是整个计算机系统的基础和核心。
(2)系统软件在硬件之外,为用户提供一个基本操作界面。
(3)应用软件在最外层,为用户提供解决具体问题的应用系统界面。
通常将硬件系统之外的其余层称为虚拟机。
各层次之间关系密切,上层是下层的扩展,下层是上层的基础,各层次的划分不是绝对的。
言的符号表示,高级语言是面向算法的语言。
高级语言编写的程序(源程序)处于最高层,必须翻译成汇编语言,再由汇编程序汇编成机器语言(目标程序)之后才能被执行。
4.如何理解计算机组成和计算机体系结构?答:计算机体系结构是指那些能够被程序员所见到的计算机系统的属性,如指令系统、数据类型、寻址技术组成及I/O机理等。
计算机组成是指如何实现计算机体系结构所体现的属性,包含对程序员透明的硬件细节,如组成计算机系统的各个功能部件的结构和功能,及相互连接方法等。
5.冯诺依曼计算机的特点是什么?解:冯诺依曼计算机的特点是:P8计算机由运算器、控制器、存储器、输入设备、输出设备五大部件组成;指令和数据以同同等地位存放于存储器内,并可以按地址访问;指令和数据均用二进制表示;指令由操作码、地址码两大部分组成,操作码用来表示操作的性质,地址码用来表示操作数在存储器中的位置;指令在存储器中顺序存放,通常自动顺序取出执行;机器以运算器为中心(原始冯诺依曼机)。
6.画出计算机硬件组成框图,说明各部件的作用及计算机系统的主要技术指标。
答:计算机硬件组成框图如下:控制器运算器CPU存储器接口接口输入设备主机外设输出设备各部件的作用如下:控制器:整机的指挥中心,它使计算机的各个部件自动协调工作。
计算机系统结构课后答案chap2-answer
第二章计算机指令集结构设计名词解释1.堆栈型机器——CPU中存储操作数的单元是堆栈的机器。
2.累加型机器——CPU中存储操作数的单元是累加器的机器。
3.通用寄存器型机器——CPU中存储操作数的单元是通用寄存器的机器。
4.CISC——复杂指令集计算机。
5.RISC——精简指令集计算机。
@2.2堆栈型机器、累加器型机器和通用寄存器型机器各有什么优缺点2.3常见的三种通用寄存器型机器的优缺点各有哪些指令集结构设计所涉及的内容有哪些(1)指令集功能设计:主要有RISC和CISC两种技术发展方向;(2)寻址方式的设计:设置寻址方式可以通过对基准程序进行测试统计,察看各种寻址方式的使用频度,根据适用频度设置相应必要的寻址方式;(3)操作数表示和操作数类型:主要的操作数类型和操作数表示的选择有,浮点数据类型(可以采用IEEE 754标准)、整型数据类型(8位、16位、32位的表示方法)、字符型(8位)、十进制数据类型(压缩十进制和非压缩十进制数据表示)等等。
(4)寻址方式的表示:可以将寻址方式编码与操作码中,也可将寻址方式作为一个单独的域来表示。
(5)((6)指令集格式的设计:有固定长度编码方式、可变长编码方式和混合编码方式三种选择。
简述CISC计算机结构指令集功能设计的主要目标。
从当前的计算机技术观点来看,CISC结构有什么缺点CISC结构追求的目标是强化指令功能,减少程序的指令条数,以达到提高性能的目的。
从目前的计算机技术观点来看,CISC结构存在以下几个缺点:(1)在CISC结构的指令系统中,各种指令的使用频率相差悬殊。
(2)CISC结构的指令系统的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。
(3)CISC结构的指令系统的复杂性给VLSI设计带来了很大负担,不利于单片集成。
(4)CISC结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。
(5)^(6)在结构的指令系统中,由于各条指令的功能不均衡性,不利于采用先进的计算机体系结构技术(如流水技术)来提高系统的性能。
计算机体系结构课后答案
计算机体系结构课后答案【篇一:计算机体系结构习题(含答案)】1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。
对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。
(1)最大尾数(8)最小正数(2)最小正尾数(9)最大负数(3)最小尾数(10)最小负数(4)最大负尾数(11)浮点零(5)最大阶码(12)表数精度(6)最小阶码(13)表数效率(7)最大正数(14)能表示的规格化浮点数个数2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。
尾数用原码、纯小数表示,阶码用移码、整数表示。
(1) 设计这种浮点数的格式(2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。
3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。
(1) 选择合适的舍入方法。
(2) 确定警戒位位数。
(3) 计算在正数区的误差范围。
4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。
b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。
如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。
对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。
(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。
6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为6位。
计算机组成原理课后答案(第二版)_唐朔飞_第八章
t
26. 设某机配有A、B、C三台设备, 其优先级按A→B→C降序排列,为改 变中断处理次序,它们的中断屏蔽字 设置如下:
设备 A B C 屏蔽字 111 010 011
请按下图所示时间轴给出的设备 请求中断的时刻,画出CPU执行程序 的轨迹。设A、B、C中断服务程序的 执行时间均为20s。
向量编码器——向量中断时,用 来产生向量地址; 中断允许触发器(EINT)—— CPU中的中断总开关,完成开、关中 断状态的设置; 中断标记触发器(INT)——用来 建立中断周期状态。INT=1,表示进 入中断周期,即开始执行中断隐指令; 中断屏蔽触发器——对于可屏蔽 的中断源进行开、关中断操作,可视 为各中断源的中断分开关; 采用程序中断技术时,指令系统 中往往有相关指令支持。常见的指令 有:开中断、关中断、中断返回等。
17. 在中断系统中,INTR、INT、 EINT这三个触发器各有何作用? 解:INTR——中断请求触发器,用 来登记中断源发出的随机性中断请求信号, 以便为CPU查询中断及中断排队判优线路 提供稳定的中断请求信号; EINT——中断允许触发器,CPU中 的中断总开关。当EINT=1时,表示允许 中断(开中断),当EINT=0时,表示禁 止中断(关中断)。其状态可由开、关中 断等指令设置; INT——中断标记触发器,控制器时 序系统中周期状态分配电路的一部分,表 示中断周期标记。当INT=1时,进入中断 周期,执行中断隐指令的操作。
4. 设CPU内有下列部件:PC、IR、 SP、AC、MAR、MDR和CU,要求: (1)画出完成间接寻址的取数指 令LDA@X(将主存某地址单元X的内 容取至AC中)的数据流(从取指令开 始)。 (2)画出中断周期的数据流。 解:CPU中的数据流向与所采用 的数据通路结构直接相关,不同的数 据通路中的数据流是不一样的。常用 的数据通路结构方式有直接连线、单 总线、双总线、三总线等形式,目前 大多采用总线结构,直接连线方式仅 适用于结构特别简单的机器中。
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。
高阶交错存储器具有扩展方便、存取效率低的优点。
低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。
(2)各种存储器的带宽与其工作频率有关。
不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。
(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。
3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。
计算机系统结构——课后答案
习题一1、解释下列术语计算机系统的外特性:通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性,即由他们所看到的计算机的基本属性(概念性结构和功能特性)。
计算机系统的内特性:计算机系统的设计人员所看到的基本属性,本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。
模拟:模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。
可移植性:在新型号机出台后,原来开发的软件仍能继续在升级换代的新型号机器上使用,这就要求软件具有可兼容性,即可移植性。
可兼容性是指一个软件可不经修改或只需少量修改,便可由一台机器移植到另一台机器上运行,即同一软件可应用于不同环境。
Amdahl 定律:系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频度或占总执行时间的比例。
虚拟机(Virtual Machine ):指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。
6、7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%,为了增强该操作的性能,可采用两种不同的方法:一种是增加专门的硬件,可使求浮点数平方根操作的速度提高为原来的20倍;另一种方法是提高所有浮点运算指令的速度,使其为原来的2倍,而浮点运算指令的执行时间在总执行时间中占30%。
试比较这两种方法哪一种更好些。
答:增加硬件的方法的加速比23.120/2.0)2.01(11=+-=p S ,另一种方法的加速比176.12/3.0)3.01(12=+-=p S ,经计算可知Sp1>Sp2第一种方法更好些。
9、假设高速缓存Cache 的工作速度为主存的5倍,且Cache 被访问命中的概率为90%,则采用Cache 能使整个存储系统获得多高的加速比? 答:加速比%10)(%90'⨯++⨯==tc tm tc tmT T S ,其中tm=5tc ,代入公式,得到加速比S=3.33。
计算机体系结构习题答案
一、(5分)计算机系统设计中经常使用的4个定量原理是什么?请简要说明它们的含义。
答:(1)以经常性事件为重点。
在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。
(2)Amdahl 定律。
加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。
(3)CPU 性能公式。
执行一个程序所需的CPU 时间 = IC ×CPI ×T 。
(4)程序的局部性原理。
程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。
二、(15分)假设某应用程序中有4类操作,通过改进各类操作的功能部件,可(2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少? 答:根据Amdahl 定律aff S n +-=)1(1,其中f 是可改进部分在总运行时间中所占比例,a 是可改进部分的加速比,可得4类操作均改进后,整个程序的加速比:11.77(1)n ii iS FF S =≈-+∑∑三、(5分)请简述指令之间数据冲突的类型。
答:指令之间的数据冲突有3种类型:真相关、反相关、输出相关。
真相关(数据依赖,有时候也称为数据相关):考虑两条指令i 和j ,i 在j 的前面,指令k 在指令i 和指令j 之间。
如果下述条件之一成立,则称指令j 与指令i 真相关:(1)指令j 使用指令i 产生的结果(写后读);(2)指令j 与指令k 真相关,而指令k 又与指令i 真相关。
(真相关的传递性) 反相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 所写的名与指令i 所读的寄存器名或存储地址相同,则称指令i 和j 发生了反相关。
(读后写)输出相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 和指令i 所写的寄存器名或存储地址相同,则称指令i 和j 发生了输出相关。
(写后写) 其中反相关和输出相关又合称名相关。
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。
高阶交错存储器具有扩展方便、存取效率低的优点。
低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。
(2)各种存储器的带宽与其工作频率有关。
不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。
(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。
3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。
计算机系统结构(第2版(课后习题答案
word 文档下载后可自由复制编辑你计算机系统结构清华第 2 版习题解答word 文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9 (透明性概念),1.12-1.18 (Amdahl定律),1.19、1.21 、1.24 (CPI/MIPS)1.2 第二章(P124)2.3 、2.5 、2.6 (浮点数性能),2.13 、2.15 (指令编码)1.3 第三章(P202)3.3 (存储层次性能), 3.5 (并行主存系统),3.15-3.15 加 1 题(堆栈模拟),3.19 中(3)(4)(6)(8)问(地址映象/ 替换算法-- 实存状况图)word 文档下载后可自由复制编辑1.4 第四章(P250)4.5 (中断屏蔽字表/中断过程示意图),4.8 (通道流量计算/通道时间图)1.5 第五章(P343)5.9 (流水线性能/ 时空图),5.15 (2种调度算法)1.6 第六章(P391)6.6 (向量流水时间计算),6.10 (Amdahl定律/MFLOPS)1.7 第七章(P446)7.3 、7.29(互连函数计算),7.6-7.14 (互连网性质),7.4 、7.5 、7.26(多级网寻径算法),word 文档下载后可自由复制编辑7.27 (寻径/ 选播算法)1.8 第八章(P498)8.12 ( SISD/SIMD 算法)1.9 第九章(P562)9.18 ( SISD/多功能部件/SIMD/MIMD 算法)(注:每章可选1-2 个主要知识点,每个知识点可只选 1 题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例 , 习题2.1 第一章 (P33)例 1.1,p10假设将某系统的某一部件的处理速度加快到 10倍 ,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知: Fe=0.4, Se=10,根据 Amdahl 定律S n To T n1 (1Fe )S n 1 10.6 0.4100.64 Fe Se 1.56word 文档 下载后可自由复制编辑例 1.2,p10采用哪种实现技术来求浮点数平方根 FPSQR 的操作对系统的性能影响较大。
计算机系统结构课后答案chap2-answer
第二章计算机指令集结构设计2.1 名词解释1.堆栈型机器——CPU中存储操作数的单元是堆栈的机器。
2.累加型机器——CPU中存储操作数的单元是累加器的机器。
3.通用寄存器型机器——CPU中存储操作数的单元是通用寄存器的机器。
4.CISC——复杂指令集计算机。
5.RISC——精简指令集计算机。
2.2堆栈型机器、累加器型机器和通用寄存器型机器各有什么优缺点?2.3常见的三种通用寄存器型机器的优缺点各有哪些?2.4 指令集结构设计所涉及的内容有哪些?(1)指令集功能设计:主要有RISC和CISC两种技术发展方向;(2)寻址方式的设计:设置寻址方式可以通过对基准程序进行测试统计,察看各种寻址方式的使用频度,根据适用频度设置相应必要的寻址方式;(3)操作数表示和操作数类型:主要的操作数类型和操作数表示的选择有,浮点数据类型(可以采用IEEE 754标准)、整型数据类型(8位、16位、32位的表示方法)、字符型(8位)、十进制数据类型(压缩十进制和非压缩十进制数据表示)等等。
(4)寻址方式的表示:可以将寻址方式编码与操作码中,也可将寻址方式作为一个单独的域来表示。
(5)指令集格式的设计:有固定长度编码方式、可变长编码方式和混合编码方式三种选择。
2.5 简述CISC计算机结构指令集功能设计的主要目标。
从当前的计算机技术观点来看,CISC结构有什么缺点?CISC结构追求的目标是强化指令功能,减少程序的指令条数,以达到提高性能的目的。
从目前的计算机技术观点来看,CISC结构存在以下几个缺点:(1)在CISC结构的指令系统中,各种指令的使用频率相差悬殊。
(2)CISC结构的指令系统的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。
(3)CISC结构的指令系统的复杂性给VLSI设计带来了很大负担,不利于单片集成。
(4)CISC结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。
计算机系统结构教程课后答案
1.7某台主频为400MHz 的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:指令类型 指令执行数量 平均时钟周期数 整数 45000 1 数据传送 75000 2 浮点 8000 4 分支 1500 2求该计算机的有效CPI 、MIPS 和程序执行时间。
解:1(/)ni i i CPI CPI IC IC ==⨯∑(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (2)MIPS 速率=f/ CPI =400/1.776 =225.225MIPS (3)程序执行时间= (45000×1+75000×2+8000×4+1 500×2)/400=575s1.9 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?解:由题可知: 可改进比例Fe=40% = 0.4 部件加速比Se = 10根据()011 1.5625(10.4)0.4/101n n T S Fe T Fe Se ====-+-+ 1.10 计算机系统中有三个部件可以改进,这三个部件的部件加速比为: 部件加速比1=30; 部件加速比2=20; 部件加速比3=10 (1) 如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?(2) 如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少? 解:(1)在多个部件可改进情况下,Amdahl 定理的扩展:()011231123123n nT S Fe Fe Fe T Fe Fe Fe Se Se Se ==---+++ 已知S1=30,S2=20,S3=10,Sn =10,F1=0.3,F2=0.3,得: 得F3=0.36,即部件3的可改进比例为36%。
计算机体系结构课后习题原版答案-张晨曦著(2)
第1章计算机系统结构的基本概念1.1解释下列术语计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。
只要在时间上相互重叠,就存在并行性。
它包括同时性与并发性两种含义。
1.2试用实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系。
答:如在设计主存系统时,确定主存容量、编址方式、寻址范围等属于计算机系统结构。
确定主存周期、逻辑上是否采用并行主存、逻辑设计等属于计算机组成。
选择存储芯片类型、微组装技术、线路设计等属于计算机实现。
计算机组成是计算机系统结构的逻辑实现。
计算机实现是计算机组成的物理实现。
一种体系结构可以有多种组成。
一种组成可以有多种实现。
1.4计算机系统设计中经常使用的4个定量原理是什么?并说出它们的含义。
答:(1)以经常性事件为重点。
在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。
(2)Amdahl定律。
加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。
(3)CPU性能公式。
执行一个程序所需的CPU时间=IC×CPI×时钟周期时间。
(4)程序的局部性原理。
程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。
1.6某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:指令类型指令执行数量平均时钟周期数整数450001数据传送750002浮点80004分支15002求该计算机的有效CPI、MIPS和程序执行时间。
计算机组成原理课后答案(第二版)_唐朔飞_第四章
讨论: 讨论: 1)刷新与再生的比较: 刷新与再生的比较: 共同点: 共同点: ·动作机制一样。都是利用DRAM存储元破 动作机制一样。都是利用DRAM存储元破 坏性读操作时的重写过程实现; 坏性读操作时的重写过程实现; ·操作性质一样。都是属于重写操作。 操作性质一样。都是属于重写操作。
区别: 区别:
·解决的问题不一样。再生主要解决DRAM存储元 主要解决DRAM存储元 解决的问题不一样。 破坏性读出时的信息重写问题; 破坏性读出时的信息重写问题;刷新主要解决长时间不 访存时的信息衰减问题。 访存时的信息衰减问题。 ·操作的时间不一样。再生紧跟在读操作之后,时间 紧跟在读操作之后, 操作的时间不一样。 上是随机进行的; 最大间隔时间为周期定时重复 上是随机进行的;刷新以最大间隔时间为周期定时重复 进行。 进行。 ·动作单位不一样。再生以存储单元为单位,每次仅 以存储单元为单位, 动作单位不一样。 重写刚被读出的一个字的所有位; 以行为单位, 重写刚被读出的一个字的所有位;刷新以行为单位,每 次重写整个存储器所有芯片内部存储矩阵的同一行。 次重写整个存储器所有芯片内部存储矩阵的同一行。
特性 存储信息 破坏性读出 需要刷新 送行列地址 运行速度 集成度 发热量 存储成本 功耗 可靠性 可用性 适用场合
SRAM 触发器 非 不要 同时送 快 低 大 高 高 高 使用方便 高速小容量存储器
DRAM 电容 是 需要 分两次送 慢 高 小 低 低 低 不方便 大容量主存
9. 什么叫刷新?为什么要刷新?说明刷新有几种方法。 什么叫刷新 为什么要刷新 说明刷新有几种方法 刷新? 要刷新? 几种方法。 刷新——对DRAM定期进行的全部重写过程; 定期进行的全部重写过程 解:刷新——对DRAM定期进行的全部重写过程; 刷新原因——因电容泄漏而引起的 而引起的DRAM所存信息的衰减需 刷新原因——因电容泄漏而引起的DRAM所存信息的衰减需 及时补充,因此安排了定期刷新操作; 要及时补充,因此安排了定期刷新操作; 常用的刷新方法有三种 有三种——集中式 分散式、异步式。 集中式、 常用的刷新方法有三种——集中式、分散式、异步式。 集中式:在最大刷新间隔时间内,集中安排一段时间进行刷 集中式:在最大刷新间隔时间内,集中安排一段时间进行刷 新; 分散式:在每个读/写周期之后插入一个刷新周期, CPU访 插入一个刷新周期 分散式:在每个读/写周期之后插入一个刷新周期,无CPU访 存死时间; 存死时间; 异步式:是集中式和分散式的折衷 折衷。 异步式:是集中式和分散式的折衷。
计算机体系结构课后习题原版答案张晨曦著
第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构按照计算机语言从低级到高级的次序把计算机系统按功能划分成多级层次结构每一层以一种不同的语言为特征。
这些层次依次为微程序机器级传统机器语言机器级汇编语言机器级高级语言机器级应用语言机器级等。
虚拟机用软件实现的机器。
翻译先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序然后再在这低一级机器上运行实现程序的功能。
解释对于高一级机器上的程序中的每一条语句或指令都是转去执行低一级机器上的一段等效程序。
执行完后再去高一级机器取下一条语句或指令再进行解释执行如此反复直到解释执行完整个程序。
计算机系统结构传统机器程序员所看到的计算机属性即概念性结构与功能特性。
透明性在计算机技术中把这种本来存在的事物或属性但从某种角度看又好像不存在的概念称为透明性。
计算机组成计算机系统结构的逻辑实现包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现计算机组成的物理实现包括处理机、主存等部件的物理结构器件的集成度和速度模块、插件、底板的划分与连接信号传输电源、冷却及整机装配技术等。
系统加速比对系统中某部分进行改进时改进后系统性能提高的倍数。
Amdahl定律当对一个系统中的某个部件进行改进后所能获得的整个系统性能的提高受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理程序执行时所访问的存储器地址不是随机分布的而是相对地簇聚。
包括时间局部性和空间局部性。
CPI每条指令执行的平均时钟周期数。
测试程序套件由各种不同的真实应用程序构成的一组测试程序用来测试计算机在各个方面的处理性能。
存储程序计算机冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中机器一旦启动就能按照程序指定的逻辑顺序执行这些程序自动完成由程序所描述的处理工作。
系列机由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
软件兼容一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。
第2章 计算机体系结构 习题与答案
第二章习题(P69-70)一、复习题1.简述冯∙诺依曼原理,冯∙诺依曼结构计算机包含哪几部分部件,其结构以何部件为中心?答:冯∙诺依曼理论的要点包括:指令像数据那样存放在存储器中,并可以像数据那样进行处理;指令格式使用二进制机器码表示;用程序存储控制方式工作。
这3条合称冯∙诺依曼原理OgtiojD。
冯∙诺依曼计算机由五大部分组成:运算器、控制器、存储器、输入设备、输出设备,整个结构一般以运算器为中心,也可以以控制器为中心。
(P51-P54)r1fI4bu。
2.简述计算机体系结构与组成、实现之间的关系。
答:计算机体系结构通常是指程序设计人员所见到的计算机系统的属性,是硬件子系统的结构概念及其功能特性。
计算机组成(computer organization)是依据计算机体系结构确定并且分配了硬件系统的概念结构和功能特性的基础上,设计计算机各部件的具体组成,它们之间的连接关系,实现机器指令级的各种功能和特性。
同时,为实现指令的控制功能,还需要设计相应的软件系统来构成一个完整的运算系统。
计算机实现,是计算机组成的物理实现,就是把完成逻辑设计的计算机组成方案转换为真实的计算机。
计算机体系结构、计算机组成和计算机实现是三个不同的概念,各自有不同的含义,但是又有着密切的联系,而且随着时间和技术的进步,这些含意也会有所改变。
在某些情况下,有时也无须特意地去区分计算机体系结构和计算机组成的不同含义。
(P47-P48)28BoSAn。
3.根据指令系统结构划分,现代计算机包含哪两种主要的体系结构?答:根据指令系统结构划分,现代计算机主要包含:CISC和RISC两种结构。
(P55)4.简述RISC技术的特点?答:从指令系统结构上看,RISC体系结构一般具有如下特点:(1)精简指令系统。
可以通过对过去大量的机器语言程序进行指令使用频度的统计,来选取其中常用的基本指令,并根据对操作系统、高级语言和应用环境等的支持增设一些最常用的指令;hJslBtf。
计算机系统结构教程课后答案
1。
7某台主频为400MHz 的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:指令类型 指令执行数量 平均时钟周期数 整数 45000 1 数据传送 75000 2 浮点 8000 4 分支 1500 2求该计算机的有效CPI 、MIPS 和程序执行时间。
解:1(/)ni i i CPI CPI IC IC ==⨯∑(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (2)MIPS 速率=f/ CPI =400/1。
776 =225。
225MIPS (3)程序执行时间= (45000×1+75000×2+8000×4+1 500×2)/400=575s1.9 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?解:由题可知: 可改进比例Fe=40% = 0。
4 部件加速比Se = 10根据()011 1.5625(10.4)0.4/101n n T S Fe T Fe Se ====-+-+ 1.10 计算机系统中有三个部件可以改进,这三个部件的部件加速比为: 部件加速比1=30; 部件加速比2=20; 部件加速比3=10 (1) 如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?(2) 如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少? 解:(1)在多个部件可改进情况下,Amdahl 定理的扩展:()011231123123n nT S Fe Fe Fe T Fe Fe Fe Se Se Se ==---+++ 已知S1=30,S2=20,S3=10,Sn =10,F1=0。
计算机体系结构1-6章习题答案
1 2 3 4 5 6
8 16 24 32 40 48
1*82
2*82 3*82 4*82 5*82 6*82 7*82
4/8 5/8 6/8
7/8
7
56
2)规格化浮点数表: rm=2时,规格化浮点数共有4*8=32个 rm=8时,规格化浮点数共有7*8=56个,在[0.5,112]中, 有数19个(上表中红的数字表示)。
§4通道(CH)
一、CH的基本工作原理 CH执行CH程序的过程 CH的任务 二、CH流量计算和时空图绘制 CH的类型 CH流量计算 字节多路CH响应处理时空图的绘制 1)计算每个子CH提供一个字节时间(1/f) 2)画出一个完整申请周期时空图 3)计算字节多路CH对每个字节响应的最长用时
第一章参考答案: 1.应用语言级 高级语言级 汇编语言级 操作系统级 机器语言级 微程序语言级。 2. 从上而下 从下到上 专用机 通用机 3. 软、硬件交界面 计算机系统的性能/价格比 4 . 1 T FLOPS 的计 算能力 1 TBy te 的 主存容量 1 TByte/s 的I/O带宽 5. 虚拟机 实际机器 6. 统一高级语言 模拟 仿真 系列机 7. 控制流 数据流 SISD SIMD MISD MIMD 8. 汇编语言程序员 9. 任务单一化 操作重叠化 吞吐匹配化 程序多道 化
嵌套
中断处理程序 一 二 三 响② 嵌套 四 五
t
返回主程序
例4 解 (1)处理顺序为 2-3-1-5-4 (2)中断响应处理时空图 中断请求 主程序 ①③ ②③④⑤
嵌套
中断处理程序 一 二 三 四 五
响① 嵌套
t
返回主程序
1 分别利用两级描述符和三级描述符描述下列阵列数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
习题一1、解释下列术语计算机系统的外特性:通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性,即由他们所看到的计算机的基本属性(概念性结构和功能特性)。
计算机系统的内特性:计算机系统的设计人员所看到的基本属性,本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。
模拟:模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。
可移植性:在新型号机出台后,原来开发的软件仍能继续在升级换代的新型号机器上使用,这就要求软件具有可兼容性,即可移植性。
可兼容性是指一个软件可不经修改或只需少量修改,便可由一台机器移植到另一台机器上运行,即同一软件可应用于不同环境。
Amdahl定律:系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频度或占总执行时间的比例。
虚拟机(Virtual Machine):指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。
6、7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%,为了增强该操作的性能,可采用两种不同的方法:一种是增加专门的硬件,可使求浮点数平方根操作的速度提高为原来的20倍;另一种方法是提高所有浮点运算指令的速度,使其为原来的2倍,而浮点运算指令的执行时间在总执行时间中占30%。
试比较这两种方法哪一种更好些。
答:增加硬件的方法的加速比Sp1=1.23, 另一种方法的加速比Sp2=1.176,经计算可知Sp1=方法更好些。
Sp2>Sp2第一种9、假设高速缓存Cache的工作速度为主存的5倍,且Cache被访问命中的概率T=为90%,则采用Cache能使整个存储系统获得多高的加速比?答:加速比,其中tm=5tc,代入公式、得到加速比S=3.33。
11、Flynn分类法的依据是什么,它与按“并行级”和“流水级”的分类方法有什么不同?答:Flynn分类法的依据是指令流和数据流多倍性概念进行分类的。
而“并行级”和“流水级”的分类方法是根据子系统的并行程度及流水线处理程度进行分类的方法。
13、计算机系统按功能划分,通常分为那几个层次,这种划分方法有什么意义?答:计算机系统按功能可划分成多层次结构,在传统机器级上是操作系统级、汇编语言级、高级语言级和应用语言级,在下面的是微程序机器级以及扩展级电子线路。
这种划分方法的意义是:有助于理解各级语言的实质及实现,分层后,处在某一级虚拟机的程序员只需知道这一级的语言及虚拟机,至于这一级语言如何层次地经翻译或解释直到下面的实际机器级,则无需知道。
习题二1、解释下列术语CPIMIPSMFLOPS基准测试程序性能算术平均值性能几何平均值2、衡量计算机性能的主要标准是什么?为什么它是最可靠的衡量标准?答:衡量计算机系统性能可采用各种尺度,最常用的是时间和速率,但最为可靠的衡量尺度是时间。
例如响应时间、CPU时间等。
由于系统CPU时间很难精确统计,误差较大,故采用用户CPU时间作为衡量时间比较妥当。
但在衡量无负载系统时,采用响应时间比较合适。
用时间来作为计算机的衡量标准直观、准确,适用于各种情况的衡量,所以时间是最可靠的衡量标准。
3、4、计算机持续性能的表示常用哪3种平均值表示?列出他们的公式,并比较它们的优缺点。
答:持续性能(Sustained Performance)的表示常用算术平均(Arithmetic Mean)、几何平均(Geometric Mean)和调和平均(Harmonic Mean)3种平均值方法,其计算公式如下:以上3个公式中Ri表示由n个程序组成的工作负荷中执行第i个程序的速率,Ti表示执行第i个程序所需的时间,这里Ri=1/Ti。
三种方法中Am计算最简单,但不能精确地衡量性能。
Gm运算量大,但它有一个良好的性能,即它的几何平均比和比的几何平均是相等的。
在进行比较时是很方便的。
Hm值是真正与运行所有典型测试程序所需时间总和成反比的,从时间是衡量性能唯一标准来看,用Hm值来衡量计算机系统性能是比较精确的。
习题三1、解释下列术语带标志符的数据:带标志符数据表示(Tagged Data Representation)要求对每一个数据都附加标志符,由标志符来表示后边数据所具有的类型。
数据描述符:数据描述符(Data Descriptors)主要是用来描述复杂和多维数据类型的,例如:向量、矩阵、记录等。
2、3、将下列数转换成IEEE单精度浮点格式,以8位十六进制数表示。
(a)9IEEE单精度浮点格式为0x41100000(b)5/32IEEE单精度浮点格式为0x3E200000(c)-5/32IEEE单精度浮点格式为0xBE200000(d)6.125IEEE单精度浮点格式为0x40C400004、9、将下列的IEEE754单精度数由二进制数转换成十进制数。
(1)1 1000 0011 1100 0000 0000 0000 0000 000十进制数为: -7;(2)0 0111 1110 1010 0000 0000 0000 0000 000十进制数为:0.8125(3)0 1000 0000 0000 0000 0000 0000 0000 000十进制数为:110、11、IEEE745浮点数标准中,为什么要设置非规格化数?答:对于绝对值较小的数,为了避免下溢而损失精度,IEEE754标准允许采用比最小规格化数还要小的那些数,称为非规格化数(Denormal Number)来表示,这是因为使用非规格化数后,就可以表示那些处于0和最小可表示的规格化数之间的数。
习题四1、解释下列术语RISCCISC装载延迟低端排序高端排序延迟转移技术重叠窗口技术4、某计算机有10条指令,它们的使用频率分别为:0.3、0.24、0.16、0.12、0.07、0.04、0.03、0.02、0.01、0.01若用霍夫曼编码对它们的操作码进行编码,其操作码的平均码长其平均编码长度=7*0.01+7*0.01+6*0.02+5*0.03+4*0.04+3*0.07+2*0.24+3*0.12+3*0.16+2*0.3 =2.75、6、某模型机有8条指令,使用频率分别为:0.3、0.3、0.2、0.1、0.05、0.02、0.02、0.01试分别用霍夫曼编码和扩展码对其操作码进行编码,限定扩展编码只有两种长度,则它们的平均编码长度各比定长操作码的平均编码长度减少多少?答:编码如下表:用霍夫曼编码要比定长编码平均长度减少0.62,用霍夫曼扩展编码要比定长编码平均长度减少0.4。
7、8、试叙述比较-转移指令的功能特点,为什么在有的RISC机中要设置这样的指令?答:将比较指令和转移指令合成一条指令后,该指令将直接对两个对象进行相等或不等的比较,然后根据比较结果判别是否执行转移,这样就可以省去一条指令,且不用受条件码的约束。
所以许多典型的RISC机中都采用这样的复合指令。
习题五1、解释下列术语:超长指令字机:(VLIW:Very Long Instruction Word)以一条长指令(或一组指令形式)来实现每个时钟周期发动多个操作的并行执行,以减少对存储器的访问。
超标量机:借助对硬件资源重复设置来实现空间的并行操作。
超级流水机:通过提高流水线的运行速度来增强机器的性能,加深流水深度。
2、3、假设一条指令的解释分为取指、分析和执行3个阶段,每个阶段所需的时间为t取指、t分析、和t执行。
写出用下列几种方式执行100条指令所需的时间通式:6、7、比较阻塞、交叉和同时多线程三者各自的优缺点。
答:在阻塞多线程超标量处理器中,长的阻塞可借助切换到另一线程而得到部分隐藏。
虽然这种方式在每个时钟周期能减少完全闲置的时钟周期的数目,但由于有限的指令级并行性仍将导致闲置周期。
对于交叉多线程的超标量处理器,由于各线程的交叉运行,从而可消除完全空闲的指令发射槽。
但因为在指定的时钟周期中,仅有一个线程发射指令,所以悠闲地指令级并行性仍将导致在各个时钟周期内会有一定数量的闲置发射槽。
在同时多线程的超标量处理器中,线程级并行性和指令级并行性被同时开发,因此在单个时钟周期中,各个指令发射槽可被多个线程使用。
在理想情况下,指令发射槽的闲置数主要受多线程间所需的资源及可用资源间的不平衡约束。
习题六1、解释下列术语:向量流水处理:允许流水线具有较深的流水深度,每条指令相当于一个标量循环,可以交叉访问的处理结构。
屏蔽向量:通过向量测试得到的,采用屏蔽控制技术来控制那些向量元素参加运算,使循环能够向量化。
半性能向量长度:为达到向量流水线最大性能值一半时所需要的向量长度。
2、3、4、向量的加工方法有哪几种,各有什么特点?试从加工速度、需用中间变量等方面加以比较。
答:向量的加工方法有三种:(1)横向加工(2)垂直加工(3)纵横向加工或称为分组加工。
横向加工用到一个暂存单元,出现N次相关和2N次功能转换。
垂直加工一次相关一次切换,但要一个中间暂存向量。
横向加工各组有一次数据相关,2次切换,n个中间向量寄存器单元。
习题七1、解释下列术语:直接映射全相联映射组相联映射虚拟存储器全写法写回法 SAN 2、 3、 4、 5、 1、 2、 4、 5、 6、 10 习题八。