计算机体系结构课后答案

合集下载

(完整版)计算机系统结构课后习题答案

(完整版)计算机系统结构课后习题答案

第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

计算机系统结构课后答案chap2-answer

计算机系统结构课后答案chap2-answer

第二章计算机指令集结构设计名词解释1.堆栈型机器——CPU中存储操作数的单元是堆栈的机器。

2.累加型机器——CPU中存储操作数的单元是累加器的机器。

3.通用寄存器型机器——CPU中存储操作数的单元是通用寄存器的机器。

4.CISC——复杂指令集计算机。

5.RISC——精简指令集计算机。

@2.2堆栈型机器、累加器型机器和通用寄存器型机器各有什么优缺点2.3常见的三种通用寄存器型机器的优缺点各有哪些指令集结构设计所涉及的内容有哪些(1)指令集功能设计:主要有RISC和CISC两种技术发展方向;(2)寻址方式的设计:设置寻址方式可以通过对基准程序进行测试统计,察看各种寻址方式的使用频度,根据适用频度设置相应必要的寻址方式;(3)操作数表示和操作数类型:主要的操作数类型和操作数表示的选择有,浮点数据类型(可以采用IEEE 754标准)、整型数据类型(8位、16位、32位的表示方法)、字符型(8位)、十进制数据类型(压缩十进制和非压缩十进制数据表示)等等。

(4)寻址方式的表示:可以将寻址方式编码与操作码中,也可将寻址方式作为一个单独的域来表示。

(5)((6)指令集格式的设计:有固定长度编码方式、可变长编码方式和混合编码方式三种选择。

简述CISC计算机结构指令集功能设计的主要目标。

从当前的计算机技术观点来看,CISC结构有什么缺点CISC结构追求的目标是强化指令功能,减少程序的指令条数,以达到提高性能的目的。

从目前的计算机技术观点来看,CISC结构存在以下几个缺点:(1)在CISC结构的指令系统中,各种指令的使用频率相差悬殊。

(2)CISC结构的指令系统的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。

(3)CISC结构的指令系统的复杂性给VLSI设计带来了很大负担,不利于单片集成。

(4)CISC结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。

(5)^(6)在结构的指令系统中,由于各条指令的功能不均衡性,不利于采用先进的计算机体系结构技术(如流水技术)来提高系统的性能。

计算机体系结构答案

计算机体系结构答案

计算机体系结构答案2021 福师网院一、填空题(每空1分,共14分)1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相联方式。

2. 虚拟存储器的三种管理方式是段式管理,页式管理和段页式管理。

3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量。

4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为RAW 、WAR 和WAW 三种类型。

5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容。

二、名词解释(每题2分,共16分)计算机体系结构:答:计算机体系结构包括指令集结构、计算机组成和计算机实现三个方面的内容。

兼容机:答:不同厂家生产的具有相同计算机结构的计算机;系列机:同一厂家生产的具有相同计算机结构,但具有不同组成和实现的一系列不同档次不同型号的机器;写直达法:答:执行“写”操作时,不仅写入Cache,而且也写入下一级存储器。

高速缓冲存储器:答:为解决CPU与主存储器间速度差而在内存储器和CPU之间增加的一种存取速度远高于普通内存的特殊存储器。

延迟转移技术:答:为了使指令流水线不断流,在转移指令之后插入一条不相关的有效的指令,而转移指令被延迟执行,这种技术称为延迟转移技术。

线性流水线:答:指各段串行连接、没有反馈回路的流水线。

数据通过流水线中的各段时,每一个段最多只流过一次;非线性流水线:指各段除了有串行的连接外,还有反馈回路的流水线。

流水线的吞吐率:答:在单位时间内流水线所完成的任务数量或输出结果的数量。

并行性:答:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。

只要在时间上相互重叠,就存在并行性。

它包括同时性与并发性两种含义。

三、简答题(每题5分,共30分)1. 如有一个经解释实现的计算机,可以按功能划分成4级。

每一级为了执行一条指令需要下一级的N条指令解释。

计算机体系结构 习题与答案

计算机体系结构 习题与答案

第二章习题(P69-70)一、复习题1.简述冯∙诺依曼原理,冯∙诺依曼结构计算机包含哪几部分部件,其结构以何部件为中心?答:冯∙诺依曼理论的要点包括:指令像数据那样存放在存储器中,并可以像数据那样进行处理;指令格式使用二进制机器码表示;用程序存储控制方式工作。

这3条合称冯∙诺依曼原理冯∙诺依曼计算机由五大部分组成:运算器、控制器、存储器、输入设备、输出设备,整个结构一般以运算器为中心,也可以以控制器为中心。

(P51-P54)2.简述计算机体系结构与组成、实现之间的关系。

答:计算机体系结构通常是指程序设计人员所见到的计算机系统的属性,是硬件子系统的结构概念及其功能特性。

计算机组成(computer organization)是依据计算机体系结构确定并且分配了硬件系统的概念结构和功能特性的基础上,设计计算机各部件的具体组成,它们之间的连接关系,实现机器指令级的各种功能和特性。

同时,为实现指令的控制功能,还需要设计相应的软件系统来构成一个完整的运算系统。

计算机实现,是计算机组成的物理实现, 就是把完成逻辑设计的计算机组成方案转换为真实的计算机。

计算机体系结构、计算机组成和计算机实现是三个不同的概念,各自有不同的含义,但是又有着密切的联系,而且随着时间和技术的进步,这些含意也会有所改变。

在某些情况下,有时也无须特意地去区分计算机体系结构和计算机组成的不同含义。

(P47-P48)3.根据指令系统结构划分,现代计算机包含哪两种主要的体系结构?答:根据指令系统结构划分,现代计算机主要包含:CISC和RISC两种结构。

(P55)4.简述RISC技术的特点?答:从指令系统结构上看,RISC 体系结构一般具有如下特点:(1) 精简指令系统。

可以通过对过去大量的机器语言程序进行指令使用频度的统计,来选取其中常用的基本指令,并根据对操作系统、高级语言和应用环境等的支持增设一些最常用的指令;(2) 减少指令系统可采用的寻址方式种类,一般限制在2或3种;(3) 在指令的功能、格式和编码设计上尽可能地简化和规整,让所有指令尽可能等长;(4) 单机器周期指令,即大多数的指令都可以在一个机器周期内完成,并且允许处理器在同一时间内执行一系列的指令。

第3章计算机网络体系结构(习题参考答案)

第3章计算机网络体系结构(习题参考答案)

第3章计算机网络体系结构三、简答题1. 为什么要采用分层的方法解决计算机的通信问题?通过分层的方法,使得计算机网络复杂的通信处理问题转化成为若干相对较小的层次内的局部问题,对其进行的研究和处理变得相对容易。

2. “各层协议之间存在着某种物理连接,因此可以进行直接的通信。

”这句话对吗?不对。

物理连接只存在于最底层的下面。

各层协议之间只存在着称为“对等层通信”的逻辑连接。

3. 请简要叙述服务与协议之间的区别。

通过协议的规定,下一层可以为上一层提供服务,但是对于上一层的服务用户来说下面的协议是透明的。

协议是存在于对等层之间的,是水平的;服务存在于直接相邻的两个层次之间,是垂直的。

4. 请描述一下通信的两台主机之间通过OSI模型进行数据传输的过程。

发送数据的具体过程为:要进行通信的源用户进程首先将要传输的数据送至应用层并由该层的协议根据协议规范进行处理,为用户数据附加上控制信息后形成应用层协议数据单元再送至表示层;表示层根据本层的协议规范对收到的应用层协议数据单元进行处理,给应用层协议数据单元附加上表示层的控制信息后形成表示层的协议数据单元再将它传送至下一层。

数据按这种方式逐层向下传送直至物理层,最后由物理层实现比特流形式的传送。

当比特流沿着传输介质经过各种传输设备后最终到达了目标系统。

此后,接收数据的具体过程为:按照发送数据的逆过程,比特流从物理层开始逐层向上传送,在每一层都按照该层的协议规范以及数据单元的控制信息完成规定的操作,而后再将本层的控制信息剥离,并将数据部分向上一层传送,依此类推直至最终的、通信的目的用户进程。

5. 请简述虚电路服务的特点。

虚电路服务要求发送分组之前必须建立连接,即虚电路。

之后所有的分组都沿着虚电路依次进行传送。

在所有分组传送完毕后要释放连接。

它可以提供顺序、可靠的分组传输,适用于长报文的通信,一般应用于稳定的专用网络。

6. 请简述无连接服务的特点。

无连接服务无需事先建立连接。

计算机体系结构课后答案

计算机体系结构课后答案

计算机体系结构课后答案【篇一:计算机体系结构习题(含答案)】1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。

对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。

(1)最大尾数(8)最小正数(2)最小正尾数(9)最大负数(3)最小尾数(10)最小负数(4)最大负尾数(11)浮点零(5)最大阶码(12)表数精度(6)最小阶码(13)表数效率(7)最大正数(14)能表示的规格化浮点数个数2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。

尾数用原码、纯小数表示,阶码用移码、整数表示。

(1) 设计这种浮点数的格式(2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。

3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。

(1) 选择合适的舍入方法。

(2) 确定警戒位位数。

(3) 计算在正数区的误差范围。

4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。

b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。

如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。

对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。

(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。

6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为6位。

计算机系统结构__《张晨曦、王志英》课后习题参考答案

计算机系统结构__《张晨曦、王志英》课后习题参考答案

第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

计算机系统结构(高教版)张晨曦 习题答案 第二章

计算机系统结构(高教版)张晨曦 习题答案 第二章

2.1 解释下列术语:堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。

累加型机器——CPU 中存储操作数的单元是累加器的机器。

通用寄存器型机器——CPU 中存储操作数的单元是通用寄存器的机器。

CISC——复杂指令集计算机。

RISC——精简指令集计算机。

寻址方式:一种指令集结构如何确定所要访问的数据的地址。

数据表示:指计算机硬件能够直接识别、指令集可以直接调用的数据类型。

2.4 指令集应满足那几个基本要求?(书P32-33)答:对指令集的基本要求是:完整性、规整性、高效率和兼容性。

完整性:指在一个有限可用的存储空间内,对于任何可解的问题,编制计算程序时,指令集所提供的指令够用。

完整性要求指令集功能齐全、使用方便。

规整性:主要包括对称性和均匀性。

对称性是指所有与指令集有关的存储单元的使用、操作码的设置等都是对称的。

均匀性是指对于各种不同的操作数类型、字长、操作种类和数据存储单元,指令的设置都要同等对待。

高效率:指令的执行速度快、使用频率高。

在RISC机体系结构中,大多数指令都能在一个节拍内完成,而且只设置使用频率高的指令。

兼容性:系列机各机种之间具有相同的基本结构和共同的基本指令集,因而,指令系统是兼容的,即各机种上基本软件可以通用。

2.5 指令集结构设计所涉及的内容有哪些?答:1)指令集功能设计:主要有RISC和CISC两种技术发展方向;2)寻址方式的设计:设置寻址方式可以通过对基准程序进行测试统计,查看各种寻址方式的使用频度,根据使用频度设置相应必要的寻址方式;3)操作数表示和操作数类型:主要的操作数类型和操作数表示的选择有浮点数据类型(可以采用IEEE754标准)、整形数据类型(8位、16位、32位的表示方法)、字符类型(8位)、十进制数据类型(压缩十进制和非压缩十进制数据表示)等等;4)寻址方式的表示:可以将寻址方式编码与操作码中,也可将寻址方式作为一个单独的域来表示;5)指令集格式的设计:有固定长度编码方式、可变长编码方式和混合编码方式三种选择。

计算机体系结构习题答案

计算机体系结构习题答案

一、(5分)计算机系统设计中经常使用的4个定量原理是什么?请简要说明它们的含义。

答:(1)以经常性事件为重点。

在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。

(2)Amdahl 定律。

加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

(3)CPU 性能公式。

执行一个程序所需的CPU 时间 = IC ×CPI ×T 。

(4)程序的局部性原理。

程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

二、(15分)假设某应用程序中有4类操作,通过改进各类操作的功能部件,可(2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少? 答:根据Amdahl 定律aff S n +-=)1(1,其中f 是可改进部分在总运行时间中所占比例,a 是可改进部分的加速比,可得4类操作均改进后,整个程序的加速比:11.77(1)n ii iS FF S =≈-+∑∑三、(5分)请简述指令之间数据冲突的类型。

答:指令之间的数据冲突有3种类型:真相关、反相关、输出相关。

真相关(数据依赖,有时候也称为数据相关):考虑两条指令i 和j ,i 在j 的前面,指令k 在指令i 和指令j 之间。

如果下述条件之一成立,则称指令j 与指令i 真相关:(1)指令j 使用指令i 产生的结果(写后读);(2)指令j 与指令k 真相关,而指令k 又与指令i 真相关。

(真相关的传递性) 反相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 所写的名与指令i 所读的寄存器名或存储地址相同,则称指令i 和j 发生了反相关。

(读后写)输出相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 和指令i 所写的寄存器名或存储地址相同,则称指令i 和j 发生了输出相关。

(写后写) 其中反相关和输出相关又合称名相关。

第3章 计算机网络体系结构(习题标准答案)

第3章 计算机网络体系结构(习题标准答案)

第3章计算机网络体系结构(习题答案)————————————————————————————————作者:————————————————————————————————日期:2第3章计算机网络体系结构一、填空题1.协议主要由(语法)、(语义)和(同步)三个要素组成。

2.OSI模型分为(物理层)、(数据链路层)、(网络层)、(传输层)、(会话层)、(表示层)和(应用层)七个层次。

3.OSI模型分为(资源子网)和(通信子网)两个部分。

4.物理层定义了(机械特性)、(电气特性)、(功能特性)和(规程特性)四个方面的内容。

5.数据链路层处理的数据单位称为(帧)。

6.数据链路层的主要功能有(链路管理)、(成帧)、(信道共享)、(帧同步)、(流量控制)、(差错控制)、(透明传输)和(寻址)。

7.在数据链路层中定义的地址通常称为(硬件地址)或(物理地址)。

8.网络层所提供的服务可以分为两类:(面向连接的)服务和(无连接的)服务。

9.传输层的功能包括(服务选择)、(连接管理)、(流量控制)、(拥塞控制)和(差错控制)等。

二、名词解释同步协议实体对等层对等层通信服务 CIDR 协议数据单元服务数据单元同步同步指的是广义的、在一定条件下发生什么事情的特性,而且条件和时间有关,具有时序的含义。

协议计算机网络中意图进行通信的结点必须要遵守一些事先约定好的规则。

这些为进行数据交换而建立的规则、标准或约定即称为协议,也称为网络协议。

实体任何接收或者发送数据的硬件单元或者软件进程模块都可以称为通信实体,简称实体。

对等层不同的网络结点,若它们遵循的是同一种网络体系结构的话,那么在不同结点上完成同样功能的层次称为对等层。

对等层通信在分层的网络体系结构中,每个层次只知道自己从上层接收来数据并处理后再传递给下一层,结果通信目的方该层次的对等层就收到与己方处理的一模一样的数据。

就好像在两个对等层之间有一条“通道”直接把数据传送过去一样,这种情况就称为对等层通信。

计算机系统结构答案

计算机系统结构答案

一、选择题1、对汇编语言程序员,下列(A )不是透明的。

A: 中断字寄存器 B: 乘法器 C: 移位器 D: 指令缓冲器2、假设对A机器指令系统的每条指令的解释执行可直接由B机器的一段微程序解释执行,则A称为(D )。

A: 仿真机 B: 宿主机 C: 虚拟机 D: 目标机3、 1. 查看下面三条指令:V3←A;V2←V0+V1;V4←V2*V3;假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。

三条指令全部采用串行的方法,那么执行的时间是:A: 3N+20 B: 3N+21 C: 3N+22 D: 3N+234、某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。

采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停的情况下,接着计算(D+E)*F。

求此链接流水线的通过时间是多少拍?(设寄存器出入各需1拍)A: 8 B: 9 C: 17 D: 185、设有一个4个处理器的MIMD系统,假设在系统中访存取指和取数的时间可以忽略不计;加法与乘法分别需要2拍和4拍;在MIMD系统中处理器(机)之间每进行一次数据传送的时间为1拍;在MIMD系统中,每个PE都可以和其它PE有直接的的通路。

求利用此系统计算表达式所需的节拍数。

A: 23 B: 12 C: 11 D: 106、以下哪些是周期窃取方式的特点?A : 硬件结构简单B : 硬件结构复杂C : 数据输入或输出过程中占用了CPU时间D : 数据输入或输出过程中不占用CPU时间7、从下列有关Cache的描述中,选出应填入空格中的正确答案:(1)今有甲、乙两台计算机,甲计算机的Cache存取时间为50ns,主存储器为2us;乙计算机的Cache存储时间为100ns,主存储器为1.2us。

计算机体系结构课后答案和复习

计算机体系结构课后答案和复习

第一章计算机体系结构的基本概念1.1名词解释:2.翻译——(基于层次结构)先把N+1级程序全部变换成N级程序之后,再去执行N级程序,在执行过程中,N+1级程序不再被访问。

3.解释——每当一条N+1级指令被译码后,就直接去执行一串等效的N级指令,然后再去取下一条N+1级指令,依此重复执行。

4.体系结构——程序员所看到的计算机的属性,即概念性结构与功能特性。

5.透明性——在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的概念称为透明性。

6.系列机——在一个厂家生产的具有相同的体系结构,但具有不同的组成和实现的一系列不同型号的机器。

7.软件兼容——同一个软件可以不加修改地运行于体系结构相同的各档机器上,而且它们所获得的结果一样,差别只在于运行的时间不同。

8.兼容机——不同厂家生产的、具有相同体系结构的计算机。

9.计算机组成——计算机体系结构的逻辑实现。

10.计算机实现——计算机组成的物理实现。

11.存储程序计算机(冯·诺依曼结构)——采用存储程序原理,将程序和数据存放在同一存储器中。

指令在存储器中按其执行顺序存储,由指令计数器指明每条指令所在的单元地址。

12.并行性——在同一时刻或同一时间间隔内完成两种或两种以上性质相同或不同的工作。

13.时间重叠——在并行性中引入时间因素,即多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。

14.资源重复——在并行性中引入时间因素,是根据“以数量取胜”的原则,通过重复设置资源,尤其是硬件资源,大幅度提高计算机系统的性能。

15.资源共享——是一种软件方法,它使多个任务按一定的时间顺序轮流使用同一套硬件设备。

16.同构型多处理机——由多个同种类型、至少同等功能的处理机组成、同时处理同一作业中能并行执行的多个任务的机器。

17.异构型多处理机——由多个不同类型、功能不同的处理机组成、串行完成同一作业中不同任务的机器。

计算机系统结构课后答案chap2-answer

计算机系统结构课后答案chap2-answer

第二章计算机指令集结构设计2.1 名词解释1.堆栈型机器——CPU中存储操作数的单元是堆栈的机器。

2.累加型机器——CPU中存储操作数的单元是累加器的机器。

3.通用寄存器型机器——CPU中存储操作数的单元是通用寄存器的机器。

4.CISC——复杂指令集计算机。

5.RISC——精简指令集计算机。

2.2堆栈型机器、累加器型机器和通用寄存器型机器各有什么优缺点?2.3常见的三种通用寄存器型机器的优缺点各有哪些?2.4 指令集结构设计所涉及的内容有哪些?(1)指令集功能设计:主要有RISC和CISC两种技术发展方向;(2)寻址方式的设计:设置寻址方式可以通过对基准程序进行测试统计,察看各种寻址方式的使用频度,根据适用频度设置相应必要的寻址方式;(3)操作数表示和操作数类型:主要的操作数类型和操作数表示的选择有,浮点数据类型(可以采用IEEE 754标准)、整型数据类型(8位、16位、32位的表示方法)、字符型(8位)、十进制数据类型(压缩十进制和非压缩十进制数据表示)等等。

(4)寻址方式的表示:可以将寻址方式编码与操作码中,也可将寻址方式作为一个单独的域来表示。

(5)指令集格式的设计:有固定长度编码方式、可变长编码方式和混合编码方式三种选择。

2.5 简述CISC计算机结构指令集功能设计的主要目标。

从当前的计算机技术观点来看,CISC结构有什么缺点?CISC结构追求的目标是强化指令功能,减少程序的指令条数,以达到提高性能的目的。

从目前的计算机技术观点来看,CISC结构存在以下几个缺点:(1)在CISC结构的指令系统中,各种指令的使用频率相差悬殊。

(2)CISC结构的指令系统的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。

(3)CISC结构的指令系统的复杂性给VLSI设计带来了很大负担,不利于单片集成。

(4)CISC结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。

计算机体系结构第4章答案

计算机体系结构第4章答案

1、循环体2、循环级并行性3、指令调度循环展开4、写后读控制相关5、编译器动态6、不同的寄存器测试分支7、互锁二名词解释四、指令级并行*(3个)1、名相关:名相关不能改变指令顺序,但由于没有数据流,但可以通过改变操作数名来消除名相关,称为重命名(renaming)技术。

2、循环展开:通过多次复制循环体(并改变循环结束条件)来减少循环控制对性能的影响(循环控制指令以及控制相关引起的停顿)。

3、指令调度:通过改变指令在程序中的位置,将相关指令之间的距离加大到不小于指令执行延迟的时钟数,使相关指令成为实际上的无关指令。

四简答题1、循环展开和指令调度需注意哪几方面问题?答:指令调度:通过改变指令在程序中的位置,将相关指令之间的距离加大到不小于指令执行延迟的时钟数,使相关指令成为实际上的无关指令。

循环展开:通过多次复制循环体(并改变循环结束条件)来减少循环控制对性能的影响(循环控制指令以及控制相关引起的停顿)。

循环展开+指令调度要注意这几方面问题:(1)正确性(主要是循环控制和操作数偏移量修改)(2)有效性(主要是不同循环次之间的无关性)(3)使用不同的寄存器(避免冲突)(4)尽可能减少循环控制中的测试和分支(5)注意对存储器数据的相关性分析(6)注意新的相关性关键:要分析清指令之间存在怎样的相关性以及在这种相关性下指令应该如何被修改和调度。

2、指令的静度调度和动态调度有哪些区别?答:指令的静度调度和动态调度的目的都是消除或者减少空转,它们的实现原理不同。

静态调度首先由编译器确定并分离出程序中存在的相关指令,然后进行指令调度,并对代码进行优化;指令的动态高度通过硬件重新安排指令的执行顺序,来调整相关指令实际执行时的关系,养活处理器空转,它可以处理一些编译时未发现的相关(比如涉及存储器访问的相关),从而简化了编译器。

指令的动态调度技术是以硬件复杂性的显著增加来换取的。

1、对于下面的源代码,转换成DLX汇编语言,在不进行指令调度和进行指令调度两种情况下,分析代码一次循环的执行时间。

计算机系统结构课后习题答案

计算机系统结构课后习题答案

计算机系统结构基本习题和答案填空题1、从(使用语言的)角度可以将系统看成是按(功能)划分的多个机器级组成的层次结构。

2、计算机系统结构的层次结构由高到低分别为(应用语言机器级,高级语言机器级,汇编语言机器级,操作系统机器级,传统机器语言机器级,微程序机器级)。

3、应用程序语言经(应用程序包)的(翻译)成高级语言程序。

4、高级语言程序经(编译程序)的(翻译)成汇编语言程序。

5、汇编语言程序经(汇编程序)的(翻译)成机器语言程序。

6、在操作系统机器级,一般用机器语言程序(解释)作业控制语句。

7、传统机器语言机器级,是用(微指令程序)来(解释)机器指令。

8、微指令由(硬件)直接执行。

9、在计算机系统结构的层次结构中,机器被定义为(能存储和执行相应语言程序的算法和数据结构)的集合体。

10、目前M0由(硬件)实现,M1用(微程序(固件))实现,M2到M5大多用(软件)实现。

以(软件)为主实现的机器成为虚拟机。

(虚拟机)不一定全用软件实现,有些操作也可用(固件或硬件)实现。

11、透明指的是(客观存在的事物或属性从某个角度看不到),它带来的好处是(简化某级的设计),带来的不利是(无法控制)。

12、计算机系统结构也称(计算机体系结构),指的是(传统机器级的系统结构)。

它是(软件和硬件/固件)的交界面,是机器语言汇编语言程序设计者或编译程序设计者看到的(机器物理系统)的抽象。

13、计算机组成指的是(计算机系统结构的逻辑实现),包括(机器级内的数据流和控制流)的组成及逻辑设计等。

计算机实现指的是(计算机组成的物理实现),它着眼于(器件)技术和(微组装)技术。

14、确定指令系统中是否要设乘法指令属于(计算机系统结构),乘法指令是用专门的高速乘法器实现还是用加法器实现属于(计算机组成),乘法器和加法-移位器的物理实现属于(计算机实现)。

15、主存容量与编址方式的确定属于(计算机系统结构),主存是否采用多体交叉属于(计算机组成),主存器件的选定属于(计算机实现)。

体系结构课后习题答案

体系结构课后习题答案

体系结构课后习题答案3.某模型机有10条指令I1~I10,它们的使⽤频度分别为0.3,0.24,0.16,0.12,0.07,0.04,0.03,0.02,0.01,0.01。

(1)计算采⽤等长操作码表⽰时的信息冗余量。

(2)要求操作码的平均长度最短,试设计操作码的编码,并计算所设计操作码的平均长度。

(3)只有⼆种码长,试设计平均码长最短的扩展操作码编码并计算平均码长。

(4)只有⼆种码长,试设计平均码长最短的等长扩展码编码并计算平均码长。

3.(1)采⽤等长操作码表⽰时的信息冗余量为33.5%。

(2)操作码的Huffman编码法如表2.2所⽰,此种编码的平均码长为2.7位。

表2.2 操作码的Huffman编码法、2-5扩展码和2-4等长扩展码编码法(3)操作码的2-5扩展码编码法如表2.2所⽰,此种编码的平均码长为2.9位。

(4)操作码的2-4等长扩展码编码法如表2.2所⽰,此种编码的平均码长为2.92位。

5.若某机设计有如下格式的指令:三地址指令12种,⼀地址指令254种,设指令字的长度为16位,每个地址码字段的位数均为4位。

若操作码的编码采⽤扩展操作码,问⼆地址指令最多可以设计多少种?5.⼆地址指令最多可以设计48种。

6.⼀台模型机共有9条指令I1~I9,各指令的使⽤频度分别为30%,20%,20%,10%,8%,6%,3%,2%,1%。

该模型机有8位和16位两种指令字长。

8位字长指令为寄存器-寄存器(R-R)⼆地址类型,16位字长指令为寄存器-存储器(R-M)⼆地址变址寻址类型。

(1)试设计有⼆种码长的扩展操作码,使其平均码长最短,并计算此种编码的平均码长。

(2)在(1)的基础上,该机允许使⽤多少个可编址的通⽤寄存器?(3)若采⽤通⽤寄存器作为变址寄存器,试设计该机的两种指令格式,并标出各字段的位数。

(4)计算变址寻址的偏移地址范围。

6.(1)操作码的2-5扩展码编码法如表2.3所⽰,此种编码的平均码长为2.9位。

计算机体系结构习题(含答案)

计算机体系结构习题(含答案)

第2章课后习题1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6〔不包括符号位〕,阶码字长q=6〔不包括符号位〕,为数基值r m=16,阶码基值r e=2。

对于规格化浮点数,用十进制表达式写出如下数据〔对于前11项,还要写出16进值编码〕。

〔1〕最大尾数〔8〕最小正数〔2〕最小正尾数〔9〕最大负数〔3〕最小尾数〔10〕最小负数〔4〕最大负尾数〔11〕浮点零〔5〕最大阶码〔12〕表数精度〔6〕最小阶码〔13〕表数效率〔7〕最大正数〔14〕能表示的规格化浮点数个数2.一台电脑系统要求浮点数的精度不低于10,表数范围正数不小于1038,且正、负数对称。

尾数用原码、纯小数表示,阶码用移码、整数表示。

(1) 设计这种浮点数的格式(2) 计算〔1〕所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。

3.某处理机要求浮点数在正数区的积累误差不大于2-p-1,其中,p是浮点数的尾数长度。

(1) 选择合适的舍入方法。

(2) 确定警戒位位数。

(3) 计算在正数区的误差范围。

4.假设有A和B两种不同类型的处理机,A处理机中的数据不带标志符,其指令字长和数据字长均为32位。

B处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。

如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。

对于一个由1000条指令组成的程序,分别计算这个程序在A处理机和B处理机中所占用的存储空间大小〔包括指令和数据〕,从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。

(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。

(2) 设计8字长的寄存器-寄存器型指令3条,16位字长的寄存器-存储器型变址寻址方式指令4条,变址范围不小于±127。

计算机组成与体系结构赵姝版课后答案

计算机组成与体系结构赵姝版课后答案

计算机组成与体系结构赵姝版课后答案1.微程序控制器中,机器指令与微指令的关系是B A.每条机器指令由一条微指令米执行B.每一条机器指令由一段由微指令编程的微程序米解释执行C.一段机器指令组成的程序可由一条微指令来执行D.一条微指令由若干个机器指令组成2.控制器的同步控制方式是指C A只适用于CPU控制的方式B.只适用于外围设备控制的方式C.由统一时序信号控制的方式D.所有指令执行的时间都相同的方式3.关于硬布线控制与微程序控制的描述不正确的是B A.微程序控制电路规整,应用广泛B.硬布线控制设计复杂,易于修改C.指令系统复杂的计算机,一般采用微程序控制D.在超高速机器中,对影响速度的关键部分(如CPU)往往采用硬布线控制4.下列关于RISC的叙述中,错误的是A A.RISC普遍采用微程序控制器B.RISC大多数指令在-个时钟周期内完成C.RISC的内部通用寄存器数量相对CISC多D.RISC的指令数、寻址方式和指令格式种类相对CISC少5.下列不会引起指令流水阻塞的是A A.数据旁路B.数据相关C.条件转移D.资源冲突。

6.某CPU结构如下图所示,其中有一个累加寄存器AC、一个状态寄存器PSR和其他四个寄存器,各部分之间的连线表示数据通路,箭头表示信息传送方向。

(1)标明图中四个寄存器的名称:(2)简述指令从卞存取到控制器的数据通路:(3)简述数据在运算器和主存之间逃行存/取访问的数据通路。

答:(1)a-数据寄存器DR,b-指令寄存器IR,c-地址寄存器AR,d-程序计数器PC(2)M→DR→IR→控制器(3)存:运算器·AC→DR→M:取:M→DR→运算器7.某机采用微程序控制方式,微指令字长为32位,微指令采用水平型格式(含微指令字段、判别测试字段、下址字段三部分),控制微程序转移条件4个(直接控制),共有56个微命令,构成五组互斥类,各包含6个、8个、14个、3个、25个微命令(1)设计出微指令的具体格式:(2)控制存储器的容量应为多少。

计算机系统结构__《张晨曦、王志英》课后习题参考答案

计算机系统结构__《张晨曦、王志英》课后习题参考答案

计算机系统结构__《张晨曦、王志英》课后习题参考答案第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

计算机体系结构1-6章习题答案

计算机体系结构1-6章习题答案

1 2 3 4 5 6
8 16 24 32 40 48
1*82
2*82 3*82 4*82 5*82 6*82 7*82
4/8 5/8 6/8
7/8
7
56
2)规格化浮点数表: rm=2时,规格化浮点数共有4*8=32个 rm=8时,规格化浮点数共有7*8=56个,在[0.5,112]中, 有数19个(上表中红的数字表示)。
§4通道(CH)
一、CH的基本工作原理 CH执行CH程序的过程 CH的任务 二、CH流量计算和时空图绘制 CH的类型 CH流量计算 字节多路CH响应处理时空图的绘制 1)计算每个子CH提供一个字节时间(1/f) 2)画出一个完整申请周期时空图 3)计算字节多路CH对每个字节响应的最长用时
第一章参考答案: 1.应用语言级 高级语言级 汇编语言级 操作系统级 机器语言级 微程序语言级。 2. 从上而下 从下到上 专用机 通用机 3. 软、硬件交界面 计算机系统的性能/价格比 4 . 1 T FLOPS 的计 算能力 1 TBy te 的 主存容量 1 TByte/s 的I/O带宽 5. 虚拟机 实际机器 6. 统一高级语言 模拟 仿真 系列机 7. 控制流 数据流 SISD SIMD MISD MIMD 8. 汇编语言程序员 9. 任务单一化 操作重叠化 吞吐匹配化 程序多道 化
嵌套
中断处理程序 一 二 三 响② 嵌套 四 五
t
返回主程序
例4 解 (1)处理顺序为 2-3-1-5-4 (2)中断响应处理时空图 中断请求 主程序 ①③ ②③④⑤
嵌套
中断处理程序 一 二 三 四 五
响① 嵌套
t
返回主程序
1 分别利用两级描述符和三级描述符描述下列阵列数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章存储层次5.1名词解释1.存储层次——采用不同的技术实现的存储器,处在离CPU不同距离的层次上,目标是达到离CPU 最近的存储器的速度,最远的存储器的容量。

2.全相联映象——主存中的任一块可以被放置到Cache中任意一个地方。

3.直接映象——主存中的每一块只能被放置到Cache中唯一的一个地方。

4.组相联映象——主存中的每一块可以放置到Cache中唯一的一组中任何一个地方(Cache分成若干组,每组由若干块构成)。

5.替换算法——由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。

这时,需要被迫腾出其中的某一块,以接纳新调入的块。

6.L RU——选择最近最少被访问的块作为被替换的块。

实际实现都是选择最久没有被访问的块作为被替换的块。

7.写直达法——在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。

8.写回法——只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。

9.按写分配法——写失效时,先把所写单元所在的块调入Cache,然后再进行写入。

10.不按写分配法——写失效时,直接写入下一级存储器中,而不把相应的块调入Cache。

11.写合并——在往缓冲器写入地址和数据时,如果缓冲器中存在被修改过的块,就检查其地址,看看本次写入数据的地址是否和缓冲器内某个有效块的地址匹配。

如果匹配,就将新数据与该块合并。

12.命中时间——访问Cache命中时所用的时间。

13.失效率——CPU访存时,在一级存储器中找不到所需信息的概率。

14.失效开销——CPU向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。

15.强制性失效——当第一次访问一个块时,该块不在Cache中,需要从下一级存储器中调入Cache,这就是强制性失效。

16.容量失效——如果程序在执行时,所需要的块不能全部调入Cache中,则当某些块被替换后又重新被访问,就会产生失效,这种失效就称作容量失效。

17.冲突失效——在组相联或直接映象Cache中,若太多的块映象到同一组(块)中,则会出现该组中某个块被别的块替换(即使别的组或块有空闲位置),然后又被重新访问的情况。

18.2:1Cache经验规则——大小为N的直接映象Cache的失效率约等于大小为N /2的两路组相联Cache 的实效率。

19.相联度——在组相联中,每组Cache中的块数。

20.Victim Cache——位于Cache和存储器之间的又一级Cache,容量小,采用全相联策略。

用于存放由于失效而被丢弃(替换)的那些块。

每当失效发生时,在访问下一级存储器之前,先检查Victim Cache中是否含有所需块。

21.伪相联Cache——一种既能获得多路组相联Cache的低失效率,又能获得直接映象Cache的命中速度的相联办法。

22.故障性预取——在预取时,若出现虚地址故障或违反保护权限,就会发生异常。

23.非故障性预取——在预取时,若出现虚地址故障或违反保护权限,不发生异常。

24.非阻塞Cache——Cache在等待预取数据返回时,还能继续提供指令和数据。

25.子块放置技术——把一个Cache块划分为若干小块,称为子块(sub-blocks),并为每个子块赋予一位有效值,用于说明该子块中的数据是否有效。

失效时,只需从下一级存储器调入一个子块。

26.尽早重启动——在请求字没有到达时,CPU处于等待状态。

一旦请求字到达,就立即发送给CPU,让等待的CPU尽早重启动,继续执行。

27.请求字优先——调块时,首先向存储器请求CPU所要的请求字。

请求字一旦到达,就立即送往CPU,让CPU继续执行,同时从存储器调入该块的其余部分。

28.多级包容性——一级存储器(Cache)中的数据总位于下一级存储器中。

29.虚拟Cache——地址使用虚地址的Cache。

30.多体交叉技术——具有多个存储体,各体之间按字交叉的存储技术。

31.存储体冲突——多个请求要访问同一个体。

32.TLB——一个专用高速存储器,用于存放近期经常使用的页表项,其内容是页表部分内容的一个副本。

5.3 降低Cache失效率有哪几种方法?简述其基本思想。

常用的降低Cache失效率的方法有下面几种:(1)增加Cache块大小。

增加块大小利用了程序的空间局部性。

(2)提高相联度,降低冲突失效。

(3)Victim Cache,降低冲突失效。

(4)伪相联Cache,降低冲突失效。

(5)硬件预取技术,指令和数据都可以在处理器提出访问请求前进行预取。

(6)由编译器控制的预取,硬件预取的替代方法,在编译时加入预取的指令,在数据被用到之前发出预取请求。

(7)编译器优化,通过对软件的优化来降低失效率。

5.4简述减小Cache失效的几种方法。

(1)让读失效优先于写。

(2)子块放置技术。

(3)请求字处理技术。

(4)非阻塞Cache技术。

(5)采用两级Cache、5.5通过编译器对程序优化来改进Cache性能的方法有哪几种?简述其基本思想。

(1)数组合并,通过提高空间局部性来减少失效次数。

有些程序同时用相同的索引来访问若干个数组的同一维,这些访问可能会相互干扰,导致冲突失效,可以将这些相互独立的数组合并成一个复合数组,使得一个Cache块中能包含全部所需元素。

(2)内外循环交换。

循环嵌套时,程序没有按数据在存储器中的循序访问。

只要简单地交换内外循环,就能使程序按数据在存储器中的存储循序进行访问。

(3)循环融合。

有些程序含有几部分独立的程序断,它们用相同的循环访问同样的数组,对相同的数据作不同的运算。

通过将它们融合成一个单一循环,能使读入Cache的数据被替换出去之前得到反复的使用。

(4)分块。

通过改进时间局部性来减少失效。

分块不是对数组的整行或整列进行访问,而是对子矩阵或块进行操作。

5.6 在“Cache—主存”层次中,主存的更新算法有哪几种??它们各有什么特点?(1)写直达法易于实现,而且下一级存储器中的数据总是最新的。

(2)写回法速度块,“写”操作能以Cache存储器的速度进行。

而且对于同一单元的多个写最后只需一次写回下一级存储器,有些“写”只到达Cache,不到达主存,因而所使用的存储器频带较低。

5.7 组相联Cache比相同容量的之直接映象Cache的失效率低。

由此是否可以得出结论:采用组相联Cache一定能带来性能上的提高?为什么?答:不一定。

因为组相联命中率的提高是以增加命中时间为代价的,组相联需要增加多路选择开关。

5.8 写出三级Cache的平均访问时间T A的公式。

平均访存时间=命中时间+失效率×失效开销只有第I层的失效时才会访问第I+1设三级Cache的命中率分别为H L1、 H l2、 H L3,失效率分别为M l1、M l2、M L3,第三级Cache 的失效开销为P L3。

平均访问时间T A =H L1+M l1{H l2+M l2(H L3+M L3×P L3)}5.9给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。

由计算结果能得出什么结论?(1)理想Cache情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.2次;(2)两者Cache容量均为64KB,块大小都是32字节;(3)组相联Cache中的多路选择器使CPU的时钟周期增加了10%;(4)这两种Cache的失效开销都是80ns;(5)命中时间为1个时钟周期;(6)64KB直接映象Cache的失效率为1.4%,64KB两路组相联Cache的失效率为1.0%。

解:平均访问时间=命中时间+失效率×失效开销平均访问时间1-=2.0+1.4% *80=3.12ns路=2.0*(1+10%)+1.0% *80=3.0ns平均访问时间2-路两路组相联的平均访问时间比较低CPU ti me=(CPU执行+存储等待周期)*时钟周期CPU time =IC (CPI 执行+总失效次数/指令总数*失效开销) *时钟周期=IC ((CPI 执行*时钟周期)+(每条指令的访存次数*失效率*失效开销*时钟周期))CPU time 1-way =IC(2.0*2+1.2*0.014*80)=5.344ICCPU time 2-way =IC(2.2*2+1.2*0.01*80)=5.36IC 相对性能比:=--1waytime 2way time CPUCPU 5.36/5.344=1.003直接映象cache 的访问速度比两路组相联cache 要快1.04倍,而两路组相联Cache 的平均性能比直接映象cache 要高1.003倍。

因此这里选择两路组相联。

5.10 假设一台计算机具有以下特性:(1) 95%的访存在Cache 中命中;(2) 块大小为两个字,且失效时整个块被调入; (3) CPU 发出访存请求的速率为109字/秒; (4) 25%的访存为写访问;(5) 存储器的最大流量为109字/秒(包括读和写); (6) 主存每次只能读或写一个字;(7) 在任何时候,Cache 中 有30%的块被修改过; (8) 写失效时,Cache 采用写分配法。

现欲给计算机增添一台外设,为此想先知道主存的频带已经使用了多少。

试对于以下两种情况计算主存频带的平均使用比例。

(1)写直达Cache ; (2)写回法Cache 。

解:采用按写分配(1)写直达cache 访问命中,有两种情况:读命中,不访问主存;写命中,更新cache 和主存,访问主存一次。

访问失效,有两种情况:读失效,将主存中的块调入cache 中,访问主存两次;写失效,将要写的块调入cache ,访问主存两次,再将修改的数据写入cache 和主存,访问主存一次,共三次。

上述分析如下表所示。

一次访存请求最后真正的平均访存次数=(71.3%*0)+(23.8%*1)+(3.8%*2)+(1.3%*3)=0.35已用带宽=0.35×109/10 9=35.0%(2)写回法cache 访问命中,有两种情况:读命中,不访问主存;写命中,不访问主存。

采用写回法,只有当修改的cache 块被换出时,才写入主存;访问失效,有一个块将被换出,这也有两种情况:如果被替换的块没有修改过,将主存中的块调入cache 块中,访问主存两次;如果被替换的块修改过,则首先将修改的块写入主存,需要访问主存两次;然后将主存中的块调入cache块中,需要访问主存两次,共四次访问主存。

所以:一次访存请求最后真正的平均访存次数=66.5%*0+28.5%*0+3.5%*2+1.5%*4=0.13已用带宽=0.13×10 9/10 9=13%5.11 伪相联中,假设在直接映象位置没有发现匹配,而在另一个位置才找到数据(伪命中)时,需要1个额外的周期,而且不交换两个Cache中的数据,失效开销为50个时钟周期。

相关文档
最新文档