计算机系统结构(有详细答案)

合集下载

计算机系统结构课后答案

计算机系统结构课后答案

1、数据结构和机器的数据表示之间是什么关系?确定和引入数据表示的基本原则是什么?答:数据表示是能由硬件直接识别和引用的数据类型。

数据结构反映各种数据元素或信息单元之间的结构关系。

数据结构要通过软件映象变换成机器所具有的各种数据表示实现,所以数据表示是数据结构的组成元素。

不同的数据表示可为数据结构的实现提供不同的支持,表现在实现效率和方便性不同。

数据表示和数据结构是软件、硬件的交界面。

除基本数据表示不可少外,高级数据表示的引入遵循以下原则:(1)看系统的效率有否提高,是否养活了实现时间和存储空间。

(2)看引入这种数据表示后,其通用性和利用率是否高。

2、标志符数据表示与描述符数据表示有何区别?描述符数据表示与向量数据表示对向量数据结构所提供的支持有什么不同?答:标志符数据表示指将数据类型与数据本身直接联系在一起,让机器中每个数所都带类型樗位。

其优点是:(1)简化了指令系统和程序设计;(2)简化了编译程序;(3)便于实现一致性校验;(4)能由硬件自动变换数据类型;(5)支持数据库系统的实现与数据类型无关;(6)为软件调试和应用软件开发提供支持。

缺点是:(1)会增加程序所点的主存空间;(2)在微观上对机器的性能(运算速度)不利。

数据描述符指数据的描述与数据分开存放,描述所访问的数据是整块还是单个的,及访问该数据块或数据元素的地址住处它具备标志符数据表示的优点,并减少了标志符数据表示所占的空间,为向量和数组结构的实现提供支持。

数据描述符方法优于标志符数据表示,数据的描述与数据分开,描述所访问的数据是整块还是单个的,及访问该数据块或数据元素的地址信息,减少了樗符数据表示所占的窨。

用描述符方法实现阵列数据的索引比用变址方法实现要方便,且便于检查出程序中的阵列越界错误。

但它不能解决向量和数组的高速运算问题。

而在有向量、数组数据表示的向量处理机上,硬件上设置有丰富的赂量或阵列运算指令,配有流水或阵列方式处理的高速运算器,不仅能快速形成向量、数组的元素地址,更重要的是便于实现把向量各元素成块预取到中央处理机,用一条向量、数组指令流水或同时对整个向量、数组高速处理.如让硬件越界判断与元素运算并行。

计算机体系结构答案

计算机体系结构答案

计算机体系结构答案2021 福师网院一、填空题(每空1分,共14分)1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相联方式。

2. 虚拟存储器的三种管理方式是段式管理,页式管理和段页式管理。

3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量。

4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为RAW 、WAR 和WAW 三种类型。

5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容。

二、名词解释(每题2分,共16分)计算机体系结构:答:计算机体系结构包括指令集结构、计算机组成和计算机实现三个方面的内容。

兼容机:答:不同厂家生产的具有相同计算机结构的计算机;系列机:同一厂家生产的具有相同计算机结构,但具有不同组成和实现的一系列不同档次不同型号的机器;写直达法:答:执行“写”操作时,不仅写入Cache,而且也写入下一级存储器。

高速缓冲存储器:答:为解决CPU与主存储器间速度差而在内存储器和CPU之间增加的一种存取速度远高于普通内存的特殊存储器。

延迟转移技术:答:为了使指令流水线不断流,在转移指令之后插入一条不相关的有效的指令,而转移指令被延迟执行,这种技术称为延迟转移技术。

线性流水线:答:指各段串行连接、没有反馈回路的流水线。

数据通过流水线中的各段时,每一个段最多只流过一次;非线性流水线:指各段除了有串行的连接外,还有反馈回路的流水线。

流水线的吞吐率:答:在单位时间内流水线所完成的任务数量或输出结果的数量。

并行性:答:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。

只要在时间上相互重叠,就存在并行性。

它包括同时性与并发性两种含义。

三、简答题(每题5分,共30分)1. 如有一个经解释实现的计算机,可以按功能划分成4级。

每一级为了执行一条指令需要下一级的N条指令解释。

计算机体系结构课后答案

计算机体系结构课后答案

计算机体系结构课后答案【篇一:计算机体系结构习题(含答案)】1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。

对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。

(1)最大尾数(8)最小正数(2)最小正尾数(9)最大负数(3)最小尾数(10)最小负数(4)最大负尾数(11)浮点零(5)最大阶码(12)表数精度(6)最小阶码(13)表数效率(7)最大正数(14)能表示的规格化浮点数个数2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。

尾数用原码、纯小数表示,阶码用移码、整数表示。

(1) 设计这种浮点数的格式(2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。

3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。

(1) 选择合适的舍入方法。

(2) 确定警戒位位数。

(3) 计算在正数区的误差范围。

4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。

b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。

如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。

对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。

(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。

6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为6位。

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录

计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录片上地址模块内部体号模式5: 4高阶交叉4低阶交叉16存储器模块每4个形成一个大模块:片上地址模块内部体号模式6: 4并行访问4低阶交叉31 0模块片上地址模块号输出选择(1)所有这些存储器可以并行工作,因此带宽可以增加一般来说,并行内存访问的优点是简单且易于实现,缺点是访问冲突大。

高阶交错存储器具有扩展方便、存取效率低的优点。

低阶交叉存取存储器可以分时方式提高速度46,但扩展不方便。

(2)各种存储器的带宽与其工作频率有关。

不考虑冲突,如果有足够多的独立控制电路和寄存器,那么它们的带宽是相同的。

(3)存储器原理图注意,并行存取存储器非常类似于低阶交叉存取存储器,除了并行存取存储器使用存储器模块号(存储体号)来选择输出结果,而低阶交叉存取存储器用于为存储器模块(存储体)生成芯片选择信号,这通过流水线操作提高了存取速度。

3.14在页面虚拟内存中,一个程序由从P1到P5的5个虚拟页面组成程序执行过程中依次访问的页面如下:P2、P3、P2、P1、P5、P2、P4、P5、P3、P2、P5、P2假设系统为该程序的主存储器分配三个页面,主存储器的三个页面分别由先进先出、先进先出和优化调度(1)绘制主内存页面条目、替换和命中的表(2)计算三种页面替换算法的页面命中率3.15(1)当分配的主内存页的数量大于或等于5时,可以达到最高的页命中率,除了第一次调入未命中,所有访问都在47: 7实际命中之后,因此可以达到的最高页命中率是H?7?0.5833 12(2)由于当页面数大于或等于5时肯定可以达到最高的命中率,让我们看看当页面数小于5时是否可以达到命中率:当由分配的主存储器页面数等于4时,调度过程如下:489 LFU算法4调用中4 5 4 5 3 4 5* 3 2调用中4 5 3 2命中1 5 3* 2调用中1 5 3 2*命中1 5 3* 2命中1 5* 3 2命中1 5 3 2命中1 5 3* 2命中1 5 3 * 2命中1 5 3 2命中1 5 3 2命中1 5 3 2命中7调用中此时也能达到最高命中率。

(完整版)第3章计算机网络体系结构(习题答案)

(完整版)第3章计算机网络体系结构(习题答案)

第3章计算机网络体系结构一、填空题1.协议主要由(语法)、(语义)和(同步)三个要素组成。

2.OSI模型分为(物理层)、(数据链路层)、(网络层)、(传输层)、(会话层)、(表示层)和(应用层)七个层次。

3.OSI模型分为(资源子网)和(通信子网)两个部分。

4.物理层定义了(机械特性)、(电气特性)、(功能特性)和(规程特性)四个方面的内容。

5.数据链路层处理的数据单位称为(帧)。

6.数据链路层的主要功能有(链路管理)、(成帧)、(信道共享)、(帧同步)、(流量控制)、(差错控制)、(透明传输)和(寻址)。

7.在数据链路层中定义的地址通常称为(硬件地址)或(物理地址)。

8.网络层所提供的服务可以分为两类:(面向连接的)服务和(无连接的)服务。

9.传输层的功能包括(服务选择)、(连接管理)、(流量控制)、(拥塞控制)和(差错控制)等。

二、名词解释同步协议实体对等层对等层通信服务 CIDR 协议数据单元服务数据单元同步同步指的是广义的、在一定条件下发生什么事情的特性,而且条件和时间有关,具有时序的含义。

协议计算机网络中意图进行通信的结点必须要遵守一些事先约定好的规则。

这些为进行数据交换而建立的规则、标准或约定即称为协议,也称为网络协议。

实体任何接收或者发送数据的硬件单元或者软件进程模块都可以称为通信实体,简称实体。

对等层不同的网络结点,若它们遵循的是同一种网络体系结构的话,那么在不同结点上完成同样功能的层次称为对等层。

对等层通信在分层的网络体系结构中,每个层次只知道自己从上层接收来数据并处理后再传递给下一层,结果通信目的方该层次的对等层就收到与己方处理的一模一样的数据。

就好像在两个对等层之间有一条“通道”直接把数据传送过去一样,这种情况就称为对等层通信。

服务下一层能被上一层看见的功能称为服务。

协议数据单元、服务数据单元对等层上传送的数据单位称为协议数据单元,而直接相邻的两个层次之间交换的数据单位称为服务数据单元。

(完整版)计算机系统结构考试题目及参考答案.doc

(完整版)计算机系统结构考试题目及参考答案.doc

(完整版)计算机系统结构考试题目及参考答案.doc一:名词解释1:虚拟机:由软件实现的机器。

2:CPI :是衡量CPU 执行指令效率的重要标志,指执行每条指令所需的平均时钟周期数。

3:摩尔定律:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18 个月便会增加一倍,性能也将提升一倍。

4:并发性:指两个或多个事件在同一时间间隔内发生的并行性。

5:程序局部性原理:是指程序在执行时呈现出局部性规律,即在一段时间内,整个程序的执行仅限于程序中的某一部分。

相应地,执行所访问的存储空间也局限于某个内存区域。

局部性原理又表现为:时间局部性和空间局部性。

6: CISC/RISC : CISC :即复杂指令系统计算机,指在系统中增加更多和复杂的指令,来提高操作系统效率的计算机。

RISC :即精简指令系统计算机,指在系统中选取使用一些频率最高的、长度固定的、格式种类少的简单指令的计算机。

7:计算机系统结构:指对机器语言计算机的软、硬件功能的分配和对界面的定义。

8:系列机:指先设计好一种系统结构,而后就按这种系统结构设计它的系统软件,按器件状况和硬件技术研究这种结构的各种实现方法,并按照速度、价格等不同要求,分别提供不同速度、不同配置的各档机器。

9:模拟:用机器语言程序解释实现程序移植的方法。

10:仿真:用微程序直接解释另一种机器的指令系统。

11:寻址方式:寻找操作数或指令的有效地址的方式。

12:替换算法:在存储体系中,当出现页面失效时或者主存的所有页面已经全部被占用而又出现页面失效时,按照某种算法来替换主存中某页。

[ 由于主存中的块比Cache 中的块多,所以当要从主存中调一个块到Cache 中时,会出现该块所映象到的一组(或一个)Cache 块已全部被占用的情况。

这时,需要被迫腾出其中的某一块,以接纳新调入的块。

]二:选择题1,直接执行微指令的是( C )A 汇编程序B 编译程序C 硬件D 微指令程序2,对汇编语言程序员不透明的是( C )A 程序计数器B 主存地址寄存器C 条件码寄存器D 指令寄存器3,最早的冯·诺依曼型计算机是以( B )为中心的A 运算器B 控制器C 存储器D I/O 设备4,计算机系统结构的角度的结构来看,机器语言程序员看到的机器属性是( C )A 计算机软件所要完成的功能B 计算机硬件的全部组成C 编程要用到的硬件组织D 计算机各部分硬件的实现5,不同系列计算机之间实现可移植性的途径,不包括( B )A 采用统一的高级语言B 采用统一的汇编语言C 模拟D 仿真6,利用时间重叠原理,实现并行处理的是( A )A 流水处理机B 多处理机C 阵列处理机D 集群系统7,多处理机实现的并行主要是(B)A 指令级并行B 任务级并行C 操作级并行D 操作步骤的级并行8 计算机系统结构不包括( B )A 信息保护B 存储速度C 数据表示D 机器工作状态9,不需要编址的数据存储空间( D )A CPU 通用寄存器B 主存储器C I/O 寄存器D 堆栈10, RISC 执行程序的速度比CISC 快的原因是( C )A RISC 指令系统中条数较少B 程序在 RISC 编译生成的目标程序较短C RISC 指令平均执行周期数较少D RISC 中只允许 LOAD 和 STORE 指令存储11,程序员在编写程序时,使用的访存地址是( B )A 主存地址B 逻辑地址C 物理地址D 有效地址12,虚拟存储器主要是为了( A )A 扩大存储器系统容量B 提高存储器系统速度C 扩大存储器系统容量和提高存储器系统速度D 便于程序的访存操作13,与全相联映像相比,组相联映像的优点是( B )A 目录表小B 块冲突概率低C 命中率高D 主存利用率高14,输入输出数据不经过CPU 内部寄存器的输入输出方式是( C )A 程序控制方式B 中断C DMA 方式D 上述三种方式15,在配置了通道的计算机系统中,用户程序需要输入输出时引起的中断是( A )A 访管中断B I/O 中断C 程序性中断D 外部中断16,当计算机系统通过执行通道程序,完成输入输出工作时,执行通道程序的是(B)A CPUB 通道C CPU 和通道D 指定的外设三:填空1,常见的计算机系统结构的分类法有两种:Flynn 分类法,冯氏分类法冯氏分类法是根据系统的最大并行度对计算机系统结构进行分类,大多数的位并行的单处理机属于字串位并的处理机方式2,由软件实现的机器称为:虚拟机3,在一个计算机系统中,低层机器的属性往往对高层机器的程序员是透明的。

计算机系统结构——课后答案

计算机系统结构——课后答案

习题一1、解释下列术语计算机系统的外特性:通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性,即由他们所看到的计算机的基本属性(概念性结构和功能特性)。

计算机系统的内特性:计算机系统的设计人员所看到的基本属性,本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。

模拟:模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。

可移植性:在新型号机出台后,原来开发的软件仍能继续在升级换代的新型号机器上使用,这就要求软件具有可兼容性,即可移植性。

可兼容性是指一个软件可不经修改或只需少量修改,便可由一台机器移植到另一台机器上运行,即同一软件可应用于不同环境。

Amdahl 定律:系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频度或占总执行时间的比例。

虚拟机(Virtual Machine ):指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。

6、7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%,为了增强该操作的性能,可采用两种不同的方法:一种是增加专门的硬件,可使求浮点数平方根操作的速度提高为原来的20倍;另一种方法是提高所有浮点运算指令的速度,使其为原来的2倍,而浮点运算指令的执行时间在总执行时间中占30%。

试比较这两种方法哪一种更好些。

答:增加硬件的方法的加速比23.120/2.0)2.01(11=+-=p S ,另一种方法的加速比176.12/3.0)3.01(12=+-=p S ,经计算可知Sp1>Sp2第一种方法更好些。

9、假设高速缓存Cache 的工作速度为主存的5倍,且Cache 被访问命中的概率为90%,则采用Cache 能使整个存储系统获得多高的加速比? 答:加速比%10)(%90'⨯++⨯==tc tm tc tmT T S ,其中tm=5tc ,代入公式,得到加速比S=3.33。

计算机体系结构习题答案

计算机体系结构习题答案

一、(5分)计算机系统设计中经常使用的4个定量原理是什么?请简要说明它们的含义。

答:(1)以经常性事件为重点。

在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。

(2)Amdahl 定律。

加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

(3)CPU 性能公式。

执行一个程序所需的CPU 时间 = IC ×CPI ×T 。

(4)程序的局部性原理。

程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

二、(15分)假设某应用程序中有4类操作,通过改进各类操作的功能部件,可(2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少? 答:根据Amdahl 定律aff S n +-=)1(1,其中f 是可改进部分在总运行时间中所占比例,a 是可改进部分的加速比,可得4类操作均改进后,整个程序的加速比:11.77(1)n ii iS FF S =≈-+∑∑三、(5分)请简述指令之间数据冲突的类型。

答:指令之间的数据冲突有3种类型:真相关、反相关、输出相关。

真相关(数据依赖,有时候也称为数据相关):考虑两条指令i 和j ,i 在j 的前面,指令k 在指令i 和指令j 之间。

如果下述条件之一成立,则称指令j 与指令i 真相关:(1)指令j 使用指令i 产生的结果(写后读);(2)指令j 与指令k 真相关,而指令k 又与指令i 真相关。

(真相关的传递性) 反相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 所写的名与指令i 所读的寄存器名或存储地址相同,则称指令i 和j 发生了反相关。

(读后写)输出相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 和指令i 所写的寄存器名或存储地址相同,则称指令i 和j 发生了输出相关。

(写后写) 其中反相关和输出相关又合称名相关。

计算机系统结构作业答案

计算机系统结构作业答案

计算机系统结构计算机系统结构作业1第1章计算机系统结构的基本概念一、解释下列术语:计算机系统结构;计算机组成;计算机实现;透明性;系列机;软件兼容;兼容机;模拟;仿真;虚拟机;宿主机;Amdahl定律;CPI;MIPS;MFLOPS。

【答案】计算机系统结构、计算机组成和计算机实现是三个不同的概念。

系统结构定义为由程序设计者所看到的一个计算机系统的属性,即概念性结构和功能特性,这里的程序设计者所看到的计算机属性是指为机器语言或编译程序设计者所看到的计算机属性,是硬件子系统的概念性结构及其功能特性,它是计算机系统的软、硬件的界面。

计算机组成是计算机系统结构的逻辑实现,包括机器内部的数据流和控制流的组成以及逻辑设计等。

计算机实现是指计算机组成的物理实现。

透明性:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,成为透明性现象。

所谓系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。

不同公司厂家生产的具有相同系统结构的计算机称为兼容机。

软件兼容:在新的计算机系统出台后,原先已开发的软件仍能继续在升档换代的新型号机器上使用,这就是软件兼容。

系列机方法能够在具有相同系统结构的各种机器之间实现软件移植,为了实现软件在不同系统结构的机器之间的相互移植,可以采用模拟和仿真。

模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。

仿真是指用微程序直接解释另一种机器指令系统的方法。

虚拟机是被模拟的机器;宿主机是进行模拟的机器。

Amdahl 定律:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。

Fe=(改进前可改进部分占用的时间)/(改进前整个任务的执行时间) Se=(改进前可改进部分的执行时间)/(改进后改进部分的执行时间) 则,改进后整个系统加速比为ee e n S F F s /)1(1+-=。

计算机系统结构答案

计算机系统结构答案

一、选择题1、对汇编语言程序员,下列(A )不是透明的。

A: 中断字寄存器 B: 乘法器 C: 移位器 D: 指令缓冲器2、假设对A机器指令系统的每条指令的解释执行可直接由B机器的一段微程序解释执行,则A称为(D )。

A: 仿真机 B: 宿主机 C: 虚拟机 D: 目标机3、 1. 查看下面三条指令:V3←A;V2←V0+V1;V4←V2*V3;假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。

三条指令全部采用串行的方法,那么执行的时间是:A: 3N+20 B: 3N+21 C: 3N+22 D: 3N+234、某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。

采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停的情况下,接着计算(D+E)*F。

求此链接流水线的通过时间是多少拍?(设寄存器出入各需1拍)A: 8 B: 9 C: 17 D: 185、设有一个4个处理器的MIMD系统,假设在系统中访存取指和取数的时间可以忽略不计;加法与乘法分别需要2拍和4拍;在MIMD系统中处理器(机)之间每进行一次数据传送的时间为1拍;在MIMD系统中,每个PE都可以和其它PE有直接的的通路。

求利用此系统计算表达式所需的节拍数。

A: 23 B: 12 C: 11 D: 106、以下哪些是周期窃取方式的特点?A : 硬件结构简单B : 硬件结构复杂C : 数据输入或输出过程中占用了CPU时间D : 数据输入或输出过程中不占用CPU时间7、从下列有关Cache的描述中,选出应填入空格中的正确答案:(1)今有甲、乙两台计算机,甲计算机的Cache存取时间为50ns,主存储器为2us;乙计算机的Cache存储时间为100ns,主存储器为1.2us。

计算机系统结构习题答案(李学干)

计算机系统结构习题答案(李学干)

计算机系统结构习题解答第一章习题一1.2一台经解释实现的计算机,可以按照功能划分成4级。

每一级为了执行一条指令需要下一级的N条指令解释。

若执行第1级的一条指令需K纳秒时间,那么执行第2、3、4级的一条指令个需要多少时间?解:①分析:计算机按功能分级时,最底层的为第1级。

向上一次是第2 、3、4级。

解释执行是在低级机器级上,用它的一串指令或语句来解释执行高一级上的一条指令的功能。

是逐条解释的。

②解答:执行第2、3、4级的一条指令各需KNns,KN2ns,KN3ns的时间。

1.3操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接实现,而不由操作系统自己来实现。

根据你对习题1.2的回答,你认为这样做有哪两个好处?答:可以加快操作系统操作命令解释的速度。

同时也节省了存放解释操作命令这部分解释程序所占用的空间。

简化了操作系统机器级的设计。

也有利于减少传统机器级的指令条数。

1.5硬件和软件在什么意义上是等效的?在什么意义上是不等效的?试举例说明。

答:硬件和软件在逻辑意义上是等效的。

在物理意义上是不等效的。

①在原理上,用硬件或固件实现的功能完全可以用软件来完成。

用软件实现的功能也可以用硬件或固件来完成。

功能一样。

②只是反映在速度、价格、实现的难易程度上,这两者是不同的。

性能不同。

③例如,浮点运算在80386以前一直是用软件实现的。

到了80486,将浮点运算器集成到了CPU中,可以直接通过浮点运算指令用硬件实现。

但速度却高的多。

1.9下列哪些对系统程序员是透明的?哪些对应用程序员是透明的?系列机各档不同的数据通路宽度;虚拟存储器;Cache存储器;程序状态字;“启动I/O”指令;“执行”指令;指令缓冲器。

答:①对系统程序员和应用程序员均透明的:是全用硬件实现的计算机组成所包含的方面。

有:数据通路宽度、Cache存储器、指令缓冲器。

②仅对应用程序员透明的:是一些软硬件结合实现的功能。

有:虚拟存储器、程序状态字、“启动I/O”指令。

《计算机系统结构》及参考答案精选全文完整版

《计算机系统结构》及参考答案精选全文完整版

可编辑修改精选全文完整版《计算机系统结构》练习题一一、单项选择题1.页式虚拟存储器的地址变换对于 D 是透明的.A. 操作系统设计者B. 任何程序员C. 系统结构设计者D. 应用程序员2.以下各类中断中,属于自愿中断的是 C .A. 外部中断B. I/O中断C. 执行“访管”指令D. 机器校验中断3. 高速外部设备磁盘机适合连接于 C .4. 页式虚拟存储器页表的作用是 A .A. 反映虚页在主存的存储情况B. 仅反映虚页是否调入主存C. 反映主存实页与Cache的对应关系D. 反映虚页在辅存的存储情况5.软件和硬件的功能在逻辑上是 C 的.D.软件优于固件6. 计算机中最优化的操作码编码方法是 D .码码C.扩展操作码 D.哈夫曼编码7. 从计算机系统执行程序的角度看,并行性等级由低到高分为四级 A .A.指令内部——指令之间——进程之间——程序之间B.指令之间——指令内部——进程之间——程序之间C.进程之间——指令之间——指令内部——程序之间D.程序之间——进程之间——指令之间——指令内部8. 计算机系统多级层次结构中,操作系统机器级的直接上层是 D .A.传统机器级B.高级语言机器C.应用语言机器级D.汇编语言机器级9.全相联地址映像是指 A .A.任何虚页都可装入主存中任何实页的位置B.一个虚页只装进固定的主存实页位置C.组之间是固定的,而组内任何虚页可以装入任何实页位置D.组间可任意装入,组内是固定装入10.对于同一系列机,必须保证软件能够 C .A.向前兼容,并向上兼容B.向前兼容,并向下兼容C.向后兼容,力争向上兼容D.向后兼容,力争向下兼容11.设有16个处理单元的并行处理机系统, 采用共享主存的方式. 若同时存取16个数据, 为避免存储器访问冲突, 共享主存的多体数量应该为 C 才合理.A. 15B. 16C. 17D. 1912. 软件兼容的根本特征是 C .A. 向前兼容B. 向后兼容C. 向上兼容D. 向下兼容13.在下列机器中,能够实现软件兼容的机器是 B .A. 完全不同种类的机型B. 系统结构相同的机器C. 宿主机和目标机D. 虚拟机14.输入输出系统硬件的功能对 C 是透明的。

计算机系统结构(课后习题答案)

计算机系统结构(课后习题答案)

第一章电脑系统结构的基本概念1.有一个电脑系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。

现假设需第i级的N 条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks。

第3级上等效程序需运行:(N/M)*(N/M)*Ks。

第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。

note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。

而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。

所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。

答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。

但是实现的性能价格比,实现的难易程序不同。

在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡〔硬件〕上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件。

3.试以实例说明电脑系统结构、电脑组成与电脑实现之间的相互关系与影响。

答:电脑系统结构、电脑组成、电脑实现互不相同,但又相互影响。

〔1〕电脑的系统结构相同,但可采用不同的组成。

如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。

从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。

其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。

计算机系统结构第1章部分习题参考答案

计算机系统结构第1章部分习题参考答案

第1章部分习题参考答案1.1 解释下列术语⏹翻译:先用转换程序将上一级机器级上的程序整个地变换成下一级机器级上可运行的等效程序,然后再在下一级机器级上去实现的技术。

⏹解释:在下一级机器级上用它的一串语句或指令来仿真上一级机器级上的一条语句或指令的功能,通过对上一级机器语言程序中的每条语句或指令逐条解释来实现的技术。

⏹层次结构:将计算机系统由上往下依次划分为应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器级和微程序机器级。

对于一个具体的计算机系统,层次的多少会有所不同。

⏹计算机系统结构:传统机器级的程序员所看到计算机的基本属性,即计算机的概念性结构和功能特性。

简称为计算机的外特性。

⏹计算机组成:计算机系统结构的逻辑实现,也常称为计算机组织。

该组织包括机器级内的数据流和控制流的组成以及逻辑设计等。

⏹计算机实现:计算机组成的物理实现。

它包括处理机、主存等部件的物理结构,器件的集成度、速度和信号,器件、模块、插件、底板的划分与连接,专用器件的设计,电源、冷却、装配等技术。

⏹透明性:本来存在的事物或属性,但从某个角度看似乎不存在,称为透明性现象。

⏹固件:是一种具有软件功能的硬件。

如将软件固化在ROM中,就是一种固件。

⏹由上往下设计:先考虑如何满足应用要求,确定好面对使用者那级机器应有什么基本功能和特性,然后再逐级往下设计,每级都考虑怎样优化上一级实现。

这种方法适合于专用机设计。

⏹由下往上设计:根据现有的部件,并参照或吸收已有各种机器的特点,先设计出微程序机器级(如果采用微程序控制)及传统机器级,然后再为不同应用配置多种操作系统和编译系统软件,采用合适的算法来满足相应的应用。

这是20世纪60-70年代前常用的通用机设计思路。

⏹系列机:同一厂家生产的具有相同系统结构,但具有不同组成和实现的一系列的机器。

⏹软件兼容:同一软件可以不加修改地运行于系统结构相同的不同档次的机器上,而且它们所获得的结果一样,差别只是运行时间不同。

(完整版)计算机系统结构网上作业参考答案

(完整版)计算机系统结构网上作业参考答案

计算机系统结构作业参考答案一、1、试述现代计算机系统的多级层次结构。

计算机系统具有层次性,它由多级层次结构组成。

从功能上计算机系统可分为五个层次级别:第一级是微程序设计级。

这是一个硬件级,它由机器硬件直接执行微指令。

第二级是一般机器级,也称为机器语言级。

它由微程序解释机器指令系统.这一级是硬件级。

第三级是操作系统级,它由操作系统程序实现。

这些操作系统由机器指令和广义指令组成,这些广义指令是操作系统定义和解释的软件指令。

这一级也称混合级。

第四级是汇编语言级。

它给程序人员提供一种符号形式的语言,以减少程序编写的复杂性。

这一级由汇编程序支持执行。

第五级是高级语言级。

这是面向用户为编写应用程序而设置的。

这一级由各种高级语言编译程序支持。

2、试述RISC设计的基本原则和采用的技术。

答:一般原则:(1)确定指令系统时,只选择使用频度很高的指令及少量有效支持操作系统,高级语言及其它功能的指令,大大减少指令条数,一般使之不超过100条;(2)减少寻址方式种类,一般不超过两种;(3)让所有指令在一个机器周期内完成;(4)扩大通用寄存器个数,一般不少于32个,尽量减少访存次数;(5)大多数指令用硬联实现,少数用微程序实现;(6)优化编译程序,简单有效地支持高级语言实现。

基本技术:(1)按RISC一般原则设计,即确定指令系统时,选最常用基本指令,附以少数对操作系统等支持最有用的指令,使指令精简。

编码规整,寻址方式种类减少到1、2种。

(2)逻辑实现用硬联和微程序相结合。

即大多数简单指令用硬联方式实现,功能复杂的指令用微程序实现。

(3)用重叠寄存器窗口。

即:为了减少访存,减化寻址方式和指令格式,简有效地支持高级语言中的过程调用,在RISC机器中设有大量寄存嚣,井让各过程的寄存器窗口部分重叠。

(4)用流水和延迟转移实现指令,即可让本条指令执行与下条指令预取在时间上重叠。

另外,将转移指令与其前面的一条指令对换位置,让成功转移总是在紧跟的指令执行之后发生,使预取指令不作废,节省一个机器周期。

计算机系统结构(有详细答案)

计算机系统结构(有详细答案)

(仅供参考,不作为考试标准),选择题(30分,每题2分)计算机系统结构设计者所关心得就是________所瞧到得得计算机结构。

A)硬件设计人员B)逻辑设计人员C)机器语言或汇编语言程序员D)高级语言程序员在计算机系统设计时,为了提高系统性能,应当注意________。

A)加快经常性使用指令得执行速度B)要特别精心设计少量功能强大得指令C)要减少在数量上占很小比例得指令得条数D)要加快少量指令得速度重叠寄存器技术主要用于解决在RISC系统中因________而导致得问题。

A)JMP指令影响流水线B)CALL指令得现场保护C)只有LOAD与STORE指令带来得访问存储器不便D)存储器访问速度为使流水计算机运行效率高________A)各过程段时间要不同B)连续处理得任务类型应该不同C)连续处理得任务类型应该相同D)连续处理得任务数尽可能少不属于堆栈型替换算法得就是________。

A)近期最少使用法B)近期最久未用法C)先进先出法D)页面失效频率法与全相联映象相比,组相联映象得优点就是________。

A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好得方法就是________。

A)不准修改指令B)设相关专用通路C)推后分析下条指令D)推后执行下条指令流水操作中,遇到数据相关时,采用得解决办法有________。

A)用优化编译器检测,通过指令重新排序得办法B)数据重定向技术C)延迟转移技术D)加快与提前形成条件码经多级网络串联来实现全排列网络,只能用________。

A)多级立方体网络B)多级PM2I网络C)多级混洗交换网络D)上述任何网络虫蚀寻径以流水方式在各寻径器就是顺序传送得就是________。

A)消息B)包C)片D)字节超标量处理机________A)在一个时钟周期内分时发射多条指令B)只有一个操作部件C)在一个时钟周期内同时发射多条指令D)只有一个取指部件流水线得技术指标不包括________A)响应比B)吞吐率C)加速比D)效率向量处理机属于________A)SISD B)SIMD C)MISD D)MIMD________属于MIMD系统结构。

计算机系统结构__《张晨曦、王志英》课后习题参考答案

计算机系统结构__《张晨曦、王志英》课后习题参考答案

计算机系统结构__《张晨曦、王志英》课后习题参考答案第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

(完整版)计算机系统结构课后习题答案

(完整版)计算机系统结构课后习题答案

第 1 章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl 定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

计算机体系结构1-6章习题答案

计算机体系结构1-6章习题答案

1 2 3 4 5 6
8 16 24 32 40 48
1*82
2*82 3*82 4*82 5*82 6*82 7*82
4/8 5/8 6/8
7/8
7
56
2)规格化浮点数表: rm=2时,规格化浮点数共有4*8=32个 rm=8时,规格化浮点数共有7*8=56个,在[0.5,112]中, 有数19个(上表中红的数字表示)。
§4通道(CH)
一、CH的基本工作原理 CH执行CH程序的过程 CH的任务 二、CH流量计算和时空图绘制 CH的类型 CH流量计算 字节多路CH响应处理时空图的绘制 1)计算每个子CH提供一个字节时间(1/f) 2)画出一个完整申请周期时空图 3)计算字节多路CH对每个字节响应的最长用时
第一章参考答案: 1.应用语言级 高级语言级 汇编语言级 操作系统级 机器语言级 微程序语言级。 2. 从上而下 从下到上 专用机 通用机 3. 软、硬件交界面 计算机系统的性能/价格比 4 . 1 T FLOPS 的计 算能力 1 TBy te 的 主存容量 1 TByte/s 的I/O带宽 5. 虚拟机 实际机器 6. 统一高级语言 模拟 仿真 系列机 7. 控制流 数据流 SISD SIMD MISD MIMD 8. 汇编语言程序员 9. 任务单一化 操作重叠化 吞吐匹配化 程序多道 化
嵌套
中断处理程序 一 二 三 响② 嵌套 四 五
t
返回主程序
例4 解 (1)处理顺序为 2-3-1-5-4 (2)中断响应处理时空图 中断请求 主程序 ①③ ②③④⑤
嵌套
中断处理程序 一 二 三 四 五
响① 嵌套
t
返回主程序
1 分别利用两级描述符和三级描述符描述下列阵列数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(仅供参考,不作为考试标准),
选择题(30分,每题2分)
计算机系统结构设计者所关心的是________所看到的的计算机结构。

A)硬件设计人员B)逻辑设计人员
C)机器语言或汇编语言程序员D)高级语言程序员
在计算机系统设计时,为了提高系统性能,应当注意________。

A)加快经常性使用指令的执行速度
B)要特别精心设计少量功能强大的指令
C)要减少在数量上占很小比例的指令的条数
D)要加快少量指令的速度
重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。

A)JMP指令影响流水线
B)CALL指令的现场保护
C)只有LOAD和STORE指令带来的访问存储器不便
D)存储器访问速度
为使流水计算机运行效率高________
A)各过程段时间要不同B)连续处理的任务类型应该不同
C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。

A)近期最少使用法B)近期最久未用法
C)先进先出法D)页面失效频率法
与全相联映象相比,组相联映象的优点是________。

A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。

A)不准修改指令B)设相关专用通路
C)推后分析下条指令D)推后执行下条指令
流水操作中,遇到数据相关时,采用的解决办法有________。

A)用优化编译器检测,通过指令重新排序的办法
B)数据重定向技术
C)延迟转移技术
D)加快和提前形成条件码
经多级网络串联来实现全排列网络,只能用________。

A)多级立方体网络B)多级PM2I网络
C)多级混洗交换网络D)上述任何网络
虫蚀寻径以流水方式在各寻径器是顺序传送的是________。

A)消息B)包C)片D)字节
超标量处理机________
A)在一个时钟周期内分时发射多条指令B)只有一个操作部件
C)在一个时钟周期内同时发射多条指令D)只有一个取指部件
流水线的技术指标不包括________
A)响应比B)吞吐率C)加速比D)效率
向量处理机属于________
A)SISD B)SIMD C)MISD D)MIMD
________属于MIMD系统结构。

A)各处理单元同时受同一个控制单元的管理
B)各处理单元同时接受同一个控制单元送来的指令
C)多处理机和多计算机
D)阵列处理机
BSP计算机的并行处理机有16个处理单元,并行存储器的存储体个数为________。

A)16 B)1 C)32 D)17
判断题(正确打√,错误打╳,10分,每题1分)
( ×)对计算机系统中经常使用的基本单元功能,宜于用软件来实现,这样可降低系统的成本。

(√)处理机级流水线又称为指令流水线。

( ×)由于RISC简化了指令系统,因此,RISC上的目标程序比CISC上的目标程序要短一些,程序执行的时间就会少一些。

( ×)在存储体系中,地址的映象与地址的变换没有区别。

( ×)在满足Cache与主存的一致性方面,写回比写直达法好。

( ×)Cache组相联映象的块冲突概率比直接映象的高。

(√)采用LRU替换的Cache存储器,分配给程序的Cache容量一定时,块的大小增加,Cache的命中率将先上升,到一定时候又会逐渐降低。

(×)阵列处理机以多个处理机构成阵列。

( √)SIMD计算机的算法极大地依赖于机器的系统结构。

(× )解决多处理机Cache不一致性问题是基于链式目录的协议优点是限制了共享数据块的拷贝数量。

综合题
(10分)如果某计算机系统有3个部件可以改进,则这三个部件经改进后的加速比分别为:S1=30,S2=20,S3=10。

(1)如果部件1和部件2改进前的执行时间占整个系统执行时间的比例都为30%,那
么,部件3改进前的执行时间占整个系统执行时间的比例为多少,才能使3个部件都改进后的整个系统的加速比Sn达到10?
(2)如果3个部件改进前执行时间占整个系统执行时间的比例分别为30%、30%和
20%,那么,3个部件都改进后系统的加速比是多少?未改进部件执行时间在改进后的系统执行时间中占的比例是多少?
(10分)一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%。

(1)要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长
度。

(2)设计8字长的寄存器-寄存器型指令3条,16位字长的寄存器-存储器型变址寻址方式指令4条,变址范围不小于±127。

请设计指令格式,并给出各字段的长度和操作码的编码。

解:
解:(1)要使得到的操作码长度最短,应采用Huffman 编码,构造Huffman树如下:
S 1S2S3S4这样,采用Huffman编码法得到的操作码的平均长度为:
H = 2×(0.35+0.25+0.20) + 3×0.10 + 4 ×0.05+ 5×(0.03 + 0.02) =1.6+0.3+0.2+0.25
=2.35
S
1S2S3S4
(10分)有一个4段流水线,如下图所示:
S1S2S3S4
其中,段S1和S3的执行时间均为200ns,段S2和S4的执行时间均为100ns。

若瓶颈段S1可使用细分方法改造,瓶颈段S3可使用并联方法改造,对改造后的流水线,分别使用公式和时空图求连续流入4条指令的实际吞吐率和效率
(10分)设向量长度均为64,在Cray-1机上所用浮点功能部件的执行时间分别为:相加6拍,相乘7拍,求倒数近似值14拍;从存储器读数6拍,打入寄存器及启动功能部件各1拍,问下列各指令组,组内的哪些指令可以链接?哪些指令不可链接?不能链接的原因是什么?
分别计算出各指令组全部完成所需要的拍数。

(1)V0<--存储器 V1<--V2+V3 V4<--V5*V6(2)V2<--V0*V1 V3<--存储器 V4<--V2+V3(3)V0<--存储器 V2<--V0*V1
V3<--V2+V0
V5<--V3+V4
(4)V0<--存储器 V1<--1/V0 V3<--V1*V2 V5<--V3+V4
解:(1)3 条向量指令之间既没有发生源Vi 冲突,也没有Vi 的先写后读相关,又不存在功能部件的使用冲突,所以这 3 条向量指令可以同时并行流水。

向量指令组全部完成需要max{(1+6(访存)+1+64-1),(1+6(浮加)+1+64-1),(1+7(浮乘)+1+64-1)} =72拍。

(2)3 条向量指令之间没有功能部件的使用冲突,但是在第1、2 两条向量指令与第3 条向量指令之间有V2 及V3 的先写后读相关。

只要让第1 条向量指令较第2 条向量指令提前 1 拍启动,则第1,2 两条向量指令的第 1 个结果元素就可以被同时链接到第 3 条向量指令中。

(1+7(浮乘)+1)+(1+6(浮加)+1+64-1)
=80(拍)。

(3)第1 条向量指令与第2 条向量指令之间有V0 的先写后读相关,两者可以链接。

第3 条向量指令与第 2 条向量指令之间有源向量寄存器V0 的冲突,它们之间只能串行。

第3 条向量指令与第4 条向量指令之间有加法功能部件的使用冲突,它们之间也只能串行。

(1+6( 访存)+1+1+7( 浮乘)+1+64-1)+(1+6( 访存)+1+64-1)+(1+6( 浮
加)+1+64-1)=222(拍)。

(4)4 条向量指令均依次有Vi 的先写后读相关,但无源Vi 冲突,也无功能部件的使用冲突,所以,这4 条向量指令可以全部链接在一起,进行流水。

(1+6(访存)+1)+(1+14(求倒数)+1)+(1+(7 浮乘)+1)+(1+6(浮加)+1)+64-1=104 拍
(10分)有一个5段流水线,各段执行时间均为Δt ,其预约表如下表所示。

t7X
S5
段S 时间t
t1
t2
t3
t4
t5
t6
S1S2S3S4X
X
X
X
X
X
X X
X
(1)列出禁止表F和冲突向量C。

(2)画出流水线调度的状态图。

(3)分别求出允许不等时间间隔调度和等时间间隔调度的两种最优调度策略,以及这两
种调度策略的流水线最大呑吐率。

(4)若连续输入10个任务,求这两种调度策略的流水线实际呑吐率和加速比。

解:
(1)禁止向量F=(1,3,6) (1 分)
冲突向量C=(100101) (1 分)
(2)
(3)
最小启动循环(2,2,5) 最小平均延迟(2+2+5)/3=3
TPmax=1/(3Dt) (1 分)
最小恒定循环(4)
TPmax=1/(4Dt) (1 分)
(4)
(10分)阵列机有0~7共8个处理单元互连,要求按(0,5),(1,4),(2,7),(3,6)配对通信。

(1)写出实现此功能的互连函数的一般式。

(2)画出用3级立方网络实现该互连函数的互连网络拓扑结构图,并标出各控制开关
状态。

解:(1)
(2)如下图所示:。

相关文档
最新文档