计算机系统结构有详细答案

合集下载

计算机体系结构课后答案

计算机体系结构课后答案

计算机体系结构课后答案【篇一:计算机体系结构习题(含答案)】1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。

对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。

(1)最大尾数(8)最小正数(2)最小正尾数(9)最大负数(3)最小尾数(10)最小负数(4)最大负尾数(11)浮点零(5)最大阶码(12)表数精度(6)最小阶码(13)表数效率(7)最大正数(14)能表示的规格化浮点数个数2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。

尾数用原码、纯小数表示,阶码用移码、整数表示。

(1) 设计这种浮点数的格式(2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。

3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。

(1) 选择合适的舍入方法。

(2) 确定警戒位位数。

(3) 计算在正数区的误差范围。

4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。

b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。

如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。

对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。

(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。

6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为6位。

计算机系统结构--《张晨曦、王志英》课后习题参考答案

计算机系统结构--《张晨曦、王志英》课后习题参考答案

第1章计算机系统结构的基本概念1.1 解释下列术语层次机构: 按照计算机语言从低级到高级的次序, 把计算机系统按功能划分成多级层次结构, 每一层以一种不同的语言为特征。

这些层次依次为: 微程序机器级, 传统机器语言机器级, 汇编语言机器级, 高级语言机器级, 应用语言机器级等。

虚拟机: 用软件实现的机器。

翻译: 先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序, 然后再在这低一级机器上运行, 实现程序的功能。

解释: 对于高一级机器上的程序中的每一条语句或指令, 都是转去执行低一级机器上的一段等效程序。

执行完后, 再去高一级机器取下一条语句或指令, 再进行解释执行, 如此反复, 直到解释执行完整个程序。

计算机系统结构: 传统机器程序员所看到的计算机属性, 即概念性结构与功能特性。

在计算机技术中, 把这种本来存在的事物或属性, 但从某种角度看又好像不存在的概念称为透明性。

计算机组成: 计算机系统结构的逻辑实现, 包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现: 计算机组成的物理实现, 包括处理机、主存等部件的物理结构, 器件的集成度和速度, 模块、插件、底板的划分与连接, 信号传输, 电源、冷却及整机装配技术等。

系统加速比: 对系统中某部分进行改进时, 改进后系统性能提高的倍数。

Amdahl定律: 当对一个系统中的某个部件进行改进后, 所能获得的整个系统性能的提高, 受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理: 程序执行时所访问的存储器地址不是随机分布的, 而是相对地簇聚。

包括时间局部性和空间局部性。

CPI: 每条指令执行的平均时钟周期数。

测试程序套件: 由各种不同的真实应用程序构成的一组测试程序, 用来测试计算机在各个方面的处理性能。

存储程序计算机: 冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中, 机器一旦启动, 就能按照程序指定的逻辑顺序执行这些程序, 自动完成由程序所描述的处理工作。

计算机系统结构——课后答案

计算机系统结构——课后答案

习题一1、解释下列术语计算机系统的外特性:通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性,即由他们所看到的计算机的基本属性(概念性结构和功能特性)。

计算机系统的内特性:计算机系统的设计人员所看到的基本属性,本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。

模拟:模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。

可移植性:在新型号机出台后,原来开发的软件仍能继续在升级换代的新型号机器上使用,这就要求软件具有可兼容性,即可移植性。

可兼容性是指一个软件可不经修改或只需少量修改,便可由一台机器移植到另一台机器上运行,即同一软件可应用于不同环境。

Amdahl 定律:系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频度或占总执行时间的比例。

虚拟机(Virtual Machine ):指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。

6、7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%,为了增强该操作的性能,可采用两种不同的方法:一种是增加专门的硬件,可使求浮点数平方根操作的速度提高为原来的20倍;另一种方法是提高所有浮点运算指令的速度,使其为原来的2倍,而浮点运算指令的执行时间在总执行时间中占30%。

试比较这两种方法哪一种更好些。

答:增加硬件的方法的加速比23.120/2.0)2.01(11=+-=p S ,另一种方法的加速比176.12/3.0)3.01(12=+-=p S ,经计算可知Sp1>Sp2第一种方法更好些。

9、假设高速缓存Cache 的工作速度为主存的5倍,且Cache 被访问命中的概率为90%,则采用Cache 能使整个存储系统获得多高的加速比? 答:加速比%10)(%90'⨯++⨯==tc tm tc tmT T S ,其中tm=5tc ,代入公式,得到加速比S=3.33。

计算机体系结构习题答案

计算机体系结构习题答案

一、(5分)计算机系统设计中经常使用的4个定量原理是什么?请简要说明它们的含义。

答:(1)以经常性事件为重点。

在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。

(2)Amdahl 定律。

加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

(3)CPU 性能公式。

执行一个程序所需的CPU 时间 = IC ×CPI ×T 。

(4)程序的局部性原理。

程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

二、(15分)假设某应用程序中有4类操作,通过改进各类操作的功能部件,可(2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少? 答:根据Amdahl 定律aff S n +-=)1(1,其中f 是可改进部分在总运行时间中所占比例,a 是可改进部分的加速比,可得4类操作均改进后,整个程序的加速比:11.77(1)n ii iS FF S =≈-+∑∑三、(5分)请简述指令之间数据冲突的类型。

答:指令之间的数据冲突有3种类型:真相关、反相关、输出相关。

真相关(数据依赖,有时候也称为数据相关):考虑两条指令i 和j ,i 在j 的前面,指令k 在指令i 和指令j 之间。

如果下述条件之一成立,则称指令j 与指令i 真相关:(1)指令j 使用指令i 产生的结果(写后读);(2)指令j 与指令k 真相关,而指令k 又与指令i 真相关。

(真相关的传递性) 反相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 所写的名与指令i 所读的寄存器名或存储地址相同,则称指令i 和j 发生了反相关。

(读后写)输出相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 和指令i 所写的寄存器名或存储地址相同,则称指令i 和j 发生了输出相关。

(写后写) 其中反相关和输出相关又合称名相关。

计算机系统结构作业答案

计算机系统结构作业答案

计算机系统结构计算机系统结构作业1第1章计算机系统结构的基本概念一、解释下列术语:计算机系统结构;计算机组成;计算机实现;透明性;系列机;软件兼容;兼容机;模拟;仿真;虚拟机;宿主机;Amdahl定律;CPI;MIPS;MFLOPS。

【答案】计算机系统结构、计算机组成和计算机实现是三个不同的概念。

系统结构定义为由程序设计者所看到的一个计算机系统的属性,即概念性结构和功能特性,这里的程序设计者所看到的计算机属性是指为机器语言或编译程序设计者所看到的计算机属性,是硬件子系统的概念性结构及其功能特性,它是计算机系统的软、硬件的界面。

计算机组成是计算机系统结构的逻辑实现,包括机器内部的数据流和控制流的组成以及逻辑设计等。

计算机实现是指计算机组成的物理实现。

透明性:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,成为透明性现象。

所谓系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。

不同公司厂家生产的具有相同系统结构的计算机称为兼容机。

软件兼容:在新的计算机系统出台后,原先已开发的软件仍能继续在升档换代的新型号机器上使用,这就是软件兼容。

系列机方法能够在具有相同系统结构的各种机器之间实现软件移植,为了实现软件在不同系统结构的机器之间的相互移植,可以采用模拟和仿真。

模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。

仿真是指用微程序直接解释另一种机器指令系统的方法。

虚拟机是被模拟的机器;宿主机是进行模拟的机器。

Amdahl 定律:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。

Fe=(改进前可改进部分占用的时间)/(改进前整个任务的执行时间) Se=(改进前可改进部分的执行时间)/(改进后改进部分的执行时间) 则,改进后整个系统加速比为ee e n S F F s /)1(1+-=。

计算机系统结构答案

计算机系统结构答案

一、选择题1、对汇编语言程序员,下列(A )不是透明的。

A: 中断字寄存器 B: 乘法器 C: 移位器 D: 指令缓冲器2、假设对A机器指令系统的每条指令的解释执行可直接由B机器的一段微程序解释执行,则A称为(D )。

A: 仿真机 B: 宿主机 C: 虚拟机 D: 目标机3、 1. 查看下面三条指令:V3←A;V2←V0+V1;V4←V2*V3;假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。

三条指令全部采用串行的方法,那么执行的时间是:A: 3N+20 B: 3N+21 C: 3N+22 D: 3N+234、某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。

采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停的情况下,接着计算(D+E)*F。

求此链接流水线的通过时间是多少拍?(设寄存器出入各需1拍)A: 8 B: 9 C: 17 D: 185、设有一个4个处理器的MIMD系统,假设在系统中访存取指和取数的时间可以忽略不计;加法与乘法分别需要2拍和4拍;在MIMD系统中处理器(机)之间每进行一次数据传送的时间为1拍;在MIMD系统中,每个PE都可以和其它PE有直接的的通路。

求利用此系统计算表达式所需的节拍数。

A: 23 B: 12 C: 11 D: 106、以下哪些是周期窃取方式的特点?A : 硬件结构简单B : 硬件结构复杂C : 数据输入或输出过程中占用了CPU时间D : 数据输入或输出过程中不占用CPU时间7、从下列有关Cache的描述中,选出应填入空格中的正确答案:(1)今有甲、乙两台计算机,甲计算机的Cache存取时间为50ns,主存储器为2us;乙计算机的Cache存储时间为100ns,主存储器为1.2us。

计算机系统结构答案

计算机系统结构答案

第一章2 执行第2、第3、第4级的一条指令各需KNns、KN2ns、KN3ns的时间。

3 这样做,可以加快操作系统中操作命令的解释速度,同时也节省了存放解释操作命令这部分解释程序所占的存储空间,简化了操作系统机器级的设计,也有利于减少传统机器级的指令条数。

4 第2、3、和4级上的一段等效程序分别需要KN/Ms、KN2/M2s、KN3/M3s的时间。

13(1)可以。

因为它虽然是属计算机系统结构的内容,但它是新增加的数据类型和指令,不会影响到已有指令所写的程序的正确运行,只是现在用新增加的指令来写程序,会使计算机的性能和效率变得更好。

(2)不可以。

中断的分级和中断的响应次序等中断机构都属于计算机系统结构的内容。

中断分级由原来的4级增加到5级应当还是允许的,关键是重新调整了中断响应的优先次序,这就使原有程序的中断响应次序发生了改变,会影响原有程序工作得正确性。

(3)可以。

Cache存贮器属于计算机组成,它不会改变原有的系统程序和应用程序,不会影响到它们的正常运行,只是有了Cache存贮器后,系统的性能有了明显的提高。

(4)可以。

浮点数尾部的下溢处理不属于计算机系统结构,而是计算机组成设计所考虑的内容。

(5)不可以。

指令的操作码、字段格式、寻址方式等的指明都是计算机系统结构的内容,如果将它们加以改变,就会直接导致以前编写的程序都不能正确运行了。

(6)可以。

数据通路宽度是计算机组成的内容。

(7)可以。

单总线改为双总线是计算机组成的内容。

(8)不可以。

通用寄存器的德使用是属于计算机系统结构的内容。

0号通用寄存器该作堆栈指示器,将使原先程序中0号通用寄存器中的内容改变直接影响到堆栈指针的位置发生变化,造成程序无法正常工作的局面。

第二章6 p=6、m=48时,在非负阶、规格化、正尾数情况下,r m=2、8、16时的各个参数的计算结果如表2.1所示。

8ROM下溢处理表16个单元的地址码0000~1111,它与其内容(即下溢处理后的3位结果值)的对照表关系如表2.2所示。

《计算机系统结构》及参考答案

《计算机系统结构》及参考答案

《计算机系统结构》练习题一一、单项选择题1。

页式虚拟存储器得地址变换对于 D 就是透明得、ﻩA、操作系统设计者ﻩﻩB、任何程序员C、系统结构设计者D、应用程序员2.以下各类中断中,属于自愿中断得就是C、ﻩA、外部中断B、 I/O中断ﻩC、执行“访管”指令D、机器校验中断3、高速外部设备磁盘机适合连接于 C 、A、选择通道或字节多路通道ﻩB、数组多路通道或字节多路通道C、数组多路通道或选择通道ﻩﻩD、任意一种通道4、页式虚拟存储器页表得作用就是A、ﻩA、反映虚页在主存得存储情况B、仅反映虚页就是否调入主存C、反映主存实页与Cache得对应关系D、反映虚页在辅存得存储情况5.软件与硬件得功能在逻辑上就是C得、A、固件优于软件ﻩﻩB、不等价C、等价ﻩﻩﻩD、软件优于固件6、计算机中最优化得操作码编码方法就是 D 、ﻩD、哈夫曼编码A、BCD码ﻩﻩﻩB、ASCII码C、扩展操作码ﻩﻩﻩ7、从计算机系统执行程序得角度瞧,并行性等级由低到高分为四级 A 、A.指令内部—-指令之间-—进程之间-—程序之间B。

指令之间——指令内部-—进程之间-—程序之间ﻫC。

进程之间——指令之间——指令内部——程序之间D.程序之间—-进程之间——指令之间——指令内部8、计算机系统多级层次结构中,操作系统机器级得直接上层就是D、A.传统机器级ﻩB。

高级语言机器C.应用语言机器级ﻩD.汇编语言机器级9、全相联地址映像就是指A、A、任何虚页都可装入主存中任何实页得位置B、一个虚页只装进固定得主存实页位置ﻩC、组之间就是固定得,而组内任何虚页可以装入任何实页位置D、组间可任意装入,组内就是固定装入10.对于同一系列机,必须保证软件能够 C 、A。

向前兼容,并向上兼容ﻩB。

向前兼容,并向下兼容C.向后兼容,力争向上兼容ﻩD.向后兼容,力争向下兼容11。

设有16个处理单元得并行处理机系统,采用共享主存得方式、若同时存取16个数据, 为避免存储器访问冲突,共享主存得多体数量应该为 C 才合理、ﻩA、15ﻩﻩﻩﻩB、16ﻩC、17ﻩﻩD、1912、软件兼容得根本特征就是C、A、向前兼容ﻩﻩB、向后兼容C、向上兼容ﻩD、向下兼容ﻩ13、在下列机器中,能够实现软件兼容得机器就是B、A、完全不同种类得机型ﻩB、系统结构相同得机器ﻩﻩC、宿主机与目标机ﻩD、虚拟机ﻩ14。

计算机系统结构习题答案(李学干)

计算机系统结构习题答案(李学干)

计算机系统结构习题解答第一章习题一1.2一台经解释实现的计算机,可以按照功能划分成4级。

每一级为了执行一条指令需要下一级的N条指令解释。

若执行第1级的一条指令需K纳秒时间,那么执行第2、3、4级的一条指令个需要多少时间?解:①分析:计算机按功能分级时,最底层的为第1级。

向上一次是第2 、3、4级。

解释执行是在低级机器级上,用它的一串指令或语句来解释执行高一级上的一条指令的功能。

是逐条解释的。

②解答:执行第2、3、4级的一条指令各需KNns,KN2ns,KN3ns的时间。

1.3操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接实现,而不由操作系统自己来实现。

根据你对习题1.2的回答,你认为这样做有哪两个好处?答:可以加快操作系统操作命令解释的速度。

同时也节省了存放解释操作命令这部分解释程序所占用的空间。

简化了操作系统机器级的设计。

也有利于减少传统机器级的指令条数。

1.5硬件和软件在什么意义上是等效的?在什么意义上是不等效的?试举例说明。

答:硬件和软件在逻辑意义上是等效的。

在物理意义上是不等效的。

①在原理上,用硬件或固件实现的功能完全可以用软件来完成。

用软件实现的功能也可以用硬件或固件来完成。

功能一样。

②只是反映在速度、价格、实现的难易程度上,这两者是不同的。

性能不同。

③例如,浮点运算在80386以前一直是用软件实现的。

到了80486,将浮点运算器集成到了CPU中,可以直接通过浮点运算指令用硬件实现。

但速度却高的多。

1.9下列哪些对系统程序员是透明的?哪些对应用程序员是透明的?系列机各档不同的数据通路宽度;虚拟存储器;Cache存储器;程序状态字;“启动I/O”指令;“执行”指令;指令缓冲器。

答:①对系统程序员和应用程序员均透明的:是全用硬件实现的计算机组成所包含的方面。

有:数据通路宽度、Cache存储器、指令缓冲器。

②仅对应用程序员透明的:是一些软硬件结合实现的功能。

有:虚拟存储器、程序状态字、“启动I/O”指令。

《计算机系统结构》及参考答案精选全文完整版

《计算机系统结构》及参考答案精选全文完整版

可编辑修改精选全文完整版《计算机系统结构》练习题一一、单项选择题1.页式虚拟存储器的地址变换对于 D 是透明的.A. 操作系统设计者B. 任何程序员C. 系统结构设计者D. 应用程序员2.以下各类中断中,属于自愿中断的是 C .A. 外部中断B. I/O中断C. 执行“访管”指令D. 机器校验中断3. 高速外部设备磁盘机适合连接于 C .4. 页式虚拟存储器页表的作用是 A .A. 反映虚页在主存的存储情况B. 仅反映虚页是否调入主存C. 反映主存实页与Cache的对应关系D. 反映虚页在辅存的存储情况5.软件和硬件的功能在逻辑上是 C 的.D.软件优于固件6. 计算机中最优化的操作码编码方法是 D .码码C.扩展操作码 D.哈夫曼编码7. 从计算机系统执行程序的角度看,并行性等级由低到高分为四级 A .A.指令内部——指令之间——进程之间——程序之间B.指令之间——指令内部——进程之间——程序之间C.进程之间——指令之间——指令内部——程序之间D.程序之间——进程之间——指令之间——指令内部8. 计算机系统多级层次结构中,操作系统机器级的直接上层是 D .A.传统机器级B.高级语言机器C.应用语言机器级D.汇编语言机器级9.全相联地址映像是指 A .A.任何虚页都可装入主存中任何实页的位置B.一个虚页只装进固定的主存实页位置C.组之间是固定的,而组内任何虚页可以装入任何实页位置D.组间可任意装入,组内是固定装入10.对于同一系列机,必须保证软件能够 C .A.向前兼容,并向上兼容B.向前兼容,并向下兼容C.向后兼容,力争向上兼容D.向后兼容,力争向下兼容11.设有16个处理单元的并行处理机系统, 采用共享主存的方式. 若同时存取16个数据, 为避免存储器访问冲突, 共享主存的多体数量应该为 C 才合理.A. 15B. 16C. 17D. 1912. 软件兼容的根本特征是 C .A. 向前兼容B. 向后兼容C. 向上兼容D. 向下兼容13.在下列机器中,能够实现软件兼容的机器是 B .A. 完全不同种类的机型B. 系统结构相同的机器C. 宿主机和目标机D. 虚拟机14.输入输出系统硬件的功能对 C 是透明的。

计算机系统结构(课后习题答案)

计算机系统结构(课后习题答案)

第一章计算机系统结构的基本概念1。

有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。

现若需第i级的N 条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答:第2级上等效程序需运行:(N/M)*Ks.第3级上等效程序需运行:(N/M)*(N/M)*Ks。

第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。

note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。

而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。

所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。

答:软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。

但是实现的性能价格比,实现的难易程序不同。

在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件.3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。

答:计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。

(1)计算机的系统结构相同,但可采用不同的组成。

如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。

从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。

其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。

计算机系统结构第1章部分习题参考答案

计算机系统结构第1章部分习题参考答案

第1章部分习题参考答案1.1 解释下列术语⏹翻译:先用转换程序将上一级机器级上的程序整个地变换成下一级机器级上可运行的等效程序,然后再在下一级机器级上去实现的技术。

⏹解释:在下一级机器级上用它的一串语句或指令来仿真上一级机器级上的一条语句或指令的功能,通过对上一级机器语言程序中的每条语句或指令逐条解释来实现的技术。

⏹层次结构:将计算机系统由上往下依次划分为应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器级和微程序机器级。

对于一个具体的计算机系统,层次的多少会有所不同。

⏹计算机系统结构:传统机器级的程序员所看到计算机的基本属性,即计算机的概念性结构和功能特性。

简称为计算机的外特性。

⏹计算机组成:计算机系统结构的逻辑实现,也常称为计算机组织。

该组织包括机器级内的数据流和控制流的组成以及逻辑设计等。

⏹计算机实现:计算机组成的物理实现。

它包括处理机、主存等部件的物理结构,器件的集成度、速度和信号,器件、模块、插件、底板的划分与连接,专用器件的设计,电源、冷却、装配等技术。

⏹透明性:本来存在的事物或属性,但从某个角度看似乎不存在,称为透明性现象。

⏹固件:是一种具有软件功能的硬件。

如将软件固化在ROM中,就是一种固件。

⏹由上往下设计:先考虑如何满足应用要求,确定好面对使用者那级机器应有什么基本功能和特性,然后再逐级往下设计,每级都考虑怎样优化上一级实现。

这种方法适合于专用机设计。

⏹由下往上设计:根据现有的部件,并参照或吸收已有各种机器的特点,先设计出微程序机器级(如果采用微程序控制)及传统机器级,然后再为不同应用配置多种操作系统和编译系统软件,采用合适的算法来满足相应的应用。

这是20世纪60-70年代前常用的通用机设计思路。

⏹系列机:同一厂家生产的具有相同系统结构,但具有不同组成和实现的一系列的机器。

⏹软件兼容:同一软件可以不加修改地运行于系统结构相同的不同档次的机器上,而且它们所获得的结果一样,差别只是运行时间不同。

(完整版)计算机系统结构网上作业参考答案

(完整版)计算机系统结构网上作业参考答案

计算机系统结构作业参考答案一、1、试述现代计算机系统的多级层次结构。

计算机系统具有层次性,它由多级层次结构组成。

从功能上计算机系统可分为五个层次级别:第一级是微程序设计级。

这是一个硬件级,它由机器硬件直接执行微指令。

第二级是一般机器级,也称为机器语言级。

它由微程序解释机器指令系统.这一级是硬件级。

第三级是操作系统级,它由操作系统程序实现。

这些操作系统由机器指令和广义指令组成,这些广义指令是操作系统定义和解释的软件指令。

这一级也称混合级。

第四级是汇编语言级。

它给程序人员提供一种符号形式的语言,以减少程序编写的复杂性。

这一级由汇编程序支持执行。

第五级是高级语言级。

这是面向用户为编写应用程序而设置的。

这一级由各种高级语言编译程序支持。

2、试述RISC设计的基本原则和采用的技术。

答:一般原则:(1)确定指令系统时,只选择使用频度很高的指令及少量有效支持操作系统,高级语言及其它功能的指令,大大减少指令条数,一般使之不超过100条;(2)减少寻址方式种类,一般不超过两种;(3)让所有指令在一个机器周期内完成;(4)扩大通用寄存器个数,一般不少于32个,尽量减少访存次数;(5)大多数指令用硬联实现,少数用微程序实现;(6)优化编译程序,简单有效地支持高级语言实现。

基本技术:(1)按RISC一般原则设计,即确定指令系统时,选最常用基本指令,附以少数对操作系统等支持最有用的指令,使指令精简。

编码规整,寻址方式种类减少到1、2种。

(2)逻辑实现用硬联和微程序相结合。

即大多数简单指令用硬联方式实现,功能复杂的指令用微程序实现。

(3)用重叠寄存器窗口。

即:为了减少访存,减化寻址方式和指令格式,简有效地支持高级语言中的过程调用,在RISC机器中设有大量寄存嚣,井让各过程的寄存器窗口部分重叠。

(4)用流水和延迟转移实现指令,即可让本条指令执行与下条指令预取在时间上重叠。

另外,将转移指令与其前面的一条指令对换位置,让成功转移总是在紧跟的指令执行之后发生,使预取指令不作废,节省一个机器周期。

计算机体系结构复习题(有答案)

计算机体系结构复习题(有答案)
《体系结构复习题》 一、选择题(15 分) 1. 计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是( ) A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级语言机器级---汇编语言机器级 D. 汇编语言机器级---应用语言机器级---高级语言机器级 2. 对系统程序员不透明的是( ) A.Cache 存储器 B.系列几各档不同的数据通路宽度 C.指令缓冲寄存器 D.虚拟存储器 3. 在计算机系统设计中,比较好的方法是( ) A.从上向下设计 B.从下向上设计 C.从两头向中间设计 D.从中间开始向上、向下设计 4. 不同系列的机器之间,实现软件移植的途径不包括( ) A.用统一的高级语言 B.用统一的汇编语言 C.模拟 D.仿真 5. 堆栈型机器比通用寄存器型机器优越的是( ) A.支持先进先出类接替算法的求解 B.能更好地支持向量的运算 C. 支 持 由 逆 波 兰 表 达 式 将 高 级 语 言 多 元 赋 值 语 句 直 接 编 译 生 成 堆 栈 指 令 程 序 D.能优化存储器的空间利用率 6. 浮点数尾数基值 rm=8,尾数数值部分长 6 位,可表示的规格化最小正尾数为( ) A.0.5 B.0.25 C.0.125 D.1/64 7. 在尾数下溢处理方法中,平均误差最大的是( ) A.截断法 B.舍入法 C.恒置“1”法 D.ROM 查表法 8. ILLIAC Ⅳ是一种( ) A.流水线处理机 B.指令重叠处理机 C.阵列处理机 D.多处理机 9. 能实现作业、任务级并行的异构型多处理机属( ) A.MISD B.SIMD C.MIMD D.SISD 10.非线性流水线是指( ) A.一次运算中使用流水线中多个功能段 B.一次运算中要多次使用流水线中的某些功能段 C. 流水线中的某些功能段在各次运算中的作用不同 D. 流水线中的各个功能段在各种运算中有不同的组合 11.流水机器对全局性的相关处理不包括( ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路 12.外部设备打印机适合于连接( ) A.数组多路通道或选择通道 B.字节多路通道或选择通道 C.选择通道 D.任意一种通道 13.虚拟存储器常用的地址映像方式是( ) A.全相联 B.段相联 C.组相联 D.直接

(完整版)系统结构简答题答案

(完整版)系统结构简答题答案

《计算机系统结构》简答题复习资料1.简述标志符数据表示的主要优点(1)简化了指令系统和程序设计;(2)简化了编译程序;(3)便于实现一致性校验;(4)能由硬件自动变换数据类型;(5)支持数据库系统的实现与数据类型无关的要求;(6)为软件调试和应用软件开发提供了支持。

2.简述哈夫曼压缩概念的基本思想。

哈夫曼压缩概念的基本思想是,当各种事件发生的概率不均等时,采用优化技术对发生概率最高的事件用最短的位数(时间)来表示(处理),而对出现概率较低的,允许用较长的位数(时间)来表示(处理),就会导致表示(处理)的平均位数(时间)的缩短。

3.RISC存在不足表现在哪些方面?(1)、由于指令少使原来在CISC上由单一指令完成的某些复杂功能现在要用多条RISC指令才能完成,加重了汇编语言程序设计的负担,增加了机器语言程序的长度,占用存储空间多,加大了指令的信息流量。

(2)、对浮点运算执行和虚拟存储器的支持虽有很大加强,但仍显得不足。

(3)、RISC机器的编译程序比CISC的难写。

4.简述设计RISC结构用了哪些基本技术?(1)按RISC一般原则设计;(2)逻辑实现用硬联和微程序结合;(3)用重叠寄存器窗口(4)指令用流水和延迟转移;(5)优化设计编译系统。

5.简述计算机系统“由中间开始”设计的基本思想。

(1)软硬件设计分离和脱节是”由上往下”和“由下往上”设计的主要缺点,由此提出“有中间开始”设计。

“中间”提的是层次结构中的软硬交界面,目前多数实在传统机器级与操作系统机器级之间。

(2)进行合理的软、硬件功能分配时,既要考虑能拿到的硬、器件,又要考虑可能的应用所需的算法和数据结构,先定义好这个交界面。

确定哪些功能由硬件实现,哪些功能由软件实现,同时还要考虑好硬件对操作系统、编译系统的实现提供些什么支持。

然后由这个中间点分别往上往下进行软件和硬件的设计。

6.简述计算机系统结构、组成和实现三者的相互关系。

结构、组成、实现三者互不相同,但又互相影响:相同结构(如指令系统相同)的计算机,可以因速度不同而采用不同的组成。

计算机系统结构习题答案

计算机系统结构习题答案

计算机系统结构习题答案计算机系统结构是计算机科学与技术领域中的一个重要分支,它涉及到计算机硬件的设计和实现,以及与软件的交互。

以下是一些常见的计算机系统结构习题及其答案。

1. 指令集架构(ISA)是什么?答案:指令集架构(ISA)是计算机体系结构中定义计算机硬件能执行的指令类型和操作方式的规范。

它包括指令的格式、操作数类型、寻址模式、寄存器组织等。

2. 流水线技术是如何提高计算机处理速度的?答案:流水线技术通过将指令执行过程分解为多个阶段,使得多个指令可以同时在不同的阶段执行,从而减少了每条指令的执行时间,提高了计算机的处理速度。

3. 什么是缓存一致性问题?答案:缓存一致性问题是指在多处理器系统中,每个处理器可能有自己的缓存,当多个处理器访问同一数据时,如果缓存数据不一致,就会产生一致性问题。

解决这个问题通常需要使用缓存一致性协议。

4. 虚拟内存是如何工作的?答案:虚拟内存是一种内存管理技术,它允许计算机使用磁盘空间作为内存的一部分。

操作系统将物理内存和磁盘空间映射,使得应用程序可以访问比物理内存更大的地址空间。

当物理内存不足时,操作系统会将不常用的数据从内存转移到磁盘,释放内存给其他程序使用。

5. 解释冯·诺伊曼结构和哈佛结构的区别。

答案:冯·诺伊曼结构是一种计算机组织方式,其中程序指令和数据使用相同的总线和存储器。

哈佛结构则将指令存储器和数据存储器分开,允许同时访问指令和数据,提高了执行效率。

6. 什么是超标量处理器?答案:超标量处理器是一种设计,允许同时执行多条指令。

这种处理器通常具有多个执行单元,可以同时处理多条指令的不同部分,从而提高性能。

7. RISC和CISC的区别是什么?答案:RISC(精简指令集计算机)使用简单、统一的指令集,每条指令执行时间短,适合流水线处理。

CISC(复杂指令集计算机)则包含更多的指令,每条指令可以执行更复杂的操作,但执行时间较长,流水线效率较低。

计算机系统结构__《张晨曦、王志英》课后习题参考答案

计算机系统结构__《张晨曦、王志英》课后习题参考答案

计算机系统结构__《张晨曦、王志英》课后习题参考答案第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

计算机系统结构(有详细答案)

计算机系统结构(有详细答案)

(仅供参考,不作为考试标准),选择题(30分,每题2分)计算机系统结构设计者所关心的是________所看到的的计算机结构。

A)硬件设计人员B)逻辑设计人员C)机器语言或汇编语言程序员D)高级语言程序员在计算机系统设计时,为了提高系统性能,应当注意________。

A)加快经常性使用指令的执行速度B)要特别精心设计少量功能强大的指令C)要减少在数量上占很小比例的指令的条数D)要加快少量指令的速度重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。

A)JMP指令影响流水线B)CALL指令的现场保护C)只有LOAD和STORE指令带来的访问存储器不便D)存储器访问速度为使流水计算机运行效率高________A)各过程段时间要不同B)连续处理的任务类型应该不同C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。

A)近期最少使用法B)近期最久未用法C)先进先出法D)页面失效频率法与全相联映象相比,组相联映象的优点是________。

A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。

A)不准修改指令B)设相关专用通路C)推后分析下条指令D)推后执行下条指令流水操作中,遇到数据相关时,采用的解决办法有________。

A)用优化编译器检测,通过指令重新排序的办法B)数据重定向技术C)延迟转移技术D)加快和提前形成条件码经多级网络串联来实现全排列网络,只能用________。

A)多级立方体网络B)多级PM2I网络C)多级混洗交换网络D)上述任何网络.虫蚀寻径以流水方式在各寻径器是顺序传送的是________。

A)消息B)包C)片D)字节超标量处理机________A)在一个时钟周期内分时发射多条指令B)只有一个操作部件C)在一个时钟周期内同时发射多条指令D)只有一个取指部件流水线的技术指标不包括________A)响应比B)吞吐率C)加速比D)效率向量处理机属于________A)SISD B)SIMD C)MISD D)MIMD________属于MIMD系统结构。

计算机体系结构1-6章习题答案

计算机体系结构1-6章习题答案

1 2 3 4 5 6
8 16 24 32 40 48
1*82
2*82 3*82 4*82 5*82 6*82 7*82
4/8 5/8 6/8
7/8
7
56
2)规格化浮点数表: rm=2时,规格化浮点数共有4*8=32个 rm=8时,规格化浮点数共有7*8=56个,在[0.5,112]中, 有数19个(上表中红的数字表示)。
§4通道(CH)
一、CH的基本工作原理 CH执行CH程序的过程 CH的任务 二、CH流量计算和时空图绘制 CH的类型 CH流量计算 字节多路CH响应处理时空图的绘制 1)计算每个子CH提供一个字节时间(1/f) 2)画出一个完整申请周期时空图 3)计算字节多路CH对每个字节响应的最长用时
第一章参考答案: 1.应用语言级 高级语言级 汇编语言级 操作系统级 机器语言级 微程序语言级。 2. 从上而下 从下到上 专用机 通用机 3. 软、硬件交界面 计算机系统的性能/价格比 4 . 1 T FLOPS 的计 算能力 1 TBy te 的 主存容量 1 TByte/s 的I/O带宽 5. 虚拟机 实际机器 6. 统一高级语言 模拟 仿真 系列机 7. 控制流 数据流 SISD SIMD MISD MIMD 8. 汇编语言程序员 9. 任务单一化 操作重叠化 吞吐匹配化 程序多道 化
嵌套
中断处理程序 一 二 三 响② 嵌套 四 五
t
返回主程序
例4 解 (1)处理顺序为 2-3-1-5-4 (2)中断响应处理时空图 中断请求 主程序 ①③ ②③④⑤
嵌套
中断处理程序 一 二 三 四 五
响① 嵌套
t
返回主程序
1 分别利用两级描述符和三级描述符描述下列阵列数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(仅供参考,不作为考试标准),
选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。

A)硬件设计人员B)逻辑设计人员
D)高级语言程序员C)机器语言或汇编语言程序员。

意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速。

的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储
________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同
D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同
栈型替是的________。

换算法堆不属于B)近期最少A)近期最使用法久未用法
D)页面失效频率法出进C)先先法
象联组,相映的优点。

是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高
是方好关相指除中叠次一重消令最的法________。

B)设相关专用令指改准A)不修通路
令指条下析分后推C) 令指条下行执后推D)
流的用采,时关据数到,中作水操遇相________。

有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术
C)延迟转移技术
D)加快和提前形成条件码
经多级网络串联来实现全排列网络,只能用________。

A)多级立方体网络B)多级PM2I网络
D)上述多级混洗交换网络任何网络C)
序传送的________。

是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字
________
处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)
________ 流水括标不包线的技术指率比加B) 应A)响比吞吐率C)速D)效
________ 属于机向量处理D)MIMD
B)SIMD A)SISD C)MISD
系。

统结构属________于MIMD 同一的管理元个控制单时元理A)各处单同受的送单一时理各B)处单元同接受同个控制元来指令机算机理和多计处C)多机处理阵D)列
储的储,单处机处并计BSP算机的行理有16个理元并行存器存体个数________。

为B)1
C)32
D)17A)16
判断题正确打√,错误打╳,分,每题分)10(1( ×)对计算机系统中经常使用的基本单元功能,宜于用软件来实现,这样可降低系统的成本。

(√)处理机级流水线又称为指令流水线。

( ×)由于RISC简化了指令系统,因此,RISC上的目标程序比CISC上的目标程序要短一些,程序执行的时间就会少一些。

( ×)在存储体系中,地址的映象与地址的变换没有区别。

( ×)在满足Cache与主存的一致性方面,写回比写直达法好。

( ×)Cache组相联映象的块冲突概率比直接映象的高。

(√)采用LRU替换的Cache存储器,分配给程序的Cache容量一定时,块的大小增加,Cache的命中率将先上升,到一定时候又会逐渐降低。

(×)阵列处理机以多个处理机构成阵列。

( √)SIMD计算机的算法极大地依赖于机器的系统结构。

(×)解决多处理机Cache不一致性问题是基于链式目录的协议优点是限制了共享数据块的拷贝数量。

综合题
(10分)如果某计算机系统有3个部件可以改进,则这三个部件经改进后的加速比分别为:S1=30,S2=20,S3=10。

(1)如果部件1和部件2改进前的执行时间占整个系统执行时间的比例都为30%,那么,部件3
改进前的执行时间占整个系统执行时间的比例为多少,才能使3个部件都改进后的整个系统的加速比Sn达到10
(2)如果3个部件改进前执行时间占整个系统执行时间的比例分别为30%、30%和20%,那么,3个部件都改进后系统的加速比是多少未改进部件执行时间在改进后的系统执行时间中占的比例是多少
,5%,10%,,别为35%25%,20%使条共有7指令,各指令的用频率分机一(10分)台模型。

3%和2%。

长平均度设算所计操作码的,并码设度的求(1)要操作码平均长最短,请计操作的编码计存储器型变址寻址方式-16位字长的寄存器-8字长的寄存器寄存器型指令3条,(2)设计127。

请设计指令格式,并给出各字段的长度和操作码的编码。

指令4条,变址范围不小于±
解:
Huffman)要使得到的操作码长度最短,应采用解:(1树如下:编码,构造Huffman
S1S2 S3S4这样,采用Huffman编码法得到的操作码的平均长度为:
H = 2×++ + 3×+ 4 ×+ 5×+
=+++
=
(10分)有一个4段流水线,如下图所示:
S1S2S3S4
其中,段S1和S3的执行时间均为200ns,段S2和S4的执行时间均为100ns。

若瓶颈段S1可使用细分方法改造,瓶颈段S3可使用并联方法改造,对改造后的流水线,分别使用公式和时空图求连续流入4条指令的实际吞吐率和效率
(10分)设向量长度均为64,在Cray-1机上所用浮点功能部件的执行时间分别为:相加6拍,相乘7拍,求倒数近似值14拍;从存储器读数6拍,打入寄存器及启动功能部件各1拍,问下列各指令组,组内的哪些指令可以链接哪些指令不可链接不能链接的原因是什么
分别计算出各指令组全部完成所需要的拍数。

(2)V2<--V0*V1(3)V0<--存储器存储器(4)V0<--存储器(1)V0<--存储器V3<--V1<--1/V0 V1<--V2+V3 V2<--V0*V1 V3<--V1*V2 V3<--V2+V0 V4<--V5*V6
V4<--V2+V3 V5<--V3+V4 V5<--V3+V4
解:(1)3 条向量指令之间既没有发生源Vi 冲突,也没有Vi 的先写后读相关,又不存在功能部件的使用冲突,所以这3 条向量指令可以同时并行流水。

向量指令组全部完成需要
max{(1+6(访存)+1+64-1),(1+6(浮加)+1+64-1),(1+7(浮乘)+1+64-1)}
=72拍。

(2)3 条向量指令之间没有功能部件的使用冲突,但是在第1、2 两条向量指令与第3 条向量指令之间有V2 及V3 的先写后读相关。

只要让第1 条向量指令较第2 条向量指令提前1 拍启动,则第1,2 两条向量指令的第1 个结果元素就可以被同时链接到第3 条向量指令中。

(1+7(浮乘)+1)+(1+6(浮加)+1+64-1)
=80(拍)。

(3)第1 条向量指令与第2 条向量指令之间有V0 的先写后读相关,两者可以链接。

第3
条向量指令与第2 条向量指令之间有源向量寄存器V0 的冲突,它们之间只能串行。

第3
条向量指令与第4 条向量指令之间有加法功能部件的使用冲突,它们之间也只能串行。

)+1+64-1)浮加乘)+1+64-1)+(1+6( 访存)+1+64-1)+(1+6( (1+6( 访存)+1+1+7( 浮。

拍)=222(冲用的使功能部件,但无源Vi 冲突,也无依(4)4 条向量指令均次有Vi 的先写后读相关水。

,进行流以全部链接在一起以突,所,这4 条向量指令可加)+1)+64-1乘)+1)+(1+6(浮)+1)+(1+(7 访
存)+1)+(1+14(求倒数浮(1+6(=104 拍。

表所示其预约表如下Δ水线,各段执行时间均为t,一(10分)有个5段流时间tt1t2t3t4t5t6t7S 段XS1XXS2XXXS3XS4XXXS5
(1)列出禁止表F和冲突向量C。

(2)画出流水线调度的状态图。

(3)分别求出允许不等时间间隔调度和等时间间隔调度的两种最优调度策略,以及这两种调度策略的流水线最大呑吐率。

(4)若连续输入10个任务,求这两种调度策略的流水线实际呑吐率和加速比。

解:
(1)禁止向量F=(1,3,6) (1 分)
冲突向量C=(100101) (1 分)
(2)
(3)
最小启动循环(2,2,5) 最小平均延迟(2+2+5)/3=3 TPmax=1/(3Dt) (1 分)
最小恒定循环(4)
TPmax=1/(4Dt) (1 分)
(4)
(10分)阵列机有0~7共8个处理单元互连,要求按(0,5),(1,4),(2,7),(3,6)配对通信。

(1)写出实现此功能的互连函数的一般式。

(2)画出用3级立方网络实现该互连函数的互连网络拓扑结构图,并标出各控制开关状态。

解:(1)
如下图所示:(2)。

相关文档
最新文档