计算机系统结构考试计算题
计算机系统结构试题库
一、单选(共计100分,每题2.5分)1、多处理机主要实现的是()并行性。
指令级B.任务级C.操作级D.线程级正确:【B】2、常用的虚拟存储系统由()两级存储器组成,其中辅存是大容量的磁表面存储器。
cache-主存B.主存-辅存C.cache-辅存D.通用寄存器-cache正确:【B】3、交叉存储器实质上是一种多模块存储器,它用()方式执行多个独立的读写操作。
流水B.资源重复C.顺序D.资源共享正确:【A】4、机器指令与微指令之间的关系是()。
用若干条微指令实现一条机器指令B.用若干条机器指令实现一条微指令C.用一条微指令实现一条机器指令D.用一条机器指令实现一条微指令正确:【A】5、下列指令编码中平均码长最短的是()。
哈弗曼编码B.等长编码C.不等长扩展编码D.等长扩展编码正确:【A】6、在系统结构设计中,提高软件功能实现的比例会()。
提高解题速度B.减少需要的存贮容量C.提高系统的灵活性D.提高系统的性能价格比正确:【C】7、ILLIAC IV是一种()。
流水线处理机B.指令重叠处理机C.阵列处理机D.多处理机正确:【C】8、某机字长64位,1位符号位,63位表示尾数,若用定点整数表示,则最大正整数为()。
263-1B.264-1C.263D.264正确:【A】9、全相联地址映象是指()。
任何主存块都可装入Cache 中任何块的位置B.一个虚页只装进固定的主存实页位置C.组之间是固定的,而组内任何虚页可以装入任何实页位置D.组间可任意装入,组内是固定装入正确:【A】10、最容易实现的替换算法()。
FIFOB.LRUC.OPTD.堆栈法正确:【A】11、在下面描述的汇编语言基本概念中,不正确的表述是()。
对程序员的训练要求来说,需要硬件知识B.汇编语言对机器的依赖性高C.用汇编语言编写程序的难度比用高级语言大D.汇编语言编写的程序执行速度比高级语言慢正确:【D】12、CPU要能预知未来被访问信息的地址是基于计算机程序具有的特性是()。
《计算机组成与系统结构》课程考试试卷(01卷)
)分; CRT,_C_A,超大规模集成电路B,集成电路C,晶体管D,电子管3.微型计算机中控制总线提供的完整信息是_D__A,存储其和I/O设备的地址码B,所有存储其和I/O设备的时序信号和控制信号C,来自I/O设备和存储器的响应信号D,上述各项4.某计算机字长是32位,它的存储容量是356KB,按字编址,它的寻址范围是__B__。
A,128K B,64K C,64KB D,128KB5.主机与I/O设备传送数据时,采用_A__,CPU 的效率最高。
A,DMA方式B,程序查询方式C,中断方式D,以上都可以6.DMA方式中,周期窃取是窃取一个__A___。
A,存取周期B,指令周期C,CPU 周期D,总线周期7.两个十六进制数7E5和4D3相加,得__C___。
A,(BD8)16 B,(CD8)16 C,(CB8)16 D,以上都不对8.运算型指令的寻址和转移型指令的寻址不同点在于_B___A,前者是短指令,后者是长指令B,前者取操作数,后者决定程序转移地址C,后者是短指令,前者是长指令D,后者取操作数,前者决定程序转移地址9.某机有四级中断,优先级从高到低依次为1,2,3,4。
若将优先级顺序修改,改后1级中断的屏蔽字是1011,2级中断的屏蔽字是1111,3级中断的屏蔽字是0011,4级中断的屏蔽字是0001,则修改后的优先顺序从高到低为_D_。
A,3,2,1,4B,1,3,4,2C,4,2,1,3D,2,1,3,410.在中断周期中,将允许中断触发器置“0”的操作由__A___完成。
A,硬件B,软件C,关中断指令D,开中断指令三,判断题(1*10=10分)1,控制器能理解、解释并执行所有的指令及存储结果。
(错)2,Zilog Z80是16位微处理器。
(错)3,总线的半同步通信方式既采用时钟信号,又采用握手信号。
(对)4,可编程的只读存储器不一定是可改写的。
(对)5,大多数个人计算机中可配置的最大主存容量受指令中地址码位数的限制。
计算机体系结构试卷试题(答案全)
一填空题(每空1分,共30分)1、系列机是指具有相同的体系结构,但具有不同组织和实现的一系列不同型号的机器。
2、存储程序计算机结构上的主要特点之一是以运算器为中心。
3、从计算机系统结构的多级层次结构可知,通常情况下,第1、2、3级用解释方法实现,第4或更高级用翻译方法实现。
4、对于最常见的事件,通常赋予它优先的处理权和资源使用权,这是计算机体系结构设计中的大概率事件优先原则。
5、容量为64块的Cache采用组相联方式映像,字块大小为128字节,每4块为一组,若主存容量为4096块,且以字编址,那么主存地址为 19 位,主存区号为 6 位。
6、可改进比例的值总是小于等于1 。
7、一般有两种策略来保存寄存器的内容,即:调用者保存和被调用者保存。
8、DLX指令集提供了立即数寻址、寄存器寻址、偏移寻址和寄存器间接寻址4种寻址方式。
9、对某流水线处理器测试时发现其存在结构冲突,通常可采用资源重复和流水化功能单元方法解决该问题。
10、编译器通过重新组织代码顺序消除暂停的技术被称为指令调度。
11、按照流水的级别可以把流水线分为部件级流水线、处理机级流水线和处理机间流水线。
12、为解决流水线使用非流水数据通路的寄存器引起冲突,在流水线设计中采用寄存器文件技术解决该问题。
13、Cache的替换算法常见的有 FIFO 、LRU 和随机法。
14、改进Cache性能的方法主要有降低失效率、减少失效开销和减少Cache命中时间。
15、减少流水线处理分支暂停时钟周期数的途径包括尽早判断分支转移是否成功和尽早计算出分支成功转移的PC值。
二、选择题(1—15题,每题1分,共15分)1、下面的指令中, A 不属于RISC处理器指令集。
A.ADD R4,[1000] B.LD R3,(R4) C.SUB R4,R3 D.SD 0(R3),R42. 在其它部件性能保持不变的情况下,对CPU性能的不断改进并没有获得期望的结果,这主要是受到了 A 的影响。
计算机系统结构考试试题
计算机系统结构考试试题一、选择题(每题 2 分,共 40 分)1、以下关于计算机系统结构的说法中,错误的是()A 计算机系统结构是指计算机系统的软、硬件的界面B 计算机系统结构是对计算机系统中各级界面的定义及其上下的功能分配C 计算机系统结构是指计算机系统的概念性结构和功能特性D 计算机系统结构与计算机组成和计算机实现无关2、提高并行性的技术途径不包括()A 时间重叠B 资源重复C 资源共享D 增加指令3、指令流水线中出现数据相关时,通常采用的解决办法不包括()A 停顿B 分支预测C 数据旁路D 指令预取4、以下关于存储系统的说法中,正确的是()A Cache 是为了弥补主存速度的不足B 虚拟存储器是为了扩大主存容量C 相联存储器是按地址访问的D 主存是按内容访问的5、以下关于中断的说法中,错误的是()A 中断是指计算机在执行程序过程中,遇到突发事件而中断当前程序的执行B 中断响应的过程包括关中断、保存断点、识别中断源、保护现场等C 中断向量是中断服务程序的入口地址D 中断处理的过程包括恢复现场、开中断、返回原程序等6、以下关于总线的说法中,错误的是()A 总线是连接计算机各部件的公共信息传输线B 总线可以分为数据总线、地址总线和控制总线C 同步总线的传输效率高于异步总线D 总线的带宽等于总线的时钟频率乘以总线的宽度7、以下关于输入输出系统的说法中,正确的是()A 程序查询方式的效率最高B 中断方式需要 CPU 不断查询设备状态C DMA 方式可以直接在内存和外设之间传输数据D 通道方式的功能比 DMA 方式强大8、以下关于多处理机系统的说法中,错误的是()A 多处理机系统是指由两个或两个以上的处理机组成的计算机系统B 多处理机系统的并行性比单处理机系统高C 多处理机系统的通信方式包括共享存储器和消息传递D 多处理机系统的性能只取决于处理机的数量9、以下关于流水线的说法中,正确的是()A 流水线的段数越多,流水线的效率越高B 流水线的吞吐率与流水线的段数无关C 流水线的加速比等于流水线的段数D 流水线的效率与任务的类型有关10、以下关于 RISC 指令集的说法中,错误的是()A RISC 指令集的指令长度固定B RISC 指令集的指令格式种类少C RISC 指令集的寻址方式简单D RISC 指令集的指令功能强大11、以下关于 CISC 指令集的说法中,正确的是()A CISC 指令集的指令长度可变B CISC 指令集的指令格式种类多C CISC 指令集的寻址方式复杂D 以上都是12、以下关于超标量技术的说法中,错误的是()A 超标量技术是指在一个时钟周期内同时发射多条指令B 超标量技术可以提高指令的并行度C 超标量技术需要增加硬件的复杂度D 超标量技术可以在任何指令集架构上实现13、以下关于向量处理机的说法中,正确的是()A 向量处理机是专门用于处理向量数据的计算机B 向量处理机的运算速度比标量处理机快C 向量处理机的并行性主要体现在指令级并行D 以上都是14、以下关于存储层次的说法中,错误的是()A 存储层次的目的是为了提高存储系统的性能价格比B 存储层次的性能由命中率、访问时间和失效开销决定C 增加 Cache 的容量可以提高命中率D 降低主存的访问时间可以提高存储层次的性能15、以下关于虚拟存储器的说法中,正确的是()A 虚拟存储器的容量等于主存容量加上辅存容量B 虚拟存储器的页面大小是固定不变的C 虚拟存储器的地址转换是由硬件完成的D 虚拟存储器的页面替换算法对系统性能有很大影响16、以下关于多总线结构的说法中,错误的是()A 多总线结构可以提高系统的性能B 多总线结构可以增加系统的可靠性C 多总线结构可以减少系统的成本D 多总线结构可以提高系统的可扩展性17、以下关于 I/O 接口的说法中,正确的是()A I/O 接口是 CPU 与外设之间的桥梁B I/O 接口可以实现数据格式的转换C I/O 接口可以实现数据缓冲和锁存D 以上都是18、以下关于 DMA 控制器的说法中,错误的是()A DMA 控制器可以接管总线控制权B DMA 控制器可以在内存和外设之间直接传输数据C DMA 控制器可以减少 CPU 的干预D DMA 控制器可以提高系统的并行性19、以下关于通道的说法中,正确的是()A 通道是一种具有特殊功能的处理器B 通道可以实现对 I/O 设备的统一管理C 通道可以提高系统的 I/O 性能D 以上都是20、以下关于计算机系统性能评价的说法中,错误的是()A MIPS 是衡量计算机性能的常用指标之一B MFLOPS 是衡量浮点运算性能的指标C 基准测试程序可以用来评价计算机系统的性能D 计算机系统的性能只取决于硬件的性能二、填空题(每题 2 分,共 20 分)1、计算机系统结构的经典定义是由提出的。
计算机组成原理与系统结构试卷
《计算机组成与系统结构》课程考试试卷( A 卷) 本试卷适用专业 :计科、网络、物联、软工 年级 : 考试时间:110分钟 考试方式: 闭卷 一、 单项选择题(每小题1分,共10分) 1.用于直接给出内存地址寻找内存中操作数的寻址方式称为______寻址。
A. 直接 B. 间接 C. 寄存器直接 D. 寄存器间接 2.______可区分存储单元中存放的是指令还是数据。
A .用户 B .运算器 C .存储器 D .控制器 3.系统总线中地址线的功用是 。
A. 用于指定主存单元和I/O 设备接口电路的地址 B. 用于传送主存物理地址和逻辑地址 C. 用于选择进行信息传输的设备 D. 用于选择主存单元 4.某计算机字长是16位,它的存储容量是512KB ,按字编址,它的寻址范围是______。
A .128K ;B .256K ;C .256KB ;D .128KB 。
5.在小数定点机中,下述第______种说法是正确的。
A .原码和反码不能表示 -1,补码可以表示 -1 B .三种机器数均可表示 -1 C .三种机器数均可表示 -1,且三种机器数的表示范围相同 D .三种机器数均不可表示 -1 6.相对寻址方式中,操作数的有效地址是______。
A .基址寄存器内容加上形式地址(位移量) B .程序计数器内容加上形式地址 C .变址寄存器内容加上形式地址 D .以上都不对 7.一个节拍信号的宽度是指______。
A .存储周期 B .时钟周期 C .机器周期 D .指令周期 8.将微程序存储在EPROM 中的控制器是______控制器。
A .硬布线 B .毫微程序 C .静态微程序 D .动态微程序 9.地址总线的宽度由总线的 定义。
A. 功能特性B. 电气特性C. 物理特性D. 时间特性10.三种集中式总线控制中,______方式对电路故障最敏感。
A .以下都不对B .计数器定时查询C .独立请求D .链式查询二 填空题(每小题3分,共15分)1.存储器和CPU 连接时,要完成______的连接、______的连接和______的连接,方能正常工作。
计算机系统结构考试计算题
有一指令流水线如下所示入 1 2 3 4 出 50ns 50ns 100ns 200ns(1) 求连续输入10条指令,该流水线的实际吞吐率和效率;(2) 该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。
对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)2200(ns)2009200)10050(50t )1n (t T maxm1i i pipeline =⨯++++=∆-+∆=∑= )(ns 2201T nTP 1pipeline-==45.45%1154400TP mtTP E m1i i≈=⋅=∆⋅=∑= (2)瓶颈在3、4段。
变成八级流水线(细分)850(ns)509850t 1)(n t T maxm1i i pipeline =⨯+⨯=∆-+∆=∑=)(ns 851T nTP 1pipeline-==58.82%17108400TP mtiTP E m1i ≈=⋅=∆⋅=∑= 重复设置部件123_13_24_14_4入出)(ns 851T nTP 1pipeline-==58.82%1710885010400E ≈=⨯⨯=有一4段组成,其3段时,总次,然后流到第4段。
如果需要的时间都是t ∆,问:(1) 当在流水线的输入端连续地每t ∆时间输入任务时,该流水线会发生什么情况?(2) 此流水线的最大吞吐率为多少?如果每t ∆2输入一个任务,连续处理10个任务时的实际吞吐率和效率是多少?(3) 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理10个任务时,其吞吐率提高多少?(2)54.35%925045TP E 2310T nTp 23T 21TP pipelinepipeline max ≈=∆⋅=∆∆==∆=∆=t tt t(3)重复设置部件t t∆⋅=∆⋅==751410T nTP pipeline吞吐率提高倍数=tt ∆∆231075=有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或 )(41i i i B A +∏=段t∆ 14暂存于相应的流水寄存器中。
计算机系统结构考试及答案
模拟试卷 1一、名词解释1. 系统结构:是对计算机系统中各机器级之间界面的划分和定义,以及对各级界面上、下的功能进行分配。
2. SIMD :单指令流多数据流计算机系统。
3. 资源共享4. Cache:高速缓冲存储器5. 模拟: 是对真实事物或者过程的虚拟二、选择1. Cache 是介于CPU 和( C )之间的小容量存储器,能高速地向CPU 提供指令和数据,从而加快程序的执行速度。
A.寄存器B.DRAMC.主存D.硬盘2. 并行性开发的途径为时间重叠、资源共享和( C ) 等。
A.时间并行B.资源分布C.资源重复D.时间并发3. 冯?诺依曼型计算机的设计思想是( C )。
A.存储数据并按地址顺序执行B.存储程序并按地址逆序执行C.存储程序并按地址顺序执行D.存储程序并乱序执行4. 在计算机系统的层次结构中,属于硬件级的是( D )。
A.应用语言级B.高级语言级C.汇编语言级D.机器语言级5. 消除流水线性能瓶颈的方法:瓶颈段细分和( B )。
A.瓶颈段串联B.瓶颈段并联C.瓶颈段拆分D.瓶颈段流水三、简答1. 试述现代计算机系统的多级层次结构。
3. 试述全相联映像与直接映像的含义及区别。
直接映像: 指主存的一个字块只能映像到Cache的一个准确确定的字块中。
直接映象是一种最简单的地址映像方式,它的地址变换速度快,而且不涉及其他两种映像方式中的替换策略问题。
但是这种方式的块冲突概率较高,当称序往返访问两个相互冲突的块中的数据时,Cache 的命中率将急剧下降,因为这时即使Cache中有其他空闲块,也因为固定的地址映像关系而无法应用。
全相联映像:指主存的一个字块可以映像到整个Cache的任何一个字块中。
这种方式只有当C ache 中的块全部装满后才会出现块冲突,所以块冲突的概率低,可达到很高的Cache 命中率;但实现很复杂。
当访问一个块中的数据时,块地址要与Cache 块表中的所有地址标记进行比较已确定是否命中。
计算机体系结构题库
计算机体系结构题库1.名词解释(每个3分,共15分)多级层次结构----按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为微程序机器级、传统机器语言机器级、操作系统机器级、汇编语言机器级、高级语言机器级、应用语言机器级等。
解释----对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
翻译----先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
透明性----在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
Amdahl定律----当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
模拟----用软件的方法在一台现有的计算机(称为宿主机host)上实现另一台计算机(称为虚拟机)的指令系统。
仿真----用一台现有计算机(称为宿主机)上的微程序去解释实现另一台计算机(称为目标机)的指令系统。
指令系统的完整性----在一个有限可用的存储空间内,对于任何可解的问题,编制计算程序时,指令系统所提供的指令足够使用。
指令系统的规整性----没有或尽可能减少例外的情况和特殊的应用,所有运算都能对称,均匀地在存储器单元或寄存器单元之间进行。
静态流水线----指在同一时间内,多功能流水线中的各段只能按同一种功能的连接方式工作的流水线。
当流水线要切换到另一种功能时,必须等前面的任务都流出流水线之后,才能改变连接。
动态流水线----指在同一时间内,多功能流水线中的各段可以按照不同的方式连接,同时执行多种功能的流水线。
它允许在某些段正在实现某种运算时,另一些段却在实现另一种运算。
计算机系统结构-----传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
(完整版)计算机系统结构考试题目及参考答案
一:名词解释1:虚拟机:由软件实现的机器。
2:CPI:是衡量CPU执行指令效率的重要标志,指执行每条指令所需的平均时钟周期数。
3:摩尔定律:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。
4:并发性:指两个或多个事件在同一时间间隔内发生的并行性。
5:程序局部性原理:是指程序在执行时呈现出局部性规律,即在一段时间内,整个程序的执行仅限于程序中的某一部分。
相应地,执行所访问的存储空间也局限于某个内存区域。
局部性原理又表现为:时间局部性和空间局部性。
6:CISC/RISC:CISC:即复杂指令系统计算机,指在系统中增加更多和复杂的指令,来提高操作系统效率的计算机。
RISC:即精简指令系统计算机,指在系统中选取使用一些频率最高的、长度固定的、格式种类少的简单指令的计算机。
7:计算机系统结构:指对机器语言计算机的软、硬件功能的分配和对界面的定义。
8:系列机:指先设计好一种系统结构,而后就按这种系统结构设计它的系统软件,按器件状况和硬件技术研究这种结构的各种实现方法,并按照速度、价格等不同要求,分别提供不同速度、不同配置的各档机器。
9:模拟:用机器语言程序解释实现程序移植的方法。
10:仿真:用微程序直接解释另一种机器的指令系统。
11:寻址方式:寻找操作数或指令的有效地址的方式。
12:替换算法:在存储体系中,当出现页面失效时或者主存的所有页面已经全部被占用而又出现页面失效时,按照某种算法来替换主存中某页。
[由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。
这时,需要被迫腾出其中的某一块,以接纳新调入的块。
]二:选择题1,直接执行微指令的是(C)A 汇编程序B 编译程序C 硬件D微指令程序2,对汇编语言程序员不透明的是(C)A 程序计数器B主存地址寄存器C条件码寄存器D指令寄存器3,最早的冯·诺依曼型计算机是以(B)为中心的A运算器B控制器C存储器 D I/O设备4,计算机系统结构的角度的结构来看,机器语言程序员看到的机器属性是(C )A 计算机软件所要完成的功能B 计算机硬件的全部组成C 编程要用到的硬件组织D计算机各部分硬件的实现5,不同系列计算机之间实现可移植性的途径,不包括(B )A 采用统一的高级语言B采用统一的汇编语言C 模拟D仿真6,利用时间重叠原理,实现并行处理的是(A)A流水处理机B多处理机 C 阵列处理机D集群系统7,多处理机实现的并行主要是(B)A指令级并行 B 任务级并行C 操作级并行D操作步骤的级并行8计算机系统结构不包括(B)A信息保护B存储速度C数据表示D机器工作状态9,不需要编址的数据存储空间(D )A CPU通用寄存器B 主存储器C I/O寄存器D堆栈10,RISC执行程序的速度比CISC 快的原因是(C)A RISC指令系统中条数较少B 程序在RISC编译生成的目标程序较短C RISC指令平均执行周期数较少D RISC中只允许LOAD和STORE指令存储11,程序员在编写程序时,使用的访存地址是(B)A主存地址B逻辑地址C物理地址D有效地址12,虚拟存储器主要是为了(A)A扩大存储器系统容量B提高存储器系统速度C扩大存储器系统容量和提高存储器系统速度D便于程序的访存操作13,与全相联映像相比,组相联映像的优点是(B)A目录表小B块冲突概率低C命中率高D主存利用率高14,输入输出数据不经过CPU内部寄存器的输入输出方式是(C )A程序控制方式B中断 C DMA方式D上述三种方式15,在配置了通道的计算机系统中,用户程序需要输入输出时引起的中断是(A)A访管中断 B I/O中断C程序性中断D外部中断16,当计算机系统通过执行通道程序,完成输入输出工作时,执行通道程序的是(B)A CPUB 通道C CPU和通道D指定的外设三:填空1,常见的计算机系统结构的分类法有两种:Flynn分类法,冯氏分类法冯氏分类法是根据系统的最大并行度对计算机系统结构进行分类,大多数的位并行的单处理机属于字串位并的处理机方式2,由软件实现的机器称为:虚拟机3,在一个计算机系统中,低层机器的属性往往对高层机器的程序员是透明的。
计算机体系结构复习计算题
1. 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?根据Amdahl 定律可知: 系统加速比 = ==由题可知: 可改进比例 = 40% = 部件加速比 = 10 系统加速比 =采用此增强功能方法后,能使整个系统的性能提高倍。
2. 假设一台计算机的I/O 处理占10%,当其CPU 性能改进到原来的10倍时,而I/O 性能仅改进为原来的两倍时,系统总体性能会有什么改进?加速比=1/(10%/2+90%/10)=本题反映了Amdahl 定律,要改进一个系统的性能要对各方面性能都进行改进,不然系统中最慢的地方就成为新系统的瓶颈。
3. 双输入端的加、乘双功能静态流水线有1、2、3、4四个子部件,延时分别为Δt, Δt, 2Δt, Δt ,“加”由1→2→4组成,“乘”由1→3→4组成,输出可直接返回输入或锁存。
现执行∑=*+41])[(i iiic b a(1) 画出流水时空图,标出流水线输入端数据变化情况。
(2) 求运算全部完成所需的时间和流水线效率。
(3) 找出瓶颈子过程并将其细分,重新画出时空图并计算流水时间和效率。
(1)(2)由上图可知,全部运算完的时间是23Δt 。
923723437=∆⨯∆=t t η(3)部件 ① ② ③ ④ ⑤ ⑥ 结果输入 a 1 a 2 a 3 a 4 a 1+b 1 a 2+b 2 a 3+b 3 a 4+b 4 ① ③ ⑤ b 1 b 2 b 3 b 4 c 1 c 2 c 3 c 4 ② ④ ⑥Δt4 3 2 1由上图可知,流水时间为20Δt 。
1003720537=∆⨯∆=t t η4. 有一条流水线如下所示。
50ns50ns100ns200ns(1) 求连续输入5指令,该流水线的实际吞吐率和效率;(2) 该流水线的瓶颈在哪一段?请采取两种不同的措施消除此“瓶颈”。
系统结构测试题及答案
1.4 测试题及参考答案(一)单项选择题(在下列每小题的四个备选答案中,只有一个答案是正确的,请把你认为是正确答案的题号,填入题后的()内,多选不给分)1、计算机系统多级层次中,从下层到上层,各级间相对顺序正确的应当是()。
①汇编语言机器级——操作系统机器级——高级语言机器级②微程序机器级——传统机器语言机器级——汇编语言机器级③传统机器语言机器级——高级语言机器级——汇编语言机器级④汇编语言机器级——应用语言机器级——高级语言机器级2、汇编语言源程序变换成机器语言目标程序是经()来实现的。
①编译程序解释②汇编程序解释③编译程序翻译④汇编程序翻译3、直接执行微指令的是()。
①汇编程序②编译程序③硬件④微指令程序4、对系统程序员不透明的应当是()。
①Cache存贮器②系列机各档不同的数据通路宽度③指令缓冲寄存器④虚拟存贮器5、对应用程序员不透明的应当是()。
①先行进位链②乘法器③指令缓冲器④条件码寄存器6、对机器语言程序员透明的是()。
①中断字②主存地址寄存器③通用寄存器④条件码7、计算机系统结构不包括()。
①主存速度②机器工作状态③信息保护④数据表示8、对计算机系统结构透明的是()。
①字符行运算指令②是否使用通道型I/O处理机③虚拟存贮器④VLSI技术9、对汇编程序语言透明的是()。
①I/O方式中的DMA访问方式②浮点数据表示③访问方式保护④程序性中断10、属计算机系统结构考虑的是()。
①主存采用MOS还是TTL②主存采用多体交叉还是单体③主存容量和编址方式④主存频宽的确定11、从计算机系统结构上讲,机器语言程序员所看到的机器属性是()。
①计算机软件所要完成的功能②计算机硬件的全部组成③编程要用到的硬件组织④计算机各部件的硬件实现12、计算组成设计不考虑()。
①专用部件设置②功能部件的集成度③控制机构的组成④缓冲技术13、在多用户机器上,应用程序员不能使用的指令是()。
①“执行”指令②“访管”指令③“启动I/O”指令④“测试与置定”指令14、以下说法中,不正确的是()。
计算机组成与系统结构第二章习题及答案
一、填空题(20每空2分)1.计数制中使用的数据个数被称为。
(基)2.移码常用来表示浮点数的部分,移码和补码比较,它们除外,其他各位都相同。
(阶码,符号位)3.码值80H:若表示真值0,则为;若表示-128,则为;若表示-127,则为;若表示-0,则为。
(移码补码反码原码)4. 在浮点运算过程中,如果运算结果的尾数部分不是形式,则需要进行规格化处理。
设尾数采用补码表示形式,当运算结果时,需要进行右规操作;当运算结果时,需要进行左规操作。
(规格化溢出不是规格化数)二、选择题(20每题2分)1.以下给出的浮点数,______是规格化浮点数。
(B)A.2^-10×0.010101 B.2^-11×0.101010C.2^-100×1.010100 D.2^-1×0.00101012.常规乘除法器乘、除运算过程采用部分积、余数左移的做法,其好处是______。
(C)A.提高运算速度 B. 提高运算精度C. 节省加法器的位数D. 便于控制3.逻辑异运算10010011和01011101的结果是。
(B)A.01001110B.11001110C.11011101D.100011104.浮点数尾数基值rm=8,尾数数值部分长6位,可表示的规格化最小正尾数为。
(C)1.A.0.5 B.0.25 C.0.125 D.1/645.当浮点数尾数的基值rm=16,除尾符之外的尾数机器位数为8位时,可表示的规格化最大尾数值是。
(D)A.1/2B.15/16C.1/256D.255/2566.两个补码数相加,采用1位符号位,当时表示结果溢出。
(D)A、符号位有进位B、符号位进位和最高数位进位异或结果为0C、符号位为1D、符号位进位和最高数位进位异或结果为17.运算器的主要功能时进行。
(C)A、逻辑运算B、算术运算C、逻辑运算和算术运算D、只作加法8.运算器虽有许多部件组成,但核心部件是。
计算机体系结构期末考试题(A卷)
福建师大网络教育学院《计算机体系结构》期末复习题系别_________ 班级_________ 姓名__________ 学号__________一、填空题(每空1分)1.按照弗林(Flynn)分类法,计算机系统可以分为4类:SISD计算机、______计算机、_______计算机和_______计算机。
2. 改进之后的冯•诺依曼计算机的只要特点是__________。
3. 当前计算机系统中的存储系统是一个层次结构,其各层分别为__________。
4.高速缓冲存储器的地址映象方式有三种,它们分别是:__________、__________、__________。
5.虚拟存储器的三种管理方式是__________,__________和__________6.目前计算机中常用数据有__________,__________和__________三种类型。
7.通常可能出现的流水线的相关性有__________。
8.解决中断引起的流水线断流的方法有_______和________。
9.目前向量处理机的系统结构有两种:__________和__________。
10.通用计算机基本指令分为5类,它们分别是:__________。
11.执行指令x1=x2+x3;x4=x1-x5会引起__________类型的数据相关,执行指令x5=x4*x3;x4=x0+x6会引起__________类型的数据相关,执行指令x6=x1+x2;x6=x4*x5会引起__________类型的数据相关。
12.多计算机网络中,通常出现的4种通信模式是__________。
13.传统的冯•诺依曼计算机是以控制驱动方式工作,以数据驱动方式工作的典型计算机是_______,以需求驱动方式工作的典型计算机是_______,以模式匹配驱动方式工作的典型计算机是_______。
二、名词解释(每题2分)1.计算机体系结构:2.系列机:3.模拟:4.程序的局部性原理:5.MIPS:6.高速缓冲存储器:7.虚拟存储器:8.快表:9.程序定位:10.延迟转移技术:11.窗口重叠技术:12.流水线技术:13.动态流水线:14.静态流水线:15.线性流水线:16.非线性流水线:17.流水线的吞吐率:18.超流水线计算机:19.向量的分段开采技术:20.基准测试程序:三、简答题(每题5分)1.什么是存储系统?2.简述全相联映象规则。
计算机组成原理与体系结构考试试卷
计算机组成原理与体系结构考试试卷(答案见尾页)一、选择题1. 计算机组成原理的主要研究对象是什么?A. 计算机的指令集B. 计算机的硬件组成及其工作原理C. 操作系统的工作原理D. 计算机网络的工作原理2. 下列哪个部件是计算机的核心部件,负责执行程序指令?A. CPUB. 内存C. 显卡D. 硬盘3. 在冯·诺依曼体系结构中,以下哪个不是必要的组成部分?A. 输入设备B. 输出设备C. 控制单元D. 数据总线4. 计算机的存储系统通常包括哪几个层次?A. 缓存B. 主存C. 外存D. 以上都是5. 在计算机组成原理中,常用的数据表示方法有哪些?A. 原码B. 补码C. 反码D. 移码6. 以下哪个是计算机的输入/输出设备?A. 键盘B. 显示器C. 打印机D. 网络接口卡7. 在计算机组成原理中,CPU的主要功能是什么?A. 存储数据B. 进行算术运算和逻辑运算C. 控制和管理计算机其他部件D. 传输数据8. 下列哪种存储器具有最快的读写速度?A. RAMB. 硬盘C. 缓存D. CD9. 在计算机组成原理中,中断是指什么?A. 计算机在执行程序时,由于某些紧急事件需要立即处理,而暂时中止当前程序的执行过程B. 计算机在执行程序时,由于某些紧急事件需要立即处理,而将程序的执行顺序暂时改变C. 计算机在执行程序时,由于某些紧急事件需要立即处理,而将程序的执行状态暂时保存D. 计算机在执行程序时,由于某些紧急事件需要立即处理,而将程序的执行内容暂时复制到另一个部件10. 在计算机组成原理中,为了提高计算机的性能,通常会采用多种技术手段,如并行处理、流水线技术等。
以下哪种技术不是常见的提高计算机性能的技术手段?A. 多核处理器B. 缓存技术C. 串行通信D. 异步I/O11. 计算机组成原理的主要内容包括哪些?A. 信息的表示与存储B. 控制器的设计与实现C. 总线与接口技术D. 操作系统的基本原理E. 以上都是12. 下列哪个部件不属于计算机的中央处理器(CPU)?A. 寄存器B. 运算器C. 控制器D. 缓存E. 输入/输出设备13. 在冯·诺依曼体系结构中,计算机由哪五个主要部分组成?A. 输入设备、输出设备、控制器、算术逻辑单元、内存B. 输入设备、输出设备、运算器、内存、外部存储器C. 输入设备、输出设备、控制器、算术逻辑单元、内存D. 输入设备、输出设备、运算器、内存、硬盘E. 输入设备、输出设备、控制器、内存、缓存14. 以下哪个不是计算机内部的信息表示方式?A. 原码B. 补码C. 反码D. ASCII码E. 二进制编码15. 在计算机组成原理中,通常使用哪种寻址方式来访问内存中的数据?A. 索引寻址B. 间接寻址C. 直接寻址D. 寄存器寻址E. 堆栈寻址16. 计算机的存储系统通常分为哪两部分?A. 主存储器B. 辅助存储器C. 随机存取存储器D. 磁盘存储器E. 光盘存储器17. 在输入/输出(I/O)系统中,中断的作用是什么?A. 提高系统的运行效率B. 实现多任务处理C. 允许计算机在等待I/O操作完成时继续执行其他任务D. 增加I/O设备的利用率E. 以上都是18. 在计算机组成原理中,为了提高指令的执行速度,通常会采用哪种技术?A. 流水线技术B. 哈希技术C. 缓存技术D. 动态调度技术E. 以上都是19. 以下哪个是计算机的输入设备?A. 显示器B. 键盘C. 打印机D. 扬声器E. 数字相机20. 在计算机体系结构中,超标量处理器的主要特点是什么?A. 支持分支预测B. 提高指令流水线的执行速度C. 增加寄存器数量D. 支持浮点运算E. 减少指令周期21. 在计算机组成原理中,以下哪个不是计算机的基本逻辑电路?A. 与门B. 或门C. 异或门D. 触发器E. 计数器22. 计算机的存储系统通常包括哪几个部分?A. 寄存器B. 缓存C. 主存储器D. 辅助存储器E. 高速缓冲存储器F. 以上都是23. 在计算机体系结构中,以下哪个是用于解释指令执行过程的概念?A. 指令集B. 指令流水线C. 数据通路D. 控制单元E. 以上都不是24. 下面关于冯·诺依曼结构的描述,哪个是正确的?A. 存储器只用于存储数据和指令B. 控制单元负责解释指令并控制整个计算机系统C. 输入/输出设备只能位于计算机的主板上D. 堆栈是用于数据存储的E. 以上都不对25. 在计算机组成原理中,以下哪个是用于表示字符的编码方式?A. ASCII码B. 汉字编码C. 国际码D. 以上都是E. 以上都不是26. 计算机的指令集是指什么?A. 计算机能够执行的全部指令的集合B. 计算机内部所有硬件部件的总和C. 计算机程序的集合D. 计算机内存中的数据集合E. 以上都不是27. 在计算机体系结构中,以下哪个是用于提高指令执行效率的技术?A. 流水线技术B. 循环展开技术C. 指令乱序执行D. 以上都是E. 以上都不是28. 计算机组成原理中的“存储程序”概念是由谁提出的?A. 图灵B. 冯·诺依曼C. 比尔·盖茨D. 以上都不是E. 以上都是29. 在计算机组成原理中,以下哪个是用于描述计算机系统各部件之间连接方式的模型?A. 系统总线B. 数据总线C. 控制总线D. 以上都是E. 以上都不是30. 计算机组成原理的主要目的是什么?A. 计算机内部电路的设计与优化B. 计算机硬件的逻辑设计C. 描述计算机硬件系统的组成和工作原理D. 计算机软件的开发与维护31. 在冯·诺依曼体系结构中,以下哪个部分不是必需的?A. CPUB. 内存C. 磁盘D. 输入输出设备32. 在计算机组成原理中,存储器的编址单位通常是:A. 字节B. 字C. 块D. 位33. 下列哪个部件不属于CPU的内部组成部分?A. 寄存器B. 指令寄存器C. 数据寄存器D. 输出缓冲器34. 在计算机的存储系统中,缓存通常位于哪个层次?A. L1缓存B. L2缓存C. 主存D. 硬盘35. 在计算机组成原理中,以下哪个概念是指CPU一次能处理的二进制数据的位数?A. 字长B. 总线宽度C. 主频D. 进程数36. 在冯·诺依曼体系结构中,程序和数据通常存储在哪里?A. RAMB. 硬盘C. ROMD. CD37. 在计算机组成原理中,以下哪个设备不是输入设备?A. 键盘B. 鼠标C. 打印机D. 显示器38. 在计算机组成原理中,以下哪个术语描述了CPU执行指令的速度?A. 主频B. 延迟C. 吞吐量D. 时序39. 在计算机的存储系统中,RAM的特点是什么?A. 速度快,但断电后数据会丢失B. 速度慢,但断电后数据不会丢失C. 速度快,断电后数据不会丢失D. 速度慢,断电后数据会丢失二、问答题1. 远程通信模块:如Wi-Fi、蓝牙等,用于与远程设备通信。
计算机系统结构考试试题
计算机系统结构考试试题
1. 简答题
a. 请简要阐述计算机系统结构的定义及其重要性。
b. 解释什么是指令集体系结构(ISA),并举例说明不同的ISA 类型。
c. 论述冯·诺伊曼体系结构的特点以及对计算机发展的影响。
2. 计算题
a. 给定一个16位的寄存器,寄存器中保存的数值为56902,将其转换为二进制和八进制表示。
b. 设计一个具有4位地址总线和8位数据总线的存储系统,假设寻址方式为直接地址寻址,计算其寻址范围。
c. 若一个指令的操作码占8位,寄存器地址占3位,立即数占5位,计算其最大可表示的指令数量。
3. 综合题
请设计一个简单的微处理器,包括寄存器组、ALU和控制器。
然后给出一个简单的汇编语言程序,要求能够将两个寄存器中的数值相加并存储到第三个寄存器中。
4. 分析题
请分析Intel x86和ARM架构在计算机系统结构上的异同点,并
讨论其适用领域及性能表现。
5. 论述题
论述存储层次结构在计算机系统中的重要性,并详细说明主存、
缓存和辅存的功能和特点。
同时分析存储层次结构对计算机系统性能
的影响。
在考试中,学生需要结合所学知识,对以上试题进行回答和解答。
对于计算题部分,需要给出详细的计算过程和结果。
对于综合题和分
析题部分,需要清晰地阐述思路和实现方案。
最终的目的是检验学生
对计算机系统结构理论和实践的掌握程度,以及对计算机体系结构相
关概念的理解和应用能力。
希望学生能够在考试中发挥所长,充分展示自己的学习成果和能力。
祝各位同学取得优异的成绩!。
计算机系统结构期末考试试题及其答案
计算机科学系《计算机系统结构》期末考试试卷(A 卷)一 单选题:(10分,每题1分) 1、 ."启动I/O"指令是主要的输入输出指令,是属于(B )A.目态指令B.管态指令C.目态、管态都能用的指令D.编译程序只能用的指令2、 输入输出系统硬件的功能对(B )是透明的A.操作系统程序员B.应用程序员C.系统结构设计人员D.机器语言程序设计员3、 全相联地址映象是指(A )A.任何虚页都可装入主存中任何实页的位置B.一个虚页只装进固定的主存实页位置C.组之间固定,组内任何虚页可装入任何实页位置D.组间可任意装入,组内是固定装入4、 ( C ) 属于MIMD 系统结构A.各处理单元同时受一个控制单元的管理B.各处理单元同时受同个控制单元送来的指令C.松耦合多处理机和多计算机系统D.阵列处理机5、 多处理机上两个程序段之间若有先写后读的数据相关,则(B )A.可以并行执行B.不可能并行C.任何情况均可交换串行D.必须并行执行6、 计算机使用的语言是(B )A.专属软件*畴,与计算机体系结构无关B.分属于计算机系统各个层次C.属于用以建立一个用户的应用环境D.属于符号化的机器指令7、 指令执行结果出现异常引起的中断是(C )A.输入/输出中断B.机器校验中断C.程序性中断D.外部中断8、 块冲突概率最高的Cache 地址映象方式是(A )A.直接 B .组相联 C .段相联 D .全相联9、 组相联映象、LRU 替换的Cache 存储器,不影响Cache 命中率的是(B)A .增大块的大小B .增大主存容量C .增大组的大小D .增加Cache 中的块数10、 流水处理机对全局性相关的处理不.包括(C ) C.加快短循环程序的执行 D.设置相关专用通路1、 数据通路宽度就是数据总线上一次并行传送的信息位数。
2、 计算机仿真用微程序解释,计算机模拟用机器语言解释二 填空题:(20分,每题2分)3、阵列处理机按存贮器的组成方式可分为两种构形,分别为:分布式存储器和集中共享式。
计算机体系结构期末考试试题及答案
填空题1.从2002年以来,计算机性能的年增长率下降到了约30%。
其主要原因是:①大功耗问题;②可以进一步有效地开发的指令级并行性已经很少;③存储器访问速度的提高缓慢。
2. 可移植性是指一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。
实现可移植性的常用方法有3种:系列机,模拟和仿真,统一高级语言。
2.通用寄存器型指令集结构计算机在灵活性和提高性能方面有明显的优势。
主要体现在①寄存器的访问速度比存储器快;②对编译器而言,能更加容易有效地分配和使用寄存器;③寄存器可以用来存放变量。
3.MIPS的数据寻址方式只有立即数寻址和偏移量寻址。
4.向量处理机的结构由所采用的向量处理方式决定。
有两种典型的结构;存储器-存储器型结构和寄存器-寄存器型结构。
5.Cache-主存层次的工作由硬件实现,对系统程序员是透明的。
6.降低Cache不命中率最直接的方法是增加Cache的容量。
不过,这种方法不但会增加成本,而且还可能增加命中时间,这种方法在片外Cache中用得比较多。
7.大多数磁盘阵列的组成可以由以下两个特征来区分:数据交叉存放的粒度、冗余数据的计算方法以及在磁盘阵列中的存放方式。
8.时延和带宽是用来评估互连网络性能的两个基本指标。
时延包括通信时延和网络时延。
9.计算机系统可分为SISD、SIMD、MISD和MIMD四类,许多早期并行处理机是SIMD计算机,近年来,MIMD已经成为通用多处理机系统结构的选择。
这是因为MIMD具有灵活性,并且MIMD能充分利用现有微处理器的性价比优势。
判断题1.从计算机语言的角度,系统结构把计算机系统按功能划分成多级层次结构,其中,第2级是操作系统虚拟机,第3级是汇编语言虚拟机。
(错)2.计算机系统中提高并行性的3种途径中,资源重复是在并行性概念中引入时间因素,加快硬件周转而赢得时间。
(错)3.指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的指令的CPI。
计算机系统结构试题汇总(带答案)
______,调出有关处理该中断服务程序,准备运行。
19.设多体单字低位交叉的存贮器,单体容量为 I 的 m 个分体,其 Mj 的编址模式为 m×i+j,
其中 i=0,1,…,I-1;j=______,如 m=4,M2 体对应二进制地址码最低二位的状态为______。 20.自定义数据表示包括标志符数据表示和______两类,标志符应由编绎程序建立,对______
I1: RI←A1+A2 I2: R2←A3+A4 I3: R3←A5+A6 I4: R4←A7+A8 I5: R5←A9+A10 I6: R6←R1+n2 I7: R7←R3+R4 I8: R8←R5+R6 I9: F←R7+R8 这并不是唯一可能的计算方法。假设功能段的延迟为△t。 1.画出流水线时空图。(8 分) 2.计算流水线的实际吞吐率、加速比和效率。(每个 4 分,共 12 分)
6. 透明性:指一种本来存在的事物或属性,从某种角度看似乎不存在的现象。 7. LRU 算法:即近期最少使用算法,它选择近期最少访问的页面作为被替换的页面。 8.RISC:精简指令系统计算机,这种系统中,尽量简化指令功能,只保留那些功能简 单,能在一个节拍内执行完成指令,较复杂的功能用一段子程序来实现。 9.超标量处理机:通常把一个时钟周期内能够同时发射多条指令的处理机称为超标量 处理机。 10.流水线的链接技术:指一条指令的结果寄存器可能成为后继指令的操作数寄存器的 技术。
五、(10 分) 已知四个程序在三台计算机上的执行时间(s,秒)如下:
程序
执行时间(s,秒)
计算机 A
计算机 B
计算机 C
程序 1
1
10
第2章 计算机体系结构 习题与答案
第二章习题(P69-70)一、复习题1.简述冯∙诺依曼原理,冯∙诺依曼结构计算机包含哪几部分部件,其结构以何部件为中心?答:冯∙诺依曼理论的要点包括:指令像数据那样存放在存储器中,并可以像数据那样进行处理;指令格式使用二进制机器码表示;用程序存储控制方式工作。
这3条合称冯∙诺依曼原理OgtiojD。
冯∙诺依曼计算机由五大部分组成:运算器、控制器、存储器、输入设备、输出设备,整个结构一般以运算器为中心,也可以以控制器为中心。
(P51-P54)r1fI4bu。
2.简述计算机体系结构与组成、实现之间的关系。
答:计算机体系结构通常是指程序设计人员所见到的计算机系统的属性,是硬件子系统的结构概念及其功能特性。
计算机组成(computer organization)是依据计算机体系结构确定并且分配了硬件系统的概念结构和功能特性的基础上,设计计算机各部件的具体组成,它们之间的连接关系,实现机器指令级的各种功能和特性。
同时,为实现指令的控制功能,还需要设计相应的软件系统来构成一个完整的运算系统。
计算机实现,是计算机组成的物理实现,就是把完成逻辑设计的计算机组成方案转换为真实的计算机。
计算机体系结构、计算机组成和计算机实现是三个不同的概念,各自有不同的含义,但是又有着密切的联系,而且随着时间和技术的进步,这些含意也会有所改变。
在某些情况下,有时也无须特意地去区分计算机体系结构和计算机组成的不同含义。
(P47-P48)28BoSAn。
3.根据指令系统结构划分,现代计算机包含哪两种主要的体系结构?答:根据指令系统结构划分,现代计算机主要包含:CISC和RISC两种结构。
(P55)4.简述RISC技术的特点?答:从指令系统结构上看,RISC体系结构一般具有如下特点:(1)精简指令系统。
可以通过对过去大量的机器语言程序进行指令使用频度的统计,来选取其中常用的基本指令,并根据对操作系统、高级语言和应用环境等的支持增设一些最常用的指令;hJslBtf。
计算机系统结构模拟试题(3)(精)
计算机系统结构模拟试题(3)一、单选题:15分,每题03分1、一台模型机共有7条指令,各指令的使用的频率分别为45%,30%,15%,5%,3%,1%,1%。
要求操作码的平均长度最短,那么该值应该是:A: 2B: 1.87C: 2.1D: 1.972、设a为一个计算机系统中n台处理机可以同时执行的程序代码的百分比,其余代码必须用单处理机顺序执行。
而单个节点机的处理效率是4MIPS,那么在a=0.8的条件下,要让系统的效率达到20MIPS,则至少需要多少台节点机?A: 8B: 16C: 32D: 以上均错误3、一条流水线的可分为k段,各段的执行时间都是,共向该流水线输入n个任务,求该流水线实际吞吐率为:A:B:C:D:4、一条4段的流水线可以由以下时空图来表示,求该流水线的实际吞吐率(假设n=100)A:B:C:D:5、在超标量,超流水线,超标量超流水线等不同结构的指令级并行处理机上运行矩阵乘法C=A×B(假设A是m×n阶的矩阵,B是n×l阶的矩阵),最少需要进行多少次乘法和多少次加法?A: mn, nlB: mnl, ml(n-1)C: mnl, mn(l-1)D: mnl, mnl二、多选题:04分,每题04分6、下列功能,那些一般由硬件实现?A : 第一次关CPU中断B : 返回中断点C : 第一次开CPU中断D : 保存中断点三、填空选择题:04分,每题04分7、星形网络的网络直径和链路数分别为()和()。
选项 1 :N-1N/22N(N-1)/2选项 2 :N-1N/22N(N-1)/2四、大型计算题:10分,每题10分8、假设我们考虑条件分支指令的两种不同设计方法如下:CPU1:通过比较指令设置条件码,然后测试条件码进行分支。
CPU2:在分支指令中包括比较过程。
在两种CPU中,条件分支指令都占用2个时钟周期而所有其他指令占用1个时钟周期,对于CPU1,执行的指令中分支指令占20%;由于每个分支指令之前都需要有比较指令,因此比较指令也占20%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有一指令流水线如下所示入 1 2 3 4 出 50ns 50ns 100ns 200ns(1) 求连续输入10条指令,该流水线的实际吞吐率和效率;(2) 该流水线的“瓶颈”在哪一段请采取两种不同的措施消除此“瓶颈”。
对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少 解:(1)2200(ns)2009200)10050(50t )1n (t T maxm1i i pipeline =⨯++++=∆-+∆=∑= )(ns 2201T nTP 1pipeline-==45.45%1154400TP mtTP E m1i i≈=⋅=∆⋅=∑= (2)瓶颈在3、4段。
变成八级流水线(细分)850(ns)509850t 1)(n t T maxm1i i pipeline =⨯+⨯=∆-+∆=∑=)(ns 851T nTP 1pipeline-==58.82%17108400TP mtiTP E m1i ≈=⋅=∆⋅=∑= 重复设置部件123_13_24_14_4入出)(ns 851T nTP 1pipeline-==58.82%1710885010400E ≈=⨯⨯=有一4段组成,其3段时,总次,然后流到第4段。
如果需要的时间都是t ∆,问:(1) 当在流水线的输入端连续地每t ∆时间输入任务时,该流水线会发生什么情况(2) 此流水线的最大吞吐率为多少如果每t ∆2输入一个任务,连续处理10个任务时的实际吞吐率和效率是多少(3) 当每段时间不变时,如何提高该流水线的吞吐率仍连续处理10个任务时,其吞吐率提高多少(2)54.35%925045TP E 2310T nTp 23T 21TP pipelinepipeline max ≈=∆⋅=∆∆==∆=∆=t tt t(3)重复设置部件t t∆⋅=∆⋅==751410T nTP pipeline吞吐率提高倍数=tt ∆∆231075=有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或 )(41i i i B A +∏=段t∆ 14暂存于相应的流水寄存器中。
现要在该流水线上计算 ,画出其时空图,并计算其吞吐率、加速比和效率。
解:首先,应选择适合于流水线工作的算法。
对于本题,应先计算A 1+B 1、A 2+B 2、A 3+B 3和A 4+B 4;再计算(A 1+B 1) ×(A 2+B 2)和(A 3+B 3) ×(A 4+B 4);然后求总的结果。
其次,画出完成该计算的时空图,如图所示,图中阴影部分表示该段在工作。
由图可见,它在18个△t 时间中,给出了7个结果。
所以吞吐率为:tTP ∆=817如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。
所以加速比为:该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得:动态多功能流水线由6个功能段组成,如下图:乘法加法乘法 加法时间段输 入A 1B 1 A 2 B 2 A 3 B 3 A 4 B 4A B CDA ×BC ×D61.18192=∆∆=tt S 223.01853354=⨯⨯+⨯=E其中,S1、S4、S5、S6组成乘法流水线,S1、S2、S3、S6组成加法流水线,各个功能段时间均为50ns ,假设该流水线的输出结果可以直接返回输入端,而且设置有足够的缓冲寄存器,若以最快的方式用该流水计算:∑=51i i i i z y x(1) 画出时空图;(2) 计算实际的吞吐率、加速比和效率。
解:机器一共要做10次乘法,4次加法。
在MIPS 流水线上运行如下代码序列:LOOP : LW R1,0(R2) DADDIU R1,R1,#1 SW R1, 0(R2) DADDIU R2,R2,#4 DSUB R4,R3,R2 BNEZ R4,LOOP其中:R3的初值是R2+396。
假设:在整个代码序列的运行过程中,所有的存储器访问都是命中的,并且在一个时钟周期中对同一个寄存器的读操作和写操作可以通过寄存器文件“定向”。
问:(1) 在没有任何其它定向(或旁路)硬件的支持下,请画出该指令序列执行的流水线时空图。
假设采用排空流水线的策略处理分支指令,且所有的存储器访问都命中Cache ,那么执行上述循环需要多少个时钟周期(2) 假设该流水线有正常的定向路径,请画出该指令序列执行的流水线时空图。
假设采用预测分支失败的策略处理分支指令,且所有的存储器访问都命中Cache ,那么执行上述循环需要多少个时钟周期(3)假设该流水线有正常的定向路径和一个单周期延迟分支,请对该循环中的指令进行调度,你可以重新组织指令的顺序,也可以修改指令的操作数,但是注意不能增加指令的条数。
请画出该指令序列执行的流水线时空图,并计算执行上述循环所需要的时钟周期数。
解:寄存器读写可以定向,无其他旁路硬件支持。
排空流水线。
指令12345678910111213141516171819202122 LW IF ID EX M WBDADDIU IF S S ID EX M WBSW IF S S ID EX M WBDADDIU IF ID EX M WBDSUB IF S S ID EX M WBBNEZ IF S S ID EX M WBLW IF S S IF ID EX M WB第i次迭代(i=0..98)开始周期:1+(i×17)总的时钟周期数:(98×17)+18=1684有正常定向路径,预测分支失败。
指令12345678910111131415LW IF ID EX M WBDADDIU IF ID S EX M WBSW IF S ID EX M WBDADDIU IF ID EX M WBDSUB IF ID EX M WBBNEZ IF ID EX M WBLW IF miss miss IF ID EX M WB第i次迭代(i=0..98)开始周期:1+(i×10)总的时钟周期数:(98×10)+11=991有正常定向路径。
单周期延迟分支。
LOOP: LW R1,0(R2)DADDIU R2,R2,#4DADDIU R1,R1,#1DSUB R4,R3,R2BNEZ R4,LOOPSW R1,-4(R2)第i次迭代(i =0..98)开始周期:1+(i ×6 )总的时钟周期数:(98×6)+10=598指令1234567891011LW IF ID EX M WBDADDIU IF ID EX M WBDADDIU IF ID EX M WBDSUB IF ID EX M WBBNEZ IF ID EX M WBSW IF ID EX M WBLW IF ID EX M WB 假设各种分支指令数占所有指令数的百分比如下:出来,而条件分支要到第三个时钟周期结束时才能够被解析出来。
第一个流水段是完全独立于指令类型的,即所有类型的指令都必须经过第一个流水段的处理。
请问在没有任何控制相关的情况下,该流水线相对于存在上述控制相关情况下的加速比是多少解:没有控制相关时流水线的平均CPI=1存在控制相关时:由于无条件分支在第二个时钟周期结束时就被解析出来,而条件分支要到第3个时钟周期结束时才能被解析出来。
所以:(1)若使用排空流水线的策略,则对于条件分支,有两个额外的stall,对无条件分支,有一个额外的stall:CPI = 1+20%*2+5%*1 =加速比S=CPI/1 =(2)若使用预测分支成功策略,则对于不成功的条件分支,有两个额外的stall,对无条件分支和成功的条件分支,有一个额外的stall 1:CPI = 1+20%*(60%*1+40%*2) +5%*1 =加速比S=CPI/1 =(3)若使用预测分支失败策略,则对于成功的条件分支,有两个额外的stall;对无条件分支,有一个额外的stall;对不成功的条件分支,其目标地址已经由PC 值给出,不必等待,所以无延迟:CPI = 1+20%*(60%*2 + 40%*0) +5%*1 =加速比S=CPI/1 =假设对指令Cache的访问占全部访问的75%;而对数据Cache的访问占全部访问的25%。
Cache的命中时间为1个时钟周期,失效开销为50 个时钟周期,在混合Cache中一次load或store操作访问Cache的命中时间都要增加一个时钟周期,32KB的指令Cache的失效率为%,32KB的数据Cache的失效率为%,64KB 的混合Cache的失效率为%。
又假设采用写直达策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。
试问指令Cache和数据Cache容量均为32KB的分离Cache和容量为64KB的混合Cache相比,哪种Cache的失效率更低两种情况下平均访存时间各是多少解:(1)根据题意,约75%的访存为取指令。
因此,分离Cache 的总体失效率为:(75%×%)+(25%×%)=%; 容量为128KB 的混合Cache 的失效率略低一些,只有%。
(2)平均访存时间公式可以分为指令访问和数据访问两部分: 平均访存时间=指令所占的百分比×(读命中时间+读失效率×失效开销)+ 数据所占的百分比×(数据命中时间+数据失效率×失效开销)所以,两种结构的平均访存时间分别为:分离Cache 的平均访存时间=75%×(1+%×50)+25%×(1+%×50) =(75%×)+(25%×)=混合Cache 的平均访存时间=75%×(1+%×50)+25%×(1+1+%×50) =(75%×)+(25%×)=因此,尽管分离Cache 的实际失效率比混合Cache 的高,但其平均访存时间反而较低。
分离Cache 提供了两个端口,消除了结构相关。
给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 的性能。
由计算结果能得出什么结论 (1) 理想Cache 情况下的CPI 为,时钟周期为2ns ,平均每条指令访存次; (2) 两者Cache 容量均为64KB ,块大小都是32字节;(3) 组相联Cache 中的多路选择器使CPU 的时钟周期增加了10%; (4) 这两种Cache 的失效开销都是80ns ; (5) 命中时间为1个时钟周期;(6) 64KB 直接映象Cache 的失效率为%,64KB 两路组相联Cache 的失效率为%。