体系结果计算题整理

合集下载

计算机体系结构(系统结构)考试例题--大题

计算机体系结构(系统结构)考试例题--大题

例1.1 将计算机系统中某一功能的处理速度加快15倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少? 解 由题可知: F e = 40% = 0.4 S e = 15根据Amdahl 定律可知:采用此增强功能方法后,能使整个系统的性能提高到原来的1.6倍。

例1.2 某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的25倍,而系统运行某一程序的整体性能提高到原来的4倍,试计算该程序中浮点操作所占的比例。

解 由题可知: S e = 25 S n = 4 根据Amdahl 定律可知:6.1154.0)4.01(1)1(1≈+-=+-=SeFeFe Sn()25114FeFe +-=由此可得:Fe = 78.1%即程序中浮点操作所占的比例为78.1%。

例1.3 假设FP 指令的比例为25%,其中,FPSQR 占全部指令的比例为2%,FP 操作的CPI 为4,FPSQR 操作的CPI 为20 ,其他指令的平均CPI 为1.33。

现有两种改进方案,第一种是把FPSQR 操作的CPI 减至2,第二种是把所有的FP 操作的CPI减至2,试比较两种方案 对系统性能的提高程度。

解 没有改进之前,每条指令的平均时钟周期CPI 为:(1)采用第一种方案FPSQR 操作的CPI 由CPI FPSQR =20减至CPI’FPSQR =2,则整个系统的指令平均时钟周期数为:()()2%7533.1%2541=⨯+⨯=⎪⎭⎫ ⎝⎛⨯=∑=ni i i IC IC CPI CPICPI1=CPI―(CPIFPSQR―CPI’FPSQR)×2%=2―(20―2) ×2%=1.64(2)采用第二种方案所有FP操作的CPI由CPIFP =4减至CPI’FP=2,则整个系统的指令平均时钟周期数为:CPI2=CPI―(CPIFP―CPI’FP)×25%=2―(4―2) ×25%=1.5从降低整个系统的指令平均时钟周期数的程度来看,第二种方案优于第一种方案。

计算机体系结构试卷试题(答案全)

计算机体系结构试卷试题(答案全)

一填空题(每空1分,共30分)1、系列机是指具有相同的体系结构,但具有不同组织和实现的一系列不同型号的机器。

2、存储程序计算机结构上的主要特点之一是以运算器为中心。

3、从计算机系统结构的多级层次结构可知,通常情况下,第1、2、3级用解释方法实现,第4或更高级用翻译方法实现。

4、对于最常见的事件,通常赋予它优先的处理权和资源使用权,这是计算机体系结构设计中的大概率事件优先原则。

5、容量为64块的Cache采用组相联方式映像,字块大小为128字节,每4块为一组,若主存容量为4096块,且以字编址,那么主存地址为 19 位,主存区号为 6 位。

6、可改进比例的值总是小于等于1 。

7、一般有两种策略来保存寄存器的内容,即:调用者保存和被调用者保存。

8、DLX指令集提供了立即数寻址、寄存器寻址、偏移寻址和寄存器间接寻址4种寻址方式。

9、对某流水线处理器测试时发现其存在结构冲突,通常可采用资源重复和流水化功能单元方法解决该问题。

10、编译器通过重新组织代码顺序消除暂停的技术被称为指令调度。

11、按照流水的级别可以把流水线分为部件级流水线、处理机级流水线和处理机间流水线。

12、为解决流水线使用非流水数据通路的寄存器引起冲突,在流水线设计中采用寄存器文件技术解决该问题。

13、Cache的替换算法常见的有 FIFO 、LRU 和随机法。

14、改进Cache性能的方法主要有降低失效率、减少失效开销和减少Cache命中时间。

15、减少流水线处理分支暂停时钟周期数的途径包括尽早判断分支转移是否成功和尽早计算出分支成功转移的PC值。

二、选择题(1—15题,每题1分,共15分)1、下面的指令中, A 不属于RISC处理器指令集。

A.ADD R4,[1000] B.LD R3,(R4) C.SUB R4,R3 D.SD 0(R3),R42. 在其它部件性能保持不变的情况下,对CPU性能的不断改进并没有获得期望的结果,这主要是受到了 A 的影响。

计算机组成原理与体系结构习题

计算机组成原理与体系结构习题

1.冯·诺依曼机工作的基本方式的特点是______。

A 多指令流单数据流B 按地址访问并顺序执行指令C 堆栈操作D 存贮器按内容选择地址2. 某计算机字长16位,它的存贮容量是64KB,若按字编址,那么它的寻址范围是______A. 64KB. 32KC. 64KBD. 32 KB3.单地址指令中为了完成两个数的算术运算,除地址码指明的一个操作数外,另一个常需采用______。

A堆栈寻址方式 B立即寻址方式 C隐含寻址方式 D 间接寻址方式4.在微程序控制器中,微地址形成电路产生两种地址:微程序入口地址和后续微地址。

5、已知某8位机的主存采用半导体存储器,地址码为18位,采用4K×4位的SRAM芯片组成该机所允许的最大主存空间,并选用模块条形式,问:(1)若每个模块条为32K×8位,共需几个模块条?(2)每个模块条内有多少片RAM芯片?(3)主存共需多少RAM芯片?CPU需使用几根地址线来选各模块?用何种译码器?6.CPU有16根地址线(A15~A0),8根数据线(D7~D0),MREQ 作访问存储器的控制电平(低电平有效),WE作为读写控制电平(WE=0时,写允许;WE=1时,读允许)。

现有芯片Intel 2114(1K*4),要扩展成2KB内存,地址范围为2000H~27FFH。

片选信号由74LS138译码器采用全译码方式进行。

试画出CPU与译码器及存储芯片的连接图。

7.某计算机字长16位,主存容量为64K字,采用单字长单地址指令,共有64条指令,试采用四种寻址方式(直接、间接、变址、相对)设计指令格式。

解:64条指令需占用操作码字段(OP)6位,这样指令余下长度为10位。

为了覆盖主存64K字的地址空间,设寻址模式(X)2位,形式地址(D)8位,其指令格式如下:628OP X D寻址方式定义如下:X= 0 0 直接寻址有效地址 E=D(256单元)X= 0 1 间接寻址有效地址 E= (D)(64K)X= 1 0 变址寻址有效地址 E= (R)+D (64K)X= 1 1 相对寻址有效地址 E=(PC)+D (64K)其中R为变址寄存器(16位),PC为程序计数器(16位),在变址和相对寻址时,位移量D可正可负。

计算机体系结构考试总结

计算机体系结构考试总结

计算机体系构造考试总结考试范围:1—6章题型:名词翻译简答题计算题一.名词解释1.什么是虚拟机:用软件实现旳机器2.什么是透明性:本来存在旳事物或属性,从某种角度看似乎不存在3.什么是系列机:在一种厂家生产旳具有相似旳体系构造,但具有不同样旳构成和实现旳一系列不同样型号旳机器。

系列机必须保证顾客看到旳机器属性一致。

系统旳软件必须兼容4.什么是模拟?什么是仿真?两者区别:在一台既有旳计算机上实现另一台计算机旳指令系统。

所有用软件实现旳叫模拟,用软件、硬件、固件混合实现旳叫仿真区别:模拟措施速度低,仿真措施速度高仿真需要较多旳硬件(包括控制存储器)系统构造差异大旳机器难于用仿真措施实现除了指令系统之外,尚有存储系统、I/O系统、中断系统、控制台旳操作等5.什么是并行性?什么是并发?在同一时刻或同一时间间隔内完毕两种或两种以上性质相似或不同样旳工作。

它包括同步性和并发性两重含义。

从执行程序旳角度和处理数据旳角度看,并行性均有不同样旳并行等级。

并发性:两个或两个以上旳事件在同一时间间隔发生。

6.CISC,RISC,VLIW体现什么?CISC:复杂指令集计算机(Complex Instruction Set Computer),是一种指令集构造(ISA),通过强化指令功能,减少程序旳指令条数,实现软件功能向硬件功能转移,以抵达提高性能旳目旳RISC:精简指令集计算机(Reduced Instruction Set Computer),是一种指令集构造(ISA),通过减少指令总数和简化指令旳功能来减少硬件设计旳复杂度,提高指令旳执行速度VLIW:超长指令字(一种显式指令级并行指令系统,二维程序构造,指令级并行度高)7.什么是程序局部性原理:程序在执行时所访问旳地址不是随机旳,而是相对簇聚;这种簇聚包括指令和数据两部分,程序旳局部性原理包括程序旳时间局部性和程序旳空间局部性。

8.什么是快表什么是慢表?快表:即转换后援缓冲器(Translation Lookaside Buffer),简称TLB,寄存页表旳小容量高速缓存器慢表:9.设备无关性:计算机系统旳使用者,在需要更换外围设备时,多种不同样型号,不同样生产厂家旳设备都可以直接通过独立于详细设备旳原则接口与计算机系统连接。

计算机体系结构模拟试卷整理版

计算机体系结构模拟试卷整理版

模拟卷一、选择题(每小题2分,共20分)1.最早的冯·诺依曼结构的计算机是以()为中心的。

A.运算器B.控制器C.存储器D.I/O设备小结:1.计算机以运算器为中心。

2.在存储器中,指令和数据同等对待。

3.存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。

4.指令的执行是顺序的5.指令由操作码和地址码组成。

6.指令和数据均以二进制编码表示,采用二进制运算。

2.Amdahl提出的系统结构指的是()级程序员所看到的计算机属性。

A.操作系统级B.高级语言C.机器语言(传统机器级)D.汇编语言3.计算机指令集的两个发展方向是RISC和()。

A.ARMB.MIPSC.SIMDD.CISC4.从执行程序的角度看,并行性等级最低的是()。

A.指令内部并行B.指令级并行C.线程级并行D.作业级并行小结:指令内部并行、指令级并行、线程级并行、任务级或过程级并行、作业或程序级并行5.流水线的通过时间是指流水线中()流出结果所需的时间。

A.流水线第一段B.流水线第二段C.第一个任务D.最后一个任务小结:排空时间:最后一个任务从进入流水线到流出结果所需的时间。

6.弗林(Michael J. Flynn)对计算机的分类中,MIMD指的是()计算机。

A.单指令流单数据流B.单指令流多数据流C.多指令流单数据流D.多指令流多数据流7..因为分支指令引起的相关叫做()相关。

A.数据B.结构C.控制D.循环8.基本的MIPS整数流水线中,访存地址的计算发生在流水线的第()段。

A.1 B.2 C.3D.49.RISC执行程序的速度比CISC要快的原因是()。

A.RISC的指令系统中指令条数较少B.程序在RISC上编译生成的目标程序较短。

C.RISC的指令平均执行周期数较少。

D.RISC只允许load和store指令访存。

10.通过编译器重新安排指令的执行顺序以减少流水的停顿方法,称之为( )。

A.线性流水线B.非线性流水线C.动态调度D.静态调度二、填空题(每空2分,共30分)1.按某个时期投入市场的某种型号机器编制的程序,不加修改地就能运行于在它之前或之后投入市场的机器。

第3章计算机网络体系结构(习题参考答案)

第3章计算机网络体系结构(习题参考答案)

第3章计算机网络体系结构三、简答题1. 为什么要采用分层的方法解决计算机的通信问题?通过分层的方法,使得计算机网络复杂的通信处理问题转化成为若干相对较小的层次内的局部问题,对其进行的研究和处理变得相对容易。

2. “各层协议之间存在着某种物理连接,因此可以进行直接的通信。

”这句话对吗?不对。

物理连接只存在于最底层的下面。

各层协议之间只存在着称为“对等层通信”的逻辑连接。

3. 请简要叙述服务与协议之间的区别。

通过协议的规定,下一层可以为上一层提供服务,但是对于上一层的服务用户来说下面的协议是透明的。

协议是存在于对等层之间的,是水平的;服务存在于直接相邻的两个层次之间,是垂直的。

4. 请描述一下通信的两台主机之间通过OSI模型进行数据传输的过程。

发送数据的具体过程为:要进行通信的源用户进程首先将要传输的数据送至应用层并由该层的协议根据协议规范进行处理,为用户数据附加上控制信息后形成应用层协议数据单元再送至表示层;表示层根据本层的协议规范对收到的应用层协议数据单元进行处理,给应用层协议数据单元附加上表示层的控制信息后形成表示层的协议数据单元再将它传送至下一层。

数据按这种方式逐层向下传送直至物理层,最后由物理层实现比特流形式的传送。

当比特流沿着传输介质经过各种传输设备后最终到达了目标系统。

此后,接收数据的具体过程为:按照发送数据的逆过程,比特流从物理层开始逐层向上传送,在每一层都按照该层的协议规范以及数据单元的控制信息完成规定的操作,而后再将本层的控制信息剥离,并将数据部分向上一层传送,依此类推直至最终的、通信的目的用户进程。

5. 请简述虚电路服务的特点。

虚电路服务要求发送分组之前必须建立连接,即虚电路。

之后所有的分组都沿着虚电路依次进行传送。

在所有分组传送完毕后要释放连接。

它可以提供顺序、可靠的分组传输,适用于长报文的通信,一般应用于稳定的专用网络。

6. 请简述无连接服务的特点。

无连接服务无需事先建立连接。

计算机体系结构题库

计算机体系结构题库

计算机体系结构题库1.名词解释(每个3分,共15分)多级层次结构----按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为微程序机器级、传统机器语言机器级、操作系统机器级、汇编语言机器级、高级语言机器级、应用语言机器级等。

解释----对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

翻译----先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

透明性----在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

Amdahl定律----当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

模拟----用软件的方法在一台现有的计算机(称为宿主机host)上实现另一台计算机(称为虚拟机)的指令系统。

仿真----用一台现有计算机(称为宿主机)上的微程序去解释实现另一台计算机(称为目标机)的指令系统。

指令系统的完整性----在一个有限可用的存储空间内,对于任何可解的问题,编制计算程序时,指令系统所提供的指令足够使用。

指令系统的规整性----没有或尽可能减少例外的情况和特殊的应用,所有运算都能对称,均匀地在存储器单元或寄存器单元之间进行。

静态流水线----指在同一时间内,多功能流水线中的各段只能按同一种功能的连接方式工作的流水线。

当流水线要切换到另一种功能时,必须等前面的任务都流出流水线之后,才能改变连接。

动态流水线----指在同一时间内,多功能流水线中的各段可以按照不同的方式连接,同时执行多种功能的流水线。

它允许在某些段正在实现某种运算时,另一些段却在实现另一种运算。

计算机系统结构-----传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

计算机系统结构基本习题和答案

计算机系统结构基本习题和答案

计算机系统结构基本习题和答案计算机系统结构基本习题和答案填空题1、从(使用语言的)角度可以将系统看成是按(功能)划分的多个机器级组成的层次结构。

2、计算机系统结构的层次结构由高到低分别为(应用语言机器级,高级语言机器级,汇编语言机器级,操作系统机器级,传统机器语言机器级,微程序机器级)。

3、应用程序语言经(应用程序包)的(翻译)成高级语言程序。

4、高级语言程序经(编译程序)的(翻译)成汇编语言程序。

5、汇编语言程序经(汇编程序)的(翻译)成机器语言程序。

6、在操作系统机器级,一般用机器语言程序(解释)作业控制语句。

7、传统机器语言机器级,是用(微指令程序)来(解释)机器指令。

8、微指令由(硬件)直接执行。

9、在计算机系统结构的层次结构中,机器被定义为(能存储和执行相应语言程序的算法和数据结构)的集合体。

10、目前M0由(硬件)实现,M1用(微程序(固件))实现,M2到M5大多用(软件)实现。

以(软件)为主实现的机器成为虚拟机。

(虚拟机)不一定全用软件实现,有些操作也可用(固件或硬件)实现。

11、透明指的是(客观存在的事物或属性从某个角度看不到),它带来的好处是(简化某级的设计),带来的不利是(无法控制)。

12、计算机系统结构也称(计算机体系结构),指的是(传统机器级的系统结构)。

它是(软件和硬件/固件)的交界面,是机器语言汇编语言程序设计者或编译程序设计者看到的(机器物理系统)的抽象。

13、计算机组成指的是(计算机系统结构的逻辑实现),包括(机器级内的数据流和控制流)的组成逻辑设计等。

计算机实现指的是(计算机组成的物理实现),它着眼于(器件)技术和(微组装)技术。

14、确定指令系统中是否要设乘法指令属于(计算机系统结构),乘法指令是用专门的高速乘法器实现还是用加法器实现属于(计算机组成),乘法器和加法-移位器的物理实现属于(计算机实现)。

15、主存容量与编址方式的确定属于(计算机系统结构),主存是否采用多体交叉属于(计算机组成),主存器件的选定属于(计算机实现)。

计算机体系结构复习计算题

计算机体系结构复习计算题

1. 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?根据Amdahl 定律可知: 系统加速比 = ==由题可知: 可改进比例 = 40% = 部件加速比 = 10 系统加速比 =采用此增强功能方法后,能使整个系统的性能提高倍。

2. 假设一台计算机的I/O 处理占10%,当其CPU 性能改进到原来的10倍时,而I/O 性能仅改进为原来的两倍时,系统总体性能会有什么改进?加速比=1/(10%/2+90%/10)=本题反映了Amdahl 定律,要改进一个系统的性能要对各方面性能都进行改进,不然系统中最慢的地方就成为新系统的瓶颈。

3. 双输入端的加、乘双功能静态流水线有1、2、3、4四个子部件,延时分别为Δt, Δt, 2Δt, Δt ,“加”由1→2→4组成,“乘”由1→3→4组成,输出可直接返回输入或锁存。

现执行∑=*+41])[(i iiic b a(1) 画出流水时空图,标出流水线输入端数据变化情况。

(2) 求运算全部完成所需的时间和流水线效率。

(3) 找出瓶颈子过程并将其细分,重新画出时空图并计算流水时间和效率。

(1)(2)由上图可知,全部运算完的时间是23Δt 。

923723437=∆⨯∆=t t η(3)部件 ① ② ③ ④ ⑤ ⑥ 结果输入 a 1 a 2 a 3 a 4 a 1+b 1 a 2+b 2 a 3+b 3 a 4+b 4 ① ③ ⑤ b 1 b 2 b 3 b 4 c 1 c 2 c 3 c 4 ② ④ ⑥Δt4 3 2 1由上图可知,流水时间为20Δt 。

1003720537=∆⨯∆=t t η4. 有一条流水线如下所示。

50ns50ns100ns200ns(1) 求连续输入5指令,该流水线的实际吞吐率和效率;(2) 该流水线的瓶颈在哪一段?请采取两种不同的措施消除此“瓶颈”。

系统架构设计师真题解析(计算题)

系统架构设计师真题解析(计算题)

系统架构设计师真题解析(计算题)第一章计算机组成与体系结构流水线吞吐率、加速比2017年下半年1.某计算机系统采用5级流水线结构执行指令,设每条指令的执行由取指令(2t ∆)、分析指令(1t ∆)、取操作数(3t ∆)、运算(1t ∆)和写回结果(2t ∆)组成,并分别用5个子部件完成,该流水线的最大吞吐率为();若连续向流水线输入10条指令,则该流水线的加速比为()。

【解析】理论流水线执行时间=(2t ∆+1t ∆+3t ∆+1t ∆+2t ∆)+max(2t ∆,1t ∆,3t ∆,1t ∆,2t ∆)*(n-1)=9t ∆+(n-1)*3t ∆;第一问:最大吞吐率:Δt 31Δt 6t nΔ3n Δt31)(n-Δt+9n n =+=⨯∞→lim 第二问:10条指令使用流水线的执行时间=9t ∆+(10-1)*3t ∆=36t ∆。

10条指令不用流水线的执行时间=9t ∆*10=90t ∆。

加速比=使用流水线的执行时间/不使用流水线的执行时间=90t ∆/36t ∆=5:2。

2.例:某计算机系统,一条指令的执行需要经历取指(2ms )、分析(4ms )、执行(1ms )三个阶段,现要执行100条指令,利用流水线技术需要多长时间?(教材1.3.1)理论上来说,1条指令的执行时间为:2ms+4ms+1ms=7ms 。

所以:理论流水线执行时间=2ms+4ms+1ms+(100-1)*4=403ms 。

而实际上,真正做流水线处理时,考虑到处理的复杂性,会将指令的每个执行阶段的时间都统一为流水线周期,即1条指令的执行时间为:4ms+4ms+4ms=12ms 。

所以:实际流水线执行时间=4ms+4ms+4ms+(100-1)*4=408ms扩展:上述题目中,如果采用3级操作,2级流水,等价于将3级操作变成2级操作。

最合理的划分是由取指(2ms )、分析(4ms )、执行(1ms )相连划分为指(2ms )、分析(4ms )+执行(1ms )={2,5}。

计算机系统结构考试计算题

计算机系统结构考试计算题

计算机系统结构考试计算题3.12 有一指令流水线如下所示(1)求连续输入10条指令,该流水线的实际吞吐率和效率;(2)该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。

对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少?解:(1)2200(ns)2009200)10050(50t )1n (t T maxm1i i pipeline =?++++=?-+?=∑= )(ns 2201T nTP 1pipeline-==45.45%1154400TP mtTP E m1i i≈=?=??=∑= (2)瓶颈在3、4段。

变成八级流水线(细分)850(ns)509850t 1)(n t T maxm1i i pipeline =?+?=?-+?=∑=)(ns 851T nTP 1pipeline-==58.82%17108400TP mtiTP E m1i ≈=?=??=∑= ? 重复设置部件出50ns 50ns 100ns 200ns)(ns 851T nTP 1pipeline-==58.82%1710885010400E ≈=??=3.13有一个流水线由4段组成,其中每当流经第3段时,总要在该段循环一次,然后才能流到第4段。

如果每段经过一次所需要的时间都是,问:(1)当在流水线的输入端连续地每时间输入任务时,该流水线会发生什么情况?(2)此流水线的最大吞吐率为多少?如果每输入一个任务,连续处理10个任务时的实际吞吐率和效率是多少?(3)当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理10个任务时,其吞吐率提高多少?解:(1)会发生流水线阻塞情况。

第1个任务 S1 S2 S3 S3 S4第2个任务 S1 S2 stall S3 S3 S4第3个任务 S1 stall S2 stall S3 S3 S4第4个任务 S1 stall S2 stall S3 S3 S4(2)t ?t ?2123-13-24-14-2 4-3 4-41 23_1 3_2 4_1 4_2 4_3 4_4 1 11 12 2 223 3 334 4 445 5 55 6 6 667 7 778 8 9 9 1010 89108910 850ns时间段54.35%925045TP E 2310T nTp 23T 21TP pipelinepipeline max ≈=??=??==?=?=t t t t(3)重复设置部件t t=??==751410T nTP pipeline吞吐率提高倍数=tt ??231075=1.643.14 有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或 )(41i i i B A +∏=段t14暂存于相应的流水寄存器中。

计算机系统结构习题

计算机系统结构习题

计算机系统结构习题第一章1. 计算机系统的多级层次结构从上到下的顺序分别是、、、、、。

2. 以往对计算机系统的设计方法有设计和设计,它们分别适用于设计和设计。

3. 研究计算机系统结构的重点是,其主要目的是。

4. 计算机系统的3T性能目标是、、。

5. 以软件为主实现的机器为,由硬件或固件实现的是。

6. 解决软件可移植的办法有、、和。

7. 计算机中的两种信息流是和,计算机系统按流分类可分为、、和。

8. 计算机系统结构主要指。

9. 为了提高CPU的利用率,有效的途径是、、、。

10. 计算机系统的主要软、硬件交界面特性包括、、、、。

11.在系统结构设计中,提高软件功能实现的比例会( )。

A、提高解题速度B、减少需要的存贮容量C、提高系统的灵活性D、提高系统的性能价格比12.对计算机系统结构透明的是( )。

A、数据表示B、是否使用通道型I/O处理机C、虚拟存贮器D、VLSI技术(Very large scale integration)13.对汇编语言程序员透明的是( )。

A、I/O方式中的DMA访问方式B、浮点数据表示C、信息保护方式D、程序性中断14.系列机软件应做到( )。

A、向前兼容,并向上兼容B、向后兼容,力争向上兼容C、向前兼容,并向下兼容D、向后兼容,力争向下兼容15.推出系列机的新机器,不能更改的是( )。

A、原有指令的寻址方式和操作码B、系统总线的组成C、数据通路宽度D、存贮芯片的集成度16.不同系列的机器之间,实现软件移植的途径不包括( )。

A、用统一的高级语言B、用统一的汇编语言C、模拟D、仿真17.在计算机系统的多级层次结构中,单条指令执行速度最快的一级是()。

A、L5(应用语言)级B、L2(操作系统)级C、L1(机器语言)级D、L0(微程序)级18.在计算机系统的多级层次结构中,单条指令功能最强的一级是()。

A、L5(应用语言)级B、L2(操作系统)级C、L1(机器语言)级D、L0(微程序)级19.简述计算机系统设计中软硬件取舍3原则。

《计算机系统结构》及参考答案精选全文完整版

《计算机系统结构》及参考答案精选全文完整版

可编辑修改精选全文完整版《计算机系统结构》练习题一一、单项选择题1.页式虚拟存储器的地址变换对于 D 是透明的.A. 操作系统设计者B. 任何程序员C. 系统结构设计者D. 应用程序员2.以下各类中断中,属于自愿中断的是 C .A. 外部中断B. I/O中断C. 执行“访管”指令D. 机器校验中断3. 高速外部设备磁盘机适合连接于 C .4. 页式虚拟存储器页表的作用是 A .A. 反映虚页在主存的存储情况B. 仅反映虚页是否调入主存C. 反映主存实页与Cache的对应关系D. 反映虚页在辅存的存储情况5.软件和硬件的功能在逻辑上是 C 的.D.软件优于固件6. 计算机中最优化的操作码编码方法是 D .码码C.扩展操作码 D.哈夫曼编码7. 从计算机系统执行程序的角度看,并行性等级由低到高分为四级 A .A.指令内部——指令之间——进程之间——程序之间B.指令之间——指令内部——进程之间——程序之间C.进程之间——指令之间——指令内部——程序之间D.程序之间——进程之间——指令之间——指令内部8. 计算机系统多级层次结构中,操作系统机器级的直接上层是 D .A.传统机器级B.高级语言机器C.应用语言机器级D.汇编语言机器级9.全相联地址映像是指 A .A.任何虚页都可装入主存中任何实页的位置B.一个虚页只装进固定的主存实页位置C.组之间是固定的,而组内任何虚页可以装入任何实页位置D.组间可任意装入,组内是固定装入10.对于同一系列机,必须保证软件能够 C .A.向前兼容,并向上兼容B.向前兼容,并向下兼容C.向后兼容,力争向上兼容D.向后兼容,力争向下兼容11.设有16个处理单元的并行处理机系统, 采用共享主存的方式. 若同时存取16个数据, 为避免存储器访问冲突, 共享主存的多体数量应该为 C 才合理.A. 15B. 16C. 17D. 1912. 软件兼容的根本特征是 C .A. 向前兼容B. 向后兼容C. 向上兼容D. 向下兼容13.在下列机器中,能够实现软件兼容的机器是 B .A. 完全不同种类的机型B. 系统结构相同的机器C. 宿主机和目标机D. 虚拟机14.输入输出系统硬件的功能对 C 是透明的。

体系结构试题及答案

体系结构试题及答案

一.名词解释2:1Cache经验规则:大小为N得直接印象Cache得失效率约等于大小为N/2得两路组相联Cache得失效率。

通道处理机:通道得专用处理机,来专门负责整个计算机体系得输入/输出工作。

通道处理机只能执行有限得一组输入/输出指令。

透明性:在计算机技术中,把这种本来存在得事物或属性,但从某种角度瞧又好像不存在得概念称为透明性。

向量处理机:设置了向量数据表示与相应得向量指令得流水线处理机称为向量处理机。

虚拟Cache:直接用虚拟地址进行访问得Cache计算机系统结构:传统机器程序员所瞧到得计算机属性,即概念性结构与功能特性。

系列机:由同一厂家生产得具有相同系统结构、但具有不同组成与实现得一系列不同型号得计算机。

同构型多处理机系统:由多个同类型或至少担负同等功能得处理机组成,它们同时处理同一作业中能并行执行得多个任务。

堆栈型机器:CPU 中存储操作数得单元就是堆栈得机器。

累加器型机器:CPU 中存储操作数得单元就是累加器得机器。

通用寄存器型机器:CPU 中存储操作数得单元就是通用寄存器得机器。

数据相关:考虑两条指令i与j,i在j得前面,如果下述条件之一成立,则称指令j与指令i数据相关:(1)指令j使用指令i产生得结果;(2)指令j与指令k数据相关,而指令k又与指令i数据相关。

定向:用来解决写后读冲突得。

在发生写后读相关得情况下,在计算结果尚未出来之前,后面等待使用该结果得指令并不见得就是马上就要用该结果。

如果能够将该计算结果从其产生得地方直接送到其它指令需要它得地方,那么就可以避免停顿。

指令级并行:简称ILP。

就是指指令之间存在得一种并行性,利用它,计算机可以并行执行两条或两条以上得指令。

指令得动态调度:就是指在保持数据流与异常行为得情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线得利用率且减少停顿现象。

就是由硬件在程序实际运行时实施得。

指令得静态调度:就是指依靠编译器对代码进行静态调度,以减少相关与冲突。

计算机系统结构考试试题

计算机系统结构考试试题

计算机系统结构考试试题
1. 简答题
a. 请简要阐述计算机系统结构的定义及其重要性。

b. 解释什么是指令集体系结构(ISA),并举例说明不同的ISA 类型。

c. 论述冯·诺伊曼体系结构的特点以及对计算机发展的影响。

2. 计算题
a. 给定一个16位的寄存器,寄存器中保存的数值为56902,将其转换为二进制和八进制表示。

b. 设计一个具有4位地址总线和8位数据总线的存储系统,假设寻址方式为直接地址寻址,计算其寻址范围。

c. 若一个指令的操作码占8位,寄存器地址占3位,立即数占5位,计算其最大可表示的指令数量。

3. 综合题
请设计一个简单的微处理器,包括寄存器组、ALU和控制器。

然后给出一个简单的汇编语言程序,要求能够将两个寄存器中的数值相加并存储到第三个寄存器中。

4. 分析题
请分析Intel x86和ARM架构在计算机系统结构上的异同点,并
讨论其适用领域及性能表现。

5. 论述题
论述存储层次结构在计算机系统中的重要性,并详细说明主存、
缓存和辅存的功能和特点。

同时分析存储层次结构对计算机系统性能
的影响。

在考试中,学生需要结合所学知识,对以上试题进行回答和解答。

对于计算题部分,需要给出详细的计算过程和结果。

对于综合题和分
析题部分,需要清晰地阐述思路和实现方案。

最终的目的是检验学生
对计算机系统结构理论和实践的掌握程度,以及对计算机体系结构相
关概念的理解和应用能力。

希望学生能够在考试中发挥所长,充分展示自己的学习成果和能力。

祝各位同学取得优异的成绩!。

计算机体系结构期末考试试题及答案

计算机体系结构期末考试试题及答案

填空题1.从2002年以来,计算机性能的年增长率下降到了约30%。

其主要原因是:①大功耗问题;②可以进一步有效地开发的指令级并行性已经很少;③存储器访问速度的提高缓慢。

2. 可移植性是指一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。

实现可移植性的常用方法有3种:系列机,模拟和仿真,统一高级语言。

2.通用寄存器型指令集结构计算机在灵活性和提高性能方面有明显的优势。

主要体现在①寄存器的访问速度比存储器快;②对编译器而言,能更加容易有效地分配和使用寄存器;③寄存器可以用来存放变量。

3.MIPS的数据寻址方式只有立即数寻址和偏移量寻址。

4.向量处理机的结构由所采用的向量处理方式决定。

有两种典型的结构;存储器-存储器型结构和寄存器-寄存器型结构。

5.Cache-主存层次的工作由硬件实现,对系统程序员是透明的。

6.降低Cache不命中率最直接的方法是增加Cache的容量。

不过,这种方法不但会增加成本,而且还可能增加命中时间,这种方法在片外Cache中用得比较多。

7.大多数磁盘阵列的组成可以由以下两个特征来区分:数据交叉存放的粒度、冗余数据的计算方法以及在磁盘阵列中的存放方式。

8.时延和带宽是用来评估互连网络性能的两个基本指标。

时延包括通信时延和网络时延。

9.计算机系统可分为SISD、SIMD、MISD和MIMD四类,许多早期并行处理机是SIMD计算机,近年来,MIMD已经成为通用多处理机系统结构的选择。

这是因为MIMD具有灵活性,并且MIMD能充分利用现有微处理器的性价比优势。

判断题1.从计算机语言的角度,系统结构把计算机系统按功能划分成多级层次结构,其中,第2级是操作系统虚拟机,第3级是汇编语言虚拟机。

(错)2.计算机系统中提高并行性的3种途径中,资源重复是在并行性概念中引入时间因素,加快硬件周转而赢得时间。

(错)3.指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的指令的CPI。

计算机系统结构习题

计算机系统结构习题

一、简答题(2题)相关概念、原理、方法说明及比较分析例题1:解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。

差别只是执行时间的不同。

兼容机:由不同公司厂家生产的具有相同系统结构的计算机。

模拟:用软件的方法在一台现有的计算机(称为宿主机)上实现另一台计算机(称为虚拟机)的指令系统。

仿真:用一台现有计算机(称为宿主机)上的微程序去解释实现另一台计算机(称为目标机)的指令系统。

并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。

只要在时间上相互重叠,就存在并行性。

它包括同时性与并发性两种含义。

时间重叠:在并行性概念中引入时间因素,让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。

资源重复:在并行性概念中引入空间因素,以数量取胜。

通过重复设置硬件资源,大幅度地提高计算机系统的性能。

计算机系统结构试题汇总(带答案)

计算机系统结构试题汇总(带答案)

______,调出有关处理该中断服务程序,准备运行。
19.设多体单字低位交叉的存贮器,单体容量为 I 的 m 个分体,其 Mj 的编址模式为 m×i+j,
其中 i=0,1,…,I-1;j=______,如 m=4,M2 体对应二进制地址码最低二位的状态为______。 20.自定义数据表示包括标志符数据表示和______两类,标志符应由编绎程序建立,对______
I1: RI←A1+A2 I2: R2←A3+A4 I3: R3←A5+A6 I4: R4←A7+A8 I5: R5←A9+A10 I6: R6←R1+n2 I7: R7←R3+R4 I8: R8←R5+R6 I9: F←R7+R8 这并不是唯一可能的计算方法。假设功能段的延迟为△t。 1.画出流水线时空图。(8 分) 2.计算流水线的实际吞吐率、加速比和效率。(每个 4 分,共 12 分)
6. 透明性:指一种本来存在的事物或属性,从某种角度看似乎不存在的现象。 7. LRU 算法:即近期最少使用算法,它选择近期最少访问的页面作为被替换的页面。 8.RISC:精简指令系统计算机,这种系统中,尽量简化指令功能,只保留那些功能简 单,能在一个节拍内执行完成指令,较复杂的功能用一段子程序来实现。 9.超标量处理机:通常把一个时钟周期内能够同时发射多条指令的处理机称为超标量 处理机。 10.流水线的链接技术:指一条指令的结果寄存器可能成为后继指令的操作数寄存器的 技术。
五、(10 分) 已知四个程序在三台计算机上的执行时间(s,秒)如下:
程序
执行时间(s,秒)
计算机 A
计算机 B
计算机 C
程序 1
1
10

计算机网络的原理体系结构共分为5层

计算机网络的原理体系结构共分为5层

一、填空题35*11、计算机网络的原理体系结构共分为5层,它们是(1)、(2)、(3)、(4)和(5)。

2、计算机网络的体系结构模型中,最有影响的有(6)和(7)。

3、在OSI 参考模型中,在对等层次上传送的数据,其单位都称为该层的(8)。

4、为进行网络中的数据交换而建立的规则、标准或约定即称为(9)。

5、TCP/IP 模型分为四层,它们是(10)、(11)、(12)、(13)。

8、每赫带宽的理想低通信道的最高码元传输速率的每秒(14)个码元,这就是奈奎斯特准则。

9、信道的(15)越大或信道中的(16)越大,则信息的极限传输速率就越高。

10、HDLC 帧的标志字段的内容是(17),它表示帧的边界。

为了避免数据内容被误认为帧边界,HDLC 采用(18)。

11、CSMA 和ALOHA 的主要区别是CS MA 有(19)。

12、局域网的数据链路层划分为两个子层,它们是(20)和(21)。

13、网卡的物理地址共有(22)字节,(23)负责分配其中的前三字节。

14、广域网由(24)和(25)组成。

15、将网络互连起来要使用一些中间设备,例如,在物理层互连需要中继器,在数据链路层互连需要(26),在网络层互连需要(27),连接两个互不兼容的系统往往需要(28)。

16、将主机名转换成IP 地址,要使用(29)协议,将IP 地址转换成MAC 地址,要使用(30)协议。

17、PING 命令使用了(31)的Echo 请求和Echo 回答报文。

18、TCP/IP 运输层有两个不同的协议,即(32)和(33)。

19 、一般HTML 文件的后缀名为(34 )或(35 )。

二、选择题15*21 .C 类IP 地址的最高三个比特位,从高到低依次是()A 、010B 、110C 、100D 、1012 .下列不属于广域网的是:()A 、电话网B 、ISDNC 、以太网D 、X.25 分组交换公用数据网3 .PPP 是哪种类型的协议?()A 、面向比特B 、面向字符C 、面向字D 、面向数字4 .局域网中的MAC 与OSI 参考模型哪一层相对应?()A 、物理层B 、数据链路层C 、网络层D 、传输层5 .IEEE 802 标准中,规定了CSMA/CD 访问控制方法和物理层技术规范的是:()A 、802.1AB 、802.2C 、802.1BD 、802.36 .ATM 网络采用的是拓扑结构。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.14 有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或
暂存于相应的流水寄存器中。

现要在该流水线上计算 ,画出其时空图,
并计算其吞吐率、加速比和效率。

解:首先,
1+B 1、A 2+B 2、A 3+B 3和A 4+B 4;再计算(A 1+B 1) ×(A 2+B 2)和(A 3+B 3) ×(A 4+B 4);然后求总的结果。

其次,画出完成该计算的时空图,如图所示,图中阴影部分表示该段在工作。

时间
段输 入
A 1
B 1 A 2 B 2 A 3 B 3 A 4 B 4
A B
C
D
A ×
B
C ×D
由图可见,它在18个△t 时间中,给出了7个结果。

所以吞吐率为:
如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。


以加速比为:
该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得:
3.15 动态多功能流水线由6个功能段组成,如下图:
其中,S1、S4、S5、S6组成乘法流水线,S1、S2、S3、S6组成加法流水线,各个功能段时间均为50ns ,假设该
流水线的输出结果可以直接返回输入端,而且设置有足够的缓冲寄存器,若以最快的方式用该流水计算: 乘法
加法
(1) 画出时空图;
(2) 计算实际的吞吐率、加速比和效率。

解:机器一共要做10次乘法,4次加法。

乘法
加法
)(4
1
i i i B A +∏
=61
.18192=∆∆=
t
t
S 223.01853354=⨯⨯+⨯=E t
TP ∆=817
∑=5
1
i i
i i z
y x
3.18 在CRAY-1机器上,按照链接方式执行下述4条向量指令(括号中给出了相应功能部件的执行时间),如果向量寄存器和功能部件之间的数据传送需要1拍,试求此链接流水线的通过时间是多少拍?如果向量长度为64,则需多少拍才能得到全部结果?
V 0←存储器 (从存储器中取数:7拍) V 2←V 0+V 1 (向量加:3拍)
V 3←V 2<A 3 (按(A 3)左移:4拍) V 5←V 3∧V 4 (向量逻辑乘:2拍)
解:通过时间就是每条向量指令的第一个操作数执行完毕需要的时间,也就是各功能流水线由空到满的时间,具体过程如下图所示。

要得到全部结果,在流水线充满之后,向量中后继操作数继续以流水方式执行,直到整组向量执行完毕。

5.10 假设对指令Cache 的访问占全部访问的75%;而对数据Cache 的访问占全部访问的25%。

Cache 的命中时
间为1个时钟周期,失效开销为50 个时钟周期,在混合Cache 中一次load 或store 操作访问Cache 的命中时间都要增加一个时钟周期,32KB 的指令Cache 的失效率为0.39%,32KB 的数据Cache 的失效率为4.82%,64KB 的混合Cache 的失效率为1.35%。

又假设采用写直达策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。

试问指令Cache 和数据Cache 容量均为32KB 的分离Cache 和容量为64KB 的混合Cache 相比,哪种Cache 的失效率更低?两种情况下平均访存时间各是多少?
解:(1)根据题意,约75%的访存为取指令。

因此,分离Cache 的总体失效率为:(75%×0.39%)+(25%×4.82%)=1.055%; 容量为128KB 的混合Cache 的失效率略低一些,只有0.95%。

(2)平均访存时间公式可以分为指令访问和数据访问两部分:
平均访存时间=指令所占的百分比×(读命中时间+读失效率×失效开销)+ 数据所占的百分比×(数据命中时间+数据失效率×失效开销)
所以,两种结构的平均访存时间分别为:
分离Cache 的平均访存时间=75%×(1+0.39%×50)+25%×(1+4.82%×50) =(75%×1.075)+(25%×2.885)=1.5275
混合Cache 的平均访存时间=75%×(1+1.35%×50)+25%×(1+1+1.35%×50) =(75%×1.475)+(25%×2.475)=1.725
因此,尽管分离Cache 的实际失效率比混合Cache 的高,但其平均访存时间反而较低。

分离Cache 提供了两个端口,消除了结构相关。

5.11 给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 的性能。

由计算结果能得出什么结论?
(1) 理想Cache 情况下的CPI 为2.0,时钟周期为2ns ,平均每条指令访存1.2次; (2) 两者Cache 容量均为64KB ,块大小都是32字节; (3) 组相联Cache 中的多路选择器使CPU 的时钟周期增加了10%; (4) 这两种Cache 的失效开销都是80ns ; (5) 命中时间为1个时钟周期; (6) 64KB 直接映象Cache 的失效率为1.4%,64KB 两路组相联Cache 的失效率为1.0%。

解: 平均访问时间=命中时间+失效率×失效开销
(拍)
=+)=-+((拍))=++)+(++)+(++)+(+=(通过总共通过866323164T T 2312114113117T
平均访问时间1-路=2.0+1.4% *80=3.12ns
平均访问时间2-路=2.0*(1+10%)+1.0% *80=3.0ns 两路组相联的平均访问时间比较低
CPU time =(CPU 执行+存储等待周期)*时钟周期
CPU time =IC (CPI 执行+总失效次数/指令总数*失效开销) *时钟周期 =IC ((CPI 执行*时钟周期)+(每条指令的访存次数*失效率*失效开销*时钟周期)) CPU time 1-way =IC(2.0*2+1.2*0.014*80)=5.344IC CPU time 2-way =IC(2.2*2+1.2*0.01*80)=5.36IC 相对性能比:
=--1way
time 2way time CPU CPU 5.36/5.344=1.003
直接映象cache 的访问速度比两路组相联cache 要快1.04倍,而两路组相联Cache 的平均性能比直接映象cache 要高1.003倍。

因此这里选择两路组相联。

例题4.4 :采用了Tomasulo 算法和多流出技术的MIPS 流水线,考虑一下简单循环的执行。

该程序把F2中的标量加到一个向量的每个元素上。

Loop: L.D F0, 0(R1) //取一个数组元素放入F0 ADD.D F4, F0, F2 //加上在F2的标量 S.D F4, 0(R1) //存结果 DADDIU R1,R1,#-8 //将指针减少8(每个数据占8个字节) BNE R1,R2,Loop //若R1不等于R2,表示尚未结束,转移到LOOP 继续 现做以下假设:
1)每个时钟周期能流出一条整数指令和一条浮点指令,即使它们相关也是如此。

2)有一个整数部件,用于整数ALU 运算和地址计算;并且对于每一种浮点操作类型都有一个独立的流水化了的浮点功能部件。

3) 指令流出和写结果各占用一个时钟周期
4) 具有动态分支预测部件和一个独立的计算分支条件的功能部件。

5) 分支指令单独流出,没有采用延迟分支,但分支预测是完美的。

分支指令完成前,其后续指令只能被取出和流出,但不能执行。

6) 产生结果的延迟为:整数运算一个周期、load 两个周期、浮点加法运算3个周期 列出该程序前三遍循环中各条指令的流出、开始执行和将结果写到CDB 上的时间。

相关文档
最新文档