体系结构作业解题参考
231242 北交《计算机体系结构》在线作业一 15秋答案.
北交《计算机体系结构》在线作业一一、单选题(共 20 道试题,共 60 分。
)1. 在h存储器中常用的地址映象方式是()。
. 全相联映象. 页表法映象. 组相联映象. 段页表映象正确答案:2. 计算机系统结构不包括( )。
. 主存速度. 机器工作状态. 信息保护. 数据表示正确答案:3. ( )属于MIM系统结构。
. 各处理单元同时受同一个控制单元的管理. 各处理单元同时接受同一个控制单元送来的指令. 松耦合多处理机和多计算机. 阵列处理机正确答案:4. 多处理机的各自独立型操作系统( )。
. 要求管理程序不必是可再入的. 适合于紧耦合多处理机. 工作负荷较平衡. 有较高的可靠性正确答案:5. 在系统结构设计中,提高软件功能实现的比例会( )。
. 提高解题速度. 减少需要的存贮容量. 提高系统的灵活性. 提高系统的性能价格比正确答案:6. 用户高级语言源程序中出现的读写 (I/O) 语句,到读写操作全部完成,需要通过 ( )共同完成。
. 编译系统和操作系统. I/O 总线、设备控制器和设备. 操作系统和 I/O 设备硬件. 编译系统、操作系统软件和 I/O 总线,设备控制器、设备硬件等正确答案:7. 对汇编语言程序员透明的是( )。
. I/0方式中的M访间方式. 浮点数据表示. 访问方式保护. 程序性中断正确答案:8. 在计算机系统设计中,比较好的方法是( )。
. 从上向下设计. 从下向上设计. 从两头向中间设计. 从中间开始向上、向下设计正确答案:9. 计算机系统中主存一辅存存储层次或 h 一主存存储层次常用的替换算法是 ( )。
. 随机算法. 近期最少使用算法. 先进后出算法. OPT 算法正确答案:10. 下列说法中不正确的是( )。
. 软件设计费用比软件重复生产费用高. 硬件功能只需实现一次,而软件功能可能要多次重复实现. 硬件的生产费用比软件的生产费用高. 硬件的设计费用比软件的设计费用低正确答案:11. 关于软硬件功能是等效的,提高硬件功能的比例以下说法中,不正确的是( )。
14秋福师《计算机体系结构》在线作业一满分答案
福师《计算机体系结构》在线作业一单选题判断题多选题一、单选题(共20 道试题,共40 分。
)1. 松耦合多处理机是通过()方式实现处理机间的通信的。
A. 中断B. 循环C. 消息D. 通道-----------------选择:C2. 下列关于虚拟存储器的说法,比较正确的应当是()。
A. 访主存命中率随页面大小增大而提高B. 访主存命中率随主存容量增加而提高C. 更换替换算法能提高命中率D. 在主存命中率低时,改用堆栈型替换算法,并增大主存容量,可提高命中率-----------------选择:D3. 中断响应由高到低的优先次序宜用()。
A. 访管→程序性→机器故障B. 访管→程序性→重新启动C. 外部→访管→程序性D. 程序性→I/O→访管-----------------选择:B4. 变址寻址的主要作用是()。
A. 支持程序的动态再定位B. 支持访存地址的越界检查C. 支持向量、数组的运算寻址D. 支持操作系统的进程调度-----------------选择:C5. 计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是()。
A. 汇编语言机器级-操作系统机器级-高级语言机器级B. 微程序机器级-传统机器语言机器级-汇编语言机器级C. 传统机器语言机器级-高级语言机器级-汇编语言机器级D. 汇编语言机器级-应用语言机器级-高级语言机器级-----------------选择:B6. 计算机系统结构不包括()。
A. 主存速度B. 机器工作状态C. 信息保护D. 数据表示-----------------选择:A7. 在IBM 370系统中,支持操作系统实现多进程共用公用区管理最有效的指令。
吉林大学22春“计算机科学与技术”《计算机系统结构》作业考核题库高频考点版(参考答案)试题号4
吉林大学22春“计算机科学与技术”《计算机系统结构》作业考核题库高频考点版(参考答案)一.综合考核(共50题)1.多端口存储器适合于连接()。
A.紧耦合多处理机B.松耦合多处理机C.机数很多的处理机D.机数可变的多处理机参考答案:A2.直接执行微指令的是()。
A.编译程序B.硬件C.汇编程序D.微指令程序参考答案:B3.实现汇编语言源程序变换成机器语言目标程序是由( )。
A、编译程序解释B、编译程序翻C、汇编程序解释D、汇编程序翻译正确答案:D4.要实现两条指令在时间上重叠解释,首先需要付出空间代价,其次,要处理好指令之间可能存在的关联。
()A.正确B.错误5.信息在主存—辅存存储层次间的传送是由辅助软硬设备来实现﹔信息在Cache—主存层次间的传送则由辅助硬件来实现。
()A.正确B.错误参考答案:A6.归约机和数据流机一样,都是基于数据流的计算机模型,它们所采用的驱动方式是一样( )。
A、错误B、正确正确答案:A7.数据流机采用数据驱动,执行的操作序列取决于输入数据的可用性﹔归约机则采用需求驱动,执行的操作序列取决于对数据的要求,对数据的需求又来源于函数式程序设计语言对表达式的归纳。
()A.正确B.错误参考答案:A8.对计算机系统结构透明的是( )。
A、字符行运算指令B、是否使用通道型I/O处理机C、虚拟存贮器D、VLSI技术正确答案:D9.在多用户机器上,应用程序员不能使用的指令是()。
A.“访管”指令D.“启动1/0”指令参考答案:D10.利用时间重叠概念实现并行处理的是()。
A.相联处理机B.流水处理机C.并行(阵列)处理机D.多处理机参考答案:B11.计算机系统结构不包括()。
A.机器工作状态B.数据表示C.信息保护D.主存速度参考答案:D12.()属于MIMD系统结构。
A.阵列处理机B.松耦合多处理机和多计算机C.各处理单元同时接受同一个控制单元送来的指令D.各处理单元同时受同一个控制单元的管理参考答案:B13.关于非专用总线三种控制方式中,下列叙述错误的是()。
福师(2020-2021)《计算机体系结构》在线作业二(2)答案
福师(2020-2021)《计算机体系结构》在线作业二
注:本科有多套试卷,请核实是否为您所需要资料,本资料只做参考学习使用!!!
一、单选题(共20题,40分)
1、下列关于标量流水机的说法不正确的是()。
A可对标量数据进行流水处理
B没有向量数据表示
C不能对向量数据进行运算
D可以对向量、数组进行运算
提示:认真复习课本知识302,并完成以上题目
【参考选择】:C
2、()是访问主存空间的地址
A物理地址
B程序地址
C逻辑地址
D虚拟地址
提示:认真复习课本知识302,并完成以上题目
【参考选择】:A
3、在IBM系统中,中断响应硬件分工保存的是()。
A通用寄存器内容
B条件码等状态信息
C各种软件状态和标志
D作业名称和优先级等
提示:认真复习课本知识302,并完成以上题目
【参考选择】:B
4、在IBM 370系统中,支持操作系统实现多进程共用公用区管理最有效的指令是()。
A“测试与置定”指令
B“比较与交换”指令
C“执行”指令
D“程序调用”指令
提示:认真复习课本知识302,并完成以上题目
【参考选择】:B
5、通道流量是在某个时期单位时间内传送的字节数,这个时期应是()。
A通道开始选择设备期
B通道数据传送期
C通道数据传送结束期
D用户经访管指令进入管态,运行I/O管理程序的期间
提示:认真复习课本知识302,并完成以上题目
【参考选择】:B。
计算机体系结构模拟试卷整理版
模拟卷一、选择题(每小题2分,共20分)1.最早的冯·诺依曼结构的计算机是以()为中心的。
A.运算器B.控制器C.存储器D.I/O设备小结:1.计算机以运算器为中心。
2.在存储器中,指令和数据同等对待。
3.存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。
4.指令的执行是顺序的5.指令由操作码和地址码组成。
6.指令和数据均以二进制编码表示,采用二进制运算。
2.Amdahl提出的系统结构指的是()级程序员所看到的计算机属性。
A.操作系统级B.高级语言C.机器语言(传统机器级)D.汇编语言3.计算机指令集的两个发展方向是RISC和()。
A.ARMB.MIPSC.SIMDD.CISC4.从执行程序的角度看,并行性等级最低的是()。
A.指令内部并行B.指令级并行C.线程级并行D.作业级并行小结:指令内部并行、指令级并行、线程级并行、任务级或过程级并行、作业或程序级并行5.流水线的通过时间是指流水线中()流出结果所需的时间。
A.流水线第一段B.流水线第二段C.第一个任务D.最后一个任务小结:排空时间:最后一个任务从进入流水线到流出结果所需的时间。
6.弗林(Michael J. Flynn)对计算机的分类中,MIMD指的是()计算机。
A.单指令流单数据流B.单指令流多数据流C.多指令流单数据流D.多指令流多数据流7..因为分支指令引起的相关叫做()相关。
A.数据B.结构C.控制D.循环8.基本的MIPS整数流水线中,访存地址的计算发生在流水线的第()段。
A.1 B.2 C.3D.49.RISC执行程序的速度比CISC要快的原因是()。
A.RISC的指令系统中指令条数较少B.程序在RISC上编译生成的目标程序较短。
C.RISC的指令平均执行周期数较少。
D.RISC只允许load和store指令访存。
10.通过编译器重新安排指令的执行顺序以减少流水的停顿方法,称之为( )。
A.线性流水线B.非线性流水线C.动态调度D.静态调度二、填空题(每空2分,共30分)1.按某个时期投入市场的某种型号机器编制的程序,不加修改地就能运行于在它之前或之后投入市场的机器。
计算机体系结构作业整理
1. 简述计算机系统设计的主要方法。
答:基于计算机系统层次结构的基础上,其设计方法可以有以下的三种:方法1:由上向下(Top-Down)①设计过程:面向应用的数学模型→面向应用的高级语言→面向这种应用的操作系统→面向操作系统和高级语言的机器语言→面向机器语言的微指令系统和硬件实现。
②应用场合:专用计算机的设计(早期计算机的设计)。
③特点:对于所面向的应用领域,性能(性能价格比)很高。
方法2:由下向上(Bottom-Up)(通用计算机系统的一种设计方法)①设计过程:根据当时的器件水平,设计微程序机器级和传统机器级。
根据不同的应用领域设计多种操作系统、汇编语言、高级语言编译器等。
最后设计面向应用的虚拟机器级。
②应用场合:在计算机早期设计中(60~70年代)广为采用。
③特点:容易使软件和硬件脱节,整个计算机系统的效率降低。
方法3:中间开始(Middle-Out)①设计过程:首先定义软硬件的分界面,然后各个层次分别进行设计。
②应用场合:用于系列机的设计。
③特点:软硬件的分界面在上升,硬件比例在增加。
硬件价格下降,软件价格上升。
软硬件人员结合共同设计。
2. 一般来讲,计算机组成设计要确定的内容应包括那些方面?答:计算机组成设计要确定的内容应包括:①数据通路的宽度,指数据总线上一次能并行传送的信息位数;②专用部件的设置,包括设置那些专用部件,如乘除法专用部件,浮点运算部件,字符处理部件,地址运算部件等,每种专用部件的个数等等,这些都取决于所需答到的机器速度,专用部件的使用频度及允许的价格等;③各种操作对部件的共享程度,若共享程度太高,则会由于共享部件的分时使用而降低操作的速度;若对同一功能部件设置多个以降低共享度,则系统的价格会随之升高;④功能部件的并行度,如功能部件的控制和处理方式是采用顺序串行方式,还是采用重叠,流水,分布处理方式。
⑤控制机构的组成方式,如控制机构是采用硬联线控制还是微程序控制,是采用单机处理还是多机处理或功能分布处理;⑥缓冲和排队技术,包括如何在部件间设置多大容量的缓冲器来弥补它们的速度差异,对于等待要求处理的事件如何排队,如随机,先进先出,先进后出,优先级,循环等不同方式;⑦预估,预判技术,如采用何种原则来预测未来的行为,以优化性能和优化处理;⑧可靠性技术,如采用什么样的冗余技术和容错技术来提高可靠性。
计算机网络体系结构-作业4
(A,6,E)
(F,9,E)
4
(D,0,-)
(E,2,E)
(C,3,E)
(A,6,E)
(B,4,E)
(F,9,E)
5
(D,0,-)
(E,2,E)
(C,3,E)
(B,4,E)
(A,6,E)
(F,9,E)
6
(D,0,-)
(E,2,E)
(C,3,E)
(B,4,E)
(A,6,E)
(F,9,E)
7
(D,0,-)
(E,2,E)
(C,3,E)
3
D
5
4
2
0
5
5
E
3
1
3
5
0
3
F
6
4
3
5
3
0
2、对于图2给出的网络,试述链路状态算法如何建立节点D的路由表。
图2
解:链路状态算法的步骤如下:
步骤
最短路径的节点
待确认的节点
1
(D,0,-)
2
(D,0,-)
(A,8,A)
(E,2,E)
3
(D,0,-)
(E,2,E)
(A,8,A)
(B,4,E)
(C,3,E)
1、对于图1给出的网络,给出当以下条件成立时的全局距离向量表
(a)每个节点只知道到它直接邻居的距离。
(b)每个节点将前一步中的信息告知了它的直接邻居。
(c)步骤(b)再发生一次。
图
解:(a)当每个节点只知道它直接邻居的距离时,全局距离向量表如下:
初始节点
目标节点
A
B
C
D
E
F
软件体系结构课后作业及参考答案
1、就项目管理方面而言,软件重用项目与非重用项目有哪些不同之处。
答:使用软件重用技术可减少重复工作,提高软件生产率, 缩短开发周期。
同时,由于软构建大多经过严格的质量认证,因此有助于改善软件质量,大量使用构建,软件的灵活性和标准化程度可得到提高。
2、实际参与/组织一个软件重用项目的开发,然后总结你是如何组织该项目的开发的答:参加了一个网页管理系统的开发,该项目重复使用已有的软件产品用于开发新的软件系统,以达到提高软件系统的开发质量与效率,降低开发成本的目的。
在过程中使用了代码的复用、设计结果的复用、分析结果的复用、测试信息的复用等。
3、为什么要研究软件体系结构?答:1.软件体系结构是系统开发中不同参与者进行交流和信息传播的媒介。
2.软件体系结构代表了早期的设计决策成果。
3.软件体系结构可以作为一种可变换的模型。
4、根据软件体系结构的定义,你认为软件体系结构的模型应该由哪些部分组成?答:构件(component)可以是一组代码,如程序的模块;也可以是一个独立的程序(如数据库的SQL服务器);连接件(connector)是关系的抽象,用以表示构件之间的相互作用。
如过程调用、管道、远程过程调用等;限制(constrain):用于对构件和连接件的语义说明。
5、在软件体系结构的研究和应用中,你认为还有哪些不足之处?答:(1)缺乏同意的软件体系结构的概念,导致体系结构的研究范畴模糊。
(2)ADL繁多,缺乏同意的ADL的支持。
(3)软件体系结构研究缺乏统一的理论模型支持。
(4)在体系结构描述方便,尽管出现了多种标准规范或建议标准,但仍很难操作。
(5)有关软件体系结构性质的研究尚不充分,不能明确给出一个良体系结构的属性或判定标准,没有给出良体系结构的设计指导原则,因而对于软件开发实践缺乏有力的促进作用。
(6)缺乏有效的支持环境软件体系结构理论研究与环境支持不同步,缺乏有效的体系结构分析、设计、方针和验证工具支持,导致体系结构应用上的困难。
软件设计与体系结构课后练习部分答案
(3)继承。类之间的继承关系是实现现实世界中遗传关系的直接模拟,它表示类之间的内在联系以及对属性和操作的共享,即子类可以沿用父类(被继承类)的某些特征。子类也可以具有自己独有的属性和操作。
(4)聚集。除遗传关系外,现实世界中还普遍存在着部分整体关系。这种关系在面向对象方法学中表示为类之间的聚集关系。在聚集关系下,部分类的对象是整体类对象的一个
(3)类图和对象图的联系:对象是类的实例,对象图也可以看做类图的实例,对象之间的连接是类之间的关联关系的实例。对象图描述在特定时刻和特定环境下,类图中类的具体实例以及这些实例之间的具体连接关系,能帮助人们理解一个比较复杂的类图。
(4)类图和对象图的区别:对象的名字下面要加下划线,对象名称后可以注明所属的类。在一个对象图中可以同时出现一个类的多个实例。
5 需求文档正式进入了配置库。
第四章作业
2、用例分析与设计在设计过程中起到什么作用?
答:
理解业务领域和初步需求描述文档,更准确地使用用例图描述系统需求,作为后续分析和设计活动的依据。
3、什么是概念模型设计?为什么需要建立软件概念模型?
答:
概念模型设计:主要针对问题领域中的对象进行描述的设计。
原因:在用户需求和相关的业务领域中,往往有一些全局性的概念对于理解需求至关重要。因此有必要抽取这些概念,研究这些概念之间的关系。2来自面向数据流的设计过程包含哪些步骤?
答:
面向数据流的结构设计过程和步骤是:
(1)分析、确认数据流图的类型,区分是事务型还是变换型。
(2)说明数据流的边界。
(3)把数据流图映射为程序结构。对于事务流区分事务中心和数据接收通咱,将它映射成事务结构。对于变换流区分输出和输入分支,并将其映射成变换结构。
《计算机组成与体系结构》白中英第三版课后答案
[x]补=0.11011 [y]补=1.00001
(0) 1 1 0 1 1 ×) (1) 0 0 0 0 1 ----------------------------------
(0) 1 1 0 1 1 (0) 0 0 0 0 0 (0) 0 0 0 0 0 (0) 0 0 0 0 0 (0) 0 0 0 0 0 (0) (1) (1) (0) (1) (1) ----------------------------------------(1) 0 0 1 0 1 1 1 0 1 1
(略)
13. "计算机应用"与"应用计算机"在概念上等价吗?用学科角度和计算机系统的层次结构来寿 命你的观点。
课后答案网
www.khd课后a答w案.网com
(略)
第二章运算方法和运算器 习题参考答案
1. 写出下列各数的原码、反码、补码、移码表示(用 8 位二进制数)。其中 MSB 是最高位(又 是符号位)LSB 是最低位。如果是小数,小数点在 MSB 之后;如果是整数,小数点在 LSB 之后。 (1) -35/64 (2) 23/128 (3) -127 (4) 用小数表示-1 (5) 用整数表示-1
2. 数字计算机如何分类?分类的依据是什么?
解:分类:
数字计算机分为专用计算机和通用计算机。通用计算机又分为巨型机、大型机、 中型机、小型机、微型机和单片机六类。
分类依据:专用和通用是根据计算机的效率、速度、价格、运行的经济性和适应性来划分的。 通用机的分类依据主要是体积、简易性、功率损耗、性能指标、数据存储容量、 指令系统规模和机器价格等因素。
[x]移=0.0111010
结构力学作业参考-知识归纳整理
知识归纳整理结构力学课程作业答案第一章 绪论1、按照不同的构造特征和受力特点,平面杆件结构可分为哪几类?平面杆件结构根据其组成特征和受理特点可以分成如下几种类型梁、(刚架) 、( 桁架)、拱以及组合结构。
2、何为静定结构和超静定结构?从几何构造分析的角度看,结构必须是几何不变体系。
根据多余约束 n ,几何不变体系又分为: 有多余约束( n > 0)的几何不变体系——超静定结构;无多余约束( n = 0)的几何不变体系——静定结构。
从求解内力和反力的想法也可以以为:静定结构:凡只需要利用静力平衡条件就能计算出结构的全部支座反力和杆件内力的结构。
超静定结构:若结构的全部支座反力和杆件内力,不能惟独静力平衡条件来确定的结构。
3、土建、水利等工程中的荷载,根据其不同的特征,主要有哪些分类?第二章 平面结构的几何组成分析作业题:1、何为平面体系的几何组成分析?按照机械运动及几何学的观点,对平面结构或体系的组成事情举行分析,称为平面体 系的几何组成分析。
2、何为几何不变体系?何为几何可变体系?几何不变体系—若不思量材料的应变,体系的位置和形状不会改变。
几何可变体系—若不思量材料的应变,体系的位置和形状是可以改变的。
3、几何组成分析的目的是什么?1)保证结构的几何不变性,以确保结构能承受荷载和维持体系平衡.2)判别某一体系是否为几何不变,从而决定它能否作为结构.3)研究几何不变体系的组成规则,以保证所设计的结构是几何不变体系,从而能承受荷载而维持平衡.4)根据体系的几何组成分析,正确区分静定结构和超静定结构,从而挑选适当的计算想法进行结构的反力和内力计算.5)经过几何组成分析,明确结构的构成特点,从而挑选结构受力分析的顺序以简化计算.4、何为一具体系的自由度?知悉体系计算自由度的公式。
求知若饥,虚心若愚。
5、试对下图所示体系举行几何组成分析。
1图图3图4 6、试求图示各体系的计算自由度数W。
千里之行,始于足下。
计算机网络体系结构-作业2
1、假设我们想要传输消息1011001001001011,并用CRC多项式x8+x2+x+1防止它出错。
(a)使用多项式长除法确定应传输的消息。
(b)假设由于传输链路上的噪音使得消息最左端的比特发生反转。
接收方CRC 的计算结果是什么?接受方如何知道发生了一个差错?解:(a)CRC多项式x8+x2+x+1二进制表示为:C(x)=1000 0011 1要传输的消息为:M(x)=1011001001001011首先给要传输的消息后加8个0:T(x)=101100100100101100000000此时用C(x)除T(x):100000111 10110010010010110000000010000011111000111010000011110001001010000011110101101110000011110111000010000011111101110010000011111011011010000011110110001010000011111001010010000011110010011可以得到余数R(x)=10010011将余数附在要发送的消息后面,应传输的消息为:P(x)=101100100100101110010011(b)接收方收到的消息为:P(x)=001100100100101110010011用R(x)去除,可得到:100000111 00110010010010111001001110000011110110001110000011111001001010000011110010101010000011110110110110000011111010101110000011110101100010000011110111110110000011111110100010000011111101111110000011111011000110000011110110110由上式可以看出,余数为10110110,不能整除,说明传输过程中发生了错误。
计算机体系结构_第一次作业
计算机体系结构第一章1.11 Availability is the most important consideration for designing servers, followed closely by scalability and throughput.a. We have a single processor with a failures in time(FIT) of 100. What is the mean time to failure (MTTF) for this system?b. If it takes 1 day to get the system running again, what is the availability of the system?c. Imagine that the government, to cut costs, is going to build a supercomputer out of inexpensive computers rather than expensive, reliable computers. What is the MTTF for a system with 1000 processors? Assume that if one fails, they all fail.答:a. 平均故障时间(MTTF)是一个可靠性度量方法,MTTF的倒数是故障率,一般以每10亿小时运行中的故障时间计算(FIT)。
因此由该定义可知1/MTTF=FIT/10^9,所以MTTF=10^9/100=10^7。
b. 系统可用性=MTTF/(MTTF+MTTR),其中MTTR为平均修复时间,在该题目中表示为系统重启时间。
计算10^7/(10^7+24)约等于1.c. 由于一个处理器发生故障,其他处理器也不能使用,所以故障率为原来的1000倍,所以MTTF值为单个处理器MTTF的1/1000即10^7/1000=10^4。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
体系结构作业解题参考第1章习题6.某处理机时钟频率为f =30MHz ,处理速度为20MIPS ,用它来执行一个已知混合程序。
假定每次存储器访问延迟时间为1个时钟周期。
问:⑴ 此处理机的有效CPI 是多少?⑵ 假定新处理机的时钟频率f 提高到60MHz ,但存储子系统速率不变。
这样,每次存储器访问需2个时钟周期。
如果30%的指令每条只需要1次访存,而另外5%指令每条需2次访存,且假定已知混合程序的指令数不变,并与原处理机兼容,请定量分析改进后的新处理机性能。
解:⑴ 由610⨯=CPI f MIPS 得 5.11020103010666=⨯⨯=⨯=MIPS f CPI⑵ 设已知混合程序的总指令执行数为IC ,则改进前程序执行所需的总时钟周期数NC O 为IC IC CPI NC o 5.1=⨯=而改进后的混合程序的指令数不变,且每次访存需增加1个时钟周期,故改进后程序执行所需的总时钟周期数NC n 为ICICIC IC IC NC NC o n 9.14.05.1205.013.0=+=⨯+⨯+=所以,改进后,处理机的有效CPI 为9.19.1===ICIC IC NC CPI n n 故改进后的处理机速度为58.31109.1106010666≈⨯⨯=⨯=n n n CPI f MIPS第2章习题6.一条线性流水线有4个流水段,每个流水段的延迟时间都为△t 。
开始5个 △t ,每间隔一个△t 向流水线输入一个任务,然后停顿2个△t ,如此重复。
⑴ 画出流水线的时空图。
⑵ 求流水线的实际吞吐率、加速比和效率。
解:⑴ 时空图如下:⑵ 设流入流水线的任务总数为n ,若以5个任务为一组,则共可分为⎥⎥⎤⎢⎢⎡5n 组。
由于两组任务之间间隔2个时钟周期,所以完成n 个任务的总时间为()t n n t n t n T k ∆⎪⎭⎫ ⎝⎛⨯⎥⎥⎤⎢⎢⎡++=∆⨯⎪⎭⎫ ⎝⎛-⎥⎥⎤⎢⎢⎡+∆-+=25121514 所以有t n n n T n P k ∆⎪⎭⎫ ⎝⎛⨯⎥⎥⎤⎢⎢⎡++=251=吞吐率 , 25125242512154⨯⎥⎥⎤⎢⎢⎡++⨯⎥⎥⎤⎢⎢⎡+-=∆⎪⎭⎫ ⎝⎛⨯⎥⎥⎤⎢⎢⎡++∆⨯⎪⎭⎫ ⎝⎛-⎥⎥⎤⎢⎢⎡+∆=n n n n t n n t n t n S 加速比 , 25125144⨯⎥⎥⎤⎢⎢⎡++=∆⎪⎭⎫ ⎝⎛⨯⎥⎥⎤⎢⎢⎡++∆=n n n t n n t n E 效率 。
7.用一条5个流水段的浮点加法流水线计算∑==101i i A F 。
每个流水段的延迟时间均相等,流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。
要求用尽可能短的时间完成计算,画出流水线时空图,计算流水线的P 、S 、E 值。
解:流水线时空图如下由时空图可知,完成全部计算共用了21△t ,共执行了9次加法运算。
所以t t T n P k ∆=∆==73219 , 7152195=∆⨯∆==t t T T S k o , 7351715=⨯==k S E 。
10.在一台流水线处理机上执行下面程序。
每条指令都要经过“取指”、“译码”、“执行”、“写结果”4 个流水段,每个流水段延迟时间都是5ns 。
但在“执行”流水段LS 部件和ALU 部件只能其中一个工作,其中LS 部件完成LOAD 和STORE 操作,ALU 部件完成其它操作。
这两个操作部件的输出端和输入端有直接输出通路相互切换连接,且ALU 部件产生的条件码也能直接送入控制器。
I1 SUB R0,R0I2 LOAD R1,#8I3 LOOP:LOAD R2,A(R1)I4 MUL R2,R1I5 ADD R0,R2I6 DNE R1 LOOPI7 STORE R0,M(X)假定采用静态分支预测技术,每次都预测转移不成功。
要求:⑴ 画出指令流水线的时空图。
⑵ 计算流水线的吞吐率和加速比,并分别计算译码部件和ALU 部件的使用效率。
解:⑴ 时空图如下:⑵ ()秒任务吞吐率/10644.1181055935593569⨯≈⨯⨯=∆==-st T n P k , 373.259354≈∆⨯∆==tt T T S k o 加速比 , %831.14594351≈∆⨯∆⨯=tt E ID , ()%593.105948311≈∆⨯∆⨯+⨯=t t E ALU 。
第3章习题7.第6题中假设所有运算型指令都在译码(ID)段读寄存器,在写结果(WB)段写寄存器,采用顺序发射顺序完成的调度策略。
⑴画出流水线执行指令序列的时空图。
⑵计算执行这个程序所用的时间。
I1 LOAD R0,M(A)I2 ADD R1,R0I3 LOAD R2,M(B)I4 MUL R3,R4I5 AND R4,R5I6 ADD R2,R5解:⑴⑵执行时间=10ns×11=110ns .8.第6题中假设所有运算型指令都在译码(ID)段读寄存器,在写结果(WB)段写寄存器,采用顺序发射乱序完成的调度策略。
⑴画出流水线执行指令序列的时空图。
⑵计算执行这个程序所用的时间。
解:⑴⑵执行时间=10ns×10=100ns .9.第6题中假设每个操作部件的输出端都有直接数据通路与输入端相连,采用顺序发射乱序完成的调度策略。
⑴画出流水线执行指令序列的时空图。
⑵计算执行这个程序所用的时间。
解:⑴⑵执行时间=10ns×8=80ns .11.解:两种静态指令调整方案的时空图如下:第4章习题3.解:⑴向量链接图如下⑵ T=(1+7+1)+(1+3+1)+(1+4+1)+(1+2+1)+(64-1)=87(拍)。
⑶流过时间=1+7+1+1+3+1+1+4+1+1+2+1=24(拍)。
4.解:⑴第1、2两条指令并行执行,然后与第3条指令链接,第4条指令顺序执行。
⑵ T=[(1+6+1)+(1+7+1)+(32-1)]+[(1+6+1)+(32-1)]=87(拍)。
5.⑴ V0←存储器V1←V2+V3V4←V5*V63条指令全并行执行,总时间为T=(1+7+1)+(32-1)=40(拍)⑵ V2←V0*V1V3←存储器V4←V2+V3第1、2条指令并行执行,第3条指令顺序执行。
总时间为T=[(1+7+1)+(32-1)]+[(1+6+1)+(32-1)]=79(拍)⑷ V0←存储器V1←1/V0V3←V1+V2V5←V3*V44条指令全部链接执行。
总时间为T=(1+6+1)+(1+14+1)+(1+6+1)+(1+7+1)+(32-1)=72⑸ V0←存储器V1←V2+V3V4←V5*V6S0←S1+S24条指令全部并行执行。
总时间为T=(1+7+1)+(32-1)=40(拍)⑹ V3←存储器V2←V0+V1V3←V2*V1V5←V3*V4第1、2条指令并行执行,第3、4条指令均顺序执行。
总时间为T=[(1+6+1)+(32-1)]+[(1+7+1)+(32-1)]+[(1+7+1)+(32-1)]=1197.某机有16个向量寄存器,其中V0—V5分别放有A、B、C、D、E、F,向量长度均为32,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。
采用链接技术,先计算(A+B)*C,在流水线不停顿的情况下,接着计算(D+E)*F。
⑴设寄存器入/出各需1拍,此链接流水线的流过时间为多少拍?⑵假设每拍为50ns,完成这些计算并把结果存入相应寄存器,此部件的实际吞吐率是多少MFLOPS?解:写出向量操作序列如下:V6←V0+V1V7←V6*V2V8←V3+V4V9←V8*V5显然可将第1、2两条指令链接,第3、4两条指令链接;且第2组操作紧随第1组操作流入流水线,使流水线不停顿。
⑴流过时间=1+2+1+1+3+1=9(拍)。
⑵ 总时间T=[(1+2+1)+(1+3+1)+(64-1)]* 50ns =3600ns ,完成的浮点运算总次数N=2*64=128,所以,该部件的实际吞吐率为MFLOPS sT N P 56.351036001289=⨯==-8.在某向量机上计算D=A*(B+C ),设A 、B 、C 均为长度为128的向量,并已存放在相应寄存器中,都利用浮点功能部件和链接技术。
该机向量寄存器长度为64。
⑴ 完成计算任务所需要的最短时间为多少拍?⑵ 实际吞吐率是多少MFLOPS ?解:本题的向量需要分两段处理,每段长度均为64。
设各向量存放的向量寄存器为:A 存于V0和V1,B 存于V2和V3,C 存于V4和V5,D 存于V6和V7,且该机有足够的向量寄存器。
则完成计算所需的操作序列如下:V8←V2+V4V6←V0*V8V8←V3+V5V7←V1*V8⑴ 显然可将第1、2两条指令链接,第3、4两条指令链接。
设加法功能部件时间为6拍,乘法功能部件时间为7拍,向量寄存器入/出各需1拍,则总时间为T=[(1+6+1)+(1+7+1)+(64-1)]*2=160(拍)⑵ 完成计算任务所做的浮点操作总次数为N=2*128=256。
设该机的时钟频率为f ,则其实际吞吐率为MFLOPS f T f N P 661016025610⨯⨯=⨯⨯=4.设E为交换函数,S为均匀洗牌函数,B为蝶式函数,PM2I为移数函数,函数的自变量是十进制数表示的处理机编号。
现有32台处理机,其编号为0,1,2, (31)⑴分别计算下列互连函数:E2(12)S(8)B(9)PM2I+3(28)E0(S(4))S(E0(18))⑵用E0和S构成均匀洗牌交换网(每步只能使用E0和S一次),网络直径是多少?从5号处理机发送数据到7号处理机,最短路径要经过几步?请列出经过的处理机编号。
⑶采用移数函数构成互连网,网络直径是多少?结点度是多少?与2号处理机距离最远的是几号处理机?解:⑴E2(12)=E2(01100)=(01000)2=8,S(8)=S(01000)=(10000)2=16,B(9)=B(01001)=(11000)2=24,PM2I+3(28)=28+23 mod 32=4,E0(S(4))=E0(S(00100))=E0(01000)=(01001)2=9,S(E0(18))=S(E0(10010))=S(10011)=(00111)2=7.⑵依题意,均匀洗牌交换网的互连函数设计为:S(E0(X))。
S(E0(00000))=00010,S(E0(00001))=00000,S(E0(00010))=00110,S(E0(00011))=00100,S(E0(00100))=01010,S(E0(00101))=01000,S(E0(00110))=01110,S(E0(00111))=01100,S(E0(01000))=10010,S(E0(01001))=10000,S(E0(01010))=10110,S(E0(01011))=10100,S(E0(01100))=11010,S(E0(01101))=11000,S(E0(01110))=11110,S(E0(01111))=11100,S(E0(10000))=00011,S(E0(10001))=00001,S(E0(10010))=00111,S(E0(10011))=00101,S(E0(10100))=01011,S(E0(10101))=01001,S(E0(10110))=01111,S(E0(10111))=01101,S(E0(11000))=10011,S(E0(11001))=10001,S(E0(11010))=10111,S(E0(11011))=10101,S(E0(11100))=11011,S(E0(11101))=11001,S(E0(11110))=11111,S(E0(11111))=11101。