计算机系统结构_第六章练习答案
计算机系统结构课后习题答案
![计算机系统结构课后习题答案](https://img.taocdn.com/s3/m/5ea02bad9ec3d5bbfc0a7414.png)
第一章计算机系统结构的基本概念1.有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。
现若需第i级的N条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间?答: ????第2级上等效程序需运行:(N/M)*Ks。
第3级上等效程序需运行:(N/M)*(N/M)*Ks。
第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。
note: ????由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。
而现在第i级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级需(N/M)条指令来完成第i级的计算量。
所以,当有一段第1级的程序需要运行Ks时,在第2级就需要(N/M)Ks,以此类推2.硬件和软件在什么意义上是等效的?在什么意义上又是不等效的?试举例说明。
答:?软件和硬件在逻辑功能上是等效的,原理上,软件的功能可用硬件或固件完成,硬件的功能也可用软件模拟完成。
但是实现的性能价格比,实现的难易程序不同。
????在DOS操作系统时代,汉字系统是一个重要问题,早期的汉字系统的字库和处理程序都固化在汉卡(硬件)上,而随着CPU、硬盘、内存技术的不断发展,UCDOS把汉字系统的所有组成部份做成一个软件。
3.试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。
答: ?计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。
????(1)计算机的系统结构相同,但可采用不同的组成。
如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。
从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由中央处理机/主存,通道、设备控制器,外设4级构成。
其中,中央处理机都有相同的机器指令和汇编指令系统,只是指令的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。
计算机体系结构课后习题原版答案
![计算机体系结构课后习题原版答案](https://img.taocdn.com/s3/m/718e04f45022aaea998f0f63.png)
第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机体系结构第6章答案
![计算机体系结构第6章答案](https://img.taocdn.com/s3/m/675dbb20aaea998fcc220e86.png)
一填空题六、输入输出系统(28空)1、连接特性I/O系统容量2、响应时间吞量3、寻道时间旋转时间4、传输时间控制器开销5、从盘面到缓冲存储器从缓冲存储器到主机6、面密度7、提高转速提高记录密度8、可用性可信性9、可用性可信性可靠性10、容量大可靠性高11、RAID1 RAID212、同步异步13、通用串行总线14、必须独占使用15、周边元件扩展接口廉价磁盘冗余阵列六、输入输出系统(10个)6.1 引言6.2 外部存储设备6.3 可靠性、可用性和可信性1、系统可靠性:系统可靠性是指系统从初始状态开始一直提供服务的能力,可靠性通常用平均无故障时间(MTTF)来衡量。
2、系统可用性:系统可用性是指系统正常工作时间在连续两次正常服务间隔时间中所占的比率。
3、系统可信性:系统的可信性是指服务的质量,即在多大程度上可以合理的认为服务是可靠的。
可信性是不可以度量的。
4、故障容忍技术:通过冗余措施,虽然可能出现故障,但是可以通过冗余信息保证服务仍然能够正常进行。
6.4 廉价磁盘冗余陈列RAID5、RAID:即廉价磁盘冗余陈列,通过在磁盘阵列中增加冗余信息来容错,提高磁盘阵列的可靠性。
当单个磁盘失效时,丢失的信息可以通过冗余盘中的信息重新构建。
6、RAID1:亦称镜像盘,使用双备份磁盘。
每当数据写入一个磁盘时,将该数据也写到另一个冗余盘,这样形成信息的两份复制品。
如果一个磁盘失效,系统可以到镜像盘中获得所需要的信息。
镜像是最昂贵的解决方法。
特点是系统可靠性很高,但效率很低。
6.5 I/O设备与CPU和存储器的连接7、PCI:Peripheral Component Interconnect,即外围器件互连,是一种为CPU和外设之间提供高性能数据通道的总线。
8、I/O层次结构:即I/O系统的四级层次结构,在一台大型计算机系统中可以有多个通道,一个通道可以连接多个设备控制器,而一个设备控制器又可以管理一台或多台外围设备。
计算机系统结构 第六章自考练习题答案
![计算机系统结构 第六章自考练习题答案](https://img.taocdn.com/s3/m/99ddabb3fd0a79563c1e7223.png)
5.阵列处理机是( 单 )指令流( 多 )数据流的计算机。 6.ILLIAC IV 8×8 的阵列中,任意两个处理单元之间通信的最大距离不会超过( 步。推广到一般, n × n 的阵列中,则为(
n -1
7 )
)步。 ) ,Shuffle(Shuffle
7.8 个节点混洗网络, 其混洗函数为 Shuffle P 2 P1 P 0 ) ( P1 P 0 P 2 ( = ( P 2 P1 P 0 )) =( P 0 P 2 P1 ) 。
N /2
) 。
不同的多级互连网络,在所用的( 交换开关 ) 、拓扑结构和( 控制方 式 )上各有不同。 4. 阵列处理机按存储器的组织方式不同,分为两种不同的基本构形,一种是采用( 分 布 )存储器的阵列处理机构形,另一种是具有( 集中 )共享存储器的阵列处理机 构形。 5. 简述去安排列网络的概念及实现全排列网络的两种方法。 (P174-175) 6.
(参考 P176-177)
同步强化练习
一.单项选择题。
1. 2. ( 3. 4. 多级混洗交换网络又称为( B ) 。 A.移数网络 B.Omega C.STARAN 网络 D.数据交换网络 存储器分体数 m 为质数时,访问一维数组的元素无冲突,要求数组变址的跳距为 A ) 。 A.与 m 互质 B.是 m 的倍数 C.与 m 不等 D.与 m 相等 ILLIAC IV 是一种( C ) 。 A.流水线处理机 B.指令重叠处理机 C.阵列处理机 D.多处理机 N 个结点的单级立方体网络,互连函数种数为( B ) 。 A.N 5. B. log
计算机系统结构自考复习资料
第六章 阵列处理机 历年真题精选
1. 拓 扑 结 构 用 多 级 立 方 体 网 络 , 二 功 能 交 换 单 元 , 级 控 制 方 式 , 这 种 网 络 称 为 ( B ) 。 A. Omega 网络 B. 交换网络 C. 间接二进制 n 方体网络 D. 数据变换网络 2.N 个结点的 PM2I 单级网络的最短距离是( 3. log 2
计算机系统结构习题答案(李学干)
![计算机系统结构习题答案(李学干)](https://img.taocdn.com/s3/m/da9bcb3383c4bb4cf7ecd130.png)
计算机系统结构习题解答第一章习题一1.2一台经解释实现的计算机,可以按照功能划分成4级。
每一级为了执行一条指令需要下一级的N条指令解释。
若执行第1级的一条指令需K纳秒时间,那么执行第2、3、4级的一条指令个需要多少时间?解:①分析:计算机按功能分级时,最底层的为第1级。
向上一次是第2 、3、4级。
解释执行是在低级机器级上,用它的一串指令或语句来解释执行高一级上的一条指令的功能。
是逐条解释的。
②解答:执行第2、3、4级的一条指令各需KNns,KN2ns,KN3ns的时间。
1.3操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接实现,而不由操作系统自己来实现。
根据你对习题1.2的回答,你认为这样做有哪两个好处?答:可以加快操作系统操作命令解释的速度。
同时也节省了存放解释操作命令这部分解释程序所占用的空间。
简化了操作系统机器级的设计。
也有利于减少传统机器级的指令条数。
1.5硬件和软件在什么意义上是等效的?在什么意义上是不等效的?试举例说明。
答:硬件和软件在逻辑意义上是等效的。
在物理意义上是不等效的。
①在原理上,用硬件或固件实现的功能完全可以用软件来完成。
用软件实现的功能也可以用硬件或固件来完成。
功能一样。
②只是反映在速度、价格、实现的难易程度上,这两者是不同的。
性能不同。
③例如,浮点运算在80386以前一直是用软件实现的。
到了80486,将浮点运算器集成到了CPU中,可以直接通过浮点运算指令用硬件实现。
但速度却高的多。
1.9下列哪些对系统程序员是透明的?哪些对应用程序员是透明的?系列机各档不同的数据通路宽度;虚拟存储器;Cache存储器;程序状态字;“启动I/O”指令;“执行”指令;指令缓冲器。
答:①对系统程序员和应用程序员均透明的:是全用硬件实现的计算机组成所包含的方面。
有:数据通路宽度、Cache存储器、指令缓冲器。
②仅对应用程序员透明的:是一些软硬件结合实现的功能。
有:虚拟存储器、程序状态字、“启动I/O”指令。
计算机组成原理习题答案第六章
![计算机组成原理习题答案第六章](https://img.taocdn.com/s3/m/45f540e56c175f0e7dd13768.png)
1.如何区别存储器和寄存器?两者是一回事的说法对吗?解:存储器和寄存器不是一回事。
存储器在CPU 的外边,专门用来存放程序和数据,访问存储器的速度较慢。
寄存器属于CPU 的一部分,访问寄存器的速度很快。
2.存储器的主要功能是什么?为什么要把存储系统分成若干个不同层次?主要有哪些层次?解:存储器的主要功能是用来保存程序和数据。
存储系统是由几个容量、速度和价存储系统和结构各不相同的存储器用硬件、软件、硬件与软件相结合的方法连接起来的系统。
把存储系统分成若干个不同层次的目的是为了解决存储容量、存取速度和价格之间的矛盾。
由高速缓冲存储器、主存储器、辅助存储器构成的三级存储系统可以分为两个层次,其中高速缓存和主存间称为Cache -主存存储层次(Cache 存储系统);主存和辅存间称为主存—辅存存储层次(虚拟存储系统)。
3.什么是半导体存储器?它有什么特点?解:采用半导体器件制造的存储器,主要有MOS 型存储器和双极型存储器两大类。
半导体存储器具有容量大、速度快、体积小、可靠性高等特点。
半导体随机存储器存储的信息会因为断电而丢失。
4.SRAM 记忆单元电路的工作原理是什么?它和DRAM 记忆单元电路相比有何异同点?解:SRAM 记忆单元由6个MOS 管组成,利用双稳态触发器来存储信息,可以对其进行读或写,只要电源不断电,信息将可保留。
DRAM 记忆单元可以由4个和单个MOS管组成,利用栅极电容存储信息,需要定时刷新。
5.动态RAM 为什么要刷新?一般有几种刷新方式?各有什么优缺点?解:DRAM 记忆单元是通过栅极电容上存储的电荷来暂存信息的,由于电容上的电荷会随着时间的推移被逐渐泄放掉,因此每隔一定的时间必须向栅极电容补充一次电荷,这个过程就叫做刷新。
常见的刷新方式有集中式、分散式和异步式3种。
集中方式的特点是读写操作时不受刷新工作的影响,系统的存取速度比较高;但有死区,而且存储容量越大,死区就越长。
分散方式的特点是没有死区;但它加长了系统的存取周期,降低了整机的速度,且刷新过于频繁,没有充分利用所允许的最大刷新间隔。
计算机系统结构_第六章练习 答案
![计算机系统结构_第六章练习 答案](https://img.taocdn.com/s3/m/f57820cf48649b6648d7c1c708a1284ac950054d.png)
计算机系统结构_第六章练习答案计算机系统结构_第六章练习答案第六章向量处理机1.在大型数组的处置中常常涵盖向量排序,按照数组中各排序相继的次序,我们可以把向量处置方法分成哪三种类型?横向处理方式,纵向处理方式,纵横处理方式纵向处理方式:向量排序就是按行的方式从左至右纵向的展开横向处理方式:向量排序就是按列的方式自上而下横向的展开四海处理方式:纵向处置和横向处置结合的方式2.表述以下与向量处置有关的术语。
(1)向量和标量的平衡点:为了使向量硬件设备和标量设备的利用率相等,一个程序中向量代码所占的百分比(2)用户代码的向定量比值:用户代码可以向定量的部分占到全部的比重(3)向量化编译器或量化器:将标量运算进行向量化或者将向量运算进行适当的修改使之能够进入向量处理进行向量处理的编译器3.详细描述提升向量处理机性能的常用技术(1)链接技术(2)向量循环或分段开采技术(3)向量递归技术(4)稠密矩阵的处置技术4.下述的几个需要解决的问题中,那个是向量处理机所最需要关心的?a.计算机指令的优化技术b.设计满足用户运算器频宽建议的存储器c.如何提高存储器的利用率,增加存储器系统的容量d.纵横处理方式的划分问题5.假设系统在向量模式下面能达至9mflops,在标量模式下能达至1mflops速度,而代码的90%就是向量运算,10%就是标量运算,这样花掉在两种模式上的排序时间成正比。
那么向量平衡点就是:a.0.1b.0.9一个程序中向量代码所占的百分比c.0.5d.以上都不是6.查看下面三条指令:v3←av2←v0+v1v4←v2*v3假设向量长度大于64,且前后其他的指令均没相关性,数据步入和流入每个功能部件,包含出访存储器都须要一拍摄的时间,假设向量的长度为n。
三条指令全部使用以太网的方法,那么继续执行的时间就是:a.3n+20b.3n+21c.3n+22d.3n+237.下面一组向量操作能分成几个编队?假设每种流水功能部件只有一个。
计算机组织与系统结构第六章习题答案
![计算机组织与系统结构第六章习题答案](https://img.taocdn.com/s3/m/dbccb24cd1f34693dbef3e0d.png)
习题1.给出以下概念的解释说明。
指令周期(Instruction Cycle)机器周期(Machine Cycle)同步系统(Synchronous system)时序信号(Timing signal)控制单元(Control Unit, CU)执行部件(Execute Unit,EU)组合逻辑元件(Combinational logic element)或操作元件(Operate element)时序逻辑元件(Sequential logic circuit)或状态元件(State element)多路选择器(Multiplexor)扩展器(Extension unit)“零”扩展(0- extend)“符号”扩展(Sign extend)算术逻辑部件ALU(Arithmetic Logic Unit)加法器(Adder)CPU总线(CPU Bus)寄存器堆(Register file)定时方式(Clocking methodology)边沿触发(Edge-triggered)寄存器写信号(Register Write)指令存储器(Instruction Memory)数据存储器(Data Memory)程序计数器(Program Counter)指令寄存器(Instruction Register)指令译码器(Instruction Decoder)时钟周期(Clock Cycle)主频(CPU Clock Rate / Frequency转移目标地址(Branch target address)控制信号(Control signal)微程序控制器(Microprogrammed control)硬布线控制器(Hardwared control)控制存储器(Control Storage,控存CS)微代码(Microcode)微指令(Microinstruction)微程序(Microprogram)固件(Firmware)中断过程(Interrupt Processing)异常(Exception)故障(fault)自陷(Trap) 终止(Abort)中断(Interrupt)中断服务程序(Interrupt Handler)中断允许位(Interrupt Enable Bit)关中断(Interrupt OFF)开中断(Interrupt ON)中断响应(Interrupt Response)向量中断(Vector Interrupt)中断向量(Interrupt vector)中断向量表(Interrupt vector table)向量地址(vector Address)中断类型号(Interrupt number)2. 简单回答下列问题。
计算机系统结构作业答案
![计算机系统结构作业答案](https://img.taocdn.com/s3/m/dc76671dc281e53a5802ff2d.png)
计算机系统结构计算机系统结构作业1第1章计算机系统结构的基本概念一、解释下列术语:计算机系统结构;计算机组成;计算机实现;透明性;系列机;软件兼容;兼容机;模拟;仿真;虚拟机;宿主机;Amdahl定律;CPI;MIPS;MFLOPS。
【答案】计算机系统结构、计算机组成和计算机实现是三个不同的概念。
系统结构定义为由程序设计者所看到的一个计算机系统的属性,即概念性结构和功能特性,这里的程序设计者所看到的计算机属性是指为机器语言或编译程序设计者所看到的计算机属性,是硬件子系统的概念性结构及其功能特性,它是计算机系统的软、硬件的界面。
计算机组成是计算机系统结构的逻辑实现,包括机器内部的数据流和控制流的组成以及逻辑设计等。
计算机实现是指计算机组成的物理实现。
透明性:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,成为透明性现象。
所谓系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。
不同公司厂家生产的具有相同系统结构的计算机称为兼容机。
软件兼容:在新的计算机系统出台后,原先已开发的软件仍能继续在升档换代的新型号机器上使用,这就是软件兼容。
系列机方法能够在具有相同系统结构的各种机器之间实现软件移植,为了实现软件在不同系统结构的机器之间的相互移植,可以采用模拟和仿真。
模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。
仿真是指用微程序直接解释另一种机器指令系统的方法。
虚拟机是被模拟的机器;宿主机是进行模拟的机器。
Amdahl 定律:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。
Fe=(改进前可改进部分占用的时间)/(改进前整个任务的执行时间) Se=(改进前可改进部分的执行时间)/(改进后改进部分的执行时间) 则,改进后整个系统加速比为ee e n S F F s /)1(1+-=。
计算机系统结构(第2版(课后习题答案
![计算机系统结构(第2版(课后习题答案](https://img.taocdn.com/s3/m/244b099f2e3f5727a4e96255.png)
word 文档下载后可自由复制编辑你计算机系统结构清华第 2 版习题解答word 文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9 (透明性概念),1.12-1.18 (Amdahl定律),1.19、1.21 、1.24 (CPI/MIPS)1.2 第二章(P124)2.3 、2.5 、2.6 (浮点数性能),2.13 、2.15 (指令编码)1.3 第三章(P202)3.3 (存储层次性能), 3.5 (并行主存系统),3.15-3.15 加 1 题(堆栈模拟),3.19 中(3)(4)(6)(8)问(地址映象/ 替换算法-- 实存状况图)word 文档下载后可自由复制编辑1.4 第四章(P250)4.5 (中断屏蔽字表/中断过程示意图),4.8 (通道流量计算/通道时间图)1.5 第五章(P343)5.9 (流水线性能/ 时空图),5.15 (2种调度算法)1.6 第六章(P391)6.6 (向量流水时间计算),6.10 (Amdahl定律/MFLOPS)1.7 第七章(P446)7.3 、7.29(互连函数计算),7.6-7.14 (互连网性质),7.4 、7.5 、7.26(多级网寻径算法),word 文档下载后可自由复制编辑7.27 (寻径/ 选播算法)1.8 第八章(P498)8.12 ( SISD/SIMD 算法)1.9 第九章(P562)9.18 ( SISD/多功能部件/SIMD/MIMD 算法)(注:每章可选1-2 个主要知识点,每个知识点可只选 1 题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例 , 习题2.1 第一章 (P33)例 1.1,p10假设将某系统的某一部件的处理速度加快到 10倍 ,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知: Fe=0.4, Se=10,根据 Amdahl 定律S n To T n1 (1Fe )S n 1 10.6 0.4100.64 Fe Se 1.56word 文档 下载后可自由复制编辑例 1.2,p10采用哪种实现技术来求浮点数平方根 FPSQR 的操作对系统的性能影响较大。
计算机组成与结构课后答案6-7章习题.
![计算机组成与结构课后答案6-7章习题.](https://img.taocdn.com/s3/m/4be80d65d4d8d15abf234ed5.png)
1、如图1表示使用快表(页表)的虚实地址转换条件,快表存放在相联存贮器中,其中容量为8个存贮单元。
问:(1) 当CPU 按虚拟地址1去访问主存时,主存的实地址码是多少? (2) 当CPU 按虚拟地址2去访问主存时,主存的实地址码是多少? (3) 当CPU 按虚拟地址3去访问主存时,主存的实地址码是多少?虚拟地址 123图1解:(1)用虚拟地址为1的页号15作为快表检索项,查得页号为15的页在主存中的起始地址为80000,故将80000与虚拟地址中的页内地址码0324相加,求得主存实地址码为80324。
(2)主存实地址码 = 96000 + 0128 = 96128(3)虚拟地址3的页号为48,当用48作检索项在快表中检索时,没有检索到页号为48的页面,此时操作系统暂停用户作业程序的执行,转去执行查页表程序。
如该页面在主存中,则将该页号及该页在主存中的起始地址写入主存;如该页面不存在,则操作系统要将该页面从外存调入主存,然后将页号及其在主存中的起始地址写入快表。
2、假设某计算机的运算器框图如图2所示,其中ALU 为16位的加法器,S A 、S B 为16位暂存器,4个通用寄存器由D 触发器组成,Q 端输出, 其读写控制如下表所示:要求:(1)设计微指令格式。
(2)画出ADD ,SUB 两条指令微程序流程图。
图2解:(1)微命令字段共12位,微指令格式如下:1R RA0RA1 w WA0W A1 LDS A LDS B S B->ALU CLR ~ P字段下址字段各字段意义如下:R—通用寄存器读命令W—通用寄存器写命令.RA0RA1—读R0—R3的选择控制。
WA0W A1—写R0—R3的选择控制。
LDS A—打入SA的控制信号。
LDS B—打入SB的控制信号。
S B->ALU—打开非反向三态门的控制信号。
S B->ALU—打开反向三态门的控制信号,并使加法器最低位加1。
CLR-暂存器SB清零信号。
计算机系统结构(高教版)张晨曦 习题答案 第六章
![计算机系统结构(高教版)张晨曦 习题答案 第六章](https://img.taocdn.com/s3/m/400bee3610661ed9ad51f323.png)
6.1 名词解释响应时间:从用户输入命令开始到得到结果所花费的时间可靠性:系统从某个初始参考点开始一直连续提供服务的能力可用性:系统正常工作的时间在连续两次正常服务间隔时间所占的比率可信性:服务的质量,记载多大程度上可以合理地认为服务是可靠的RAID:在磁盘阵列中设置冗余信息盘,从而形成的磁盘阵列分离式事务总线:在请求和应答之间的空闲时间内,总线可以提供其他的I/O使用,这样就不必在整个I/O过程中都独占总线,采用这种技术的总线叫分离事务总线通道:专门负责整个计算机系统的输入输出工作的专用处理机通道流量:又称通道吞吐率、通道数据传输率等,它是指一个通道在数据传送期间,单位时间能够传送的数据量虚拟DMA:允许DMA设备直接使用虚拟地址,并在DMA期间由硬件将虚拟地址转换为物理地址。
异步I/O:允许进程在发出I/O请求后继续执行,直到该进程真正访问这些数据而它们又尚未就绪时才被挂起。
6.3 RAID有哪些分级?各有何特点?RAID0亦称数据分块,即把数据分布在多个盘上,实际上是非冗余阵列,无冗余信息。
RAID1亦称镜像盘,使用双备份磁盘。
每当数据写入一个磁盘时,将该数据也写到另一个冗余盘,这样形成信息的两份复制品。
如果一个磁盘失效,系统可以到镜像盘中获得所需要的信息。
镜像是最昂贵的解决方法。
特点是系统可靠性很高,但效率很低。
RAID2位交叉式海明编码阵列。
原理上比较优越,但冗余信息的开销太大,因此未被广泛应用。
RAID3位交叉奇偶校验盘阵列,是单盘容错并行传输的阵列。
即数据以位或字节交叉的方式存于各盘,冗余的奇偶校验信息存储在一台专用盘上。
RAID4专用奇偶校验独立存取盘阵列。
即数据以块(块大小可变)交叉的方式存于各盘,冗余的奇偶校验信息存在一台专用盘上。
RAID5块交叉分布式奇偶校验盘阵列,是旋转奇偶校验独立存取的阵列。
即数据以块交叉的方式存于各盘,但无专用的校验盘,而是把冗余的奇偶校验信息均匀地分布在所有磁盘上。
计算机系统结构课后答案uint6
![计算机系统结构课后答案uint6](https://img.taocdn.com/s3/m/9ac0c033a9114431b90d6c85ec3a87c240288aa7.png)
计算机系统结构课后答案uint6第六章课后题1.画出16台处理器仿ILLIAC Ⅳ的模式进行互连的互连结构图,列出PE0分别只经一步、二步和三步传送能将信息传送到的各处理器号。
答:6台处理器仿ILLIAC Ⅳ处理单元的互连结构如图所示:图中第个PU中包含PE、PEM和MLU。
PE0(PU0)经一步可将信息传送至PU1、PU4、PU12、PU15。
PE0(PU0)至少需经二步才能将信息传送至PU2、PU3、PU5、PU8、PU11、PU13、PU1 4。
PE0(PU0)至少需经三步步才能将信息传送至PU6、PU7、PU9、PU10。
2.编号为0、1、...、15的16个处理器,用单级互连网互连。
当互连函数分别为(1)Cube3(2)PM2+3(3)PM2-0(4)Shuffle(5)Shuffle(Shuffle)时,第13号处理器各连至哪一个处理器?解答:(1)5号处理器(2)5号处理器(3)12号处理器(4)11号处理器(5)7号处理器剖析:由题意知,有16个处理器,即N=16,n=log2(N)=log2(16)=4。
Cube3(13)=Cube3(1101)=0101=5PM2+3(13)=(13+2^3)mod16=5PM2-0(13)=(13-2^0)mod16=12Shuffle(13)=Shuffle(1101)=1011=11Shuffle(Shuffle)=Shuffle(11)=Shuffle(1011)=0111=73.编号分别为0、1、2、...、F的16个处理器之间要求按下列配对通信:(B、1),(8、2),(7、D),(6、C),(E、4),(A、0),(9、3),(5、F)。
试选择所用互连网络类型、控制方式,并画出该互连网络的拓补结构和各级交换开关状态图。
解答:采用4级立方体网络,级控制。
该互连网络的拓补结构和各级交换开关状态图如下图所示:剖析:从处理器号的配对传送关系可以转成处理器二进制编号的配对传送关系:(B,1) (1011,0001)(8,2) (1000,0010)(7,D) (0111,1101)(6,C) (0110,1100)(E,4) (1110,0100)(A,0) (1010,0000)(9,3) (1001,0011)(5,F) (0101,1111)不难得出其一般规律是:二进制编号为P3P2P1P0的处理器与( ̄P3)P2( ̄P1)P0的处理器配对交换数据。
计算机系统结构(高教版)张晨曦 习题答案 第六章
![计算机系统结构(高教版)张晨曦 习题答案 第六章](https://img.taocdn.com/s3/m/bedc807bbe23482fb4da4c20.png)
6.1 名词解释响应时间:从用户输入命令开始到得到结果所花费的时间可靠性:系统从某个初始参考点开始一直连续提供服务的能力可用性:系统正常工作的时间在连续两次正常服务间隔时间所占的比率可信性:服务的质量,记载多大程度上可以合理地认为服务是可靠的RAID:在磁盘阵列中设置冗余信息盘,从而形成的磁盘阵列分离式事务总线:在请求和应答之间的空闲时间内,总线可以提供其他的I/O使用,这样就不必在整个I/O过程中都独占总线,采用这种技术的总线叫分离事务总线通道:专门负责整个计算机系统的输入输出工作的专用处理机通道流量:又称通道吞吐率、通道数据传输率等,它是指一个通道在数据传送期间,单位时间能够传送的数据量虚拟DMA:允许DMA设备直接使用虚拟地址,并在DMA期间由硬件将虚拟地址转换为物理地址。
异步I/O:允许进程在发出I/O请求后继续执行,直到该进程真正访问这些数据而它们又尚未就绪时才被挂起。
6.3 RAID有哪些分级?各有何特点?RAID0亦称数据分块,即把数据分布在多个盘上,实际上是非冗余阵列,无冗余信息。
RAID1亦称镜像盘,使用双备份磁盘。
每当数据写入一个磁盘时,将该数据也写到另一个冗余盘,这样形成信息的两份复制品。
如果一个磁盘失效,系统可以到镜像盘中获得所需要的信息。
镜像是最昂贵的解决方法。
特点是系统可靠性很高,但效率很低。
RAID2位交叉式海明编码阵列。
原理上比较优越,但冗余信息的开销太大,因此未被广泛应用。
RAID3位交叉奇偶校验盘阵列,是单盘容错并行传输的阵列。
即数据以位或字节交叉的方式存于各盘,冗余的奇偶校验信息存储在一台专用盘上。
RAID4专用奇偶校验独立存取盘阵列。
即数据以块(块大小可变)交叉的方式存于各盘,冗余的奇偶校验信息存在一台专用盘上。
RAID5块交叉分布式奇偶校验盘阵列,是旋转奇偶校验独立存取的阵列。
即数据以块交叉的方式存于各盘,但无专用的校验盘,而是把冗余的奇偶校验信息均匀地分布在所有磁盘上。
大学计算机第六章练习题
![大学计算机第六章练习题](https://img.taocdn.com/s3/m/5eef9013a76e58fafab00321.png)
单项选择题:1.假设数据表A与B按某字段建立了一对多关系,B为多方,正确的说法是()。
A、A中一个记录可与B中多个记录匹配B、B中一个字段可与A中多个字段匹配C、A中一个字段可与B中多个字段匹配D、B中一个记录可与A中多个记录匹配参考答案:A2.Access中,建立查询时可以设置筛选条件,应在()栏中输入筛选条件。
A、总计B、排序C、条件D、字段参考答案:C3.目前人们所使用的数据库管理系统几乎都是()。
A、Access数据库B、网状数据库C、关系数据库D、层次数据库参考答案:C4.数据类型是()。
A、字段的另一种说法B、决定字段能包含哪类数据的设置C、一类数据库应用程序D、一类用来描述Access表向导允许从中选择的字段名称参考答案:B5.数据库技术产生于(),其主要目的是有效地管理和存取大量的数据资源。
A、20世纪50年代末60年代初B、20世纪70年代中C、20世纪60年代末70年代初D、20世纪70年代末80年代初参考答案:C6.二维表中的某个属性或属性组,若它的值唯一地标识了一个元组,则称该属性或属性组为()。
A、主键B、码C、候选码D、主码参考答案:C7.在Access 2003表中要存放图像、图表、声音等信息时,需要的数据类型是()。
A、文本B、OLE对象C、超(级)链接D、备注参考答案:B8.假设数据库中表A与表B建立了“一对多”关系,表B为“多”方,则下述说法正确的是()。
A、表A中的一个记录能与表B中的多个记录匹配B、表B中的一个记录能与表A中的多个记录匹配C、表A中的一个字段能与表B中的多个字段匹配D、表B中的一个字段能与表A中的多个字段匹配9.下面对数据表的叙述有错误的是:()。
A、数据表是Access数据库中的重要对象之一。
B、表的设计视图的主要工作是设计表的结构。
C、表的数据视图只用于显示数据。
D、可以将其他数据库的表导入到当前数据库中。
参考答案:C10.在数据表设计视图中,不能()。
计算机系统结构-第六章练习-答案培训资料
![计算机系统结构-第六章练习-答案培训资料](https://img.taocdn.com/s3/m/97503cd7336c1eb91a375dbc.png)
计算机系统结构-第六章练习-答案第六章向量处理机1.在大型数组的处理中常常包含向量计算,按照数组中各计算相继的次序,我们可以把向量处理方法分为哪三种类型?横向处理方式,纵向处理方式,纵横处理方式横向处理方式:向量计算是按行的方式从左至右横向的进行纵向处理方式:向量计算是按列的方式自上而下纵向的进行纵横处理方式:横向处理和纵向处理相结合的方式2.解释下列与向量处理有关的术语。
(1)向量和标量的平衡点:为了使向量硬件设备和标量设备的利用率相等,一个程序中向量代码所占的百分比(2)用户代码的向量化比值:用户代码可向量化的部分占全部的比重(3)向量化编译器或量化器:将标量运算进行向量化或者将向量运算进行适当的修改使之能够进入向量处理进行向量处理的编译器3.简要叙述提高向量处理机性能的常用技术(1)链接技术(2)向量循环或分段开采技术(3)向量递归技术(4)稀疏矩阵的处理技术4.下述的几个需要解决的问题中,那个是向量处理机所最需要关心的?A.计算机指令的优化技术B.设计满足运算器带宽要求的存储器C.如何提高存储器的利用率,增加存储器系统的容量D.纵横处理方式的划分问题5.假设系统在向量模式下面能够达到9Mflops,在标量模式下能够达到1Mflops速度,而代码的90%是向量运算,10%是标量运算,这样花在两种模式上的计算时间相等。
那么向量平衡点是:A.0.1B.0.9 一个程序中向量代码所占的百分比C.0.5D.以上都不是6.查看下面三条指令:V3←AV2←V0+V1V4←V2*V3假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。
三条指令全部采用串行的方法,那么执行的时间是:A.3N+20B.3N+21C.3N+22D.3N+237.下面一组向量操作能分成几个编队?假设每种流水功能部件只有一个。
LV V1,Rx ;取向量MULTSV V2,F0,V1;向量和标量相乘LV V3,Ry ;取向量YADDV V4,V2,V3;加法SV Ry,V4;存结果可以划分成四个编队:(1)LV (2)MULTSV LV (3)ADDV (4)SV8.在一台向量处理机上实现A=B×s操作,其中A和 B是长度为200的向量,s是一个标量。
计算机系统结构复习试题及答案(非计算)
![计算机系统结构复习试题及答案(非计算)](https://img.taocdn.com/s3/m/46de67275a8102d276a22fc9.png)
一.名词解释计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
同构型多处理机系统:由多个同类型或至少担负同等功能的处理机组成,它们同时处理同一作业中能并行执行的多个任务。
堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。
累加器型机器:CPU 中存储操作数的单元是累加器的机器。
通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。
数据相关:考虑两条指令i 和j,i 在j 的前面,如果下述条件之一成立,则称指令j 与指令 i 数据相关:(1)指令j 使用指令i 产生的结果;(2)指令j 与指令k 数据相关,而指令k 又与指令i 数据相关。
定向:用来解决写后读冲突的。
在发生写后读相关的情况下,在计算结果尚未出来之前,后面等待使用该结果的指令并不见得是马上就要用该结果。
如果能够将该计算结果从其产生的地方直接送到其它指令需要它的地方,那么就可以避免停顿。
向量处理机:指令级并行:简称ILP。
是指指令之间存在的一种并行性,利用它,计算机可以并行执行两条或两条以上的指令。
指令的动态调度:是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。
是由硬件在程序实际运行时实施的。
指令的静态调度:是指依靠编译器对代码进行静态调度,以减少相关和冲突。
它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。
失效率:CPU 访存时,在一级存储器中找不到所需信息的概率。
失效开销:CPU 向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。
强制性失效:当第一次访问一个块时,该块不在Cache 中,需要从下一级存储器中调入Cache,这就是强制性失效。
容量失效:如果程序在执行时,所需要的块不能全部调入Cache 中,则当某些块被替换后又重新被访问,就会产生失效,这种失效就称作容量失效。
计算机组成原理第六章部分课后题答案(唐朔飞版)
![计算机组成原理第六章部分课后题答案(唐朔飞版)](https://img.taocdn.com/s3/m/124167e19b89680203d825db.png)
6.4 设机器数字长为8位(含1位符号位在内),写出对应下列各真值的原码、补码和反码。
-13/64,29/128,100,-87解:十进制数二进制数原码反码补码-13/64 -0.00 1101 1.001 1010 1.110 0101 1.110 011029/128 0.001 1101 0.001 1101 0.001 1101 0.001 1101100 110 0100 0,110 0100 0,110 0100 0,110 0100-87 -101 0111 1,101 0111 1,010 1000 1,010 10016.5 已知[x]补,求[x]原和x.[x]补 = 1.1100; [x]补 = 1.1001; [x]补 = 0.1110; [x]补= 1.0000;[x]补 = 1,0101; [x]补 = 1,1100; [x]补 = 0,0111; [x]补= 1,0000;解:[x]补 [x]原 x1.1100 1.0100 -0.01001.1001 1.0111 -0.01110.1110 0.1110 0.11101.0000 1.0000 01,0101 1,1011 -10111,1100 1,0100 -01000,0111 0,0111 1111,0000 1,0000 06.9 当十六进制数9B和FF分别表示为原码、补码、反码、移码和无符号数时,所对应的十进制数各为多少(设机器数采用一位符号位)解:原码补码反码移码无符号数9B 二进制 -11011 -1100101 -1100100 +11011 1001 十进制 -27 -101 -100 +27 155 FF 二进制 -1111111 -0000001 -0000000 +1111111 1111 1111十进制 -127 -1 -0 +127 2556.11 已知机器数字长为4位(其中1位为符号位),写出整数定点机和小数定点机中原码、补码和反码的全部形式,并注明其对应的十进制数真值。
计算机体系结构1-6章习题答案
![计算机体系结构1-6章习题答案](https://img.taocdn.com/s3/m/4e71917f02768e9951e7388c.png)
1 2 3 4 5 6
8 16 24 32 40 48
1*82
2*82 3*82 4*82 5*82 6*82 7*82
4/8 5/8 6/8
7/8
7
56
2)规格化浮点数表: rm=2时,规格化浮点数共有4*8=32个 rm=8时,规格化浮点数共有7*8=56个,在[0.5,112]中, 有数19个(上表中红的数字表示)。
§4通道(CH)
一、CH的基本工作原理 CH执行CH程序的过程 CH的任务 二、CH流量计算和时空图绘制 CH的类型 CH流量计算 字节多路CH响应处理时空图的绘制 1)计算每个子CH提供一个字节时间(1/f) 2)画出一个完整申请周期时空图 3)计算字节多路CH对每个字节响应的最长用时
第一章参考答案: 1.应用语言级 高级语言级 汇编语言级 操作系统级 机器语言级 微程序语言级。 2. 从上而下 从下到上 专用机 通用机 3. 软、硬件交界面 计算机系统的性能/价格比 4 . 1 T FLOPS 的计 算能力 1 TBy te 的 主存容量 1 TByte/s 的I/O带宽 5. 虚拟机 实际机器 6. 统一高级语言 模拟 仿真 系列机 7. 控制流 数据流 SISD SIMD MISD MIMD 8. 汇编语言程序员 9. 任务单一化 操作重叠化 吞吐匹配化 程序多道 化
嵌套
中断处理程序 一 二 三 响② 嵌套 四 五
t
返回主程序
例4 解 (1)处理顺序为 2-3-1-5-4 (2)中断响应处理时空图 中断请求 主程序 ①③ ②③④⑤
嵌套
中断处理程序 一 二 三 四 五
响① 嵌套
t
返回主程序
1 分别利用两级描述符和三级描述符描述下列阵列数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章向量处理机1.在大型数组的处理中常常包含向量计算,按照数组中各计算相继的次序,我们可以把向量处理方法分为哪三种类型?横向处理方式,纵向处理方式,纵横处理方式横向处理方式:向量计算是按行的方式从左至右横向的进行纵向处理方式:向量计算是按列的方式自上而下纵向的进行纵横处理方式:横向处理和纵向处理相结合的方式2.解释下列与向量处理有关的术语。
(1)向量和标量的平衡点:为了使向量硬件设备和标量设备的利用率相等,一个程序中向量代码所占的百分比(2)用户代码的向量化比值:用户代码可向量化的部分占全部的比重(3)向量化编译器或量化器:将标量运算进行向量化或者将向量运算进行适当的修改使之能够进入向量处理进行向量处理的编译器3.简要叙述提高向量处理机性能的常用技术(1)链接技术(2)向量循环或分段开采技术(3)向量递归技术(4)稀疏矩阵的处理技术4.下述的几个需要解决的问题中,那个是向量处理机所最需要关心的?A.计算机指令的优化技术B.设计满足运算器带宽要求的存储器C.如何提高存储器的利用率,增加存储器系统的容量D.纵横处理方式的划分问题5.假设系统在向量模式下面能够达到9Mflops,在标量模式下能够达到1Mflops速度,而代码的90%是向量运算,10%是标量运算,这样花在两种模式上的计算时间相等。
那么向量平衡点是:A.0.1 一个程序中向量代码所占的百分比D.以上都不是6.查看下面三条指令:V3←AV2←V0+V1V4←V2*V3假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。
三条指令全部采用串行的方法,那么执行的时间是:+20 +21+22 +237.下面一组向量操作能分成几个编队?假设每种流水功能部件只有一个。
LV V1,Rx ;取向量MULTSV V2,F0,V1;向量和标量相乘LV V3,Ry ;取向量YADDV V4,V2,V3;加法SV Ry,V4;存结果可以划分成四个编队:(1)LV (2)MULTSV LV (3)ADDV (4)SV8.在一台向量处理机上实现A=B×s操作,其中A和 B是长度为200的向量,s是一个标量。
向量寄存器长度为64。
功能部件的启动开销为:取数和存数部件为12个时钟周期,乘法部件为7个时钟周期,加法部件为6个时钟周期。
总的执行时间是?9.简述三种向量处理方式,他们对向量处理机结构要求有什么不同。
解:水平处理方式:向量长度为N,则水平处理方式相当于执行N次循环。
不适合对向量进行流水处理。
(或者叫做横向处理方式)垂直处理方式:将整个向量按相同的运算处理完毕之后,再去执行其他的运算,适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入输出端直接与存储器相联,构成M-M型的运算流水线。
分组处理方式:把长度为N的向量分为若干组,每组按照纵向处理10.解释下列与向量处理有关的术语。
(1)向量规约指令(2)收集和散播指令解:(1)将向量化转化为标量的指令(2)收集指令可以把非连续存储单元的内容传送到向量寄存器组中若干个连续的寄存器;散播指令与此相反。
他们用于稀疏矩阵的存储与运算,可以节省空间。
11. 查看下面三条指令:V3←AV2←V0+V1V4←V2*V3假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。
三条指令采用链接的方法,那么执行的时间是:+22 +15+16+1712.在一台向量处理机上实现A=B×s操作,其中A和 B是长度为200的向量,s是一个标量。
向量寄存器长度为64。
功能部件的启动开销为:取数和存数部件为12个时钟周期,乘法部件为7个时钟周期,加法部件为6个时钟周期。
那么一个结果元素的平均执行时间(包括启动开销)为:A.3.7 某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。
采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停的情况下,接着计算(D+E)*F。
求此链接流水线的通过时间是多少拍?(设寄存器出入各需1拍)14.名词解释向量流水处理机解:处理机具有向量数据表示,并通过向量指令对向量的各元素进行处理。
15.某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。
采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停的情况下,接着计算(D+E)*F 。
每拍时间是50ns,完成这些计算并且把结果存进相应的寄存器,此处理部件实际吞吐率是多少MFLOPS?(设寄存器出入各需1拍). 一台单处理机可以以标量方式运行,也可以以向量方式运行。
在向量方式情况下,计算可比标量方式快9倍。
设某基准程序在此计算机上运行的时间是T 。
另外,已知T 的25%用于向量方式,其余机器时间则以标量方式运行。
请计算在上述条件下与完全不用向量方式条件下相比的加速比,并计算上述程序中向量化代码所占的百分比。
加速比=*9+*1)/T=3由于T 中向量化代码所占的时间为,则串行代码用时==,所以完全不用向量方式执行该段代码用时= +9*=3T, 因此加速比=3T/T=3.根据Amdahl 定律.17.一台向量计算机一次只能以下述两种方式中的一种运行:一种是向量方式,执行速度v R 为10Mflops ;另一种是标量方式,执行速度s R 为1Mflops 。
设α是该计算机的典型程序代码中可以向量化部分的百分比。
如果要使平均执行的速度达到,那么向量化百分比应该多大?1/[a/Rv+(1-a)/Rs]=所以a=18.在CARY1机器上,设向量长度均为32,s 是标量寄存器,加法需要6拍,乘法需要7拍,从存储器读数需要6拍,打入寄存器及启动功能部件(包括寄存器)各需要1拍。
则下面的指令组完成所需要的拍数是:V3←存储器 打入1,启动1,读数6V2←V0+V1s0←s2+s3V3←V1×V48+31+9+3119.在CRAY-1机器上,链接方式执行下面4条向量指令(括号中给出相应功能部件的时间),如果向量寄存器和功能部件之间的数据传输需要1拍,试求此链接流水线的流过时间为多少拍?V0←存储器 (存储器取数7拍)9V1←V0+V1 (向量加3拍)5V3←V2<A3 (按照A3左移4拍)6V5←V3∧V4 (向量逻辑乘2拍)420. 一台单处理机可以以标量方式运行,也可以以向量方式运行。
在向量方式情况下,计算可比标量方式快18倍。
设某基准程序在此计算机上运行的时间是T 。
另外,已知T 的25%用于向量方式,其余机器时间则以标量方式运行。
那么在上述条件下与完全不用向量方式的条件下相比的加速比是:以上均不正确1/[18+1]21.一台向量计算机一次只能以下述两种方式中的一种运行:一种是向量方式,执行速度v R 为10Mflops ;另一种是标量方式,执行速度s R 为1Mflops 。
设α是该计算机的典型程序代码中可以向量化部分的百分比。
求平均执行速度的计算公式。
1/[a/Rv+(1-a)/Rs]=10/(10-9a)22.向量处理机有那两种最基本的结构?存储器--存储器结构寄存器--寄存器结构23.研制高性能的向量处理机主要需要解决哪几个问题?(1) 较好的维持向量/标量性能平衡(2) 可扩展性随处理机数目的增加而提高(3) 增加存储器系统的容量和性能(4) 提供高性能的I/O 和易访问的网络24.为了提高向量处理机的性能,会采用一些特殊的技术,下面那一项不是提高向量处理机性能而采用的技术?A.链接技术B.向量递归技术缓存技术D.稀疏矩阵的处理技术25.在CARY1机器上,设向量长度均为32,s 是标量寄存器,加法需要6拍,乘法需要7拍,从存储器读数需要6拍,打入寄存器及启动功能部件(包括寄存器)各需要1拍。
则下面的指令组完成所需要的拍数是:V0←存储器V2←V0+V1V3←V2×V1V5←V3×V426.若要进行向量运算D=A ×(B+C),假设向量长度N<64,且B 和 C 已经存至V0和V1,则下面三条指令就可以完成上述的运算。
V3←A (6拍)V2←V0+V1 (6拍)V4←V2×V3 (7拍)分别求三条指令全部用串行的方法和链接技术执行的时间(读写各需1拍)。
27.在某台向量处理机上执行DAXPY代码,即完成Y=a×X+Y,其中X和Y是向量,最初存放在内存,a是一个标量,他们的向量指令如下:LV V1,Rx ;取向量MULTSV V2,F0,V1 ;标量和向量相乘LV V2,Ry ;取向量YADDV V4,V2,V3 ;相加SV Ry,V4 ;存结果求总的执行时间。
假设其中存取数需要12拍,乘法需要7拍,加法需要6拍,向量长度是n。
28.假设某向量处理机上执行DAXPY代码所需要的时钟周期是4n+64,其中n是向量长度,时钟频率是200MHz,那么最大性能是多少?A. 90MFLOPSB. 80MFLOPS MFLOPS D. 100MFLOPS29.假设某向量处理机上执行DAXPY代码所需要的时钟周期是4n+64,其中n是向量长度,时钟频率是200MHz,那么半性能向量长度是:A.12.830.日本FOCOM向量处理机VP-200具有流水线链接和并行化功能。
它有2条存储流水线到向量寄存器,两者可以并行工作。
此外尚有加法和乘法流水线。
各流水线间均可以链接操作。
若现在要在Vp-200向量机上实现以下的向量操作:A(I)=B(I) ×C(I)+D(I) ×E(I)+F(I) ×G(I)I=1,2,…,N。
假定所有流水线的延迟时间都相等,取/存操作转换时将有t的流水线重构延迟时间。
求完成操作所需要的时间。
所以时间为:4N+t31. 在CARY1机器上,设向量长度均为32,s是标量寄存器,加法需要6拍,乘法需要7拍,从存储器读数需要6拍,打入寄存器及启动功能部件(包括寄存器)各需要1拍。
则下面的指令组完成所需要的拍数是:V3←存储器V2←V0+V1V4←V2×V3存储器←V4n表示向量流水方式的工作速度优于标量串行方式工作时间时所需要的向量长度32.v的临界值。
请问该参数主要衡量那些标准?衡量建立时间,也衡量标量向量的速度比对性能的影响。