系统结构复习资料

合集下载

计算机系统结构(复习题)

计算机系统结构(复习题)

《计算机系统结构》复习题(一)一、单项选择题1.同号相减或异号相加,阶差为1,只需要设置位警戒位. 【】A.0 B. 1 C。

2 D。

32.计算机系统多级层次结构中,操作系统机器级的直接上层是?【】A.传统机器级B.高级语言机器级C.应用语言机器级D.汇编语言机器级3.以下不.是设计RISC的原则的是?【】A.指令多用硬联控制实现B.指令条数多,通常超过100条C.指令寻址方式一般不超过两种D.所有指令都在一个机器周期内完成4。

下列操作码的编码方法中,操作码平均长度最短的是: 【】A、固定长编码B、Huffman编码C、不等长扩展编码D、等长扩展编码5.在采用延迟转移技术时,在以下几种调度方法中,效果最好的是哪一种方法? 【】A。

将转移指令前的那条指令调度到延迟槽中B.将转移目标处的那条指令调度到延迟槽中C。

将转移不发生时该执行的那条指令调度到延迟槽中D。

在延迟槽中填入NOP空操作指令6.在以下输入输出控制器的管理方式中,外设的工作速度对计算机性能影响最小的是?【】A。

程序控制轮询方式B。

程序控制中断方式C. 直接存储器访问方式D. I/O处理机方式7. 计算机系统多级层次结构中,操作系统机器级的直接上层是?【】A.传统机器级B.高级语言机器级C.应用语言机器级D.汇编语言机器级8.多处理机的互连方式采用总线形式的优点是?【】A.硬件成本低且简单B。

适用于处理机机数较多的场合C。

有很高的潜在通信速率D。

不便于改变系统硬件设置9.浮点数尾数基值r m=8,尾数数值部分长6位,可表示规格化正尾数的个数是?【】A.56个B.63个C.64个D.84个10.在IBM370系统中,支持操作系统实现多进程共用公用区管理最有效的指令是?【】A.“执行”指令B.“程序调用”指令C.“比较与交换”指令D.“测试与置定"指令11.解释指令的流水线方式中,同一时间内,流水线的各段只能按同一种功能的连接方式工作称为。

计算机系统结构复习试题及答案(非计算)

计算机系统结构复习试题及答案(非计算)

计算机系统结构复习试题及答案(⾮计算)⼀.名词解释计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种⾓度看⼜好像不存在的概念称为透明性。

系列机:由同⼀⼚家⽣产的具有相同系统结构、但具有不同组成和实现的⼀系列不同型号的计算机。

同构型多处理机系统:由多个同类型或⾄少担负同等功能的处理机组成,它们同时处理同⼀作业中能并⾏执⾏的多个任务。

堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。

累加器型机器:CPU 中存储操作数的单元是累加器的机器。

通⽤寄存器型机器:CPU 中存储操作数的单元是通⽤寄存器的机器。

数据相关:考虑两条指令i 和j,i 在j 的前⾯,如果下述条件之⼀成⽴,则称指令j 与指令 i 数据相关:(1)指令j 使⽤指令i 产⽣的结果;(2)指令j 与指令k 数据相关,⽽指令k ⼜与指令i 数据相关。

定向:⽤来解决写后读冲突的。

在发⽣写后读相关的情况下,在计算结果尚未出来之前,后⾯等待使⽤该结果的指令并不见得是马上就要⽤该结果。

如果能够将该计算结果从其产⽣的地⽅直接送到其它指令需要它的地⽅,那么就可以避免停顿。

向量处理机:指令级并⾏:简称ILP。

是指指令之间存在的⼀种并⾏性,利⽤它,计算机可以并⾏执⾏两条或两条以上的指令。

指令的动态调度:是指在保持数据流和异常⾏为的情况下,通过硬件对指令执⾏顺序进⾏重新安排,以提⾼流⽔线的利⽤率且减少停顿现象。

是由硬件在程序实际运⾏时实施的。

指令的静态调度:是指依靠编译器对代码进⾏静态调度,以减少相关和冲突。

它不是在程序执⾏的过程中、⽽是在编译期间进⾏代码调度和优化的。

失效率:CPU 访存时,在⼀级存储器中找不到所需信息的概率。

失效开销:CPU 向⼆级存储器发出访问请求到把这个数据调⼊⼀级存储器所需的时间。

强制性失效:当第⼀次访问⼀个块时,该块不在Cache 中,需要从下⼀级存储器中调⼊Cache,这就是强制性失效。

计算机系统结构复习

计算机系统结构复习

n
2
pi (pi 表示第 i 种操作码在程序中出现的概率)
4
Copyright 2011
计算机系统结构复习提纲
© 计 081

固定长编码相对于 Huffman 编码的信息冗余量: R 1 必须知道每种操作码在程序中出现的概率
pi log i
1
n
2
pi
log n
2
扩展编码法
Huffman 操作码的主要缺点: 操作码长度很不规整,硬件译码困难 与地址码共同组成固定长的指令比较困难 扩展编码法:由固定长操作码与 Huffman 编码法相结合形成
存在的问题
以硬件为主固件为辅 固件的主要缺点是: 执行速度低。目前,ROM 的速度低于 SRAM 一条机器指令通常要多条微指令解释执行 固件的主要优点是: 便于实现复杂指令,便于修改指令系统 以硬联逻辑为主来实现指令系统 对于少数复杂的指令,目前的许多处理机也用微程序技术实现。 RISC 对编译器造成的困难主要有: (1)必须精心安排每一个寄存器的用法,以便充分发挥每一个通用寄存器的效率,尽量减少访问主存储器的次数。 (2)做数据和控制相关性分析,要调整指令的执行序列,并与硬件相配合实现指令延迟技术和指令取消技术等。 (3)要设计复杂的子程序库,RISC 的子程序库通常要比 CISC 的子程序库大得多。
2. 数据表示的含义及与数据结构的关系
数据表示的定义: 数据表示是指计算机硬件能够直接识别,可以被指令系统直接调用的那些数据类型。 例如:定点、逻辑、浮点、十进制、字符、字符串、堆栈和向量等 数据类型:文件、图、表、树、阵列、队列、链表、栈、向量、串、实数、整数、布尔数、字符等 确定哪些数据类型用数据表示实现,是软件与硬件的取舍问题

系统结构复习

系统结构复习

中国地质大学(武汉)计算机学院吴湘宁计算机体系结构习题及答案第一章基础知识1.名词解释翻译解释模拟仿真透明性程序访问局部性[答案]略2. 一个经解释实现的计算机可以按功能划分为四级. 每一级为了执行一条指令需要下一级的N条指令. 若执行第一级的一条指令需要的时间为K ns, 那么执行第二、三、四级的一条指令各需要多少时间?3. 计算机系统按功能划分层次结构的好处主要体现在哪些方面?[答案] (1) 有利于理解软件, 硬件和固件在系统中的地位和作用;(2) 有利于理解各种语言的实质和实现途径;(3) 有利于推动计算机系统结构的发展;(4) 有利于理解计算机系统结构的定义.4. 什么是透明性? 对计算机系统结构, 下列哪些是透明的? 哪些是不透明的?1) 存储器的模m交叉存取; 2) 浮点数据表示; 3) I/O系统是采用通道方式还是I/O处理机方式; 4) 阵列运算部件; 5) 数据总线宽度; 6) 通道是采用结合型的还是独立型的; 7) 访问方式保护; 8) 程序性中断; 9) 串行、重叠还是流水控制方式; 10) 堆栈指令; 11) 存储器的最小编址单位; 12) Cache存储器.[答案] 一种本来是存在的事务或属性, 但从某种角度看却好像不存在, 称为透明性.对计算机系统结构来说透明的是: 1), 4), 5), 6), 9), 12)对计算机系统结构来说不透明的是:2), 3), 7), 8), 10), 11)5. 什么是计算机体系结构? 什么是计算机组成? 什么是计算机实现? 并说明三者的关系和相互影响?[答案] 计算机系统结构是计算机系统的软, 硬件分界面, 是机器语言程序员或是编译程序员所需了解的计算机属性;计算机组成是计算机系统结构的逻辑事项;计算机实现是计算机组成的物理实现.三者的关系和互相影响为:(1) 具有相同系统结构的计算机可以采用不同的组成;(2)(2) 一种计算机组成可以采用多种不同的计算机实现;(3) 计算机组成、计算机实现对计算机系统结构有着很大的影响;(4) 计算机系统结构的设计不应限制计算机组成和实现技术,应能用于高档机,也可用于低挡机;(5) 在不同时期, 计算机系统结构,、组成和实现所包含的内容会有所变化,三者之间的界线常常很模糊.6. 从机器(汇编)语言程序员角度看, 以下哪些是透明的?1) 指令地址存储器; 2) 指令缓冲器; 3) 时标发生器; 4) 条件码寄存器; 5) 乘法器; 6) 主存地址寄存器; 7) 磁盘外设; 8) 先行进位链; 10) 通用寄存器; 11) 中断字寄存器.[答案] 对机器(汇编)语言程序员来说透明的有: 2), 3), 5), 6), 8), 9)对机器(汇编)语言程序员来说不透明的有: 1), 4), 7), 10), 11)7. 假设在一台40 MHz处理机上运行200 000条指令的目标代码, 程序主要由四种类型的指令所组成. 根据程序跟踪实验结果, 各类指令的混合比和每类指令的CPI值如表1.9所示.(1) 试计算在单处理机上执行上述该程序时的平均CPI;(2) 根据(1)所得到的CPI, 计算相应的MIPS速率及程序的执行时间.[答案] (1) 2.24 CPI (2) 17.86 MPIS; 0.0112 s8. 某工作站采用时钟频率为15 MHz、处理速率为10 MIPS的处理机来执行一个程序,假定每次存储器存取为1周期延迟, 试问:(1) 此计算机的有效CPI是多少?(2) 假定将处理机的时钟频率提高到30 MHz, 但存储器子系统速率不变, 这样, 每次存储器存取需要两个时钟周期. 如果30%的指令每条只需要一次存储存取, 而另外5%的指令每条需要两次存储存取, 还假定已知混合程序的指令数不变, 并与原工作站兼容, 试求改进后的处理机性能.[答案] (1) 1.5 CPI; (2) 15.8 MPIS9.什么是并行性?它分为哪两种类型?开发计算机系统并行性的主要技术途径有哪三个?沿这些途径分别发展出什么类型的计算机?[答案]略10.实现软件移植的途径有哪些?[答案]略11.什么是Flynn分类法,按照Flynn分类法可将计算机系统分为哪几类?[答案]略第二章指令系统1. 名词解释数据类型、数据表示、规格化浮点数、Huffman编码、扩展编码、RISC[答案]略2. 某模型机有8条指令I1~I8, 它们的使用频度分别为0.3, 0.3, 0.2, 0.1, 0.05, 0.02, 0.02, 0.01.(1) 试分别用Huffman编码和平均码长最短的等长扩展码(限定为两种码长)对其操作码进行编码.(2) 分别计算Huffman编码和等长扩展码编码的平均长度.[答案] (1) 操作码的Huffman编码和2-4等长扩展码编码如下表1所示.(2) Huffman编码的平均长度为2.38位; 等长扩展码编码的平均码长为2.8位.3. 某模型机有10条指令I1~I10, 它们的使用频度分别为0.3, 0.24, 0.16, 0.12, 0.07, 0.04, 0.03,0.02, 0.01, 0.01.(1) 计算机采用等长操作码表示时的信息冗余量.(2) 要求操作码平均码长最短, 试设计操作码的编码, 并计算所设计操作码的平均长度. (3) 设计2-5扩展操作码编码,并计算平均码长.(4) 设计2-4(2/8)等长扩展码编码,并计算平均码长. [答案] (1) 采用等长操作码表示时的信息冗余量为33.5%. (2) 操作码的Huffman编码如表2所示, 此种编码的平均长度为2.7位.(3) 操作码的2-5扩展码编码如表2所示, 此种编码的平均长度为2.9位.(4) 操作码的2-4(2/4)等长扩展码编码如表2所示, 此种编码的平均长度为2.92位.4. 何谓指令格式的优化? 操作码和地址码的优化一般采用哪些方法?[答案] 指令格式的优化是指通过采用多种不同的寻址方式, 地址制, 地址形式和地址码长度以及多种指令字长, 并将它们与可变长操作码的优化表示相结合, 就可以构成冗余度尽可能少的指令字. 操作码的优化采用扩展操作码编码法. 地址码优化有以下四种方法:(1) 在指令中采用不同的寻址方式;(2)(2) 在指令中采用多地址制;(3) 同一种地址制还可以采用多种地址形式和长度, 也可以考虑利用空白处来存放直接操作数或常数等;(4) 在以上措施的基础上, 还可以进一步考虑采用多种指令字长度的指令.5. 若某机设计有如下指令格式的指令:三地址指令12种, 一地址指令254种, 设计指令的长度为16位, 每个地址码字段的位数均为4位. 若操作码的编码采用扩展操作码, 问二地址指令最多可以设计多少种? [答案] 二地址指令最多可以设计48种.6. 一台模型机共有九条指令I1~I9, 各指令的使用频度分别为0.3,0.2,0.2,0.1,0.08,0.6,0.03, 0.02, 0.01. 该模型机有8位和16位两种指令字长. 8位字长指令为寄存器----寄存器(R--R)二地址类型, 16位字长指令为寄存器----存储器(R--M)二地址变址寻址类型.(1) 试设计有两种码长的扩展操作码, 使其平均码长最短, 并计算此种编码的平均码长. (2) 在(1)的基础上, 该机允许使用多少个可编址的通用寄存器?(3) 若采用通用寄存器作为变址寄存器, 试设计该机的两种指令格式, 并标出各字段的位数.(4) 计算变址寻址的偏移地址范围.[答案] (1) 操作码的2-5扩展码编码如表3所示, 此种编码的平均长度位2.9位.2) 在(1)的基础上, 该机允许使用8个可编址的通用寄存器.(3) 该机的两种指令格式及各字段的位数如下:R-R型: 操作码OP (2位) | 源寄存器RS (3位) | 目的寄存器Rd (3位)R-M型: 操作码OP (5位) | 源寄存器RS (3位) | 变址寄存器RX (3位) | 偏移地址 (5位)(4) 变址寻址的偏移地址范围为-16~+15.7. 简述CISC的特点.[答案] CISC的特点如下:(1) 庞大的指令系统;(2) 采用了可变长度的指令格式;(3) 指令使用的寻址方式繁多;(4) CISC指令系统中包括一些用于特殊用途的指令, 各种指令的使用频度相当悬殊.8. 从指令格式, 寻址方式以及平均CPI三个方面, 比较经典CISC和纯RISC体系结构.[答案] 略9.简述RISC设计的一般原则。

02325计算机系统结构复习资料

02325计算机系统结构复习资料

第一章计算机系统结构的基本概念从处理数据的角度看,并行级别有位串字串,位并字串,位片串字并,全并行。

位串字串和位并字串基本上构成了SIMD。

位片串字并的例子有:相联处理机STARAN,MPP。

全并行的例子有:阵列处理机ILLIACIV。

从加工信息的角度看,并行级别有存储器操作并行,处理器操作步骤并行,处理器操作并行,指令、任务、作业并行。

存储器操作并行是指可以在一个存储周期内并行读出多个CPU字的,采用单体多字、多体单字或多体多字的交叉访问主存系统,进而采用按内容访问方式,位片串字并或全并行方式,在一个主存周期内实现对存储器中大量字的高速并行操作。

例子有并行存储器系统,以相联存储器为核心构成的相联处理机。

处理器操作步骤并行是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。

例子有流水线处理机。

处理器操作并行是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。

擅长对向量、数组进行处理。

例子有阵列处理机。

指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。

例子有多处理机,计算机网络,分布处理系统。

并行性的开发途径有时间重叠(Time Interl eaving ),资源重复(Resou rceReplication),资源共享(ResourceSharing)。

时间重叠是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。

例子有流水线处理机。

资源重复是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。

例子有阵列处理机,相联处理机。

资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率,从而提高系统性能。

例子有多处理机,计算机网络,分布处理系统。

SISD:一个指令部件控制一个操作部件,实现一条指令对一个数据的操作。

最新系统结构总复习题(附答案)

最新系统结构总复习题(附答案)

《计算机系统结构》期末考试复习题一、选择题:1、我们称由(B )实现的机器为虚拟机器。

A、硬件B、软件C、微程序D、固件2、计算机系统结构设计者所关心的是(C )所看到的的计算机结构。

A、硬件设计人员B、逻辑设计人员C、机器语言或汇编语言程序员D、高级语言程序员3、计算机组成是计算机系统结构的(B )。

A、硬件实现B、逻辑实现C、软件实现D、以上三种4、在计算机系统设计时,为了提高系统性能,应当注意(A )。

A、加快经常性使用指令的执行速度B、要特别精心设计少量功能强大的指令B、要减少在数量上占很小比例的指令的条数D、要加快少量指令的速度5、SIMD计算机可以处理(D )。

A、多指令流、单数据流B、单指令流单数据流C、多指令流多数据流D、单指令流多数据流6、在提高CPU性能的问题上,从系统结构角度,可以(C )。

A、提高时钟频率B、减少程序指令条数C、减少每条指令的时钟周期数D、减少程序指令条数和减少每条指令的时钟周期数7、冯.诺依曼计算机是(B )。

A、以存储器为中心B、以CPU为中心C、以处理输入/输出危重点D、以存储器与计算器为中心8、解决软件移植最好的办法就是(C )。

A、采用模拟方法B、采用仿真的方法C、采用统一高级语言D、采用统一标准设计计算机结构9、对计算机系统结构,下列透明的是(A )。

A、数据总线宽度B、浮点数表示C、CPU寄存器个数D、存储器的编址方法10、以下对系统程序员不透明的是(B )。

A、系列机各档不同的数据通路宽度B、虚拟存储器C、指令缓冲寄存器D、存储器读写缓冲寄存器11、在浮点数表示中,尾数的位数多少主要影响( B )。

A、表数范围B、表数精度C、表数效率D、运算实现容易程度12、当浮点数的尾数基值为(A )时,其表数效率最高(假如不考虑隐藏位)。

A、16B、8C、4D、213、当浮点数的尾数基值为( D )时,其表数精度最高,表数范围最大。

A、2B、8C、16D、2或414、当浮点数的尾数用原码表示,基值为2,阶码用移码表示,基值为2时,若尾数部分占23位(不含符号位),阶码占8位(含符号位),则表示的最大负数和最大正数分别为( C )。

系统结构期末复习

系统结构期末复习

第一章1.计算机系统结构的定义:计算机系统结构主要研究软硬件功能分配和对软硬件界面的确定3.透明性概念:本来存在的事物或属性,从某种角度看似乎不存在4.计算机系统的多层次模型:第6级专用应用语言机器特定应用用户(使用特定应用语言)(经应用程序翻译成高级语言)第5级通用高级语言机器高级语言程序员(使用通用高级语言)(经编译程序翻译成汇编语言)第4级汇编语言机器汇编语言程序员(使用汇编语言)(经汇编程序翻译成机器语言、操作系统原语)第3级操作系统语言机器操作系统用户(使用操作系统原语)(经原语解释子程序翻译成机器语言)第2级传统机器语言机器传统机器程序员(使用二进制机器语言)(由微程序解释成微指令序列)第1级微指令语言机器微指令程序员(使用微指令语言)(由硬件译码器解释成控制信号序列)第0级硬联逻辑硬件设计员第0级由硬件实现,第1级由微程序实现,第2级至第6级由软件实现,由软件实现的机器称为:虚拟机从学科领域来划分:第0和第1级属于计算机组织与结构,第3至第5级是系统软件,第6级是应用软件。

它们之间仍有交叉。

第0级要求一定的数字逻辑基础;第2级涉及汇编语言程序设计的内容;第3级与计算机系统结构密切相关。

在特殊的计算机系统中,有些级别可能不存在。

5.计算机运算速度评价的主要方法:1)时钟频率(2)指令执行速度MIPS及KIPS、GIPS、TIPS 书P15-16(3)等效指令速度。

(CPI (Cycles Per Instruction) 为每条指令所需的平均时钟周期数,IPC为每个时钟周期平均执行的指令条数。

)例子:如果浮点开平方操作FPSQR的比例为2%,它的CPI为100 ,其他浮点操作的比例为23% ,它的CPI=4.0,其余指令的CPI=1.33 ,计算该处理机的等效CPI。

如果FPSQR操作的CPI也为4.0,重新计算等效CPI。

解:等效CPI1=100 ×2 %+4 ×23%+1.33 ×75%=3.92等效CPI2=4 ×25%+1.33 ×75%=2.00•由于改进了仅占2 %的FPSQR操作的CPI,使等效速度提高了近一倍。

计算机系统结构复习总结

计算机系统结构复习总结

计算机系统结构复习总结计算机系统结构复习总结一、计算机系统结构概念1.1 计算机系统结构:程序员所看到的计算机的基本属性,即概念性结构与功能特性。

*注意:对不同层次上的程序员来说,由于使用的程序设计语言不同,可能看到的概念性结构和功能特性会有所不同。

1.2 计算机系统的层次结构现代计算机是一种包括机器硬件、指令系统、系统软件、应用程序和用户接口的集成系统。

现代计算机结构图*注意:计算机结构的层次模型依据计算机语言广义的理解,可将计算机系统看成由多级“虚拟”计算机所组成。

从语言层次上画分可得下图:计算机结构的层次模型1.3计算机系统结构组成与实现计算机系统结构:是计算机系统的软件与硬件直接的界面计算机组成:是指计算机系统结构的逻辑实现计算机实现:是指计算机组成的物理实现*计算机系统结构、组成与实现三者间的关系:计算机系统结构不同会影响到可用的计算机组成技术不同,而不同的计算机组成又会反过来影响到系统结构的设计。

因此,计算机系统结构的设计必须结合应用来考虑,要为软件和算法的实现提供更多更好的硬件支持,同时要考虑可能采用和准备采用哪些计算机组成技术,不能过多或不合理地限制各种计算机组成、实现技术的采用与发展。

计算机组成与计算机实现可以折衷,它主要取决于器件的来源、厂家的技术特长和性能价格比能否优化。

应当在当时的器件技术条件下,使价格不增或只增很少的情况下尽可能提高系统的性能。

1.4 计算机系统结构的分类计算机结构分类方式主要有三种:(1)按“流”分类按“流”分类法是Flynn教授在1966年提出的一种分类方法,它是按照计算机中指令流(Instruction Stream)和数据流(Data Stream)的多倍性进行分类。

指令流是指机器执行的指令序列,数据流是指指令流调用的数据序列。

多倍性是指在计算机中最受限制(瓶颈最严重)的部件上,在同一时间单位中,最多可并行执行的指令条数或处理的数据个数。

*注意:按“流”分类法,即Flynn分类法的逻辑结构类型:①SISD计算机②SIMD计算机③MISD计算机④MIMD计算机(2)按“并行性”和“流水线”分类(3)按计算机系统结构的最大并行度进行分类1.5计算机系统的设计与实现随着大规模集成电路技术的发展和软件硬化的趋势,计算机系统软、硬件间界限已经变得模糊了。

自学考试_计算机系统结构考前复习资料全

自学考试_计算机系统结构考前复习资料全

第一章计算机系统结构的基本概念从处理数据的角度看,并行级别有位串字串,位并字串,位片串字并,全并行。

位串字串和位并字串基本上构成了SIMD。

位片串字并的例子有:相联处理机STARAN,MPP。

全并行的例子有:阵列处理机ILLIAC IV。

从加工信息的角度看,并行级别有存储器操作并行,处理器操作步骤并行,处理器操作并行,指令、任务、作业并行。

存储器操作并行是指可以在一个存储周期内并行读出多个CPU字的,采用单体多字、多体单字或多体多字的交叉访问主存系统,进而采用按内容访问方式,位片串字并或全并行方式,在一个主存周期内实现对存储器中大量字的高速并行操作。

例子有并行存储器系统,以相联存储器为核心构成的相联处理机。

处理器操作步骤并行是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。

例子有流水线处理机。

处理器操作并行是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。

擅长对向量、数组进行处理。

例子有阵列处理机。

指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。

例子有多处理机,计算机网络,分布处理系统。

并行性的开发途径有时间重叠(Time Interleaving),资源重复(Resource Replication),资源共享(Resource Sharing)。

时间重叠是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。

例子有流水线处理机。

资源重复是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。

例子有阵列处理机,相联处理机。

资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率,从而提高系统性能。

例子有多处理机,计算机网络,分布处理系统。

SISD:一个指令部件控制一个操作部件,实现一条指令对一个数据的操作。

计算机系统结构-复习笔记

计算机系统结构-复习笔记

第一章概论
本章重点:计算机系统的层次结构、计算机系统结构的定义、计算机系统的设计思路、系统结构并行性开发的方法和计算机系统的分类。

本章难点:透明性分析。

复习建议:本章在历年考试中,为必考的章节,但一般考察基本概念和基本知识;从题型来讲主要为单项选择题和填空题。

建议学员在复习时注意基本概念的理解和掌握。

第一节计算机系统的多级层次结构
一、计算机系统的层次
(1)从使用语言的角度,计算机系统可以被看成是按功能划分的多层机器级所组成的层次结构。

层次结构由高到低依次为应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序机器级,如图所示。

(2)对各级机器级的理解。

计算机系统结构 复习要点

计算机系统结构 复习要点

计算机系统结构:第一章基本概念填空题、选择题复习:1、从使用语言角度,系统按功能划分层次结构由低到高分别为:微程序机器M0、传统机器M1、操作系统机器M2、汇编语言机器M3、高级语言机器M4、应用语言机器M5.2、计算机系统的设计思路:“从中间开始”设计的“中间”是指层次结构中的软硬件交界面,目前多数在传统机器语言机器级与操作系统机器级之间。

3、翻译与解释的区别与联系:区别:翻译是整个程序转换,解释是低级机器的一串语句仿真高级机器的一条语句;联系:都是高级机器程序在低级机器上执行的必须步骤。

4、模拟与仿真的区别:模拟:用机器语言解释实现软件移植的方法,解释的语言存在主存中;仿真用微程序解释,存储在控制存储器中。

5、解决好软件的可移植性方法有统一高级语言、采用系列机、模拟与仿真。

6、系列机必须保证向后兼容,力争向上兼容。

7、非用户片也称通用片,其功能是由器件厂生产时定死的,器件的用户只能用,不能改;现场片,用户根据需要改变器件内部功能;用户片是专门按用户的要求生产高集成度VLSI器件,完全按用户的要求设计的用户片称为全用户片。

一般同一系列内各档机器可分别用通用片、现场片或用户片实现。

8、计算机应用可归纳为向上升级的4类:数据处理、信息处理、知识处理、智能处理。

9、并行性开发的途径有:时间重叠、资源重复和资源共享。

10、并行性是指:同一时刻或同一时间间隔内完成两种或两种以上性质相同或不同的工作,并行性包含同时性和并发性二重含义。

11、科学计算中的重大挑战性课题往往要求计算机系统能有1TFLOPS的计算能力、1TBYTE 的主存容量、1TBYTE/S的I/O带宽。

12、并行处理计算机的结构:流水线计算机——时间重叠,阵列处理机——资源重复,多处理机——资源共享。

13、多机系统分多处理机系统和多计算机系统,多处理机系统:多台处理机组成的单一系统,多计算机系统:多台独立的计算机组成的系统。

14、多机系统的耦合度可以分为最低耦合、松散耦合和紧密耦合。

02325计算机系统结构复习资料全

02325计算机系统结构复习资料全

第一章计算机系统结构的基本概念从处理数据的角度看,并行级别有位串字串,位并字串,位片串字并,全并行。

位串字串和位并字串基本上构成了SIMD。

位片串字并的例子有:相联处理机STARAN,MPP。

全并行的例子有:阵列处理机ILLIAC IV。

从加工信息的角度看,并行级别有存储器操作并行,处理器操作步骤并行,处理器操作并行,指令、任务、作业并行。

存储器操作并行是指可以在一个存储周期内并行读出多个CPU字的,采用单体多字、多体单字或多体多字的交叉访问主存系统,进而采用按内容访问方式,位片串字并或全并行方式,在一个主存周期内实现对存储器中大量字的高速并行操作。

例子有并行存储器系统,以相联存储器为核心构成的相联处理机。

处理器操作步骤并行是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。

例子有流水线处理机。

处理器操作并行是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。

擅长对向量、数组进行处理。

例子有阵列处理机。

指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。

例子有多处理机,计算机网络,分布处理系统。

并行性的开发途径有时间重叠(TimeInterleaving),资源重复(Resource Replication),资源共享(Resource Sharing)。

时间重叠是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。

例子有流水线处理机。

资源重复是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。

例子有阵列处理机,相联处理机。

资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率,从而提高系统性能。

例子有多处理机,计算机网络,分布处理系统。

SISD:一个指令部件控制一个操作部件,实现一条指令对一个数据的操作。

计算机系统结构复习资料

计算机系统结构复习资料

计算机系统结构复习资料、名词解释1. 时间局部性【答案】时间局部性是指最近访问过的代码是不久将被访问的代码2. 空间局部性【答案】空间局部性是指那些地址上相邻近的代码可能会被一起访问3. 物理地址空间【答案】主存储器中所有存储字构成的物理地址空间 。

4. 从执行程序的角度看,并行性等级可分为哪些?【答案】指令内部并行、指令级并行、任务级或过程级并行、作业或程序级并行5. CPI【答案】每条指令平均时钟周期数其中h =指令i 在程序中执行的次数 6. 从机器(汇编)语言程序员看,以下哪些是透明的?指令地址寄存器;指令缓冲器;时标发生器;条件码寄存器;乘法器;主存地址 寄存器;磁盘外设;先行进位链;移位器;通用寄存器;中断字寄存器【答案】透明的有:指令缓冲器、时标发生器、乘法器、先行进位链、移位器7. 高位存储交叉存取【答案】用存储器地址的高位指明存储体的体号, 而低位用于指明存储体的体内 地址。

8. 直接映射高速缓存组织的优缺点【答案】直接映射的优点在于硬件比较简单, 不需要相联查找,不需要页面替换 算法,因而成本较低且速度较高。

缺点是命中率较低。

9. 写回【答案】在M +i 中的修改延迟到M 中正在修改的字被替换或从 M 中消除后才进行。

10. 虚拟地址空间【答案】应用程序员用来编写程序的地址空间,这个地址空间非常大。

11. 动态互连网络【答案】设臵有源开关,可以根据需要借助控制信号对连接通路加以重新组合实 CPI=CPU 寸钟周期数/IC (指令的条数) n(CPI i *=i 丄 IC12.向量横向处理方式【答案】向量计算是按行的方式自左向右横向的进行。

13.动态流水线【答案】在同一时间内,多功能流水线的各段可以按照不同的方式连接,同时执行多种功能。

其中流水线中各个功能部件不能发生冲突。

14.程序中的数据相关【答案】数据相关指在执行本条指令的过程中,如果用到的指令、操作数、变址偏移量等是前面指令的执行结果,则必须等待前面的指令执行完成,并把结果写到主存或通用寄存器中之后,本条指令才能开始执行。

计算机系统结构复习题

计算机系统结构复习题

计算机系统构造复习1、从使用语言角度,可将系统按功能划分为多层次机器级构造,层次构造分别是:应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序序机器级。

2、各机器级的实现主要靠翻译和解释或两者结合进展。

翻译是先用转换程序将高一级机器级上的程序整个地变换成低一级机器级上等效的程序,然后再在低一级机器级上实现的技术。

解释则是在低级机器上用它的一串语句或指令来仿真高级机器上的一条语句或指令的功能,是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。

3、计算机系统构造在计算机系统机器级层次中指传统机器级的系统构造。

4、计算机系统构造研究的是软、硬件之间的功能分配以及对传统机器级界面确实定,提供机器语言、汇编语言程序设计或编译程序生成系统为使其设计或生成的程序能在机器上正确运行应看到的遵循的计算机属性。

5、计算机系统构造的属性包括:数据表示、寻址方式、存放器组织、指令系统、存储系统组织、中断机构、系统机器级的管态和用户态的定义和切换、机器级的I/O构造、系统各局部的信息保护方式和保护机构等属性。

6、机器透明性:指相对于每一机器级设计人员,都客观存在的功能或属性看不到的现象,称相对于此级设计人员来说,这此功能或属性是具有透明性,即透明的。

7、计算机组成指的是计算机系统构造的逻辑实现,包括机器级部的数据流和控制流的组成以及逻辑设计等。

它着眼于机器级部各事件的排序方式与控制机构、各部件的功能及各部件间的联系。

8、计算机组成设计要解决的问题是在所希望到达的性能和价格下,怎样更好、更合理地把各种设备各部件组织成计算机,来实现所确定的系统构造。

9、当前,计算机组成设计主要是围绕提高速度,着重从提高操作的并行度、重叠度,以及功能的分散和设置专用功能部件来进展的。

10、计算机组成设计要确定的方面一般应包括:数据通路宽路、专用部件的设置、各种操作对部件的共享程度、功能部件的并行度、控制机构的组成方式、缓冲和排队技术、预估预判技术、可靠性技术等。

(完整版)系统结构简答题答案

(完整版)系统结构简答题答案

《计算机系统结构》简答题复习资料1.简述标志符数据表示的主要优点(1)简化了指令系统和程序设计;(2)简化了编译程序;(3)便于实现一致性校验;(4)能由硬件自动变换数据类型;(5)支持数据库系统的实现与数据类型无关的要求;(6)为软件调试和应用软件开发提供了支持。

2.简述哈夫曼压缩概念的基本思想。

哈夫曼压缩概念的基本思想是,当各种事件发生的概率不均等时,采用优化技术对发生概率最高的事件用最短的位数(时间)来表示(处理),而对出现概率较低的,允许用较长的位数(时间)来表示(处理),就会导致表示(处理)的平均位数(时间)的缩短。

3.RISC存在不足表现在哪些方面?(1)、由于指令少使原来在CISC上由单一指令完成的某些复杂功能现在要用多条RISC指令才能完成,加重了汇编语言程序设计的负担,增加了机器语言程序的长度,占用存储空间多,加大了指令的信息流量。

(2)、对浮点运算执行和虚拟存储器的支持虽有很大加强,但仍显得不足。

(3)、RISC机器的编译程序比CISC的难写。

4.简述设计RISC结构用了哪些基本技术?(1)按RISC一般原则设计;(2)逻辑实现用硬联和微程序结合;(3)用重叠寄存器窗口(4)指令用流水和延迟转移;(5)优化设计编译系统。

5.简述计算机系统“由中间开始”设计的基本思想。

(1)软硬件设计分离和脱节是”由上往下”和“由下往上”设计的主要缺点,由此提出“有中间开始”设计。

“中间”提的是层次结构中的软硬交界面,目前多数实在传统机器级与操作系统机器级之间。

(2)进行合理的软、硬件功能分配时,既要考虑能拿到的硬、器件,又要考虑可能的应用所需的算法和数据结构,先定义好这个交界面。

确定哪些功能由硬件实现,哪些功能由软件实现,同时还要考虑好硬件对操作系统、编译系统的实现提供些什么支持。

然后由这个中间点分别往上往下进行软件和硬件的设计。

6.简述计算机系统结构、组成和实现三者的相互关系。

结构、组成、实现三者互不相同,但又互相影响:相同结构(如指令系统相同)的计算机,可以因速度不同而采用不同的组成。

计算机系统结构 总复习

计算机系统结构 总复习
4
∑ 而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算: AiBi i =1
① 画出时空图;(9 分) ② 计算实际的吞吐率、加速比和效率。(6 分) 15. 静态多功能流水线由 6 个功能段组成,如图 E_3 所示。其中,s1、s4、s5、s6 组
成乘法流水线,s1、s2、s3、s6 组成加法流水线,各个功能段时间均为△t,假设 该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以 最快的方式用该流水计算:∏(Ai+Bi)(其中 i=1..4,∏为连乘符号) ① 画出时空图;(9 分) ② 计算实际的吞吐率、加速比和效率。(6 分) 16. (20 分)设指令流水线由取指令、分析指令和执行指令 3 个部件构成,每个部件 经过的时间为△t,连续流入 12 条指令。分别画出标量流水处理机以及 ILP 均为 4 的超标量处理机、超长指令字处理机、超流水处理机的时空图,并分别计算它们 相对于标量流水处理机的加速比。 17. (15 分)给定以下的假设,试计算直接映象 Cache 和两路组相联 Cache 的平均访 问时间以及 CPU 时间。 ① 理想 Cache(命中率为 100%)情况下的 CPI 为 2.0,时钟周期为 2ns,平均每条指 令访存 1.2 次。 ② 两种 Cache 容量均为 64KB,块大小都是 32 字节。 ③ 组相联 Cache 中的多路选择器使 CPU 的时钟周期增加了 10%。 ④ 这两种 Cache 的失效开销都是 80 ns。 ⑤ 命中时间为 1 个时钟周期。 ⑥ 64 KB 直接映象 Cache 的失效率为 1.4%,64 KB 两路组相联 Cache 的失效率为 1.0%。
① 画出处理过程的时空图。(9 分) ② 计算其吞吐率、加速比和效率。(6 分) 12. 有一条动态多功能流水线由 5 段组成(如图 E_2 所示),加法用 1、3、4、5 段,

计算机体系结构复习,考点

计算机体系结构复习,考点

1.计算机系统结构的定义:计算机系统结构概念的实质是确定计算机系统中软、硬件的界面,界面之上是软件实现的功能,界面之下是硬件和固件实现的功能。

2.计算机组成额计算机实现的二者关系:计算机组成指的是计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

它着眼于物理机器级内各事件的排序方式与控制方式、各部件的功能以及各部件之间的关系。

计算机实现指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

它着眼于器件技术和微组装技术,其中器件技术在实现技术中起主导作用。

3.系列机的软件兼容方式4种:向上兼容、向下兼容、向前兼容、向后兼容。

向上(下)兼容指的是按某档计算机编制的程序,不加修改就能运行于比他高(低)档的计算机。

向后(前)兼容指的按某个时期投入市场的某种型号计算机编制的程序,不加修改就能运行于在它之后(前)投入市场的计算机。

向后兼容一定要保证,他是系列机的根本特征。

兼容机:它是指由不同制造商生产的具有相同系统结构的计算机。

4.计算机系统设计的4个常用定量原理:①以经常性事件为重点:这是计算机设计中最重要、使用最广泛的设计原则。

②Amdahl定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比。

Amdahl定律可用来计算当对计算机系统中的某个部分进行改进后,系统总体性能可获得多大的提高。

这是通过加速比这个指标来衡量的。

= =,这个加速比依赖于两个因素:在改进前的系统中,可改进部分的执行时间在总执行时间中的比例:可改进部分改进以后性能提高的倍数。

③CPU性能公式:CPU 时间=执行程序所需的时钟周期数X时钟周期时间,引入新参数CPI(每条指令执行的平均时钟周期数)CPI = 执行程序所需的时钟周期数/IC IC:所执行的指令条数。

程序执行的CPU 时间可以写成CPU时间= IC ×CPI ×时钟周期时间。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

考试题型一、单项选择题(每题2分,共26分)二、填空题(每空0.5分,共7分)三、大题(共67分)共5个,有概念题、分析题、计算题、设计题、综合题复习提纲大题的复习范围:1.会利用CPU性能公式比较多种设计方案的优劣公式一:CPU时间= 一个程序的CPU时钟周期数*时钟周期长度或: CPU时间= 一个程序的CPU时钟周期数/时钟频率公式二:CPU时间= IC*CPI*时钟周期长度公式三:2.会利用Amdahl定律比较多种设计方案的优劣Amdahl定律:计算机系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。

3. Cache 的性能分析,会针对具体情况分析Cache 的性能CPU 执行时间:时钟周期时间存储器停顿周期数时钟周期数执行时间⨯+=)(CPU CPU缺失代价缺失率指令存储器访问次数指令数缺失代价指令缺失次数指令数缺失代价缺失次数存储器停顿周期数⨯⨯⨯=⨯⨯=⨯= 平均存储器访问时间(AMAT ):缺失代价缺失率命中时间主存⋅+=⋅-+⋅=T H T H AMAT Cache )1(提高Cache 性能:可见主要途径有:降低缺失代价降低缺失率通过并行性降低缺失代价/缺失率降低Cache 命中时间4. 导致Cache 失效的原因,需进一步掌握如何降低这三类失效的方法原因:(1)强制(Compulsory )缺失:对一个块的第一次访问一定不在Cache 中,所以该块必须被调入到Cache 中(这也称为:冷启动缺失、首次访问缺失等)。

(2)容量(Capacity )缺失:如果Cache 容纳不了一个程序持续执行所需要的所有块,将会发生容量缺失,某些块将被放弃,随后再被调入。

(3)冲突(Conflict )缺失:如果采用组相联/直接相联,则可能有多个块映射到同一块中,发生冲突缺失。

降低缺失率的技术:(1)增加Cache 块大小(2)增加Cache 容量(3)增加相联度(4)路预测和伪相联Cache(5)编译优化5.向量链接技术基本思想:对于有写读数据相关的向量指令,可以采用“相关专用通道”:从一个流水线部件得到的结果直接送入另一个流水线部件的操作数寄存器,这样多条向量指令可以并行执行,这种技术称为流水线的链接技术。

链接要求:1.没有向量寄存器冲突和运算部件冲突;2.只有当前一条指令的第一个结果分量送入结果向量寄存器的那一个时钟周期方可链接,否则只能串行执行;3.若一条向量指令的两个源操作数分别是两条先行指令的结果时,要求:先行的两条指令产生结果的时间必须相等;先行的两条指令的向量长度必须相等。

6.静态多功能流水线和动态多功能流水线的调度动态调度算法:Tomasulo算法7.Delta互连网络的设计,根据方法即可设计8.多级交叉开关互连网络的设计,需掌握其基本原理方可进行设计9.循环中的指令调度技术:调度、循环展开、软件流水(重点掌握)第四章205页其它题的复习范围:1.衡量机器性能的唯一固定而且可靠的标准是什么?真实程序的执行时间。

2.并行性的常用实现技术,并结合本课程的内容进行举例(1)时间重叠:指令流水线(2)资源重叠: N模冗余结构多处理机多值存储器(3)资源共享:多道程序分时系统3.设计计算机系统设计的常用的定量准则(1)加快经常性事件的速度(2)CPU性能公式(3)局部性原理(4)利用并行性4.实现软件可移植的主要途径有哪些?(1)统一高级语言:设计出一种完全通用的高级语言,为所有的程序员所使用。

(2)采用系列机思想:先确定好系统结构,软件设计者据此设计软件,硬件设计者则根据不同的性能要求,采用不同的组成和实现技术,提供不同档次的机器。

软件兼容性:软件兼容性指的是同一软件可不加修改地运行于该系列机器中的各档机器上的特性。

(3)模拟与仿真:模拟(simulation simulation)指的是用一台机器(宿主机宿主机)的机器语言程序解释实现另一台机器(虚拟机虚拟机)的指令系统的方法。

仿真(emulation emulation)指的是用一台机器(宿主机宿主机)的微程序解释实现另一台机器(目标机目标机)的指令系统的方法。

5.Flynn分类法6.什么是数据表示?什么是数据结构?数据表示:能由硬件直接识别和引用(即有相应运算指令和有硬件支持)的数据类型,例如:定点数据表示、逻辑数据表示、浮点数据表示等。

数据结构:带有结构的数据元素的集合,例如:串、队列、栈、向量、阵列、链表、树、图等。

7.扩展编码的编码原理思想:是固定长度操作码和Huffman编码法相结合形成的。

即:对Huffman编码,根据使用频率宏观分布,将编码长度扩展成有限几种长度的编码。

8.RISC执行程序的速度比CISC要快的关键原因是什么?减少指令平均执行周期。

(1)硬件为主固件为辅(2)在CPU中设置数量较大的寄存器组(3)指令的执行采用流水(4)采用认真设计和优化编译系统设计的技术9.RISC的特点优点:简化指令系统设计,适合VLSI实现。

提高执行速度和效率。

降低设计成本,提高了系统的可靠性。

可以提供直接支持高级语言的能力,简化编译程序的设计。

缺点:加重了汇编语言程序员的负担。

对浮点运算和虚拟存储器的支持不够理想。

相对来说,RISC机器上的编译程序要比CISC机器上的难写。

10.如何提高Cache的命中率?采用预取技术提高命中率思想:不命中时,把M2存储器中相邻几个单元组成的一个数据块都取出来送入M1存储器中。

11.存储系统的主要性能参数存储容量:存储价格:存储速度:12.如何提高存储器频宽?地址码高位交叉多个存储器并行,采用并行/交叉访问等方法提高存储器的访问速度(并行存储器);设置各种缓冲存储器;采用存储体系,特别是Cache存储体系。

13.流水线最大吞吐率的计算吞吐率:单位时间内能流出的任务数或能流出的结果数。

TP=n/Tmn :任务数。

Tm:处理完成n个任务所用的时间。

14.流水线的分类分类一:单功能流水线多功能流水线分类二:静态流水线动态流水线分类三:线性流水线非线性流水线分类四:部件级流水线处理机级流水线系统级流水线其它:标量流水线向量流水线顺序流水线异步流水线15.常见的数据相关有哪些?通常在哪些流水线上会出现?“先写后读”相关“先读后写”相关“写写”相关“先写后读”相关在流水线顺序执行和乱序执行时都可能发生,“先读后写”相关和“写写”相关只有在流水线乱序执行时才可能发生,而“读读”相关无需处理。

16.对分支指令引起的全局相关通常是如何处理的?条件出来前:提前形成条件码预测条件出来后:停顿17.Tomasulo算法和前瞻执行机制中的换名功能分别是如何实现的?18.向量处理机的常见的相关和冲突有哪些?相关:V0←V1+V2 V0←V1+V2V3←V4×V5 V3←V0×V4(a) 不相关的指令(b) 写读数据相关V0←V1+V2 V0←V1+V2V3←V4+V5 V3←V1×V4(c) 功能部件冲突(d) 读读数据相关提示:采用顺序发射顺序完成方式。

19.评价向量处理机性能的参数有哪些?及其具体用途是什么?向量指令处理时间Tvp:(1)一条向量指令的处理时间:Tvp=Ts + Tvf + (n - 1) Tc其中:Tvp为一条向量指令的处理时间;Ts为向量流水线的建立时间;Tvf为向量流水线的流过时间;Tc为流水线“瓶颈”段的执行时间;n为向量长度。

如果每段执行时间都等于一个时钟周期,则有:Tvp =[s + e + (n - 1)]τ其中:s 为向量流水线建立时间所需的时钟周期数;e 为向量流水线流过时间所需的时钟周期数;n 为向量长度;τ为时钟周期长度。

(2)一批向量指令的处理时间:向量长度≤向量寄存器长度时:i i c start n T n T T 编队编队数])1([1∑=-+=其中: Tstart 为每个编队的向量启动开销,即流水线建立时间+流过时间;Tc 为流水线“瓶颈”段的执行时间;n 为向量长度;Tchime 为编队数。

向量长度>向量寄存器长度时:需进行分段开采,向量长度为n 的一组向量操作的整个执行时间为:()chime start loop n T n T T MVL n T ⨯++⨯⎥⎥⎤⎢⎢⎡=其中:Tloop 为执行标量代码的开销,Tstart 为每个编队的向量启动开销, Tchime 为编队数,MVL 是向量寄存器的长度。

Tloop 可以看作是一个常数,Cray 1机的 Tloop 约等于15。

最大性能R ∞:R ∞表示当向量长度为无穷大时的向量流水线的最大性能。

常在评价峰值性能时使用,单位为MFLOPS 。

可表示为:⎥⎥⎤⎢⎢⎡⨯=⨯=∞→∞→∞n T R n n n lim lim 时钟频率浮点运算次数循环所花费时钟周期数时钟频率浮点运算次数其中:n 为向量长度;Tn 为一组向量操作的整个执行时间。

半性能向量长度n1/2:为达到一半R ∞值所需的向量长度称为半性能向量长度n1/2,主要评价向量流水线建立时间对性能的影响。

2/12/121n T R n 时钟频率浮点运算次数循环所花费时钟周期数时钟频率浮点运算次数⨯=⨯=∞向量长度临界值nv : nv 表示向量流水方式的工作速度优于标量串行方式工作时所需得向量长度临界值。

该参数既衡量建立时间,也衡量标量/向量速度比对性能的影响。

20. 常用的互连函数恒等置换交换置换方体置换均匀洗牌置换蝶式置换位序颠倒置换移数置换加减2i 置换21. Omega 网络的结构和特点采用2×2的四功能开关,对于N ×N 网络,有n=log2N 个开关级,每级有N/2个开关; n 个开关级从输入端到输出端依次为Kn-1 、 … K1 、 K0,n+1个级间连接依次为Cn 、 … C1、 C0, 其中C0为恒等置换, C1~Cn 都为均匀洗牌置换;开关采用单元控制方式。

本网络也称为:多级洗牌置换网络或多级混洗网络。

Omega网络(网络)可看作是多级立方体网络的逆网络。

级控制且开关为二功能开关网络是STARAN交换网络的逆网络。

部分级控制且开关为二功能网络是STARAN移数网络的逆网络。

单元控制且开关为二功能网络是间接二进制n方体网络的逆网络。

22.多级立方体互连网络的特点23.什么是多处理机中不会引起Cache不一致?导致的原因有哪些?Cache一致性是指私有Cache中共享数据的副本和共享存储器中共享数据之间的一致性。

导致不一致的原因:(1)共享可写数据引起的不一致性(2)进程迁移引起的数据不一致性(3)I/O传输造成的数据不一致性前两种原因的解决方法:监听法目录法第三种原因的解决方法:禁止法刷新法24.多处理机系统的两种基本结构分别为?集中式分布式25.解决多处理机Cache一致性的方法有哪些?具体用在什么环境中?26.多处理机中实现同步的常见基本硬件原语有哪些?1.原子交换:将一个存储单元的值和一个寄存器的值进行交换。

相关文档
最新文档