计算机体系结构名词解释总汇
计算机体系结构术语解释
计算机体系结构术语解释1、计算机高性能发展受益于:(1)电路技术的发展;(2)计算机体系结构技术的发展。
2、层次结构:计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。
第六级:应用语言虚拟机->第五级:高级语言虚拟机->第四级:汇编语言虚拟机->第三级:操作系统虚拟机->第二级:机器语言(传统机器级) ->第一级:微程序机器级。
3、计算机体系结构:程序员所看到的计算机的属性,即概括性结构与功能特性。
4、透明性:在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的概念称为透明性。
5、Amdahl提出的体系结构是指机器语言级程序员所看见的计算机属性。
6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定,也就是指令集的设计,该界面之上由软件的功能实现,界面之下由硬件和固件的功能来实现。
7、计算机组织是计算机系统的逻辑实现;计算机实现是计算机系统的物理实现。
8、计算机体系结构、计算机组织、计算机实现的区别和联系?答:一种体系结构可以有多种组成,一种组成可以有多种物理实现,体系结构包括对组织与实现的研究。
9、系列机:是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。
10、软件兼容:即同一个软件可以不加修改地运行于系统结构相同的各机器,而且它们所获得的结果一样,差别只在于运行时间的不同。
11、兼容机:不同厂家生产的、具有相同体系结构的计算机。
12、向后兼容是软件兼容的根本特征,也是系列机的根本特征。
13、当今计算机领域市场可划分为:服务器、桌面系统、嵌入式计算三大领域。
14、摩尔定律:集成电路密度大约每两年翻一番。
15、定量分析技术基础(1)性能的评测:(a)响应时间:从事件开始到结束之间的时间;计算机完成某一任务所花费的全部时间。
(b)流量:单位时间内所完成的工作量。
(c)假定两台计算机x、y;x比y快意思为:对于给定任务,x的响应时间比y少。
计算机体系结构名词解释大全
计算机体系结构名词解释大全名词解释:(1)静态流水线——同一时间内,流水线的各段只能按同一种功能的连接方式工作。
(2)分段开采——当向量的长度大于向量寄存器的长度时,必须把长向量分成长度固定的段,然后循环分段处理,每一次循环只处理一个向量段。
(3)计算机体系结构——程序员所看到的计算机的属性,即概念性结构与功能特性(4)时间重叠——在并行性中引入时间因素,即多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。
(5)TLB——个专用高速存储器,用于存放近期经常使用的页表项,其内容是页表部分内容的一个副本(6)结构冲突——指某种指令组合因为资源冲突而不能正常执行(7)程序的局部性原理——程序在执行时所访问的地址不是随机的,而是相对簇聚;这种簇聚包括指令和数据两部分。
(8)2:1Cache经验规则——大小为N的直接映象Cache的失效率约等于大小为N /2的两路组相联Cache的实效率。
(9)组相联映象——主存中的每一块可以放置到Cache中唯一的一组中任何一个地方(10)数据相关——当指令在流水线中重叠执行时,流水线有可能改变指令读/写操作的顺序,使得读/写操作顺序不同于它们非流水实现时的顺序,将导致数据相关。
(1)动态流水线——同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。
(2)透明性——指在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的特性。
(3)层次结构——计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。
(4)资源共享——是一种软件方法,它使多个任务按一定的时间顺序轮流使用同一套硬件设备。
(5)快表——个专用高速存储器,用于存放近期经常使用的页表项,其内容是页表部分内容的一个副本。
(6)控制相关——指由分支指令引起的相关,它需要根据分支指令的执行结果来确定后续指令是否执行。
(7)存储层次——采用不同的技术实现的存储器,处在离CPU不同距离的层次上,目标是达到离CPU最近的存储器的速度,最远的存储器的容量。
02318自考计算机组成原理(名词解释)总结
第一章1.主机:由CPU、存储器与I/O接口合在一起构成的处理系统称为主机。
2.CPU:中央处理器,是计算机的核心部件,由运算器和控制器构成。
3.运算器:计算机中完成运算功能的部件,由ALU和寄存器构成。
4.ALU:算术逻辑运算单元,负责执行各种算术运算和逻辑运算。
5.外围设备:计算机的输入输出设备,包括输入设备,输出设备和外存储设备。
6.数据:编码形式的各种信息,在计算机中作为程序的操作对象。
7.指令:是一种经过编码的操作命令,它指定需要进行的操作,支配计算机中的信息传递以及主机与输入输出设备之间的信息传递,是构成计算机软件的基本元素。
8.透明:在计算机中,从某个角度看不到的特性称该特性是透明的。
9.位:计算机中的一个二进制数据代码,计算机中数据的最小表示单位。
10.字:数据运算和存储的单位,其位数取决于具体的计算机。
11.字节:衡量数据量以及存储容量的基本单位。
1字节等于8位二进制信息。
12.字长:一个数据字中包含的位数,反应了计算机并行计算的能力。
一般为8位、16位、32位或64位。
13.地址:给主存器中不同的存储位置指定的一个二进制编号。
14.存储器:计算机中存储程序和数据的部件,分为内存和外存。
15.总线:计算机中连接功能单元的公共线路,是一束信号线的集合,包括数据总线.地址总线和控制总线。
16.硬件:由物理元器件构成的系统,计算机硬件是一个能够执行指令的设备。
17.软件:由程序构成的系统,分为系统软件和应用软件。
18.兼容:计算机部件的通用性。
19.软件兼容:一个计算机系统上的软件能在另一个计算机系统上运行,并得到相同的结果,则称这两个计算机系统是软件兼容的。
20.程序:完成某种功能的指令序列。
21.寄存器:是运算器中若干个临时存放数据的部件,由触发器构成,用于存储最频繁使用的数据。
22.容量:是衡量容纳信息能力的指标。
23.主存:一般采用半导体存储器件实现,速度较高.成本高且当电源断开时存储器的内容会丢失。
计算机组织与结构名词解释
第一章集成电路: 采用一定的工艺,把一个电路中所需的晶体管、二极管、电阻、电容和电感等元件及布线互连一起,制作在一小块或几小块半导体晶片或介质基片上,然后封装在一个管壳内,成为具有所需电路功能的微型结构。
系列机:系列机指基本指令系统相同、基本体系结构相同的一系列不同型号的计算机。
通用机:虚拟机:虚拟机指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。
第二章定点数: 计算机中采用的一种数的表示方法。
参与运算的数的小数点位置固定不变。
浮点数:浮点数是属于有理数中某特定子集的数的数字表示,在计算机中用以近似表示任意某个实数。
阶码:在机器中表示一个浮点数时需要给出指数,这个指数用整数形式表示,这个整数叫做阶码.尾数:尾数:在数学里,专指小数点后面的数字,规格化:在浮点数中,为了在尾数中表示最多的有效数据位,同时使浮点数具有唯一的表示方式,浮点数的编码应当采用一定的规范,规定尾数部分用纯小数给出,而且尾数的绝对值应大于或等于1/R,并小于或等于1,即小数点后的第一位不为零。
溢出:在计算机中,当要表示的数据超出计算机所使用的数据的表示范围时,则产生数据的溢出。
字节:字节(Byte)是计算机信息技术用于计量存储容量和传输容量的一种计量单位,一个字节等于8位二进制数。
字:字是其用来一次性处理事务的一个固定长度的位(bit)组。
舍入处理:浮点运算在对阶或右规时,尾数需要右移,被右移出去的位会被丢弃掉,从而造成运算结果精度的损失。
为了减少这种精度损失,可以将一定位数的移出位先保留起来,称为保护位,在规格化后进行舍入处理.数据校验码:为自动识别所出现的差错而安排的冗余码。
纠错码:在传输过程中发生错误后能在收端自行发现或纠正的码。
第三章机器指令:机器指令是CPU能直接识别并执行的指令,它的表现形式是二进制编码。
操作码:计算机程序中所规定的要执行操作的那一部分指令*或字段(通常用代码表示)。
计算机系统结构(第三版)张晨曦 课后答案
fi Si
−1
式中,fi 为可加速部件 i 在未优化系统中所占的比例;Si 是部件 i 的加速比。
⎧ f ⎫ f f S = ⎨[1 − ( f1 + f 2 + f 3 )] + 1 + 2 + 3 ⎬ S S S 1 2 3⎭ ⎩
0.3 0.3 f 3 ⎫ ⎧ 10 = ⎨[1 − (0.3 + 0.3 + f 3 )] + + + ⎬ 30 20 30 ⎭ ⎩
课
45000 × 1 + 75000 × 2 + 8000 × 4 + 1500 × 2 = 1.776 129500
答
案 网
计算机体系结构 • 第一章 • 第4页
⎡ f ⎤ Te = To ⎢(1 − f e ) + e ⎥ S e⎦ ⎣
S=
1 (1 − f e ) +
fe Se
S=
i
1 (1 − ∑ f i ) + ∑
对于第三级而言,为了完成 IC 条指令的功能,第三级指令的条数为: 执行第三级
IC 。为了 M2
IC IC 条指令,需要执行 N 条第二级的指令对其进行解释。那么对第二级 2 M M2 IC IC + 2N 2 M M
而言,总的指令条数为:
N⎤ ⎡ = ⎢1 + ⎥ K ⎣ M⎦ N⎤ ⎡ T4 = ⎢1 + ⎥ K ⎣ M⎦
1.5 计算机系统有三个部件可以改进,这三个部件的加速比如下: 部件加速比 1=30; 部件加速比 2=20; 部件加速比 3=10; (1) 如果部件 1 和部件 2 的可改进比例为 30%,那么当部件 3 的可改进比例为多少时, 系统的加速比才可以达到 10? (2) 如果三个部件的可改进比例为 30%、30%和 20%,三个部件同时改进,那么系统 中不可加速部分的执行时间在总执行时间中占的比例是多少? 解:在多个部件可改进情况下 Amdahl 定理的扩展:
计算机专业术语名词解释
项目一1、计算机网络:是指利用通信设备和通信线路将地理位置分散的自主计算机地连在一起,在相应软件(包括网络操作系统、网络数据库、网络协议、网络通信、网络管理和应用软件)的支持下,实现数据通信和资源共享的系统。
2、协议:指两个主机间通信时对传送信息内容的理解,信息表示形式以及各种情况下信号都必须遵守一个共同的协定。
3、体系结构:在ARPA网中,将协议按功能分成了若干层次,如何分层以及各层中具体采用的协议系统。
4、通信协议:计算机网络中,数据处理主要由计算机系统来完成,数据传输则要依靠数据通信系统来完成,而数据通信系统在数据处理和数据传输中应该遵循的各种规程和标准就是网络系统要实现的通信协议。
5、Internet:是世界上规模最大、覆盖面最广、信息资源最丰富、用户最多、影响最广的计算机互联网络,是一个将全世界不同国家、不同地区、不同部门和机构不同类型的计算机和各种计算机网络(国家主干网、广域网、城域网和局域网等)连接在一起形成的全球性网络,也称为国际互联网或因特网。
6、www:万维网是全球信息网World Wide Web的缩写,也称Web或3W,是由欧洲量子物理实验室的英国工程师Lee在1989年率先提出的。
www采用客户机/服务器C/S(Client/Server)工作模式,是Internet上最受欢迎的一种多媒体信息服务系统中,最大的特点是超链接,以超文本标记语言HTML与超文本传输协议HTTP为基础,为用户提供界面一致的信息浏览系统。
7、HTML:超文本标记语言是用于建立超文本/超媒体文档的标记语言,对网页的内容、格式及连接进行描述,而浏览器的作用就是读取WWW站点上的HTML文档,再根据此类文档中的描述组织并显示相应的网页。
8、HTTP:超文本传输协议是WWW客户机与WWW服务器之间的应用层传输协议,是最经常使用的协议之一。
9、URL:用于维持页面到页面的链接信息。
10、SMTP:简单邮件传输协议,用于用户向邮件服务器发送邮件,向用户提供高效、可靠的邮件传输。
计算机组成原理名词解释
计算机组成原理名词解释1.存储容量:是指存储器可以容纳的二进制信息量,用存储器中存储地址寄存器MAR的编址数与存储字位数的乘积表示。
2.寻址方式:寻址方式就是寻找操作数或操作数地址的方式。
3.机器字长:指CPU一次能处理二进制数据的位数4.指令字长:一个指令字中包含二进制代码的位数。
5.存储字长:一个存储单元存储一串二进制代码(存储字)6.MIPS——百万条指令/秒,运算速度单位7.指令——一组二进制代码,由操作码和地址码组成8.程序——若干指令或命令的集合9.MAR——存储器地址寄存器,存放存储单元地址10.MDR——存储器数据寄存器,存储字长11.主频——CPU响应速度12.CPI——执行一条指令所需周期数13.FLOPS——每秒浮点运算次数14.CPU——中央处理器,由运算器和控制器组成15.PC——程序计算器,用于取指令并自动计数16.IR——指令寄存器,分析指令17.CU——控制单元,执行指令,产生微操作18.ALU——运算单元,进行算数,逻辑运算19.ACC——累加器,存放操作数和结果20.MQ——乘商寄存器21.X——操作数寄存器22.I/0——输入/输出接口23.总线——一种能由多个部件分时共享的公共信息传输线路24.总线宽度——数据线的根数25.总线带宽——每秒传输的最大字节数26.存储器带宽——单位时间内从存储器进出信息的最大数量27.汉明码——有一位纠错能力的编码28.字:数据运算和存储的单位,其位数取决于具体的计算机。
29.字节:衡量数据量以及存储容量的基本单位。
30.字长:一个数据字中包含的位数,反应了计算机并行计算的能力。
31.接口:计算机主机与外围设备之间传递数据与控制信息的电路32.端口:接口中的数据中转站33.DMA 方式:直接存储器访问,直接依靠硬件实现主存与外设之间的数据直接传输,传输过程本身不需CPU程序干预。
34.单级中断:CPU在执行中断服务程序的过程中禁止所有其他外部中断。
重庆大学 系统结构 题库 名词解释
传输时延(Transport latency):它等于"飞行"时间和传输时间之和。它是消息在互连网络上 所花费的时间,但不包括消息进入网络和到达目的结点后从网络接口硬件取出数据所花费的时 间。(9)
16、MPP:基于分布存储的大规模并行处理系统(10)
17、S2MP:是一种共享存储的体系结构,和大规模的消息传递系统相比,它支持简单的编程 模型,系统使用方便,是对 SMP 系统在支持更高扩展能力方面的发展。(10)
18、SMP:SMP 称为共享存储型多处理机(Shared Memory mulptiProcessors), 也称为对称型 多处理机(Symmetry MultiProcessors)(10)
"飞行"时间(Time of flight):消息的第一位信息到达接收方所花费的时间,它包括由于网络 中转发或其它硬件所起的时延(9)
传输时间(Transmission time):消息通过网络的时间,它等于消息长度除以频宽。(9)
频宽(Bandwidth):它是指消息进入网络后,互连网络传输信息的最大速率。它的单位是兆 位/秒,而不用兆字节/秒。
28、虚拟直通(virtual cut through) :目前有一些多计算机系统采用的是虚拟直通的寻径方式 。 虚拟直通的寻径方式的思想是,为了减少时延,没有必要等到整个消息全部缓冲后再作路由选 择,只要接收到用作寻径的消息头部即可判断。 (9)
29、存储转发寻径:存储转发寻径(store and forward) 在存储转发网络中包是信息流的基本单
(3) 顺序流动:一串连续任务在流水线中是一个接一个地在各个功能段中间流过的。从流水线 的输出端看,任务流出流水线的顺序与输入端的任务流入顺序完全相同 ,这种控制方式称为顺 序流动方式
考研计算机体系结构知识点梳理
考研计算机体系结构知识点梳理计算机体系结构是计算机科学与技术中的重要分支,涵盖了计算机硬件和软件之间的接口设计、计算机系统的层次结构、指令集架构等内容。
考研中,对计算机体系结构的掌握是非常重要的,本文将对考研计算机体系结构的知识点进行梳理和总结。
一、计算机体系结构的基本概念计算机体系结构(Computer Architecture)是指计算机硬件与软件之间接口规格定义的集合,它包括计算机硬件的组成和工作原理,以及指令集架构和计算机系统的层次结构。
1.1 计算机硬件的组成计算机硬件由中央处理器(CPU)、存储器(Memory)、输入输出设备(I/O)等组成。
其中,中央处理器是计算机的核心部件,负责执行指令和进行数据处理。
1.2 计算机系统的层次结构计算机系统的层次结构包括硬件层次结构和软件层次结构。
硬件层次结构包括处理器、存储器、总线等组成部分;软件层次结构包括操作系统、编译系统、应用软件等。
1.3 指令集架构指令集架构(Instruction Set Architecture,ISA)定义了计算机系统的指令集合和指令的编码格式。
常见的指令集架构包括精简指令集(RISC)和复杂指令集(CISC)。
二、计算机的性能指标在计算机体系结构中,常用的性能指标有时钟周期、时钟频率、执行时间和吞吐量等。
2.1 时钟周期和时钟频率时钟周期是指计算机系统中最小的时间单位,是计算机进行一次简单操作所需要的时间。
时钟频率是指计算机系统每秒钟进行时钟周期的次数。
2.2 执行时间执行时间是指计算机完成一个程序的时间,它等于指令执行的总周期数乘以时钟周期。
执行时间是衡量计算机性能的重要指标,通常以秒为单位。
2.3 吞吐量吞吐量是指计算机系统在单位时间内完成的任务数量。
吞吐量大表示计算机系统的处理能力强,可以同时处理更多的任务。
三、指令的执行流程计算机处理器执行指令的流程包括指令获取、指令译码、指令执行和结果写回等步骤。
3.1 指令获取指令获取是指计算机从存储器中获取指令的过程。
计算机体系结构概述
计算机体系结构概述计算机体系结构是指计算机硬件与软件之间的组织和交互方式。
它定义了计算机系统内部各个组成部分的功能、连接方式以及数据传输的路径等。
计算机体系结构的设计直接影响了计算机性能、可扩展性和能效等方面的表现。
本文将概述计算机体系结构的基本概念、发展历程和常见结构类型。
一、基本概念计算机体系结构是计算机系统的“蓝图”,可以将其比作大楼的设计图。
它包括了各个部分之间的功能划分、数据传输和操作方式等。
计算机体系结构主要由以下几个方面组成:1. 处理器:负责执行计算机指令,包括算术逻辑运算、控制逻辑和数据处理等功能。
2. 存储器:用于存储程序和数据。
常见的存储器有主存储器和辅助存储器,如内存和硬盘等。
3. 输入输出设备:用于与用户进行信息交互,如键盘、鼠标、显示器等。
4. 总线:用于连接各个组件之间的数据传输通路。
主要包括数据总线、地址总线和控制总线。
二、发展历程计算机体系结构随着计算机技术的发展而不断演变和完善。
以下是计算机体系结构的三个主要发展阶段:1. 单指令流单数据流(SISD):早期计算机采用的体系结构,指令和数据都从单一的内存存取,处理器按照指令序列依次执行,没有并发操作。
2. 单指令流多数据流(SIMD):在SISD的基础上,引入多个处理器核心,它们可以同时处理不同的数据,但执行的指令序列相同。
3. 多指令流多数据流(MIMD):当前普遍采用的体系结构,具有多个独立的处理器核心,可以同时执行不同的指令和处理不同的数据。
三、常见结构类型根据计算机体系结构的特点和应用需求,发展出了多种常见的结构类型。
以下是几种常见的计算机体系结构:1. 冯·诺依曼结构:由冯·诺依曼于20世纪40年代提出的经典计算机结构。
它以存储程序的概念为基础,包含了用于指令和数据存取的存储器、算术逻辑单元(ALU)、控制单元和输入输出设备等。
2. 流水线结构:将指令执行划分为多个阶段,并行处理不同的指令。
计算机系统结构名词解释简答
一.名词解释1.计算机体系结构:程序员所看到的计算机的属性,即概念性结构与功能特性。
2.系列机:在一个厂家内生产的具有相同的体系结构,但具有不同组成和实现的一系列不同型号的机器。
3.透明性现象:在计算机技术中,一种本来存在的事物或属性,但从某种角度看似乎不存在,称之为透明性现象。
因而计算机层次结构各个级上都有它的系统结构。
4.流水线技术:把一个重复的过程分解为若干个子过程,每个子过程由专门的功能部门实现。
将多个处理过程在时间上错开,一次通过各功能段,这样,每个子过程就可以与其它子过程并行进行。
5.指令调度:通过改变指令在程序中的位置,将相关指令之间的距离加大到不小于指令执行延迟,将相关指令转化为无关指令。
指令调度是循环展开的技术基础。
6.请求字优先:调块时,从请求字所在的位置读起。
这样,第一个读出的字便是请求字。
将之立即发送给CPU。
二.简答题1.降低Cache失效率答:强制性失效:增加块大小,预取(本身很少)容量失效:增加容量(抖动现象)冲突失效:提高相联度(理想情况:全相联)2.减少失效开销5.4.1 让读失效优先于写1. Cache中的写缓冲器导致对存储器访问的复杂化2. 解决问题的方法(读失效的处理)◆推迟对读失效的处理(缺点:读失效的开销增加,如50%)◆检查写缓冲器中的内容3. 在写回法Cache中,也可采用写缓冲器5.4.2 子块放置技术1. 为减少标识的位数,可采用增加块大小的方法,但这会增加失效开销,故应采用子块放置技术。
2. 子块放置技术:把Cache块进一步划分为更小的块(子块),并给每个子块赋予一位有效位,用于指明该子块中的数据是否有效。
Cache与下一级存储器之间以子块为单位传送数据。
但标识仍以块为单位。
5.4.3 请求字处理技术1. 请求字从下一级存储器调入Cache的块中,只有一个字是立即需要的。
这个字称为请求字。
2. 应尽早把请求字发送给CPU◆尽早重启动:调块时,从块的起始位置开始读起。
计算机系统结构术语解释和简答题
一.名词解释1)虚拟机:指通过软件模拟具有完整硬件系统功能的,运行在一个完全隔离环境中的完整计算机系统2)系统加速比:同一个任务在系统改进前花费总时间和在系统改进后花费总时间的比率3)Amdahl定律:计算计算机系统中某个部件改进后能获得多少总性能提高的定律15)顺序流水线:输入端任务流入的顺序和输出端任务流出的顺序相同的流水线16)乱序流水线:输入端任务流入的顺序和输出端任务流出的顺序不同的流水线17)流水线吞吐率:单位时间内流水线完成任务的数量18)流水线加速比:完成同样一批任务,使用流水线花费的时间和不使用流水线花费的时间之比19)流水线的效率:流水线中设备的实际使用时间和整个运行时间的比值20)数据相关:此次运算需要前一次运算的结果作为数据21)名相关:两个操作使用了相同的寄存器或者存储器22)控制相关:根据分支指令的执行结果确定后面程序的运行23)反相关:名相关的一种,指令i读的名和指令j写的名相同,简称i读j写24)结构冲突:硬件资源不足引起的冲突25)数据冲突:当指令在流水线中重叠执行时,因需要晕倒前面的指令的执行结果引起的冲突26)控制冲突:流水线遇到的分支指令或者其他会改变pc值的指令所引起的冲突27)定向技术:把计算结果从产生位置直接放到需要的位置28)多级存储层次:采用多种存储器技术的存储器结构29)命中时间:cpu访问存储系统时,找到所需数据花费的时间30)不命中率:cpu访问存储系统时,没有找到所需数据的比率31)不命中开销:cpu访问存储系统时,没有找到所需数据花费的时间32)全相连映像:主存中的任意一块对应Caceh中的任意一个位置33)直接映像:主存中的任意一块对应Caceh中的唯一一个位置34)组相连映像:主存中的任意一块对应Caceh中的一组位置35)写直达法:写入cache之后,直接写入下一级存储器36)写回法:只写入caceh中,只有该块被替换时,才写入下一级存储器37)强制性不命中:第一次访问时,Cache中没有该程序的任何数据而产生的不命中38)容量不命中:因为Cache容量限制导致某些块被替换出去之后又再次访问该块而放到不到的不命中39)冲突不命中:被替换出去的块又要访问而产生的不命中(不是因为Caceh容量)40)2:1Caceh经验规则:大小为N的直接映像Cache的失效率约等于大小为N/2的两路组相连Cache的失效率41)相连度:42)牺牲Cache:指在Cache和其下一级存储器的数据通路上的一个全相连的小Cache 43)系统响应时间:指计算机对用户的请求做出反映的时间44)可靠性:规定条件下完成预定功能的能力45)可用性:考察某个时间,系统正常运行的概率期望46)RAID:独立冗余磁盘阵列47)互连网络:一种由开关元件按照一定的拓扑结构和控制方式构成的网络48)互连函数:表示输入端号和输出端号连接关系的函数49)网络规模:网络中结点个数50)网络直径:网络中任意两点间的最大距离51)静态互连网络:各结点间有固定连接通路且在运行中不能改变的网络52)动态互连网络:由交换开关构成可以按照程序的要求动态改变连接状态的网络53)集中式共享多处理机:多个处理器共享一个存储器的多处理机系统54)分布式共享多处理机:多个处理器共享多个存储器的多处理机系统55)多Caceh一致性:多个Cache中的同一个数据要求保持一致的特性56)写作废协议:通知其他保留该数据副本的Cache作废副本数据的协议57)写更新协议:通知其他暴力该数据副本的Cache更新该副本数据的协议二.简答题1.什么是软件兼容?软件兼容有哪几种?其中哪一种是软件兼容的根本特征?软件兼容:一个软件可以不经修改或者只经过少量修改就可以由一台计算机移植到另外一台计算机上,差别只是时间不同软件兼容的种类:向上(下)兼容:按某档计算机编制的程序,不加修改就能运行于比他高(低)挡的计算机向后(前)兼容:按某个时期投入市场的某种型号的计算机,不加修改就能运行于在他之后(前)投入市场的计算机根本特征:向后兼容2.试以系列机为例,说明计算机系统结构,计算机组成,计算机实现三者之间的关系计算机组成是计算机系统结构的逻辑实现,计算机实现是计算机组成的物理实现一种系统结构可以有多种组成,一种组成可以有多种实现,同一系列计算机中各型号的计算机具有相同的系统结构,但采用不同的组成和实现技术,因而就有不同的价格和性能3.计算机系统结构的设计和分析中最经常使用的三条基本原则是什么?1)大概率事件优先原则(对于大概率常见事件,赋予他优先的处理权和资源使用权,以获得全局最优结果2)Amdahl定律(加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性3)程序局部性原理(程序的执行时所访问的地址不是随机的,而是相对簇聚4. 根据Amdahl定律,系统的加速比由那两个因素决定?可改进比例和部件加速比5. 计算机系统中提高并行性的技术途径有哪三种?1)时间重叠:在并行性概念中引入时间因素,即多个处理过程在时间上相互错开,轮流重叠的使用同一套硬件设备的各个部分,以加快硬件周转时间而赢得速度,比如流水线技术2)资源重复:在并行性概念中引入空间因素,以数量取胜的原则,通过重复设置硬件资源,大幅度提高计算机系统性能,比如多处理机系统3)资源共享:软件方法,使多个任务按照一定的时间顺序轮流使用同一套硬件设备,比如多道程序和分时系统6. 从当前计算机技术观点来看,CISC结构有什么缺点?1)各种指令的使用频率相差悬殊2)CISC的复杂性带来了计算机系统结构的复杂性,增加了研制的时间和成本,还容易造成设计错误3)CISC中许多指令需要复杂的操作,运行速度慢4)CISC中指令功能的不均衡性,不利于采用先进的计算机系统结构技术来提高系统性能7. RISC的设计原则是什么?1)选取使用频率最高的指令,并补充一些最有用的指令2)每条指令的功能应尽可能简单,并且在一个周期内完成3)所有指令长度均相同4)只有load指令和store指令才访问存储器,其他指令均在寄存器之间进行5)以简单有效的方式支持高级语言8.MIPS采用哪几种寻址方式?答:寄存器寻址,立即数寻址,偏移寻址9.流水线技术有哪些特点?1)流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现,因此流水线实际上是把一个大的功能部件分解为多个独立的功能部件,并依靠他们的并行工作来提高效率2)流水线中各段的时间应尽可能相同,否则会引起流水线的堵塞和断流3)流水线每一个功能部件前面都有一个缓冲寄存器,称为流水寄存器4)流水线技术适合于大量重复的时序过程,只有在输入端不断的提供服务,才能充分发挥流水线的效率5)流水线需要有通过时间和排空时间,在这两个时间段中,流水线都不是满负荷工作10.在5段流水线中,一条指令的执行需要几个时钟周期?他们分别是什么?5个时钟周期1)取指令周期2)指令译码周期/读存储器周期3)执行周期/有效地址计算周期4)存储访问周期/分支完成周期5)写回周期11.评价流水线的性能指标是什么?吞吐率和加速比吞吐率:单位时间内流水线所完成的任务数量加速比:使用流水线和1不使用流水线花费时间的比值12.什么叫相关?流水线中有哪几种相关?1)数据相关(此次运算需要前一次运算的结果作为数据)2)名相关(指令所访问的寄存器或存储器单元相同)3)控制相关(分支指令引起的相关)13.单级存储器的主要矛盾是什么?主要采用什么方法解决?主要矛盾:1)速度越快,价格就越高2)容量越大,价格就越低3)容量越大,速度越慢解决方法:采用多级存储层次结构14.在存储层次中应解决那四个问题?1)映像规则问题:当把一个块调入高一级存储器时,可以放到哪些位置上2)查找算法问题:当所要访问的块在高一级存储器时,任何找到改块?3)替换算法问题:当发生失效时,应该替换哪一块?4)写策略问题:当进行写访问时,应进行哪些操作?15.地址映像方法有哪几种?他们各有什么优缺点?1)全相连映像(主存中的任意一块可以放在Cache中的任何位置)缺点;查找复杂,代价高,速度慢优点:Cache空间利用率高,块冲突概率低,Caceh的失效率低2)直接映像:(主存中的任意一块都只对应Cache中的唯一一个位置)缺点:Cache空间利用率低,块冲突概率高,Cache失效率高优点:查找简单,快速3)组相连映像(主存中的任意一块对应Cache中的一组位置)直接映像和全相连映像折中的办法16.写策略主要有哪两种?他们各有什么优点?1)写直达法:容易实现,而且存储器中下一级的数据总是最新的,但是速度慢2)写回法:速度块,写操作能以Cache存储器的速度进行,而且对于同一个单元的多个写最后只需一次写回下一级存储器(不直接写回下一级存储器,而是交给写缓冲器去做)17.伪相连的基本思想是什么?采用这种方法时,在命中情况下,访问Caceh的过程和直接映像访问Cache的过程相同,而且发生失效时,在访问下一级存储器之前,会先检查Caceh另一个位置,看是否匹配,确定这个另一块的简单方法是将索引字段的最高位取反,然后按照新索引去寻找伪相连中对应的块,如果这一块的标识匹配,则称发生了伪命中,否则就只好访问下一级存储器18.采用二级Caceh的基本思想是什么?通过在原有的Cache和存储器中间增加一层Cache,构成两级Cache,把第一级Cache做得足够小,使其速度和快速cpu的时钟周期相匹配,,而把第二级Cache做得足够大,使得他能捕获更多需要1到主存去的访问,从而降低实际失效开销19.采用容量小且结构简单的Cache有什么好处?1)可以有效提高Cache的访问速度,因为硬件越简单速度就越快,小容量Cache可以实现快速标识检测,对减少命中时间有益2)Cache足够小,可以与处理权做在同一芯片上,以避免因芯片外访问而增加时间开销3)保持Cache简单结构可采用直接映像Cache,直接映像Cache的主要优点就是可以让标识检测和数据传送重叠进行,这样可以有效减少命中时间20.“虚拟索引+物理标识”Cache的基本思想是什么?答:直接用虚地址中的页内位移(页内位移在虚拟地址的转换中保持不变),作为访问Cache 的索引,但标识确实物理地址,Cpu发出访存请求后,在进行虚地址转换的同时,可并行进行标识的读取,在完成地址变换后,再把得到的物理地址和标识进行比较21.在分布式存储结构的机器中,将存储器分布到各节点有什么好处?1)如果大多数的访问是针对本结点的局部存储器,则可降低对存储器和互连网络的带宽要求2)对局部存储器的访问延迟低,分布式存储器结构的主要缺点就是处理器之间的通信较为复杂,且各处理器之间访问延迟大22.在分布式存储器结构的机器中,目前有哪两种存储地址空间的组织方案?1)物理上分离的多个存储器作为一个逻辑上共享的存储空间进行编址2)整个地址空间由多个独立的地址空间构成,他们在逻辑上也是独立的,远程的处理器不能对其直接寻找23.在分布式存储器结构的机器中,对应于两种地址空间的组织方案,分别有哪两种通信机制?它们是怎么实现的?1)共享地址空间的机器:理由load和store中的地址隐含的进行数据通信2)多个地址空间的机器:根据简单的网络协议,通过传递消息来请求某些服务或传输数据,从而完成通信24.实现Cache一致性协议时,有哪两种跟踪共享数据状态的技术?1)目录协议:物理存储器中共享数据库的状态及其相关消息被保存在一个叫做目录的地方2)监听协议:每个Cache除了包含物理存储器中块的数据副本以外,也保存着共享状态信息,Cache通常连接在共享存储器的总线上,各个Cache控制器通过监听总线来判断是否由总线上请求的数据块25.目录协议中,Cache块有哪三种状态1)共享:在一个或多个处理器上有这个块的副本,且主存中的值是最新的(所有Cache均相同)2)未缓冲:所有处理器的Cache都没有此块的副本3)专有:仅有一个处理器上有该块的副本,且已对此块进行了写操作,而主存的副本仍是旧的。
计算机组成原理名词解释和简答
第一章名词解释:1.中央处理器:主要由运算器和控制器组成。
控制部件,运算部件,存储部件相互协调,共同完成对指令的执行。
2.ALU:对数据进行算术和逻辑运算处理的部件。
3.数据通路:由操作元件和存储元件通过总线或分散方式连接而成的进行数据存储,处理和传送的路径。
4.控制器:对指令进行译码,产生各种操作控制信号,规定各个部件在何时做什么动作来控制数据的流动。
5.主存:存放指令和数据,并能由中央处理器(CPU)直接随机存取。
6.ISA:指令集体系结构:计算机硬件与系统软件之间的接口。
指令系统是核心部分,还包括数据类型,数据格式的定义,寄存器设计,I/O空间编址,数据传输方式,中断结构等。
7•响应时间:作业从开始提交到完成的时间,包括CPU执行时间,等待I/O 的时间,系统运行其他用户程序的时间,以及操作系统运行时间。
8. CPU执行时间:CPU真正用于程序执行的时间。
包括用户CPU时间(执行用户程序代码的时间)和系统CPU时间(为了执行用户代码而需要CPU 运行操作系统的时间)简答题:1.冯诺依曼计算机由那几部分组成,主要思想:①计算机应由运算器、控制器、存储器、输入设备和输出设备五个基本部件组成。
②各基本部件的功能是:存储器不仅能存放数据,而且也能存放指令,形式上两者没有区别,但计算机应能区分数据还是指令;控制器应能自动执行指令;运算器应能进行加/减/乘/除四种基本算术运算,并且也能进行一些逻辑运算和附加运算;操作人员可以通过输入设备、输出设备和主机进行通信。
③采用'‘存储程序"工作方式。
2.从源程序到可执行程序的过程:第二章名词解释:1.定点数:计算机中小数点固定在最左(或右)边的数2.汉字输入码:汉字用相应按键的组合进行编码表示3.汉字内码:计算机内部进行汉字存储,查找,传输和处理而采用的存储方式,两个字节表示一个内码4.大端方式:数据字的最低有效字节存放在大地址单元中5.边界对齐:要求数据的地址是相应的边界地址。
计算机体系结构与基础知识
计算机体系结构与基础知识计算机体系结构是计算机科学领域中的一个重要概念,它涵盖了计算机硬件和软件之间的关系,以及计算机如何组织、执行和管理数据。
在现代社会中,计算机已经成为我们生活和工作中不可或缺的一部分。
了解计算机体系结构和基础知识对于我们有效地使用计算机和解决计算机相关问题至关重要。
一、计算机体系结构概述计算机体系结构是指计算机硬件和软件之间的组织结构和相互关系。
它由几个主要组成部分组成,包括中央处理器(CPU)、内存、输入设备和输出设备等。
1.中央处理器(CPU)中央处理器是计算机的核心部件,负责执行计算机指令和控制数据的流动。
它包括算术逻辑单元(ALU)和控制单元。
2.内存内存是计算机用于存储数据和程序的地方。
它分为主存和辅助存储器,主存是CPU可以直接访问的部分,而辅助存储器则用于长期存储和备份数据。
3.输入设备和输出设备输入设备用于将外部数据输入到计算机中,例如键盘、鼠标和扫描仪等;输出设备用于将计算机处理结果呈现给用户,例如显示器、打印机和音响等。
二、计算机组成原理计算机组成原理是计算机体系结构的基础,包括计算机硬件和软件之间的相互作用以及计算机指令的执行过程等。
1.指令集架构指令集架构定义了计算机的指令集和寄存器等硬件组件。
常见的指令集架构有CISC(复杂指令集计算机)和RISC(精简指令集计算机)等。
2.数据通路和控制单元数据通路用于数据在计算机内部的传输,包括数据寄存器、数据总线和控制总线等。
控制单元则控制这些数据路径和指令执行的顺序和时序。
3.存储器结构存储器结构包括主存和辅助存储器,主存采用地址访问方式,辅助存储器则采用数据块存取方式。
存储器的组织和层次结构不同,对计算机系统的性能和功耗有重要影响。
三、计算机体系结构分类计算机体系结构可以根据硬件组成、指令集架构和并行性等因素进行分类。
1.冯·诺依曼体系结构冯·诺依曼体系结构是计算机体系结构的基础模型,它采用存储程序的方式,程序和数据存储在同一内存中。
计算机体系结构详解
计算机体系结构详解计算机体系结构是指计算机硬件和软件之间的关系以及它们在计算机体系中的组织方式。
在计算机科学领域中,计算机体系结构被认为是计算机科学的核心概念之一。
本文将详细介绍计算机体系结构的各个方面,包括其定义、发展历程、基本原理、主要类型和应用。
一、定义计算机体系结构是一种用于描述计算机硬件和软件之间关系的概念模型。
它描述了计算机内部各个组件、子系统之间的连接方式、数据流动和控制方式等。
计算机体系结构不仅包括计算机的物理结构,还包括计算机的逻辑结构和操作方式。
二、发展历程计算机体系结构的概念最早出现在20世纪40年代末的冯·诺依曼体系结构中。
随着计算机科学的发展,计算机体系结构逐渐演变出多种类型,包括冯·诺依曼体系结构、哈佛体系结构、超标量体系结构、多核体系结构等。
三、基本原理计算机体系结构的基本原理包括指令集架构、数据表示和处理、存储器层次结构、处理器组织和控制方式等。
指令集架构定义了计算机的指令集和执行方式,数据表示和处理涉及数据的内部表示以及算术和逻辑运算的执行方式,存储器层次结构描述了计算机内存的组织和访问方式,处理器组织和控制方式描述了计算机处理器的内部结构和运行方式。
四、主要类型根据计算机体系结构的组织方式和特点,常见的计算机体系结构类型包括冯·诺依曼体系结构、哈佛体系结构、超标量体系结构、多核体系结构等。
冯·诺依曼体系结构是最早的计算机体系结构之一,它的特点是将程序指令和数据存储在同一个存储器中,并且以顺序执行方式执行指令。
哈佛体系结构则将程序指令和数据存储在不同的存储器中,以提高指令和数据的并行处理能力。
超标量体系结构可以同时执行多条指令,提高计算机的运行效率。
多核体系结构是指将多个处理器核心集成在一起,以实现多任务并行处理。
五、应用计算机体系结构的应用广泛涉及到计算机硬件和软件的设计、开发和优化。
在计算机硬件设计领域,计算机体系结构的选择直接影响计算机的性能和能耗。
计算机系统结构 总复习
∑ 而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算: AiBi i =1
① 画出时空图;(9 分) ② 计算实际的吞吐率、加速比和效率。(6 分) 15. 静态多功能流水线由 6 个功能段组成,如图 E_3 所示。其中,s1、s4、s5、s6 组
成乘法流水线,s1、s2、s3、s6 组成加法流水线,各个功能段时间均为△t,假设 该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以 最快的方式用该流水计算:∏(Ai+Bi)(其中 i=1..4,∏为连乘符号) ① 画出时空图;(9 分) ② 计算实际的吞吐率、加速比和效率。(6 分) 16. (20 分)设指令流水线由取指令、分析指令和执行指令 3 个部件构成,每个部件 经过的时间为△t,连续流入 12 条指令。分别画出标量流水处理机以及 ILP 均为 4 的超标量处理机、超长指令字处理机、超流水处理机的时空图,并分别计算它们 相对于标量流水处理机的加速比。 17. (15 分)给定以下的假设,试计算直接映象 Cache 和两路组相联 Cache 的平均访 问时间以及 CPU 时间。 ① 理想 Cache(命中率为 100%)情况下的 CPI 为 2.0,时钟周期为 2ns,平均每条指 令访存 1.2 次。 ② 两种 Cache 容量均为 64KB,块大小都是 32 字节。 ③ 组相联 Cache 中的多路选择器使 CPU 的时钟周期增加了 10%。 ④ 这两种 Cache 的失效开销都是 80 ns。 ⑤ 命中时间为 1 个时钟周期。 ⑥ 64 KB 直接映象 Cache 的失效率为 1.4%,64 KB 两路组相联 Cache 的失效率为 1.0%。
① 画出处理过程的时空图。(9 分) ② 计算其吞吐率、加速比和效率。(6 分) 12. 有一条动态多功能流水线由 5 段组成(如图 E_2 所示),加法用 1、3、4、5 段,
计算机系统结构名词解释
名词解释1、透明答:客观存在的事物或属性从某个角度看不到,称对它透明。
2、CISC答:复杂指令系统计算机,这种计算机增强了原有指令的功能,设置了更为复杂的新指令取代原先由软件子程序完成的功能,实现了软件功能的硬化,但指令系统日益庞大和复杂。
3、LRU算法答:近期最少使用算法。
选择近期最少访问的页作为被替换的页。
4、地址变换答:地址变换是每次访问Cache时怎样将主存地址变换成Cache地址。
5、主存空间数相关答:是指相邻的两条指令之间出现对主存同一单元要求先写而后读的关联。
6、并行性答:同一时刻或同一时间间隔内完成两种以上性质相同或不相同的工作特性称为并行性。
7、RISC答:精简指令系统计算机,这种计算机通过减少指令种数和简化指令功能来降低硬件设计的复杂度,提高指令的执行速度。
8、存储体系答:存储体系是指在构成存储系统的几种不同的存储器之间,配上辅助软硬件或辅助硬件,使之从应用程序员的角度看,它们在逻辑上是一个整体。
9、地址映像答:地址映像就是将每个主存块按什么规则装入Cache中。
10、流水线的速度瓶颈答:流水线中经过时间最大的功能段就是流水线中的速度瓶颈。
11、计算机系统结构答:计算机系统结构也叫计算机体系结构,指的是传统机器级的系统结构。
12、非专用总线答:非专用总线是指可以被多种功能或多个部件分时共享的总线。
13、页面失效答:要访问的虚页不在实际主存中时,就会发生页面失效。
14、一次重叠答:是指将指令的解释分为“分析”和“执行”两个阶段,任何时刻都只是“执行K”与“分析K+1”在时间上的重叠,让指令分析部件和指令执行部件同时在处理相邻的两条指令。
15、全局性相关答:指的是已进入流水线的转移指令和其后续指令之间的相关。
16、向后兼容答:系列机软件的向后兼容指的是按某个时期投入市场的机器上编写的软件,不加修改就能运行于在它之后投入市场的机器上。
17、高级语言机器答:高级语言机器是不需要编译即可运行高级语言程序的计算机。
体系结构名词解释
学习好资料欢迎下载1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机系统结构名词解释汇总 八
计算机系统结构名词解释汇总八1.计算机体系结构:计算机体系结构包括指令集结构、计算机组成和计算机实现三个方面的内容。
2.透明性:在计算机技术中,对这种本来是存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性(transparency)。
3.程序访问的局部性原理:程序总是倾向于访问最近刚访问过的信息,或和当前所访问的信息相近的信息,程序对信息的这一访问特性就称之为程序访问的局部性原理。
4.RISC:精简指令集计算机。
5.CPI——指令时钟数(Cycles per Instruction)。
6.Amdahl定律——加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中的所占的重要性。
7.系列机:在一个厂家内生产的具有相同的指令集结构,但具有不同组成和实现的一系列不同型号的机器。
8.软件兼容:同一个软件可以不加修改地运行于体系结构相同的各档机器,而且它们所获得的结果一样,差别只在于有不同的运行时间。
9.基准程序:选择一组各个方面有代表性的测试程序,组成的一个通用测试程序集合,用以测试计算机系统的性能。
10.合成测试程序:首先对大量的应用程序中的操作进行统计,得到各种操作的比例,再按照这个比例人为制造出的测试程序。
11.Benchmarks:测试程序包,选择一组各个方面有代表性的测试程序,组成的一个通用测试程序集合。
12.核心程序:从真实程序提取出来的用于评价计算机性能的小的关键部分。
13.通用寄存器型机器:指令集结构中存储操作数的存储单元为通用寄存器的机器,称之为通用寄存器型机器。
14.Load/Store型指令集结构:在指令集结构中,除了Load/Store 指令访问存储器之外,其它所有指令的操作均是在寄存器之间进行,这种指令集结构称之为Load/Store型指令集结构。
15.虚拟机器:(virtual machine),由软件实现的机器。
16.操作系统虚拟机:直接管理传统机器中软硬件资源的机器抽象,提供了传统机器所没有的某些基本操作和数据结构,如文件系统、虚拟存储系统、多道程序系统和多线程管理等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
集中式共享存储器结构(centralized shared memory architecture):这类多处理机在目前至多有几十个处理器,可通过大容量的cache和总线互连使各处理器共享一个单独的集中式存储器。
物理上分离的多个存储器可作为一个逻辑上共享的存储空间进行编址,每个处理器可以访问任何一个其他的局部存储器。
这类机器的结构被称为分布式共享存储器(DSM,distributed shared memory)或可缩放共享存储器(SSM,scalable shared memory)体系结构。
整个地址空间由多个独立的地址空间构成,它们在逻辑上也是独立的,远程的处理器不能对其直接寻址。
在这种机器的不同处理器中,相同的物理地址指向不同存储器的不同单元,每一个处理器、存储器模块实际上是一个单独的计算机,因而这种机器也称为多计算机(multicomputers)。
通讯延迟:发送开销+跨越时间+传输延迟+接收开销。
迁移是把远程的共享数据项的拷贝放在一个本处理器局部的cache中使用,从而可降低对远程共享数据的访问延迟。
复制是把多个处理器需要同时读取的共享数据项的拷贝放在各自局部cache中使用,复制不仅降低了访存的延迟,也减少了访问共享数据时的产生的冲突。
目录(directory):物理存储器中用来保存共享数据块的状态及相关信息的数据结构。
监听(snooping):每个cache除了包含物理存储器中块的数据拷贝外,也保存着各个块的共享状态信息。
Cache通常连在共享存储器的总线上,各个cache控制器通过监听总线来判断它们是否有总线请求的数据块。
在一个处理器写某个数据项之前保证它对此数据项有唯一的访问权,对应这种方法的协议称为写作废(write invalidate)协议。
cache块拥有唯一的拷贝的处理器通常称为这个cache 块的拥有者(ower)。
处理器的写操作使其成为对应cache块的拥有者。
原子性(atomic),即操作运行过程中不能被打断,例如将写失效的检测、申请总线连接、接收响应作为一个单独的原子操作。
基于目录的相关性协议称为全映射(full map)。
原子交换(atomic change):将一个存储单元的值和一个寄存器的值进行交换。
建立一个锁,锁值为0表示开锁,为1表示上锁。
旋转锁是指处理器环绕一个锁不停地旋转而试图获得该锁。
栅栏(barrier)同步:是一个同步操作,它强制所有到达该栅栏的进程进行等待,直到全部的进程到达栅栏,然后释放全部的进程,从而形成同步。
组合树是多个请求在局部结合起来形成树的一种分级结构,它降低冲突的原因是将大冲突化解成为并行的多个小冲突。
排队记录等待的进程,当锁释放时送出一个已确定的等待进程,这种机制称为排队锁(queuing lock)。
一个处理器对变量的写和另一个处理器对该变量的访问(读或写)由一对同步操作分开,其中一个在写操作后执行,另一个在别的处理机访问之前执行,则称数据访问有序。
无同步操作排序变量可能提前被刷新,这种情况称为数据竞争(data race),从而对于同步的程序可称之为无数据竞争(data-race-free)。
称与解锁相对应的同步操作为释放(release)与加锁相对应的则称为获取(acquire)。
防护(fence)是计算过程中的固定点,用来保证无读或写穿过防护点。
预取能返回最新数据值,并且保证对数据实际的存储器访问返回的是最新的数据项,则被称为非绑定的(nonbinding)。
互连网络是将集中式系统或分布式系统中的结点连接起来所构成的网络,这些结点可能是处理器、存储模块或其它设备,它们通过互连网络进行信息交换。
静态网络由点和点直接相连而成,这种连接方式在程序执行过程中不会改变。
动态网络是用开关通道实现的,它可动态地改变结构,使其与用户程序中通信要求匹配。
与结点相连接的边的数目称为结点度(node degree)。
链路或通路是指网络中连接两个结点并传送数字信号的通路。
在单向通道的情况下,进入结点的通道数叫做入度(in degree),而从结点出来的通道数则称为出度(out degree),结点度是这两点之和。
结点度应尽可能地小并保持恒定。
网络中任意两个结点间最短路径长度的最大值称为网络直径。
网络直径应当尽可能地小。
在将某一网络切成相等两半的各种切法中,沿切口的最小通道边数称为通道等分宽度(channel bisection width)。
对于一个网络,如果从其中的任何一个结点看,拓朴结构都是一样的话,则称此网络为对称网络。
计算/通讯比:是衡量并行程序性能的尺度,是应用程序中相对于每次数据通信需要进行的计算。
路由(routing):在网络通信中对路径的选择与指定。
置换(permutation):指对象的重新排序。
虫蚀(wormhole):把包进一步分成小片,硬件路由器有片缓冲区,同一个包中所有片象不可分离的同伴一样,以流水方式顺序传送。
只有片头包含目标地址,所有片必须跟随片头。
存储转发:是指每个结点有一个包缓冲区,包先进入缓冲区,当所需要的输出通道和接收结点的包缓冲区可用时,就将它传输给下一结点。
维序:按多维网络维序的特定顺序来选择后续通道。
由于唯一性,可能产生死锁。
虚拟自适应:将一个物理通道分成几个虚拟的通道,根据后续各虚拟通道的忙闲情况自适应选择后续通道。
线性阵列(linear array):是一种一维的线性网络,其中n个结点用n-1个链路连成一行。
如果多级网络通过重新安排连接方式可以建立所有可能的输入输出之间的连接,则称之为非阻塞网络(nonblocking network)。
粗粒度:每台处理机所执行的程序为20秒以上,共享主存。
中粒度:每台处理机所执行的程序为10毫秒以上,消息传递。
细粒度:并行性高,在几个微秒量级,但通信开销大。
指令级并行(instruction level parallelism ILP):指令序列中存在的潜在并行性。
循环级并行:循环体指令之间的并行性。
指令调度:通过改变指令在程序中的位置,将相关指令之间的距离加入到不小于指令执行延迟的时钟数,这样就可以将相关指令转化为实际上无关指令。
循环展开:通过多次复制循环体并改变结束条件来相对增加有效操作时间。
名相关:如果两条指令使用相同的名,但是它们之间并没有数据流。
包括反相关和输出相关。
指令使用的寄存器或存储器称为名。
反相关:指令i先执行,指令j写的名是指令i读的名。
W AR输出相关:指令j与指令i写的名相同。
W AW重命名技术:通过改变指令中操作数的名来消除名相关。
控制相关:是指分支指令引起的相关。
动态调度:通过硬件重新安排指令的执行顺序,来调整相关指令实际执行的关系,减少处理器的空转。
记分牌(scoreboarding):指令运行所需的资源满足并且没有数据相关,允许指令乱序执行,并同时记录指令运行状态的技术。
寄存器重命名:一条指令流出时,存放操作数的寄存器被重命名为对应于该存储器保留站的名称(编号)的过程。
动态分支预测:一种给予历史记录的分支预测,它解决记录一个分支指令的历史和决定预测的分支的一个问题的两个方面。
分支目标缓冲(PTB):将分支成功的分支指令的地址和它的分支目标地址都放到一个缓冲中保存起来,缓冲区分支指令的地址作为标示。
前瞻(speculation)执行:允许在处理器还未判断指令是否能执行之前就提前执行,以克服控制相关。
保留站:用于保存等待流出和正在流出的指令所需的操作数。
再定序缓冲:在前瞻执行的指令之间传送结果的一套额外的硬件缓冲,保存指令执行完毕到指令得到确认之间的所有指令及结果。
超标量(superscalar):每个时钟流出的指令不定。
超流水(super pipeling):是指每个功能部件进一步流水化,使得一个功能部件在一拍中可以处理多条指令。
超长指令字VLIW(very long instruction word):每个时钟周期流出的指令数是固定的,它们构成一条长指令,或者是一个混合的指令包。
DLX标量:每个时钟流出两条指令。
The compiler technique to create sdditional instruction-level parallelism for a loop is simply called loop unrolling.The hardware technique to create additional instruction-level parallism for a loop is simply called register renaming.Reservation stations: buffers hold instructions and operands that have been issued and are awaiting execution at a functional unit.A recurrence is when a variable is defined based on the value of that variable in an earlier iteration, often the one immediately preceeding, as in the above fragment.As an example, a simple and sufficient test for the absence of a dependence is the greatest common divisor (GCD) test.软件流水:是一项重构造相互重叠进行的软件流水性代码的循环,使其指令从原始的循环中的不同重复中选取的技术。
路径调度是用一项通过不同于循环分支的条件分支发觉并行的技术,扩展可循环展开。
路径:试图去发觉一个可能的其操作将被放入一个小数目的指令集基本程序块的顺序称为路径(trace),须子此路径称为路径选择(trace selection)。
路径精简:试图去精简路径到一个小数目的广泛的指令集的过程(trace compaction)a set of status, called poison bits, are attached to the result registers written by speculated instructions when the instructions cause exceptions.An alternative is to move instructions past branches, flagging them as speculative, and providing renaming and buffering in the hardware, much as Tomasulo’s algorithm does. This concept has been called boosting(推进).Adding this commit phase to the instruction execution sequence requires some changes to the sequence as well as an additional hardware buffer, called the reorder buffer, to hold the results of instructions that have finished execution but have not committed.3.1 术语1.流水线:将一个重复的时序过程,分解为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其他子过程同时执行。