计算机体系结构复习资料

合集下载

计算机体系结构复习资料

计算机体系结构复习资料

第一章计算机体系机构的基本概念1.计算机系统结构包括数据表示、机器工作状态、信息保护,不包括主存速度。

计算机系统结构应该考虑的内容包括主存容量和编址方式,而主存采用MOS还是TTL器件、主存是采用多体交叉还是单体、主存频宽的确定等都不是计算机系统结构应该考虑的内容。

存储器采用单体单字,还是多体交叉并行存取,对系统结构设计是透明的。

又如在系列机内推出新机器,不能更改的是原有指令的寻址方式和操作码,而存储芯片的集成度、系统总线的组成、数据通路宽度是可以更改的。

系列机是指在一个厂家内生产的具有相同的体系结构,但具有不同的组成和实现的一系列不同型号的机器。

2. 计算机系统中提高并行性的技术途径有时间重叠、资源重复和资源共享三种。

在高性能单处理机的发展中,它的实现基础是流水线。

3. 软件和硬件在逻辑功能上是等效的,软件的功能可用硬件或固件完成,但性能、实现的难易程度不同。

4. Amdahl 定律:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

5. 计算机组成是计算机系统结构的逻辑实现,计算机实现是计算机组成的物理实现。

6. 计算机系统多级层次结构由高到低,依次是应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言级和微程序机器级。

7. 某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的20倍,而系统运行某一程序的整体性能提高到原来的5倍,试计算该程序中浮点操作所占的比例。

系统加速比=1 / (1-可改进比例+可改进比例/部件加速比)5 = 1 / (1-可改进比例+可改进比例/ 20)可得可改进比例=84.2%8. 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。

具体数据、如下所示。

(1)改进后,各类操作的加速比分别是多少?(2)各类操作单独改进后,程序获得的加速比分别是多少?(3)4类操作均改进后,整个程序的加速比是多少?多部件改进后的系统加速比=1 / (1-(11.1%+33.3%+38.9%+16.7%)+(11.1%/2+33.3%/1.33+38.9%/3.33+16.7%/4))=2.169. 将计算机系统中某一功能的处理速度加快20倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少。

计算机体系结构期末复习资料

计算机体系结构期末复习资料

计算机体系结构期末复习资料第一章1、计算机体系结构:计算机体系结构是程序员所看到的计算机属性,即概念性结构与功能特性。

(Amdahl提出的系统结构实际上指传统机器语言级程序员所能看到的计算机属性。

)2、透明性:原来是存在的事物或属性,但从某种角度看又仿佛不存在的概念称为透明性(transparency),在一个计算机系统中,低层机器的属性对高层机器的程序员往往是透明的,如传统机器级的概念性结构和功能特性,对高级语言程序员来说是透明的。

3、计算机系统结构、计算机组成、计算机实现之间的关系:计算机系统结构指的是计算机系统的软、硬件的界面,即机器语言程序员所看到的传统机器级所具有的属性。

计算机组成:指的是计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

它着眼于物理机器级内各事件的排序方式与控制方式、各部件的功能以及各部件之间的关系。

计算机的实现:指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

它着眼于器件技术和微组装技术,其中器件技术在实现技术中起主导作用。

4、系列机的软件兼容方式:软件兼容有(向上兼容)和(向下兼容)之分,又有(向前兼容)和(向后兼容)之分。

系列机软件必须保证(向后兼容),力争(向上兼容)。

兼容机:不同制造商生产的具有相同系统结构的计算机。

系列机:在一个厂家内生产的具有相同的体系结构,但具有不同组织和实现的一系列不同型号的机器。

5. 软件兼容:同一个软件能够不加修改第运行于体系结构相同的各档及其,而且它们所获得的结果一样,差别只在于运行时间不同。

6、并行性的概念:指计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。

只要在时间上相互重叠,就存在并行性。

她是同时性和并发性两种含义。

同时性:两个或两个以上的事件在同一时刻发生。

并发性:两个或两个以上的事件在同一时间间隔内发生。

计算机体系结构复习要点

计算机体系结构复习要点

第一章计算机体系结构的基本概念1.计算机系统的层次结构L6应用语言虚拟机L5高级语言虚拟机L4汇编语言虚拟机L3操作系统虚拟机L2机器语言L1微程序机器级:L1~L3级用解释的方法实现,L4~L6级用翻译的方法实现。

翻译和解释是语言实现的两种基本技术。

共同点:都是以执行一串L级指令来实现一跳L+1级指令;不同点:翻译技术是先把L+1级程序全部转换成L 级程序后,再去执行新产生的L级程序,在执行过程中L+1级程序不再被访问;而解释技术则是每当一条L+1条指令被译码后,就直接去执行一串等效的L级指令,然后再去取下一条L+1级的指令,依次重复进行。

一般来说,解释执行比编译后再去执行所花的时间多,但占用的存储空间较少。

2.计算机系统结构的定义计算机系统结构是程序员看到的计算机属性,即概念性结构与功能特性。

计算机设计的3个方面:指令集结构、组成、硬件。

计算机系统结构概念的实质是:确定计算机系统中软硬件的界面,界面之上是软解实现的功能,界面之下是硬件实现的功能。

3.计算机组成和计算机实现计算机系统结构指的是计算机系统的软硬件的界面,即机器语言程序员所看到的传统机器级所具有的属性。

计算机组成指的是计算机系统结构的逻辑实现,包括物理机器级中的数据流和控制流的组成以及逻辑设计等。

它着眼于物理机器级内各事件的排序方式与控制方式、各部件的功能以及各部件之间的联系。

计算机实现指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

它着眼于器间技术和微组装技术,其中器件技术在现实技术中起主导作用。

系列机是指由同一厂商生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的机器。

4.定量分析技术(计算)Amdahl定律、CPU性能公式(简答)程序的局部性原理:它是指程序执行时所访问的存储器地址分布不是随机的,而是相对地簇聚。

(局部性包括时间局部性和空间局部性。

计算机体系结构必考知识点

计算机体系结构必考知识点

计算机体系结构必考知识点一、知识概述《计算机体系结构必考知识点》①基本定义:计算机体系结构呢,简单说就是计算机的各个组成部分,像处理器、内存、输入输出设备等,它们之间是怎么连接的,还有各自的功能怎么协同工作。

就好比一个足球队,每个球员(硬件组件)都有自己的位置(功能),教练(操作系统等软件)怎么安排他们配合踢球(协同工作),这就是大致的概念。

②重要程度:在计算机这个学科里,这可太重要了。

要是不懂体系结构,就好比你盖房子不知道怎么搭框架,那接下来的装修(软件开发之类的)就无从下手。

计算机系统的性能、功能等都和它有很大关系。

③前置知识:得有基本的数字电路知识,像什么是逻辑门之类的。

还有对计算机各个硬件部件有个简单了解,就像你得知道有CPU这个东西,它大致是干啥的。

如果之前学过计算机组成原理那就更好了,就像你是个盖房子的小工,盖了几次小房子(了解简单的硬件组合),再来盖大楼(学习体系结构)就容易些。

④应用价值:实际应用可多了。

比如说设计新的计算机芯片,要考虑体系结构。

像手机厂商想让手机运行得更快,还不那么耗电,那就得优化手机芯片的体系结构。

再比如说云计算中心设计大型服务器集群,也得按照合理的体系结构来,这样才能高效处理海量的数据。

二、知识体系①知识图谱:在计算机学科的大地图里,计算机体系结构是重要的一块。

它连接着计算机硬件底层,向上又影响着操作系统、软件应用的开发。

就好比它是城市里的交通规划(对计算机里的数据等流动起规划作用),其他的建筑物(软件等)得按照这个交通规划来建设。

②关联知识:和计算机组成原理关联紧密,组成原理就像是讲每个部件的详细构造,体系结构就是把这些部件组合起来看。

和操作系统也有很大关系,操作系统的运行依赖于计算机体系结构提供的环境。

就好像演员(操作系统)得在舞台(体系结构)上表演。

③重难点分析:掌握难度在于概念比较抽象,像多级存储体系结构,什么缓存、主存、外存的关系不好理解。

关键点在于要理解各个部件的交互原理。

计算机体系结构期末考试知识点与答案

计算机体系结构期末考试知识点与答案

计算机体系结构期末考试知识点与答案体系结构复习重点.doc1.冯.诺依蔓计算机的特点答:冯·若依曼计算机的主要特点如下:存储程序方式。

指令和数据都是以字的方式存放在同一个存储器中,没有区别,由机器状态来确定从存储器读出的字是指令或数据。

指令串行执行,并由控制器集中加以控制、单元定长的一维线性空间的存储器使用低级机器语言,数据以二进制形式表示。

单处理机结构,以运算器作为中心。

其实,他最大的特点就是简单易操作。

2. T(C)=<K*K',D*D',W*W'>所描述的三个层次(8页)答:3个层次为控制器、算术逻辑部件、基本逻辑部件3. 计算机系统结构的分类(5页)4. 计算机系统中的数据表示(38页)5. 指令系统设计的原则答:指令系统的设计原则是,应特别注意如何支持编译系统能高效、简易地将源程序翻译成目标代码。

首先是正交性:又称分离原则或互不相干原则。

即指令中各个有不同含义的字段之间,在编码时应互相独立、互不相关。

规整性:对相似的操作数做出相同的规定。

可扩充性:要保留一定余量的操作码空间,为以后的扩展所用。

对称性:为了使编译能更加方便,通常希望操作具有对称性。

6. 流水操作中的相关答:流水操作过程中会出现一下的3个相关:资源或结构相关、数据相关、和控制相关。

资源相关是指当有多条指令进入流水线后在同一机器周期内争用同一功能部件所发生的冲突。

数据相关:这是由于流水线中的各条指令的重叠操作使得原来对操作数的访问顺序发生了变化,从而导致了数据相关的冲突。

控制相关主要是转移指令引起的,比起数据相关来,他会使流水线丧失更多的性能。

7. 向量机中对向量的各种运算可以采用的加工方式(149页)答:向量机中对向量的各种运算可以采用不同的加工方式,但比较有效的加工方式应是尽量避免出现数据相关和尽量减少对向量功能的转换。

一种普通加工方式称为横向加工,它是按向量顺序计算的。

另外一种加工方式称为垂直加工,即它是先纵向加工所有B和C向量中元素对的相加操作。

计算机体系结构复习题

计算机体系结构复习题
i i i 1
4
(1) 选择适合于流水线工作的算法应先计算A1+B1、
A2+B2、A3+B3和A4+B4; 再计算(A1+B1) ×(A2×B2) (A3+B3) ×(A4+B4);
然后求总的结果。
(2) 画出时空图 (3) 计算性能
A 段 5
B
C
D
C× D A× B
A× B× C× D
A = A 1+ B 1 4 3 2 1 输 入 0 1 2 3 4 5 6 7 A B 8 C D 9 10 11 1 2 A× B C× D 13 14 时间 B = A 2+ B 2 C = A 3+ B 3 D = A 4+ B 4
计算机组成是计算机系统结构的逻辑实现。 计算机实现是计算机组成的物理实现。一种 体系结构可以有多种组成。一种组成可以有 多种实现。







4、计算机系统设计的量化设计原则有哪些?说 出它们的含义? 答:加速经常性事件的原则:对经常发生的情 况采用优化方法的原则进行选择,以得到更多 的总体上的改进。 Amdahl定律:加快某部件执行速度所能获得的 系统性能加速比,受限于该部件的执行时间占 系统中总执行时间的百分比。 CPU性能公式:执行一个程序所需的CPU时间, CPU时间 = 执行程序所需的时钟周期数×时钟 周期时间 程序的局部性原理:程序执行时所访问的80%是 程序代码的20%的部分。
6
7
8
9 A B
1 0 11 1 2 1 3 1 4 1 5 1 6 1 7 1 8 C D A× B C× D
时间
输 入
A1 A2 A3 A4 B1 B2 B3 B4

计算机体系结构复习资料.doc

计算机体系结构复习资料.doc

第一章计算机体系结构的基本概念1.层次结构——计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。

2.体系结构——程序员所看到的计算机的属性,即概念性结构与功能特性。

3.透明性——在计算机技术中,对木来存在的事物或属性,从某一角度来看乂好像不存在的概念称为透明性。

4.系列机——在一个厂家生产的具冇相同的体系结构,但具有不同的组成和实现的一系列不同型号的机器。

5.软件兼容——同一个软件可以不加修改地运行于体系结构相同的各档机器上,1WK 它们所获得的结果一样,差别只在于运行的吋间不同。

6.兼容机——不同厂家牛产的、具有相同体系结构的计算机。

7.计算机组成——计算机体系结构的逻辑实现。

8.计算机实现一一计算机组成的物理实现。

9.存储程序计算机(冯•诺依曼结构)——采用存储程序原理,将程序和数据存放在同一存储器中。

指令在存储器中按其执行顺序存储,由指令计数器指切每条指令所在的单元地址。

10.并行性——在同一时刻或同一时间间隔内完成两种或两种以上性质相同或不同的T 作。

11.响应时间——从事件开始到结束之间的时间,也称执行时间。

12.测试程序——用于测试计算机性能的程序,可分为四类:真实程序、核心程序、小测试程序、合成测试程序。

13.测试程序组件一一选择一个各个方面有代表性的测试程序,组成一个通用的测试程序集合。

这个通用的测试程序集合称为测试程序组件。

14.大概率事件优先——此原则是计算机体系结构中最重要和最常用的原则。

对于大概率事件(最常见的事件),赋了它优先的处理权和资源使用权,以获得全局的最优结果。

15. 系统加速比——系统改进前少改进后总执行吋间Z 比。

16. Amdahl 定律一一加快某部件执行速度所获得的系统性能加速比,受限于该部件在系 统中的所占的重要性。

17. 程序的局部性原理一一程序在执行时所访问的地址不是随机的,而是相对簇聚;这 种簇聚包括指令和数据两部分。

18. CPT ---- 扌旨令时钟数(Cycles per Instruction )。

计算机体系结构知识点汇总

计算机体系结构知识点汇总

第一章计算机体系构造的根本概念1.计算机系统构造的经典定义程序员所看到的计算机属性,即概念性构造与功能特性。

〔计算机组成:指计算机系统构造的逻辑实现。

计算机实现:计算机组成的物理实现〕2.计算机系统的多级层次构造:1.虚拟机:应用语言机器->高级语言机器->汇编语言机器->操作系统机器2.物理机:传统机器语言机器->微程序机器3.透明性:在计算机技术中,把这种本来存在的事物或属性,但从*种角度看又好似不存在的概念称为透明性。

4.编译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序5.解释:对于高一级机器上的程序中的每一条语句或指令,都转去执行低一级机器上的一段等效程序。

6.常见的计算机系统构造分类法有两种:Flynn分类法、氏分类法〔按系统并行度〕进展分类。

Flynn分类法把计算机系统的构造分为4类:单指令流单数据流(SISD)单指令流多数据流(SIMD)多指令流单数据流(MISD)多指令流多数据流(MIMD)IS指令流,DS数据流,CS〔控制流〕,CU〔控制部件〕,PU〔处理部件〕,MM,SM〔表示存储器〕7.计算机设计的定量原理:1.大概率事件优先原理〔分配更多资源,到达更高性能〕2.Amdahl定理:加速比:(Fe为可改进比例〔可改进局部的执行时间/总的执行时间〕,Se为部件加速比〔改进前/改进后〕3.程序的局部性原理:时间局部性:程序即将使用的信息很可能是目前使用的信息。

空间局部性:即将用到的信息可能与目前用到的信息在空间上相邻或相近。

4.CPU性能公式:1.时钟周期时间2.CPI:CPI = 执行程序所需的时钟周期数/IC3.IC(程序所执行的指令条数)8.并行性:计算机系统在同一时刻或者同一时间间隔进展多种运算或操作。

同时性:两个或两个以上的事件在同一时刻发生。

并发性:两个或两个以上的事件在同一时间间隔发生。

从处理数据的角度来看,并行性等级从低到高可分为:1.字串位串:每次只对一个字的一位进展处理。

《计算机系统结构》总复习

《计算机系统结构》总复习

主存储器
定义:主存储器是计算机系统中的主要存储器用于存储程序和数据。 组成:由多个存储单元组成每个单元存储一个二进制数。 访问方式:通过地址码直接访问存储单元实现数据的读取和写入。 性能指标:主要包括存储容量、存取时间和可靠性等。
高速缓存
添加 标题
定义:高速缓存是一种用于存储经常访问 数据的硬件设备
功能:输入输出接口的主要功能是传输数据和命令支持各种外部设备的接入和控制。
发展趋势:随着技术的不断发展输入输出接口也在不断演进和改进未来将更加高效、快速和智能化。
输入输出处理机
输入输出处理机是计算机系统中的重要组成部分负责管理计算机的输入输出设备。
输入输出处理机的主要功能是实现输入输出数据的传输和控制支持各种外部设备的操作。
分布式系统概述
定义:分布式系统是由多个相互通信的计算机组成的系统这些计算机在物理上通过网络连接协同完 成共同的任务。
特点:分布式系统具有并行性、可靠性和可扩展性等特点能够提高系统的整体性能和可靠性。
组成:分布式系统由多个节点组成每个节点都有自己的处理器和存储器节点之间通过网络进行通信。
应用:分布式系统广泛应用于各种领域如云计算、大数据处理、物联网等。
计算机系统结构总复习
汇报人:
目录
添加目录标题
存储系统
01
04
计算机系统概述
02
处理器系统
03
输入输出系统
05
并行处理与分布式系 统
06
添加章节标题
计算机系统概述
计算机系统的基本组成
硬件:计算机系 统的物理实体包 括中央处理器、 存储器、输入输
出设备等。
软件:计算机 系统的程序和 数据包括系统 软件和应用软

计算机系统结构 总复习

计算机系统结构 总复习
4
∑ 而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算: AiBi i =1
① 画出时空图;(9 分) ② 计算实际的吞吐率、加速比和效率。(6 分) 15. 静态多功能流水线由 6 个功能段组成,如图 E_3 所示。其中,s1、s4、s5、s6 组
成乘法流水线,s1、s2、s3、s6 组成加法流水线,各个功能段时间均为△t,假设 该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以 最快的方式用该流水计算:∏(Ai+Bi)(其中 i=1..4,∏为连乘符号) ① 画出时空图;(9 分) ② 计算实际的吞吐率、加速比和效率。(6 分) 16. (20 分)设指令流水线由取指令、分析指令和执行指令 3 个部件构成,每个部件 经过的时间为△t,连续流入 12 条指令。分别画出标量流水处理机以及 ILP 均为 4 的超标量处理机、超长指令字处理机、超流水处理机的时空图,并分别计算它们 相对于标量流水处理机的加速比。 17. (15 分)给定以下的假设,试计算直接映象 Cache 和两路组相联 Cache 的平均访 问时间以及 CPU 时间。 ① 理想 Cache(命中率为 100%)情况下的 CPI 为 2.0,时钟周期为 2ns,平均每条指 令访存 1.2 次。 ② 两种 Cache 容量均为 64KB,块大小都是 32 字节。 ③ 组相联 Cache 中的多路选择器使 CPU 的时钟周期增加了 10%。 ④ 这两种 Cache 的失效开销都是 80 ns。 ⑤ 命中时间为 1 个时钟周期。 ⑥ 64 KB 直接映象 Cache 的失效率为 1.4%,64 KB 两路组相联 Cache 的失效率为 1.0%。
① 画出处理过程的时空图。(9 分) ② 计算其吞吐率、加速比和效率。(6 分) 12. 有一条动态多功能流水线由 5 段组成(如图 E_2 所示),加法用 1、3、4、5 段,

计算机体系结构复习资料(汇总版)

计算机体系结构复习资料(汇总版)

第一章计算机系统结构的基础知识1、计算机体系结构:计算机体系结构是程序员所看到的计算机属性,即概念性结构与功能特性。

2、透明性:对本来是存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

在一个计算机系统中,低层机器的属性对高层机器的程序员往往是透明的,如传统机器级的概念性结构和功能特性,对高级语言程序员来说是透明的。

3、计算机系统结构、计算机组成、计算机实现之间的关系:计算机系统结构指的是计算机系统的软、硬件的界面,即机器语言程序员所看到的传统机器级所具有的属性。

计算机组成:指的是计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等.它着眼于物理机器级内各事件的排序方式与控制方式、各部件的功能以及各部件之间的关系。

计算机的实现:指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等.它着眼于器件技术和微组装技术,其中器件技术在实现技术中起主导作用。

4、计算机系统的分类:1)Flynn(单/多指令流单/多数据流四种)2)冯氏分类法:最大并行速度.5、程序的局部性:时间局部性(程序即将用到的信息很可能就是目前正在使用的信息)空间局部性(程序即将用到的信息很可能与目前正在使用的信息在空间上相邻或者邻近)。

6、计算机系统设计原理:由上往下设计、由下往上设计、从中间开始设计。

从中间设计的优点:“中间"指层次结构中的软硬件的交界面,目前一般是在传统机器语言机器级与操作系统机器级之间。

好处:采用这种方法时,首先要进行软硬件功能分配,确定好这个界面。

然后从这个界面开始,软件设计者往上设计操作系统、汇编、编译系统等,硬件设计者往下设计传统机器级、微程序机器级等。

软件和硬件并行设计可以缩短设计周期,设计过程中可以交流协调,是一种交互式的、很好的设计方法。

7、存储程序计算机(冯·诺依曼结构):采用存储程序原理,将程序和数据存放在同一存储器中。

计算机体系结构复习提纲

计算机体系结构复习提纲

1.简述:1)计算机体系结构研究的目的提高处理机运算速度:MIPS =fz * IPCMIPS ——每秒执行的百万条指令fz —8212 —处理机的工作主频(MHz)IPC(Instruction Per Cycle)—8212 —单位时钟周期内执行的指令条数提高IPC:依靠先进系统结构过去,几个或几十个周期完成一条指令现在,一个周期完成几条指令提高fz:缩短门电路延迟,依靠工艺技术进步、流水线技术等依靠先进系统结构,从指令串行执行,到P4的20级流水线2)计算机系统中并行性的层次划分。

①指令内并行②指令级并行③任务(或过程)级并行④作业(或程序)级并行2.简述:1)存储系统性能评价的关键指标大容量;高速度;低价格2)提高存储系统性能的基本途径。

(1)器件技术,缩短访问时间(T↓)(2)多体并行存贮器结构①加宽存贮字长度(W↑)-----超长字存储方案②缩短平均访问周期(Ta↓)---------多模块交叉存储方案(3)多级存贮器层次结构以不同速度、容量的存储器进行层次化组织(Ta↓)即提高容量、带宽,又降低成本,属于高效率技术3.简述实地址Cache在虚拟存储器中的工作过程及其加速作用。

①查TLB,若命中则形成实地址,否则再进行查段表、页表形成实地址②用实地址访问Cache,若命中则完成访问。

否则启动主存进行Cache替换加速作用:①加速虚拟存贮器的访问②加速虚地址到实地址的转换4.简述Cache的三种典型结构及其特点。

组相联结构:1)利用现有的存储器结构和工作方式(采用高速电路)2)利用常规的单元电路模块(比较器、多路选择器MUX等)3)综合应用于Cache的工作方式/访问过程直接相联结构:直接利用行号定位,结构简单易实现,容量大,速度快全相联结构:完全通过标志的相联比较定位确定数据行,地址映像最灵活,每个Cache 行可映像到主存任意行,命中率高5.简述:流水段细分的目的与流水段细分的类型,并举例说明。

计算机系统结构复习汇总

计算机系统结构复习汇总

03
中央处理器
CPU的功能和组成
控制器
负责指令的取指、译码和执行,控制数据在CPU内部的流动。
运算器
执行算术和逻辑运算,包括加法、减法、乘法、除法等。
寄存器组
存储操作数、中间结果和指令地址等信息的临时存储单元。
高速缓存
位于CPU和主存之间的快速存储器,用于提高CPU访问数据的速度。
CPU的设计和实现
计算机系统结构复习汇总
• 计算机系统概述 • 指令系统 • 中央处理器 • 存储系统 • 输入输出系统 • 总线与互连
01
计算机系统概述
计算机系统的组成
01
02
03
硬件系统
包括中央处理器、内存储 器、外存储器、输入设备 和输出设备等,是计算机 系统的物质基础。
软件系统
包括系统软件和应用软件, 是计算机系统的灵魂,负 责管理和控制计算机硬件 及应用程序。
I/O软件层次结构
01
用户层软件
提供用户与I/O设备交互的接口, 如命令解释程序、图形用户界面
等。
03
设备驱动程序
直接与硬件交互的软件模块,负 责接收上层软件的请求并控制I/O
设备的操作。
02
设备独立性软件
实现设备无关性,使得应用程序 无需关心具体设备的细节。
04
中断处理程序
响应中断请求并处理中断事件的 程序,通常与设备驱动程序紧密
位于计算机外部,速度较慢,容量最 大,用于长期保存程序和数据。
主存储器的设计和实现
存储器芯片
主存储器由多个存储器芯 片组成,每个芯片包含一 定数量的存储单元和读写 电路。
存储单元
每个存储单元可以存储一 个字节或多个字节的数据 ,由地址线、数据线和控 制线连接CPU和其他设备 。

计算机组成及结构总复习资料

计算机组成及结构总复习资料

第一章1、主机:、存储器和输入输出接口合起来构成计算机的主机。

2、:中央处理器,使计算机的核心部件,由运算器和控制器构成。

3、:算术逻辑运算单元,执行各种算术运算和逻辑运算。

4、指令:构成计算机软件的基本元素,表示成二进制数编码的操作命令。

5、位:计算机中的一个二进制数据代码(0或1),计算机中数据的最小表示单位。

6、字长:一个数据字中包含的位数,一般为8位,16位,32位或64位等。

7、操作系统:主要的系统软件,控制其它程序的运行,管理系统资源并且为用户提供操作界面。

8、汇编程序:将汇编语言程序翻译成机器语言程序的计算机软件。

9、汇编语言:采用文字方式(助记符)表示的程序设计语言。

10、编译程序:将高级语言程序转换成机器语言程序的计算机软件。

11、解释程序:解释执行高级语言程序的计算机软件,解释并执行源程序的语句。

12、接口:部件之间的连接电路,如输入输出接口是主机与外围设备之间传输数据与控制信息的电路。

13、伪指令:汇编语言程序通常还提供有关该程序装入内存中的位置的信息、表示程序段和数据段开始或结束的信息以及表示程序的开始和结束的信息等,还可以有条件汇编、文件包含、常熟定义等信息。

表示这些信息的汇编指令称为伪指令。

14、虚拟地址:在虚拟存储器中,根据指令生成的地址,又称为逻辑地址。

15、机器语言:是一种用二进制代码标识的能够被计算机硬件直接识别和执行的语言。

16. 运算器:计算机中完成运算功能的部件,由和寄存器构成。

17.外围设备:计算机的输入输出设备,包括输入设备,输出设备和外存储设备。

18.数据:编码形式的各种信息,在计算机中作为程序的操作对象。

19.指令:是一种经过编码的操作命令,它指定需要进行的操作,支配计算机中的信息传递以及主机与输入输出设备之间的信息传递,是构成计算机软件的基本元素。

20. 透明:在计算机中,从某个角度看不到的特性称该特性是透明的。

21.字:数据运算和存储的单位,其位数取决于具体的计算机。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章计算机体系机构的基本概念1.计算机系统结构包括数据表示、机器工作状态、信息保护,不包括主存速度。

计算机系统结构应该考虑的内容包括主存容量和编址方式,而主存采用MOS还是TTL器件、主存是采用多体交叉还是单体、主存频宽的确定等都不是计算机系统结构应该考虑的内容。

存储器采用单体单字,还是多体交叉并行存取,对系统结构设计是透明的。

又如在系列机内推出新机器,不能更改的是原有指令的寻址方式和操作码,而存储芯片的集成度、系统总线的组成、数据通路宽度是可以更改的。

系列机是指在一个厂家内生产的具有相同的体系结构,但具有不同的组成和实现的一系列不同型号的机器。

2. 计算机系统中提高并行性的技术途径有时间重叠、资源重复和资源共享三种。

在高性能单处理机的发展中,它的实现基础是流水线。

3. 软件和硬件在逻辑功能上是等效的,软件的功能可用硬件或固件完成,但性能、实现的难易程度不同。

4. Amdahl 定律:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

5. 计算机组成是计算机系统结构的逻辑实现,计算机实现是计算机组成的物理实现。

6. 计算机系统多级层次结构由高到低,依次是应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言级和微程序机器级。

7. 某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的20倍,而系统运行某一程序的整体性能提高到原来的5倍,试计算该程序中浮点操作所占的比例。

系统加速比=1 / (1-可改进比例+可改进比例/部件加速比)5 = 1 / (1-可改进比例+可改进比例/ 20)可得可改进比例=84.2%8. 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。

具体数据、如下所示。

(1)改进后,各类操作的加速比分别是多少?(2)各类操作单独改进后,程序获得的加速比分别是多少?(3)4类操作均改进后,整个程序的加速比是多少?多部件改进后的系统加速比=1 / (1-(11.1%+33.3%+38.9%+16.7%)+(11.1%/2+33.3%/1.33+38.9%/3.33+16.7%/4))=2.169. 将计算机系统中某一功能的处理速度加快20倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少。

方法一:系统加速比=1 / (1-可改进比例+可改进比例/部件加速比)=1 / (1-.04+0.4/20)=1.613方法二:系统加速比= 改进前的时间/ 改进后的时间=T / ( 0.6*T+ 0.4*T/20)=1.61310. 计算机系统有3个部件可以改进,这三个部件的加速比如下:部件加速比S1=30,部件加速比S2=20,部件加速比S3=10,(1)如果部件1和部件2的可改进比例为30%,那么当部件3的可改进比例为多少时,系统的加速比才可以达到10;(2)如果三个部件的可改进比例分别为30%、30%、20%,3个部件同时改进,那么系统中不可改进部分的执行时间在总执行时间中占的比例是多少。

(1)求得X=0.36(2)假设改进前系统的执行时间为T,3个部件改进前的执行时间是(0.3+0.3+0.2)*T=0.8T,不可改进部分的执行时间是0.2T。

3个部件改进后的时间T2 = 0.3T/30+0.3T/20+0.2T/10 = 0.045T改进后整个系统的执行时间T总= 0.045T+0.2T = 0.245T0.2T / 0.245T = 0.82即系统中不可改进部分的执行时间在总执行时间中占的比例是0.82。

第二章计算机指令集结构设计1. 数据表示指的是机器硬件能识别和引用的数据类型。

2. 操作码优化的目的是缩短指令字长、减少程序总位数、增加指令字表示的信息。

3. 机器的运算类指令和运算器结构主要是看机器中应当有什么样的数据表示来确定。

4. RISC结构的设计原则:(1)选取使用频率最高的指令,并补充一些最有用的指令;(2)每条指令的功能应尽可能简单,并在一个机器周期内完成;(3)所有指令长度均相同;(4)只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器之间进行;(5)以简单有效的方式支持高级语言。

第三章流水线技术1. 浮点加法指令让“求阶差”、“对阶”、“尾数加”和“规格化”流水,是属于部件级流水。

2. 在指令的流水解释过程中,MUL R1,R2和ADD R3,R1之间可能发生寄存器R1的写后读相关。

3. 流水线由若干个段或级组成,流水线有“通过时间”,“各段时间”应尽量相等,流水线的深度并不是越深越好。

4. 衡量流水线性能通常有三种主要指标,它们是吞吐率、加速比和效率。

5. DLX流水线寄存器的作用是把数据和控制信息从一个流水段传送到下一个流水段。

6. 指令的重叠执行,可以加快程序的解释,但不能加快指令的解释。

7. 流水线技术的特点:○1流水过程由多个相联系的子过程组成,每个过程称为流水线的“级”或“段”;○2每个子过程由专用的功能段实现;○3各个功能段所需时间应尽量相等,否则,时间长的功能段将成为流水线的瓶颈,会造成流水线的“堵塞”和“断流”;○4流水线需要有“通过时间”(第一个任务流出结果所需的时间),在此之后流水过程才进入稳定工作状态,每一个时钟周期(拍)流出一个结果;○5流水技术适合于大量重复的时序过程,只有在输入端能连续地提供任务,流水线的效率才能充分发挥。

8. 区分静态、动态流水线,单功能、多功能流水线。

9. 在MIPS/DLX的指令流水线中,可能发生的冲突只有前后指令的写后读冲突。

10. 流水线处理机中常见的三种相关是结构相关、数据相关和控制相关。

11. 减少流水线处理分支暂停时钟周期数的途径包括尽早判断分支转移是否成功、尽早计算出分支成功转移的PC值。

12. 编译器通过重新组织代码顺序消除暂停的技术被称为指令调度。

13. 标量流水机没有向量数据表示,只能依靠循环程序来处理向量和数组。

14. 有一条流水线如下所示。

(1) 求连续输入10条指令,该流水线的实际吞吐率和效率;(2) 该流水线的瓶颈在哪一段?请采取三种不同的措施消除此“瓶颈”。

对于你所给出的新流水线,计算连续输入10条指令时,其实际吞吐率和效率。

答:(1)(2) 瓶颈在3、4段。

变成八级流水线(细分)变成两级流水线(合并)重复设置部件15. 有一个流水线由四段组成,其中每当流经第三段时,总要在该段循环一次才能流到第四段。

如果每段经过一次的时间都是△t,问:(1) 当在流水线的输入端每△t时间输入任务时,该流水线会发生什么情况?(2) 此流水线的最大吞吐率为多少?如果每2△t输入一个任务,连续处理10个任务的实际吞吐率和效率是多少?(3) 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理10个任务时,其吞吐率提高多少?答:(1) 会发生流水线阻塞情况。

(2)(3) 重复设置部件吞吐率提高倍数==1.6416. 假设我们考虑条件分支指令的两种不同设计方法如下:(1) CPUA:通过比较指令设置条件码,然后测试条件码进行分支;(2) CPUB:在分支指令中包括比较过程。

在两种CPU中,条件分支指令都占用2个时钟周期而所有其它指令占用1个时钟周期,对于CPUA,执行的指令中分支指令占30%;由于每个分支指令之前都需要有比较指令,因此比较指令也占30%。

由于CPUA在分支时不需要比较,因此假设它的时钟周期时间比CPUB快1.4倍。

哪一个CPU更快?如果CPUA的时钟周期时间仅仅是CPUB的1.15倍,哪一个CPU更快呢?解:我们不考虑所有系统问题,所以可以用CPU性能公式。

占用2个时钟周期的分支指令占总指令的30%,剩下的指令占用1个时钟周期。

所以CPIA = 0.3 ×2 + 0.70 × 1 = 1.3则CPU性能为:总CPU时间A = IC × 1.3 ×时钟周期A根据假设,有:时钟周期B = 1.4 ×时钟周期A在CPUB中没有独立的比较指令,所以CPUB的程序量为CPUA的70%,分支指令的比例为:30%/70% = 42.8%这些分支指令占用2个时钟周期,而剩下的57.2%的指令占用1个时钟周期,因此:CPIB = 0.428 ×2 + 0.572 × 1 = 1.428因为CPUB不执行比较,故:ICB = 0.7 ×ICA因此CPUB性能为:总CPU时间B = ICB ×CPIB ×时钟周期B= 0.7 ×ICA ×1.428 ×(1.4×时钟周期A)= 1.44 ×ICA ×时钟周期A在这些假设之下,尽管CPUB执行指令条数较少,CPUA因为有着更短的时钟周期,所以比CPUB快。

如果CPUA的时钟周期时间仅仅是CPUB的1.15倍,则时钟周期B = 1.15 ×时钟周期ACPUB的性能为:总CPU时间B = ICB ×CPIB ×时钟周期B= 0.7 ×ICA ×1.428 ×(1.15 ×时钟周期A)= 1.18 ×ICA ×时钟周期A因此CPUB由于执行更少指令条数,比CPUA运行更快。

17. 动态多功能流水线由6个功能段组成,如下图:其中,S1、S4、S5、S6组成乘法流水线,S1、S2、S3、S6组成加法流水线,各个功能段时间均为△t,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:(1) 画出时空图;(2) 计算实际的吞吐率、加速比和效率。

答:本题解题的关键是弄清楚机器一共要做10次乘法,4次加法,而且应进行适当的指令调度,以得到最大的吞吐率。

第五章存储层次1. 全相联映像、组相联映像、直接映像的优缺点是什么?(例如:块冲突概率直接映像的最高,全相联映像的最低,组相联映像的居于二者之中,和全相联映像相比,组相联映像所用的目录表较小……)2. 伪相联Cache中,确定另一块的一种简单的方法是将索引字段的最高位取反。

3. Victim Cache是一种能减少冲突失效次数而又不影响失效开销的方法。

4. 虚拟存储器常用的地址映像是全相联映像。

5. 大小为N的直接映像Cache的失效率约等于大小为N/2的两路组相联Cache的失效率。

6. 减小Cache失效开销的五种方法:○1.让读失效优先于写。

○2.子块放置技术。

○3.请求字处理技术。

○4.非阻塞Cache 技术。

○5.采用两级Cache。

7. 降低Cache失效率的方法:○1增加Cache块大小。

相关文档
最新文档