计算机体系结构重点总结

合集下载

计算机组成与体系结构重点

计算机组成与体系结构重点

计算机组成与体系结构重点计算机组成指的是计算机硬件的组成部分,包括中央处理器(CPU)、存储器、输入输出设备和总线等。

这些部分相互协调工作,完成计算机的主要功能。

中央处理器是计算机的核心,负责执行指令并控制整个系统的运行。

存储器则用于存储数据和指令,可以分为主存储器和辅助存储器。

输入输出设备用于和外部世界进行交互,例如键盘、显示器和打印机等。

总线则是不同设备之间信息传输的通道。

在计算机组成与体系结构的研究中,存在几个重要的关键点。

首先是对计算机硬件的深入理解。

计算机硬件是计算机系统的基础,了解计算机硬件的组成和工作原理对于理解计算机系统的整体运行至关重要。

硬件的各个组件之间互相依赖,只有理解其相互关系,才能为系统的性能和可靠性做出合理的设计和调整。

其次是对指令集架构的研究。

指令集架构是决定计算机软件和硬件之间交互方式的关键,不同的指令集架构对计算机系统的性能和功能有着不同的影响。

为了提高计算机系统的性能,需要深入研究指令集的设计和实现。

此外,对于存储器层次结构的研究也是计算机组成与体系结构的重要内容。

计算机的存储器系统是计算机性能的瓶颈之一,如何提高存储器系统的容量和速度是计算机体系结构设计的关键问题。

研究存储器层次结构可以有效地提高存储器的访问速度,从而提高整个系统的性能。

最后,还需要对计算机系统的优化和并行计算进行深入研究。

计算机系统的优化是指通过改进硬件和软件的设计,使计算机系统的性能达到最优化。

并行计算则是指通过多个处理器同时执行多个任务,以提高计算速度和吞吐量。

这些研究对于提高计算机系统的性能和可靠性具有重要意义。

综上所述,计算机组成与体系结构是计算机科学与技术中的重要研究领域。

对计算机硬件和软件之间的关系以及计算机内部各个组件的结构和功能进行深入研究,可以为计算机系统的设计、优化和性能提供有力支撑。

计算机组成与体系结构的研究有助于推动计算机科学与技术的发展,为实现更高效、更可靠的计算机系统提供理论和实践基础。

计算机体系结构必考知识点

计算机体系结构必考知识点

计算机体系结构必考知识点一、知识概述《计算机体系结构必考知识点》①基本定义:计算机体系结构呢,简单说就是计算机的各个组成部分,像处理器、内存、输入输出设备等,它们之间是怎么连接的,还有各自的功能怎么协同工作。

就好比一个足球队,每个球员(硬件组件)都有自己的位置(功能),教练(操作系统等软件)怎么安排他们配合踢球(协同工作),这就是大致的概念。

②重要程度:在计算机这个学科里,这可太重要了。

要是不懂体系结构,就好比你盖房子不知道怎么搭框架,那接下来的装修(软件开发之类的)就无从下手。

计算机系统的性能、功能等都和它有很大关系。

③前置知识:得有基本的数字电路知识,像什么是逻辑门之类的。

还有对计算机各个硬件部件有个简单了解,就像你得知道有CPU这个东西,它大致是干啥的。

如果之前学过计算机组成原理那就更好了,就像你是个盖房子的小工,盖了几次小房子(了解简单的硬件组合),再来盖大楼(学习体系结构)就容易些。

④应用价值:实际应用可多了。

比如说设计新的计算机芯片,要考虑体系结构。

像手机厂商想让手机运行得更快,还不那么耗电,那就得优化手机芯片的体系结构。

再比如说云计算中心设计大型服务器集群,也得按照合理的体系结构来,这样才能高效处理海量的数据。

二、知识体系①知识图谱:在计算机学科的大地图里,计算机体系结构是重要的一块。

它连接着计算机硬件底层,向上又影响着操作系统、软件应用的开发。

就好比它是城市里的交通规划(对计算机里的数据等流动起规划作用),其他的建筑物(软件等)得按照这个交通规划来建设。

②关联知识:和计算机组成原理关联紧密,组成原理就像是讲每个部件的详细构造,体系结构就是把这些部件组合起来看。

和操作系统也有很大关系,操作系统的运行依赖于计算机体系结构提供的环境。

就好像演员(操作系统)得在舞台(体系结构)上表演。

③重难点分析:掌握难度在于概念比较抽象,像多级存储体系结构,什么缓存、主存、外存的关系不好理解。

关键点在于要理解各个部件的交互原理。

计算机体系结构重点

计算机体系结构重点

1计算机组成——计算机体系结构的逻辑实现。

2计算机实现——计算机组成的物理实现。

3关系系统结构是组成的抽象,组成是实现的抽象4体系结构——程序员所看到的计算机的属性,即概念性结构与功能特性。

5软件兼容——同一个软件可以不加修改地运行于体系结构相同的各档机器上,而且它们所获得的结果一样,差别只在于运行的时间不同。

6 Amdahl定律——加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中的所占的重要性。

1 结构相关——某些指令组合在流水线中重叠执行时,发生资源冲突,则称该流水线有结构相关。

2 数据相关——当指令在流水线中重叠执行时,流水线有可能改变指令读/写操作的顺序,使得读/写操作顺序不同于它们非流水实现时的顺序,将导致数据相关。

3 定向——将计算结果从其产生的地方直接送到其他指令需要它的地方,或所有需要它的功能单元,避免暂停。

4 RAW——两条指令i,j,i在j前进入流水线,j执行要用到i的结果,但当其在流水线中重叠执行时,j可能在i写入其结果之前就先行对保存该结果的寄存器进行读操作,得到错误值。

★1 强制性失效——当第一次访问一个块时,该块不在Cache中,需要从下一级存储器中调入Cache,这就是强制性失效。

2 Victim Cache——位于Cache和存储器之间的又一级Cache,容量小,采用全相联策略。

用于存放由于失效而被丢弃(替换)的那些块。

每当失效发生时,在访问下一级存储器之前,先检查Victim Cache中是否含有所需块。

4 2:1Cache经验规则——大小为N的直接映象Cache的失效率约等于大小为N /2的两路组相联Cache的实效率。

1 互联网络:互联网络是将对称式的系统或分布式系统中的节点连接起来所构成的网络,这些节点可能是处理器,存储模块或者其他设备,他们通过互联网络进行信息交换2 互联网络特点:数数据传送速率高,延迟低,通信频带宽机群系统:机群是一种价格低廉,易于构建,可扩展性强的并行计算机系统,由多台同构或者异构的地理计算机通过高性能网络或者局域网互联在一起,协同完成特定的并行计算机任务。

计算机系统结构考点总结

计算机系统结构考点总结

计算机系统结构考点总结计算机系统结构是计算机科学与技术领域的重要分支,涉及计算机硬件和软件的组成及其相互关系。

为了帮助大家更好地掌握这一领域的核心知识,本文将针对计算机系统结构的考点进行详细总结。

一、计算机系统结构基本概念1.计算机系统结构的定义及发展历程2.计算机系统结构的分类:冯·诺伊曼结构、哈佛结构、堆栈式结构等3.计算机系统性能指标:指令周期、CPU时钟周期、主频、缓存命中率等二、中央处理器(CPU)1.CPU的组成:算术逻辑单元(ALU)、控制单元(CU)、寄存器组等2.指令集架构:复杂指令集计算机(CISC)、精简指令集计算机(RISC)3.CPU缓存:一级缓存、二级缓存、三级缓存及其工作原理4.多核处理器:核数、并行计算、线程级并行等三、存储系统1.存储器层次结构:寄存器、缓存、主存储器、辅助存储器等2.主存储器:DRAM、SRAM、ROM等3.磁盘存储器:硬盘、固态硬盘、光盘等4.存储器管理:分页、分段、虚拟存储器等四、输入输出系统1.I/O接口:并行接口、串行接口、USB、PCI等2.I/O设备:键盘、鼠标、显示器、打印机等3.I/O控制方式:程序控制、中断、直接内存访问(DMA)等4.I/O调度策略:先来先服务(FCFS)、最短作业优先(SJF)、扫描算法等五、总线与通信1.总线分类:内部总线、系统总线、I/O总线等2.总线标准:ISA、PCI、PCI Express等3.通信协议:TCP/IP、UDP、串行通信等4.网络拓扑结构:星型、总线型、环型、网状等六、并行计算与分布式系统1.并行计算:向量机、SIMD、MIMD等2.分布式系统:分布式计算、分布式存储、负载均衡等3.并行与分布式编程:OpenMP、MPI、MapReduce等4.并行与分布式算法:排序、搜索、分布式锁等通过以上考点的总结,相信大家对计算机系统结构有了更加全面和深入的了解。

计算机体系结构重点总结

计算机体系结构重点总结

1.、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高的越多;整机的性能加速不可能大于在原机器中除该部件外所有其它部件运行时间的百分比的倒数1/(1-F)。

F定义为采用先进高速部件的那部分程序在未采用先进高速部件的计算机上运行的时间占总时间的百分比,则F= 采用高速部件的任务在老计算机上运行的时间整个任务在老计算机上运行的时间同时将S定义为先进高速部件与老部件的性能,则S= 老部件完成该功能的时间先进高速部件完成该功能的时间而采用了高速部件后整机性能提高比,即Speedup = T old = 1T new (1-F)+F/S某种硬件增强技术,可使执行速度提高10倍,在采用增强技术的计算机上测出其使用率是50%。

根据Amdahl定律计算:⑴采用增强技术后计算机性能加速比是多少?⑵未采用增强技术运行的部件在不采用增强技术的机器上运行时的时间比例。

2、(1)90/10局部性规则:程序花费90%的执行时间运行指令集中10%的指令代码。

这就是说在指令集中所有的指令只有10%指令是常用的,而另外90%指令的使用率合起来只有10%。

(2)时间局部性:如果某一参数被引用,那它不久将再次被引用。

这里指出了程序执行时在时间上的局部性(3)空间局部性:如果某一参数被引用,那它附近的参数不久也将被引用。

指出程序执行时地址空间上的局部性。

3、计算机的性能是指在计算机上完成用户的应用任务所需的时间长短。

完成同样任务所需的时间越短,计算机的性能越好。

(考判断)4、衡量计算机性能的参数:响应时间是指计算机系统完成某一任务(程序)所花费的时间。

5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。

(考判断)6、计算机整机性能分成两部分:一是CPU执行程序的时间,二是等待时间。

提高计算机性能就是提高CPU性能和减少等待时间。

cpu性能因子CPI:每条指令的平均时钟周期数(clock cycles per instruction),CPI=CPU花费的时钟数/CPU执行的总指令数CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I)(考填空)CPU性能 =1/CPU time= f / ( I×CPI )计算机性能常用指标:(1)MIPS(million instruction per second)MIPS的意思是每秒钟执行的百万条指令数。

计算机体系结构知识点

计算机体系结构知识点

第一章计算机体系结构得基本概念1计算机系统结构得经典定义程序员所瞧到得计算机属性,即概念性结构与功能特性。

2透明性在计算机技术中,把这种本来存在得事物或属性,但从某种角度瞧又好像不存在得概念称为透明性。

3系列机由同一厂家生产得具有相同系统结构、但具有不同组成与实现得一系列不同型号得计算机。

4常见得计算机系统结构分类法有两种:Flynn 分类法、冯氏分类法Flynn 分类法把计算机系统得结构分为4 类:单指令流单数据流(SISD)单指令流多数据流(SIMD)多指令流单数据流(MISD)多指令流多数据流(MIMD)5 改进后程序得总执行时间系统加速比为改进前与改进后总执行时间之比6CPI(Cycles Per Instruction):每条指令执行得平均时钟周期数CPI = 执行程序所需得时钟周期数/IC7存储程序原理得基本点:指令驱动8冯·诺依曼结构得主要特点1以运算器为中心。

2在存储器中,指令与数据同等对待。

指令与数据一样可以进行运算,即由指令组成得程序就是可以修改得。

3存储器就是按地址访问、按顺序线性编址得一维结构,每个单元得位数就是固定得。

4指令得执行就是顺序得5指令由操作码与地址码组成。

6指令与数据均以二进制编码表示,采用二进制运算。

9软件得可移植性一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上正确地运行。

差别只就是执行时间得不同。

我们称这两台计算机就是软件兼容得。

实现可移植性得常用方法:采用系列机、模拟与仿真、统一高级语言。

软件兼容:向上(下)兼容:按某档机器编制得程序,不加修改就能运行于比它高(低)档得机器。

向前(后)兼容:按某个时期投入市场得某种型号机器编制得程序,不加修改地就能运行于在它之前(后)投入市场得机器。

向后兼容就是系列机得根本特征。

兼容机:由不同公司厂家生产得具有相同系统结构得计算机。

10并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。

考研计算机体系结构知识点梳理

考研计算机体系结构知识点梳理

考研计算机体系结构知识点梳理计算机体系结构是计算机科学与技术中的重要分支,涵盖了计算机硬件和软件之间的接口设计、计算机系统的层次结构、指令集架构等内容。

考研中,对计算机体系结构的掌握是非常重要的,本文将对考研计算机体系结构的知识点进行梳理和总结。

一、计算机体系结构的基本概念计算机体系结构(Computer Architecture)是指计算机硬件与软件之间接口规格定义的集合,它包括计算机硬件的组成和工作原理,以及指令集架构和计算机系统的层次结构。

1.1 计算机硬件的组成计算机硬件由中央处理器(CPU)、存储器(Memory)、输入输出设备(I/O)等组成。

其中,中央处理器是计算机的核心部件,负责执行指令和进行数据处理。

1.2 计算机系统的层次结构计算机系统的层次结构包括硬件层次结构和软件层次结构。

硬件层次结构包括处理器、存储器、总线等组成部分;软件层次结构包括操作系统、编译系统、应用软件等。

1.3 指令集架构指令集架构(Instruction Set Architecture,ISA)定义了计算机系统的指令集合和指令的编码格式。

常见的指令集架构包括精简指令集(RISC)和复杂指令集(CISC)。

二、计算机的性能指标在计算机体系结构中,常用的性能指标有时钟周期、时钟频率、执行时间和吞吐量等。

2.1 时钟周期和时钟频率时钟周期是指计算机系统中最小的时间单位,是计算机进行一次简单操作所需要的时间。

时钟频率是指计算机系统每秒钟进行时钟周期的次数。

2.2 执行时间执行时间是指计算机完成一个程序的时间,它等于指令执行的总周期数乘以时钟周期。

执行时间是衡量计算机性能的重要指标,通常以秒为单位。

2.3 吞吐量吞吐量是指计算机系统在单位时间内完成的任务数量。

吞吐量大表示计算机系统的处理能力强,可以同时处理更多的任务。

三、指令的执行流程计算机处理器执行指令的流程包括指令获取、指令译码、指令执行和结果写回等步骤。

3.1 指令获取指令获取是指计算机从存储器中获取指令的过程。

计算机体系结构

计算机体系结构

计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。

以下是一些主要的知识点:
1. 存储程序计算机(冯诺依曼型):这种类型的计算机包括运算器、存储器、输入输出设备和控制器四部分。

它以运算器为中心,采用存储程序原理,即程序(指令)和数据放在同一存储器中。

此外,存储器按地址访问,控制流由指令流产生,指令由操作码和地址码组成,数据以二进制代码表示。

2. 程序员所看到的机器属性:这包括数据表示,即硬件能直接辨认和处理的数据类型;寻址规则,包括最小寻址单元,寻址方式及其表示;寄存器定义,包括各种寄存器的定义,数量和使用方式。

3. 指令系统:指令系统是计算机中用来计算和控制的命令集合。

4. 流水线技术:这是一种提高处理器执行指令速度的技术,将指令执行过程分解为多个阶段,并让各阶段的操作重叠进行。

5. 存储层次:存储层次是指把内存划分为不同的等级,以满足不同的存储需求。

6. 输入输出系统:这是负责计算机与外部信息交互的部分。

7. 多处理机和非冯-洛依曼型计算机:这些是计算机体系结构中的高级主题。

计算机体系结构知识点汇总

计算机体系结构知识点汇总

第一章计算机体系构造的根本概念1.计算机系统构造的经典定义程序员所看到的计算机属性,即概念性构造与功能特性。

〔计算机组成:指计算机系统构造的逻辑实现。

计算机实现:计算机组成的物理实现〕2.计算机系统的多级层次构造:1.虚拟机:应用语言机器->高级语言机器->汇编语言机器->操作系统机器2.物理机:传统机器语言机器->微程序机器3.透明性:在计算机技术中,把这种本来存在的事物或属性,但从*种角度看又好似不存在的概念称为透明性。

4.编译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序5.解释:对于高一级机器上的程序中的每一条语句或指令,都转去执行低一级机器上的一段等效程序。

6.常见的计算机系统构造分类法有两种:Flynn分类法、氏分类法〔按系统并行度〕进展分类。

Flynn分类法把计算机系统的构造分为4类:单指令流单数据流(SISD)单指令流多数据流(SIMD)多指令流单数据流(MISD)多指令流多数据流(MIMD)IS指令流,DS数据流,CS〔控制流〕,CU〔控制部件〕,PU〔处理部件〕,MM,SM〔表示存储器〕7.计算机设计的定量原理:1.大概率事件优先原理〔分配更多资源,到达更高性能〕2.Amdahl定理:加速比:(Fe为可改进比例〔可改进局部的执行时间/总的执行时间〕,Se为部件加速比〔改进前/改进后〕3.程序的局部性原理:时间局部性:程序即将使用的信息很可能是目前使用的信息。

空间局部性:即将用到的信息可能与目前用到的信息在空间上相邻或相近。

4.CPU性能公式:1.时钟周期时间2.CPI:CPI = 执行程序所需的时钟周期数/IC3.IC(程序所执行的指令条数)8.并行性:计算机系统在同一时刻或者同一时间间隔进展多种运算或操作。

同时性:两个或两个以上的事件在同一时刻发生。

并发性:两个或两个以上的事件在同一时间间隔发生。

从处理数据的角度来看,并行性等级从低到高可分为:1.字串位串:每次只对一个字的一位进展处理。

计算机体系结构-重点

计算机体系结构-重点

1.电脑系统层次结构:现代电脑系统是有硬件和软件组成的一个复杂系统,按功能〔语言〕划分可以分为多级层次机构,由低到高分别为〔7个层次〕:微程序机器,传统机器,操作系统机器,汇编机器,高级语言机器,应用语言机器。

多级层次结构作用〔3个〕:有利于正确理解电脑系统的工作,明确软件,硬件和固件在电脑系统中的作用;有利于正确理解各种语言的实质及其实现;有利于探索虚拟机器新的实现方法,设计新的电脑系统。

2电脑系统结构,电脑组成,电脑实现电脑系统结构:是指电脑多级层次结构中机器语言级的结构,它是软件和硬件/固件的主要交界面。

〔硬件子系统的概念结构及其功能特性〕电脑组成:是电脑系统结构的逻辑实现,主要研究硬件系统在逻辑上是如何组织的。

包括机器的内部的数据流和控制流的组成以及逻辑设计等。

电脑实现:是指电脑组成的物理实现,主要着眼于器件技术和微组装技术。

包括处理机,主存等部件的物理结构,器件的集成度和速度,线路划分与连接看,制造技术与工艺等。

3.透明性一种本来存在的事物或属性,但从某种角度看似乎不存在,称为透明性现象。

4 翻译解释翻译:先用转换程序将高一级机器上的程序整个地址变换成为低一级机器上可运行的等效程序,然后再在低一级机器级上去实现的技术。

解释:在低一级机器上的一条语句或指令的功能,通过对高一级机器语言程序中的每条语句或指令逐条解释来实现的技术。

5模拟仿真模拟:用软件的方法在一台电脑〔宿主A〕上,实现另一台电脑〔虚拟机B〕的指令系统,由于用纯软件解释执行,速度较慢。

仿真:用微程序的方法一台电脑〔宿主机A〕上实现另一台电脑〔目标机B〕的指令系统,由于部分硬件、固件参与解释执行,故速度比“模拟”快。

6并行性耦合度耦合度:耦合度反映出多机系统各机器之间物理连接的紧密程度和交互作用能力的强弱。

并行性:并行性是指在同一时刻或是同一时间段内完成两种或两种以上性质相同或不相同的工作。

7软件的可移植性是指一个软件可不经修改或只需少量修改便可由一条机器移植到另一台机器上去运行,即同一软件可应用于不同的环境。

计算机体系结构知识点汇总情况

计算机体系结构知识点汇总情况

第一章计算机体系结构的基本概念1.计算机系统结构的经典定义程序员所看到的计算机属性,即概念性结构与功能特性。

(计算机组成:指计算机系统结构的逻辑实现。

计算机实现:计算机组成的物理实现)2.计算机系统的多级层次结构:1.虚拟机:应用语言机器->高级语言机器->汇编语言机器->操作系统机器2.物理机:传统机器语言机器->微程序机器3.透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

4.编译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序5.解释:对于高一级机器上的程序中的每一条语句或指令,都转去执行低一级机器上的一段等效程序。

6.常见的计算机系统结构分类法有两种:Flynn分类法、氏分类法(按系统并行度P P:计算机系统在单位时间能处理的最大二进制位数)进行分类。

Flynn分类法把计算机系统的结构分为4类:单指令流单数据流(SISD)单指令流多数据流(SIMD)多指令流单数据流(MISD)多指令流多数据流(MIMD)IS指令流,DS数据流,CS(控制流),CU(控制部件),PU(处理部件),MM,SM(表示存储器)7.计算机设计的定量原理:1.大概率事件优先原理(分配更多资源,达到更高性能)2.Amdahl定理:加速比:P P=P0(加速前)P P(加速后)=1(1−PP)+PP/PP(Fe为可改进比例(可改进部分的执行时间/总的执行时间),Se为部件加速比(改进前/改进后)3.程序的局部性原理:时间局部性:程序即将使用的信息很可能是目前使用的信息。

空间局部性:即将用到的信息可能与目前用到的信息在空间上相邻或相近。

4.CPU性能公式:1.时钟周期时间2.CPI:CPI = 执行程序所需的时钟周期数/IC3.IC(程序所执行的指令条数)8.并行性:计算机系统在同一时刻或者同一时间间隔进行多种运算或操作。

同时性:两个或两个以上的事件在同一时刻发生。

计算机体系结构基础知识要点梳理

计算机体系结构基础知识要点梳理

计算机体系结构基础知识要点梳理计算机体系结构是指计算机硬件和软件之间的交互方式和组织方式。

在计算机科学领域中,对计算机体系结构的理解是非常重要的。

本文将梳理计算机体系结构的基础知识要点,以帮助读者更好地理解和应用这一领域的知识。

一、什么是计算机体系结构计算机体系结构是指计算机硬件和软件之间的接口和交互方式。

它对计算机的功能、性能、能耗以及可扩展性等方面起到了决定性的影响。

计算机体系结构包括指令集架构、操作系统、内存管理、输入输出等方面的设计和实现。

二、指令集架构(ISA)指令集架构是计算机体系结构的核心之一。

它定义了计算机的指令集和指令的编码方式,决定了计算机能执行哪些操作。

常见的指令集架构有CISC(复杂指令集计算机)和RISC(精简指令集计算机)。

CISC架构的指令较为复杂,可以执行多种操作,而RISC架构的指令较为简单,执行速度更快。

三、存储器层次结构存储器层次结构是计算机体系结构中的重要概念之一。

它由多级存储器组成,包括寄存器、缓存、内存和硬盘等。

存储器层次结构的设计目标是提高访问速度和存储容量,以及降低成本。

其中,寄存器是最快的存储器,但容量较小;缓存是位于CPU和内存之间的存储器,可以提高访问速度;内存是计算机主存储器,容量大但访问速度较慢;硬盘用于长期存储,容量最大但访问速度最慢。

四、处理器和流水线处理器是计算机体系结构中的核心部件。

它负责执行计算机指令,进行算术逻辑运算和控制数据流动等操作。

常见的处理器类型包括中央处理器(CPU)和图形处理器(GPU)。

流水线是一种提高指令执行效率的技术,它将指令执行过程划分为多个子操作,并通过多级流水线的并行处理方式,提高处理器的吞吐量。

五、总线和I/O系统总线是计算机体系结构中的重要组成部分,它用于连接计算机的各个硬件设备,传输数据和控制信息。

常见的总线包括数据总线、地址总线和控制总线。

I/O系统负责计算机与外部设备之间的数据交换和控制操作。

计算机系统结构概要归纳

计算机系统结构概要归纳

计算机系统结构复习第一章 计算机系统结构基本概念1.1计算机系统结构计算机系统层次结构·计算机系统结构主要研究软件、硬件功能分配和对软件硬件界面的确定,即哪些功能由软件完成、哪些功能由硬件完成。

·软件与硬件实现的特点:硬件实现:速度快、成本高;灵活性差、占用内存少。

软件实现:速度低、复制费用低;灵活性好、占用内存多。

·计算机组成的任务是在计算机系统结构确定分配给硬件子系统的功能及其概念结构之后,研究各组成部分的内部构造和相互联系,以实现机器指令级的各种功能和特性。

·系统结构是计算机系统的软硬件界面;计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理实现。

·计算机系统结构的分类:①Flynn 分类法:指令流:机器执行的指令序列。

数据流:由指令调用的数据序列,包括输入数据和中间结果。

多倍性:在系统最受限制的元件上同时处于同一执行阶段的指令或数据的最大可能个数。

按照数据流和指令流的组织方式分为:SISD 、SIMD 、MISD 、MIMD 。

②冯氏分类法:用最大并行度分类,最大并行度:计算机系统在单位时间内能够处理的最大的二进制位数。

分为:1、字串位串WSBS ;2、字并位串WPBS ;3、字串位并WSBP ;4、字并位并WPBP 。

③Handler 分类法:根据并行度和流水线分类,把计算机的硬件结构分成三个层次:1、程序控制部件(PCU )的个数k ;2、算术逻辑部件(ALU )或处理部件PE 的个数d ;3、每个算术逻辑部件包含基本逻辑线路(ELC )的套数w 。

1.2计算机系统设计技术·计算机系统设计的定量原理:①、加快经常性时间的处理速度;②、Amdahl 定律:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。

加速比=(采用改进措施后的性能)/(没有采用改进措施性能)=(没有采用改进措施前执行某任务的时间)/(采用改进措施后某任务执行时间)。

计算机体系结构总结

计算机体系结构总结

计算机体系结构重点1、并行线索:时间,空间的并行并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作2、资源重复,时间重叠,资源共享资源重复:通过重复设置硬件资源,大幅度提高计算机系统的性能。

(多处理机系统)时间重叠:多个处理过程在时间上相互错开,轮流、重叠地使用同一套硬件设备的各个部分。

(流水线)资源共享:软件方法,使多个任务按一定时间顺序轮流使用同一套硬件设备。

(多道程序、分时系统)3、数据并行:字、位(1)流水线的指令并行(2)超流水线:细分时间(3)超标量流水线:重复设置流水线(4)向量机:流水线,数据并行(5)提高cache命中率(6)多机系统,线程级并行(CMP)4、局部性(1)存储系统原理(2)提高cache命中率(victim cache,伪相联cache)(3)cache有好程序(空间、时间局部性)有些去年的题都没有被老师的提纲点出来,崩溃了。

蓝色的没查到,晕了。

红色的太庞大,懒了。

-----------卖萌了by备(分章解读)一、概论1、计算机体系结构与组成原理,实现的关系,基本概念(兼容、模拟、仿真)层次:微程序语言、机器语言、(操作系统虚拟机)、<-解释的方法实现--------------用翻译的方法实现->汇编语言、高级语言、应用语言硬件逻辑优点:速度快虚拟机:由软件实现的机器,以区别于由硬件/固件实现的物理机器计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性计算机组成:计算机系统结构的逻辑实现,包含物理机器中的数据通道和控制信号的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

计算机系统机构的研究对象:计算物理系统的抽象和定义;具体包括:数据表示;寻址方式;寄存器定义;指令系统;存储结构;中断系统;机器工作状态定义和切换;I/O系统;总线结构;系统安全与保密;结构、组成和实现三者关系:结构是计算机系统的软、硬件界面;组成是计算机系统结构的逻辑实现;实现是九三级组成的物理实现;软件兼容:同一个软件可以不加修改地运行于系统结构相同的各个机器上,而且所得结果一致;向上(下)兼容:低(高)档机器的目标程序不加修改就可以运行于高(低)档机器。

计算机系统结构基础知识要点梳理

计算机系统结构基础知识要点梳理

计算机系统结构基础知识要点梳理计算机系统结构是指计算机硬件和软件之间的组织和交互方式,是计算机科学与技术的基础。

了解计算机系统结构的基础知识对于计算机专业学生和从事计算机相关工作的人员来说至关重要。

本文将梳理计算机系统结构的基础知识要点,帮助读者更好地理解和掌握这一领域的知识。

一、计算机的组成与功能计算机系统由硬件和软件组成。

硬件包括中央处理器(CPU)、内存、存储器、输入输出设备等,而软件包括系统软件和应用软件。

计算机的主要功能是数据的输入、处理、输出和存储。

1.中央处理器中央处理器是计算机的核心部件,负责执行指令并控制计算机的工作。

它由运算器和控制器组成,运算器负责进行算术和逻辑运算,控制器负责解析和执行指令。

2.内存内存是计算机用来存储数据和指令的地方,它可以分为主存和辅存。

主存是CPU可以直接访问的存储器,而辅存则用于长期存储数据和程序。

3.存储器存储器用于存储计算机系统中的各种数据和信息,包括数据、指令和程序等。

根据存储介质的不同,可以将存储器分为内存和外存。

4.输入输出设备输入输出设备用于将数据从外部输入到计算机系统中,或将计算机系统中的数据输出到外部设备中。

常见的输入输出设备包括键盘、鼠标、显示器、打印机等。

二、计算机的层次结构计算机系统可以按照功能和性能划分为多个层次,从底层到高层分别是物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。

1.物理层物理层是计算机系统中最底层的层次,它负责处理计算机硬件和信号传输的问题。

包括处理器、存储器、总线等硬件设备,并规定了数据的传输方式和电信号的特性。

2.数据链路层数据链路层负责处理数据在链路上的传输和错误控制。

它将数据分组成帧,并对传输过程中的错误进行检测和纠正。

3.网络层网络层负责处理数据在不同网络之间的传输和路由问题。

它使用IP 地址来标识网络和主机,并通过路由选择算法确定数据的传输路径。

4.传输层传输层负责处理数据的传输可靠性和流量控制。

计算机系统结构 总复习

计算机系统结构 总复习
4
∑ 而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算: AiBi i =1
① 画出时空图;(9 分) ② 计算实际的吞吐率、加速比和效率。(6 分) 15. 静态多功能流水线由 6 个功能段组成,如图 E_3 所示。其中,s1、s4、s5、s6 组
成乘法流水线,s1、s2、s3、s6 组成加法流水线,各个功能段时间均为△t,假设 该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以 最快的方式用该流水计算:∏(Ai+Bi)(其中 i=1..4,∏为连乘符号) ① 画出时空图;(9 分) ② 计算实际的吞吐率、加速比和效率。(6 分) 16. (20 分)设指令流水线由取指令、分析指令和执行指令 3 个部件构成,每个部件 经过的时间为△t,连续流入 12 条指令。分别画出标量流水处理机以及 ILP 均为 4 的超标量处理机、超长指令字处理机、超流水处理机的时空图,并分别计算它们 相对于标量流水处理机的加速比。 17. (15 分)给定以下的假设,试计算直接映象 Cache 和两路组相联 Cache 的平均访 问时间以及 CPU 时间。 ① 理想 Cache(命中率为 100%)情况下的 CPI 为 2.0,时钟周期为 2ns,平均每条指 令访存 1.2 次。 ② 两种 Cache 容量均为 64KB,块大小都是 32 字节。 ③ 组相联 Cache 中的多路选择器使 CPU 的时钟周期增加了 10%。 ④ 这两种 Cache 的失效开销都是 80 ns。 ⑤ 命中时间为 1 个时钟周期。 ⑥ 64 KB 直接映象 Cache 的失效率为 1.4%,64 KB 两路组相联 Cache 的失效率为 1.0%。
① 画出处理过程的时空图。(9 分) ② 计算其吞吐率、加速比和效率。(6 分) 12. 有一条动态多功能流水线由 5 段组成(如图 E_2 所示),加法用 1、3、4、5 段,

计算机系统结构考点总结

计算机系统结构考点总结

计算机系统结构考点总结计算机系统结构是指计算机硬件和软件之间的组织关系,它决定了计算机系统的性能、可靠性和可扩展性。

它是计算机科学中的一个重要领域,涉及到计算机的各个方面,包括中央处理器、存储器、输入输出设备以及各种通信和控制设备。

计算机系统结构的考点主要包括以下几个方面:1.中央处理器(CPU):中央处理器是计算机系统的核心部件,负责执行计算机程序中的指令。

它由控制单元和算术逻辑单元组成,控制单元负责指令的解码和执行,算术逻辑单元负责执行算术运算和逻辑运算。

中央处理器的性能取决于其时钟频率、指令集和缓存结构等因素。

2.存储器:存储器用于存储计算机程序和数据。

计算机系统通常包括主存储器和辅助存储器。

主存储器是CPU直接访问的存储介质,其速度较快但容量较小;辅助存储器用于长期存储数据,容量较大但速度较慢。

存储器的组织和访问方式对计算机系统的性能有重要影响。

3.输入输出设备:输入输出设备用于与外部环境进行信息交换。

常见的输入设备包括键盘、鼠标和扫描仪等,输出设备包括显示器、打印机和音频设备等。

输入输出设备的种类和性能对计算机系统的使用体验和功能扩展能力有重要影响。

4.总线和通信:总线是计算机系统中各个组件之间进行数据传输的通道。

它包括地址总线、数据总线和控制总线等,用于传输指令、数据和控制信号。

通信是计算机系统中各个计算机之间进行数据交换的方式,常见的通信方式包括以太网、无线网络和蓝牙等。

5.操作系统:操作系统是计算机系统的核心软件,负责管理计算机的资源和控制计算机的运行。

它提供了文件管理、进程管理、内存管理和设备管理等功能,为用户提供了友好的接口和良好的使用体验。

6.并行计算和分布式系统:并行计算是指多个处理器同时进行计算,以提高计算速度和处理能力。

分布式系统是指多台计算机通过网络相互连接,共同完成计算任务。

并行计算和分布式系统在科学计算、大数据处理和人工智能等领域具有重要应用。

7.虚拟化和云计算:虚拟化是指将一个物理资源划分为多个逻辑资源,使多个用户可以共享物理资源。

计算机体系结构总结(DOC)

计算机体系结构总结(DOC)

计算机体系结构重点1、并行线索:时间,空间的并行并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作2、资源重复,时间重叠,资源共享资源重复:通过重复设置硬件资源,大幅度提高计算机系统的性能。

(多处理机系统)时间重叠:多个处理过程在时间上相互错开,轮流、重叠地使用同一套硬件设备的各个部分。

(流水线)资源共享:软件方法,使多个任务按一定时间顺序轮流使用同一套硬件设备。

(多道程序、分时系统)3、数据并行:字、位(1)流水线的指令并行(2)超流水线:细分时间(3)超标量流水线:重复设置流水线(4)向量机:流水线,数据并行(5)提高cache命中率(6)多机系统,线程级并行(CMP)4、局部性(1)存储系统原理(2)提高cache命中率(victim cache,伪相联cache)(3)cache有好程序(空间、时间局部性)有些去年的题都没有被老师的提纲点出来,崩溃了。

蓝色的没查到,晕了。

红色的太庞大,懒了。

-----------卖萌了by备(分章解读)一、概论1、计算机体系结构与组成原理,实现的关系,基本概念(兼容、模拟、仿真)层次:微程序语言、机器语言、(操作系统虚拟机)、<-解释的方法实现--------------用翻译的方法实现->汇编语言、高级语言、应用语言硬件逻辑优点:速度快虚拟机:由软件实现的机器,以区别于由硬件/固件实现的物理机器计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性计算机组成:计算机系统结构的逻辑实现,包含物理机器中的数据通道和控制信号的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

计算机系统机构的研究对象:计算物理系统的抽象和定义;具体包括:数据表示;寻址方式;寄存器定义;指令系统;存储结构;中断系统;机器工作状态定义和切换;I/O系统;总线结构;系统安全与保密;结构、组成和实现三者关系:结构是计算机系统的软、硬件界面;组成是计算机系统结构的逻辑实现;实现是九三级组成的物理实现;软件兼容:同一个软件可以不加修改地运行于系统结构相同的各个机器上,而且所得结果一致;向上(下)兼容:低(高)档机器的目标程序不加修改就可以运行于高(低)档机器。

计算机体系结构重点

计算机体系结构重点

计算机体系结构重点一、解释下列术语计算机系统结构:是指计算机系统多级层次结构中传统机器级的结构,它是软件和硬件/固件的主要交界面,是让编制的机器语言程序、汇编语言程序以及将高级语言源程序编译生成的机器语言目标程序在机器上正确运行所应看到的计算机属性。

计算机系统结构是与汇编语言程序或机器语言程序所能实现的功能,要用到的数据类型、寻址方式、指令系统、I/O结构等密切相关的。

计算机组成:是计算机系统结构的逻辑实现,包括机器级内的数据流和控制流的组成以及逻辑设计等。

它与指令和编程等没有直接关系,主要是看硬件系统在逻辑上是如何组织的。

也即它着眼于机器级内各事件的排序方式与控制机构、各部分的功能及各部件之间的联系。

计算机实现:计算机实现指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,器件、模块、插件、底板的划分与连接,专用器件的设计,微组装技术,信号传输,电源、冷却及整机装配技术等。

它着眼于器件技术和微组装技术。

器件技术在实现技术中起着主导作用。

它直接影响到系统的速度和价格。

透明性:指的是在计算机中,客观存在的事物或属性从某个角度看不到,则称这些事物或属性对计算机是透明的。

并行性:并行性是指问题中具有可同时进行运算和操作的特性。

只要在同一时刻或同一时间间隔内完成两种或两种以上性质相同或性质不同的工作,它们在时间上相互重叠,则都体现了并行性。

同时性:两个或多个事件在同一时刻发生则属于同时性(Simultaneity)。

并发性:两个或多个事件在同一时间间隔内发生则属于并发性(Concurrency)。

软件兼容:由于系列内各档机器从程序设计者看都具有相同的机器属性,因此按这个属性编制的机器语言程序以及编译程序都能不加修改地通用于各档机器。

我们称这种情况下的各档机器是软件兼容的。

系列机的区别仅在于运行所需时间不同。

模拟:模拟(Simulation):用机器语言程序解释另一机器的机器指令实现软件移植的方法称为模拟。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高得越多;整机得性能加速不可能大于在原机器中除该部件外所有其它部件运行时间得百分比得倒数1/(1-F)。

F定义为采用先进高速部件得那部分程序在未采用先进高速部件得计算机上运行得时间占总时间得百分比,则F= 采用高速部件得任务在老计算机上运行得时间整个任务在老计算机上运行得时间同时将S定义为先进高速部件与老部件得性能,则S= 老部件完成该功能得时间先进高速部件完成该功能得时间而采用了高速部件后整机性能提高比,即Speedup = T old = 1T new (1-F)+F/S某种硬件增强技术,可使执行速度提高10倍,在采用增强技术得计算机上测出其使用率就是50%。

根据Amdahl定律计算:⑴采用增强技术后计算机性能加速比就是多少?⑵未采用增强技术运行得部件在不采用增强技术得机器上运行时得时间比例。

2、(1)90/10局部性规则:程序花费90%得执行时间运行指令集中10%得指令代码。

这就就是说在指令集中所有得指令只有10%指令就是常用得,而另外90%指令得使用率合起来只有10%。

(2)时间局部性:如果某一参数被引用,那它不久将再次被引用。

这里指出了程序执行时在时间上得局部性(3)空间局部性:如果某一参数被引用,那它附近得参数不久也将被引用。

指出程序执行时地址空间上得局部性。

3、计算机得性能就是指在计算机上完成用户得应用任务所需得时间长短。

完成同样任务所需得时间越短,计算机得性能越好。

(考判断)4、衡量计算机性能得参数:响应时间就是指计算机系统完成某一任务(程序)所花费得时间。

5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。

(考判断)6、计算机整机性能分成两部分:一就是CPU执行程序得时间,二就是等待时间。

提高计算机性能就就是提高CPU性能与减少等待时间。

cpu性能因子CPI:每条指令得平均时钟周期数(clock cycles per instruction),CPI=CPU花费得时钟数/CPU执行得总指令数CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I) (考填空)CPU性能 =1/CPU time= f / ( I×CPI )计算机性能常用指标:(1)MIPS(million instruction per second)MIPS得意思就是每秒钟执行得百万条指令数。

MIPS= 指令数/ ( 执行时间×106 ) = 时钟频率 / ( CPI×106 ) =f / ( CPI×106 )MFLOPS(million floating-point operation per second)每秒钟执行得百万个浮点操作数MFLOPS=浮点操作数 / 执行时间×10610、工作负载基准程序(workload benchmark):(1)实际程序(2)核心基准程序(3)简单基准程序(4)合成基准程序 (考填空)11、基准程序得一般设计原则:(1)具有代表性,反映用户得实际应用。

(2)不能对基准程序进行优化。

(3)复现性。

能重复测试,其环境相同,结果能重复出现。

(4)可移植性。

系统相关性要小。

(5)紧凑性。

基准程序不宜太庞大。

(6)成本-效率要高。

12、测量结果得统计与比较----性能报告:SPEC(system performance evaluation cooperative)基准程序13、指令设计时主要以下几个方面来考虑: (考填空)⑴应用范围;⑵指令得使用概率;⑶常用指令分析;⑷特殊指令设计。

14、正向条件转移大部分就是不成功得,它满足条件得概率较低。

(考判断)15、一般基本传送指令包含Load,Store与Move三类。

(考填空)16、从操作数存放得位置来说,至少有三类地址:(1)存储器地址(2) I/O地址(3)寄存器地址如果不加特殊说明,我们称地址就就是指存储器地址或I/O地址。

17、主存储器编址:计算机有两种习惯使用方法,即在字单元地址内有两种字节排列次序:第一种为低位收尾(little endian),其字节次序就是低字节在最低位得排列; DEC Intel公司第二种为高位收尾(big endian),其字节次序就是高字节在最低位得排列。

IBM Motorola公司操作码得信息源熵(系统包含得平均信息量)公式(H=-Σp i log2p i )式中pi为事件出现得频率,由此我们可以比较压缩前后得信息冗余量或时间冗余量。

“Simple is fast”与“Small is fast”,即:简单事件可以更快速处理;小规模器件得速度可以做得更快,体现了RISC思想得精髓。

20、构成计算机得成本组合:(1)器件成本(2)直接成本(3)间接成本(4)报价单价格 (考填空)21、计算机得三种机器结构:堆栈、累加器、通用寄存器22、处理器(CPU)可分为两部分:(1、)数据通路(ALU(arithmetic logic unit)+寄存器)为处理器工作时数据实际流过得路径。

(2)控制器(解释计算机机器指令代码,并按这些代码发出控制信号控制数据通道得工作以完成指令)就是处理器中得主控部分,就是将指令转换为实际硬件动作得桥梁,设计最复杂。

23、数据通路组成图24、寄存器:专用寄存器+通用寄存器专用寄存器:(1)PC(Program Counter) 程序计数器(2)MAR(memoryaddress register) 存储器地址寄存器MDR(memory dataregister) 存储器数据寄存器(4)IAR(interruptaddress register)中断地址寄存器(5)Temp 暂存寄存器:数据访问中起暂存作用得寄存器。

不知道存在:MAR、MDR、Temp 用户透明:PC、IAR通用寄存器:能被用户自由地用于数据计算得寄存器寄存器堆(register file)由多个通用寄存器合起来得。

存储器层次结构中得最高层,属于最小也就是最快得暂存部件。

25、指令得执行分为以下五个步骤:(1)取指令IF(2、)指令译码/寄存器读出ID(3)执行/有效地址计算EX(4)存储器访问/完成转移:a、访存指令b、转移指令 MEM(5)写回 WB26、微指令编制方式:(1)垂直微代码:加一些硬件电路来解释这些信号,而不就是直接使用它们(2)水平微代码:完全不编码得微指令27、中断在不同得计算机系统中有不同得叫法,Intel与IBM仍将所有得都称为中断,而Motorola将它们称为例外,DEC则根据不同得情况,将它们称作异常、出错、自陷、放弃或中断。

28、流水线得作用:提高硬件功能部件得使用率, 减少指令得平均执行时间。

流水线(pipeline)就是指在程序执行时多条指令重叠进行操作得一种准并行处理实现技术(流水线得并行处理就是指完成一条指令得各个部件在时间上可以重叠工作)。

29、30、流水线竞争有三种:⑴结构竞争(资源竞争):由资源缺乏引起。

⑵数据竞争(data hazard) :由指令间数据相关而引起。

⑶控制竞争(control hazard) :由程序指针PC值得改变而引起。

(考填空)31、为什么计算机设计者允许结构竞争存在(1)减少成本。

(2)降低单元电路得延时时间。

(3)减少电路得复杂程度。

32、三种数据竞争:(1)先写后读相关 RAW (read after write)(2)写写相关 WAW (write after write)(3)先读后写相关 WAR (write after read)指令从ID级流入EX级,一般称指令发射(instruction issue)。

一条指令已建立了这一过程,称为已发射(issued)。

34、35、浮点乘法:15个周期,执行周期7个。

浮点加法:执行周期4个。

浮点除法:15个周期36、37、集中式动态调度。

记分牌有以下四级流水步骤:⑴发射级(issue) 处理结构竞争与WAW竞争⑵读操作数(read operands) 动态解决RAW竞争⑶执行(execution) ⑷写结果(write result) 处理WAR竞争记分牌重点掌握:38、下面我们来分析如图4-30所示得5个功能部件得记分牌数据结构与工作过程。

表4-24给出了执行下列简单得指令序列时记分牌得组成信息:LD F6,34(R2)LD F2,45(R3)MULTD F0,F2,F4SUBD F8,F6,F2DIVD F10,F0,F6ADDD F6,F0,F2表4-24 记分牌得组成结构指令状态记分牌构成分三个部分:1、指令状态。

指出指令工作处在上述四级中得哪一级。

2、功能部件工作状态。

指出功能部件得工作情况,每个功能部件需要指出九项相关参数。

Busy—指出功能部件地忙或空闲状态。

Op—功能部件所执行得操作类型。

F i—目得寄存器。

F j,F k—源操作数所用得寄存器。

Q j,Q k—产生源寄存器数据得功能单元。

R j,R k—指示源寄存器Fj,Fk准备就绪。

3、寄存器结果状态。

如果有一条已激活指令有一个目得操作数就是寄存器,则指出那个功能单元将写(操作)这个寄存器。

相应流水线记分牌得工作过程也分三步。

从表4-24可以瞧到,每条指令不论有没有发射,只要已取入流水线,在指令状态表中就有记录。

而每个功能部件在其状态表中只保持一条记录。

对于上述指令序列:指令状态寄存器表明第一条LD指令已经完成并且将结果写入了寄存器,而第二条LD指令已经执行完成,但还没有写结果。

第三、四、五条指令MULTD,SUBD与DIVD已经发射,但被暂停在读操作数这一级,等候其操作数得到来。

功能部件工作状态则表明第一个乘法单元在等整数单元取操作数F2,同样加法单元在等整数减法部件得操作数F2,除法部件在等第一个乘法部件得操作数F0。

加法指令ADDD被暂停发射,因为存在一个结构竞争,这个结构竞争就是减法指令引起得,等加法功能部件得减法指令执行完,功能部件竞争就会消除。

[例4-8] 我们假定浮点功能部件在EX级流水级其等待延迟时间,加法部件就是2时钟周期,乘法部件就是10时钟周期,则对表4-24记分牌记录得代码序列与初值数据结构,分析当前指令MULTD与指令DIVD继续执行各自进入写结果状态时记分牌得数据结构。

解:第二条指令LD给MULTD与SUBD指令带来了RAW型数据竞争,而指令MULTD给指令DIVD、指令SUBD给指令ADDD也带来了RAW型数据竞争。

在指令DIVD与ADDD之间存在着WAR数据竞争。

相关文档
最新文档