第一章 计算机系统结构的基本概念

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
具有相同系统结构的计算机可以采用不同的组成,一种计 算机组成可以采用多种不同的计算机实现; 采用不同的系统结构会使可以采用的组成技术产生差异, 计算机组成也会影响系统结构;
11
一种计算机系统结构,可以采用不同的组成
一种计算机系统结构 1. 设计指令系统 可以采用不同的组成 1. 指令间顺序执行 2. 指令间重叠执行 2. 乘法指令 1. 用加法器、移位器 2. 用专门乘法器 性能与价格 速度慢、价格低 速度快、价格高 速度慢、价格低 速度快、价格高 性能价格比、 乘法指令使 用频度 考虑因素 性能价格比
解:CPI1=100×2% + 4×23 % + 1.33×75%=3.92 CPI2 =4×25% + 1.33×75%=2
22
(2) 系统性能评价指标 MIPS(Million Instructions Per Second)每秒百万指令条数 IC fc MIPS = = 6 TCPU ×10 CPI ×10 6 MFLOPS(Million Floating Point Per Second)每秒百万浮点 操作次数
I FN MFLOPS = × 10 −6 TCPU
采用基准测试程序
最常见的测试程序组件是基于UNIX的SPEC,主要版本包括SPEC89、 SPEC92、SPEC95和SPEC2000等。
23
1.2.2 Amdahl定律 定律 加速比
若用T0表示某部件改进前执行某一任务所用的时间,Tn 表示改进后执行该任务所用的时间;Se表示可改进部件速 度提高的倍数,Fe表示可改进部件执行时间相对于T0 的比 值;则系统性能(或时间)加速比Sn的公式可表示如下:
17
冯泽云分类
提出用数据处理的并 行度来定量地描述各 种计算机系统特性。
WSBS(字串位串) WSBP(字串位并) WPBS(字并位串) WPBP(字并位并)
位片宽 WSBS
n
WSBP
m
WPBS WPBP
1
字宽
1 m’ n’
18
Leabharlann Baidu
1.2 计算机系统评测及定量设计原理
1.2.1 计算机系统性能评测 (1)CPU性能公式 (a) 一个程序所花的CPU时间: CPU :
3
第5级 虚拟机器 第4级 虚拟机器 第3级 虚拟机器 第2级 虚拟机器 第1级 实际机器 第0级 实际机器
应用语言机器级M5 具有L5机器语言(应用语言)
应用语言程序经应用程序 包翻译成高级语言程序 高级语言程序经编译程序翻译 成汇编语言(或是某种中间语 言程序,或是机器语言程序) 汇编语言程序经汇编程序 翻译成机器语言程序
CPU时间= CPU 时钟周期数 / 时钟频率f = CPU 时钟周期数 × 时钟周期 (b) CPI (Cycles Per Instruction) 每条指令平均时钟周期数 CPI= CPU 时钟周期数 / 指令条数IC 由(a) 、(b) 知
CPU时间 IC × CPI / f 时间= 时间
19
14
SM
PU1
IS CS DS DS1
MM1 MM2
PU2
DS2
CU
CS
CU MM
PU
PUn SISD
DSn IS
MMm
SIMD
CU:控制部件,PU:处理部件,MM:存储模块,SM:共享主存 IS:指令流,CS:控制流,DS:数据流
15
CS1
CU1 CU2
CS2
PU1 PU2
DS
SM
MM1
MM2
对于通用寄存器型机器,这些属性主要是指: 对于通用寄存器型机器,这些属性主要是指: (1) 数据表示 硬件能直接识别和处理的数据类型和格式) (硬件能直接识别和处理的数据类型和格式) (2) 寻址规则 包括最小寻址单元、寻址方式及其表示) (包括最小寻址单元、寻址方式及其表示) (3) 寄存器组织 (包括各种寄存器的定义、数量和使用方式) 包括各种寄存器的定义、数量和使用方式)
高级语言机器级M4 具有L4机器语言(高级语言)
汇编语言机器级M3 具有L3机器语言(汇编语言)
操作系统机器级M2 具有L2机器语言(作业控制语言等)
一般用机器语言程序解释 作业控制语句
传统机器语言机器级M1 具有L1机器语言(机器指令系统)
由微指令程序解释机器指令
微程序机器级M0 具有L0机器语言(微指令系统)
8
(4) 指令系统 包括机器指令的操作类型和格式、指令间的排序和控制机构等) (包括机器指令的操作类型和格式、指令间的排序和控制机构等) (5) 中断系统 中断的类型和中断响应硬件的功能等) (中断的类型和中断响应硬件的功能等) (6) 处理机工作状态的定义和切换方式 如管态和目态等) (如管态和目态等) (7) 输入输出系统 包括I/O连接方式、处理机/存储器与I/O I/O连接方式 I/O设备间数据传送的方式和 (包括I/O连接方式、处理机/存储器与I/O设备间数据传送的方式和 格式以及I/O操作的状态等) I/O操作的状态等 格式以及I/O操作的状态等) (8) 信息保护 包括信息保护方式和硬件对信息保护的支持) (包括信息保护方式和硬件对信息保护的支持)
1 Sn = = ≈ 156 . 0.4 0.64 0.6 + 10
25
1
Amdahl例2
假设某个测试程序中求浮点数平方根 FPSQR操作占整个测试程序执行时间的20%, 而所有浮点运算指令FP操作占整个程序执行时 间的50% 。 现有两种实现技术来提高系统性能,一种 是采用FPSQR硬件,使FPSQR操作的速度加快 到10倍。另一种实现方法是使所有浮点数据指 令的速度加快,使FP指令的速度提高到2倍。 请比较这两种设计方案。
26
Amdahl例2
解:分别计算出这两种设计方案所能得到 的加速比:
SPFPSQR = SPF = 1 (1− Fe ) + 1 (1− Fe ) + Fe Se Fe Se = = 1 ≈ 1.22 (1− 0.2) + 0.2 /10
1 ≈ 1.33 (1− 0.5) + 0.5 / 2
通过计算可以看出,使采用“提高FP指令的速度”,要比“FPSQR硬件” 方案好一些。
假设系统共有n种指令,第i种指令在程序中 出现的次数为Ii,则CPU时钟周期数为
∑ (CPI × I )
i =1 i i
n
即:
CPI =
∑ (CPI × I )
i =1 i i
n
IC
Ii = ∑ (CPI i × ) IC i =1
n
Ii IC 表示第i种指令在程序中所占的比例
20
举例1
一台40MHZ的处理机执行一标准测试程序,它含有的 的处理机执行一标准测试程序, 一台 各类指令条数和相应一条指令所需时钟周期数如下所示: 各类指令条数和相应一条指令所需时钟周期数如下所示:
12
1.1.4 计算机系统结构的分类
(1) Flynn分类法
弗林Flynn1966年提出按指令流和数据流的多倍性进行分类 指令流:是指机器执行的指令序列。 数据流:是指指令流调用的数据序列,包括输入数据和中 间结果。 多倍性:是指在系统性能瓶颈部件上处于同一执行阶段的 指令或数据的最大可能个数。
13
TCPU =
IC × CPI 100000 × 1 .55 = = 3 .875 × 10 − 3 S 6 f 40 × 10
21
举例2
假设在程序中浮点数开平方操作FPSQR操作的 比例为2%,它的CPI=100;其它浮点操作FP的比 例为23%,FP操作的平均CPI=4,其余75%指令的 平均CPI=1.33,计算该处理机的等效CPI,如果 FPSQR操作的CPI也是4,重新计算CPI
第一章 计算机系统结构的基本概念
吕友波 哈尔滨商业大学 计算机学院 2011年 2011年8月
1
目录
计算机系统的多级层次结构 计算机系统结构、组成与实现 计算机系统评测及定量设计原理 系统结构中的并行性发展和计算机系统 的分类
2
1.1 计算机系统结构概念
1.1.1 计算机系统的层次结构
1. 计算机系统=软件+硬件/固件 2. 计算机语言由低级向高级发展 高一级语言的语句相对于低级语言功能更强, 高一级语言的语句相对于低级语言功能更强,更便于应 但又都以低级语言为基础。 用,但又都以低级语言为基础。 3. 从计算机语言的角度,把计算机系统按功能划分成多级层次 结构。
Flynn分类
SISD 单指令流单数据流
传统的单处理机属于SISD计算机
SIMD 单指令流多数据流
并行处理机是SIMD计算机的典型代表 我国的YH-I型是此类计算机型
MISD 多指令流单数据流
宏流水线、脉动阵列流水
MIMD 多指令流多数据流
包括了大多数多处理机及多计算机系统 我国的YH-II型计算机是这种类型的计算机
指令类型 整数运算 数据传送 浮 点 控制传送 指令条数 45000条 32000条 32000 15000条 8000条 时钟周期数 1 2 2 2
求 CPI,MIPS和程序执行时间
解:
CPI =
45000 × 1 + 32000 × 2 + 15000 × 2 + 8000 × 2 = 1 .55 45000 + 32000 + 15000 + 8000
定义2 系统结构主要研究软硬件功能分配和对软硬件界面的 确定,是计算机软硬件的交界面。 确定,是计算机软硬件的交界面。
9
计算机系统的软、硬件成本变化
成本
硬件
软件
七十年代
年代
10
1.1.3 计算机组成和实现
计算机组成(Computer Organization)是计算 计算机组成 机系统结构的逻辑实现,包括机器级的数据流 和控制流的组成以及逻辑设计等。 计算机实现(Computer Implementation)是计算机 计算机实现 组成的物理实现,它着眼于器件技术和微组装 技术。
27
1.2.3 程序访问的局部性规律
局部性包含时间上的局部性和空间上的 局部性
时间局部性:程序中近期被访问的信息项很 可能马上将被再次访问。 空间局部性:指那些在访问地址上相邻近的 信息项很可能会被一起访问。


5
几点说明
虚拟机(Virtual Machine):用软件实现为主的机器 虚拟机 透明性 在计算机技术中,某种本来存在 本来存在的事物或属性,但从 本来存在 某种角度看好象不存在 不存在。例如,每一层“机器”上对应的 不存在 使用者只需要了解对应层次的语言,对下层的工作原理不 需了解和掌握。 同一功能可以由软件或硬件实现,软硬件在逻辑功能上是 等效的,只是性能和价格不同。
6
分层的优点
有利于人们正确理解计算机系统的工作, 明确软硬件和固件在计算机系统的地位和 作用 理解各种语言的实质及其实现 有利于探索虚拟机器新的实现途径,便于 设计新的系统 有助于理解计算机体系结构的含义,从而 合理地进行计算机系统的开发和设计。
7
1.1.2 计算机系统结构的定义
定义1 1964年 IBM/360系列机的总设计工程师Amdahl提出 系列机的总设计工程师Amdahl提出: 1964年,IBM/360系列机的总设计工程师Amdahl提出: Computer Architecture 为程序员所看到的计算机的属 性,即程序员为编写出能在机器上正确运行的程序所必须了 解的机器的概念性结构和功能特性。 解的机器的概念性结构和功能特性。
微指令由硬件直接执行
4
应用 软件 虚 拟 机 器 系统 软件
应用语言级 高级语言级 汇编语言级 操作系统级
L5虚拟机 翻译(应用程序包) 翻译(应用程序包) L4虚拟机 翻译(编译程序) 翻译(编译程序) L3虚拟机 翻译(汇编程序) 翻译(汇编程序) L2虚拟机 软 件
实 际 机 器
件 件
统机 级 程序机 级
T0 T0 1 = = S = n T T0 × (1 − Fe ) + T0 × Fe / S e (1 − Fe ) + Fe / S e n
24
Amdahl例1
假设将某系统的某一部件的处理速度加快到原 来的10倍,但该部件的原处理时间仅为整个运行时间 的40%,则采用加快措施后能使整个系统的性能提 高多少? 解:由题意可知:Fe=0.4, Se=10,根据Amdahl定 律
ISn
MMm
IS1
CUn
CSn
PUn
DS
IS2
MISD
CU:控制部件,PU:处理部件,MM:存储模块,SM:共享主存 IS:指令流,CS:控制流,DS:数据流
16
IS1
CS1
CU1 CU2
IS2 CS2
PU1 PU2
DS1 DS2
MM1 MM2
CUn
ISn
CSn
PUn
DSn
MMm
MIMD
CU:控制部件,PU:处理部件,MM:存储模块,SM:共享主存 IS:指令流,CS:控制流,DS:数据流
相关文档
最新文档