计算机系统结构课件第1章

合集下载

计算机组成原理第1章PPT课件

计算机组成原理第1章PPT课件

3.数据传输率与数据通路宽度 (1)数据通路宽度: 数据总线一次能并行 传输的数据位数。 (2)数据传输率(带宽):数据总线每秒 传输的数据量。
总线位数×总线时钟频率
总线带宽 =
8
(B/S)
主存带宽 =?
4.存储容量
1)主存容量
K、M、G、T
1024
指存储单元个数 × 位数。
决定地址位数
存储体
控制线路
数据寄存器 读/写线路
译码器
…………
地址寄存器
…………
存储体: 存放信息的实体。 寻址系统:对地址码译码,选择存储单元。 读/写线路和数据寄存器:完成读/写操作,暂 存读/写数据。 控制线路:产生读/写时序,控制读/写操作。 3)讨论 存储单元读/写原理、存储器逻辑设计
(3) 输入/输出设备 1)功能:转换信息。
换、逻辑控制等功能。
2.典型的硬件系统结构 (1)以总线为基础的系统结构 特点:结构简单、控制方便、扩展容易。
总线
部件 部件 部件
单总线结构 系统总线
CPU
M
接口
I/O
接口 I/O
(2)采用通道或IOP的系统结构 带通道的系统(图1-6)
主机
通道
I/O控制器
I/O
• 规模较小的系统可将通道部件设置在 CPU内部。
1.3.2 计算机的主要性能指标
1.基本字长 指操作数的基本位数。 和运算器、寄存器、总线有关,它影响
计算精度、指令功能。 8 — 16 — 32 — 64位
2. 运算速度 (1)定点/浮点四则运算时间
(2)每秒平均执行的指令条数(MIPS) (3)CPU时钟频率(Hz)
5M 100M 1G 2.0G 3.2G (4)典型程序执行时间 (5)每条指令平均执行周期.事先编制程序 2.事先存储程序 3.自动、连续地执行程序

教学课件 计算机系统结构--张晨曦

教学课件 计算机系统结构--张晨曦
确定计算机系统中软、硬件的界面,界面之上是软件实 现的功能,界面之下是硬件和固件实现的功能。
1.2.3 计算机组成和计算机实现
计算机系统结构:计算机系统的软、硬件的界面 即机器语言程序员所看到的传统机器级所具有的 属性。
1.2 计算机系统结构的概念 • 计算机组成:计算机系统结构的逻辑实现 • 包含物理机器级中的数据流和控制流的组成以及 逻辑设计等。 • 着眼于:物理机器级内各事件的排序方式与控制 方式、各部件的功能以及各部件之间的联系。
由同一厂家生产的具有相同系统结构、但具有 不同组成和实现的一系列不同型号的计算机。
例如,IBM公司的IBM 370系列,Intel公司的x86系列等。
1.2.4 计算机系统结构的分类
常见的计算机系统结构分类法有两种: Flynn分类法、冯氏分类法
1.2 计算机系统结构的概念
• 冯氏分类法
• 用系统的最大并行度对计算机进行分类。 • 最大并行度:计算机系统在单位时间内能够处理
• 解释:每当一条N+1级指令被译码后,就直接去执行一串等效的N级指令,然后 再去取下一条N+1级的指令,依此重复进行。
解释执行比编译后再执行所花的时间多,但占用的存储空间较 少。
1.2 计算机系统结构的概念 1.2.2 计算机系统结构的定义
• 计算机系统结构的经典定义
程序员所看到的计算机属性,即概念性结构与功能 特性。
第 6 级:应用语言虚拟机
第 5 级:高级语言虚拟机
第 4 级:汇编语言虚拟机 第 3 级:操作系统虚拟机
软件
第 2 级:机器语言(传统机器级) 硬件或固件
第 1 级:微程序机器级
1.2 计算机系统结构的概念
• 虚拟机:由软件实现的机器 • 语言实现的两种基本技术

计算机组成与系统结构图文 (1)

计算机组成与系统结构图文 (1)

⑦ HPCC:利用双精度矩阵乘法、傅立叶变换、并行矩阵 转置等七个子项全面评价系统的性能。
⑧ SAP SD:测试系统的响应时间及每小时完成的订单数, 用以衡量系统同时执行应用程序及数据库的能力。
第1章 绪 论
32
2) SPEC CPU 2000基准测试程序 SPEC成立于1988年,其全称最初是System Performance Evaluation Cooperative(系统性能评估合作社),现在已经更名 为Standard Performance Evaluation Corporation(系统性能评估 公司),先后开发出一系列的测试程序,其主要版本有SPEC CPU 89、SPEC CPU 92、SPEC CPU 95、SPEC CPU 2000等。
9
1.3 计算机的层次概念
1.3.1 计算机系统的层次结构 计算机系统的层次结构可用图1.2来表示。
第1章 绪 论
10
图 1.2 计算机系统的层次结构
第1章 绪 论
11
1.3.2 计算机系统结构、组成与实现 1. 计算机系统结构 今天的计算机系统结构所指的计算机的属性主要包括: ·数据的表示形式; ·寻址方式; ·内部寄存器组; ·指令集; ·中断系统; ·处理器工作状态及其切换; ·存储系统; ·输入/输出结构; ·信息保护及特权; ·高性能设计等。
解 因为
所以
PA TB 20 4 PB TA TA
即A完成该任务用时5 s。
TA=5 s
第1章 绪 论
28
3. 用测试程序来测评计算机系统性能
1) 基准测试程序 以往对计算机的测试采用过如下几种程序: ① 实际应用程序,即计算机工作的真实程序。 ② 修正的实际应用程序,即对真实程序进行其些修改构

计算机体系结构完整讲义ppt课件

计算机体系结构完整讲义ppt课件

• 计算机的更新换代
– 第一代:电子管计算机 – 第二代:晶体管计算机
硬件设计公理: 越小越快
– 第三代:中小规模集成电路
– 第四代:大或超大规模集成电路
– 第五代:VLSI(甚大规模集成电路)
计算机性能的大幅度提高和更新换代,一方面依靠 器件的不断更新,同时也依赖系统结构的不断改进。
30
二 按计算机系统成本分类
• 是对计算机系统中各机器级之间界面的划 分和定义,以及对各级界面上、下的功能 进行分配
– 1964年,IBM/360系列机的总设计工程师G.M. Amdahl、G.A. Blauw、F.P. Brooks等人提出。 也称体系结构。
– 是从程序员的角度所看到的系统的属性,是 概念上的结构和功能上的行为
• 1.2.2 计算机系统的设计方法
• ---软硬件舍取的基本原则 • ---计算机系统设计者的主要任务 • ---计算机系统设计的基本方法 (三种)
• 计算机语言:是用以描述控制流程的、 有一定规则的字符集合
– 语言不是专属软件范畴,可以介属于计算机 系统的各个层次,具有不同作用
4
1.1.1计算机系统的多级层次结构
从使用语言的角度上,将计算机系统 看成按功能划分的多级层次结构
机器、汇编、高级、应用语言
低级
高级
后者比前者功能更强、使用更方便;
而前者是后者发展的基础,在单条指令的 执行速度相比较,前者更快。
•第1章 •第2章 •第3章 •第4章 •第5章 •第6章
计算机系统设计基础 数据表示与指令系统性能分析 流水技术和向量处理 阵列计算机 多处理机系统 数据流计算机
1
第1章 计算机系统设计基础
• 1.1 计算机系统的基本概念 • 1.2 计算机系统的设计技术 • 1.3 计算机系统的性能评价 • 1.4 计算机系统结构的发展

第1章-计算机系统的基本构成-完整版

第1章-计算机系统的基本构成-完整版

运算器
运算器是完成运算功能的部件。
运算器中有一个算术逻辑单元(ALU), 它执行各种数据运算操作。
算术运算:加、减、乘、除、数据格式转 换。
ALU
逻辑运算:按位对数据进行与、或、非、
控制信号
移位等运算。
ALU是一个多功能的运算电路,进行何种
运算取决于由控制器发出的控制信号。
运算结果
缺点:所有设备都连在一组总线上,总线 只能分时工作,使数据传输量受限。
AB
CPU
RAM
ROM
I/O接口 IO设备
IO设备
DB CB
面向CPU的双总线结构
输入输出(I/O)总线
CPU
I/O接口 I/O接口
存储总线
I/O接口
主存
IO设备
IO设备
IO设备
通过存储总线使CPU对主存进行读/写操作。通过I/O总线让CPU与I/O设备 进行数据交换。
(1) DMA (Direct Memory Access)方式的提出
中断方式仍很费时,无法实现大容量的快速数据交换。
每进行一次传送,CPU都要执行一次中断服务程序,且都要保 护和恢复断点,及保护现场等。这些操作与数据传送并无直 接联系,但很费时。
1.3 计算机系统的历史与发展
1.1 计算机的基本构成
输入
存储器 运算器
控制器
数据线路 控制信号
输出
微型计算机
以微处理器为核心 配上由大规模集成电路的存储器
(ROM/RAM)、输入/输出接口(I/O)电 路及系统总线(BUS)等所组成的计算机。 将这些组成部分集成在一片超大规模集成电 路芯片上则构成单片微型计算机
第1章 计算机系统概论

计算机操作系统第四版-汤小丹-官方课件PPT-第1章

计算机操作系统第四版-汤小丹-官方课件PPT-第1章

2. 同时访问方式 系统中还有另一类资源,允许在一段时间内由多个进程 “同时”对它们进行访问。这里所谓的“同时”,在单处理 机环境下是宏观意义上的,而在微观上,这些进程对该资源 的访问是交替进行的。典型的可供多个进程“同时”访问的 资源是磁盘设备。一些用重入码编写的文件也可以被“同时” 共享,即允许若干个用户同时访问该文件。
1.2.4 分时系统(Time Sharing System) 1. 分时系统的引入 如果说推动多道批处理系统形成和发展的主要动力是提
高资源利用率和系统吞吐量,那么,推动分时系统形成和发 展的主要动力,则是为了满足用户对人—机交互的需求,由 此形成了一种新型OS。用户的需求具体表现在以下几个方面:
效地提高系统中的资源利用率,增加系统的吞吐量。 1. 并行与并发 并行性和并发性是既相似又有区别的两个概念。并行性
是指两个或多个事件在同一时刻发生。而并发性是指两个或 多个事件在同一时间间隔内发生。
2. 引入进程 在一个未引入进程的系统中,在属于同一个应用程序的 计算程序和I/O程序之间只能是顺序执行,即只有在计算程 序执行告一段落后,才允许I/O程序执行;反之,在程序执 行I/O操作时,计算程序也不能执行。但在为计算程序和I/O 程序分别建立一个进程(Process)后,这两个进程便可并发执 行。若对内存中的多个程序都分别建立一个进程,它们就可 以并发执行,这样便能极大地提高系统资源的利用率,增加 系统的吞吐量。
图1-6 多道程序的运行情况
2. 多道批处理系统的优缺点 多道批处理系统的优缺点如下: (1) 资源利用率高。引入多道批处理能使多道程序交替 运行,以保持CPU处于忙碌状态;在内存中装入多道程序可 提高内存的利用率;此外还可以提高I/O设备的利用率。 (2) 系统吞吐量大。能提高系统吞吐量的主要原因可归 结为:① CPU和其它资源保持“忙碌”状态;② 仅当作业 完成时或运行不下去时才进行切换,系统开销小。

计算机组成原理:第一章-计算机系统体系结构

计算机组成原理:第一章-计算机系统体系结构

一计算机系统体系结构1.1 什么是计算机体系结构本章的第一个概念是计算机系统(computer system)。

计算机系统包括读取并执行程序的中央处理单元(CPU,保存程序和数据的存储器以及将芯片转换为实用系统的其他子系统。

这些子系统会使CPU与显示器、打印机、Internet等外部设备之间的通信变得更加容易。

•cpu(处理器): 计算机实际执行程序的部分•微处理器: 在单个硅片上实现的CPU•微机: 围绕微处理器构建的计算机计算机的性能既取决于CPU;也取决于其他子系统。

如果不能高效进行数据传输,仅仅提高CPU的性能是毫无意义的。

Figure 1:•信息(程序和数据): 保存在存储器中;计算机会使用不同类型的存储器,达到不同的目的。

–如果不能叫信息保存在正确的存储器,那么CPU的速度再快也将毫无意义–Cache: 保存常用的数据是高速专用的存储器。

–主存: 存放大量的工作数据,断电消失–辅存: 指磁盘等,用于存储海量的数据。

永久存储•组成计算机的各个子系统通过总线连接在一起,数据通过总线从计算机中的一个位置传递到另一个位置。

什么是计算机Figure 2:•输入: 指用户交给计算机的信息•输出: 指计算机返回给用户的信息可编程计算机接收两种类型的输入: 它将要处理的数据,以及准确描述要如何处理输入数据的程序。

程序不过是计算机所执行的完成给定任务的操作序列。

Figure 3:•CPU读程序并完成程序指定的操作。

内部使用寄存器来保存数据•存储器系统保存两类信息:程序,程序处理或产生的数据计算机从存储器中读出指令并执行这些指令(即完成或执行指令定义的动作)。

执行指令时,可能要从存储器中读出数据,对数据进行操作,将数据写回存储器。

寄存器是CPU内部用来存放数据的存储单元。

时钟提供了脉冲流,所有内部操作都在时钟脉冲的触发下进行。

时钟频率是决定计算机速度的一个因素程序执行过程Figure 4:CPU先读取一条指令;在CPU分析或解码指令;从存储器中读出这条指令所需的所有数据。

第1章__计算机系统基础

第1章__计算机系统基础
36
1.3.2 指令和指令系统
指令:能被计算机识别并执行的二进制代码, 它规定了计算机能完成的某一种操作。
指令组成:操作码+操作数 指令系统:一台计算机所有指令的集合,包
括数据传送指令,数据处理指令,程序控制 指令,输入/输出指令和其他指令。
37
1.3.2 指令和指令系统
指令的执行:主要由“取指令”,“指令译码”, “指令执行”,“结果写回”四种基本操作构成, 这个过程不断重复进行。
超级计算机集群“红杉”(Sequoia)
21
1.2.2 大型计算机
我国国防科技大学研制的“天河1号”计算机, 2010年11月排名世界500强计算机第1名
“天河1号”计算机性能:
2560个计算节点,6144个3.0GHz的Intel Xeon处理 器,2560片显卡,内存总容量为98TB
点对点通信带宽:40Gbit/s 峰值计算速度:每秒钟2570万亿次。
49
1.4.2 CPU系统
CPU的组成
50
1.4.2 CPU系统
英特尔公司CPU产品
酷睿(Core)系列,主要用于台式微机和笔记本 微机。
至强(Xeon)系列,主要面向PC服务器。 凌动(Atom)系列,主要用于平板微机。
51
1.4.2 CPU系统
CPU技术性能
系统结构,指令系统,处理字长,工作频率,高 速缓存容量,加工线路宽度,工作电压等。
(2)硬盘 机械硬盘和电子硬盘(SSD)
63
1.4.4 存储系统
机械硬盘和电子硬盘的比较
64
1.4.4 存储器系统
硬盘容量
320GB,500GB,1TB,2TB或更高。
硬盘尺寸
3.5英寸、2.5英寸等。

第1章 计算机系统概述

第1章 计算机系统概述
令和控制信息,控制各部件协调工作。
2.运算器 运算器是对信息或数据进行处理和运算的部件
,经常进行的运算是算术运算和逻辑运算。
息的存储和交流的中心。 4.输入设备 输入设备用于输入原始数据和程序等信息。 常用的输入设备有键盘、鼠标、光电输入机 等。
3.存储器 存储器用来存储程序和数据,是计算机各种信
5.输出设备 输出设备用于输出计算结果和各种有用信息
第13页 2012年6月11日星期一
第1章
计算机系统概述
1982年采用大、中规模集成电路研制成16位 的DJS-150机。 1983年国防科技大学推出向量运算速度达一亿 次的银河I巨型计算机。1992年向量运算速度达10亿 次的银河Ⅱ投入运行。1997年银河Ⅲ投入运行,速 度为130亿次每秒,内存容量为9.15GB。 1999年具有世界水平的大规模并行计算机系统 神威I号研制成功,其最高运算速度达每秒3840亿次 浮点运算。 2002年,国内第一台万亿次超级计算机——联 想深腾诞生。
(1)计算机由运算器、控制器、存储器、输 入设备、输出设备五大部件构成。
(2)采用存储程序的方式,将程序和数据放 在同一存储器中,参加运算。 (3)采用二进制码表示数据和指令。 (4)指令由操作码和地址码组成。
(5)以运算器为中心,输入输出设备与存储 器间的数据传送都通过运算器。
第6页 2012年6月11日星期一
第15页 2012年6月11日星期一
第1章
2. 按用途分类:
计算机系统概述
通用计算机 :功能齐全、通用性强 ;
专用计算机 :功能单一、可靠性高,作为军 事、工业控制等方面的专用设 备;
一般所讲的计算机都是通用计算机 。
3. 按计算机的规模分类: 巨型机、大型机、中型机、小型机和微型机。

计算机01组成原理第一章PPT

计算机01组成原理第一章PPT
史准确无误地验证着
系统结构
基本概念
1.1 计算机的发展与应用
计算机从总体上来说分为两大类:
模拟计算机和数字计算机。
各自主要特点: 模拟计算机由模拟运算器件构成,其变量由连续量 (如:电压、电流等)来表示,运算过程也是连续的
数字计算机则是由逻辑电子器件构成,其变量为开 关量(离散的数字量),采用数字式按位运算,运算 模式是离散式的
系统结构
基本概念

国际TOP500组织本月 2015年7月13日在德国举 行的 2015 年国际超级计算机大会上发布全球超 级计算机500强最新榜单,中国“天河二号”以 每秒3.386万万亿次的浮点运算速度第五次蝉联 冠军。该计算机由国防科技大学与中国的IT公司 浪潮合作制造。天河二号包含16000个计算机节 点,其中每个节点都包含两个 Intel Ivy Bridge Xeon处理器和三个Xeon Phi高性能计算卡。
系统结构
基本概念
冯·诺依曼
20 世纪 30 年代中期,冯·诺依曼大胆
的提出 : 抛弃十进制,采用二进制作为 数字计算机的数制基础。同时,他还说: 预先编制计算程序,然后由计算机来按 照人们事前制定的计算顺序来执行数值 计算工作。
系统结构
基本概念
根据冯诺依曼体系结构构成的计算机, 必须具有如下功能:
灵测验”。
系统结构
基本概念
阿兰·图灵(Alan Turing)

1945年,图灵被调往英国国家物理研究所工作。他
结合自己多年的理论研究和战时制造密码破译机的
经验,起草了一份关于研制自动计算机器(ACE: Automatic Computer Engine )的报告,以期实 现他曾提出的通用计算机的设计思想。图灵预言, 总有一天计算机可通过编程获得能与人类竞争的智

第1章-计算机系统结构(第五版)李学干【可编辑全文】

第1章-计算机系统结构(第五版)李学干【可编辑全文】

3.
1) 系列机只能在系统结构相同或相近(允许向后稍许发展) 的机器之间实现汇编语言软件的移植。 要求原来在B机器上运行的应用软件,能移植到有不同 系统结构的A机器上,根据层次结构概念,可把B机器的机器 语言看成是在A机器的机器语言级之上的一个虚拟机器语 言,在A机器上用虚拟机概念来实现B机器的指令系统,如图 1 - 6所示。
图 1-6 用模拟方法实现应用软件的移植
如果能直接用微程序去解释B机器的指令,如图1 - 7所 示,显然就会加快这一解释过程。
仿真和模拟的主要区别在于解释用的语言。仿真是用微 程序解释,其解释程序存在于控制存储器中; 而模拟是用机 器语言程序解释,其解释程序存在于主存中。
3) 不同系列间的软件移植一般是仿真和模拟并行。
TCPUICCPI1fc
假设系统共有n种指令,第i种指令的时钟周期数为 CPIi,第i种指令在程序中出现的次数为Ii,则
TCP U i n1 (CP iIIi)1 fc
这样
n
CP Ii1CIC P iIi i n1CP iIIIiC
为了反映程序的运行速度,通常引入如下一些定量指
(1) MIPS(Million Instructions Per Second,百万条指令 数每秒)
1 MFLOPS≈3 MIPS
2. 在设计计算机系统时,一般应遵循如下的定量设计原
理:
(1) 哈夫曼(Huffman)压缩原理。 (2) Amdahl定律。 性能可改进比fnew是系统性能可改进部分占用的时间与未 改进时系统总执行时间的比值,显然,0≤fnew≤1。部件加速 比rnew是系统性能可改进部分在改进后性能提高的比值。不 难看出,rnew>1
1.1 计算机系统的层次结构 1.2 计算机系统结构、计算机组成和计算机实现 1.3 计算机系统的软、硬件取舍和性能评测及定量设计原理 1.4 软件、应用、器件的发展对系统结构的影响 1.5 系统结构中的并行性开发及计算机系统的分类 1.6 本章小结

计算机系统结构 第 1 章 基本概念

计算机系统结构 第 1 章 基本概念
26
Flynn计算机分类举例
类型 SISD SIMD
计算机的型号 IBM 370,VAX 11/780,MC 680X0,INTEL 80X86
ILLIAC-IV,ICL-DAP,CRAY-1, YH-1(银河1),CYBER-205, CM-2 MIMD IBM 370/168,Cmmp,CRAY XMP,YH-2(银河2)
• 对于系统程序员,系统结构是不透明的,组成 和实现是透明的; • 对于应用程序员(一般指高级应用程序员),系 统结构、组成和实现均是透明的
2014-3-7 19
• 例:某机主存容量为32MB ——系统结构问题 • 采用模4交叉存储方式——组成问题 • 使用1M×4位的存储芯片组装——实现问题。
• 例:某机设有乘法指令——系统结构问题 • 采用布斯乘法算法和阵列乘法器实现乘法 运算——组成问题 • 选用4位阵列乘法器芯片组装——实现问题
计算机组成
• 1.计算机组成的定义
• 计算机组成是计算机系统结构的逻辑实 现。包括机器内部的数据流、控制流的 形成与逻辑设计。
• 计算机组成的内容对机器语言程序员一 般是透பைடு நூலகம்的。
2014-3-7
16
2.计算机组成的主要内容
• • • • • • • • • (1)数据通路宽度 组 (2)功能部件的设置 成 (3)系统内部并行性的确定 原 (4)各种操作对功能部件的共享程度 理 (5)可靠性技术的应用 (6)缓冲、排队、预估、预测技术的应用的 (7)存储器逻辑组织方式及速度的确定 总 (8)控制器的逻辑结构及组成方式 结 (9)功能部件的互连方式及总线结构
2014-3-7
14
2.
• • • • • • • • •

计算机组成与结构第1章 计算机系统概述

计算机组成与结构第1章 计算机系统概述
45
计算机的过去
根据逻辑元件,计算机的发展划分为四代: 第一代(1946年~1958年)是电子管计算机 第二代(1959年~1964年)是晶体管计算机 第三代(1965年~1970年)是集成电路计算机 第四代( 1971年以后)是大规模和超大规模集成电路计算机
从1946年计算机诞生以来,大约每五年运算速度提高10倍,可 靠性提高10倍,成本降低10倍,体积缩小10倍。60多年来计算 机的发展过程,是在冯 · 诺依曼型计算机结构的基础上,紧紧围 绕提升运算速度、扩大存储容量、降低制造成本、提高系统可靠 性和使用的方便性为目的,不断采用新器件和研制新软件的过程。
23
二、计算机的分类
计算机从总体上分: • 模拟计算机、数字计算机(数字计算机俗称电脑)
计算机从用途上分: • 通用机、专用机
数字计算机按性能进一步分: • 巨型机、大型机、中型机、小型机、微型机、单片机
24
计算机的应用
1.科学计算 2.信息管理 3.过程检测与控制 4.计算机辅助工程 5.人工智能方面的
目前绝大多数计算机仍然建立在存储程序、程序控制概念的基础 上,称为冯·诺依曼型计算机。
28
外设
四、计算机的硬件组成
Байду номын сангаас输入设备
存储器
辅助存储器
输出设备
主存储器
主机
运算器
控制器
CPU
控制 数据 地址/指令
29
1、运算器
运算器的功能是执行算术运算、逻辑运算以及数据 转换,更复杂的运算分解成这些基本运算来实现。
计算机组成与结构第1章 计算机系统 概述
为什么要开设“计算机组成与结构”
重要的专业基础课有:
数据结构
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i 1 i
T
i
T
最大并行度的表示方法:
处理机名(m,n)
冯泽云分类法(续)
按冯泽云分类法,可分为:
(1)字串位串 (WSBS) 串行计算机;m=1,n=1;如:EDVAC(1,1)
(2)字并位串 (WPBS) 传统单处理机;m=1,n>1;如:Pentium(32,1) (3)字串位并 (WSBP) 并行计算机、MPP、相联计算机;m>1,n=1; 如:MPP(1,16384),STARAN(1,256) (4)字并位并 (WPBP) 全并行计算机;m>1,n>1; 如:ASC(64,32),IILIAC IV(64,64),PEPE(32,288), Cmmp(16,16) 主要缺点: 仅考虑数据并行,没有考虑指令的并行
第1章 计算机系统结构的基本概念
本章要回答的问题是: 什么是“计算机系统结构”? 研究的主要问题是什么? 与其他课程的关系如何?
1.1 计算机系统结构
1 计算机系统的层次结构 虚拟计算机: 从不同角度所看到的计算机系统属性是不同的 主要观察者: 应用程序员、高级语言程序员、汇编语言程序员、系 统管理员、硬件设计人员 对计算机系统的认识应该建立在某一个层次上
( 4 25% ) ( 1.33 75%) 2.0
25%
F
其他操作 CPI 其他 = 1.33 CPI 原系统 =2.0
改进方案 1: 将FP中的FPSQR的CPI由原来的20变为2。
FP操作,25%
改进前:
23%
2%
75%
FPSQR操作,CPI=20 CPI 原系统 =2.0
M M … M M
CU1 CU2 … CUn
DS1 DS2
PU1
PU2 … PUn
IS1
IS2
IS2
ISn
DSn
ISn
控制部件和处理部件均并行工作,多数据流
Flynn分类法的特点
(1)应用广泛 (2)分类太粗 在SIMD中包括有多种处理机 对流水线处理机的划分不明确,标量流水线为SISD,向 量流水线为SIMD (3)根本问题是把两个不同等级的功能并列对待,数据流 受指令流控制,造成MISD不存在 (4)非冯计算机的分类?其他新型计算机的分类
或: 定义: CPI: IC: 则:
每条指令执行时所花费的平均时钟周期数 程序执行的指令条数
CPI=CPU时钟周期数 / IC CPU时钟周期数=CPI×IC CPU时间 =(CPI×IC)/频率
CPI是评价CPU性能的重要指标 例: 8088 CPI=20
80486 Pentium II CPI=2 CPI=0.3
分析: 尽管将该部件的速度加快了10倍,但整个系统的加速比 仅提高了1.56倍。 原因:该部件的原处理时间仅为整个运行时间的40%,所 占比例不大。
例1.2 求浮点数的平方根(FPSQR),设其占整个时间的20%。 方案1: 改进硬件,速度加快10倍。 方案2: 改进FP指令,速度加快2倍。设FP指令占50% 解: 按方案1 可改进部分 20% 不可改进部分 80% 1/10 不可改进部分 80%
Flynn(弗林)分类法 基本思想: 按照指令流和数据流的多倍性特征进行分类 指令流:机器执行的指令序列。 数据流:由指令流调用的数据序列。 多倍性(multiplicity):在系统性能瓶颈部件上同时处 于同一执行阶段的指令或数据的最大可能个数。
四种类型: 单指令流单数据流 SISD 单指令流多数据流 SIMD 多指令流单数据流 MISD 多指令流多数据流 MIMD
例: Cray1: 1个CPU, k =1 , k′=1 12个相当于ALU或PE的处理部件,d = 12 最多8级流水线, d′=8 字长为64位,w = 64 可以实现1~14位流水线, w′= 1~14 则Cray1表示为: t(Cray1)=( 1,12×8,64(1~14) )
1.2
计算机系统的设计技术
提高CPI的途径: 提高CPU频率、减少指令条数。 为了计算CPI,要计算CPU时钟周期总数:
n
CPU时钟周期总数 (CPI i I i )
而: CPU时间 [ (CPIi I i )] 时钟周期长度
n i 1 i 1
所以: CPI
(CPI I )
i 1 i i
DS1 DS2 DSn
MM … MM
Flynn(弗林)分类法(续) (3) 多指令流单数据流 MISD
DS
MM …
IS1
CU1 CU2 … CUn
DS
PU1 PU2
IS2
ISn
MM
PUn
控制部件和处理部件均并行工作,单数据流
Flynn(弗林)分类法(续) (4) 多指令流多数据流 MIMD
IS1
冯泽云分类法
基本思想
用最大并行度对计算机系统进行分类
最大并行度Pm: 单位时间内能处理的最大二进制位数。 设同时处理的字宽为n,位宽为m,则最大并行度定义为: Pm=m×n
平均并行度Pa:设每个时钟周期 △ti 内能同时处理的二进位数为 Pi ,则 T 个时钟周期内的平均并行度为:
Pa
P t
4 计算机系统结构的分类 通常分类
(1) 按性价比划分 以性能为特征,按价格来划分: 巨型、大型、中型、小型、 微型机。 问题:划分的标准是随时间而变化,每5年左右降低一个等级。 (2) 按应用领域划分
科学计算、事务处理、实时控制、工作站、服务器、家用计算机等。
(3) 按应用领域划分 单处理机、并行处理机、多处理机、分布处理机、关联处理 机、超标量处理机、超流水线处理机、SMP(对称多处理机)、 MPP(大规模并行处理机)、机群(Cluster)系统等。
例1.1
假设将某系统的某一部件的处理速度加快到10倍, 但该部件的原处理时间仅为整个运行时间的40%,则采 用加快措施后能使整个系统的性能提高多少? 解: 已知:Fe =0.4,Se=10,求Sn。依 Amdahl定律: 1 Sn 1.56 1 0.4 0.4 / 10
可改进部分 40% 不可改进部分 60% 1/10 不可改进部分 60%
透明性: 定义:本来存在的事物或属性,从某种角度看似乎不存在 例:CPU类型、型号、主存储器容量等 对应用程序员 对系统程序员、硬件设计人员等 例:浮点数表示、乘法指令 对高级语言程序员、应用程序员 对汇编语言程序员、机器语言程序员 例:数据总线宽度、微程序 对汇编语言程序员、机器语言程序员 对硬件设计人员、计算机维修人员
1.2.2 CPU的性能公式
(1) CPI ——每条指令执行时所花费的平均时钟周期数 基本概念 CPU时间: 一个程序所花的CPU时间,不包括I/O等待时间 CPU时钟周期: CPU运行的时钟的周期,是频率的倒数 CPU时间 = CPU时钟周期数/频率 CPU时间 = CPU时钟周期数×时钟周期长
已知:Fe =0.4,Se=10,则:
按方案2
Sn
1 1.22 1 0.2 0.2 / 10
可改进部分 50%
不可改进部分 50%
1/2
已知:Fe =0.5,Se=2,则:
不可改进部分 50%
1 Sn 1.33 1 0.5 0.5 / 2
分析:
方案2成本较低,且效果更好。
—— 加快经常性事件原理
在计算机系统结构中,加快经常性事件的速度原理是普遍 原则,Amdahl定律就是用来解决这个问题的。
Amdahl定律:
系统中某一部件,由于采用某种更快的执行方式后,整个系统性 能的提高与这种执行方式的使用频率或占用总执行时间的比例有关, 用加速比
Sn
表示:
加速比: Sn = 改进后的性能/改进前的性能 或: Sn = 改进前执行某任务时间/改进前执行某任务时间
Handler (汉德勒 )分类法
基本思想
根据并行度和流水线分类 把计算机硬件结构分成三个层次,并分别考虑它们的可并行性和 流水处理程度: (1)程序级k:程序控制部件(PCU)的个数; (2)操作级d:算术逻辑部件(ALU)或处理部件(PU)的个数; (3)逻辑级w:每个算术逻辑部件包含的逻辑线路(ELC)的套数。
基本观念: 计算机系统由软件、硬件和固件组成,它们在功能上是同 等的。 同一种功能可以用硬件实现,也可以用软件或固件实现。 但他们的系统结构是相同的。 基本问题: 不同的组成将导致不同的性能和价格 系列计算机概念: 相同系统结构,不同组成和实现的一系列计算机系统
3 计算机组成与实现 计算机组成(Computer Organization) 内容: 计算机系统结构的逻辑实现。如:确定数据通路的宽度; 各种操作对功能部件的共享程度;专用的功能部件;功能部 件的并行度;设计缓冲和排队策略;设计控制机构;采用何 种可靠性确定技术 计算机实现 内容: 计算机组成的物理实现。处理机、主存储器等部件的物 理结构。如:器件的集成度和速度;专用器件的设计;器件、 模块、插件、底版的划分与连接;信号传输技术;制造工艺 及技术等
Amdahl定律:
T0 改进前执行时间 改进前: 改进后:
A:
可改进部分
B:改进后
C:不可改进部分
C:不可改进部分
Tn 改进后执行时间 定义 Fe = A / T0, 即可改进部分占的比例, ≤1 Se = A / B,即改进前后的比例, ≥1 于是, Amdahl定律写为: 加速比:
T0 1 Sn Tn (1 Fe ) Fe / Se
改善系统结构的性能的主要目标: “快” 器件“快”
器件的发展会受到器件自身制造工艺的影响,存在极限
结构“快” 处理: 采用并行处理的方式(指令、时间、空间)
存储: Cache,存储容量大,可靠性高
传输: 传输快,准确
相关文档
最新文档