chapter7-1 多处理机 计算机体系结构课件

合集下载

计算机体系结构-第7章 多处理机

计算机体系结构-第7章  多处理机
ห้องสมุดไป่ตู้
第7章 多处理机
主 CPU
主存
CIOP
高速系统总线 BIOP NIOP GIOP
ACOP
CIOP----字符处理机 BIOP----数组处理机 NIOP----网络处理机 GIOP----图形处理机 ACOP----向量加速处理机
图7.5 异构非对称式多处理机的一般结构
第7章 多处理机
2. 松耦合(loosely coupled)多处理机 松耦合多处理机是通过消息传递方式来实现处理机间的相互通 信的。 而每台处理机是由一个独立性较强的计算机模块组成,该模 块由处理器、较大容量的本地存储器(在运算时所需的绝大部分的 指 令 和 数 据 均 取 自 本 地 存 储 器 ) 、 I/O 设 备 以 及 与 消 息 传 递 系 统 (Message Transfer System,MTS)相连的接口组成。当不同模块上 运行的进程间需要通信时,可通过网络接口电路及消息传递系统 进行信息交换。由于这种相互间的耦合程度是很松散的,因此称 之为松耦合多处理机。 松耦合多处理机可分为非层次式和层次式两种结构。
第7章 多处理机
(5)合理地进行资源分配和任务调度。 在MIMD多处理机中,由于任务的大小不相同, 各处理机的速度也可能不相同(如异构型多处理机系统), 互连网络的拓扑结构和通信延迟在不同的多处理机中 也有很大的差别,在执行并发任务时,并不是使用的 处理机个数越多,系统获得的性能就越高。因此需要 采用软件手段,合理地进行资源分配和任务调度,否 则系统性能将受较大影响。而在SIMD并行处理机中, 程序员只需用屏蔽的手段来设置部分处理单元为不活 跃状态,来控制实际参加并行操作的处理单元数目。
因此,Cm*是一个三层总线多处理机,三级的访 存时间分别为:计算机模块内3.5μs,计算机模块群内 9.3μs,而群间则为26μs。

计算机系统体系结构(大学课件)

计算机系统体系结构(大学课件)

常见的计算机系统体系结构类型
1
单指令流单数据流 (SISD)
SISD是最简单的计算机系统体系结构类型,
单指令流多数据流 (SIMD)
2
所有指令和数据都在一条单向流水线上 处理。
SIMD是一种并行计算机系统体系结构类
型,多个处理器同时进行同一种操作。3Biblioteka 多指令流单数据流 (MISD)
MISD是一种不常见的计算机系统体系结
计算机系统体系结构的组成
处理器和指令集
处理器是计算机系统的核心 部件,指令集是处理器所能 识别的一组机器指令,决定 了计算机能够进行的操作类 型和范围。
存储器和主存储器层次 结构
存储器是计算机系统的重要 组成部分,主存储器层次结 构包括寄存器、高速缓存、 内存、辅助存储器等。
输入输出设备和接口
输入输出设备是计算机与外 部环境交互的方式之一,接 口是计算机系统各个组成部 分之间传递信息的桥梁。
计算机系统体系结构
从基础到入门,深入讲解计算机系统体系结构的重要性和应用领域,让你深 入了解计算机内部的原理和工作方式。
定义和概述
定义
计算机系统体系结构是计算机各个部分组成结构的 总称,包括处理器、存储器、输入输出设备等,是 计算机硬件系统的基本组成部分。
概述
计算机系统体系结构是计算机学科中最重要也是最 基本的研究领域之一,它研究计算机系统各个组成 部分的结构、功能、性能以及它们之间的联系和相 互作用。
20世纪60年代提出的计算机指令和数据流水线技术, 将计算机运行速度提升到了新的高度。
总结
总的来说,计算机系统体系结构是计算机科学中最重要的研究领域之一,让 我们更深入了解计算机内部的原理和工作方式。
构类型,多个处理器同时进行不同操作,

计算机体系结构完整讲义ppt课件

计算机体系结构完整讲义ppt课件

• 计算机的更新换代
– 第一代:电子管计算机 – 第二代:晶体管计算机
硬件设计公理: 越小越快
– 第三代:中小规模集成电路
– 第四代:大或超大规模集成电路
– 第五代:VLSI(甚大规模集成电路)
计算机性能的大幅度提高和更新换代,一方面依靠 器件的不断更新,同时也依赖系统结构的不断改进。
30
二 按计算机系统成本分类
• 是对计算机系统中各机器级之间界面的划 分和定义,以及对各级界面上、下的功能 进行分配
– 1964年,IBM/360系列机的总设计工程师G.M. Amdahl、G.A. Blauw、F.P. Brooks等人提出。 也称体系结构。
– 是从程序员的角度所看到的系统的属性,是 概念上的结构和功能上的行为
• 1.2.2 计算机系统的设计方法
• ---软硬件舍取的基本原则 • ---计算机系统设计者的主要任务 • ---计算机系统设计的基本方法 (三种)
• 计算机语言:是用以描述控制流程的、 有一定规则的字符集合
– 语言不是专属软件范畴,可以介属于计算机 系统的各个层次,具有不同作用
4
1.1.1计算机系统的多级层次结构
从使用语言的角度上,将计算机系统 看成按功能划分的多级层次结构
机器、汇编、高级、应用语言
低级
高级
后者比前者功能更强、使用更方便;
而前者是后者发展的基础,在单条指令的 执行速度相比较,前者更快。
•第1章 •第2章 •第3章 •第4章 •第5章 •第6章
计算机系统设计基础 数据表示与指令系统性能分析 流水技术和向量处理 阵列计算机 多处理机系统 数据流计算机
1
第1章 计算机系统设计基础
• 1.1 计算机系统的基本概念 • 1.2 计算机系统的设计技术 • 1.3 计算机系统的性能评价 • 1.4 计算机系统结构的发展

《计算机体系结构》课件

《计算机体系结构》课件

ABCD
理解指令集体系结构、处 理器设计、存储系统、输 入输出系统的基本原理和 设计方法。
培养学生对计算机体系结 构领域的兴趣和热情,为 未来的学习和工作打下坚 实的基础。
CHAPTER
02
计算机体系结构概述
计算机体系结构定义
计算机体系结构是指计算机系统的整 体设计和组织结构,包括其硬件和软 件的交互方式。
CHAPTER
06
并行处理与多核处理器
并行处理概述
并行处理
指在同一时刻或同一时间间隔内 完成两个或两个以上工作的能力

并行处理的分类
时间并行、空间并行、数据并行和 流水并行。
并行处理的优势
提高计算速度、增强计算能力、提 高资源利用率。
多核处理器
1 2
多核处理器
指在一个处理器上集成多个核心,每个核心可以 独立执行一条指令。
间接寻址
间接寻址是指操作数的有效地址通过寄存器间接给出,计算机先取出 寄存器中的地址,再通过该地址取出操作数进行操作。
CHAPTER
04
存储系统
存储系统概述
存储系统是计算机体系结构中 的重要组成部分,负责存储和 检索数据和指令。
存储系统通常由多个层次的存 储器组成,包括主存储器、外 存储器和高速缓存等。
《计算机体系结构》ppt 课件
CONTENTS
目录
• 引言 • 计算机体系结构概述 • 指令系统 • 存储系统 • 输入输出系统 • 并行处理与多核处理器 • 流水线技术 • 计算机体系结构优化技术
CHAPTER
01
引言
课程简介
计算机体系结构是计算机科学的一门核心课程,主要研究计算机系统的基本组成、组织结构、工作原 理及其设计方法。

计算机系统结构—第七章(多处理机)

计算机系统结构—第七章(多处理机)

4 之 1
基本原理
本方法只适用于采用基于总线互连结构 的系统中,由于系统中每个处理机都能觉察 到存储器系统正在进行的活动,在某个活动 破坏了Cache的一致性时, Cache控制器 将采取相应的动作使有关的拷贝无效或更新。
《Computer Architecture》V3
幻灯片 19/75
同济大学.电子与信息工程学院.计算机科学与工程系
利用多任务处理可以提高处理速度,利
用系统的重组能力可以提高可靠性。
《Computer Architecture》V3 幻灯片 2/75 同济大学.电子与信息工程学院.计算机科学与工程系
本章内容
2 之 2
提 示
因为多处理机系统结构是一个巨大而多
样的领域,其中很多领域仍处于不成熟的阶
段,所以本课程集中于多处理机设计的主流
《Computer Architecture》V3
幻灯片 13/75
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>一致性问题>>Cache一致性>>原因分析
共享可写数据引起的 不一致性
不同处理器对相同单元在各自Cache的拷贝 的异步写操作。
处理机
Cache 共享存 储器 P1 P2 P1 P2 P1 P2
《Computer Architecture》V3 幻灯片 23/75 同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>一致性问题>>Cache一致性>>解决方法>>监听协议
2 之 1
采用写回策略的
Cache
WL RL,WL 读写 RR WL WR 无效 WR RL 只读 RL,RR

计算机体系结构课件

计算机体系结构课件
向量处理器广泛应用于高性能计算、科学计算、图像处理等领域,是计算机体系结构优化的重要方向之 一。
05
计算机体系结构的发展趋势
多核处理器
总结词
多核处理器技术是计算机体系结构的重要发 展趋势之一,它通过将多个处理器核心集成 到一个芯片上,提高了计算机的处理能力和 能效。
详细描述
随着集成电路技术的发展,多核处理器已成 为现实,并广泛应用于各类计算机系统中。 多核处理器可以同时执行多个线程,提高了 并行处理能力,使得计算机在处理复杂任务 时更加高效。
存储器是计算机中用于存储数据和指令的部件。
详细描述
存储器分为不同的类型,如随机存取存储器(RAM)、只读存储器(ROM)和高速缓存等。它们以二进制的形 式存储数据和指令,并允许对存储的数据进行读取、写入和修改等操作。
控制器
总结词
控制器是计算机中协调各部件工作的部件。
详细描述
控制器负责控制计算机中各个部件的工作流程,确保它们按照正确的顺序和时间进行操作。它通常由 指令计数器、指令寄存器和控制逻辑等组成,能够解析指令并协调各部件的工作。
硬件虚拟化技术
总结词
硬件虚拟化技术是计算机体系结构的另一重要发展趋势,它通过虚拟化技术将物理硬件 资源抽象成虚拟资源,实现了资源的共享和灵活配置。
详细描述
硬件虚拟化技术可以使得多个操作系统在同一物理硬件上运行,并且每个操作系统都认 为自己拥有完整的硬件资源。这不仅提高了硬件资源的利用率,还增强了系统的可靠性
03
计算机体系结构决定了计算机 的能耗和成本,对于现代计算 机系统来说,能耗和成本是非 常重要的考虑因素。
计算机体系结构的分类
1 2
根据指令集体系结构的分类
可以分为复杂指令集计算机(CISC)和精简指令 集计算机(RISC)。

计算机体系结构第七章 多处理机

计算机体系结构第七章 多处理机
第七章 多处理机
一、多处理机的特点
1、多处理机的定义 具有两台以上的处理机,在操作系统控制下通过 共享的主存或输入输出子系统或高速通讯网络进 行通讯。实现指令以上级(任务级、作业级)并 行。 按照Flynn分类法,多处理机系统属于MIMD计算 机。 多处理机系统由多个独立的处理机组成,每个处 理机都能够独立执行自己的程序。
K1
若采用平均分配策略:
RETCT2(11) N 2N N
五、多处理机操作系统
主从型(Master-slave Supervisor) 各自独立型(Separate Supervisor) 浮动型(Floating Supervisor)
主从型
管理程序只在主处理机运行 硬件结构管理控制简单,对主处理机要
求高 适用于工作负荷固定,从处理机能力明
显低的紧耦合、异构型、非对称多处理 机系统 实现简单,经济方便,但不够灵活。
各自独立型
每个处理机有独立的管理程序在运行 管理程序可再入,可靠性高,系统表格
少,系统效率高,实现复杂,访存冲突 解决和负载较困难 适合于松耦合多处理机
浮动型
管理程序在多个处理机间浮动 管理程序可再入,实现复杂,负载平衡
当机数由N台增加到N+1台时,总运行 时间的减少量为:
E(T 1 1 )C ETC N N1 N(N1)
令其>=0,有 N ET
临界值
C
3、额外开销与计算工作重叠
假定额外工作被计算工作完全覆盖,则 总运行时间为:
Rma E*x m {IaK)xC 2 ,(K N 1IK(TIK)}
平均分配
RETCT2 CT2 N 2 2N
简单起见,设T是N的整数倍

计算机系统的组成演示课件

计算机系统的组成演示课件
件。
功能
输入设备包括键盘、鼠标 、扫描仪等;输出设备包
括显示器、打印机等。
组成
输入输出设备通过接口与 计算机连接。
总线与接口
定义
总线是计算机中用于连接各个部 件的通道;接口是计算机中用于
连接外设的接口。
功能
总线负责传输数据和控制信号; 接口负责连接外设和与计算机进
行通信。
组成
总线由多个信号线组成,常见的 总线包括数据总线、地址总线和 控制总线;接口包括串口、并口
、USB接口等。
03
软件系统
系统软件
操作系统
提供计算机系统的基本功能,如文件管理、设备管理、进 程管理、内存管理等。常见的操作系统有Windows、 Linux等。
开发工具
用于开发应用程序的软件,如编译器、调试器、集成开发 环境等。
数据库管理系统
用于管理数据存储、检索和分析的软件,如Oracle、 MySQL等。
器、嵌入式设备和桌面计算机。
03
macOS
macOS是苹果公司开发的操作系统,专为Mac电脑设计。它具有优雅
的用户界面、强大的多媒体和图形处理能力,以及与苹果硬件的完美配
合,是高端计算机用户的首选之一。
应用程序的分类与特点
01 应用程序分类
02 应用程序特点
03 针对性强
04 易于使用
05 功能丰富
小型机
结构简单,价格低廉,适用于中小型企业 和学校的计算需求。
工作站
具有较高的运算速度和较大的存储容量, 适用于图像处理和多媒体应用。
个人计算机
体积小,价格适中,操作简便,适用于个 人和家庭使用。
02
硬件系统
中央处理器
定义

计算机体系结构课件

计算机体系结构课件
详细描述
输入输出系统是计算机中用于接收外部输入(如键盘、鼠标、传感器等)和输 出数据(如显示器、打印机、音响等)的硬件设备。输入输出系统的性能和可 靠性对计算机的整体性能和使用体验至关重要。
总线与接口
总结词
总线与接口是计算机中用于连接各个部件并进行通信的通道。
详细描述
总线与接口是计算机中各个部件之间进行通信的通道。总线是连接各个部件的公共通道,而接口则是 连接外部设备和计算机的通道。通过总线与接口,各个部件之间可以相互通信并协同工作,实现计算 机的整体功能。总线与接口的性能和稳定性对计算机的整体性能和使用体验至关重要。
长电池寿命。
扩展功能
03
通过增加输入输出接口、支持多种数据类型等,可以扩展计算
机的功能和应用范围。
计算机体系结构的分类
1 2
按指令集分类
可以分为复杂指令集计算机(CISC)和精简指令 集计算机(RISC)。
按数据类型分类
可以分为固定长度数据和可变长度数据。
3
按寻址方式分类
可以分为直接寻址、间接寻址和基址加变址寻址 等。
03
计算机指令系统
指令集架构
ቤተ መጻሕፍቲ ባይዱ
复杂指令集架构 (CISC)
提供了许多复杂的指令,能够执行各种高级操作。
精简指令集架构 (RISC)
只包含简单的、基本的指令,强调通过并行处理加快执行速度。
超长指令集架构 (VLIW)
通过将多个操作数和操作码放入一个指令,实现并行处理。
指令格式与寻址方式
固定长度的指令格式
可重构计算面临着能效、可扩展性、编程模型等方面的挑 战,如何设计更高效的
THANKS
感谢观看
详细描述
存储器是计算机中用于存储数据和程序的硬件设备。根据存储速度、容量和价格的不同,计算机中存在多种类型 的存储器,如随机存取存储器(RAM)、只读存储器(ROM)、高速缓存(Cache)等。存储器的容量和速度 对计算机的性能有很大的影响。

计算机系统结构课件第7章

计算机系统结构课件第7章
序段,其书写的顺序反映了该程序正常执行的顺序。为了便于
分析,设Pi和Pj程序段都是一条语句,Pi在Pj之前执行,且只讨
论Pi和Pj之间数据的直接相关关系。实际上,Pi和Pj即使表面上 没有数据相关,也可能通过它们之间的其他语句形成间接的数 据相关关系 .
第7章 多处理机 (1) 如果 Pi 的左部变量在 Pj 的右部变量集内,且 Pj 必须取出 Pi
运算的结果来作为操作数,就称Pj“数据相关”于Pi。
Pi A=B+D
Pj
C=A*E
相当于流水中发生的“先写后读”相关。 顺序串行运行
Pi A新=B原+D原 Pj C新=A新*E原=(B原+D原)*E原
第7章 多处理机 如果让Pi和Pj并行,Pj的C新成了A原*E原,显然不是应有的结果, 因此Pi和Pj是不能并行的。如果将Pi和Pj执行顺序颠倒,交换串
需 7 级运算,如图 7.17(a)所示。利用交换律和结合律改写为
E2=(a+h)+b((c+g)+def)
第7章 多处理机
图 7.17 利用交换律和结合律降低树高
第7章 多处理机 利用分配律进一步降低树高,在恰当平衡各子树的级数的 情况下, 往往能收到较好的效果。例如上式,计算(c+g)的子 树时只用一级,而计算def的子树要用 2 级,相加乘b需再增加 2 级。如果把b写进括号内,则计算bdef仍用 2 级已够,却省去 了后来的一次乘b,使总级数由 5 减为 4。因此,将上式改写 成 E2=(a+h)+(bc+bg)+bdef
余和增大系统总的信息传送率。日本的实验多处理机 EPOS 采用的是四总线方式。德国西门子公司的结构式多处理机 SMS采用的是八总线方式。 而上节介绍的Cm*多微处理机则 采用分级的多总线方式。

《计算机体系结构》课件

《计算机体系结构》课件

计算机体系结构的应用领域
1
云计算
了解云计算架构的特点和应用领域,
物联网
2
如基础设施即服务(IaaS)和软件 即服务(SaaS)。
探索物联网架构的设计原则和适用
场景,如智能家居和智慧城市。
3
人工智能
了解人工智能系统的计算机体系结 构,包括深度学习和神经网络。
总结和展望
通过本课件,我们深入了解了计算机体系结构的定义、重要性、经典模型和 应用领域。希望这些知识能够帮助您更好地理解和应用计算机体系结构的原 理和思想。
3
多核处理器
了解多核处理器的原理,以及如何充分利用多核架构提高系统性能。
计算机体系结构的演进
主机计算机时代
个人计算机时代
回顾早期大型计算机的发展, 如IBM System/360系列。
介绍个人计算机的崛起,如 IBM PC和Apple Macintosh。
云计算时代
探索云计算的概念和发展, 如Amazon Web Services和 Microsoft Azure。
《计算机体系结构》PPT 课件
欢迎来到《计算机体系结构》PPT课件!在这里,我们将深入探讨计算机体系 结构的定义、重要性、经典模型以及应用领域。让我们一起展望计算机体系 结构的未来吧!
课程介绍
探索计算机架构的奥秘
了解计算机体系结构的基本概念和学习目标,以及如何应用这些知识。
重要性与应用
探索计算机体系结构在各个领域中的重要性和应用,如云计算、物联网和人工智能。
2 可伸缩性
计算机体系结构的合 理设计可以实现系统 的可扩展性,适应不 断增长的需求。
3 可靠性
合理的计算机体系结 构可以提高系统的可 靠性,减少故障和中 断。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

16
总线仲裁算法
计 算


❖ 静态优先级算法:为每一个连到总线的部件分配一
统 结
固定的优先级,例如:串行链接、独立请求结构 构
❖ 固定时间片算法:把总线按固定大小时间片,轮流 提供给部件使用
适合同步总线,时钟同步
❖ 动态优先级算法:让总线上各部件优先级可根据情 况按一定规则动态地改变
近期最少使用法,循环串行链法
存中同一个信息块在多个Cache中都有时,会出
现信息块内容不一致情况;
❖写直达法---保证一个;
进程迁移----将一个尚未执行完而被挂起的进程 调度到另一个空闲的处理机上去执行;
通过输入/输出操作改变内存
32
多Cache的一致性问题的解决办法
计 算


❖ 1 解决进程迁移引起的多Cache不一致性
22
计 算 机 系 统 结 构
四端口存储器形式的结构
23
蠕虫穿洞寻径网络
计 算


❖ 机间采用小容量缓冲存储器,实现消息分组
统 结
寻径存储转发之用

❖ 曙光1000多处理机
24
开关枢纽结构形式
计 算


❖ 把互连结构的开关设置在各个处理机或其接
统 结
口内部,组成分布式结构。

❖ 美国加州大学伯克利分校设计的树形多处理 机X-TREE
结 构
全映象目录表法
❖ 表中每项有N个标志位对应于多处理机中全部N台处理机的Cache。 系统中全部Cache均可同时存有同一个信息块的副本。
有限目录表法
❖ 表中每项的标志位少于N个。因此,限制了一个数据块在各 Cache中能存放的副本数目。
链式目录表法
❖ 它把目录分散存放在各个Cache中,主存只存有一个指针,指向 一台处理机。要查找所有放有同一个信息块的Cache时,先找到 一台处理机的Cache,然后顺链逐台查找,直到找到目录表中的 指针为空时为止。
❖ 高位交叉:按物理地址顺序从模块0到模块 m-1依次连续分布。
连续
多处理机中采用高位交叉;
27
模块0 0 m
im
模块1 1
m+1
im+1

模块m-1
算 机
m-1
系 统
2m-1
结 构
(i+1)m-1
(n-1)*m
(n-1)*m+1
模块内部单元号 模块号
log2n
log2m
m个模块的低位交叉编址
n*m-1
❖ 使用场合:使用于在处理机机数很多的分布 式多处理机场合
25
3 存储器的组织
计 算


❖ 并行存储器的构成
统 结
❖ 多Cache的一致性问题

26
并行存储器的构成
计 算


❖ 有高位交叉和低位交叉
统 结
❖低位交叉:按物理地址顺序轮流地分布在 构
各个存储模块中。
不连续,步距为m
向量、流水或阵列处理机中采用低位交叉
统 结
不同处理机间或者通过通道互连实现通信, 构
以共享某些外部设备;或者通过消息传送系
统(MTS)连接来交换信息。
❖ 可看成分布系统;
12
计 算 机 系 统 结 构
通过消息传送系统连接的松耦合多处理机结构
13



❖ 处理机之间的连接频带比较低


通过输入输出接口连接,处理机间互为外围设备进行连接
❖ 当通信速度要求更高时,可以通过一个通道和仲裁 开关CAS(Channel and Arbiter Switch)直接载存储 器总线之间建立连接。CAS中有一个高速的通信缓 冲存储器。
14
2 机间互联形式
计 算


❖ 总线ቤተ መጻሕፍቲ ባይዱ式
统 结
❖ 环形互连形式

❖ 交叉开关形式
❖ 多端口存储器形式
❖ 蠕虫穿洞寻径网络
36
3 以软件为基础解决Cache一致性
计 算


❖ 利用软件限制,不把一些公用的可写数据存入
统 结
Cache中

❖ 例编译时,把信息分为能存入Cache和不能存 入Cache的两部分
37
小结
计 算


❖ 硬件方法------通讯量大,处理机数多时复杂;统 结
❖ 软件方法------减少复杂,降低通讯量,性能 构
❖ 使用场合:处理机机数较多的场合
20
计 算 机 系 统 结 构
交叉开关形式
21
多端口存储器形式
计 算


❖ 如果每个存储器模块有多个访问端口,且将
统 结
分布在交叉开关矩阵中的控制、转换和优先 构
级仲裁逻辑分别移到相应存储器模块的接口
中,就构成多端口存储器形式。
❖ 使用场合:机数少的多处理机场合
算 机

❖ 监视Cache协议(Snoopy Protocol)法:
统 结
各个处理机中的Cache控制器随时都在监视着其 构
它Cache的行动。对于采用总线互连共享主存的
多处理机, 可利用总线的播送来实现。
写作废法、写更新法
35



❖ 目录表法:
系 统
建立目录表,有选择的通知其它Cache该信息块作废或更新
2
§7.1多处理机的概念、问题和硬件结构
计 算


❖ 定义:多处理机具有两个以上的处理机,在
统 结
操作系统控制下,通过共享的主存或输入/ 构
输出子系统或高速通信网络进行通信。
多任务处理,协同求解,提高速度;
利用冗余,提高可靠性、适应性、可用性。
❖ 组成分类:同构型、异构型、分布型
❖ 属于多指令流、多数据流系统(MIMD)
28
模块0 0 1
i
模块1 n
n+1
n+i

模块m-1
算 机
(m-1)*n


(m-1)*n+1 结 构
(m-1)n+i
n-1
2n-1
模块号 模块内部单元号
log2m
log2n
m个模块的高位交叉编址
M*n-1
29




❖ 本地存储器(HomeMemory):放置处理机
统 结
执行进程要用到的绝大多数页面的那个存储 构
3
计 算 机 系 统 结 构
计 算 机 系 统 结 构
多处理机存在的技术问题
计 算


❖ 硬件结构上如何解决处理机、存储器模块及I/O子 统
系统之间的互连
结 构
❖ 如何最大限度地开发系统的并行性,实现多处理机 各级的全面并行;
❖ 如何分割任务的大小,任务的粒度大小;
❖ 如何协调好处理机中各并行执行的任务和进程间的 同步问题;

例如,IBM公司的机器,都可以通过通道到通道的连接器CTC把两个 构
不同计算机系统的IOP连接起来。
❖ 通过并口或串口把多台计算机连接起来
例如,用串口加一个MODEL拨号上网,也可以直接连接;多台计算 机之间的连接需要有多个接口。
❖ 通过Ethernet网络接口连接多台计算机 速度达10Mb、 100Mb、1Gb,Mynet已经达到1.28Gb和2.56Gb。
统 结
❖ 2 以硬件为基础实现多Cache的一致性

❖ 3 以软件为基础实现多Cache的一致性
33

1 解决进程迁移引起的多Cache不一致性
算 机

❖ 对于进程迁移的Cache不一致性----禁止进程
统 结
迁移, 或者进程挂起时,用硬件强行把Cache 构
块写回主存;
34

2 以硬件为基础实现多Cache的一致性
❖ 如何将各个任务分配到一个或多个处理机上,解决 好处理机调度、任务调度和资源分配问题,防止死 锁;
❖ 系统发生故障,系统如何重新组织,正常工作
6
多处理机的硬件结构
计 算


❖ 紧耦合和松耦合
统 结
❖ 机间互联形式----性能的重要因素

❖ 存储器组织
7
1 紧耦合多处理机
计 算


❖ 是通过共享主存来实现处理机间通讯,通信
❖ 开关枢纽结构形式
15
总线形式
计 算


❖ 多个处理机、存储器模块和外围设备通过接口与公
统 结
用总线相连,采用分时或多路转接技术传送。 构
❖ 结构简单,成本低,增减模块方便,但对总线的 失效敏感。
❖ 提高总线的系统效率方法:
采用优质高频同轴电缆,使用光纤; 采用多总线方式减少冲突概率;
❖ 使用场合:只使用处理机数较少的场合
❖ 先来先服务算法:按接受到访问总线请求先后顺序 来响应
17
环形互连形式
计 算


❖ 总线形成环形互连。
统 结
❖ 令牌(Token)

❖ 点点连接,物理参数容易控制
❖ 使用场合:高通信带宽的光纤通信;
❖ 总线形式必须在原来的信息不在总线上时, 才可以发送新的信息。环形不需要如此。
18
计 算 机 系 统 结 构
通过映象部件MM把处理机访问逻辑地址变换 成局部物理地址、主存地址、Cache
通过互连网络寻找合适的路径,并分解访问存 储器的冲突
相关文档
最新文档