第八部分多计算机系统-资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/4/11
• 负载均衡
• 负载平衡就是将各个任务均衡得分布到集 群系统的各处理结点,以充分利用系统资源 ,提高各结点的利用率和整个系统的吞吐率 。
• 衡量负载平衡的指标
• ①吞吐率:系统上运行的应用程序的响应时 间或平均完成时间。
• ②可扩展性¬:系统规模增大或总负载大小 变化时系统负载平衡的适应能力。
2020/4/11
CP U
Cache
存储器
NIC
PCI
CP U
Cache
存储器
NIC
PCI
交换机
CP U
Cache
Βιβλιοθήκη Baidu存储器
NIC
PCI
CP U
Cache
存储器
NIC
PCI
•
构成集群的每台计算机都被称为一个结点。每个
结点都是一个完整的系统,拥有本地磁盘和自己的完
整的操作系统。除了PC外,集群的结点还可以是工作
2020/4/11
• 实现负载均衡的任务调度算法 • ①静态调度:在编译时根据用户程序
中的各种信息(如各个任务的计算量大 小、依赖关系和通信关系等)和并行系 统的状况(如网络结构、各处理结点计 算能力等)对用户程序中的并行任务作 出静态的分配策略
•
2020/4/11
• ②动态调度方法:通过分析并行系统的 实时负载信息,动态地将任务在各处理 机之间进行分配和调度,以消除系统中 负载分布的不均衡
第八章 多计算机系统
• 8.1 集群计算机系统结构 • 8.2 典型集群系统实例 • 8.3 MPP系统 • 8.4 网格技术 • 8.5 网格实例
2020/4/11
第一节 集群计算机系统结构
• 集群系统就是多个独立计算机的集合 。
• • 本节将从集群系统的基本概念开始,
对集群系统的结构、集群系统的特点、 集群间通信、集群间资源管理和任务调 度以及集群间并行程序设计环境等问题 分别进行介绍
2020/4/11
• 1. 集群系统的基本概念和结构 • 集群系统由将多个高性能的工作站或
高档微型计算机,使用高性能网络互连 在一起,协同完成特定的并行任务. • 它是一种造价低廉、易于构建且具有 较好可扩放性的体系结构。集群系统中 的主机和网络可以是同构的,也可以是 异构的。下图为一个包含四节点的集群 系统
• ②精简通信协议。第一方面是功能的精 简,删除不必要的功能呢,第二方面是 协议层次的精简,合并协议各层的功能 呢,使得通信协议变为一层,以达到减 少数据传输次数的目的。
• ③Active Message通信机制
• Active Message是消息驱动的异步通 信方式。
•2020/4/11 Active Message的通信原理如下:
2020/4/二11 是简化了对通信数据的缓冲管理。
• 4. 集群系统资源管理和调度 • 集群操作系统 • 是在各结点的操作系统之上再构建一
层操作系统来管理整个集群,即建立一 个全局UNIX,用来解决集群系统中所有 资源管理,包括组调度、资源分配和并 行文件系统等。这就是集群操作系统。 集群操作系统须具有以下特性:
2020程/4/11 序员和用户来说,集群系统是一个整体
• 2. 集群系统的特点 • 与传统并行计算机系统相比,集群系
统具有许多优点: • 系统开发周期短 • 可靠性高 • 可扩缩性强 • 性价比高 • 用户编程方便
2020/4/11
• 集群不足之处:
• 由于集群由多台完整的计算机组成, 它的维护相当于要同时管理多个计算机 系统,因此维护工作量较大,维护费用 也较高。对称多处理机则相对较好,因 为管理员只要维护一个计算机系统即可 。正因为如此,现在很多集群采用对称 多处理机作为结点,这样可以减少结点 数量,从而减少维护工作量和降低开支 。
• 消息除包含通常的数据项外,还增加 了两项:消息处理程序指针Handler和参 数。当消息达到目的结点时,结点处理 机立即产生中断调用,由该消息的 Handler启动相应的消息处理程序。消息 处理程序的功能是从网卡上取出该消息 并给发送方发送一个应答消息,然后返 回原来被中断的程序。
•
• Active Message通信机制有两个突出 特点:一是消息驱动的异步通信方式,
• 静态调度在高度并行环境下不够均衡 不准确,造成资源利用不足
• 动态调度会给集群带来额外的计算开 销
2020/4/11
• 5. 集群系统并行程序设计环境
站,甚至是规模较大的对称多处理机。
2020/4/11
•
集群的每个结点一般通过商品化网络连接在一起,
如以太网、FDDI、Myrinet等,部分商用集群也采用专
用网络连接,如SP Switch,Crossbar等。网络接口与
结点I/O总线以松散耦合的方式相连,如图中的NIC与
PCI。
• 从结构上看,集群系统属于分布存储 系统,由建立在通用操作系统之上的并行 编程环境完成系统的资源管理及相互协作 ,同时也屏蔽工作站和网络的异构性。对
共享介质型的快速以太网和基于开关型 的ATM和Myrinet,极大地提高了通信频 宽。 • 设计新的通信协议以降低通信延迟 ▪ ①在用户空间实现通信协议:直接对网 络硬件设备进行必要的操作,减少通信 数据的拷贝次数,提高通信效率;二是 减少对操作系统调用的额外时间开销; 三是用户态协议可根据用户的实际应用 2020/4/1需1 求来设计,减少协议不必要的冗余。
2020/4/11
• 3. 集群系统的通信技术 • (1)现有集群一般是使用商用以太网连
接,通信协议使用的TCP/IP.集群通信具 有以下缺点: • 网络通信频宽低 • 多层结构的TCP/ICP协议处理开销大 • 协议复杂的缓冲管理增加了网络延迟 • 操作系统的额外开销
2020/4/11
• (2) 提高集群通信效率的方法 • 采用新型高速网络以提高网络通信频宽 • 目前出现了多种新型的高速网络,如
2020/4/11
• 单一系统映像(Single System Image,SSI )
• 1.单一入口点:用户连接到集群而不是某个 具体结点;
• 2.单一文件系统:用户看到单个目录和文件 层次;
• 3.单一作业管理系统:用户可以透明地从任 一结点提交作业,作业能在整个集群系统中 透明地竞争资源。
• 4.单控制点:用户可以从控制工作站单点控
• 负载均衡
• 负载平衡就是将各个任务均衡得分布到集 群系统的各处理结点,以充分利用系统资源 ,提高各结点的利用率和整个系统的吞吐率 。
• 衡量负载平衡的指标
• ①吞吐率:系统上运行的应用程序的响应时 间或平均完成时间。
• ②可扩展性¬:系统规模增大或总负载大小 变化时系统负载平衡的适应能力。
2020/4/11
CP U
Cache
存储器
NIC
PCI
CP U
Cache
存储器
NIC
PCI
交换机
CP U
Cache
Βιβλιοθήκη Baidu存储器
NIC
PCI
CP U
Cache
存储器
NIC
PCI
•
构成集群的每台计算机都被称为一个结点。每个
结点都是一个完整的系统,拥有本地磁盘和自己的完
整的操作系统。除了PC外,集群的结点还可以是工作
2020/4/11
• 实现负载均衡的任务调度算法 • ①静态调度:在编译时根据用户程序
中的各种信息(如各个任务的计算量大 小、依赖关系和通信关系等)和并行系 统的状况(如网络结构、各处理结点计 算能力等)对用户程序中的并行任务作 出静态的分配策略
•
2020/4/11
• ②动态调度方法:通过分析并行系统的 实时负载信息,动态地将任务在各处理 机之间进行分配和调度,以消除系统中 负载分布的不均衡
第八章 多计算机系统
• 8.1 集群计算机系统结构 • 8.2 典型集群系统实例 • 8.3 MPP系统 • 8.4 网格技术 • 8.5 网格实例
2020/4/11
第一节 集群计算机系统结构
• 集群系统就是多个独立计算机的集合 。
• • 本节将从集群系统的基本概念开始,
对集群系统的结构、集群系统的特点、 集群间通信、集群间资源管理和任务调 度以及集群间并行程序设计环境等问题 分别进行介绍
2020/4/11
• 1. 集群系统的基本概念和结构 • 集群系统由将多个高性能的工作站或
高档微型计算机,使用高性能网络互连 在一起,协同完成特定的并行任务. • 它是一种造价低廉、易于构建且具有 较好可扩放性的体系结构。集群系统中 的主机和网络可以是同构的,也可以是 异构的。下图为一个包含四节点的集群 系统
• ②精简通信协议。第一方面是功能的精 简,删除不必要的功能呢,第二方面是 协议层次的精简,合并协议各层的功能 呢,使得通信协议变为一层,以达到减 少数据传输次数的目的。
• ③Active Message通信机制
• Active Message是消息驱动的异步通 信方式。
•2020/4/11 Active Message的通信原理如下:
2020/4/二11 是简化了对通信数据的缓冲管理。
• 4. 集群系统资源管理和调度 • 集群操作系统 • 是在各结点的操作系统之上再构建一
层操作系统来管理整个集群,即建立一 个全局UNIX,用来解决集群系统中所有 资源管理,包括组调度、资源分配和并 行文件系统等。这就是集群操作系统。 集群操作系统须具有以下特性:
2020程/4/11 序员和用户来说,集群系统是一个整体
• 2. 集群系统的特点 • 与传统并行计算机系统相比,集群系
统具有许多优点: • 系统开发周期短 • 可靠性高 • 可扩缩性强 • 性价比高 • 用户编程方便
2020/4/11
• 集群不足之处:
• 由于集群由多台完整的计算机组成, 它的维护相当于要同时管理多个计算机 系统,因此维护工作量较大,维护费用 也较高。对称多处理机则相对较好,因 为管理员只要维护一个计算机系统即可 。正因为如此,现在很多集群采用对称 多处理机作为结点,这样可以减少结点 数量,从而减少维护工作量和降低开支 。
• 消息除包含通常的数据项外,还增加 了两项:消息处理程序指针Handler和参 数。当消息达到目的结点时,结点处理 机立即产生中断调用,由该消息的 Handler启动相应的消息处理程序。消息 处理程序的功能是从网卡上取出该消息 并给发送方发送一个应答消息,然后返 回原来被中断的程序。
•
• Active Message通信机制有两个突出 特点:一是消息驱动的异步通信方式,
• 静态调度在高度并行环境下不够均衡 不准确,造成资源利用不足
• 动态调度会给集群带来额外的计算开 销
2020/4/11
• 5. 集群系统并行程序设计环境
站,甚至是规模较大的对称多处理机。
2020/4/11
•
集群的每个结点一般通过商品化网络连接在一起,
如以太网、FDDI、Myrinet等,部分商用集群也采用专
用网络连接,如SP Switch,Crossbar等。网络接口与
结点I/O总线以松散耦合的方式相连,如图中的NIC与
PCI。
• 从结构上看,集群系统属于分布存储 系统,由建立在通用操作系统之上的并行 编程环境完成系统的资源管理及相互协作 ,同时也屏蔽工作站和网络的异构性。对
共享介质型的快速以太网和基于开关型 的ATM和Myrinet,极大地提高了通信频 宽。 • 设计新的通信协议以降低通信延迟 ▪ ①在用户空间实现通信协议:直接对网 络硬件设备进行必要的操作,减少通信 数据的拷贝次数,提高通信效率;二是 减少对操作系统调用的额外时间开销; 三是用户态协议可根据用户的实际应用 2020/4/1需1 求来设计,减少协议不必要的冗余。
2020/4/11
• 3. 集群系统的通信技术 • (1)现有集群一般是使用商用以太网连
接,通信协议使用的TCP/IP.集群通信具 有以下缺点: • 网络通信频宽低 • 多层结构的TCP/ICP协议处理开销大 • 协议复杂的缓冲管理增加了网络延迟 • 操作系统的额外开销
2020/4/11
• (2) 提高集群通信效率的方法 • 采用新型高速网络以提高网络通信频宽 • 目前出现了多种新型的高速网络,如
2020/4/11
• 单一系统映像(Single System Image,SSI )
• 1.单一入口点:用户连接到集群而不是某个 具体结点;
• 2.单一文件系统:用户看到单个目录和文件 层次;
• 3.单一作业管理系统:用户可以透明地从任 一结点提交作业,作业能在整个集群系统中 透明地竞争资源。
• 4.单控制点:用户可以从控制工作站单点控