高可用集群软件的技术简介
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高性能计算集群技术(1) 高性能计算集群技术(1)
能力计算( Computing) 能力计算(Capability Computing)
是一种基于大规模数据的计算需求, 是一种基于大规模数据的计算需求,它通过专 用的并行计算软件, 用的并行计算软件,将复杂的计算并行推入到集群 中的各个节点上同时进行计算,其最终的目的是缩 中的各个节点上同时进行计算,其最终的目的是缩 短计算时间。 短计算时间。
非计划停机因素
• • • • 40% 40% 31% 20% 20% 9% 硬件故障 软件故障 用户错误 其他错误
9% 9%
20% %
31% %
40% %
关键业务停滞带来的潜在损失
• • • • • • • • • • 客户流失 错过商业机会 丧失在行业内地位 生产能力下降 恢复系统的额外支出
企 业 核 心 竞 争 力 急 剧 下 降
讲座提纲
• 集群技术介绍 • 集群技术分类 • LanderCluster技术实现
wenku.baidu.com
集群技术
什么是集群?
所谓集群, 所谓集群,就是共同为客 户机提供网络资源的一组计 算机系统。 算机系统。 而其中的每一台提供服 务的计算机, 务的计算机,我们称之为节 点。当一个节点不可用或者 不能处理客户的请求时, 不能处理客户的请求时,该 请求将会转到另外的可用节 点来处理, 点来处理,对这些对于客户 端来说, 端来说,它根本不必关心这 些要使用的资源的具体位置, 些要使用的资源的具体位置, 集群系统会自动完成。 集群系统会自动完成。
双机热备份系统
双机热备份系统是集群系统中最小运行模式, 双机热备份系统是集群系统中最小运行模式, 在该模式下中采用两台PC服务器做为主机系统, PC服务器做为主机系统 在该模式下中采用两台PC服务器做为主机系统,采 用硬件冗余的方式保障业务系统的可持续运行。 用硬件冗余的方式保障业务系统的可持续运行。
Transportation
集群技术分类
• 高可用性集群技术 • 高性能计算集群技术 • 高可扩展性集群技术
什么是高可用性集群系统
“当故障发生时,数据不会丢失, 当故障发生时,数据不会丢失,
系统也能够在一个可以接受的时间限 内快速恢复, 内快速恢复,那么这个计算机系统就 可以认为高可用性的。 可以认为高可用性的。”
联鼎软件 LANDER SOFTWARE [核心业务数据安全服务商]
联鼎软件概况
• 上海联鼎软件是专业的数据安全产品研发推广、数据安 全解决方案供应商,领先的数据安全服务商。公司成立 于2000年,致力于高端集群与主机防护产品研发、用户 系统安全维护、系统整合。 公司投资800万元专注于研 发自主产权的软件产品,树立国产高端系统软件品牌, 目前公司拥有LanderCluster-DN、LanderCluster-MN、 LanderGuard、LanderBoot等联鼎系列数据安全产品, 已成为国内服务器集群及数据安全领域的领军企业,增 强了中国民族软件产业的核心竞争力。联鼎软件在Unix、 Linux 、Windows底层开发,在数据安全服务、系统性能 优化方面有丰富的经验。
损 生 降
关键业务停滞带来巨大经济损失
Industry
• 任何的宕机都会造成严重 的损失,关键IT系统的故 障可能很快造成整个商业 运作的瘫痪,每一分钟的 宕机都意味着收入、生产 和利润的损失,甚至于市 场地位的削弱。
Business Operation Brokerage operations Credit card/sales authorization Pay-per-view television Home Shopping (TV) Home catalog sales Airline reservation
主要的目的: 主要的目的:增加计算和处理能力
集群技术的实现
LanderCluster体系结构 LanderCluster体系结构
Application Layer
Config Information Script Interface Profession Module
关键应用
Critical Business
Average Cost per Hour of Downtime $6.5 million
Financial
Financial
$2.6 million
Media
$1.1 million
Retail
$113.0 thousand $90.0 thousand $89.5 thousand
Retail
主要产品: 主要产品:
Oracle Parallel Server /Oracle Parallel Server
高可用集群技术(2) 高可用集群技术(2)
镜像技术
通过专业软件, 通过专业软件,系统将数据写入到本地磁盘的 同时,通过网络发送一份拷贝, 同时,通过网络发送一份拷贝,写入到对方服务器 上的相应目录中,使数据更新保持同步。 上的相应目录中,使数据更新保持同步。
网络适配器(HBA) 网络适配器(HBA)
该接口卡是操作系统对外提供服务的物理网络接口, 该接口卡是操作系统对外提供服务的物理网络接口,是构 造集群系统必需的硬件设备之一。 造集群系统必需的硬件设备之一。根据功能分为公用网络和私 有网络两种
集群网络接口
该接口是集群系统在物理网络接口的基础上实现的虚拟网 络接口(VIP) (VIP)。 络接口(VIP)。
主要应用领域
地质探井数据、气象预报、天体物理、 地质探井数据、气象预报、天体物理、流体力学 等密集型的计算业务。 等密集型的计算业务。
高性能计算集群技术(2) 高性能计算集群技术(2)
容量计算( Computing) 容量计算(Capacity Computing)
容量计算相对于能力计算来讲是一中较小规模的 计算需求。容量计算的主要目的在于: 计算需求。容量计算的主要目的在于:提高系统的 吞吐能力,以最短的时间执行更多的任务(交易) 吞吐能力,以最短的时间执行更多的任务(交易)。
集群软件
Manager Layer Control Layer
Storage Agent System Layer MLDC Protocols
Ladercluster
操作系统
Operation System
硬件环境
主机系统
根据业务系统的负载能力,配置相同性能的两台服务器, 根据业务系统的负载能力,配置相同性能的两台服务器,考虑 到硬件的差异,建议采用相同的配置。 到硬件的差异,建议采用相同的配置。 至少一个FC HBA卡或内置外接SCSI接口 卡或内置外接SCSI 至少一个FC HBA卡或内置外接SCSI接口 至少需要两个网络适配器。 至少需要两个网络适配器。
集群节点状态( Status) 集群节点状态(Node Status)
根据用户的具体需求,定义、分配共享存储资源, 根据用户的具体需求,定义、分配共享存储资源,存储集 群中的共享数据。集群系统对定义的共享设备进行监控和管理。 群中的共享数据。集群系统对定义的共享设备进行监控和管理。 保障该集群资源正常提供存储服务
主要应用领域
网络检索、远程医疗诊断、Web信息服务等通信 网络检索、远程医疗诊断、Web信息服务等通信 密集型处理任务
高性能计算集群, 高性能计算集群,英文原文为 High Performance Computing Cluster
高可扩展性集群技术就是带均衡策略(算法) 高可扩展性集群技术就是带均衡策略(算法)的 服务器群集。 服务器群集。负载均衡群集在多节点之间按照一定的 策略(算法)分发网络或计算处理负载。 策略(算法)分发网络或计算处理负载。负载均衡建 立在现有网络结构之上, 立在现有网络结构之上,它提供了一种廉价有效的方 法来扩展服务器带宽,增加吞吐量, 法来扩展服务器带宽,增加吞吐量,提高数据处理能 同时又可以避免单点故障。 力,同时又可以避免单点故障。
双机工作模式
在该模式下, 在该模式下,工作方式支持主从模式和对等模 即运行一个任务或两个任务。 式,即运行一个任务或两个任务。
多机集群系统
多机集群是将多台PC服务器纳入到一个大的管 多机集群是将多台PC服务器纳入到一个大的管 PC 理系统中,在该系统中, 理系统中,在该系统中,每台服务器运行各自的应 用子系统,同时又做为其它应用系统的备援节点, 用子系统,同时又做为其它应用系统的备援节点, 在硬件冗余上进一步提高
高可用性集群系统 (High Availability Cluster) 高可用系统是指以减少服务中断(宕机) 高可用系统是指以减少服务中断(宕机) 时间为目的的服务器集群技术 针对高可用性集群技术目前使用的较多的 是两个节点的系统。 是两个节点的系统。 主要的目的: 主要的目的:保障业务系统不间断运行
多级工作模式
在该模式下,工作方式支持主从模式、 在该模式下,工作方式支持主从模式、对等模 多机互备等模式,即运行一个任务或多个任务。 式、多机互备等模式,即运行一个任务或多个任务。
高可用集群技术(1) 高可用集群技术(1)
共享磁盘技术
允许所有服务器访问所有磁盘, 允许所有服务器访问所有磁盘,通过分布式锁 定管理器(DLM) 定管理器(DLM)来协调对共享磁盘的访问
数据库系统
根据应用系统的要求,安装相应的数据库版本, 根据应用系统的要求,安装相应的数据库版本,在配置数 据库时,要求两个节点间配置参数保持一致。在集群系统中, 据库时,要求两个节点间配置参数保持一致。在集群系统中, 需要将数据安装在共享磁盘阵列子系统上。 需要将数据安装在共享磁盘阵列子系统上。
集群资源- 集群资源-网络管理
主要产品: 主要产品:Microsoft
MSCS、LanderCluster、VERITAS VCS 、 、
高性能计算集群, 高性能计算集群,英文原文为 High Performance Computing Cluster 简称HPC Cluster, 简称HPC Cluster,是指以提高科学计算能 力为目的计算机集群技术。 力为目的计算机集群技术。 主要的目的: 主要的目的:提高计算处理能力
存储系统
按照业务系统的数据增长以及数据的保留时间, 按照业务系统的数据增长以及数据的保留时间,配置一定 容量的共享磁盘阵列子系统。该子系统接口至少有两个SCSI SCSI接 容量的共享磁盘阵列子系统。该子系统接口至少有两个SCSI接 口或1 FC接口 口或1个FC接口
软件环境
操作系统
根据业务系统所选择的操作系统,在实现HA系统时, 根据业务系统所选择的操作系统,在实现HA系统时,要求 HA系统时 两个节点的操作系统版本一致。并根据数据库系统及其HA HA系统 两个节点的操作系统版本一致。并根据数据库系统及其HA系统 的要求,安装相应的操作系统补丁程序, 的要求,安装相应的操作系统补丁程序,并根据数据库要求调 整系统参数
根据各个节点在集群中运行的状态, 根据各个节点在集群中运行的状态,动态更新整个集群状 对于影响集群服务的故障节点,则集群进行重组。 态,对于影响集群服务的故障节点,则集群进行重组。
集群资源- 集群资源-任务资源管理
集群网络资源
在集群系统中定义可用的物理网络适配器(NIC), 在集群系统中定义可用的物理网络适配器(NIC),和集群对 (NIC) 外服务的虚拟网络适配器(VIP) 集群运行时, (VIP)。 外服务的虚拟网络适配器(VIP)。集群运行时,需要对网络状态 进行监控和管理。保障该资源对外提供正常服务。 进行监控和管理。保障该资源对外提供正常服务。
主要产品: 主要产品:
BakBone 、Legato、CA、VERITAS 、 、
高可用集群技术(3) 高可用集群技术(3)
非共享技术
每台服务器有自己的系统盘和共享数据盘, 每台服务器有自己的系统盘和共享数据盘,但 对数据盘的操作以独占方式进行, 对数据盘的操作以独占方式进行,当服务器发生故 障时, 障时,数据盘的所有权自动漂移到对方接管
集群资源- 集群资源-状态管理
集群管理节点( Node) 集群管理节点(Command Node)
提供集群管理功能的节点。 提供集群管理功能的节点。它对集群中的任意一个节点进行 监视和操作,并处理集群中所有节点返回的状态和报警信息。 监视和操作,并处理集群中所有节点返回的状态和报警信息。
集群节点状态( Status) 集群节点状态(Node Status)