双机热备份软件介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
双机热备份软件介绍
1、PrimeCluster(PCL)HA集群软件产品概述
PrimeCluster HA(PCL HA)是德国富士通-西门子计算机公司(Fujitsu-Siemens Computers)提供的业界领先的支持双机热备和多节点集群的高可用管理软件。
PCL HA是一种应用与系统高可用性(High Availability)管理器。它为关键业务应用及其相关资源提供了能够持续访问的平台。PCL HA可为任何类型的应用、服务或数据提供最通用的高可用性环境。最主要的优点在于自动识别系统故障及组件错误,并具有诸如透明本地恢复或应用故障转移(Failover)等合适的恢复措施。PCL HA拥有多方向故障转移功能——集群内任一节点均可接管其他节点的功能。若特定服务器出现故障,它所运行的应用会分配给余下正常运行的服务器,使管理员能灵活而有效地应用系统资源。由于应用可通过管理干预转移到其他服务器,这样就能在不中断操作的情况下对集群进行扩容。
PCL HA for Linux同目前市场上其他的基于开放源代码的HA软件不同,PCL是由FSC完全自行开发的Linux平台上的高可用软件,它在维护、故障排除、升级、售后服务方面都能够有充分的保障。同时根据PCL用户的反馈,对于开放源代码的HA类的系统关键软件,最终用户普遍对其版本更新能力、数据安全性和故障(特别是兼容性及底层故障)的排除能力普遍持怀疑态度。PCL for Linux在欧洲已经有相当的关键业务成功案例,在中国也有上百个成功安装使用的案例,因此,最终用户对PCL的接受度明显较高。
PCL HA做为一个高可靠的HA软件,以德国富士通-西门子公司的先进技术、严谨作风和可靠信誉为后盾,为用户提供系统高可用性方面的可靠保障,是关键应用下服务器集群的理想选择。
PCL HA高可用软件应用环境
PCL HA支持的操作系统有Linux和Solaris。
Intel-based的Linux发行版:
∙RedHat Enterprise Linux ES/AS 3 (up to Update 5)
∙RedHat Enterprise Linux ES/AS 4 (up to Update 2)以及64bit版本
∙SuSE Linux Enterprise Server 8 ( up to SP4)
∙SuSE Linux Enterprise Server 9 ( up to SP2)以及64bit版本
∙以及各种兼容上述两种发行版的Linux,比如红旗、中标、CentOS等等
Sparc-based的Solaris
∙Solaris 8 / 9 / 10
注:上述操作系统为PCLv4.2A00支持的操作系统,随着操作系统的升级,PCL也会做出相应的版本更新
PCL HA可用于基于上述操作系统的所有应用,它可对几乎所有的系统组件和应用进行故障监测以及自动的故障转移,为客户的业务提供一个持续可用的平台。PCL监控的对象包括:
∙主机
∙操作系统
∙本地文件系统
∙远程文件系统
∙IP网络
∙卷管理器(Volume Manager)
∙裸设备(Raw Device)
∙任何脚本或者程序
PrimeCluster_HA特点及优势
HA 服务器——应用与服务随时可用
PRIMECLUSTER拥有近20年的历史,它随着富士通西门子计算机公司在全球的业务开展,遍布各个行业和领域,在欧洲、中东、非洲和亚洲有着大量的成功案例。
支持多平台――PRIMECLUSTER支持Linux/Intel和Solaris/Sparc平台。它在用户层面保持界面、操作方法、管理命令的统一,和OS,硬件平台无关。
高效、冗余的集群心跳协议――PRIMECLUSTER可拥有多达8条心跳线路;采用自有的ICF (Internode Communication Facility)协议取代低效的IP协议
保护数据完整性――独有的Shutdown Facility机制,确保在集群脑裂(Brain-Split)的情况下用户数据的完整性,最完美的解决方案。严谨的Online、Offline检查机制,确保应用只可能在一个节点上启动。
灵活的配置方案――HA模式最大支持8个节点,支持1:1、N+1、N:M配置模式,多节点多应用可在集群内灵活配置。
单一管理图形界面――PRIMECLUSTER采用基于浏览器的Java管理界面,可在单一节点上远程管理集群内所有节点。
向导化的配置工具――PCS配置工具能够自动生成资源树,简化配置步骤,自动检查配置的一致性和生成配置文件信息。能够自动识别某些资源,如卷管理器、SAN网络和NAS。对于Oracle、DB2、WebServer、SAP等应用拥有Turn Key解决方案
滚动升级――PRIMECLUSTER支持版本异构(甚至OS异构),从而支持滚动升级,最小限度减少停机时间。
动态配置――HA和负载均衡模式均支持动态配置,可以在不停止应用的情况下对配置进行修改并生效。
数据完整性保护
任何一个集群系统在心跳线路出现故障,或者系统挂死的情况下都会出现集群分裂
(Brain-Split)的情况:集群内的节点相互不能得知对方的状态。如果没有一个严格的机制去处理集群分裂,那用户的应用就有可能同时在多个节点上运行,这种情况下会造成共享资源的争用,造成用户数据的损坏。比如两台节点同时对共享磁盘上的数据进行写的操作,用户数据很可能就会被损坏,而且是无法恢复的。
PCL通过Shutdown Facility来处理集群分裂的情况,一旦某个节点在规定的时间范围内没有收到对方的心跳信号,那它就会将对方的节点状态改为LEFTCLUSTER,同时调用某个关机代理(Shutdown Agent)去将对方进行关机。在关掉对方并通过确认对方节点已处于关机状态之后,该节点才将对方的状态变为DOWN,同时会按照用户设置的切换策略进行应用的切换。在分裂发生之后,哪一台节点会被关掉,这是由用户设置的节点权重+应用权重来决定的。
Shutdown Agent是通过基于硬件的某种管理端口来对节点的电源进行控制(不是操作系统级的Shutdown),现今的PC Server大多数情况下都带有此类的管理端口,比如说HP的iLO,Blade Management,ATCA CMM等等,每种硬件需要不同的SA。SA只是一个脚本或者程序,它在被调用时会通过远程接入的方式来对服务器进行电源关闭和查询的操作,对于某种特定的硬件来说,我们只需要对操作方法进行简单的修改即可完成SA的开发工作。