RoseHA高可用性系统解决实施方案.docx
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
RoseHA高可用性系统解决方案
RoseHA高可用性系统解决方案以低成本且简便的方式,实现了两个节点的Cluster环境 . 客户只需要在
原有的单机系统上增加一台服务器、一个共享存储设备,通过Rose基于共享存储的高可用解决方案即
可实现关键业务的7X24 小时连续运行,对于需要更有效应用现有服务器资源的用户而言,是最为适用
的解决方案。
RoseHA的工作原理
RoseHA 双机系统的两台服务器(主机)都与磁盘阵列(共享存储)系统直接连接,用户的操作系统、RoseHA
机之间通过私用心跳网络连接。配置好的系统主机开始工作后,RoseHA 软件开始监控系统,通过私用网
络传递的心跳信息,每台主机上的RoseHA软件都可监控另一台主机的状态。当工作主机发生故障时,
心跳信息就会产生变化,这种变化可以通过私用网络被RoseHA软件捕捉。当捕捉到这种变化后RoseHA 就会控制系统进行主机切换,即备份机启动和工作主机一样的应用程序接管工作主机的工作(包括提供
TCP/IP 网络服务、存储系统的存取等服务)并进行报警,提示管理人员对故障主机进行维修。当维修完毕
后,可以根据 RoseHA 的设定自动或手动再切换回来,也可以不切换,此时维修好的主机就作为备份机,
双机系统继续工作。
RoseHA 实现容错功能的关键在于,对客户端来说主机是透明的,当系统发生错误而进行切换时,即
主机的切换在客户端看来没有变化,所有基于主机的应用都仍然正常运行。RoseHA 采用了虚拟IP 地址映射技术来实现此功能。客户端通过虚拟地址和工作主机通讯,无论系统是否发生切换,虚拟地址始终指
向工作主机。在进行网络服务时,RoseHA 提供一个逻辑的虚拟地址,任何一个客户端需要请求服务时只
需要使用这个虚拟地址。正常运行时,虚拟地址及网络服务由主服务器提供。当主服务器出现故障时,RoseHA 会将虚拟地址转移到另外一台服务器的网卡上,继续提供网络服务。切换完成后,在客户端看来
系统并没有出现故障,网络服务仍然可以使用。除IP地址外,HA还可以提供虚拟的计算机别名供客户端
访问。对于数据库服务,当有主服务器出现故障时,另外一台服务器
用程序,使用户数据库可以正常操作。
就会自动接管,同时启动数据库和应RoseHA主要功能特点
●友好的界面
RoseHA提供了友好直观的图形安装界面和监控管理界面。面,用户可以交互式地对集群系统进行配置、监控和管理,并可以利用通过直观而又方便的Java Applet管理界Applet 的网络特性,通过网络对系
统进行远程管理,实时地显示出主机系统及服务的状态
●灵活的Active-Active模式和Active-Standby模式
RoseHA支持Active-Active模式和Active-Standby模式。用户可指定每台服务器的作用(active or
standby ),指定要监控的服务和硬件部分,定义指定的服务发生故障后要采取的进一步行动(如是否重新
启动该服务、允许的最大启动时间等)。
●支持多条心跳路径
可以将网线和RS-232 串口线作为RoseHA 软件的心跳路径。配置多条心跳路径可以避免系统的单点故障。
●支持虚拟 MAC 地址
在网络环境中,每个IP 与唯一的 MAC 绑定在一起。而传统的集群结构下,将致使集群的活动IP 不同时刻绑定不同的MAC 地址,导致跨网段通信出现问题。为了使集群软件更好的支持这种网络安全级
别较高的网络环境,RoseHA 提供了支持虚拟MAC 地址的功能,使集群环境IP 地址实现与唯一MAC 址绑定。
●自动切换
在地
当系统出现故障时(如:系统宕机、 HA 进程 /应用进程被杀掉、 RS-232 、 SCSI 、光纤、网络线缆断开),RoseHA 将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,即不会受任何影响。不需要系统管理员干预。
●自动检测
在集群系统的每一台服务器内,RoseHA 具有两个核心进程,它们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复,避免了RoseHA 自身服务的单点故障。
●服务器可靠性
在主服务器出现故障(如掉电或宕机)时,另外一台服务器接管故障服务器上运行的所有的关键性
应用。
●网络可靠性
如果服务器的网络部分发生故障,会导致客户不能连接和访问到服务器,这同样是致命的故障。如
果该服务器配备了冗余的网络接口,RoseHA 会使用它来恢复网络连接。在没有配备冗余的网络接口,或
者所有的网络接口均出现故障时,HA 会将该应用切换到另外一台服务器上。切换完成后,客户在短暂的切换过程后能够继续访问所需的服务。
●存储可靠性
需要将应用的全部数据存储在两台服务器都能访问到的共享磁盘中。建议使用磁盘阵列来存储数据,
这样可以避免单点故障,而且便于对系统的容量进行扩充。对由 Volume Manager 软件管理的磁盘阵列, RoseHA 提供了相应的处理程序,以保证磁盘阵列及数据的可靠性。
●应用可靠性
在高可用性系统中可以运行多个应用。每一个应用是作为一个服务而存在的。在服务器中,当某个
服务失败而其它服务正常运行时, RoseHA 将处理这个失败的服务。在将这个服务切换到另一台服务器上时,
该服务器上运行的服务也不会受到影响。对于与网络不相关的纯数据应用,只需要切换数据存储和数
据处理软件。而对于与网络相关的客户机/ 服务器应用,除了要切换数据存储和数据处理软件外,还需要