多节点高可用集群解决方案
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7/7
4/7
Skyge Multi-Node HA 高可用集群解决方案
2.2、基于数据镜像技术的高可用解决方案
通常在高可用软件中,为了保持数据一致性,不同的节点需要共享磁盘阵列。但是对于 很多系统来说, 一个磁盘阵列的造价太过昂贵。 因此出现了通过软件来实现共享数据的镜像 技术。在 Skyge Multi-Node HA 的高可用产品中,使用基于数据镜像技术的软件方式来实现 共享数据的同步。 DRBD(全称为:Distributed Replicated Block Device)是在 Linux 系统中一种基于 磁盘的网络镜像软件。DRBD 的基本原理相当简单,那就是把两台机器的两块磁盘通过网络 连接在一起,形成一个 RAID1 系统。两块磁盘的数据在任何时刻都保证是一致的。DRBD 负 责接收数据,把数据写到本地磁盘,然后发送给另一个主机。另一个主机再将数据存到自己 的磁盘中。DRBD 是由内核模块和相关用户态程序构成,用以构建高可用性的集群。其实现 方式是通过网络来镜像整个设备。 它允许用户在远程机器上建立一个本地块设备的实时镜像。 与心跳连接结合使用,也可以把它看作是一种网络 RAID。DRBD 的实现原理图,如下图 3:
图 3-DRBD 的实现原理
这种不需要共享存储的纯软高可用性解决方案,要节约很多成本,因为在价格上 IP 网 络要比专用的存储网络经济的多。
5/7
Skyge Multi-Node HA 高可用集群解决方案
图 4-基于数据镜像技术(DRBD)的高可用工作模式
解决方案优点:
系统切换时间短,最大程度减少业务中断的影响。 切换过程对应用程序无影响,无需重新启动或登录,做到无人值守。 不需要磁盘阵列,具有较高的性能价格比。 高效成熟的多种镜像方式,支持完全镜像、差分镜像。 最佳化的按需复制,支持自定义复制数据集。HA 的数据镜像是基于文件系统之上的以 字节为单位的按需复制,充分保证了系统性能和效率的最佳化。 消除备份窗口。 备份时可以使备机写入暂停或主机传输暂停, 在主机应用在线持续运行 的情况下,通过备机对数据进行备份操作。 支持丰富的应用配置,如:数据库应用 Oracle、DB2、Sybase、MySQL 等,文件服务应 用 NFS、SMB/CIFS 等,WEB 应用 Apache 等,商业应用 Websphere、Weblogic 等。 对服务器硬件配置要求较低, 且互备方式有效分摊系统负载, 可充分提高服务器硬件资 源的利用率。 简洁直观的管理工具,体贴的应用配置向导支持,便于维护管理。
6/7
Skyge Multi-Node HA 高可用集群解决方案
2.3、可定制的高可用集群方案
神州天勤作为国内高可用集群软件开发、提供商,拥有强大的自主研发能力。除了提供 通用的高可用集群解决方案外,还可以为用户提供可定制的高可用集群解决方案。必要时, 也可以将 HA 软件嵌入到用户的应用程序中。当遇到有特殊需求的用户(如在软件中增加某 些特殊功能),我们可以根据要求为用户量身定制。简单小功能的改进将在两周内完成,复 杂功能改进一般不会超过四周。 由于软件具有完全的自主知识产权, 无论用户需要什么样的 附加功能,我们都能满足用户的需求。
2供的多种高可用方案可以应用在几乎所有的 PC 及 服务器上,适用于 i386、x86_64、ia64、ppc64 等主流的硬件平台。高可用软件不但支持目 前市场主流的多种服务器操作系统,而且支持众多的数据库和应用软件,操作简单、配置快
1/7
Skyge Multi-Node HA 高可用集群解决方案
Skyge Multi-Node HA 高可用集群解决方案
Skyge Multi-Node HA 高可用集群解决方案
1、方案背景
信息化时代的来临, 使企业对计算机系统的依赖程度日渐增加。 尤其在一些关键行业的 关键应用上,企业 IT 业务系统和通信网络承载了诸多商业交易和重要信息资料,因此应用 的后台核心系统是否具有高可用性能力, 已经成为影响一个公司业务成败的关键因素。 高可 用性包括保护业务关键数据的完整性和维持应用程序的连续运行等方面。 这些信息处理系统 中保存了大量的关键业务数据, 在系统停止及数据丢失的情况下, 这种破坏所导致的业务中 断将带来灾难性的影响和损失。 随着企业业务的不断扩大,使用的计算机及网络设备逐渐增多,如何减少运营成本(包 括减少购置,部署,培训,使用,保养等) ,同样是企业需要考虑的重要课题之一。购置价 格昂贵的专有计算机系统来提高业务系统运行的稳定性, 同时付出极高的系统实施及维护成 本已不再是大多数企业的唯一被迫选择。如何利用价格较低的 PC 服务器系统来满足用户对 于安全性及可用性的需求,同时保证业务的连续稳定运转,正是我们可以帮您解决的。 神州天勤公司作为立足于中国市场的软件解决方案及技术服务供应商, 致力于推广高可 用集群软件解决方案,为客户提供一系列优秀的软件产品、专业服务与技术支持。 高可用集群软件解决方案, 为用户提供了具有单点故障容错能力的系统平台, 是计算机 应用系统稳定、可靠、有效、持续运行的重要保证。它通过系统冗余的方法解决计算机应用 系统的可靠性问题,并具有安装维护简单、稳定可靠、监测直观等优点。它采用主服务发生 故障时备服务器接管的机制,实现在线故障自动切换,实现系统 7×24 小时不间断运行,保 证了用户数据的可靠性和系统的持续运行,避免停机造成的损失。
图 2-基于共享磁盘阵列的高可用主备工作模式
HA 工作流程:
以数据库高可用为例,介绍当主节点出现故障后 HA 切换过程。 当主节点用户应用或数据库服务异常后,HA 会自动检测出此故障。此时 HA 在主节点的工
3/7
Skyge Multi-Node HA 高可用集群解决方案
作过程如下: 停止数据库 卸载共享磁盘分区 释放浮动 IP 地址
捷、可靠性高。高可用软件需要同时安装在两台或多台主机上,以监视系统的状态,协调集 群组主机间的工作,维护系统的可用性。它能迅速侦测到硬件、应用软件发生的故障,并及 时地进行故障告警、隔离、恢复,能防止应用业务主机的意外性或计划性宕机造成的服务停 顿,以最低成本提供给用户几乎不停顿的信息处理平台。 针对使用共享数据业务的用户, 根据其数据存储方式的不同, 神州天勤公司的一备多高 可用系统软件(Skyge Multi-Node HA)提供了两种高可用性解决方案:基于共享磁盘阵列 的高可用解决方案和基于数据镜像技术的高可用解决方案。
2.1、基于共享磁盘阵列的高可用解决方案
基于共享磁盘阵列的高可用解决方案要求,分别在两台主机(主节点和中心备份节点) 的内部存储(硬盘)上安装用户的操作系统、应用软件和相应的 HA 高可用软件,并且两台 系统都与磁盘阵列(共享存储)系统直接连接,使用的用户数据库等共享数据存放在磁盘阵 列上,两台主机之间通过心跳网络连接。对外业务正常工作时,由主节点提供服务,中心节 点作为备份机。客户是通过一个虚拟 IP(或称浮动 IP)来访问业务服务的。其架构如下图 1:
解决方案优点:
量身定制。 深度贴近用户的应用需求。 方案响应快,在短时间内为用户提供方案。 接口开放,方便用户自行定义 HA 的行为,为用户提供更大的灵活性。
地址:北京市海淀区上地信息路 1 号金远见大厦 802 室 电话:010-82359411/12 神州天勤软件技术有限公司 传真:010-82359428 支持:Support@ 邮编:100085
随后,HA 会在中心备节点上将数据库应用拉起,工作过程如下: 启动浮动 IP 地址 挂载共享磁盘分区 启动数据库
解决方案优点:
系统切换时间短,最大程度减少业务中断的影响。 切换过程对应用程序无影响,无需重新启动或登录,做到无人值守。 系统效率高,系统中数据读写、管理及容错由磁盘阵列来完成。而系统服务器故障监控 切换处理由 HA 软件来完成。双机监控的多条专用 100/1000M 网卡线路,既不占用主机 CPU 资源也不占用基础业务网络带宽。 支持丰富的应用配置,如:数据库应用 Oracle、DB2、Sybase、MySQL 等,文件服务应 用 NFS、SMB/CIFS 等,WEB 应用 Apache 等,商业应用 Websphere、Weblogic 等。 对服务器硬件配置要求较低, 且互备方式有效分摊系统负载, 可充分提高服务器硬件资 源的利用率。 硬件可采用机架式结构,便于维护管理。
图 1-基于共享磁盘阵列的高可用架构 2/7
Skyge Multi-Node HA 高可用集群解决方案
在这种场景下,所有用户应用(含数据库)都由相应的 HA 统一进行启停监控操作。在 系统开始工作后,HA 高可用软件开始监控系统,通过心跳网络传递心跳信息,成组两台主 机上的 HA 软件随时在监控另一台主机的状态。当对外业务主机(主节点)发生故障时,心 跳信息就会产生变化, 这种变化可以通过网络线传递到备份机 (中心备份节点) 的 HA 软件。 随后,HA 就会控制系统立即进行服务切换,备份机启动和对外业务主机一样的应用程序, 接管对外业务主机的工作(包括提供 TCP/IP 网络服务、文件共享、数据库等服务) ,并进行 报警提示管理人员对故障主机进行维护。当维护完毕后,HA 可以自动或手动地将切换回原 先的对外业务主机。 这种主备方式(Active-Standby)的工作模式正是一备多集群软件方案中 推荐的热备方式。即一个节点做为主节点,对外提供服务,中心节点做为备节点,监控主节 点,随时准备接管服务。 一备多高可用集群软件的中心备份节点可以作为多台主节点的备份设备, 同时监控各主 节点上的用户服务状态, 任一台主节点故障或该主节点上的一个服务故障, 中心节点都会及 时将该服务接管过来。工作模式如下图 2: