服务器双机热备方案完整版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
服务器双机热备方案 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】
双机热备方案
双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。
1.集群技术
在了解双机热备之前,我们先了解什么是集群技术。
集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。
这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。
一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。
计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。
一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。
当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。
其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。
当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。
可见,双机热备是集群技术中最简单的一种。
2. 双机热备适用对象
一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。
有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID技术和数据备份技术。
但是数据备份只能解决系统出现问题后的恢复;而RAID技术,又只能解决硬盘的
问题。
我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。
要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。
因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。
3. 实现方案
双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。
1)基于共享的存储设备的方式
基于存储共享的双机热备是双机热备的最标准方案。
对于这种方式,采用两台服务器(邮件系统同时运行在两台服务器上),使用共享的存储设备磁盘阵列(邮件系统的数据都存放在该磁盘阵列中)。
两台服务器可以采用互备、主从、并行等不同的方式。
在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求
发送给其中一台服务器承担。
同时,服务器通过心跳线(目前往往采用建立私有网络的方式)侦测另一台服务器的工作状况。
当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。
对于用户而言,这一过程是全自动的,在很短时间内完成,从而对业务不会造成影响。
由于使用共享的存储设备,因此两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行管理。
优点:对于共享方式,数据库放在共享的存储设备上。
当一台服务器提供服务时,直接在存储设备上进行读写。
而当系统切换后,另一台服务器也同样读取该存储设备上的数据。
它可以在无人值守的情况下提供快速的切换,保证不会有数据丢失现象。
缺点:增加了昂贵的存储设备投资,对于有实力的企业,可优先考虑该方式。
2)纯软件方式
纯软件的方式,通过镜像软件,将数据可以实时复制到另一台服务器上,这样同样的数据就在两台服务器上各存在一份,如果一台服务器出现故障,可以及时切换到另一台服务器。
优点:
a.避免了磁盘阵列的单点故障:对于双机热备,本身即是防范由于单个设备的故障导
致服务中断,但磁盘阵列恰恰又形成了一个新的单点。
(比如,服务器的可靠系数是
99.9%, 磁盘阵列的可靠系数是99.95%,则纯软双机的可靠系数是1-
99.9%x99.9%=99.99%,而基于磁盘阵列的双机热备系统的可靠系数则会是略低于
99.95%
b.节约投资:不需购买昂贵的磁盘阵列。
c.不受距离的限制:两台服务器不需受SCSI电缆的长度限制(光纤通道的磁盘阵列也
不受距离限制,但投资会大得多)。
这样,可以更灵活地部署服务器,包括通过物理位置的距离来提高安全性。
缺点:
a.可靠性相对较差,两服务器间的数据实时复制是一个比较脆弱的环节。
b.一旦某台服务器出现中断,恢复后还要进行比较复杂的数据同步恢复。
并且,这个
时段系统处于无保护状态。
c.没有事务机制,由于其复制是在文件和磁盘层进行的,复制是否成功不会影响数据
库事务操作,因此有出现数据不完整变化的情况,这个存在着相当的风险。
4. 配置
硬件:两台相同配置的服务器,具体的要求大家可以根据各自的实际需要来选择。
磁盘阵列,适用于采用共享的方式搭建双机热备系统。
集群软件:
搭建双机热备当然少不了集群软件。
在这里推荐集群软件heartbeat,这个软件包括心跳监测部分和资源接管部分,心跳监测可以通过网络链路和串口进行,而且支持冗余链路,它们之间相互发送报文来告诉对方自己当前的状态,如果在指定的时间内未收到对方发送的报文,那么就认为对方失效,这时需启动资源接管模块来接管运行在对方主机上的资源或者服务。