双机容错系统方案

合集下载

服务器双机(或多机)容错、备份高可用性解决方案

服务器双机(或多机)容错、备份高可用性解决方案

服务器双机(或多机)高可用性解决方案服务器高可用性解决方案简介一.服务器高可用性解决方案背景由于计算机技术的不断发展,硬件服务器平台已经具有了相当好的可用性。

据统计,一般计算机系统配用RAID以及一些好的系统管理工具,其可用性可达到99%。

即使这样,一年365天仍然有44~87小时的停机时间,这对于企业用户意味着什么?客户、财产还是名誉?为了解决高可用性问题,人们提出了各种解决方案:完全硬件冗余,其可用性达99.9999%,但价格昂贵,且造成资源浪费;硬件与软件配合解决,其可用性达99.99%,但适用范围窄……今天,联想电脑公司服务器网络事业部应用NCR LifeKeeper for Windows NT纯软件解决方案,使系统可用性达到99.99%,适用范围广,性价比高,提供抗错甚至是容错功能。

联想电脑公司是亚太地区知名的整机及系统供应商,NCR公司是美国大型计算机公司,两公司于今年携手推出了基于联想万全服务器的高可用性解决方案。

该方案基于Windows NT平台,可提供2~16节点的服务器集群管理。

其卓越的性能与合理的性价比必将为大中型企业用户带来集群计算机系统的高可用性、高扩展性以及物超所值的满意价格。

二.联想万全高可用性解决方案的关键特点1.不用增加任何额外硬件投资,纯软件方式实现双机容错,且对备份机无硬件配置要求。

2.可支持Notes、Exchange、SQL Server、Sybase、Informix、0racle、SAP等多种系统的应用层叠恢复。

3.采用全球第一套基于NT操作系统的容错软件,并同时支持UNIX平台。

支持远程灾难备份。

4.支持共享磁盘阵列柜和扩展镜像两种方式,给用户提供了选择上的灵活性,同时也能适应各种机型、网络结构、软件平台及应用系统。

5.在扩展镜像或共享磁盘阵列任意方式下,均能实现两台NT服务器各自运行不同应用且相互热备份,即实现双机Active运转模式。

6.使用共享磁盘阵列柜方式时,最多可以支持16个节点,远远大于其它类似系统所支持的2个节点数。

邮件系统双机容错方案

邮件系统双机容错方案

邮件系统双机容错方案随着互联网的普及,国内的用户数呈指数增长。

为满足不断增长的信息交流需要,作为因特网第一应用的电子邮件系统变得越来越重要。

传统的邮件系统已难以适应人们越来越高的要求,免费的电子邮件服务也往往存在缺陷。

同时,随着E-mail 应用日益变得广泛和普及,越来越多的人通过E-mail 来传送包含多媒体附件(声音、图象、Video 等)的个人信件以及重要的商业资料,人们对E-mail服务的服务质量也提出了更高的要求。

拓波软件科技有限公司本着这个原则,给客户提供更好的服务。

拓波基于对用户需求的深入分析与理解,以自主研发的超大规模电子邮件系统为核心,从系统的安全性、稳定性、高性能、可扩展性以及良好的性能价格比等角度综合分析,为客户提供完整的邮件系统解决方案。

拓波有能力有信心与客户建立良好而又深入的合作关系,保证实现邮件系统的及早投入与长期稳定运行。

客户需求:支持POP3、IMAP4 和HTTP 等邮件访问协议和方式,支持SSL 等安全访问。

能够进行用户邮件存储空间限额设置,能够独立设置分配域空间大小、每个邮箱大小、每个用户邮件附件大小。

拒收超过存储空间的邮件,用户不会因邮件空间原因造成无法访问邮件帐户。

系统管理员可以根据IP、发信人等过滤垃圾邮件。

支持简单邮件传输协议中继(SMTP Relay)认证(ESMTP)。

SPECmail 2001≥350 msgs/min。

支持流量监控和运行监控。

其它需求:高可靠性:系统稳定可靠,能够提供7X24 X365 不间断服务。

高安全性:系统要求具有较强的防垃圾邮件、防病毒、防黑客攻击能力。

多域名支持:系统应提供无数量限制的多域名支持。

(企业邮箱应用系统)手机短信支持:系统提供邮件短信到达提醒、短信回复邮件等支持。

在发送邮件的同时,可以同时发送短消息,将邮件主题、发信人、发信时间、正文摘要组成一个SMS 通知到用户手机上。

系统容量需求:电子邮件双机系统最多可支持10 万用户。

惠普双机容错系统硬件方案范例

惠普双机容错系统硬件方案范例

第四章惠普双机容错系统硬件方案范例考虑到针对不同行业的不同需求,对系统处理能力的要求也不近相同,我们推出了多套方案以供参考。

✧方案一✧方案二本方案采用惠普LC3服务器和惠普SS/6磁盘柜组合,服务器内存为128MB可升级为512MB,450MHz—600MHz PIII CPU 两个,10/100MB自适应网卡,24倍速的IDE光驱,100MHz的高速总线频率使系统处理性能有了较大的提高。

惠普NetRAID3S i磁盘阵列卡可以提供多路的SCSI通道。

SS/6磁盘柜可以放置6块高速热插拔硬盘用以存储数据。

采用RAID5阵列模式,保证了数据冗余。

24GB的内置DDS大容量磁带机保证数据的备份存储。

这是一个性能完备的工作组级双机容错方案。

此方案适合于在局域网内连接30—40用户,广域本方案采用惠普LPr服务器和一个惠普RS12磁盘柜组合,所有服务器与磁盘柜均放置在惠普的25U的机柜中,封闭式管理。

安全可靠。

服务器选配内存为128MB可升级为1GB,Pentium III 500MHz的CPU为两个。

10/100MB自适应网卡。

惠普NetRAID-3Si通道磁盘阵列卡可以提供多路的SCSI通道。

RS12磁盘柜共可以放置12块Ultra 2 SCSI 80MB/s热插拔硬盘用以存储数据。

采用RAID5或RAID50阵列模式,保证了数据冗余,极大的扩大存储容量,在采用RAID50阵列模式时,数据盘即使两块同时损坏也不会丢失数据。

本方案采用惠普LH3r 服务器和惠普RS12磁盘柜组合,服务器内存为128MB 可升级为1GB ,450MHz —600MHz PIII CPU 两个,在不使用任何工具的情况下更换系统板可升级为四个CPU 。

10/100MB 自适应网卡,24倍速的IDE 光驱,100MHz 的高速总线频率使系统处理性能有了较大的提高。

惠普NetRAID3Si磁盘阵列卡可以提供多路的SCSI 通道。

容错方案与双机热备方案比较

容错方案与双机热备方案比较

容错方案与双机热备方案比较引言概述:容错方案和双机热备方案都是为了提高系统的可靠性和可用性而采取的措施。

容错方案通过在系统设计和实现过程中引入冗余和错误检测机制,以实现系统在出现故障时能够继续正常运行。

而双机热备方案则是通过在系统中使用两台完全相同的服务器,当其中一台服务器发生故障时,另一台服务器能够立即接管工作,保证系统的连续性运行。

本文将从五个大点来比较容错方案和双机热备方案。

正文内容:1. 容错方案1.1 冗余机制1.1.1 硬件冗余:通过使用冗余硬件组件,如冗余电源、冗余存储等,当一个硬件组件发生故障时,系统可以自动切换到备用组件,保证系统的连续性运行。

1.1.2 软件冗余:通过使用冗余软件模块,如冗余算法、冗余数据等,当一个软件模块发生故障时,系统可以自动切换到备用模块,保证系统的正常运行。

1.2 错误检测机制1.2.1 校验和:通过计算数据的校验和,当数据在传输过程中发生错误时,可以通过校验和的不一致性来检测错误,并进行相应的纠正。

1.2.2 奇偶校验:通过在数据传输过程中添加奇偶校验位,当数据在传输过程中发生错误时,可以通过奇偶校验位的不一致性来检测错误,并进行相应的纠正。

2. 双机热备方案2.1 同步数据2.1.1 数据复制:将主服务器上的数据实时复制到备用服务器上,保证备用服务器上的数据与主服务器上的数据保持一致。

2.1.2 数据同步:当主服务器上的数据发生变化时,通过数据同步机制将变化的数据及时传输到备用服务器上,确保备用服务器上的数据与主服务器上的数据保持同步。

2.2 心跳检测2.2.1 心跳信号:主服务器和备用服务器之间通过发送心跳信号来检测对方的状态,当某一方停止发送心跳信号时,另一方可以判断出故障的发生。

2.2.2 心跳超时:当主服务器在一定时间内没有收到备用服务器发送的心跳信号时,可以判断备用服务器发生故障,从而触发故障切换。

2.3 故障切换2.3.1 自动切换:当主服务器发生故障时,备用服务器可以自动接管工作,保证系统的连续性运行。

双机容错系统方案

双机容错系统方案

双机容错系统方案双机容错系统是一种通过将两台或多台具备相同功能的计算机系统连接起来,实现冗余备份和自动切换的系统方案。

当其中一台计算机出现故障或失效时,系统会自动切换到备用计算机上,并继续提供服务。

这样可以保证系统的高可用性和稳定性,防止单点故障导致的服务中断。

1.冗余备份:通过将系统的核心组件(如处理器、存储器、网络接口等)以及数据存储复制到备用计算机上,实现系统的冗余备份。

当主计算机出现故障时,备用计算机能够接管所有运行任务,保证系统的可用性。

冗余备份可以采用热备份或冷备份方式,具体根据系统对于实时性和恢复速度的需求来选择。

2.自动切换:双机容错系统通过监控主计算机的状态,当主计算机出现故障时,自动触发切换到备用计算机上运行。

自动切换可以通过心跳检测、远程监控等方式实现。

心跳检测可以通过定期发送心跳信号来确保主计算机的正常运行,当心跳信号中断时,说明主计算机可能出现故障,此时备用计算机会接管。

3.数据同步:双机容错系统中,主计算机和备用计算机需要保持数据的一致性。

数据同步可以通过软件或硬件方式实现。

常见的软件方式是使用数据复制技术,将主计算机的数据实时复制到备用计算机上。

常见的硬件方式是使用磁盘阵列控制器等设备,实现主备计算机数据的硬件级别同步。

4.故障检测和恢复:双机容错系统需要能够检测和诊断故障,并能够自动恢复到正常状态。

故障检测可以通过监控系统的运行状态、日志记录和异常报警等方式实现。

故障恢复可以通过自动切换到备用计算机上、重启故障服务、动态替换故障硬件等方式实现。

5.网络通信:双机容错系统需要保证主备计算机之间的网络通信畅通,以便进行数据同步和状态监控。

通信可以通过专用网络模块、网络交换机等设备实现,确保实时性和可靠性。

双机容错系统在关键领域如银行、航空、电信等具有重要应用。

它可以提供高可靠性和高可用性服务,降低系统故障造成的影响。

比如,在银行领域,双机容错系统能够确保银行交易系统的连续性和稳定性,防止因故障导致的交易中断和数据丢失,保障用户的财产安全。

SCO Unix 平台双机容错系统方案比较

SCO Unix 平台双机容错系统方案比较

SCO Unix 平台双机容错系统方案比较第一章前言容错系统定义:对系统中的关键部件进行冗余备份,并且通过一定的检测手段,能够在系统中的软件和硬件故障时,切换到冗余部件工作,以保证整个系统能够不因这些故障而导致业务处理中断;在故障修复后,又能够恢复到冗余备份状态。

具备此种能力的系统即为容错系统。

使用容错系统的目的是:将可能的软件和硬件故障给整个系统带来的风险降至最低。

容错系统的评价指标:表述一个系统容错能力的两个常用指标是可靠性(Reliability)和可用性(Availability)。

可靠性指一个系统在一定时间内工作时发生故障的可能性。

如一个系统一年内的可靠性为99.99%意味者系统一年中工作时失败的概率为0.01%。

可用性指一个系统故障中断工作时间与可持续工作时间的比率。

如一个系统的可用性为99.99%意味者在一万小时的工作中将有一个小时的故障中断时间。

第二章一.方案分类目前SCOUnix操作系统应用在金融行业上常见系统架构有:1.有容错系统的可以分为两种:一种是共享磁盘阵列模式,数据放在共享的磁盘阵列子系统中,这种产品种类很多:GDS、ROSEHA等。

另一种是纯软件实现的,数据可以在两个系统上保持实时的一致,代表产品是SavWareHA。

2.无容错系统的也可以分为两种:一种是有共享磁盘阵列模式,数据放在共享的磁盘阵列中,即数据库裸设备建在共享的磁盘阵列,主备机分别用高速数据线连接至共享的磁盘阵列。

另一种是只有单独的主机,和备机,没有共享的磁盘阵列。

二.方案比较系统整体可靠性分析(1)对于有容错系统且又有共享磁盘阵列模式,这类方式的系统结构如下图示:图1 有容错系统且又有共享磁盘阵列对于有容错系统但没有共享磁盘阵列模式,系统结构如下图所示:图2 有容错系统但没有共享磁盘阵列纯软件方式下,将风险分散到两台服务器上,使系统可靠性得到提高。

从可靠性指标来看,假设单台PC服务器的可靠性为90%,使用了纯软件方式后,主备机同时损坏整个系统才不可用,主备机的故障互不相关,根据条件概率,整个系统完好可用的概率为:1-(1-90%)*(1-90%)=99%可以得到结论:使用了SavWareHA后,整个系统的可靠性为99%。

双机容错系统

双机容错系统

UnixWare 7 NonStop Clusters是基于Intel 处理器的高可用性、经济的群集解决方案,为群集化计算机提供99.99%的可用性环境。

这意味着IT 专业人员无需依赖专有的、基于昂贵的RISC 的UNIX 系统来建立他们所需要的可靠性的、可扩展的并且高性能的电子商务解决方案。

NonStop Clusters将单独的“结点”链接在一起(即全部的计算机,每台计算机都独立运行对操作系统的拷贝),就好象它们是一个单独的系统一样(单系统映像SSI)。

单系统映像SSI对整个群集和其它资源给出了一个一致的、直观的浏览。

通过SSI,你管理的使一个单独的资源,而不是一个系统的集合,这实际上是减少了相关的管理和应用程序设计的复杂性。

利用SSI技术,多群集结点对于用户,管理员和应用来讲就好象是一个单系统一样。

如果一个结点由于硬件故障而出现宕机,或者在一个特定的结点上的应用出现错误,进程将在一秒之内主动地被迁移和恢复,用户端正在运行的应用不会受到任何影响。

如果一个结点由于维护或升级的原因需要离线,那么群集中其它主机将继续对它的用户提供服务。

群集中的其它结点将关注新的连接和应用实例。

NonStop Clusters群集软件所带来的巨大优势之一就是使用入门级配置即可获得两个节点间应用程序和数据的镜像功能,从而减少了对共享外部存储设备的要求。

这个称为交叉点镜像的技术可以在内置SCSI磁盘间镜像数据,因而在故障恢复重,可以从备份节点重新启动应用程序,而不需要花费资金购买外部存储设备。

减少对外部存储设备的需求,使得基于UnixWare7.1的群集系统在记录数据方面比其它NOS群集实施方案更具有价格上的吸引力。

主要特点Top可以群集2到6个节点整个群集系统向磁带备份群集节点间的负载平衡光纤通道主机总线适配器的故障恢复基于Web的群集管理8路SMP支持Tower和Rack配置业界领先的群集管理功能软件平均无故障运行时间(MTBSS)大于10,000小时或99.99%可用内置或外部共享存储配置可以达到9.1GB到6.0TB活动/待机存储控制器附带64MB存储控制器缓存7端口和12端口总线支持动态存储设备添加支持优点Top关键业务应用得高可靠性存储设备得冗余部件、热插拔和服务器中得冗余选件以及提供硬件故障恢复功能得软件确保了用户应用程序的不停顿运行投资保有和配置的灵活性带有两个按需要麇集成匹配对的基本节点,对于多余的节点,可以采用匹配对或混合对配置,这样用户就具有可以裁剪自己的群集系统满足各自的计算环境的灵活性。

容错方案与双机热备方案比较

容错方案与双机热备方案比较

容错方案与双机热备方案比较一、引言容错方案和双机热备方案是常用的系统备份和恢复解决方案,用于确保系统的高可用性和可靠性。

本文将对容错方案和双机热备方案进行比较,分析它们的优缺点以及适合场景。

二、容错方案容错方案是通过使用冗余技术来提高系统的可靠性和可用性。

当系统的一部份组件发生故障时,容错方案能够自动切换到备用组件,确保系统的连续运行。

以下是一些常见的容错技术:1. 冗余存储:容错方案可以使用冗余存储技术,如RAID(冗余磁盘阵列)来保护数据。

RAID可以将数据分散存储在多个磁盘上,当其中一个磁盘发生故障时,系统可以通过使用其他磁盘上的数据进行恢复。

2. 冗余电源:容错方案可以使用冗余电源来保证系统的稳定供电。

当一台电源发生故障时,备用电源会自动接管,确保系统的持续运行。

3. 容错服务器:容错方案可以使用容错服务器来提高系统的可靠性。

容错服务器是由多台服务器组成的集群,当其中一台服务器发生故障时,其他服务器会自动接管其工作,确保系统的连续运行。

优点:- 高可靠性:容错方案能够自动切换到备用组件,确保系统的连续运行。

- 自动恢复:容错方案可以自动检测和恢复故障,减少了人工干预的需求。

- 成本相对较低:容错方案相对于双机热备方案来说,成本相对较低。

缺点:- 故障恢复时间较长:容错方案需要检测故障并切换到备用组件,这个过程需要一定的时间,可能会导致系统的短暂中断。

- 系统性能稍有损失:容错方案需要实时监测系统状态并进行切换,这会对系统的性能产生一定的影响。

适合场景:- 对系统的可靠性要求较高,但对故障恢复时间要求相对较低的场景。

- 对成本有一定要求的场景。

三、双机热备方案双机热备方案是通过使用两台彻底相同的服务器来实现系统的备份和恢复。

一台服务器作为主服务器,另一台服务器作为备用服务器,当主服务器发生故障时,备用服务器会即将接管其工作,确保系统的连续运行。

优点:- 故障恢复时间快:双机热备方案中的备用服务器已经处于运行状态,当主服务器发生故障时,备用服务器可以即将接管其工作,几乎没有中断时间。

双机数据容错与备份一体化解决方案

双机数据容错与备份一体化解决方案

双机数据容错与备份一体化解决方案目录概述 (1)第一章WINDOWS双机容错与备份一体化方案 (2)一、系统拓扑结构图 (2)二、在线部分——双机容错系统 (2)三、离线部分——数据备份系统 (4)概述随着计算机和网络应用的日益普及,每一分钟各个商家和个人都在不停地创建和使用着各种信息。

专家们已经深感信息系统不仅越来越令人提心吊胆,而且常常让人束手无策。

与此同时,在节奏不断加快的社会生活之中,通信、交通、金融和电力等基础设施一天比一天更加依赖于信息系统。

社会对于信息系统的依赖性,以及信息系统在人为攻击和自然灾害面前的脆弱性,日益引起企业和政府的重视。

然而,人们对怎样保护这些信息缺乏相应的理解,于是造成了由于系统功能不正常、人为错误、计算机病毒和其它不可预测的因素所带来的系统间断、数据丢失等等灾难性事故。

尽管各行业自身特点不同,但他们对数据的安全性、实时性、稳定性要求都是十分严格的。

为此,我们提出了“双机容错与数据备份一体化解决方案”,力图提供一种完备、智能化、易管理的数据安全管理方式,为您的网络数据安全管理尽一份微薄之力。

第一章WINDOWS双机容错与备份一体化方案一、系统拓扑结构图二、在线部分——双机容错系统在线部分是网络数据的集中核心部分,通过双机容错可以确保网络系统不间断运行以及在线数据的安全。

1、在线部分的产品2、 XX双机热容错软件XX双路JZ1200服务器3、系统说明系统以WINDOWS系统为平台,XXJZ1200服务器和XX双机热备软件为核心,两台服务器C盘只安装应用程序及XX双机热备软件,数据库放在集群软件的同步分区中,并作双机双工的容错方式。

当系统启动后:XX双机热备软件首先启动manager管理程序,然后启动必要的服务和代理程序来监控和管理系统服务。

XX双机热备软件代理程序通过RS232或专用网络适配器来监控、监测、诊断和管理硬件、软件服务。

数据库数据通过XX双机热备软件数据分区同步管理软件进行两台服务器两边分区实时同步,保证数据一致性。

双机容错软件DataWare安装方案 (1)

双机容错软件DataWare安装方案 (1)

双机容错软件DataWare安装方案DataWare双机容错软件是一种采用共享磁盘阵列柜的硬件容错系统,通过主机系统冗余的方法提高系统的可靠性。

DataWare双机容错系统可以让企业投资不多,实现容错技术,减少企业应用的中断时间。

一:DataWare双机容错系统概述1:双机容错系统组成硬件:两台计算机,至少一块网卡,可用于CLUSTER系统环境的磁盘阵列(如果要存储供客户端使用的数据时,磁盘阵列是必须的)。

软件:已安装在两台计算机内置磁盘中的基本操作系统,DataWare双机容错软件,应用系统软件。

2:工作服务器(Active or Primary Server)和后备服务器(Standby Server)工作服务器:在工作服务器上会mount磁盘阵列上的分区(如果有必要),产生虚拟(活动)IP,启动应用系统软件,向客户端提供应用系统服务。

监控本计算机和对方计算机(双机容错系统中的另一台计算机)。

后备服务器:在后备服务器上只是监控本计算机和对方计算机(双机容错系统中的另一台计算机)。

不会mount磁盘阵列上的分区,不会产生虚拟(活动)IP,不会启动应用系统软件,不会向客户端提供应用系统服务。

3:虚拟(活动)IP虚拟(活动)IP:它会在工作服务器上被产生,客户端通过它连接到双机容错系统,从而获得需要的系统服务。

4:心跳通信心跳通信:两台计算机通过在磁盘阵列上划分的一个不小于5M的裸设备(分区)或额外的一对网卡进行通信,收集心跳侦测信息,确定两台服务器是否有效。

无论双机容错系统运行在什么模式下都只需要其中的一种心跳通信方式。

5:监控工作服务器:监控在本计算机上产生的虚拟IP,已经启动的应用系统和对方计算机的网络连接。

后备服务器:监控本计算机的网络连接,在工作服务器上产生的虚拟IP和工作服务器的网络连接。

6:运行模式Hot Standby:两台计算机对一套应用系统启用双机容错。

例如使用Oracle数据库,其中一台计算机是Oracle数据库的工作服务器,另一台是Oracle数据库的后备服务器。

Windows平台双机容错解决方案

Windows平台双机容错解决方案

!"#$%&’()* +",-.&’/- $",0%1"’ 2". 31’("45 6,&%2".7
8&’0&.*9 :;;<
BB
现代电信科技
其中的一小部分。
$ 良好的扩充性 : !"#$%&’()*$+,-+, ..(-&’/+(
可以支持扩展镜像( 使用镜像引擎) 、 共享磁盘阵列 柜实现双机容错, 因此当用户的需求增加时( 如增 加服务器、数据量增长到必须使用磁盘阵列柜) 可 使用成本 以以很小的代价无缝迁移到 6+7&%" ..8 , 较低。 ( 技术方案灵活、 实施维护简单 <) 使用 3+%=>?+@+ 可以在几分钟内使 ! 安装简单: 每一个服务器快速和容易地配置 !"#$%&’()*$+,-+,
.&(-&’/+( 。
由于脱离了磁盘阵列柜的束 " 技术方案灵活: 缚并且硬件影响较小, 因此可以非常灵活地设计解 决方案。
# 维护简单: !"#$%&’()*$+,-+, .&(-&’/+( 设有
三个等级的用户访问权限A 包括系统管理员( &(B1’5 、 操作员( 以及只读访问( 13%,&%",) ">+,&%", ) ,+&(#"’C* , 简化管理和减少费用。 &//+33)
!""# 年 $ 月第 $ 期

Windows系统双机方案

Windows系统双机方案

双机热备方案一:概述企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。

而现有的双机热备份设备存在价格高昂,成本较高的情况,往往使用户望而却步。

而用户寻求低成本的纯软件方案又往往因产品不容易维护,纯软件双机方案不稳定等因素,往往给用户造成不必要的使用麻烦。

有时因护理不当造成数据损坏,发生更大的事故。

蓝科泰达凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了蓝科泰达双机容错打包解决方案,目的在于保证数据永不丢失和系统永不停顿,同时为用户节省大量的开支。

蓝科泰达容错系统结合了磁盘阵列的安全可靠性与双机容错技术高可用性的优点,相互配合二者的优势。

蓝科泰达针对共享磁盘阵列的双机容错技术做了许多优化和改进,满足了双机硬件的连接要求,根据应用环境的实际情况,适用于Windows2000平台以上,开放源代码Linux平台,SCO UNIX平台上的多种双机热备软件。

二、需求分析企业关键业务一旦中断,企业的日常运作将受到致命的影响,那么就要求我们的系统在最短的时间内将系统恢复到正常状态。

所以我们要求双机软件能够实现以下几点:1、异常终端检测2、网络故障,系统故障,应用程序故障等全系统检测3、当高可用系统中的某个节点故障,无须人工干预自动切换,保障系统运行4、速度快(快速恢复)贵单位业务平台,是以Windwos Server系统平台为基础,以SQL Server 核心的数据库应用系统,该系统对稳定性要求很高、系统实时性和可用性提出要有连续运行的能力,系统一旦出现故障,其损失是惨重的。

因此,建议用户采用高可用技术,高可用系统在各个节点间保持的间歇的通讯,使系统中的独立节点组合成整体的一套系统,并使用PlusWell 软件可以保障该系统中的某一节点故障都可被PlusWell 软件所监控,如主服务器应用程序、网卡、操作系统等,均纳入公共的安全体系,确保7*24的不停机。

容错方案与双机热备方案比较

容错方案与双机热备方案比较

容错方案与双机热备方案比较一、引言容错方案和双机热备方案是常用的系统备份和恢复策略,用于确保系统的高可用性和可靠性。

本文将比较这两种方案的特点、优势和适用场景,以帮助选择合适的方案。

二、容错方案容错方案是通过在系统中引入冗余机制,以实现在硬件或软件故障发生时,系统仍能继续正常运行的能力。

容错方案的主要特点包括:1. 冗余设计:容错方案通常会在系统中引入冗余组件,如冗余电源、冗余存储设备等,以保证在一个组件故障时,其他组件能够接管工作。

2. 快速切换:当一个组件发生故障时,容错方案能够迅速切换到备用组件,以确保系统的连续性和可用性。

3. 自动恢复:容错方案能够自动检测和恢复故障,减少人工干预的需要。

4. 适用范围广:容错方案适用于各种规模的系统和应用,包括个人电脑、服务器和数据中心等。

三、双机热备方案双机热备方案是一种常见的容错方案,它通过在系统中引入一台备用服务器,以实现在主服务器发生故障时,备用服务器能够立即接管工作的能力。

双机热备方案的主要特点包括:1. 实时同步:主服务器和备用服务器之间会进行实时数据同步,确保备用服务器上的数据与主服务器保持一致。

2. 快速切换:当主服务器发生故障时,双机热备方案能够迅速切换到备用服务器,实现对系统的无缝切换。

3. 高可用性:双机热备方案能够提供高可用性,减少系统停机时间,确保业务的连续性。

4. 适用于关键系统:双机热备方案通常用于对系统可用性要求较高的关键业务,如金融交易系统、电信运营系统等。

四、比较分析1. 故障恢复能力:容错方案和双机热备方案都能够实现系统的故障恢复,但在故障发生时的恢复速度上存在差异。

双机热备方案能够实现几乎无感知的切换,而容错方案可能需要较长的恢复时间。

2. 成本效益:双机热备方案相对容错方案来说成本较高,因为需要购买备用服务器和进行实时数据同步。

而容错方案的成本相对较低,只需增加一些冗余组件即可。

3. 可靠性:双机热备方案相对容错方案来说更可靠,因为备用服务器能够立即接管工作,几乎没有停机时间。

兴安证券双机容错方案

兴安证券双机容错方案

双机容错系统规划书双机容错解决方案双机容错的目地在于保证数据永不丢失和系统永不停机(N0N 一STOP).采用智能型磁盘陈列柜(如IBM EXP300或IBM EXP500等)解决了数据永不丢失的问题,采用NT CLUSTER 等双机容错软件解决了系统永不停机的问题。

而能够以最简单的模式实现完全双机容错的目地,我们推见以下方式。

一、 基本构架模式一 双机互备援(DUAL ACTIVE ) 操作系统支持:UNIX SCO OPEN SERVER UNIXWAREIBM/AIX SUN SOLARISWINDOWS NT4.0企业版,WINDOWS2000高级版 模式二 双机热备份(HOT STANDBY) 操作系统支持:UNIX SCO OPEN SERVER UNIXWAREIBM/AIX SUN SOLARISWINDOWS NT4.0企业版,WINDOWS2000高级版在这里我们推见这种模式的双机热备份它的主要用处是:(结构图如下)本地盘共享NT本地盘NOSServeRAID 4HServeRAID 4HEXP3001 当系统软件或应用软件造成服务器当机时2 当服务器没当机,但系统软件或应用软件工作不正常时3 当服务器内RAID卡损坏,造成服务器与磁盘陈列无法存取数据的4当服务器内硬件损坏,造成当机或不正常关机时,双机能够瞬时进行自动切换,保证信息系统的正常运行。

二、硬件系统的基本需求。

保护在以上的硬件配置中首先通过两台X250-61Y和一台EXP300做到双机热备份,把重要数据保存在阵列柜中。

附:单一台X250-61Y的内存硬盘电源风扇等以实现冗余所以X250-61Y在HOT STANDBY的环境中可以使您的数据安全的储存在EXP300(EXP300中通过RAID 5使数据永不丢失)。

另外在把最重要的数据被份到磁带机中。

附:X250 8665-71Y 标准配置表:三、软件系统基本需求。

对于软件系统我们推荐选用WINDOWS 2000高极服务器版。

双机容错存储解决方案

双机容错存储解决方案

双机容错存储解决方案
采用两台相同或不同配置的相同操作系统平台(NT/UNIX)服务器和一台SANCOME磁盘阵列及HA双机软件组成双机容错系统。

这种双机容错方案是独立于服务器硬件和操作系统的,无论是硬盘发生故障或是系统发生故障,都不会影响到数据的安全。

在双机系统中,有两种工作模式:一种是双机热备份模式:正常情况下,一台机器工作, 提供数据库或其它服务,另一台做为备份机,当工作机出现故障时, 备份机可以立即接替故障机的工作,保证系统工作连续,这种工作模式保证了系统的容错和实时功能;另一种是双机互备援(双工方式)模式:在双工模式下,一台服务器作为数据库或其它应用服务器,提供数据库或其它服务,另一台服务器可做文件服务器或WWW服务器使用,正常情况下,两台机器各自完成自己的工作,当有一台机器出现故障时,另一台机器可以立即接替故障机的工作,保证系统工作连续;双机互备援模式既充分利用了服务器的资源,又保证了系统的容错和实时功能,是大多数用户选择的工作模式。

SANCOME磁盘阵列系统提供RAID0,1,3,5,10,50的容错和热更换功能,磁盘阵列系统中某个磁盘出现故障,可以在用户在线情况下带电拔出故障盘,更换一个好的硬盘,系统会自动进行修复. 整个系统提供了很高的网络及数据的安全性。

HP MSA2000高性能双机容错方案

HP MSA2000高性能双机容错方案

HP双服务器+HP MSA2000磁盘阵列柜的双机热备方案简述一、双机热备简述:由两台服务器+磁盘阵列柜构成双机热备系统,在两台服务器中安装所有的服务模块。

由两台服务器+共享磁盘阵列柜构成高可用系统。

通过系统的服务监测模块来互相监测对方的心跳及服务,服务监测模块通过网络和串口来定时监测对方心跳,该系统具有三种运行状态:1.服务器A运行服务1,且在工作时使用磁盘阵列,服务器B运行服务2。

2. Fail Over。

a)当服务器A出现故障时:服务器B监测到服务器A出现故障,接管服务器A的IP地址,然后再mount上磁盘阵列,最后启动服务1。

b)当服务器B出现故障时:服务器A监测到服务器B出现故障,监管服务器B的IP地址,然后启动服务2。

3. Take Over。

故障服务器恢复后,两台服务器又开始工作,回到状态1。

快客电邮系统包括了服务监测模块,所以不必要额外采购第三方的HA软件。

该方案的特点是:故障切换时间短(小于2分钟),在故障切换过程中数据的完整性较好,但是需要在硬件投入上增加更多的成本(磁盘阵列柜)。

二、方案介绍本方案中采用的是基于微软的MSCS双机热备来防范服务器单点故障,所以采用MicrosoftWindows Server 2003 Enterprise Edition中自带MSCS(Microsoft Cluster Service)的服务或双机软件来实现双机热备。

该方案是由两台HP Proliant ML570服务器和一个HP MSA2000 SAS共享磁盘阵列柜组成,系统拓扑如图所示:在这个容错方案中,Windows2003 Enterprise Server操作系统和应用程序安装在两台服务器的本地系统盘上,应用系统的数据是通过磁盘阵列集中管理和数据备份的,极大地保护了数据的安全性和保密性。

因为用户的数据存放在外部HP MSA2000SAS共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证服务不间断。

DFT HA双机容错系统

DFT HA双机容错系统

DFT HA双机容错系统介绍近年来,随着各类联机应用系统,尤其是关键业务领域的关键性应用的不断增长,广大客户对系统可用性要求也不断提高。

因此运行于各个系统上的真正高可用性解决方案,也就变得越来越重要和迫切。

DFT HA双机容错系统除了完全具备双机容错系统的常规功能之外,还附加了很多的实用功能。

多年来,DFT双机容错系统以其简明、实用、稳定等诸多特点深受广大客户的欢迎,被广泛应用于铁道、邮政、电信、银行、电力、零售等关键业务行业,成为双机容错系统领域一颗耀眼的明星。

一、DFT HA主要特点:1.自动监测错误DFT双机容错系统通过RS232连接和/或网络连接监视主机的运行情况。

当操作系统、网络、数据库或应用系统不能正常运行时,DFT双机容错系统能够自动快速地侦测到故障状态。

2.自动后援切换DFT双机容错系统侦测到一台主机的故障状态后,能自动快速地将该主机上的作业转接到另一台主机上继续运行。

3.自动检测恢复故障主机修复后,DFT双机容错系统能够自动或人工地恢复双机同时运行的状态,即将转接到另一台主机上运行的作业重新恢复到原主机上运行。

4、快速的反应速度典型的错误检测时间是5秒,服务转移时间一般在20—40秒之间。

自动处理过程:错误检测和服务转移过程完全由DFT HA软件自动处理,不需要系统管理员干预。

5.实时监控管理界面及报警机制DFT双机容错系统提供系统管理界面,能实时显示系统运行状态,还能够进行双机间的切换管理。

当某台主机或系统处于非正常状态,DFT双机容错系统还将错误写入出错日志中,用户可以察看出错日志。

6.便于安装设置系统监控软件以软件包的形式提供,便于用户安装。

在安装软件包的过程中,系统提示用户对有关双机的环境参数进行配置,设置灵活方便。

7.多种工作方式7.1 主从方式此工作方式下,一台主机支持应用系统的运行,而另一台后援主机则处于监视和等待状态。

一旦检测到工作机系统不能正常运行,后援主机即刻主动接管应用系统,以保证系统的持续正常运行。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

双机容错系统方案
1.前言
对现代企业来说,利用计算机系统来提供及时可靠的信息和服务是必不可少的,另一方面,计算机硬件和软件都不可避免地会发生故障,这些故障有可能给企业带来极大的损失,甚至整个服务的终止,网络的瘫痪。

可见,对一些行业,如:金融(银行、信用合作社、证券公司)等,系统的容错性和不间断性尤其显得重要。

因此,必须采取适当的措施来确保计算机系统的容错性和不间断性,以维护系统的高可用性和高安全性,提高企业形象,争取更多的客户,保证对客户的承诺,减少人工操作错误、达到系统可用性和可靠性为99.999%。

2.双机容错系统简介
根据用户提出的系统高可用性和高安全性的需求,推出基于Cluster集群技术的双机容错解决方案,包括用于对双服务器实时监控的Lifekeeper容错软件和作为数据存储设备的系列磁盘阵列柜。

通过软硬件两部分的紧密配合,提供给客户一套具有单点故障容错能力,且性价比优越的用户应用系统运行平台。

3.Cluster集群技术
Cluster集群技术可如下定义:一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。

此单一系统为客户工作站提供高可靠性的服务。

Cluster大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。

Cluster必须可以协调管理各分离的组件的错误和失败,并可透明的向Cluster中加入组件。

一个Cluster包含多台(至少二台)拥有共享数据储存空间的服务器。

任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。

每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。

Cluster内各节点服务器通过一内部局域网相互通讯。

当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。

当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。

当以上任一故障发生时,客户将能很快连接到新的应用服务上。

4.工作拓扑图
5.双机容错系统软、硬件配置
•硬件配置
两台可为不同类型的服务器(最好为同类型),如:HP LC2000/LH6000
服务器上的SCSI卡,如:AHA2940UW/2940U2W
服务器上的网卡(NIC),如:HP5013
磁盘阵列柜,如:Adaptec 6200
•软件配置
操作系统: SCO UNIX或UNIXWARE,WIN2000/NT4.0
(OS版本应相同)
容错系统:Lifekeeper HA
数据库:Informix、Oracle、Sybase、SQL Server 、Notes等等
其它应用软件
6.工作模式
双机热备份(Hot Standby):
所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standby Server),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机可尽早通知系统管理工作人员解决,确保下一次切换的可靠性)。

当工作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保
证信息系统能够不间断地运行(Non-Stop)。

当工作机经过维修恢复正常后,它会将其先前的工作自动抓回,恢复以前正常时的工作状态。

双机互备援(Daul Active):
所谓双机互备援就是两台服务器均为工作机,在正常情况下,两台工作机均为信息系统提供支持,并互相监视对方的运行情况。

当一台主机出现异常时,不能支持信息系统正常运营,另一主机则主动接管(Take Over)异常机的工作,继续支持信息的运营,从而保证信息系统能够不间断地运行,而达到不停机的功能(Non-Stop),但正常运行主机的负载(Loading)会有所增加。

此时必须尽快将异常机修复以缩短正常机负载持续时间,当异常机经过维修恢复正常后,它会自动抓回先前的工作,恢复以前正常时的工作状态。

注:此模式至少二块NIC卡
7.双机容错系统工作原理
HA软件主要由监控与接管两部分组成
•监控系统
SCSI侦测:
HA内部含有侦测心跳通讯线路, 结果置于磁盘阵列柜上的一个8MB的小区,用于监控,此小区一般在机柜逻辑盘的起始段。

对于某一台服务器而言,将侦测讯息以类似于记录方式写在该小区内,其中每一条记录包括如下内容:
(1)系统对本服务器的监测状态信息。

(2)另一台服务器是否看到本服务器状态的信息。

当一台服务器有问题或出现故障时,对等服务器的可调变心跳频率不断提高;在最小心跳时间内发现记录内容没有更新,即会调用网络心跳侦测再次确认系统状态;当两组心跳都判断系统故障时,Lifekeeper将故障服务器的交易业务在最小安全切换时间内切换到对等服务器上继续运行,同时修改记录区内容。

网络侦测:
业务服务器对网络设备监测,同时配合SCSI心跳侦测,对等监控两台服务器的工作状态。

当有一台服务器因为网络故障或其它原因引起故障而不能正常处理业务交易时,对等服务器的可调变心跳频率不断提高;在最小心跳时间内发现心跳记录内容没有更新,即会调用SCSI心跳侦测再次确认系统状态;当两组心跳都判断系统故障时,LIFEKEEPER将故障服务器的交易业务在最小安全切换时间内切换到对等服务器上继续运行,同时修改记录区内容。

•切换系统
网络服务:
双服务器后台对于用户一端,由监控软件LIFEKEEPER提供一个逻辑的IP Address,如:192.192.192.1,任一用户上网只需要用到这一地址;当后台有一台服务器出现故障时,另外一台服务器会自动将其网卡的IP Address 替换为192.192.192.1;这样,用户一端的网络不会因为一台服务器出现故障而断掉。

数据库服务:
当有一台服务器出现故障时,另外一台服务器会自动接管数据库;同时启动数据库和应用程序,使用户数据库可以继续操作,对用户而言不受影响。

应用系统:
当有一台服务器出现故障时,另外一台服务器会自动接管各类应用程序;同时启动应用程序,使用户可以继续操作,对用户而言不受影响。

8.双机容错系统的优点
与市场上其它同类软件比较,它具有以下特别的优势:
最少占用系统资源:
Lfekeeper HA是一种需要配合硬件(阵列柜)使用的双机容错软件,由于使用共享的磁盘阵列作为数据源,所以不需要在两台服务器间架设专用网络,进行繁重的数据同步工作。

有利于减轻主机及网络的负载,同时大大提高了系统在繁重业务下的可靠性。

跨平台工作:
广泛应用于NT或UNIX平台
侦测可靠:
软件可同时使用三种侦测网络,包括RS-232、TCP/IP、Share Disk。

侦测网络架设方便,互为备份,具有极高的可靠性,可避免由于侦测网络故障而发生误切换。

切换安全:
引入可根据具体应用而自由设定的最小安全切换时间机制,可有效防止业务繁忙状态下,主、备机不能及时交换信息引起的误切换。

数据永不丢失:
使用具有容错能力的磁盘阵列系统作为外部数据存储器,可以防止由于硬盘损坏、数据丢失造成的重大损失。

客户可以根据对容错能力、存储容量、硬盘访问速度、经济性等方面的需求灵活选择容错模式。

具有互备援能力:
两台服务器可分别运行不同的任务,同时互为备援(Daul Active)。

在需要两台服务器的网络中,使用这种工作方式,可以避免因单服务器故障引起的系统瘫痪。

兼容各种网络协议:
兼容包括TCP/IP、NetBEUI、IPX/SPX、命名管道(Name Pipe)在内的多种网络协议,虚拟主机可与Netware网络互联。

安装维护方便:
Lifekeeper HA软件全部操作均为GUI图形用户界面,安装配备极为简单快捷。

系统管理员可以通过直观动态的监视界面随时了解系统运行状态。

而且系统安装完毕后不需要进行任何维护,即可自动运行。

应用广泛:
目前,这套系统已经广泛应用于各个行业,能够为所有工作于NT or UNIX平台的大型数据库提供良好的支持,用户不需要改动应用程序设计。

无2000年问题:
本双机系统所有硬件设备及软体均经过全面的测试,证明决无2000年的问题,可伴随用户系统安全跨越本世纪。

9.建议方案

实物连接图(参见工作模式)
由两台主机,共享一台磁盘阵列及双机备份软件组成。

当有任何一部主机故障时,经由Lifekeeper Cluster的支援,在无系统管理者的操作下,自动执行备援切换程式,让使用者得以正常工作,不因主机故障而影响其作业时效。

相关文档
最新文档