浅谈容灾与容灾方案设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈容灾与容灾方案设计
自从有了信息技术以来,信息系统面临的各种故障和灾难就从来没有停止过。在企业信息化进程不断加快的今天,保持业务的持续性是企业用户进行数据存储时必须考虑的重要问题。灾难的出现,可能导致生产停顿、客户满意度降低,企业的竞争力会因此大打折扣。震惊世界的“9.11” 事件让全世界都看到了金融、电信企业在灾难中遭受的巨大损失。08年的南方雪灾和汶川地震告诉我们,灾难就在我们身边,容灾系统的建设已经刻不容缓。
容灾是指为了保证关键业务和应用在经历各种灾难后,仍然能够最大限度的提供正常服务所进行的一系列系统计划及建设行为,业务连续性是容灾的最终建设目标。一般来说容灾是一个宏观的概念,IT领域所说的灾备、灾难恢复等只是容灾的一部分,主要讨论数据和信息系统保护的问题,或者说是容灾整体框架中的技术基础部分。容灾技术的进步和需求的增长是企业信息化发展的必然结果,同时也反映了信息化系统及数据对个人、企业和国家的重要程度的不断提升。
信息系统容灾建设的目标是提高信息系统抵御灾难和重大事故的能力,减少意外情况发生所造成的损失,减轻对企业和社会带来的不良影响。容灾与数据安全性是密切相关的,数据的安全性是实现业务连续性的基础。统计结果表明,在过去5年内,全球93%的公司有过丢失重要数据而造成业务损失的经历,72% 的业务没有可靠的业务连续性计划,只有18%的最终用户的数据得到了可靠保护。
虽然已经认识到数据安全的重要性,但很多企业在如何建立容灾系统的问题上却存在种种疑惑。我国在实施容灾工程方面尚处于初级阶段,某些已经建成并投入使用的容灾系统,功能单一,而且存在投入成本高、投资回报率低、容灾数
据的可恢复性难以验证、管理成本居高不下等问题。以上种种因素使得部分准备建立容灾系统的用户裹足不前。
为此,国务院信息化工作办公室于2005年4月下发了《重要信息系统给灾难恢复指南》,而后2007年国家标准《信息系统灾难恢复规范》出台,指明了灾难恢复的流程,灾备建设的等级划分及灾难恢复预案的制定等内容,为企业的相关工作提供了有益的参考。
要建设容灾工程必须提出容灾系统的建设目标,作为衡量和选择容灾产品技术和解决方案的参数。例如:
●备份/恢复的范围
●灾难恢复计划的状态
●业务系统与容灾系统之间的距离
●业务系统与容灾系统之间如何相互连接
●数据是怎样在两个系统之间传送的
●允许有多少数据被丢失
●怎样保证更新的数据在容灾系统被更新
●容灾系统可以开始支持服务的能力
在设计容灾系统时,还需要提供更加具体的设计指标。建立容灾系统的最终目的,是为了在灾难发生后能够以最快的速度恢复数据服务,所以,容灾中心的
设计指标主要与容灾系统的数据恢复能力有关,最常见的设计指标有:RTO 和RPO。 RTO(Recovery Time Objective)代表容灾系统在灾难发生后数据或者系统恢复所用的时间。RPO(Recovery Point Objective)代表灾难发生时已经备份的数据与生产中心数据的时间差。通常情况下,容灾系统投资较大,使用概率较低,因此,需要对总体投入成本(TCO)和投资回报率(ROI)进行认真的分析和计算。
从经济角度考虑,最佳的容灾技术不一定是最好的容灾解决方案,容灾系统的总体投入TCO和投资回报ROI,对于许多用户来说是十分重要的设计指标。TCO 包括建立系统、维护系统和扩充系统的总投入,由于容灾系统的启用概率很低,新技术的发展和新产品的性能价格比的提高,必定造成容灾设备的贬值。所以,对于容灾系统TCO越高,ROI越低。
不同企业的系统环境千差万别,从单机到大型数据中心,从小型单业务到复杂的多业务集成。平台复杂度、数据复杂度、业务复杂度、管理复杂度的区别使得我们很难用简单的思维去理解和规划容灾系统。容灾项目的推进不是需求与技术的简单匹配,而要深入地分析用户的应用环境,找到最适合的解决方案。正所谓“没有最好的产品,只有最合适的方案”。
容灾的建设不能局限于技术类型的划分,而是帮助用户打破产品技术局限,根据不同应用的特点,综合地考虑RTO、RPO、TCO、RIO等指标和技术实现方式,提供从单业务系统到企业数据中心的多套灾难解决方案共用户选择。用户不必过多地考虑不同技术的差异,仅需要理解技术方案与自身业务的匹配度。
例如,针对中小企业,UIT提出的基于主机容灾方案,充分考虑中小企业没有大型存储,环境简单的特点,支持从操作系统 -- 应用软件-- 数据的全面容灾保护,使得客户不需要关心数据结构和类型的差别。UIT方案兼具HA与远程复制容灾功能,传输数据量小,容灾距离无限制等特点。首先对生产系统做数据镜像,实时捕捉系统byte-level变化,当数据有任何变动时,将变动的部分更新至目标备用服务器,一旦生产数据库宕机,则灾备服务器立即接管相关的服务,系统实时数据复制与保护,最大程度降低服务中断时间,并可加强磁带备份机制,该方案同时支持SAN,NAS或 Microsoft Cluster Server(MSCS)等中小企业常用应用平台,系统环境不需要修改,最大限度的保护了现有设备的投资。
大型企业的容灾建设就需要另外的思路。企业级数据中心的复杂度在于平台繁多,各类系统的RTO、RPO指标可能差距很大。如果分散使用各类容灾技术,会极大的影响产品采购及后期使用维护的整体成本(CTO)。所以在数据中心环境下建立灾备系统,不能单独考虑某个技术或产品适合某个系统的问题。
另外大型企业数据中心进行容灾建设的前提是数据的集中。如果在数据分散存储的状态下做容灾规划是不可想象的。因此统一的SAN存储结构最有利于容灾系统的设计。
UIT提出的存储虚拟化企业级容灾方案即基于以上环境,充分考虑大型数据中心对高可靠性、高性能、高扩展性的要求,利用带外虚拟化技术在现有的SAN 存储架构上增加虚拟化管理器来实现高级的统一存储管理和远程容灾功能。UIT 方案提供先进的、集中简化的SAN管理及多层次的数据保护功能(快照和复制)。企业用户能够更加有效地管理和利用存储系统,建立可靠的容灾环境,确保业务的可靠性和连续性。同时,该解决方案能够使用户的存储基础构架更具扩展性和