如何制定灾难恢复计划
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.没有考虑到可能会破坏基础设施和数据运行的所有可能性。除了显而易见的病毒,木马,蠕虫等威胁,还需要想到您所处的地理位置发生自然灾害的可能性,比如是否处于地震断层或是在洪水区,风暴多发区,或拉闸限电等等。在制定灾备计划时,一定要把这些看似与IT无关的因素也考虑进去,如果自然条件实在太恶劣,劝您可以考虑换个地方建设数据中心。
2.灾备计划过于依赖很少的某几个员工。常常看到有些企业的灾难恢复计划依赖于某几个甚至一个IT员工,这很危险。万一如果该人由于某种原因无法工作或者刚好找不到他/她怎么办?您需要确定员工也得有“备份”,矩阵式结构的雇员组织形式会更好的做出应急响应。而且负责灾备的员工分布的地理位置最好是分散的,以防某一地区发生重大灾害。
3.故障或灾难来临时,依靠手工流程通知工作人员。假设您的设备由于停电而终断运行,可是现场又没有人,负责灾备的IT人员怎么会知道机房停电了?您需要建立一套自动化的系统,发生灾难或者服务终断时它可以自动的通知您的IT员工。你还可以选择第三方服务,请服务商来监控您的设施并且指派受过灾备培训的专业人员来帮你执行你的灾难恢复计划。
4。未能提供充足的后备电源。如果您的机房所在地常受到断电影响,一定要购买寿命最长的、最不易受干扰而间断的电力供应。还要准备好额外的备用电池以保证业务的持续能力。
5。忘记安排哪些资源需要优先恢复。您的IT应用中,哪些是最重要的?是否有一些可以等待一两天也不会影响到业务?你需要事先安排好应用与服务的恢复顺序。比如,你可以选择首先重启您公司的电子邮件应用,然后再恢复部门文件服务器。在安排这个顺序时,你需要考虑到相关的法规遵从要求。
6。未制定规范灾难恢复计划流程文档。在制订了一套灾备计划之后,您一定要把如何执行恢复计划的步骤写下来,要详细到每一个进程以及记录,描述所有系统资源的位置。这个灾备恢复步骤手册一定要多印几份,并且存储在多个不同的地方,并确保所有关键恢复人员人手一份。
7。忘记测试灾难恢复计划。确保恢复计划在有紧急状况时真的可以恢复出来!虽然这似乎是显而易见的事,但是许多企业都忽视了这一点,没有充分测试他们的灾备恢复计划。应该定期进行灾难演习,测试每种可能发生的情况,从基本的电力故障到可能导致持续几个月的重大灾难性事件。
8。密码也很难找到。虽然密码保护是数据安全的重要环节,不过还是建议您最好至少在两个不同的、安全的地方保存您的系统密码。确保一个以上的IT 工作人员的人有机会进入那里,并能获得所有密码。并且,如果这些关键人员辞职了,一定要及时更改密码。
9。未能保持恢复计划的更新。您需要不断更新您的灾难恢复计划,至少一个季度要再看一次。确定调用该计划的触发点,如人员、设备、地点或应用的改
变等等。这不仅有利于IT工作人员的技能保持更新,还将让你有机会发现灾备计划程序中的漏洞并优化之。
为何需要灾备?主要有三个原因:第一个原因就是天灾难以控制;第二个原因就是人祸不可避免;第三个原因就是信息系统本身的脆弱性。这些原因直接决定了在未来的生活中,灾备将会越来越更深入到我们的生活。
什么是灾备?从字面上理解,灾备是灾难备份的缩略语。但是实际上,从更严格意义上说,信息系统的灾备应当是指信息系统的灾难备份与恢复,这实际上包含两层含义:灾难前的备份与灾难后的恢复。
信息系统有可能面对哪些类型的灾难?灾难的主要类型包括:自然灾难、人为灾难、技术灾难等。从灾难的类型,可以看出,应对信息系统灾难涉及到诸多相关研究领域和研究方向。总的来说,灾备是容错计算、信息安全和系统管理三个研究领域的综合。
灾备有哪些核心技术?一提到灾备核心技术,首先离不开的就是存储技术。数据在灾难过后保存下来,这是否就足够了呢?答案是否定的。这就需要第二项关键技术,信息系统评估和系统重构技术,这是体系结构需要研究的内容。当前的信息系统都是运行在网络环境中的,恶意入侵、病毒、数据通路、用户身份识别都有可能引起安全事故,这就需要第三项关键技术:信息安全技术。除了上述三个关键技术之外,还需要系统管理技术进行系统的协调与管理,这就是第四项关键技术。
灾备存储技术:当前灾备存储技术可以与应用相关(主要采用软件方式实现,可以定制关键信息,实现起来也比较灵活)、也可以无关(主要基于数据卷或者块,全信息复制,实现自动化不需要用户干预)。在灾备存储技术中主要包括:虚拟化存储技术、多存储版本的管理、删除重复数据技术、集群并行存储技术、高效能存储技术等。
灾备体系结构技术:其核心包括容错系统结构、数据恢复技术、系统恢复技术、业务连续性服务。
灾备信息安全技术主要用于保障数据在存储与传输过程中的安全性问题、网络系统的可靠和安全连接问题、计算机系统的安全性问题、使用用户的身份安全问题和系统操作的不可抵赖性问题等。其核心包括:数据安全性技术、网络安全技术、系统安全技术、身份安全技术、安全审计技术。
灾备系统管理技术是灾备的关键支撑技术,它包括如下内容:数据信息管理、灾难应急管理、、系统恢复管理、灾难影响评估与决策支持。
灾备技术未来发展方向可以概括为:(1)从围绕着数据存储向围绕着应用服务转变;存储技术由集中式向分布式、虚拟化发展;从孤立专用系统向综合服务系统转变。(2)围绕服务的灾备技术发展方向:保障业务连续性方向发展,要求数据完整而可用、系统快速重建、应用快速部署。(3)新型容灾体系结构研究。(4)灾备存储未来方向包括虚拟化灾备存储技术、重复数据删除与压缩技术、分布式灾备存储技术。(5)灾备综合服务系统建设,即,建立第三方中立机构形式的外包灾备系统,重点解决的问题包括:公信力问题、数据的安全性、维护的便捷性、可扩展性、可共享性等。
一个灾备系统怎么说它好?还是不好?怎么来评价呢?那么主要有四个指标来评价:分别是RTO、RPO、DOO、和NRO。
RTO是恢复时间目标,这个指标就是容灾恢复的时间指标。它的含义就是说从灾难发生造成的业务中断,一直到使业务能够以继续恢复所需要的这段时间。因此可以看出,如果RTO越短就意味着这个容灾系统的容灾能力越强。
RPO就是所谓的恢复点目标。什么是恢复点?恢复点是宕机以后后数据开始恢复的时间点,RPO所对应的灾难,所造成数据丢失情况,我们可以这样来看,如果RPO等于零,换句话来说,也就相当于没有造成数据丢失。因为我从什么地方跌倒,就什么地方爬起来,就没有造成数据本身的丢失,当然对其他可能还是有损失的。否则的话就需要对业务进行恢复处理,需要对丢失数据进行修复。