数据容灾备份解决方案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国移动公司

IP网管系统

性数据容灾备份解决方案

VERITAS公司北京办事处

2020年11月17日

目录

1系统需求分析 (2)

1.1系统建设目标 (2)

1.2需求简析 (5)

2高可用容灾方案设计 (8)

2.1 设计原则 (8)

2.2 方案概述 (9)

2.1.1IPNET流量管理服务器及NetCool汇总管理服务器“N+1” 冗余备份方式 (10)

2.1.2“N+1” 冗余备份方式 (11)

2.1.3N节点循环备份方式 (11)

2.1.4软件安装 (12)

2.1.5NetCool网管服务器/PM服务器、业务网管服务器、Precision服务器容灾 (12)

2.1.6功能配置说明 (14)

2.1.7Visionary应用服务器、NetCool报表服务器、IPNET报表服务器容灾 (15)

3高可用容灾方案实现 (15)

3.1 软件功能解释 (16)

3.2 安装、配置过程 (21)

3.3 工作过程 (22)

3.4方案分析 (26)

3.1.1 3.4.1 有关数据的量化分析及结果 (26)

3.1.2方案小结 (27)

4附录 (29)

一、VERITAS公司简介 (29)

二、VERITAS Foundation Suite™ (31)

三、VERITAS Cluster Server ™ (38)

1系统需求分析

1.1系统建设目标

建设本系统的目的是为中国移动公司IP网管系统建立一个全面的、整体的容灾方案,最大限度地保证业务系统工作的连续性、可靠性。

常言道,“知己知彼,百战不殆”。要实现容灾,首先要了解我们的“敌人”-灾难。那么,哪些事件可以定义为灾难呢?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等,还有其它如原先提供给业务运营所需的服务中断,如设备故障、软件错误、电信网络中断和电力故障等等。此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和恐怖袭击。现

阶段,由于我国很多行业正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。事实上,我国2003 年遭遇的“非典”,某种意义上也是灾难。对此,我们认为需要做到两点:一是建立切实可行的应急机制,这主要包含一套基于充分且清楚地将风险予以分类定义的业务持续计划,二是在危机突然降临时,此计划能被有效执行。对于IT 系统,除了上述的灾难之外,与系统相关的计划外宕机也可视作灾难。

对于IT 系统而言,在技术层面上,容灾需要考虑:

* 数据版本保护-建立容灾的多版本保护底线(Bottom Line)

* 实时数据保护-数据复制,近乎0 的数据丢失,数据一致性

* 应用系统恢复-恢复时间(包括数据库恢复)、应用版本的一致性(PTF)等

* 网络系统恢复-数据访问点变化、建立新网络路径、动态路由(收敛时间/稳定性)

* 容灾切换决策-及时发现灾难(容灾系统管理)、容灾切换的损失和补救办法

* 容灾切换过程-变更管理

同时,无论任何时候,备份都是非常重要的,并要定期测试备份的可靠性。一种技术只能减少或防止某些类型的灾难的影响。除了简单或一成不变的应用,在没有特别要求的情况下,尽量不要采用操作系统层面以上的数据复制技术。而没有文档化的流程就相当于没有流程,没有流程的系统能够在要求时间内恢复完全靠运气(通常不能)。另外,在通常情况下,IT 系统相关的灾难备份方案设计都必须考虑以下五大因素,

1,灾难类型

需要考虑哪些灾难?怎样的灾难?会使业务中断多久?

2,恢复速度

灾难发生后需要多久来启动及运行系统?能否承受数天或数分钟的等待?

3,恢复程度

需要恢复每条记录和交易吗?可以使用上星期或昨天的数据吗?需要恢复一切吗?有

不相关的文件吗?什么是合法隐含的要求?有少数的一组人输入交易吗?他

们可以重新输

入灾难期间丢失的交易吗?这些交易十分重要而不容许丢失吗?

4,可用的技术

必须结合考虑所选技术在本地区的适用性、实现条件以及在实施时是否受某些现有条件的制约?

5,方案总体成本

实现灾难备份需要多少投资?不实现灾难备份会损失多少钱?

据国际标准SHARE78 的定义,灾难恢复解决方案可根据以下主要方面所达到的程度分为七级,即从低到高有七种不同层次的灾难恢复解决方案。可以根据企业数据的重要性以及需要恢复的速度和程度,来设计选择并实现灾难恢复计划。这取决于下列要求:

备份/恢复的范围

灾难恢复计划的状态

在应用中心与备份中心之间的距离

应用中心与备份中心之间是如何相互连接的

数据是怎样在两个中心之间传送的

有多少数据被丢失

怎样保证更新的数据在备份中心被更新

备份中心可以开始备份工作的能力

现已证明,为实现有效的灾难恢复,无需人工介入的自动站点故障切换功能是一个必须被纳入考虑范围的重要事项。目前通用的异地远程恢复标准采用的是1992 年Anaheim 的SHARE78,M028 会议的报告中所阐述的七个层次:

0 层- 没有异地数据(No off-site Data)

Tier0 即没有任何异地备份或应急计划。数据仅在本地进行备份恢复,没有数据送往异地。事实上这一层并不具备真正灾难恢复的能力。

1 层- PTAM 卡车运送访问方式 (Pickup Truck Access Method)

Tier1 的灾难恢复方案必须设计一个应急方案,能够备份所需要的信息并将它存储在异地。PTAM 指将本地备份的数据用交通工具送到远方。这种方案相对来说成本较低,但难于管理。

2 层- PTAM 卡车运送访问方式+热备份中心 (PTAM + Hot Center)

相关文档
最新文档