IBM-数据级容灾解决方案.

合集下载

IBM存储灾备方案

IBM 存储灾难备份方案灾难备份方案1、灾难设计的目的随着信息技术的发展，企业越来越依赖于数据处理来进行它的商业行为，保证它在业界的竞争力。

数据处理的高可靠性和高可用性越来越成为关键。

如果企业发现数据丢失，业务的开展将变得极其困难，更为重要的是，企业将失去客户的信任以及一系列的企业赖以生存发展的市场。

核心数据的丢失，严重时完全有可能造成整个企业的瘫痪。

尽管随着科学技术的发展，计算机系统的可靠性日益增加，像IBM的HACMP高可用集群多处理技术可以在局域网范围内解决大部分的硬件和软件引起的系统不可用问题，但是由地震、洪水、火灾、战争等天灾人祸或由于软硬件故障而使生产系统整体无法正常工作等情况所造成的损失依然可以轻而易举地摧毁企业赖以生成的IT系统。

所以，在异地建立灾备中心对于极度依赖IT的企业便成了必然的选择。

IBM提供了从数据级到应用级的灾难备份解决方案。

其中数据级的方案采用PPRC。

传统的灾难恢复方法（如每天对重要文件进行磁带拷贝并将这些拷贝转移到远地点）仍然能够满足大部分公司的需要。

不过，某些公司的需求已经证明了使用远程拷贝功能的必要，远程拷贝就是在一个远地点维护生产数据的一份最新拷贝。

（远程拷贝也被称为远程镜像）。

业界有两种基本的基于磁盘系统的远程拷贝形式：同步远程拷贝：来自处理器的更新被写往本地连接的磁盘系统，该系统将数据转发给远地点连接的磁盘系统。

只有当两个系统都拥有数据的拷贝以后本地系统才会向处理器返回一个I/O完成指示。

同步远程拷贝能够在远地点提供最新程度的数据当前值，但应用程序会因等待写I/O操作的完成而被延迟。

异步远程拷贝：来自处理器的更新被写往本地连接的磁盘系统，该系统立即向处理器返回一个I/O完成指示。

更新在很短的一段时间(在实际中通常在数秒钟到一分钟左右)以后被送往一个远程系统。

异步远程拷贝对应用程序性能的影响最小，但远程磁盘系统在数据最新性方面与本地系统相比会有一个延迟。

IBM 灾难恢复解决方案

IBM灾难恢复解决方案概述随着信息技术的发展，企业越来越依赖于数据处理来进行它的商业行为，保证它在业界的竞争力。

数据处理的高可靠性和高可用性越来越成为关键。

如果企业发现数据丢失，业务的开展将变得极其困难，更为重要的是，企业将失去客户的信任以及一系列的企业赖以生存发展的市场。

核心数据的丢失，严重时完全有可能造成整个企业的瘫痪。

一项Minnesota大学的研究表明,遭遇灾难同时又没有灾难恢复计划的企业超过60%以上在两到三年将退出市场,随着企业对数据处理的依赖程度的递增,此比例还有上升的趋势。

因此,在限定的时间内成功的灾难恢复将应该是一个企业战略计划中的一个关键组成部分。

尽管随着科学技术的发展，计算机系统的可靠性日益增加，像IBM的ParallelSysplex或HACMP高可用集群多处理技术可以在局域网范围内解决大部分的硬件和软件引起的系统不可用问题，但是由地震、洪水、火灾、战争等天灾人祸或由于软硬件故障而使生产系统整体无法正常工作等情况所造成的损失依然可以轻而易举地摧毁企业赖以生成的IT系统。

所以，在异地建立灾备中心对于极度依赖IT 的企业便成了必然的选择。

IBM公司提供了从数据级到应用级的灾难备份解决方案。

应用级灾难备份主要采用基于AIX平台的HAGEO方案或基于S/390平台的GDPS方案，而数据级的方案采用基于磁盘系统的PPRC或XRC 功能软件。

需要指出的是，目前传统的灾难恢复方法（如每天对重要文件进行磁带拷贝并将这些拷贝转移到远地点）仍然能够满足大部分公司的需要。

当然，某些公司的需求已经证明了使用远程拷贝功能或应用级灾难备份的必要，远程拷贝就是在一个远地点维护生产数据的一份最新拷贝(远程拷贝也被称为远程镜像）。

本文将着重讨论如何使用基于磁盘系统的PPRC远程拷贝功能实现灾难备份和利用HAGEO实现应用级备份，而基于S/390平台的GDPS应用级备份将另行讨论。

设计思想首先，IBM公司认为设计和完成灾难备份需要以下六大步骤：确定业务要求在设计开始阶段，必须进行“风险分析”和“业务影响分析”，以确定业务要求。

数据库容灾解决方案

2.数据同步
数据同步采用如下策略：
-同步方式：基于数据库日志的数据复制技术，确保数据实时同步。
-同步频率：根据业务特性和数据变化情况，合理设置同步频率，实现数据的一致性。
-同步方向：单向同步，从主数据库向备用数据库传输数据变化。
-同步策略：结合全量同步和增量同步，保障数据的一致性和完整性。
3.容灾切换
2.容灾软件
选用专业可靠的容灾软件，如Symantec Veritas、Dell EMC等，实现数据同步和容灾备，如交换机、路由器等，保证数据传输的稳定性和安全性。
五、实施步骤
1.需求分析：深入了解企业业务特性，评估数据库容灾需求，制定合理的容灾方案。
2.系统设计：根据需求分析结果，设计数据库容灾架构，包括硬件、软件、网络等资源配置。
本方案旨在为企业提供一套合法合规的数据库容灾解决方案，确保数据库的高可用性和数据安全性。在实际应用中，企业需根据自身业务特点和需求，灵活调整和优化方案，以实现最佳效果。
第2篇
数据库容灾解决方案
一、引言
在信息化时代背景下，数据库作为企业关键信息资产的核心载体，其稳定性和安全性对企业的运营至关重要。为了确保数据库在面对各类灾害时仍能保持业务的连续性和数据的完整性，本方案提出了一套全面、专业的数据库容灾解决方案。以下内容将详细阐述容灾策略、技术选型、实施步骤及后期维护等关键环节。
二、目标
1.实现数据库的高可用性，确保在主数据库发生故障时，能够在规定时间内切换至备用数据库，保证业务的连续性。
2.确保数据的完整性、一致性和安全性，防止数据丢失和损坏。
3.降低数据库故障带来的经济损失，提高企业的抗风险能力。
三、方案设计
1.容灾架构设计
本方案采用主-备容灾架构，主要包括以下部分：

DS8000容灾解决方案建议书

第1章存储容灾为业务运营遮风挡雨6.1构建存储容灾解决方案的重要性随着社会的发展和科技的进步，企业越来越依赖于数据处理来进行业务运营，对IT系统的依赖性也随之增加。

然而，灾难就像灰尘一样伏击在企业周围，您的业务可能正在一个充满风险和威胁的世界里运行：⏹无法预知的IT硬件设备的损坏、断电、火灾、自然灾害、恐怖袭击等，造成数据丢失或业务的突然中断；⏹系统人员误操作造成意外宕机或关键数据丢失，无法避免；⏹手段频多的黑客攻击、病毒入侵、垃圾邮件、网络与系统的漏洞，造成网络瘫痪、系统崩溃。

如果不能对风险采取有效治理，一旦数据由于上述某种原因丢失，就有可能造成整个企业在运营上的重大不便和经济损失，企业的信誉也将受到影响。

如果核心数据丢失，严重时完全有可能造成整个企业的瘫痪。

由此可见，保证企业的业务连续运营及数据处理的高可靠性和高可用性，已经成为所有IT 人员在建设IT基础架构中首先要考虑的问题。

与此同时，我们需要考虑建立和加强企业的业务恢复计划，以便在发生系统灾难后能够从容应对风险。

企业对存储系统提出了以下要求：⏹数据与存储系统的高可用性，保证数据7X24小时的连续访问；⏹将现有的存储技术集成，创造出一种更有效的数据存储管理，实现高效、高可靠性、低成本的数据管理；⏹需要对企业现有的数据库、邮件系统、文件服务器以及各种应用系统进行集中化、自动化的基于策略的保护；⏹需要一套成熟度高，业内应用广泛的企业级软硬件整体解决方案；⏹易于IT部门日常的管理维护，界面友好，可操作性强；⏹一旦发生灾难(洪水、地震、火灾等)，或者人为灾难(用户失误、磁盘失效等)导致数据丢失或者业务中断时，能够快速、及时地恢复数据，保证业务的连续运行。

6.2IBM企业级存储DS8000容灾解决方案简述IBM企业级存储容灾解决方案通过IBM System Storage DS8000企业级高端磁盘存储系统，结合IBM特有的数据复制技术Metro Mirror(同步的数据复制)和Global Mirror (异步的数据复制)，在两套或多套DS8000磁盘存储设备间建立数据复制关系从而实现高可用性，在数据存储方面提高您IT基础架构的整体可用性。

IBM为用户提供第七级的容灾方案-安全软件解决方案

IBM为用户提供第七级的容灾方案-安全软件解决方案容灾对企业的重要性已无需多言，在需要全天候运行的全球经济环境中，没有一家企业能够承受宕机，无论是计划的宕机（升级、维护和修复）还是突发的宕机（由于人为错误、处理故障、电源故障、甚至灾难事件）。

但许多企业都制订了在24到48小时内恢复核心应用的业务连续性计划。

虽然数据丢失了24小时，但实现全面恢复需要数天或者数星期的时间。

这些企业通常依赖后台和人工流程来保持业务的正常运行，直到系统恢复为止。

随着信息成为越来越重要的企业资产，许多企业都致力于最大限度地降低宕机风险和避免业务中断的潜在影响，从而影响：生产力：由于系统闲置，您的员工和业务运营都会造成收入损失。

客户满意度：如果您不能及时响应客户需求，只需点击一下鼠标，他们就会转向另一家供应商。

业务合作伙伴和供应商关系：经常性宕机会引发对您业务的可靠性的质疑，从而驱使重要的合作伙伴和供应商与其它企业开展业务。

事实上，专家声称一个典型的计算基础设施的宕机估计为每小时42,000美元。

按照这一比例，1%的可用性改进都可能导致通过降低风险和提高生产力创造数百万美元的收入。

IBM Windows业务连续性（CA）旨在帮助您的企业显著减少宕机、提供高可用性和改进关键应用的灾难恢复。

灾难备份技术方案的七个级别：7 Tiers for Disaster Recovery Solution，是指根据国际标准SHARE 78的定义，灾难备份技术方案可以根据以下主要方面所达到的程度而分为七级。

目前大部分厂商的容灾技术最高达到了第6级，只负责复制数据，没有自动接管和启动应用的功能。

但很多用户真正追求的是第七级的容灾解决方案，即完全做到自动判断切换时机、自动切换、自动启动应用等，尽量减小容灾切换过程中的人为干预，减少人为的错误判断。

本文将重点介绍真正的第七级自动的容灾实现方式。

目前IBM本身存储的容灾软件（metro mirror）同主机的双机软件（如AIX 上的HACMP-XD）相结合可以到达真正的7级别的解决方案。

数据中心容灾备份解决方案

详细描述
金融行业数据中心容灾备份解决方案通常采用两地三中心模式，即生产中心、同城灾备中心和异地灾备中心。同时，该方案还需考虑数据加密、身份验证、访问控制等安全措
施，确保数据的安全性和完整性。
案例二：政府数据中心容灾备份解决方案
总结词
政府数据中心需要满足高可用性和数据持久性的要求，因此需要构建稳定、安全的数据中心容灾备份系统。
详细描述
大型企业数据中心容灾备份解决方案通常采用模块化设计，可根据业务需求灵活扩展。该方案还需考虑数据备份、恢复和迁移等环节的自动化和智能化，提高数据中心的运维效率和可靠性。同时，该方案还需考虑数据加密、身份验证、访问控制等安全措施，确
保数据的安全性和完整性。
THANK YOU
详细描述
政府数据中心容灾备份解决方案通常采用一主一备模式，即主数据中心负责业务处理，备数据中心在主数据中心故障时接管业务。该方案还需考虑数据备份、恢复和验证等环节的安全性和可靠性，确保数据的完整性和可用性。
案例三：大型企业数据中心容灾备份解决方案
总结词
大型企业需要构建灵活、可扩展的数据中心容灾备份系统，以满足不断增长的业务需求。
热备
在数据丢失后，通过实时复制技术将数据从一个数据中心快速切换到另一个数据中心。备份系统始终处于运行状态，可以无缝接管。
容灾备份技术的发展
从传统磁带备份到虚拟磁带库、云存储等现代化存储技术的演进。
从本地备份到异地容灾、多地容灾等更高级别的容灾解决方案的推出。
从简单数据复制到实时数据同步、分布式存储等高可用性技术的普及。
备份系统维护
定期对备份系统进行维护，包括硬件设备检查、软件更新、安全加固等，确保备份系统的稳定性和安全性。

容灾技术介绍和IBM容灾方案

容灾方案北京同软涌莲科技有限公司2020年9月26日目录容灾方案 (1)1信息——企业的财富与麻烦 (6)1.1前言 (6)1.2IT大集中－把蛋都装进篮子里 (7)1.3容灾－覆巢之下，亦有完卵 (8)2容灾概述 (10)2.1概述 (10)2.2容灾的实质是确保永不停顿的业务运营 (13)2.3容灾的IT实现 (17)2.3.1容灾的7个层次 (19)2.3.2容灾的业务恢复时间段 (21)2.3.3容灾所涉及的恢复技术 (22)3容灾方案分析 (25)3.1业务连续性开发模式 (26)3.1.1阶段一、灾难类型分析（风险分析） (27)3.1.2阶段二、业务冲击分析 (27)3.1.3阶段三、企业容灾环境分析 (29)3.1.4阶段四、容灾策略制订 (29)3.1.5阶段五、容灾方案设计 (30)3.1.6阶段六、业务连续性流程设计 (31)3.1.7阶段七、业务连续性流程及容灾方案管理和测试 (31)3.2七层灾难恢复解决方案 (32)3.2.1恢复的7个层次 (32)3.2.2细述7个层次 (33)3.3如何选择最优的灾难恢复方案 (39)3.3.1四个关键目标 (40)3.3.2方案成本与业务停止带来的损失 (40)3.3.3与系统体系结构的关系 (41)4容灾系统的设计过程 (44)4.1灾难恢复计划描述 (44)4.2灾难恢复计划项目阶段 (45)4.3数据收集和关键需求分析阶段 (50)4.4风险分析阶段 (52)4.4.1风险管理过程 (52)4.4.2商业影响分析 (53)4.4.3建立可靠的系统 (54)4.5数据保护阶段 (54)4.6恢复阶段 (54)4.7测试和培训阶段 (55)4.8维护和修改阶段 (56)4.9选择灾难恢复方案的步骤介绍 (57)5典型方案介绍 (61)5.1基于软件的数据备份技术 (61)5.2HACMP高可靠性灾备方案 (65)5.2.1HACMP方案 (66)5.2.2HACMP/XD (67)5.3基于磁盘系统的PPRC数据级容灾解决方案 (69)5.3.1同步PPRC数据级灾难备份方案 (71)5.3.2异步PPRC数据级灾难备份方案 (72)6容灾方案演示环境 (77)图表目录附图1.停机原因分析－北美 (10)附图2.灾难备份方案选择标准 (19)附图3.容灾的7各层次 (21)附图4.容灾的业务恢复时间段 (22)附图5.数据复制技术 (24)附图6.灾难备份项目实施过程 (27)附图7.风险分析 (27)附图8.业务冲击分析曲线 (28)附图9.容灾环境分析 (29)附图10.容灾策略制订 (30)附图11.容灾方案层次 (30)附图12.容灾组织架构图 (31)附图13.三者的平衡关系 (32)附图14.灾难恢复的层次划分 (33)附图15.四个关键目标 (40)附图16.成本时间窗口 (41)附图17.高可用系统的构成因素 (41)附图18.灾备计划不同阶段图表 (46)附图19.事件间流程 (53)附图20.风险分析示例 (53)附图21.问题模型 (58)附图22.灾备恢复方案矩阵 (59)附图23.方案评估矩阵 (60)附图24.HDR工作原理1 (62)附图25.HDR工作原理2 (62)附图26 (63)附图27.数据复制工作原理 (63)附图28.同步、异步数据更新 (64)附图29.HACMP/XD PPRC方案 (67)附图30.HAGEO集群 (68)附图31.同步远程拷贝 (69)附图32.异步远程拷贝 (70)附图33.全局镜像 (70)附图34 (71)附图35.PPRC同步实现机制 (72)附图36.ESS的FlashCopy的使用 (73)附图37.FlashCopy COPY选项 (74)附图38 (75)附图39 (76)附图40.基于磁盘系统的PPRC数据级灾难备份解决方案典型应用环境拓扑图 . 771 信息——企业的财富与麻烦1.1 前言1958年，Bill Gore 和他的太太Vieve Gore在美国特拉华州Newark市，自己家里的地下室成立了Gore公司。

IBM+SVC-PPRC+异地容灾解决方案知识讲解

I B M+S V C-P P R C+异地容灾解决方案IBM SVC_PPRC 异地容灾解决方案场景介绍：生产中心与灾备中心距离200公里，线路带宽20M，要求RPO等于零，实现数据级容灾，容灾系统尽可能减少对原生产系统的性能影响。

要点说明：●SVC PPRC Global Mirror，应对物理灾难●GeoRM + Log Shipping，应对逻辑错误，误操作容灾系统设计：异地容灾解决方案的核心即在线数据复制，就在其技术而言，我们认为比较成熟的数据复制技术为：基于智能存储设备实现的硬件级别的数据复制，这种数据复制技术无需占用主机设备的系统资源，它对主机系统的资源消耗极小，可以保证主机上的应用高性能运行。

IBM SVC（SAN Volume Controller）存储虚拟化产品具有通用性强、实施简单的特点，透明地加入原有SAN 环境是SVC的基本功能。

SVC是整个SAN 网络的控制器，在SAN的分区上，逻辑上主要划分为Host Zone和Disk Zone，从而解除主机与存储设备的紧密耦合。

它将整个SAN中的存储设备整合成一个巨大的存储池，可以充分利用所有的存储资源（包含第三方存储设备）并按业务的需求分配存储空间、性能和功能。

因此，通过SVC可以很方便的将目前的存储设备进行整合，建立统一的灾备管理和资源分配平台，可以按照应用/业务不断变化的需求来动态配置存储。

IBM SVC目前提供MetroMirror和GlobalMirror两种高级复制功能。

异步（Global Mirror）功能的设计目的在于针对业务连续性和灾难恢复提供几乎不受距离限制的长距离异步远程复制能力。

在SVC中，同步(MetroMirror)和异步可以作为同一项功能实现，以便灵活地实现远程复制功能。

1.PPRC MetroMirror/同步复制来自服务器的更新被写往本地连接的集群（Cluster）缓存，该系统将数据转发给远地点连接的SVC集群（Cluster）的缓存。

数据库容灾与灾备的解决方案

数据库容灾与灾备的解决方案对于企业来说，数据库是一个至关重要的组成部分，存储着公司的所有关键数据和信息。

但是如果数据库发生灾难，如硬件故障、自然灾害或人为错误，可能会导致数据丢失、服务中断和业务崩溃等严重后果。

因此，数据库容灾与灾备的解决方案变得非常关键，有助于保护数据的安全性和完整性，同时确保业务连续性。

一、容灾与灾备的概念容灾（Disaster Recovery，简称DR）是指在灾难发生后，通过采取一系列的措施来减轻灾难的影响，尽快恢复业务运行，确保系统和数据的完整性。

灾备（Business Continuity，简称BC），则是指在灾难发生后，为了保证业务的连续运行而采取的一系列措施，包括预防、应对和恢复等方面的策略。

二、灾备与容灾的关系与区别灾备是一个更广泛概念，包括了容灾在内。

容灾是灾备的一部分，主要侧重于处理系统和数据的恢复。

而灾备则更注重确保业务的连续性，包括对业务流程的规划、设备备份、数据保护、备份恢复等方面。

三、数据库容灾与灾备的解决方案1. 数据备份与恢复备份是灾备和容灾的基础，通过定期进行数据库的备份，可以避免数据的丢失。

可以采用完整备份、增量备份或差异备份等备份策略，根据业务需求灵活调整备份频率。

同时，还需要测试恢复流程，确保备份数据的可用性和可恢复性。

2. 冗余部署与负载均衡为了提高系统的稳定性和可用性，可以采用冗余部署，即在不同的地理位置或数据中心部署多个数据库服务器。

通过负载均衡技术，将流量均匀分发到多个服务器上，避免单点故障，提高系统的性能和容错能力。

3. 主备复制与同步通过主备复制技术，将主数据库的数据实时复制到备份数据库上。

这样，在主数据库发生故障时，备份数据库可以快速切换为主数据库，并继续提供服务。

同时，通过同步机制保证数据的一致性，确保备份数据库与主数据库的数据同步。

4. 容器化与虚拟化数据库容器化和虚拟化技术可以提高数据库系统的灵活性和可迁移性。

通过将数据库容器化，可以更方便地进行部署和扩展，同时降低系统的维护成本。

ibm存储容灾方案v.03

存储容灾解决方案目录1.1信息系统现状 (3)1.1.1存储系统现状 (3)1.1.2备份系统现状 (4)1.1.3没有一套完善的容灾保护机制 (6)1.2信息中心存储系统建设需求分析 (7)1.2.1存储系统要求 (7)1.3信息中心智能保护系统建设需求分析 (10)1.3.1智能保护系统设备要求 (10)1.4集中存储备份智能保护的建设目标 (11)二、系统建设方案 (12)第一期规划 (12)2.1存储系统总体设计 (12)2.1.1方案总述 (12)2.1.2方案拓扑示意图 (13)2.1.3方案关键优势 (13)2.1.4方案配置 (14)2.1.5存储系统建设所能达到的效果 (15)第二期规划 (15)2.2虚拟化系统总体设计 (15) (15)2.3.1方案拓扑示意图 (16)2.3.2方案关键优势。

(16)2.3.3虚拟化系统建设所能达到的效果 (17)2.3.4VMware服务器虚拟化方案设计 (19)一、概述1.1信息系统现状1.1.1存储系统现状目前业务系统主要应用系统有文件服务器（windows）、应用服务器（windows）、邮件服务器（windows）、防病毒服务器（windows）、HR服务器（windows）和ERP服务器（SUN小机）。

目前应用系统均运行在独立的服务器中，一方面服务器本身容量空间有限，随着业务数据的不断增长，空间已基本饱和，另一方面数据安全性没有保障，服务器故障将面临整个业务系统数据丢失（单台服务器故障，怎么会造成整个数据丢失）。

应用系统的高性能存储空间及数据保护工作是信息中心最为重视的现有存储系统情况统计：（表格把客户目前服务型号及硬盘分布要写的详细些，表格我会提供）从上表情况来看，所有业务系统的数据都存放在本地硬盘上，本地硬盘存储具有如下缺陷：✓单硬盘或者原始RAID方式，故障率高，安全性低。

✓性能低下，影响应用主机性能。

✓磁盘容量性能扩展性差。

IBM的三种PowerAA高可用性容灾方案参考

虚拟化存储解决方案 • SVC Stretch Cluster + Parallel DB
软件解决方案 • DB2 Geographically Dispersed
PureScale Clusters (GDPC) • Geographically Dispersed GPFS
Cluster + Parallel DB • PowerHA-AIX LVM Mirroring
一步满足合规要求(验证平台、准生产平台)等
• 区域性商业银行，以初步建立两地三中心容灾体系为目标。目前更关注于：同城容灾中心的建设和优化(提高应用覆盖范围、资源利用率)、异地容灾中心合规
3
双活并不只是IT技术组件的架构设计问题，还涉及到运维管理、自动化监控等诸多方面
双活网络架构设计以及快速切换问题
管能力 – 由经过长期验证的 IBM 大型主机
HyperSwap 方案移植而来
Power 7 AIX 6.1 PowerHA Ent. Ed. 7 DB
Router
DWDDWMDM MUX MUX
SAN Switch
DS8800 (Primary Storage)
DWDM
(2 Dark Fiber from 2 TSP)
客户自身业务不同类型客户的关注点发展的迫切要求技术创新和市场的声音
• 大型全国性商业银行，已经普遍建成了两地三 • 双活和多中心是客户不懈追求的目标
中心容灾体系。目前更关注于：新技术的使用 • 市场上众多厂商推出了自己的双活和容灾解决
(双活、虚拟化、服务器存储高可用性一体化)、
方案和愿景故事
多生产中心建设、灾备中心的新工作负载、进
IBM可以提供多种Power A-A高可用性/容灾方案

IBM的三种PowerAA高可用性容灾方案参考

一步满足合规要求(验证平台、准生产平台)等
• 区域性商业银行，以初步建立两地三中心容灾体系为目标。目前更关注于：同城容灾中心的建设和优化(提高应用覆盖范围、资源利用率)、异地容灾中心合规
3
双活并不只是IT技术组件的架构设计问题，还涉及到运维管理、自动化监控等诸多方面
双活网络架构设计以及快速切换问题
6A6A4334c03c30-S22t-S2tc2imcivy“voym“osadssdaosrrttateoaatbeiaAioArborti7tkli7kniiecncl8””8ess00::
After
32 static
采购成本
16 mobile 16 “dark”
128 core -----> 96 core
MetroMirror
Primary Site
DWDDMWMDUMX MUX
Router
Power 7 AIX 6.1 PowerHA Ent. Ed. 7 DB Bkup
SAN Switch
DS8800 (Secondary Storage)
MetroMirror
Secondary Site
7
Power DB2 GDPC 特性：<双活+容灾>
▪ 双活：自动负载均衡，节点可随需求增长而增长，不需修改程序。 ▪ 容灾#1：单节点故障发生时，客户端连接自动路由到余下节点。 ▪ 容灾#2：整站点故障发生时，客户端连接自动路由到余下节点
ClCielCnieltCnieltCnieltCnieltCnieltCnieltCnieltCnieltnietnt ApApplAipcpAlapipctAlipaiopcAtlnpiapcoAstlpainpcoAtlpainpcoAtlpianpcoAtlpainpcotlpiancotlaincotainotinon

IBM容灾白皮书

IBM的容灾白皮书内容简介随着时代的发展，人类对于灾难的防范意识和要求越来越高。

灾难的概念范畴非常广泛，本书针对于企业环境，对业界当前讨论的热门话题-- IT容灾系统的概念和实现方法及设计流程做了深入浅出的分析，并从多个层面介绍了相应的解决方案。

希望读者通过本书可以加深对于容灾系统的理解，对设计出一个切实可行的容灾系统能够有所帮助。

第一章信息—企业的财富与麻烦前言1.1 IT大集中－把蛋都装进篮子里1.2 容灾－覆巢之下，亦有完卵第二章容灾概述2.1 概述2.2 容灾的实质是确保永不停顿的业务运营2.3 容灾的IT实现第三章容灾方案分析3.1 业务连续性开发模式3.2 七层灾难恢复解决方案3.3 如何选择最优的灾难恢复方案第四章容灾系统的设计过程4.1 灾难恢复计划描述4.2 灾难恢复计划项目阶段4.3 数据收集和关键需求分析阶段4.4 风险分析阶段4.5 数据保护阶段4.6 恢复阶段4.7 测试和培训阶段4.8 维护和修改阶段4.9 选择灾难恢复方案的步骤介绍第五章典型方案介绍5.1 基于软件的数据备份技术5.2 HACMP高可靠性灾备方案5.3 基于磁盘系统的PPRC数据级灾难备份解决方案附录A.容灾方案演示环境6.1 基于磁盘系统的PPRC数据级灾难备份解决方案典型应用环境附录B.术语第一章企业面临的挑战以及发展趋势1.1前言1958年，Bill Gore 和他的太太Vieve Gore在美国特拉华州Newark市，自己家里的地下室成立了Gore公司。

1969年，Gore公司研制成功独特的，具有防风、防水、透气功能的GORE-TEX面料并广泛应用于生产具有功能性、保护性和时尚感的服装和鞋类产品。

目前，Gore 公司已成为一家在全球拥有6000多名员工、40多间加工厂的跨国公司，并在氟材料的技术研究和应用领域始终占据世界领先地位。

对于Gore这样的以研发新型材料作为企业动力的公司而言，材料的研发过程记录、研发历史数据、研发结果数据是企业最可宝贵的财富。

IBM企业级存储DS8000容灾解决方案

IBM企业级存储DS8000容灾解决方案建议书目录第1章存储容灾为业务运营遮风挡雨 (1)1.1 构建存储容灾解决方案的重要性 (1)1.2 IBM企业级存储DS8000容灾解决方案简述 (2)1.3 IBM企业级存储容灾方案的价值 (2)第2章IBM企业级存储DS8000容灾解决方案介绍 (3)2.1 DS8000容灾解决方案介绍 (3)2.2 DS8000存储容灾技术介绍 (7)2.3 P OWER服务器容灾技术介绍 (14)第3章IBM企业级存储容灾解决方案优势 (17)第4章IBM企业级容灾存储产品介绍 (18)4.1 IBM S YSTEM S TORGE DS8000T URBO系列存储产品 (18)第5章IBM中国公司简介 (25)第1章存储容灾为业务运营遮风挡雨1.1构建存储容灾解决方案的重要性随着社会的发展和科技的进步,企业越来越依赖于数据处理来进行业务运营,对IT系统的依赖性也随之增加｡然而,灾难就像灰尘一样伏击在企业周围,您的业务可能正在一个充满风险和威胁的世界里运行:⏹无法预知的IT硬件设备的损坏､断电､火灾､自然灾害､恐怖袭击等,造成数据丢失或业务的突然中断;⏹系统人员误操作造成意外宕机或关键数据丢失,无法避免;⏹手段频多的黑客攻击､病毒入侵､垃圾邮件､网络与系统的漏洞,造成网络瘫痪､系统崩溃｡如果不能对风险采取有效治理,一旦数据由于上述某种原因丢失,就有可能造成整个企业在运营上的重大不便和经济损失,企业的信誉也将受到影响｡如果核心数据丢失,严重时完全有可能造成整个企业的瘫痪｡由此可见,保证企业的业务连续运营及数据处理的高可靠性和高可用性,已经成为所有IT 人员在建设IT基础架构中首先要考虑的问题｡与此同时,我们需要考虑建立和加强企业的业务恢复计划,以便在发生系统灾难后能够从容应对风险｡企业对存储系统提出了以下要求:⏹数据与存储系统的高可用性,保证数据7X24小时的连续访问;⏹将现有的存储技术集成,创造出一种更有效的数据存储管理,实现高效､高可靠性､低成本的数据管理;⏹需要对企业现有的数据库､邮件系统､文件服务器以及各种应用系统进行集中化､自动化的基于策略的保护;⏹需要一套成熟度高,业内应用广泛的企业级软硬件整体解决方案;⏹易于IT部门日常的管理维护,界面友好,可操作性强;⏹一旦发生灾难(洪水､地震､火灾等),或者人为灾难(用户失误､磁盘失效等)导致数据丢失或者业务中断时,能够快速､及时地恢复数据,保证业务的连续运行｡1.2IBM企业级存储DS8000容灾解决方案简述IBM企业级存储容灾解决方案通过IBM System Storage DS8000企业级高端磁盘存储系统,结合IBM特有的数据复制技术Metro Mirror(同步的数据复制)和Global Mirror (异步的数据复制),在两套或多套DS8000磁盘存储设备间建立数据复制关系从而实现高可用性,在数据存储方面提高您IT基础架构的整体可用性｡方案配合Power服务器AIX操作系统的特色软件PowerHA/XD及IBM全面的业务连续性计划配套服务,为您建立完善的灾难备份中心,从而保证关键数据的可恢复性与业务应用的可持续性｡1.3IBM企业级存储容灾方案的价值IBM企业级存储容灾解决方案从多方面提高您的IT基础架构的整体可用性,使您能够有效地管理风险､保证业务的连续运行,并给您带来以下好处:⏹100% 的本地数据访问弹性;⏹提高系统可用性,增加业务的可持续性,关键业务应用程序免受故障影响;⏹根据业务规范制定全面的连续性和恢复计划,确保程序和基础架构有效地恢复;⏹预测潜在崩溃,并实施计划来保持业务系统和资源的可用性;⏹在灾难和不可预知事件发生后,最快恢复关键业务数据,保障业务运营持续性;⏹加强风险管理,提高市场竞争力;⏹提高业务服务水平,提升客户满意度｡第2章IBM企业级存储DS8000容灾解决方案介绍2.1DS8000容灾解决方案介绍我们按照两地三中心､异地两地､本地存储HA+异地灾备的方案架构分别介绍基于DS8000存储系统的容灾解决方案｡2.1.1两地三中心方案(MGM)灾备复制方法:Power Server + DS8000 + Metro/Global Mirror +Power HA XD集群我们选用IBM的企业级存储系统DS8000,结合磁盘层叠式数据复制技术(Metro Global Mirror,简称MGM)为您建立两地三中心容灾解决方案:在本地生产中心的DS8000存储相应的业务数据,通过Metro Mirror数据同步复制技术将数据复制到同城灾备中心的DS8000,可以实时保证数据的一致性｡同时位于同城灾备中心的DS8000的同一份数据可以同异地远端的DS8000通过Global Mirror数据异步复制技术进行数据镜像,实现异地的数据备份及保护｡当同城灾备中心发生故障时,生产中心的DS8000可以向异地灾备中心的DS8000通过Global Mirror数据异步复制技术同步数据,实现异地的数据备份及保护｡生产中心及灾备中心的数据库服务器均由Power服务器来承担,当生产中心所在地发生灾难时,生产中心的Power 服务器AIX操作系统的PowerHA/XD功能将应用切换到同城灾备/异地灾备中心的Power数据库服务器,同时灾备中心的Power服务器接管灾备中心的存储,从而恢复数据的访问及业务的连续性｡生产中心同城灾备中心异地灾备中心方案技术优势:⏹同城范围镜像数据可以不丢失;⏹异地镜像数据根据灾难情形,尽可能降低数据丢失机率;⏹镜像网络中断恢复后,任意两站点之间可以通过增量方式实现再同步,无需重传;⏹生产中心应用系统响应时间只受本地的两个中心的距离影响｡⏹同城RPO=0,距离Max 303公里,⏹异地RPO最短3-5秒,无距离限制,保证数据一致性,且可故障切换⏹带宽要求低(较友商磁盘级DR),先进的复制机制提高带宽利用率⏹充分利用同城灾备中心的设备,DS8000 FlashCopy的数据可用于系统查询､批处理､测试2.1.2异地二地灾备方案(GM)▪灾备复制方法:Power服务器+ DS8000 + Global Mirror +Power HA XD集群我们选用IBM的企业级存储系统DS8000,结合磁盘数据异步复制技术Global Mirror为您建立异地二地容灾解决方案:在本地生产中心的DS8000存储相应的业务数据,可以同异地远端的DS8000通过Global Mirror模式进行数据镜像,实现异地的数据备份及保护｡生产中心及灾备中心的数据库服务器均由Power服务器来承担,当生产中心所在地发生灾难时,生产中心的Power 服务器AIX操作系统的PowerHA/XD功能将应用切换到异地灾备中心的Power数据库服务器,同时灾备中心的Power服务器接管灾备中心的存储,从而恢复数据的访问及业务的连续性｡方案技术优势:⏹异地RPO最短3-5秒,无距离限制,保证数据一致性,且可故障切换⏹带宽要求低(较友商磁盘级DR),先进的复制机制提高带宽利用率2.1.3存储HA+异地灾备(HA+GM)⏹灾备复制方法: Power Server + DS8000 + Metro Mirror + Global Mirror +Power HA XD集群我们选用两台IBM的企业级存储系统DS8000,在本地生产中心的DS8000存储相应的业务数据,在生产中心通过数据同步复制技术Metro Mirror实现数据的实时同步,实现存储的高可用性,任意一台存储的宕机,也不会影响业务的运行｡同时,结合磁盘数据异步复制技术Global Mirror为您建立异地二地容灾解决方案:本地生产中心的其中一台DS8000存储可以同异地远端的DS8000通过Global Mirror模式进行数据镜像,实现异地的数据备份及保护｡生产中心及灾备中心的数据库服务器均由Power服务器来承担,当生产中心所在地发生灾难时,生产中心的Power 服务器AIX操作系统的PowerHA/XD功能将应用切换到异地灾备中心的Power数据库服务器,同时灾备中心的Power服务器接管灾备中心的存储,从而恢复数据的访问及业务的连续性｡方案技术优势:⏹生产中心存储HA,RPO=0⏹异地RPO最短3-5秒,无距离限制,保证数据一致性,且可故障切换⏹带宽要求低(较友商磁盘级DR),先进的复制机制提高带宽利用率⏹充分利用生产中心HA的设备,DS8000 FlashCopy的数据可用于系统查询､批处理､测试上述三种方案共有的特色有:⏹Power服务器集群与基于DS8000数据镜像的理想集成方案⏹不依赖服务器､文件系统､数据库或操作系统,客户可自主实施､演练,发挥系统的最佳性能⏹可靠性高,技术成熟且应用最广泛⏹实施复杂度低,方案成熟⏹便于管理⏹易于扩展⏹开发投资小,服务成本低方案业务价值:➢尽可能保障没有数据丢失影响;➢为多种应用和业务提供保护;➢为灾难后业务的恢复提供最好的数据基础;➢远距离备份,提高灾难抵抗能力;➢降低镜像网络成本｡2.2DS8000存储容灾技术介绍DS8000存储系统具有智能的数据复制功能,通过FlashCopy(本地数据复制技术)､Metro Mirror(远程数据同步复制技术)和Global Mirror (远程数据异步复制技术),在两套或多套DS8000磁盘存储设备间建立数据复制关系从而实现高可用性｡方案不消耗主机系统的资源,保证相关主机上的应用高效运行｡2.2.1本地数据复制技术– FlashCopyFlashCopy提供一个“时间点”的拷贝服务功能,从源卷到目标卷快速地复制数据｡逻辑拷贝通常可以在数秒时间内完成,然后就释放源卷,进行正常工作｡而物理拷贝操作在后台进行｡当物理拷贝进行过程中,拷贝和被拷贝数据都能被客户应用使用｡Flashcopy产生的目标卷可以进行查询､数据挖掘､后台分析､备份等｡产生的目标卷的数据库也可以在指定的主机上ONLINE起来,进行备份,另外,Flashcopy可以定制COPY的时间间隔,如8小时｡对于主机的误操作如删掉一个表(8小时之内),则可以通过Flashcopy的目标卷找回这个表,如果超过两小时,又可以通过备份的磁带回存找回｡如果数据库处于归档模式(ARCHIVE MODE),对于误删除的表也可以通过磁带备份的ARCHIVE LOG来找回｡FlashCopy支持两个选项,它提供NOCOPY选项来支持灾备应用需求｡关于COPY选项下图对FlashCopy COPY选项进行了说明,请注意,生产数据的一份真实拷贝是为其它的应用使用而产生｡对于一般客户应用,需要实时生产数据的时间点物理拷贝,这样的应用示例包括日常重要卷的备份､日常报表生成､数据仓库和数据挖掘的应用等｡COPY选项能够在磁盘存储设备中产生一份生产数据的真实时间点拷贝｡该选项可以满足以下的应用需求:1.在磁盘存储设备中保存生产数据的一份时间点拷贝的业务需求｡这方面的例子是日常工作系统备份｡2.生产数据的时间点拷贝将被多个应用重复使用,特别是对每日的结束处理和报表生成｡3.生产数据的时间点拷贝将被某些统计分析类应用,如MIS或数据挖掘应用频繁使用｡无论是什么原因,只要需要生产数据的物理拷贝,就可以使用COPY选项来进行支持｡关于NOCOPY选项(IBM 独有技术)IBM FLASY COPY 除支持COPY 选项外, 还支持NOCOPY选项｡该选项调用后,所有在源卷中被改变了的数据块才会从源卷拷贝到目标卷｡而COPY选项是把所有在源卷的数据都拷贝到目标卷｡另外,Flashcopy可支持多种高级功能,包括:多关系FlashCopy多关系FlashCopy允许源数据同时与多个目标建立FlashCopy关系｡这种灵活性允许您在一个指定的逻辑单元号(LUN)､卷或数据集上建立多达12个FlashCopy关系,而不需要首先等待以前的关系结束或终止以前的关系｡增量FlashCopy增量FlashCopy提供了对一个FlashCopy关系中涉及到的LUN或卷进行“刷新”的功能｡以后发起建立FlashCopy时,将只拷贝将目标刷新到源数据的新时间点所需的数据｡“刷新”的方向可以逆转,即以前定义为目标的LUN或卷可以成为以前定义为源的LUN或卷的源数据,而以前定义为源的LUN或卷现在则变成目标｡一致群组命令这一功能允许DS8100在发出FlashCopy一致群组命令之前挂起I/O活动｡一致群组可用于跨多个LUN或卷､甚至跨多个DS8100创建一致的时间点拷贝｡2.2.2远程数据同步复制技术– Metro Mirror点对点远程拷贝(PPRC)是一种同步远程镜像工具,可用于相隔距离最多可达103公里的两个ESS或DS8000系统中指定的逻辑卷｡这一距离可以通过第三方提供的通道扩展器加以延长｡PPRC将确保如果备份卷不能被更新,那么即使源卷更新成功,整个写操作也会返回失败---彻底保证源卷和目的卷的数据彻底一致｡同步方式可以保证数据不会丢失,更重要的是数据的一致性在这种方式下能够得到很好的保证---数据的不一致意味着相关数据的丢失,此时数据库的数据安全机制无法保证数据的安全,严重时有可能造成数据库无法启动｡PPRC的同步实现机制如下图所示:返回数据写入成功信息数据写入后备存储数据写入存储返回写操作完成信息1)､在生产系统中的应用程序将数据写到生产系统的磁盘｡(主要是写入生产中心存储设备的CACHE和相应的NVS当中)2)､备份机磁盘数据复制,备份磁盘复制生产系统数据｡生产系统中的磁盘数据传输到备份中心的磁盘(主要是写入到备份中心存储设备的CACHE和相应的NVS当中)3)､当生产数据都写入备份中心存储设备的CACHE和相应的NVS后,备份磁盘将写完操作信息返给生产磁盘4)､当生产系统收到灾备系统传回的已写信息之后,生产机的磁盘系统通知主机该写操作已完毕,在此之后生产系统应用继续执行｡5)､重复进行以上的操作DS8000及ESS2105-800在PPRC的工作模式下,可以保证数据库及应用的一致性,对电信行业需同城之间的灾备可以采用此种方式｡现在同步复制技术PPRC已经正式改名为Metro Mirror｡2.2.3远程数据异步复制技术(保证一致性) -- Global MirrorPPRC-XD是IBM于2004年4月份推出的可以保证长距离(最长距离可以达到4000公里)的异步灾备方式,IBM的异步灾备PPRC-XD与同步灾备(PPRC)可以动态的转换(对用户是透明的),可以保证数据的一致性,而其它厂商都做不到这一点,对数据的连续性无法保证｡PPRC-XD的异步机制如下图所示:返回数据写入成功信息数据写入存储返回写操作完成信息（非同步的）1)､在生产系统中的应用程序将数据写到生产系统的磁盘｡(主要是写入生产中心存储设备的CACHE和相应的NVS当中)2)､当数据完全写入生产中心存储设备的CACHE和相应的NVS后,I/O完成的信息会返给生产主机,当生产系统收到磁盘系统传回的已写信息之后,生产系统应用继续执行,即可以进行下一步操作｡3)､备份机磁盘数据复制,备份磁盘复制生产系统数据｡生产磁盘会定期把已经改变了的数据传输到备份中心的磁盘｡(主要是写入备份中心存储设备的CACHE和相应的NVS当中)4)､当数据已经写入备份中心存储设备的CACHE和相应的NVS后,写完操作信息会返回给生产磁盘,生产中心的磁盘系统认为此次操作完成｡5)､重复上面的操作PPRC的操作过程同上面正相反,在生产主机受到反馈信号之前(即主机进行下一步操作之前),生产中心的存储设备和备份中心的存储设备都有了上一次操作的I/O｡异步数据复制技术PPRC-XD于2005年作了一系列的重大改进,并分支为Global Copy 和Global Mirror,其中,Global Copy把数据异步复制到远处,不保证一致性;Global Mirror利用一致性组和FlashCopy技术,保证数据异步复制的一致性｡Global Mirror可以同时利用同步的数据一致性优势和异步的性能/距离优势｡该模式采用异步方式工作,并且采用一些机制保证数据一致性,彻底解决了数据保护､距离､性能之间的矛盾｡A BC绿色:生产站点磁盘<PPRC源盘(A盘)>橙色:容灾站点磁盘<PPRC目标盘/FlashCopy源盘(B盘)>蓝色:容灾站点磁盘<FlashCopy目标盘(C盘)>Global Mirror工作方式如下:1.绿色(A盘)和橙色磁盘(B盘)之间进行PPRC-XD异步操作2.绿色磁盘(A盘)组根据预先设置的时间,生成“一致性组”(Consistency Group),并记录状态3.采用PPRC-XD异步操作方式,将且只将“一致性组”记录下来的数据从绿色磁盘组传递到橙色磁盘组4.3完成后,立刻将橙色磁盘组数据FlashCopy到蓝色磁盘组(C盘),进行一致性数据保留5.4完成后,回到步骤1由于有“一致性组”的保护,虽然采用异步方式,一旦每一个“一致性组”数据包传递成功的那一时刻,橙色磁盘组的数据是一致的;由于步骤4,蓝色磁盘组将能够保留最近一次“一致性完全”的数据｡一旦出现灾难,客户丢失的是两次生成“一致性组”间隔之间的数据｡ESS能够每3~5秒生成一次“一致性组”,意味着客户即使采用异步方式,也有可能只丢失3~5秒的数据｡一般的异步方式,客户会丢失几个小时以上的数据,并且操作十分繁琐｡该方案是一个三个卷的解决方案,正常情况下,Global Mirror只需要A､B､C三个卷,即PPRC-XD A->B , FlashCopy B->C,即可保证卓越的异步容灾能力｡但Global Mirror在对生产中心(A卷)进行保护时,在容灾中心的B卷和C卷都是不能被服务器访问的｡如果想把容灾中心的数据作为只读数据源使用,IBM推荐同时使用一个D卷(测试卷)｡D卷是不同于B卷和C 卷的另外一个卷,类似C卷,是具有数据一致性的快照卷,用于启动数据库,进行数据抽取和查询｡如下图所示:2.3Power服务器容灾技术介绍利用IBM PowerHA和Power HA/XD系统软件,可以实现本地高可用集群以及远程容灾功能,产品要点如下:⏹有助于保护关键业务应用,避免中断;无论是计划内还是计划外中断⏹在远程站点使用可选特性PowerHA™/XD,将故障切换功能扩展到备份资源,支持GLVM异步模式或SAN Volume Controller(SVC)上的全局镜像2.3.1IBM PowerHA for AIX (HACMP)IBM PowerHA for AIX® (原名为High Availability Cluster Multiprocessing -HACMP™) 是用于IBM Power系列服务器上的高可靠集群软件,通过冗余配置,消除单点故障,保证整个系统连续可用性和安全可靠性｡HACMP是利用网络来侦测主机及网卡的状况,搭配AIX所提供的硬盘镜像等功能,在主机､网卡､硬盘控制卡､硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作;若是主机故障则切换至备份机上继续应用系统的运行｡PowerHA for AIX 解决方案始终提供可靠的监控､故障检测和业务应用环境向备份资源的自动恢复,为核心数据业务弹性奠定基础｡方案的实现:⏹作为双机系统的两台服务器同时运行PowerHA软件;⏹两台服务器的备份方式有三种:–一台服务器运行应用,另外一台服务器做为备份–两台服务器除正常运行本机的应用外,同时又作为对方的备份主机(负载均衡工作模式)–两台服务器同时运行相同的应用,需要数据库的支持⏹两台主机系统在整个运行过程中,通过“心跳线”相互监测对方的运行情况(包括系统的软硬件运行､网络通讯和应用运行情况等);⏹一旦发现对方主机的运行不正常(出故障)时,故障机上的应用就会立即停止运行,本机(故障机的备份机)就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来,使故障机上的应用在本机继续运行;⏹应用和资源的接管过程由PowerHA软件自动完成,无需人工干预;⏹当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机(备份机)上运行｡2.3.2PowerHA/XD for AIX (HACMP/XD)通过PowerHA/XD可以实施容灾解决方案｡PowerHA/XD(Extended Distance)是PowerHA for AIX的一个可选特性,可以提供GLVM(Geographic Logical Volume Manager)异步模式,并支持SVC Global Mirror｡这两种选项都可以将应用切换到远程站点的备份资源, 而不会影响生产应用环境中的性能(考虑针对园区级距离专门优化的同步复制方法)｡PowerHA/XD使用自身同步模式LVM AIX镜像技术, 通过与对于Enterprise Storage Server® (ESS)､IBM System Storage™(DS6000™和DS8000™)和SAN Volume Controller(SVC)Metro-Mirror对等机的园区级故障切换和对于IP连接对等机故障切换的透明集成,从而能够提供支持｡当PowerHA for AIX检测到一个故障时, 它可以在一个远程冗余系统上将其重新启动,从而能够快速､自动地采取措施,恢复该应用｡PowerHA/XD能够在镜像多个站点间的关键任务数据的同时,还能够将故障切换到这些远程站点,这种特性对于必须保护自己避免出现站点间故障或大规模灾难的客户来说,是至关重要的｡这种特性可以应用到拥有多个站点､地区运营的任意规模的企业,或者希望分散管理数据的任意地点｡PowerHA/XD提供多种技术,可以实现远距离数据镜像､故障切换和重新同步｡PowerHA/XD实现的容灾,可基于两种技术实现:Metro Mirror 和GLVM｡⏹Metro Mirror(城域镜像):如图所示为带IBM DS8000的PowerHA/XD高可用性集群企业级解决方案,DS8000 提供Metro Mirror功能,数据通过FC网络进行复制｡可以实现随需应变的服务器角色切换､离线磁带备份,最大限度地降低日常管理要求｡⏹GLVM:如下图所示为PowerHA /XD for AIX地理分布式存储镜像集群,通过GLVM功能,基于IP网络实现数据复制:第3章IBM企业级存储容灾解决方案优势IBM在方案､技术及支持服务方面也有着其它厂商无法比拟的优势:⏹HACMP是业界唯一能在应用层次实现接管功能的产品;⏹AIX LVM 和i5/OS HASM 提供服务器配合及简易管理功能,而竞争友商的方案没有该功能;⏹LVM技术是AIX操作系统中的缺省技术,只需要少量的实施费用｡⏹复制服务性能的行业领先者⏹更为灵活的复制对象⏹标准的兼容SMI-S接口⏹单一厂家集成,从系统规划､设备提供到实施服务｡⏹最为完善的本地化原厂售后服务团队｡⏹全球最大的业务连续性和灾备服务提供商–从1989年开始正式提供该商业服务–年收入达到6.5亿美元–在执行合同超过15,000个–超过2,500个专职人员–在全球超过76个国家提供服务–在全球拥有130个灾备中心–成功帮助超过450个客户从灾难中恢复–业界满意度最高的服务提供商第4章IBM企业级容灾存储产品介绍4.1IBM System Storge DS8000 Turbo系列存储产品DS8000 Turbo系列产品特性要点⏹该系统经济高效､功能强大､灵活且高度可用,支持关键任务工作负载的不间断运行⏹具备世界级性能,可提高响应速度⏹通过高达1024 TB 的可扩展性促进整合来管理增长和复杂性,支持多种服务器平台和高级管理功能⏹同时支持高性能和高容量磁盘驱动器技术的分层存储,改善运营成本⏹通过HyperPAV､“远距离光纤连接”(Extended Distance FICON®)和协同缓存等功能使IBM 服务器环境实现更高的效率产品技术特性●IBM Virtualization Engine™ 逻辑分区(LPAR):可在一个物理设备上建立两套完全独立的存储子系统;通过减少所需的物理系统数量,帮助提高管理效率;通过在一台设备上支持测试､生产等不同的环境,帮助提高灵活性｡●内部光纤通道互连:卓越的性能,可提高总吞吐量●双SMP 处理器组:加快响应速度,从而使用户能够快速访问关键数据●采用新缓存算法的高容量缓存:动态自行调整缓存使用情况,从而帮助优化当前的工作负载;支持数据无阻碍流动,从而使数据流更顺畅● 1.10 TB 到1024 TB 的物理存储容量,无需中断系统即可进行升级:升级存储容量以满足企业不断变化的需求;无需中断业务。

IBM数据存储和远程容灾方案

数据存储和远程容灾方案网络存储设备提供网络信息系统的信息存取和共享服务，其主要特征体现在：超大存储容量、高数据传输率以及高系统可用性。

传统的网络存储设备都是将RAID磁盘阵列直接连接到网络系统的服务器上，这种形式的网络存储结构称为DAS(Direct Attached Storage)。

此外，SAN(Storage Area Network)和NAS(Network Attached Storage)也是两种常见的存储架构。

SAN(存储区域网络)是一种类似于普通局域网的高速存储网络，SAN提供了一种与现有LAN连接的简易方法，允许企业独立地增加存储容量，并使网络性能不受数据访问的影响。

这种独立的专有网络存储方式使得SAN具有扩展性高、可管理性好和容错能力强等优点。

一、需求分析随着企业业务数据的增加和应用对数据的依赖性的增强，数据的有效汇集、集中管理、综合分析以及容灾备份等处理要求日益提高。

企业的业务系统通常对于存储系统具有以下的需求：1、数据集中化数据存储与管理集中化这种模式有利于各项业务间的联动处理，并且有利于实现分级授权，加强控制和监督，提高集约化管理水平。

2、业务综合化业务综合处理就是将各种业务紧密结合起来成为一个整体，使得各系统之间信息共享，以消除信息孤岛，为数据挖掘与决策分析奠定坚实基础。

综合业务处理系统作为数据高度集中的系统，数据的安全是第一位的。

必须从网络、操作系统、数据库、存储设备等方面建立起一套严密的保障措施，保证企业、用户和业务数据的100%可用。

4、保证系统高可靠性与高可用性综合业务处理系统的数据备份是保证数据高可靠、高可用的基本手段。

在本地及异地建立与业务系统相同的备份系统，或将综合业务处理系统的数据进行实时备份，将大大提高数据资源的可靠性。

5、提高效率降低成本传统的数据由于比较分散，管理和备份都相当困难，容易造成损坏或丢失，安全性很低。

在综合业务处理系统下，数据高度集中，管理和备份都非常方便，提高了工作效率同时也降低了系统成本。

数据库容灾解决方案

数据库容灾解决方案
《数据库容灾解决方案》
在现代信息化社会，数据库已经成为企业和组织中至关重要的数据存储和管理工具。

然而，数据库系统一旦发生故障或遭受灾难，可能造成严重的数据丢失和业务中断，对企业的正常运营产生严重影响。

因此，数据库容灾解决方案成为了企业和组织必须重视和应对的重要问题。

数据库容灾解决方案是指针对数据库系统可能发生故障或遭受灾难时，采取一系列技术和措施来实现数据备份、灾备恢复和业务持续性保障的整体解决方案。

通常包括数据备份和复制、灾难恢复计划、高可用性集群等多种技术手段和方法。

首先，数据备份和复制是数据库容灾解决方案的基础。

通过定期的数据备份和实时的数据复制，可以保证数据库系统在发生故障或灾难时，可以迅速恢复到最近的可用状态，避免数据丢失和业务中断。

其次，灾难恢复计划是数据库容灾解决方案的关键环节。

企业需要在事先制定好灾难恢复计划，明确各种灾难情况下的应对措施和流程，确保在灾难发生时可以迅速有效地进行数据库系统的恢复和业务的持续运行。

此外，高可用性集群技术也是数据库容灾解决方案中常见的手段之一。

通过构建高可用性集群，可以实现数据库系统的容错和自动故障转移，保证数据库系统在发生故障时能够自动切换
到备用节点，确保业务的持续性。

总的来说，数据库容灾解决方案是企业和组织在建立和运营数据库系统时必须认真考虑和实施的重要措施。

通过科学合理地选择和应用各种技术手段，可以有效地保障数据库系统的可用性和数据的完整性，确保业务的持续运行，从而最大程度地降低因数据库系统故障或灾难而造成的损失。

IBM SVC 异构存储容灾解决方案建议书

IBM SVC异构存储容灾解决方案建议书目录1. 异构存储容灾的必要性 (1)1.1.为什么要实施异构存储容灾 (1)1.1.1. 容灾的重要性 (1)1.1.2. 容灾系统建立时面临的异构挑战 (1)1.2.IBM SVC异构存储容灾解决方案简介 (2)1.2.1. 第一步 IBM SVC异构存储的整合 (3)1.2.2. 第二步 IBM SVC异构存储的容灾 (4)1.2.3. IBM SVC异构存储容灾解决方案适用场景 (5)2. IBM SVC异构存储容灾解决方案 (6)2.1.解决方案拓扑图及常用配置 (6)2.1.1. VDisk Mirror + Metro Mirror方式拓扑图及介绍 (7)2.1.2. Global Mirror方式拓扑图及介绍 (9)2.1.3. IBM SVC异构存储解决方案常用配置 (11)3. IBM方案的优势 (12)3.1.IBM SVC异构存储容灾解决方案的优势 (12)3.1.1. IBM SVC异构存储整合及容灾产品的优势 (12)3.1.2. IBM在容灾服务上的优势 (13)3.2.IBM强大的实施能力和丰富的经验 (14)1.异构存储容灾的必要性1.1.为什么要实施异构存储容灾1.1.1.容灾的重要性随着企业的高速发展，业务数据量不断攀升，数据里记录着企业的运营情况，同时给决策者提供重要信息，成为企业最宝贵的财富之一。

大多数企业把数据集中存储到数据中心进行管理，在带来提升管理和业务效率的同时，数据中心也存在遭到毁灭性打击的风险。

因此，数据容灾已成为企业发展所必须考虑的问题之一。

容灾（Disaster Recovery）是指为了保证关键业务和应用在经历各种灾难后，仍然能够最大限度的提供正常服务的所进行的一系列系统计划及建设行为。

典型的灾难事件是自然灾难，如火灾、洪水、地震、飓风、龙卷风、台风等，还有其它如原先提供给业务运营所需的服务中断，如设备故障、软件错误、电信网络中断和电力故障等等。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1、基于软件的数据备份技术在应用软件进行灾难备份的解决方案中，应从下面三个层次考虑：用户应用程序客户机软件数据库引擎其中用户应用程序和客户机软件一般不包含关键数据，几乎所有数据都由数据库引擎管理并放置在数据库服务器中。

在这三者之中，数据库中的数据保护最为重要。

一般情况下，用户应用程序和客户机软件只需要将其执行代码和参数配置文件做以备份，当灾难发生时，可以通过这些备份重新安装和配置用户应用程序和客户机软件。

对数据库的备份，如果采用硬件级灾难备份有两种方法：一是采用备份的方法，即定期地将数据备份到硬盘和磁带/磁带库上，这些磁带可以通过运输的方式运到远程，以防磁带在本地的灾难中发生毁坏。

这种方法的缺陷是实时性较差，恢复时间较长；另一种做法就是硬件镜像的做法，这种做法在硬件的投资上较大，对两点间的网络带宽有较大的要求。

那么，有没有一种两者兼顾的解决方案呢？数据库产品提供的数据库复制技术就是一种两者兼顾的灾难备份解决方案。

在前面提到的灾难恢复方案的7个层次中属于第5或第6层次。

数据库复制技术在数据库级别的灾难备份解决方案中可以实现远程容灾。

目前已有的产品有IBM DB2 HADR、IBM INFORMIX HDR以及ORACLE DATA GUARD。

IBM DB2 HADR是High Availability Disaster Recovery 的缩写，HADR 将HA（高可用性）和INFORMIX DR的技术紧密结合起来。

INFORMIX HDR是High Availability Data Replication的缩写。

HDR的工作原理是通过将主数据库服务器（简称为A）的逻辑日志缓冲区复制到备份数据库服务器（简称为B），而且能在主数据库服务器操作失败时自动切换到备份数据库服务器。

复制方式有同步方式和异步方式两种。

我们将在下面详细介绍HDR的工作原理以及同步方式和异步方式。

正常状态下，主数据库服务器做数据库的读写操作，备份数据库服务器为只读方式。

当主数据库服务器失败时，备份数据库服务器会自动接管主数据库服务器的事务处理。

此时，备份数据库服务器作为主数据库服务器进行数据库的读写操作。

当主数据库服务器被修复后，主数据库服务器作为新的备份数据库服务器。

此时备份数据库服务器虽为只读方式，但并不是空闲的。

它可以分担主数据库服务器的负载，例如执行查询、出报表等任务。

数据库复制对硬件的要求相对较低，只要主数据库服务器和备份数据库服务器的硬件配置相同即可，不是必须使用高端存储设备，例如IBM ESS等。

主数据库服务器和备份数据库服务器的距离不受限制，而且对网络的压力并不大，但需要更强的数据库管理能力。

下面介绍一下HDR的工作原理。

如下图所示：在逻辑日志缓冲区（Logical Log buffer）刷新之前，它里面所有的交易（Transaction ）将拷贝到数据复制缓冲区（Data Replication Buffer）。

数据复制缓冲区的大小和逻辑日志缓冲区相同。

数据复制缓冲区通过TCP/IP网络将数据发送到备份数据库服务器的数据复制缓冲区中。

在备份数据库服务器端，一个数据复制线程接收数据复制缓冲区的数据并把他们放入到恢复缓冲区（Recovery Buffer）. 另一个数据复制线程（或一些线程）记录数据库日志信息。

主数据库服务器和备份数据库服务器都有一个“Ping”线程在运行，它会定时唤醒并且检查两个数据库服务器的连接。

如果任何一台服务器上的“Ping”线程检测到连接中断，都会发一条出错信息到消息日志中。

HDR有两种复制方式：同步方式（Synchronous）和异步方式（Asynchronous）在同步复制的方式下，主数据库服务器的逻辑日志缓冲区只有在下面的过程完成后才可以刷新：1. Copy: 逻辑日志缓冲区数据拷贝到数据复制缓冲区；2. Send: 数据从主数据库服务器的数据复制缓冲区通过网络传送到备份数据库服务器；3. Acknowledge:当备份数据库服务器接收到数据后发回确认信息；4. Flush: 此时，主数据库服务器才可以刷新其逻辑日志缓冲区的数据。

采用同步方式的优点是两边数据库服务器的数据一致，但是由于每笔在主数据库服务期提交的交易需要发送到备份数据库服务器而且得到确认后才算真正成功完成，由此而产生的时间延迟会使性能受到一定的影响。

如果采用异步复制方式，主数据库服务器的逻辑日志缓冲区只要在逻辑日志缓冲区的数据拷贝到数据复制缓冲区之后就可以进行刷新了。

这样做的缺点是在某些系统失败的情况下，可能会有一些数据还没有来得及通过网络传送到备份数据库服务器；优点是主数据库服务器的性能不受影响。

对于Oracle DATA GUARD的工作原理，大致上与IBM HADR 和INFORMIX HDR 的工作原理类似。

Oracle9i DATA GUARD 通过使用称为备份的数据库来防止数据灾难的出现。

它通过将源数据库的重做日志传输并应用到备份数据库中，来使备份数据库与源数据库同步：可以将重做日志直接从源数据库同步的写到备份数据库，来完成零数据损失的灾难保护，这会给源数据库的性能带来一定的性能损失。

可以将归档的重做日志从源数据库异步的写到备份数据库，来使源数据库在极少的损失性能的前提下，最小化地减少数据的丢失。

如果重做日志数据到达备份数据库后就快速应用到备份数据库，则在源数据库出现问题时便可以快速地切换到备份数据库。

然而，如果延缓一定时间后再应用重做日志数据，就可以避免源数据库的错误快速地传播到备份数据库。

DATA GUARD同样也有同步和异步复制两种方式可以选择。

2基于磁盘系统的PPRC数据级容灾解决方案本节介绍的基于磁盘系统的PPRC（Peer-to-Peer Remote Copy）数据级容灾解决方案，是灾难恢复方案的7个级别中的第六个级别，可以保证少量或无数据丢失，实现最高一级数据的实时性，适用于那些几乎不允许数据丢失和要求能快速将数据恢复到应用中的业务。

此种解决方案提供数据的一致性，不依赖于应用而靠大量的硬件技术来实现。

目前业界有两种基本的基于磁盘系统的远程拷贝形式：同步PPRC远程拷贝(synchronous writes)：来自主机的数据被写往本地连接的磁盘系统，该系统将数据转发给远地点连接的磁盘系统。

只有当两个系统都拥有数据的拷贝以后，本地系统才会向主机返回一个I/O完成指示。

同步远程拷贝能够在远地点提供最新的数据，但应用程序会因等待写I/O操作的完成而被延迟。

由于距离的限制这种方式也叫做“同城镜像(Metro Mirror)”异步PPRC远程拷贝(Asynchronous Write )：来自主机的数据被写往本地连接的磁盘系统，该系统立即向主机返回一个I/O完成指示。

数据在很短的一段时间(在实际中通常在数秒钟到一分钟左右)以后被送往一个远程磁盘系统。

异步远程拷贝对应用程序性能的影响最小，但远程磁盘系统在数据的更新程度上与本地系统相比会有一个延迟。

单纯的异步拷贝由于线路距离较远等原因，本地磁盘和远地磁盘可能会有逻辑卷读写顺序上的差异。

这种方式也叫做“全局拷贝(Global Copy)”在全局拷贝(Global Copy)的情况下，比如本地磁盘系统提供给主机5个逻辑卷，某一时刻主机对这些逻辑卷发起了A，B，C，D，E，5个写盘请求，本地的磁盘系统的写顺序是A，B，C，D，E。

但是由于线路等原因，远地的磁盘系统在接收写请求时，收到的顺序可能是A，C，B，D，E。

写盘的顺序也是A，C，B，D，E。

我们假设灾难发生在这5个写操作D，B的中间部分，那么这时远地的数据C很有可能是没有意义的，甚至是无理的。

为了解决本地磁盘和远地磁盘可能存在的逻辑卷读写顺序的差异，有的磁盘系统提供带有一致性组的异步远程数据拷贝。

在这种方式下，远地的磁盘系统会将先收到的写请求缓存起来(比如上面的数据C)，等到它前面的数据(A,B)到达后，再按照顺序写盘。

这种方式也叫做“全局镜像(Global Mirror)”。

见下图:IBM异步PPRC远程拷贝提供带有一致性组的异步远程数据拷贝。

下面，分别针对两种方案在IBM ESS中的实施方案予以介绍。

2.1、同步PPRC数据级灾难备份方案IBM的PPRC提供了实现灾难备份的方案基础。

PPRC全称Peer-to-Peer Remote Copy，是以存储为基础的实时且与应用程序无关的数据远程镜像功能。

PPRC的实现较为简单，是无数据丢失且具有完全恢复功能的灾难恢复解决方案。

PPRC基于IBM ESS企业级存储服务器，以逻辑卷为基本单位，通过光纤通道将本地ESS上的数据同步镜像到远端的ESS上。

为了在保证数据的即时性、完整性和系统性能之间达到平衡，PPRC提供了多种工作方式。

同步方式下:点对点远程拷贝(PPRC)是一种同步远程镜像的工具，可用于相隔距离达103公里的两个ESS系统中指定的逻辑卷。

这一距离可以通过第三方提供的通道扩展器加以延长，ESS可以为所有连接的主机支持PPRC功能。

PPRC 将确保如果备份卷不能被更新，那么即使源卷更新成功，整个写操作也会返回失败---保证源卷和目的卷的数据彻底一致。

同步方式可以保证数据不会丢失，更重要的是数据的一致性在这种方式下能够得到很好的保证---数据的不一致意味着相关数据的丢失，此时数据库的数据安全机制无法保证数据的安全，严重时有可能造成数据库无法启动。

PPRC的同步实现机制如下图所示：PPRC同步工作过程为：1、应用程序将数据写入磁盘--在生产系统中的应用程序将数据写到生产系统的磁盘。

2、生产系统中的磁盘数据传输到备份磁盘--对每一个在生产系统的写操作都要将这个写操作送到备份磁盘。

3、备份机磁盘数据复制--备份磁盘复制生产系统的数据。

4、将写完的操作信息返给生产磁盘--当生产系统收到备份系统传回的已写信息之后，生产机的磁盘系统通知主机该写操作已完毕，在此之后生产系统的应用将继续执行。

在同步PPRC的建立过程中，卷具有不同的状态，以保证数据的完整性。

2.2、异步PPRC数据级灾难备份方案PPRC + FlashCopy数据备份方案为了提高PPRC数据备份方案的效率，可以考虑结合IBM公司企业级存储服务器ESS的FlashCopy功能软件，采用异步方式实现PPRC数据备份。

在异步工作方式下，PPRC能够在远端更新没有完成的情况下，只要本地更新成功，就可以向主机返回“写成功”的信号。

好处是：在主备机房之间的数据链路带宽成为瓶颈时，采用异步方式可以不影响主机房生产系统的性能。

坏处是：1、数据将有可能丢失；2、在异步同步不能最终成功完成的情况下，数据的一致性无法得到保证。

所以当采用异步方式时，IBM建议先采用IBM ESS的快速拷贝功能FlashCopy备份需同步的数据，再进行数据同步。