业务连续性容灾-两地三中心方案白皮书
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
业务连续性容灾解决方案
两地三中心解决方案技术白皮书
目录
1概述 (7)
1.1数据中心业务连续性的挑战 (7)
1.2方案概述 (7)
1.3方案亮点 (7)
2两地三中心方案架构 (9)
2.1级联组网架构 (9)
2.1.1同步+异步级联方案 (9)
2.1.2异步+异步级联方案 (10)
2.2并联组网架构 (10)
2.2.1同步+异步并联方案 (10)
2.2.2异步+异步并联方案 (11)
2.3双活组网架构 (11)
2.3.1HyperMetro+异步级联方案 (11)
2.4 关键组件技术实施要求 (12)
3两地三中心方案工作原理 (13)
3.1同步+异步级联工作原理 (13)
3.1.1初始同步处理 (13)
3.1.2IO 处理流程 (14)
3.1.3灾难切换处理 (14)
3.1.4灾难恢复处理 (15)
3.1.5链路和灾备端故障处理 (15)
3.2同步+异步并联工作原理 (15)
3.2.1初始同步处理 (15)
3.2.2IO 处理流程 (16)
3.2.3灾难切换处理 (16)
3.2.4灾难恢复处理 (17)
3.2.5链路和灾备端故障 (17)
3.3异步+异步级联工作原理 (17)
3.3.1初始同步处理 (17)
3.3.2正常状态处理 (18)
3.3.3灾难切换处理 (19)
3.3.4灾难恢复处理 (20)
3.3.5链路和灾备端故障 (20)
3.4异步+异步并联工作原理 (20)
3.4.1初始同步处理 (20)
3.4.2正常状态处理 (21)
3.4.3灾难切换处理 (22)
3.4.4灾难恢复处理 (23)
3.4.5链路和灾备端故障 (23)
3.5HyperMetro+异步级联工作原理 (23)
3.5.1初始同步处理 (23)
3.5.2正常状态处理 (24)
3.5.3灾难切换处理 (24)
3.5.4灾难恢复处理 (25)
3.5.5链路和灾备端故障 (26)
3.6两地三中心容灾关键技术原理 (26)
3.7容灾管理 (29)
4两地三中心容灾业务恢复流程 (32)
4.1容灾测试流程 (32)
4.2计划性迁移流程 (33)
4.3故障切换流程 (34)
5 总结 (35)
6 缩略语 (36)
插图目录
图2-1 级联组网的两地三中心容灾架构 (9)
图2-2 并联组网的两地三中心容灾架构 (10)
图2-3 HyperMetro+异步的两地三中心容灾架构 (11)
图3-1 级联组网(同步+异步)IO 处理流程 (14)
图3-2 并联组网(同步+异步)IO 处理流程 (16)
图3-3 远程复制状态转移图 (27)
图3-4 Cache 多时间戳复制原理 (28)
图3-5 容灾管理DashBoard (29)
图3-6 容灾管理配置向导 (30)
图3-7 容灾管理组网拓扑展示 (31)
图3-8 一键式灾难恢复介绍 (31)
图4-1 一键式测试操作 (32)
图4-2 一键式计划性迁移 (33)
图4-3 一键式故障切换 (34)
表格目录表3-1 远程复制状态描述 (26)
1 概述
1.1数据中心业务连续性的挑战
随着信息化技术的飞速发展,信息系统在各种行业的关键业务中扮演着越来越重要的
角色。
在通讯、金融、医疗、电子商务、物流、政府等领域,信息系统业务中断会导
致巨大经济损失、影响品牌形象并可能导致重要数据丢失。
因此,保证业务连续性是
信息系统建设的关键。
近年来,大范围自然灾害时常发生,为保障业务连续性,同城灾备中心结合异地灾备
中心的“两地三中心”容灾解决方案越来越受到业界重视和认可。
1.2方案概述
两地三中心容灾解决方案中的“两地三中心”一般指的是一个生产中心、一个同城灾
难备份中心、一个异地灾难备份中心。
生产中心的数据同步地复制到同城灾难备份中
心,同时,生产中心的数据异步地复制到异地灾难备份中心。
同城灾备中心通常具备与生产中心等同业务处理能力,应用可在不丢失数据的情况下
切换到同城灾备中心运行,保持业务连续运行。
在出现小概率的大范围的灾难时,如自然灾害地震,造成同城灾难备份中心与生产中
心同时不可用,应用可以切换到异地灾难备份中心。
通过实施经过日常灾难演练的步
骤,应用可在业务容许的时间内,在异地的灾难备份中心恢复,保证业务连续运行。
但异地恢复通常会丢失少量的数据。
相比仅建立同城灾难备份中心或异地灾难备份中心,“两地三中心”的方式结合两者的优
点,能够适应更大范围的灾难场景,对于小范围的区域性灾难和较大范围的自然灾害,
都能够通过灾难备份系统较快地响应,尽可能保全业务数据不丢失,实现更优的
RPO 和RTO。
所以,两地三中心容灾解决方案得到了广泛的应用。
1.3方案亮点
华为两地三中心解决方案的亮点和优势如下:
高中低端阵列复制技术互通
华为全系列存储产品都采用统一的存储操作系统平台,高、中、低端阵列之间都可建
立远程复制关系。
客户在产品选型时,可以根据业务需要选择匹配的异地灾备中心磁
盘阵列,显著提升容灾建设投入产出比。
秒级异步复制RPO,分钟级RTO
基于Cache 多时间戳的异步远程复制,最小支持3s 的复制周期。
华为容灾管理软件
OceanStor BCManager 提供的一键式容灾测试和容灾切换功能大大简化灾备恢复操作,
使灾备端数据库的恢复时间达到分钟级,缩短恢复时间。
容灾业务和拓扑可视化管理
华为容灾管理软件OceanStor BCManager 支持可视化展示两地三中心的物理拓扑和业
务逻辑拓扑。
并且支持一键式容灾测试和切换,支持客户定制脚本一键恢复备用业务
系统,简化灾备系统的管理和维护。
2 两地三中心方案架构
两地三中心的容灾方式是当前容灾建设的一个重要趋势,在电信、金融、制造等领域
得到广泛的使用。
通过建设近距离的数据中心(同城数据中心)获得接近于零数据丢失的数据保护,通
过建设较远距离的数据中心(异地数据中心)获得远距离的数据保护,避免区域性的
灾难导致业务无法恢复。
华为两地三中心解决方案支持级联组网(同步+异步,异步+
异步)方案(即“A->B,B->C”组网)、并联组网(同步+异步,异步+异步)方案
(即“A->B,A->C”组网)和双活组网(双活+异步)方案(即“A<->B,B->C”组
网)。
2.1级联组网架构
图2-1 级联组网的两地三中心容灾架构
2.1.1同步+异步级联方案
如图2-1 所示,在生产中心部署磁盘阵列A;在同城灾备中心部署磁盘阵列B,两个数
据中心之间通过FC 链路实现互联,生产中心的磁盘阵列A 与同城灾备中心磁盘阵列
B 建立同步远程复制,将磁盘阵列A 的数据实时同步到磁盘阵列B;在异地灾备中心,
部署磁盘阵列C,与同城灾备中心的磁盘阵列B 建立异步远程复制,将磁盘阵列B 的
数据定时地同步到阵列C。
在同城灾备中心和异地灾备中心部署容灾管理软件,实现对3 个数据中心的统一容灾
管理。
容灾管理软件可以展示两地三中心容灾方案物理拓扑和业务逻辑拓扑,并且支
持在同城灾备中心以及异地灾备中心一键式容灾测试以及一键式容灾恢复。
2.1.2异步+异步级联方案
如图2-1 所示,在生产中心部署磁盘阵列A;在同城灾备中心部署磁盘阵列B,两个数
据中心之间根据数据变化量对带宽的需求,可以通过FC 链路或者IP 链路实现互联,
生产中心的磁盘阵列A 与同城灾备中心磁盘阵列B 建立异步远程复制,将磁盘阵列A
的数据定时同步到磁盘阵列B;在异地灾备中心,部署磁盘阵列C,与同城灾备中心的
磁盘阵列B 建立异步远程复制,将阵列B 的数据定时的地同步到阵列C。
在同城灾备中心和异地灾备中心部署容灾管理软件,实现对3 个数据中心的统一容灾
管理。
容灾管理软件可以展示两地三中心容灾方案物理拓扑和业务逻辑拓扑,并且支
持在同城灾备中心以及异地灾备中心一键式容灾测试以及一键式容灾恢复。
2.2并联组网架构
图2-2 并联组网的两地三中心容灾架构
2.2.1同步+异步并联方案
如图2-2,在生产中心部署磁盘阵列A;在同城灾备中心部署磁盘阵列B,两个数据中
心之间通过FC 链路实现互联,生产中心的磁盘阵列A 与同城灾备中心磁盘阵列B 建
立同步远程复制,将阵列A 的数据实时同步到阵列B;在异地灾备中心,部署磁盘阵列
C,通过生产中心与异地灾备中心的IP 链路,实现生产中心的磁盘阵列A 与异地灾备
中心磁盘阵列C 建立异步远程复制,异步地将数据同步到磁盘阵列C。
在同城灾备中心和异地灾备中心部署容灾管理软件,实现对3 个数据中心的统一容灾
管理。
容灾管理软件可以展示两地三中心容灾方案物理拓扑和业务逻辑拓扑,并且支
持在同城灾备中心以及异地灾备中心一键式容灾测试以及一键式容灾恢复。
2.2.2异步+异步并联方案
如图2-2,在生产中心部署磁盘阵列A;在同城灾备中心部署磁盘阵列B,两个数据中
心之间根据数据变化量对带宽的需求,可以通过FC 链路或者IP 链路实现互联,生产中
心的磁盘阵列A 与同城灾备中心建立异步远程复制,将磁盘阵列A 的数据定时同步到
磁盘阵列B;在异地灾备中心部署磁盘阵列C,与生产中心的磁盘阵列建立异步远程复
制,将磁盘阵列A 的数据定时地同步到阵列C。
在同城灾备中心和异地灾备中心部署容灾管理软件,实现对 3 个数据中心的统一容灾
管理。
容灾管理软件可以可视化的展示两地三中心容灾方案物理拓扑和业务逻辑拓扑,
并且支持在同城灾备中心以及异地灾备中心一键式容灾测试以及一键式容灾恢复。
2.3双活组网架构
2.3.1HyperMetro+异步级联方案
图2-3 HyperMetro+异步的两地三中心容灾架构
如2-4,在生产中心A 和生产中心B 位于同城,可通过裸光纤或波分设备实现FC 网络
互联,也支持通过10GE 网络互联。
生产中心A 和生产中心B 同时对外提供业务,
HyperMetro 不仅实现数据实时双向镜像,而且保证任何数据中心阵列故障,对上层业
务透明切换,业务不中断。
在异地灾备中心,部署磁盘阵列C,与生产中心A 或B 任
意磁盘阵列建立异步远程复制,将双活镜像的磁盘阵列数据周期性的同步到磁盘阵列
C。
在生产中心B 和异地灾备中心部署容灾管理软件,实现对双活+异步复制统一容灾管理。
容灾管理软件可以展示两地三中心容灾方案物理拓扑和业务逻辑拓扑,并且支持在异
地灾备中心一键式容灾测试以及一键式容灾恢复。
2.4 关键组件技术实施要求
城域网要求:(同步远程复制,双活)
容灾网络距离:<100km,双活建议<100km,裸光纤连接。
传输延迟:<1ms (单向)。
网络真实带宽:>业务的峰值写IO 带宽。
广域网要求:(异步远程复制)
容灾网络距离:无限制。
传输延迟:<50ms (单向)。
网络真实带宽:>业务的平均写IO 带宽。
管理工作站:
管理工作站需要三中心间通信。
网络距离要求:无限制。
通信网络带宽要求:10Mb/s。
3 两地三中心方案工作原理
3.1同步+异步级联工作原理
3.1.1初始同步处理
同步远程复制关系建立时,系统自动启动初始同步,将主LUN 的数据全部复制到从
LUN,复制期间,主LUN 如果接收到生产主机新写入的数据,也会将其复制到从
LUN。
初始同步完成后,主LUN 与从LUN 的数据完全一致,同步远程复制进入正常
状态。
远程复制关系建立时,系统自动启动初始同步,将主LUN 的数据全部复制到从LUN。
初始同步完成后,异步远程复制进入正常状态。
3.1.2IO 处理流程
图3-1 级联组网(同步+异步)IO 处理流程
级联组网(同步+异步)方案IO 处理流程如上图所示:
1.主机下发IO 到磁盘阵列A 的LUN1。
2.IO 写入A 站点的LUN1,并通过同步复制同时写入B 站点的LUN12(LUN12 既
是同步远程复制的从LUN,又是异步远程复制的主LUN)。
3.当异步远程复制同步周期到来,磁盘阵列B 生成LUN12 在此时间点的数据(如t1
时间点数据)。
4.磁盘阵列C 生成同步开始前LUN2 的该时间点数据(如t2 时间点数据)。
如果异
步远程复制同步失败,当需要使用LUN2 运行业务时,系统自动回滚到该时间点数
据,以保证磁盘阵列C 中数据的可用性。
5.后台启动由LUN12 在t1 时间点的数据到LUN2 的周期性同步。
如果在异步远程复制启动同步时,同步远程复制的从LUN(LUN12)状态不允许启动
同步,则周期性同步不会被启动,直到从LUN 状态允许启动同步时才生成多时间点数
据,并启动同步。
3.1.3灾难切换处理
1)生产中心故障
当生产中心发生灾难后,不能再提供业务。
同城灾备中心的从LUN 保存着与主LUN
完全同步的数据,保障数据不丢失。
如果同城灾备中心部署有备用主机,则备用主机
可以访问从LUN,接管业务。
从LUN 开始被主机访问后,每次收到新写入的数据,远程复制会自动记录其地址,以
便用于后续增量恢复,缩短业务回切的时间。
2)生产中心和同城灾备中心同时故障
当生产中心和同城灾备中心在重大灾难导致数据都不可用时,异地备中心的从LUN 保
存着与主LUN 相隔一定时间周期(1-2 个复制周期)之前的数据,保障数据绝大部分
不丢失。
如果异地同城灾备中心部署有备用主机,则备用主机可以访问从LUN,接管业
务。
异地灾备中心从LUN 开始被主机访问后,每次收到新写入的数据,远程复制会自
动记录其地址,以便用于后续增量恢复,缩短业务回切的时间。
3.1.4灾难恢复处理
1)数据未被破坏时
当生产中心灾难恢复后,如果磁盘阵列A 和B 没有受到破坏,主LUN 能够恢复其原有
数据,则远程复制可以将主LUN 故障期间,从LUN 12 或者LUN2 新写入的数据增量
复制到主LUN。
复制完成后,主、从LUN 保持复制关系。
此时,可以将业务切换回生
产中心,重新由生产主机访问磁盘阵列A 的主LUN,远程复制重新保持由主
LUN 向从LUN 实时同步数据。
2)数据完全被破坏时
当磁盘阵列A 或B 被破坏,数据不可修复时,需要重建磁盘阵列A 或者磁盘阵列B,
将从端数据反向复制到主端B 和主端A 上,调整主从关系,在生产中心恢复业务。
3.1.5链路和灾备端故障处理
当生产中心与同城灾备中心的复制链路故障或者任意灾备中心设备故障,则远程复制自
动断开复制,不影响生产系统的正常运行。
生产中心主LUN 将记录故障期间的数据差
异变化,待故障恢复后,自动将增量数据同步到从LUN。
3.2同步+异步并联工作原理
3.2.1初始同步处理
同步远程复制关系建立时,系统自动启动初始同步,将主LUN 的数据全部复制到从
LUN,复制期间,主LUN 如果接收到新的生产主机的写入的数据,也会将其复制到从
LUN。
初始同步完成后,主LUN 与从LUN 的数据完全一致,同步远程复制进入正常状
态。
异步远程复制关系建立时,系统自动启动初始同步,将主LUN 的数据全部复制到从
LUN。
初始同步完成后,异步远程复制进入正常状态。
3.2.2IO 处理流程
图3-2 并联组网(同步+异步)IO 处理流程
具体的处理流程如下:
1.主机下发IO 到磁盘阵列A 的LUN1。
2. A 站点主机写IO 双写到LUN1 和B 站点LUN12(LUN1 既是同步远程复制的主
LUN,又是异步远程复制的主LUN)。
3.当异步远程复制同步周期到来,磁盘阵列A 生成LUN1 在此时间点的数据(如t1
时间点数据)。
4.磁盘阵列C 生成LUN2 的该时间点数据(如t2 时间点数据)。
如果异步远程复制
同步失败,当需要使用LUN2 运行业务时,系统自动回滚到该时间点数据,以保证
磁盘阵列C 中数据的可用性。
5.后台启动由LUN1 在t1 时间点的数据到LUN2 的周期性同步。
3.2.3灾难切换处理
1)生产中心故障
当生产中心发生灾难后,不能再提供业务。
同城灾备中心的从LUN 保存着与主LUN
完全同步的数据,保障数据不丢失。
如果同城灾备中心部署有备用主机,则备用主机
可以访问从LUN,接管业务。
从LUN 开始被主机访问后,每次收到新写入的数据,远程复制会自动记录其地址,以
便用于后续增量恢复,缩短业务回切的时间。
2)生产中心和同城灾备中心同时故障
当生产中心和同城灾备中心在遭遇重大灾难导致数据均不可用时,异地灾备中心的从
LUN 保存着与主LUN 间隔一定时间周期(复制周期)之前的数据,保障数据绝大部分
不丢失。
如果异地同城灾备中心部署有备用主机,则备用主机可以访问从LUN,接管业
务。
异地灾备中心从LUN 开始被主机访问后,每次收到新写入的数据,远程复制会自
动记录其地址,以便用于后续增量恢复,缩短业务回切的时间。
3.2.4灾难恢复处理
1)数据未被破坏时
当生产中心灾难恢复后,如果磁盘阵列A 和B 没有受到破坏,主LUN 能够恢复其原有
数据,则远程复制可以将主LUN 故障期间,从LUN 1’新写入的数据增量复制到主
LUN。
复制完成后,主、从LUN 保持复制关系。
此时,可以将业务切换回生产中心,
重新由生产主机访问磁盘阵列A 的主LUN,远程复制重新保持由主LUN 向从LUN 实
时同步数据。
2)数据完全被破坏时
当磁盘阵列A 或B 被破坏,数据不可修复时,需要重建磁盘阵列A 或者磁盘阵列B,
将从端数据反向复制到主端磁盘阵列A 和磁盘阵列B 上,调整主从关系,在生产中心
恢复业务。
3.2.5链路和灾备端故障
当生产中心与灾备中心的复制链路故障或者灾备中心存储设备故障,则远程复制自动断
开复制,不影响生产系统的正常运行。
生产中心主LUN 将记录故障期间的数据差异变
化,待故障恢复后,自动将增量数据同步到从LUN。
3.3异步+异步级联工作原理
3.3.1初始同步处理
生产中心与同城灾备中心异步复制主从LUN 之间和同城灾备中心与异地灾备中心异步
复制主从LUN 之间都需要进行初始同步,初始同步可以在线进行。
复制带宽足够的情
况下可以配置完就启动初始同步,带宽不足情况下,可以有几种初始同步方式:
1.临时增加复制带宽完成初始同步。
2.将设备搬迁到一起来完成初始同步。
3.通过移动介质存储中转进行初始同步。
异步复制初始同步系统自动创建快照,将主LUN 数据全部复制到从LUN,复制期间
新增数据不会复制到从LUN 中。
3.3.2正常状态处理
具体处理流程如下:
1.主机下发IO 到存储系统A 的LUN1。
LUN2 和LUN3 分别是LUN1 不同时间点的副本,LUN3 的数据副本比LUN2 的数
据副本时间要早。
LUN2 既是存储系统A 与存储系统B 异步远程复制的从LUN,
又是存储系统B 与存储系统C 异步远程复制的主LUN),B 站点、C 站点LUN 对
于主机默认均为只读。
2.当A-B 异步远程复制同步周期到来,存储系统A 生成LUN1 在此时间点的数据
(如t1 时间点数据)。
3.存储系统B 生成同步开始前LUN2 的多时间点数据(如t2 时间点数据)。
如果异
步远程复制同步失败,当需要使用LUN2 运行业务时,系统自动回滚多时间点数据,
以保证存储系统B 中数据的可用性。
当B-C 异步远程复制同步周期到老,存储系
统B 生成LUN2 在此时间点的数据(如t2 时间点数据)
4.后台启动由LUN1 在t1 时间点的数据到LUN2 的周期性同步。
5.存储系统C 生成同步开始前LUN3 的多时间点数据(如台t3 时间点数据)。
如果
异步复制失败,当需要使用LUN3 运行业务时,系统自动回滚多时间点数据。
6.后台启动由LUN2 在t2 时间点的数据到LUN3 的周期性同步。
异步复制处理过程如下:
1.主LUN1 的写IO 处理
2.在周期N,将新写入主LUN 的数据写入Cache 中。
3.在下一个周期N+1,将周期N 缓存的数据复制到从LUN2,同时将周期N+1 新收
到的写数据继续写入Cache 中。
数据复制完成后,进入下一周期。
4.按照步骤2)重复进行。
5.从LUN 2 的写IO 处理
6.周期N 开始时,对从LUN 进行快照activating,即对周期N-1 的数据在Cache 和
存储介质中进行快照activating。
7.在周期N 中,接收由主LUN 同步而来的数据,写入从LUN 的Cache。
8.该周期复制完成后,disable 从LUN 的快照。
9.从LUN3 的写IO 处理
10.周期N-1 开始时,对从LUN 进行activating,即对周期N-2 的数据在Cache 和存
储介质中进行快照activating
11.在周期N-1 中,接收由主LUN 同步而来的数据,写入从LUN 的Cache。
12.该周期复制完成后,Disable 从LUN 的快照。
如果主LUN 的写IO 带宽临时性增大,或者阵列间链路带宽临时减小使得复制周期变
长,导致周期内写入数据过多,超过了Cache 所能缓存的写数据量,则远程复制会采
用日志对超出部分进行记录,不会中断周期性同步。
远程复制会严格保证从LUN 的数据一致性,即写IO 的依赖关系。
在主LUN 的IO 处
理中,在每次周期间切换时,远程复制会保证将有依赖关系的两个写IO 纳入同一个周
期,或者按照其顺序分别纳入先、后周期,不会出现先写入的IO 纳入后一周期,而后
写入的IO 纳入前一周期的情况。
在从LUN 的IO 处理中,当主LUN 故障后需要访问从
LUN 时,远程复制会检查从LUN 是否完成当前周期的复制,如果没有完成,则使
用快照对从LUN 进行回滚,使其数据保证为周期切换点时的状态,保证其数据一致性。
通过Cache 中的异步复制,最高可以实现1~6s 的秒级RPO 的数据灾备要求。
3.3.3灾难切换处理
1)生产中心故障
当生产中心发生灾难后,不能再提供业务。
同城灾备中心的从LUN 保存着与主LUN
较近时间点的数据,保障尽量少的数据丢失。
如果同城灾备中心部署有备用主机,则
备用主机可以访问从LUN,接管业务,实现最短的业务恢复。
从LUN 开始被主机访问后,每次收到新写入的数据,远程复制会自动记录其地址,以
便用于后续增量恢复,缩短业务回切的时间。
2)生产中心和同城灾备中心都故障
当生产中心和同城中心在重大灾难或者都故障后,异地备中心的从LUN 保存着与主
LUN 间隔一定时间周期(复制周期)之前的数据,保障数据绝大部分不丢失。
如果异地
同城灾备中心部署有备用主机,则备用主机可以访问从LUN,接管业务。
异地灾备中心
从LUN 开始被主机访问后,每次收到新写入的数据,远程复制会自动记录其地址,以便
用于后续增量恢复,缩短业务回切的时间。
3.3.4灾难恢复处理
数据未被破坏时
当生产中心灾难恢复后,如果存储系统A 和B 没有受到破坏,主LUN 能够恢复其原有
数据,则远程复制可以将主LUN 故障期间,从LUN 1’新写入的数据增量复制到主
LUN。
复制完成后,主、从LUN 保持复制关系。
此时,可以将业务切换回生产中心,
重新由生产主机访问存储阵列A 的主LUN,远程复制重新保持由主LUN 向从LUN 实
时同步数据。
数据完全被破坏时
当存储系统A 或B 被破坏,数据不可修复时,需要重建存储系统A 或者存储系统B,
将从端数据反向复制到主端存储系统A 和存储系统B 上,调整主从关系,在生产中心
恢复业务。
3.3.5链路和灾备端故障
当生产中心与灾备中心的复制链路故障或者灾备中心设备故障,则远程复制自动断开
复制,不影响生产系统的正常运行。
生产中心主LUN 将记录故障期间的数据差异变化,
待故障恢复后,自动将增量数据同步到从LUN。
3.4异步+异步并联工作原理
3.4.1初始同步处理
生产中心与同城灾备中心异步复制主从LUN 之间和同城灾备中心与异地灾备中心异步
复制主从LUN 之间都需要进行初始同步,初始同步可以在线进行。
复制带宽足够的情
况下可以配置完就启动初始同步,带宽不足情况下,可以有几种初始同步方式:
1.临时增加复制带宽完成初始同步。
2.将设备搬迁到一起来完成初始同步。
3.通过移动介质存储中转进行初始同步。
异步复制初始同步系统自动创建快照,将主LUN 数据全部复制到从LUN,复制期间
新增数据不会复制到从LUN 中。
3.4.2正常状态处理
具体处理流程如下:
1.主机下发IO 到存储系统 A 的LUN1。
LUN2
和LUN3 分别是LUN1 不同时间点的副本,LUN3 的数据副本一般比LUN2
的数据副本时间要早(如果LUN2 是10 点的,LUN3 可能是9 点的数据)。
LUN1
既是存储系统A 与存储系统B 异步远程复制的主LUN,又是存储系统A 与存储
系统C 异步远程复制的主LUN),B 站点、C 站点LUN 对于主机默认均为只读。
2.当A-B 异步远程复制同步周期到来,存储系统A 生成LUN1 在此时间点的数据
(如t1 时间点数据)。
3.存储系统B 生成同步开始前LUN2 的多时间点数据(如t2 时间点数据)。
如果异
步远程复制同步失败,当需要使用LUN2 运行业务时,系统自动回滚多时间点数据,
以保证存储系统B 中数据的可用性。
当B-C 异步远程复制同步周期到老,存储系
统B 生成LUN2 在此时间点的数据(如t2 时间点数据)
4.后台启动由LUN1 在t1 时间点的数据到LUN2 的周期性同步。
5.当A-C 异步远程复制同步周期到来,存储系统A 生成LUN1 在此时间点的数据
(如t3 时间点数据)
6.存储系统C 生成同步开始前LUN3 的多时间点数据(如台t4 时间点数据)。
如果
异步复制失败,当需要使用LUN3 运行业务时,系统自动回滚多时间点数据。
7.后台启动由LUN1 在t3 时间点的数据到LUN3 的周期性同步。
异步复制处理过程如下:。