双活数据中心与灾备解决方案概览
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 投资巨大:设备采购成本、软件购买成本、部署成本、后续维护成本 – 系统复杂:灾备系统的有效性难于验证,可靠性得不到保障
• 解决方案
– 广东电信公司异地组建的容灾数据中心利用VMware虚拟化软件建立 各个业务虚拟机,并通过VMware Site Recovery Manager实现生产 站点与恢复站点之间的业务切换。
• 可靠地将虚拟机恢复到任何硬件 • 主站点与容灾站点可以采用非对等设计 • 标准化的虚拟硬件消除了兼容性问题
• 减少生产端和容灾端的硬件需求 • 在容灾端可以采用较高的整合比
6
关键应用的虚拟化比例逐年提高
60%
47% 41% 38%
56% 57% 58% 53%
59%
52% 47% 43%
51% 41% 34% 25%
• vSphere内置复制功能
– 免费,RPO=15分钟-24小时,文件级一致性,虚拟机级别颗粒度 – 支持异构存储,vCenter直接管理,恢复简便
• 阵列复制功能
– 由合作伙伴提供,需额外购买 – 支持同步或异步复制,应用级一致性,LUN级别颗粒度,恢复较复杂
• 应用一致性:Oracle DataGuard, SQL Always On, Exchange DAG
两地三中心
• 场景描述
– 适用于对业务连续性要求较高的应用,通过集成同城双活与异 地灾备两种解决方案,既能实现数据零丢失和故障自动切换,又 能抵御区域性灾难对业务连续性的影响。
• 方案特点
– 同城两个站点之间的高可用提供数据零丢失的第一层保护 – 异地数据中心之间的灾备功能实现第二层保护 – 同城双活与异地灾备数据中心采用统一的管理平台 – 软件定义的网络与存储可提供最大灵活性
Jan 2010 Mar 2012
Jun 2011 Jun 2013
49%
53%
35%
28% 25%
40% 28% 18%
Microsoft Exchange
Microsoft Sharepoint
Microsoft SQL Oracle Middleware
Oracle DB
SAP
基于虚拟化技术的业务连续性解决方案概览
异地灾备
两地三中心
数据中心迁移
12
同城双活数据中心解决方案——城域存储集群(vMSC)
同城双活
• 场景描述
– 站点级双活(可支持应用级双活),整合距离相对较近的两个数据中 心中的计算、存储和网络资源,实现高度灵活的负载分配,结合数 据中心内部的高可用机制,为业务连续性提供最高级别保障。
• 方案特点
控制器 同城站点B
• 需求条件
– 数据中心距离小于100公里,实际更短,具备裸光纤链路 – 通过二层IP网络连接两个数据中心,BW>250M,RTT<100ms.
• 可通过NSX虚拟网络或其它大二层网络技术实现
– 采用存储虚拟化技术提供数据同步服务(RTT<5ms)
• 存储支持FC, iSCSI, NFS等类型 • 如EMC VPLEX、NetApp MetroCluster、HP LeftHand、IBM SVC等
23
建设方法与关键任务
24
业务连续性(信息系统)建设体系架构
业务 应用 管理实践 支撑系统 系统软件 硬件 基础设施
战略规划层,对业务进行评估,划定连续性级别 对应用的逻辑关系进行梳理,确定应用的可用性指标
流程的定义,配置变更与事件管理 管理,安全,基础架构服务等配套系统 虚拟化,操作系统,网络协议,存储服务
Recovery
Production
双活数据中心
Site 1
Production Site 2
• 最常见的场景 • 花销较大
• 灾备架构主要用于测试,开 发和培训等非生产应用
• 有效降低开销
• 两个站点均有生产应用
• 每个站点为对方提供容灾 支持
• 两个站点的应用可以跨 站点自由移动
• 计划内事件零停机
• 限制在城域范围内
18
容灾方案(DR2C)解决方案
客户数据中心
天翼混合云服务
DR-VDC
VPC
DR-Appliance
vSphere
vSphere
(VMDK1) (VMDK2)
存储
VM Replication
WAN
DR-Appliance
vSphere
(VMDK1) (VMDK2)
存储
✓ 在混合云环境中提供“温备”的容灾服务; ✓ 自服务的保护计划、容灾演练、容灾切换、容灾回滚服务; ✓ 15分钟至24小时的恢复时间点(RPO); ✓ 利用Data Seed技术减少容灾初始化的时间; ✓ 容灾传输中采用加密技术; ✓ 在原有维护工具中增加插件即可管理混合云容灾。
Minutes
RTO RPO
Hours
Days
多活集群 主备集群
传统解决方案
$100,000
$10,000
VMware解决方案 vMotion, HA/FT, VDPA,
SRM, NSX, VSAN等
数据复制
$1,000
开销(每应用)
数据备份
$100百度文库
9
以虚拟化为基础,灵活、可信、经济的业务连续性保障平台
21
两地三中心解决方案——双活与灾备的完美集成
vCenter 1
Site Recovery Manager
跨数据中心集群
控制器
控制器
同城站点A
同城站点B
生产中心 仲裁站点C
应用 切换
广域 链路
异步 复制
vCenter Server
Site Recovery Manager
vSphere
服务器
灾备中心
• 需求条件
– 同城二层网络,异地三层网络; – 同城存储同步双写,异地异步复制; – 异地采用VSAN存储简化管理降低成本;
• VMware相关产品与服务
– vSphere Ent+ – vCenter Site Recovery Manager – NSX网络虚拟化 – VSAN
22
数据中心迁移的几种场景
整体搬迁 相互融合 角色互换
• 旧有数据中心停用,无缝迁移到新数据中心 • 可靠性与业务连续性是关键 • 带宽条件好的情况下可使用长距离在线漂移
• 新旧DC同时运营,资源进行整合 • 业务可根据需要在两数据中心之间调配 • 参考双活中心解决方案进行设计
• 新DC条件更好,成为主DC • 旧DC作为新DC的灾备中心使用 • 参考灾备解决方案来进行设计
双活数据中心与灾备解决方案概览
Active-Active Datacenter and Disaster Recovery Solutions
© 2014 VMware Inc. All rights reserved.
业务连续性与灾难恢复建设是重要任务
生产力
收入
声誉
合规
2
现实情况是……
我们没有为运行在 x86上的关键应用建 立业务连续性保障计 划,因为方案太复杂 而且我们经费不足。
• 多数据副本的VSAN,计算与存储融合 • 高效的数据备份与恢复(VDAP) • 基于vSphere内核的远程数据复制(vSR)
灾难恢复
• 自动高效的灾难恢复管理SRM • 城域集群
方案特点
• 与应用程序和操 作系统无关 • 与硬件设备无关 • 完善的保护 • 简单,经济
8
与传统解决方案的对比
Continuous
– 跨地域的业务连续性保护,包括应用迁移,灾难避免和灾难恢复等 – 有效保障数据一致性及服务可用性,可实现较好的RPO和RTO – 可制定灵活且详细的灾难恢复计划与演练计划 – 不影响生产的灾难恢复测试 – 自动化的演练、切换与回切 – 一对一或多对一的站点映射关系 – 成本低,部署管理简单,地域不限
IDG
3
传统业务连续性解决方案的主要问题
昂贵
复杂
软件 主机 存储 基础设施
每应用成本超过1万
应用
??
主机
? 存储 ?
?
? ? 网络
?
不可靠
每年一次DR测试
4
业务连续性解决方案的三大要点
高可用
同城
异地
灾难
恢复
数据 保护
5
虚拟化极大地简化了业务连续性解决方案
封装 硬件无关 资源整合
• 所有与系统相关的信息都存储在文件中 • 可以通过数据保护来保护整个系统
– 跨数据中心实现高可用性与负载平衡,支持各种应用 – 管理简便,成本较高 – 数据零丢失,无单一故障点,可靠性高,可最大化业务在线时间 – 距离有限,可实现城域级别的应用迁移与灾难避免/灾难恢复
13
同城双活数据中心解决方案——城域存储集群(vMSC)
vCenter
跨数据中心集群
控制器 同城站点A
成本
关键应用,核心应用
双活数据中心 RPO=0
RTO<15分钟 BC,DA,DR
2层网络, RTT<5ms 存储虚拟化-同步双写
低
高
二三级应用
虚拟机复制 灾备切换调度 RPO<15分钟 RTO<4小时
DA,DR
2/3层网络 任意距离. 任意存储设备
中
中
非生产应用
虚拟机复制 数据保护 RPO<1小时 RTO<24小时 DA,DR(手工) 2/3层网络 任意距离. 任意存储设备
我们缺少足够的资源 来进行灾难恢复测 试,也担心演练过程 对生产环境造成影
响。
在最近一次灾难恢复 测试过程中我们比原 计划多用了几天时
间。
发生重大灾难后,如果不能在 24小时之内恢复数据访问,
40%的公司将走向破产。
Gartner Gartner
调查问卷显示,只有31%的
CIO认为他们的业务连续性计 划是行之有效的。
• VMware相关产品与服务
– vSphere Ent+
– vCenter Site Recovery Manager – NSX网络虚拟化
– VSAN
17
异地(同城)灾备解决方案——多种映射关系
主备式切换
Production
双活切换
Production
双向切换
Production
Recovery
16
异地(同城)灾备解决方案
生产站点
vCenter Server
Site Recovery Manager
vSphere
vSphere 复制
服务器
阵列 复制
灾备站点
vCenter Server
Site Recovery Manager
vSphere
服务器
• 需求条件
– 通过二层或三层IP网络连接两个数据中心 – 采用基于vSphere或阵列的复制技术
高
低
27
专业服务团队产品包(VVDR)
服务项 业务连续性 咨询服务
应用连续性 咨询设计服务
容灾实施服务
灾难恢复服务
服务内容
解决的问题
▪ 业务连续评估, 包括风险分析,业务 ▪ 不能全面了解所面临的风险 影响分析(BIA),业务连续性计划(BCP) ▪ 需要对众多的业务根据重要性进行分类
– 第三站点提供仲裁服务
• VMware相关产品与服务
– vSphere Ent+ – NSX网络虚拟化
仲裁站点C
14
异地(同城)灾备解决方案
异地灾备
• 场景描述
– 在不限距离的两个数据中心之间构建备份关系,可抵御较大范围的 灾难性事件对业务的影响。通常部署在处于不同城市的两个数据中 心之间。
• 方案特点
– 硬件:HP 580服务器,HP EVA磁盘阵列
• 主要收益
– 实现了业务异地在线容灾备份,确保 在各种灾难损害发生后,依然能够最 大限度地保障提供正常应用服务。
– 方便地实现异地虚拟机备份与容灾, 在需要异地接管应用的时候,可实现 “一键式”应用接管。
20
两地三中心解决方案——双活与灾备的完美集成
19
成功案例:广东电信应用异地接管
• 背景资料
– 电信级应用异地接管业务”是广东电信公司“商务领航”提供的一项 增值服务,该服务旨在为客户业务提供在广州与深圳两地IDC之间的 实时异地备份,可以快速地异地接管,以确保客户关键业务应用的正 常运行。
– 生产系统、电信IDC客户托管在电信机房内的业务
• 主要挑战
服务 多种 应 用 支持 多种 关 系
适用 多种 场 景
提供 多种 手 段
关键应用 双活
单中心 高可用
数据库
二三级应用
互备
主备
同城双中心
异地双中心
容错
迁移
存储迁移
开发/测试
教学/科研
多对一
备份到云
两地三中心
分支到中心
备份
复制
快照
10
应用场景与解决方案
11
业务连续性解决方案的几种主要应用场景
同城双活
服务器,存储设备,网络设备与链路 建筑,环境,供电……
25
确定业务的可用性需求
丢失数据成本
数据可用性成本
系统可用性成本
成本轴
一级应用
宕机成本
二级应用 三级应用
RPO
损失的数据量
0
时间轴
RTO
恢复业务所需时间
26
基于业务的需求选择合适的解决方案
类别
解决方案 SLA
应用场景 需求条件 管理工作量
本地站点
vSphere
资源池
vSphere
vSphere
灾备站点
Dev / Test
Dev / Test
Dev / Test
资源池
vSphere
vSphere
本地高可用
• 应用感知的高可用性(HA) • 关键应用零停机保护(FT) • 在线迁移虚拟机,动态调配资源(vMotion)
• VMotion an数d S据to保ra护ge VMotion
• 解决方案
– 广东电信公司异地组建的容灾数据中心利用VMware虚拟化软件建立 各个业务虚拟机,并通过VMware Site Recovery Manager实现生产 站点与恢复站点之间的业务切换。
• 可靠地将虚拟机恢复到任何硬件 • 主站点与容灾站点可以采用非对等设计 • 标准化的虚拟硬件消除了兼容性问题
• 减少生产端和容灾端的硬件需求 • 在容灾端可以采用较高的整合比
6
关键应用的虚拟化比例逐年提高
60%
47% 41% 38%
56% 57% 58% 53%
59%
52% 47% 43%
51% 41% 34% 25%
• vSphere内置复制功能
– 免费,RPO=15分钟-24小时,文件级一致性,虚拟机级别颗粒度 – 支持异构存储,vCenter直接管理,恢复简便
• 阵列复制功能
– 由合作伙伴提供,需额外购买 – 支持同步或异步复制,应用级一致性,LUN级别颗粒度,恢复较复杂
• 应用一致性:Oracle DataGuard, SQL Always On, Exchange DAG
两地三中心
• 场景描述
– 适用于对业务连续性要求较高的应用,通过集成同城双活与异 地灾备两种解决方案,既能实现数据零丢失和故障自动切换,又 能抵御区域性灾难对业务连续性的影响。
• 方案特点
– 同城两个站点之间的高可用提供数据零丢失的第一层保护 – 异地数据中心之间的灾备功能实现第二层保护 – 同城双活与异地灾备数据中心采用统一的管理平台 – 软件定义的网络与存储可提供最大灵活性
Jan 2010 Mar 2012
Jun 2011 Jun 2013
49%
53%
35%
28% 25%
40% 28% 18%
Microsoft Exchange
Microsoft Sharepoint
Microsoft SQL Oracle Middleware
Oracle DB
SAP
基于虚拟化技术的业务连续性解决方案概览
异地灾备
两地三中心
数据中心迁移
12
同城双活数据中心解决方案——城域存储集群(vMSC)
同城双活
• 场景描述
– 站点级双活(可支持应用级双活),整合距离相对较近的两个数据中 心中的计算、存储和网络资源,实现高度灵活的负载分配,结合数 据中心内部的高可用机制,为业务连续性提供最高级别保障。
• 方案特点
控制器 同城站点B
• 需求条件
– 数据中心距离小于100公里,实际更短,具备裸光纤链路 – 通过二层IP网络连接两个数据中心,BW>250M,RTT<100ms.
• 可通过NSX虚拟网络或其它大二层网络技术实现
– 采用存储虚拟化技术提供数据同步服务(RTT<5ms)
• 存储支持FC, iSCSI, NFS等类型 • 如EMC VPLEX、NetApp MetroCluster、HP LeftHand、IBM SVC等
23
建设方法与关键任务
24
业务连续性(信息系统)建设体系架构
业务 应用 管理实践 支撑系统 系统软件 硬件 基础设施
战略规划层,对业务进行评估,划定连续性级别 对应用的逻辑关系进行梳理,确定应用的可用性指标
流程的定义,配置变更与事件管理 管理,安全,基础架构服务等配套系统 虚拟化,操作系统,网络协议,存储服务
Recovery
Production
双活数据中心
Site 1
Production Site 2
• 最常见的场景 • 花销较大
• 灾备架构主要用于测试,开 发和培训等非生产应用
• 有效降低开销
• 两个站点均有生产应用
• 每个站点为对方提供容灾 支持
• 两个站点的应用可以跨 站点自由移动
• 计划内事件零停机
• 限制在城域范围内
18
容灾方案(DR2C)解决方案
客户数据中心
天翼混合云服务
DR-VDC
VPC
DR-Appliance
vSphere
vSphere
(VMDK1) (VMDK2)
存储
VM Replication
WAN
DR-Appliance
vSphere
(VMDK1) (VMDK2)
存储
✓ 在混合云环境中提供“温备”的容灾服务; ✓ 自服务的保护计划、容灾演练、容灾切换、容灾回滚服务; ✓ 15分钟至24小时的恢复时间点(RPO); ✓ 利用Data Seed技术减少容灾初始化的时间; ✓ 容灾传输中采用加密技术; ✓ 在原有维护工具中增加插件即可管理混合云容灾。
Minutes
RTO RPO
Hours
Days
多活集群 主备集群
传统解决方案
$100,000
$10,000
VMware解决方案 vMotion, HA/FT, VDPA,
SRM, NSX, VSAN等
数据复制
$1,000
开销(每应用)
数据备份
$100百度文库
9
以虚拟化为基础,灵活、可信、经济的业务连续性保障平台
21
两地三中心解决方案——双活与灾备的完美集成
vCenter 1
Site Recovery Manager
跨数据中心集群
控制器
控制器
同城站点A
同城站点B
生产中心 仲裁站点C
应用 切换
广域 链路
异步 复制
vCenter Server
Site Recovery Manager
vSphere
服务器
灾备中心
• 需求条件
– 同城二层网络,异地三层网络; – 同城存储同步双写,异地异步复制; – 异地采用VSAN存储简化管理降低成本;
• VMware相关产品与服务
– vSphere Ent+ – vCenter Site Recovery Manager – NSX网络虚拟化 – VSAN
22
数据中心迁移的几种场景
整体搬迁 相互融合 角色互换
• 旧有数据中心停用,无缝迁移到新数据中心 • 可靠性与业务连续性是关键 • 带宽条件好的情况下可使用长距离在线漂移
• 新旧DC同时运营,资源进行整合 • 业务可根据需要在两数据中心之间调配 • 参考双活中心解决方案进行设计
• 新DC条件更好,成为主DC • 旧DC作为新DC的灾备中心使用 • 参考灾备解决方案来进行设计
双活数据中心与灾备解决方案概览
Active-Active Datacenter and Disaster Recovery Solutions
© 2014 VMware Inc. All rights reserved.
业务连续性与灾难恢复建设是重要任务
生产力
收入
声誉
合规
2
现实情况是……
我们没有为运行在 x86上的关键应用建 立业务连续性保障计 划,因为方案太复杂 而且我们经费不足。
• 多数据副本的VSAN,计算与存储融合 • 高效的数据备份与恢复(VDAP) • 基于vSphere内核的远程数据复制(vSR)
灾难恢复
• 自动高效的灾难恢复管理SRM • 城域集群
方案特点
• 与应用程序和操 作系统无关 • 与硬件设备无关 • 完善的保护 • 简单,经济
8
与传统解决方案的对比
Continuous
– 跨地域的业务连续性保护,包括应用迁移,灾难避免和灾难恢复等 – 有效保障数据一致性及服务可用性,可实现较好的RPO和RTO – 可制定灵活且详细的灾难恢复计划与演练计划 – 不影响生产的灾难恢复测试 – 自动化的演练、切换与回切 – 一对一或多对一的站点映射关系 – 成本低,部署管理简单,地域不限
IDG
3
传统业务连续性解决方案的主要问题
昂贵
复杂
软件 主机 存储 基础设施
每应用成本超过1万
应用
??
主机
? 存储 ?
?
? ? 网络
?
不可靠
每年一次DR测试
4
业务连续性解决方案的三大要点
高可用
同城
异地
灾难
恢复
数据 保护
5
虚拟化极大地简化了业务连续性解决方案
封装 硬件无关 资源整合
• 所有与系统相关的信息都存储在文件中 • 可以通过数据保护来保护整个系统
– 跨数据中心实现高可用性与负载平衡,支持各种应用 – 管理简便,成本较高 – 数据零丢失,无单一故障点,可靠性高,可最大化业务在线时间 – 距离有限,可实现城域级别的应用迁移与灾难避免/灾难恢复
13
同城双活数据中心解决方案——城域存储集群(vMSC)
vCenter
跨数据中心集群
控制器 同城站点A
成本
关键应用,核心应用
双活数据中心 RPO=0
RTO<15分钟 BC,DA,DR
2层网络, RTT<5ms 存储虚拟化-同步双写
低
高
二三级应用
虚拟机复制 灾备切换调度 RPO<15分钟 RTO<4小时
DA,DR
2/3层网络 任意距离. 任意存储设备
中
中
非生产应用
虚拟机复制 数据保护 RPO<1小时 RTO<24小时 DA,DR(手工) 2/3层网络 任意距离. 任意存储设备
我们缺少足够的资源 来进行灾难恢复测 试,也担心演练过程 对生产环境造成影
响。
在最近一次灾难恢复 测试过程中我们比原 计划多用了几天时
间。
发生重大灾难后,如果不能在 24小时之内恢复数据访问,
40%的公司将走向破产。
Gartner Gartner
调查问卷显示,只有31%的
CIO认为他们的业务连续性计 划是行之有效的。
• VMware相关产品与服务
– vSphere Ent+
– vCenter Site Recovery Manager – NSX网络虚拟化
– VSAN
17
异地(同城)灾备解决方案——多种映射关系
主备式切换
Production
双活切换
Production
双向切换
Production
Recovery
16
异地(同城)灾备解决方案
生产站点
vCenter Server
Site Recovery Manager
vSphere
vSphere 复制
服务器
阵列 复制
灾备站点
vCenter Server
Site Recovery Manager
vSphere
服务器
• 需求条件
– 通过二层或三层IP网络连接两个数据中心 – 采用基于vSphere或阵列的复制技术
高
低
27
专业服务团队产品包(VVDR)
服务项 业务连续性 咨询服务
应用连续性 咨询设计服务
容灾实施服务
灾难恢复服务
服务内容
解决的问题
▪ 业务连续评估, 包括风险分析,业务 ▪ 不能全面了解所面临的风险 影响分析(BIA),业务连续性计划(BCP) ▪ 需要对众多的业务根据重要性进行分类
– 第三站点提供仲裁服务
• VMware相关产品与服务
– vSphere Ent+ – NSX网络虚拟化
仲裁站点C
14
异地(同城)灾备解决方案
异地灾备
• 场景描述
– 在不限距离的两个数据中心之间构建备份关系,可抵御较大范围的 灾难性事件对业务的影响。通常部署在处于不同城市的两个数据中 心之间。
• 方案特点
– 硬件:HP 580服务器,HP EVA磁盘阵列
• 主要收益
– 实现了业务异地在线容灾备份,确保 在各种灾难损害发生后,依然能够最 大限度地保障提供正常应用服务。
– 方便地实现异地虚拟机备份与容灾, 在需要异地接管应用的时候,可实现 “一键式”应用接管。
20
两地三中心解决方案——双活与灾备的完美集成
19
成功案例:广东电信应用异地接管
• 背景资料
– 电信级应用异地接管业务”是广东电信公司“商务领航”提供的一项 增值服务,该服务旨在为客户业务提供在广州与深圳两地IDC之间的 实时异地备份,可以快速地异地接管,以确保客户关键业务应用的正 常运行。
– 生产系统、电信IDC客户托管在电信机房内的业务
• 主要挑战
服务 多种 应 用 支持 多种 关 系
适用 多种 场 景
提供 多种 手 段
关键应用 双活
单中心 高可用
数据库
二三级应用
互备
主备
同城双中心
异地双中心
容错
迁移
存储迁移
开发/测试
教学/科研
多对一
备份到云
两地三中心
分支到中心
备份
复制
快照
10
应用场景与解决方案
11
业务连续性解决方案的几种主要应用场景
同城双活
服务器,存储设备,网络设备与链路 建筑,环境,供电……
25
确定业务的可用性需求
丢失数据成本
数据可用性成本
系统可用性成本
成本轴
一级应用
宕机成本
二级应用 三级应用
RPO
损失的数据量
0
时间轴
RTO
恢复业务所需时间
26
基于业务的需求选择合适的解决方案
类别
解决方案 SLA
应用场景 需求条件 管理工作量
本地站点
vSphere
资源池
vSphere
vSphere
灾备站点
Dev / Test
Dev / Test
Dev / Test
资源池
vSphere
vSphere
本地高可用
• 应用感知的高可用性(HA) • 关键应用零停机保护(FT) • 在线迁移虚拟机,动态调配资源(vMotion)
• VMotion an数d S据to保ra护ge VMotion