双活数据中心与灾备解决方案概览
弱电安防--双活数据中心与灾备解决方案
双活数据中心与灾备解决方案多数据中心的建设需要投入大量资金,其项目周很长,涉及的范围也比较大。
从技术上来说,要实现真正意义上的双活,就要求网络、应用、数据库和存储都要双活。
就现阶段来看,大多数客户的多数据中心建设还达不到完全的双活要求,主流的建设目标是实现应用双活。
目前客户建设多数据中心的模型可以归纳为以下几种:1.单纯的数据容灾:正常情况下只有主数据中心投入运行,备数据中心处于待命状态。
发生灾难时,灾备数据中心可以短时间内恢复业务并投入运行,减轻灾难带来的损失。
这种模式只能解决业务连续性的需求,但用户无法就近快速接入。
灾备中心建设的投资巨大且运维成本高昂,正常情况下灾备中心不对外服务,资源利用率偏低,造成了巨大的浪费。
数据容灾2.构建业务连续性:两个数据中心(同城/异地)的应用都处于活动状态,都有业务对外提供服务且互为备份。
但出于技术成熟度、成本等因素考虑,数据库采用主备方式部署,数据库读写操作都在主中心进行,灾备中心进行数据同步。
发生灾难时,数据中心间的数据库可以快速切换,避免业务中断。
双活数据中心可充分盘活企业闲置资源,保证业务的连续性,帮助用户接入最优节点,提高用户访问体验。
构建业务连续性3.提升业务服务能力:多个数据中心同时对外提供服务且互为备份,各中心的数据库可同时处理应用的读写请求,网络、存储、应用和数据库全部实现多活。
各数据中心独立运营,用户流量可被智能调度,形成灵活、弹性和可扩展的面向服务的业务架构。
提升业务服务能力数据中心业务连续性解决方案的几种主要应用场景同城双活:站点级双活(可支持应用级双活),整合距离相对较近的两个数据中心中的计算、存储和网络资源,实现高度灵活的负载分配,结合数据中心内部的高可用机制,为业务连续性提供最高级别保障。
特点:1、跨数据中心实现高可用性与负载平衡,支持各种应用2、管理简便,成本较高3、数据零丢失,无单一故障点,可靠性高,可最大化业务在线时间4、距离有限,可实现城域级别的应用迁移与灾难避免/灾难恢复异地灾备在不限距离的两个数据中心之间构建备份关系,可抵御较大范围的灾难性事件对业务的影响。
医院灾备建设-双活数据中心解决方案.doc
医院灾备建设-双活数据中心解决方案 XX 医院灾备建设灾备技术建议书2016 年 1 月 5 日1 项目概述................................................................... ......................................................................5 1.1 项目背景................................................................... ........................................................... 5 1.2 系统现状描述................................................................... ...................................................5 1.2.1 应用系统现状................................................................... ........................................5 1.2.2 IT 系统现状................................................................... .............................................6 1.3 需求分析................................................................... ...........................................................7 1.3.1 行业发展要求................................................................... ........................................8 1.3.2 灾备建设需求................................................................... ........................................9 2 系统总体设计原则................................................................... .................................................... 11 3 容灾建设方案................................................................... ............................................................ 13 3.1 业务系统特征及灾备需求................................................................... ............................ 13 3.1.1 HIS 门诊类................................................................... ............................................ 13 3.1.2 HIS 住院类................................................................... ............................................ 13 3.1.3 EMR 电子病历系统................................................................... .............................. 14 3.1.4 PACS 影像系统................................................................... ......................................14 3.1.5 LIS 实验室检验系统................................................................... ............................. 15 3.1.6 医院各类经营管理系统................................................................... ..................... 15 3.1.7 业务需求分析汇总................................................................... ............................. 16 3.2 总体架构设计................................................................... .................................................17 3.3 应用双活架构设.........................................18 4 关键技术................................................................... ....................................................................20 4.1 存储层解决方案................................................................... .............................................20 4.1.1 VIS 虚拟化技术................................................................... .... 错误!未定义书签。
双活数据中心及灾备解决方案技术部分
NSX利用层叠网络实现双活数据中心
站点A
三层 网络
站点A 边界网关
上联网络A
VM1
VM 2
vCenter Server
分布式逻辑路由器
逻辑交换机A 172.16.10.0/24
VM
4
逻辑交换机B
172.16.20.0/24
数据存储1
which also aligns with vMotion using Enterprise Plus
• vMSC enables disaster avoidance and basic Disaster Recovery (without the orchestration or testing
• VMotion an数d S据to保ra护ge VMotion
• 高效的数据备份与恢复 • 可通过运行计划与脚本实现自动化操作
灾难恢复
• 基于虚拟化层的异步复制 • 基于硬件设备的同异步复制 • 自动化应用切换管理 • 城域集群
方案特点
• 与应用程序和操 作系统无关 • 与硬件设备无关 • 完善的保护 • 简单,经济
9
Fault Tolerance vs. High Availability
• Fault tolerance
– Ability to recover from component loss – Example: Hard drive failure
• High avail percentage in one year 99 99.9 99.99 99.999 “five nines”
Downtime in one year 3.65 days 8.76 hours 52 minutes 5 minutes
双活灾备方案
双活灾备方案方案一双活灾备方案在当今数字化高速发展的时代,数据和业务的连续性成为了企业生存和发展的关键。
时不时出现的自然灾害、硬件故障、人为失误等,都可能给企业带来致命的打击。
这就是我们制定双活灾备方案的背景,目的很简单,就是要确保在各种“幺蛾子”出现时,企业能够稳如泰山,业务不中断,数据不丢失。
其意义嘛,那可大了去了,不仅能保护企业的“钱袋子”,还能保住企业的声誉和客户的信任,不然一旦出问题,那可真是“凉凉”了。
咱们先定个小目标,方案实施后,在遇到灾难事件时,业务恢复时间要控制在 30 分钟以内,数据丢失量不超过 10 分钟的数据,系统可用性要达到 99.99%以上。
来看看现状,内部情况是咱们的业务系统越来越复杂,数据量也与日俱增,现有的备份手段有点跟不上节奏啦。
外部呢,竞争对手们都在加强灾备能力,市场对企业的服务连续性要求越来越高,客户可不会容忍咱们动不动就“掉链子”。
具体方案内容如下:首先,搭建双活数据中心,实现数据实时同步。
这就像是给数据找了两个“家”,一个“家”出问题,另一个“家”立马顶上。
然后,优化网络架构,确保数据传输的高效稳定,别让数据在“路上”堵着。
还有,建立完善的监控和预警系统,让咱们能提前发现问题,别等出了事才傻眼。
风险评估与应对这一块,可能会出现网络延迟导致数据同步不及时,那咱就多弄几条备用网络线路呗。
要是数据中心出现故障,得有快速切换的应急预案,平时多演练,关键时刻才不慌。
效果评估方面,用业务恢复时间、数据丢失量、系统可用性这些指标来衡量。
每季度进行一次评估,通过模拟灾难事件来测试方案的有效性。
怎么样,这方案是不是还挺靠谱?方案二双活灾备方案哎呀,如今这世界变化快,各种意外情况防不胜防。
要是企业因为没做好灾备,一下子业务中断、数据丢失,那可真是哭都没地方哭去。
所以咱得搞个双活灾备方案,这就是背景啦。
目的就是让企业在灾难面前也能昂首挺胸,继续赚钱,意义嘛,那就是给企业穿上一层“金钟罩铁布衫”,让它不怕风吹雨打。
双活数据中心项目解决方案
灾难恢复计划
制定应对灾难事件的策略和流程,确保业务连续性。
数据同步机制
数据实时同步
通过数据同步引擎,实现 主备数据中心数据实时同 步。
数据校验
定期对数据进行校验,确 保数据一致性和完整性。
数据备份
定期备份数据,以应对意 外数据丢失或损坏的情况 。
03
实施步骤与计划
双活数据中心项目解决方案
汇报人: 202X-01-08
目录
• 项目背景介绍 • 双活数据中心架构设计 • 实施步骤与计划 • 效益分析 • 技术风险与应对措施 • 项目成功要素与建议
01
项目背景介绍
业务需求
实现跨地域的数据同步和备份
01
双活数据中心能够满足业务在多个地域的需求,保证数据实时
同步,避免单点故障。
1 2 3
数据同步延迟
双活数据中心要求数据实时同步,但网络延迟、 系统负载等因素可能导致数据同步出现延迟,影 响业务连续性。
数据冲突
在双活数据中心中,由于数据实时同步,可能导 致数据冲突,如两个数据中心同时更新同一数据 项。
数据完整性问题
数据传输过程中可能出现数据丢失、损坏等情况 ,影响数据完整性。
网络稳定性挑战
网络设备故障
双活数据中心依赖于高可靠性的网络设备,任何设备的故障都可能 导致数据传输中断。
网络带宽限制
双活数据中心需要大量数据传输,如果网络带宽不足,可能影响数 据同步速度和业务连续性。
网络延迟与抖动
网络延迟和抖动可能导致数据同步延迟和业务性能下降。
高可用性保障
负载均衡
通过负载均衡技术,将 业务流量分散到两个数 据中心,确保任一数据 中心故障时,业务仍能 正常运行。
双活数据中心与灾备项目解决方案概览共34页文档
谢谢!
36、自己的鞋子,自己知道紧在哪里。——西班牙
37、我们唯一不会改正的缺点是软弱。——拉罗什福科
xiexie! 38、我这个人走得很慢,但是我从不后退。——亚伯拉罕·林肯
39、勿问成功的秘诀为何,且尽全力做你应该做的事吧。——美华纳
双活数据中心与灾备项目解 决方案概览
31、别人笑我太疯癫,我笑他人看不 穿。(名 言网) 32、我不想听失意者的哭泣,抱怨者 的牢骚 ,这是 羊群中 的瘟疫 ,我不 能被它 传染。 我要尽 量避免 绝望, 辛勤耕 耘,忍 受苦楚 。我一 试再试 ,争取 每天的 成功, 避免以 失败收 常在别 人停滞 不前时 ,我继 续拼搏 。
33、如果惧怕前面跌宕的山岩,生命 就永远 只能是 死水一 潭。 34、当你眼泪忍不住要流出来的时候 ,睁大 眼睛, 千万别 眨眼!你会看到 世界由 清晰变 模糊的 全过程 ,心会 在你泪 水落下 的那一 刻变得 清澈明 晰。盐 。注定 要融化 的,也 许是用 眼泪的 方式。
35、不要以为自己成功一次就可以了 ,也不 要以为 过去的 光荣可 以被永 远肯定 。
双活数据中心与灾备解决方案概览
Recovery
Production
最常见的场景花销较大
灾备架构主要用于测试,开发和培训等非生产应用有效降低开销
两个站点均有生产应用每个站点为对方提供容灾支持
两个站点的应用可以跨站点自由移动计划内事件零停机限制在城域范围内
Site 1
Site 2
Production
容灾方案(DR2C)解决方案
在混合云环境中提供“温备”的容灾服务;自服务的保护计划、容灾演练、容灾切换、容灾回滚服务;15分钟至24小时的恢复时间点(RPO);利用Data Seed技术减少容灾初始化的时间;容灾传输中采用加密技术;在原有维护工具中增加插件即可管理混合云容灾。
双活数据中心与灾备解决方案概览
业务连续性与灾难恢复建设是重要任务
现实情况是……
我们没有为运行在x86上的关键应用建立业务连续性保障计划,因为方案太复杂而且我们经费不足。
我们缺少足够的资源来进行灾难恢复测试,也担心演练过程对生产环境造成影响。
在最近一次灾难恢复测试过程中我们比原计划多用了几天时间。
业务连续性保障平台建设工作内容
需求
设计
实施
演练
总结:VMware提供全面业务连续性保护的基础架构平台
一个平台:采用标准技术,统一资源调度,统一管理
高可用
容错
迁移
存储迁移
备份
复制
快照
关键应用
二三级应用
开发/测试
数据库
教学/科研
同城双活
异地灾备
两地三中心
数据中心迁移
感谢聆听!
Target: Build a Flexible, Trusted, and economic BC/DR Solution
两地三中心-“同城双活+异地灾备”
两地三中心灾难恢复解决方案∙需求及挑战数据中心作为承载业务的重要IT基础设施,承担着稳定运行和业务创新的重任。
在新的经济形势下,数据中心需要更高效地支持业务和信息共享需求,提供不间断的服务,这对数据中心的资源整合、全面安全、高效管理和业务连续性提出更高的要求。
∙方案内容“同城灾备+异地灾备”的两地三中心整体灾难恢复解决方案,可以满足不同灾难场景下的业务连续性要求。
同城灾备中心主要是用于防范生产中心机房或楼宇发生的灾难,异地灾备中心用于防范大规模区域性灾难。
同城灾备中心由于其与生产中心处于同一个城市,可采用较好的网络线路如光纤与生产中心进行连接,因此数据复制和应用切换比较容易实现,可实现生产与灾备中心之间数据的实时复制和应用的快速切换。
异地灾备中心由于其与生产中心不在同一城市,灾备端与生产端连接的网络线路带宽和质量存在一定的限制,一般适合于数据的异步复制,应用系统的切换也需要一定的时间,因此异地灾备中心可以实现在业务限定的时间内进行恢复和可容忍丢失范围内的数据恢复。
“同城灾备+异地灾备”的两地三中心解决方案包含了灾备咨询、实施建设、演练、运营的服务内容。
具体服务内容包括:1. 业务连续性咨询2. 灾备系统建设服务3. 灾备系统运营管理服务4. 业务连续性维护服务5. 灾难宣告及灾难恢复服务∙方案优势• 多中心一站式的整体解决方案• 将国际业务连续管理的最佳理论结合国内的成功实践• 成熟的服务体系和规范• 丰富的灾难恢复经验• 高可用性的基础设施• 众多成功案例∙客户收益• 实现数据的双重保护,确保数据完整性、一致性• 确保生产中心发生各种突发事件及灾难场景下的数据一致性和业务的连续性• 有效提高客户信息系统的风险抵御能力• 最大限度地避免或减少灾难事件和重大事故造成的损失。
双活数据中心解决方案
双活数据中心解决方案1. 引言1. 背景介绍:随着企业对高可用性和容灾能力的需求增加,双活数据中心成为了一种常见的解决方案。
2. 目标:本文档旨在提供一个详尽而全面的双活数据中心解决方案范本,以供参考使用。
2. 双活架构设计1. 架构概述:描述整体架构及其组件之间的关系。
a) 主要组件:- 数据库服务器(DB Server)- 应用程序服务器(App Server)- 网络设备(Switches、Routers等)3. 高可用性策略1)硬件层面:a) 冗余配置: 描述如何通过多个实例或节点来确保系统不会因单点故障而停止运行。
b) 快速切换机制: 解释当主节点发生故障时如何快速将工作负载转移到备份节点上。
4. 容灾恢复策略- 备份与还原策略:a)数据库备份频率;b)应急情形下进行数据库恢复所需要时间估计;- 整体系统迁移方式:a)完全关闭服务后再启动;b)逐步迁移服务。
5. 数据同步机制1) 同城双活:描述在两个数据中心之间如何实现数据的实时或准实时同步。
a) 基于数据库复制技术(例如MySQL主从复制)b) 使用消息队列系统进行异地多活6. 网络架构设计- 双线路接入:a)不同运营商提供的网络连接;b)使用BGP协议来确保流量分发和故障切换;- 负载均衡策略:a)基于硬件设备、软件负载均衡器等方式,将请求平均分配到各个节点上。
7. 安全性考虑1) 防火墙配置: 描述如何设置防火墙以保护整体系统免受恶意攻击。
2) 访问控制列表 (ACL): 解释如何限定对关键组件的访问权限。
8. 监控与报警机制- 实施监测方案;a ) 对服务器资源利用率进行监视,并及时采取行动解决问题;b ) 设置合理告警规则, 并建立相应响应计划.9.附件:本文档涉及以下附件,请参见相关文件。
10.法律名词及注释:- 双活数据中心:指同时运行两个完全独立的数据中心,以实现高可用性和容灾能力。
- 高可用性:系统或服务在面对故障时仍然可以提供连续不断的功能和服务。
思科两地三中心 双活解决方案
思科两地三中心双活解决方案一、方案背景与用户需求1.1 方案背景随着企业的商业活动越来越依赖于网络,因此越来越多的企业在寻找一种强大的数据中心架构,这种高可用的结构能够减少甚至消除正常和非正常的停机对业务可用性造成的影响。
这意味着无论是否有中断,关键任务应用系统都能够不间断地创造产值并提高公司的业务持续性底线。
因此建立多个数据中心来实现业务的容灾成为必然的选择。
而用户建立多个数据中心来承载业务系统的主要目的是为了实现应用的高可用性,因此根据数据中心之间的关系,我们通常将数据中心分为以下三个类型:●主数据中心/灾备数据中心,●双运营数据中心●双活数据中心1.2 用户方案需求分析用户建立多个数据中心来承载业务系统的主要目的是为了实现应用的高可用性,因此根据数据中心之间的关系,我们通常将数据中心分为以下三个类型:●主数据中心/灾备数据中心,●双运营数据中心●双活数据中心主数据中心/灾备数据中心:在这种工作模式下,用户所有的业务系统在主数据中心中运行,而灾备数据中心为业务系统提供冷备或热备。
当主数据中心的应用出现故障时,可以将单个应用或者数据中心整体切换到灾备数据中心。
双运营数据中心在这种工作模式下,用的一部分应用在第一个数据中心运行,另一部分应用在第二个数据中心运行,同时两个数据中心实现应用的互备,当某个应用出现故障时,由对应的备份数据中心应用接管服务。
双活数据中心在这种工作模式下,用户所有的业务系统同时在两个数据中心运行,同时为用户提供服务,当某个数据中心的应用系统出现问题时,有另一个数据中心的应用来持续的提供服务。
双活数据中心最大的特点是:一、充分利用资源,避免了一个数据中心常年处于闲置状态而造成浪费。
通过资源整合,双活数据中心的服务能力是双倍的。
二、双活数据中心如果断了一个数据中心,另外一个数据中心还在运行,对用户来说是不可感知的。
二、双活数据中心解决方案2.1 双活数据中心路径优化路径优化技术:如何引导用户去最适合的数据中心访问应用。
双活数据中心解决方案
要点一
要点二
监控与告警系统
集成Prometheus等监控工具,实时监控系统的各项性能指标,并结合告警机制,及时发现并处理潜在问题。
日志分析与故障排查
通过ELK等日志分析工具,对系统日志进行集中收集、分析和可视化展示,帮助运维人员快速定位并解决故障。同时,结合根因分析等高级功能,深入挖掘故障产生的根本原因,避免类似问题再次发生。
对网络、存储、服务器等关键组件进行冗余设计,避免单点故障。
冗余设计
故障检测与切换
数据一致性保障
灾难恢复计划
实时监控关键组件的状态,一旦发现故障,立即启动切换机制,将业务流量切换到备用数据中心。
在故障切换过程中,确保数据的一致性,避免数据丢失或损坏。
制定完善的灾难恢复计划,确保在极端情况下,双活数据中心能够快速恢复业务。
要点三
05
CHAPTER
安全性保障措施完善
1
2
3
采用生物识别、门禁系统等技术手段,严格控制数据中心物理访问权限。
数据中心物理访问控制
部署全方位的视频监控和报警系统,实时监测数据中心内的安全状况。
视频监控与报警系统
按照国家标准和行业规范,配置相应的防雷击、防火、防水等设施,确保数据中心物理环境安全。
设定定期性能评估周期
如每周、每月或每季度进行一次性能评估,根据评估结果对数据中心进行优化和调整。
制定性能评估标准
明确性能评估的指标和标准,如系统响应时间、吞吐量、资源利用率等。
编写性能评估报告
对评估结果进行整理和分析,形成性能评估报告,提出优化建议和改进措施。
NSX-T-Multisite灾备与双活数据中心解决方案
Compute can be extended between Sites ANDPrimary Site Active for North/South "Blue" Apps
S SLB Server Pool
NSX-TManager Cluster
蓝色系统网络和网段上的VM,以DC1为主, DC2为备
故障分析
22
1. 出口线路sw(图中未画出),L3router,SLB,FW单机故障或相关link fault,会导致路由,STP 重收敛(速度很快1s以下)硬件设备的主备切换,一般3秒即可完成。SLB和FW等session都有保持, 前端用户无任何感知双机均故障的情况B/S应用(no N+M):出口L3router全故障,DC2 gslb会判断DC1的slb的VS全部失效,更改dns条 目,新连接会到DC2的VIP处理;老的连接(dns cache)会timeout ,重连,内网用户会60秒或几 分钟中断;SLB双故障,同样C/S应用和B/S(在SLB N+M模式,或者是SLB RHI模式):实际就是一个动态路由切换过程。当双L3或双SLB故障,DC1的路由全消失,DC2的SLB的high cost RHI for VIPs会生效,相关的 subnet网段的high cost routes也会生效,结果就是用户的流量会吸到DC2去。(详请看NOTE)
NSX-T Multisite灾备与双活数据中心
解决方案
" 建设双数据中心的方法
5
双活中心的物理架构模型物理架构的搭建是第一步
内网用户端
仲裁点的选择
数据中心一
数据中心二
FW
6
双活项目需要考虑的方面
应用双活方案,非常庞大, 层次很多。这里仅简单地从 infrastructure这个层面来 讨论主要分为: 网络层应用层(计算,VM等),负 载均衡数据库层, 每家DB都有相应 方案和要求存储(data)层: RAID,磁 盘同步等方案
双活数据中心解决方案
双活数据中心解决方案双活数据中心解决方案介绍在现代的IT基础设施中,数据中心的高可用性和容灾能力是至关重要的。
为了确保业务的连续性和数据的安全性,双活数据中心解决方案应运而生。
双活数据中心解决方案是一种通过同时使用两个活动数据中心来实现高可用性和容灾的方法。
章节一:解决方案概述在这一章节中,我们将介绍双活数据中心解决方案的概念和目标。
我们将解释什么是双活数据中心,以及为什么它是重要的。
我们还将讨论在构建双活数据中心解决方案时需要考虑的一些关键因素,如网络连接、数据同步和故障切换等。
章节二:双活数据中心架构设计在这一章节中,我们将详细介绍双活数据中心解决方案的架构设计。
我们将讨论每个数据中心的组成部分,如服务器、存储设备、网络设备等。
我们还将讨论数据中心之间的连接方式以及数据同步的策略。
章节三:故障切换和容灾恢复在这一章节中,我们将讨论故障切换和容灾恢复的过程。
我们将介绍故障切换的触发条件,以及在发生故障时如何无缝地切换到备用数据中心。
我们还将讨论容灾恢复的策略,如数据恢复和业务恢复。
章节四:监控和管理在这一章节中,我们将介绍双活数据中心解决方案的监控和管理。
我们将讨论如何监控数据中心的性能和可用性,并提出相应的管理措施。
我们还将介绍一些常用的监控工具和技术。
章节五:安全性和合规性在这一章节中,我们将讨论双活数据中心解决方案的安全性和合规性。
我们将介绍一些常见的安全威胁和攻击,以及如何保护数据中心免受这些威胁的影响。
我们还将介绍一些合规性标准和法规,以及如何确保数据中心的合规性。
附件本文档涉及以下附件:1.双活数据中心网络架构示意图。
2.数据中心故障切换流程图。
3.监控和管理工具推荐列表。
法律名词及注释1.双活数据中心:通过同时使用两个活动数据中心来实现高可用性和容灾的解决方案。
2.高可用性:系统或服务能够在出现故障或停机情况下继续正常运行的能力。
3.容灾能力:在发生灾难性事件后能够尽快恢复业务运营的能力。
华为双活数据中心解决方案
华为双活数据中心解决方案
Content
1 背景与挑战 2 方案架构及原理 3 竞争分析 4 成功案例
1
背景与挑战
客户痛点
• 数据丢失,不可挽回 • 经济损失,名誉损失,
甚至倒闭
客户痛点
• 资源利用率低,TCO低 • 手动切换,业务中断时间长 • 数据恢复时间长
天
容灾标准: SHARE 78国际标准
方案关键点
• 基于Vplex产品构建
• 两台Vplex设备拉远,形成远程集群
• Metro功能,实现跨站点数据同步
技术缺陷
• 无增值特性,无法实现本地快照保护等功能,无
法防止人为数据损坏
14
NetApp双活数据中心解决方案
方案关键点
• 全系列产品均支持 • 单控拉远,形成远程集群 • 同步复制功能,实现跨站点数据同步
30000 20000 10000
0
Oracle TPM Performance
Local
100km
1.1%
0.7%
0.7%
100
200
300
users
9
0.8%
400
Exchange vMotion Performance (ms)
20 15 10ds Average Latency I/O Database Writes Average Latency
数据中心2
VIS镜像卷技术
写IO流程
• 写请求到镜像卷 • 镜像卷将请求复制为两份下发到两中心
的镜像数据盘 • 镜像数据盘返回写操作完成 • 镜像卷返回写I/O操作完成
读模式
• Site Read模式 • 轮询模式 • 优先模式
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– vSphere Ent+
– vCenter Site Recovery Manager – NSX网络虚拟化
– VSAN
17
异地(同城)灾备解决方案——多种映射关系
主备式切换
Production
双活切换
Production
双向切换
Production
Recovery
– 硬件:HP 580服务器,HP EVA磁盘阵列
在各种灾难损害发生后,依然能够最 大限度地保障提供正常应用服务。
– 方便地实现异地虚拟机备份与容灾, 在需要异地接管应用的时候,可实现 “一键式”应用接管。
20
两地三中心解决方案——双活与灾备的完美集成
16
异地(同城)灾备解决方案
生产站点
vCenter Server
Site Recovery Manager
vSphere
vSphere 复制
服务器
阵列 复制
灾备站点
vCenter Server
Site Recovery Manager
vSphere
服务器
• 需求条件
– 通过二层或三层IP网络连接两个数据中心 – 采用基于vSphere或阵列的复制技术
灾备站点
Dev / Test
Dev / Test
Dev / Test
资源池
vSphere
vSphere
本地高可用
• 应用感知的高可用性(HA) • 关键应用零停机保护(FT) • 在线迁移虚拟机,动态调配资源(vMotion)
• VMotion an数d S据to保ra护ge VMotion
• 多数据副本的VSAN,计算与存储融合 • 高效的数据备份与恢复(VDAP) • 基于vSphere内核的远程数据复制(vSR)
SRM, NSX, VSAN等
数据复制
$1,000
开销(每应用)
数据备份
$100
9
以虚拟化为基础,灵活、可信、经济的业务连续性保障平台
服务 多种 应 用 支持 多种 关 系
关键应用 双活
数据库
二三级应用
开发/测试
教学/科研
互备
主备
多对一
备份到云
适用 多种 场 景
单中心
同城双中心
异地双中心
两地三中心
控制器 同城站点B
• 需求条件
– 数据中心距离小于100公里,实际更短,具备裸光纤链路 – 通过二层IP网络连接两个数据中心,BW>250M,RTT<100ms.
• 可通过NSX虚拟网络或其它大二层网络技术实现
– 采用存储虚拟化技术提供数据同步服务(RTT<5ms)
• 存储支持FC, iSCSI, NFS等类型 • 如EMC VPLEX、NetApp MetroCluster、HP LeftHand、IBM SVC等
23
建设方法与关键任务
24
业务连续性(信息系统)建设体系架构
业务 应用 管理实践 支撑系统 系统软件 硬件 基础设施
战略规划层,对业务进行评估,划定连续性级别 对应用的逻辑关系进行梳理,确定应用的可用性指标
流程的定义,配置变更与事件管理 管理,安全,基础架构服务等配套系统 虚拟化,操作系统,网络协议,存储服务
关键应用,核心应用
双活数据中心 RPO=0
RTO<15分钟 BC,DA,DR
2层网络, RTT<5ms 存储虚拟化-同步双写
低
高
二三级应用
虚拟机复制 灾备切换调度 RPO<15分钟 RTO<4小时
DA,DR
2/3层网络 任意距离. 任意存储设备
中
中
非生产应用
虚拟机复制 数据保护 RPO<1小时 RTO<24小时 DA,DR(手工) 2/3层网络 任意距离. 任意存储设备
• vSphere内置复制功能
– 免费,RPO=15分钟-24小时,文件级一致性,虚拟机级别颗粒度 – 支持异构存储,vCenter直接管理,恢复简便
• 阵列复制功能
– 由合作伙伴提供,需额外购买 – 支持同步或异步复制,应用级一致性,LUN级别颗粒度,恢复较复杂
• 应用一致性:Oracle DataGuard, SQL Always On, Exchange DAG
• 可靠地将虚拟机恢复到任何硬件 • 主站点与容灾站点可以采用非对等设计 • 标准化的虚拟硬件消除了兼容性问题
• 减少生产端和容灾端的硬件需求 • 在容灾端可以采用较高的整合比
6
关键应用的虚拟化比例逐年提高
基于虚拟化技术的业务连续性解决方案概览
本地站点
vSphere
资源池
vSphere
vSphere
双活数据中心与灾备解决方案概览
Active-Active Datacenter and Disaster Recovery Solutions
业务连续性与灾难恢复建设是重要任务
生产力
收入
声誉
合规
2
现实情况是……
我们没有为运行在 x86上的关键应用建 立业务连续性保障计 划,因为方案太复杂 而且我们经费不足。
灾难恢复
• 自动高效的灾难恢复管理 SRM
• 城域集群
方案特点
• 与应用程序和操 作系统无关 • 与硬件设备无关 • 完善的保护 • 简单,经济
8
与传统解决方案的对比
Continuous
Minutes
RTO RPO
Hours
Days
多活集群 主备集群
传统解决方案
$100,000
$10,000
VMware解决方案 vMotion, HA/FT, VDPA,
整体搬迁 相互融合 角色互换
• 旧有数据中心停用,无缝迁移到新数据中心 • 可靠性与业务连续性是关键 • 带宽条件好的情况下可使用长距离在线漂移
• 新旧DC同时运营,资源进行整合 • 业务可根据需要在两数据中心之间调配 • 参考双活中心解决方案进行设计
• 新DC条件更好,成为主DC • 旧DC作为新DC的灾备中心使用 • 参考灾备解决方案来进行设计
– 投资巨大:设备采购成本、软件购买成本、部署成本、后续维护成本 – 系统复杂:灾备系统的有效性难于验证,可靠性得不到保障
• 解决方案
– 广东电信公司异地组建的容灾数据中心利用VMware虚拟化软件建立 各个业务虚拟机,并通过VMware Site Recovery Manager实现生产 站点与恢复站点之间的业务切换。
我们缺少足够的资源 来进行灾难恢复测试, 也担心演练过程对生
产环境造成影响。
在最近一次灾难恢复 测试过程中我们比原 计划多用了几天时间。
发生重大灾难后,如果不能在 24小时之内恢复数据访问,
40%的公司将走向破产。
Gartner Gartner
调查问卷显示,只有31%的
CIO认为他们的业务连续性计 划是行之有效的。
21
两地三中心解决方案——双活与灾备的完美集成
vCenter 1
Site Recovery Manager
跨数据中心集群
控制器
控制器
同城站点A
同城站点B
生产中心 仲裁站点C
应用 切换
广域 链路
异步 复制
vCenter Server
Site Recovery Manager
vSphere
服务器
灾备中心
• 需求条件
– 同城二层网络,异地三层网络; – 同城存储同步双写,异地异步复制; – 异地采用VSAN存储简化管理降低成本;
• VMware相关产品与服务
– vSphere Ent+ – vCenter Site Recovery Manager – NSX网络虚拟化 – VSAN
22
数据中心迁移的几种场景
服务器,存储设备,网络设备与链路 建筑,环境,供电……
25
确定业务的可用性需求
丢失数据成本
数据可用性成本
系统可用性成本
成本轴
一级应用
宕机成本
二级应用 三级应用
RPO
损失的数据量
0
时间轴
RTO
恢复业务所需时间
26
基于业务的需求选择合适的解决方案
类别
解决方案 SLA
应用场景 需求条件 管理工作量
成本
• 方案特点
– 跨数据中心实现高可用性与负载平衡,支持各种应用 – 管理简便,成本较高 – 数据零丢失,无单一故障点,可靠性高,可最大化业务在线时间 – 距离有限,可实现城域级别的应用迁移与灾难避免/灾难恢复
13
同城双活数据中心解决方案——城域存储集群(vMSC)
vCenter
跨数据中心集群
控制器 同城站点A
Recovery
Production
双活数据中心
Site 1
Production Site 2
• 最常见的场景 • 花销较大
• 灾备架构主要用于测试,开 发和培训等非生产应用
• 有效降低开销
• 两个站点均有生产应用
• 每个站点为对方提供容灾 支持
• 两个站点的应用可以跨 站点自由移动
• 计划内事件零停机
IDG
3
传统业务连续性解决方案的主要问题
昂贵
复杂
软件 主机 存储 基础设施
每应用成本超过1万
应用
??
主机
? 存储 ?
?
? ? 网络
?
不可靠
每年一次DR测试
4
业务连续性解决方案的三大要点
高可用
同城
异地
灾难