HCSSolutionIT华为阵列双活解决方案售前培训
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
低
自然灾害
单次发生的损失
低
高
如何有效应对故障和灾难对业务连续性带来的挑战---建设容灾系统
4
灾备发展的新挑战
海量数据
容灾系统如何有效应对数据增长,保证业务在线?
容灾系统如何将对业务的影响降至最低,实现业务零中断、数据零丢失? 数据量增速远超带宽增速,如何快速完成数据容灾?
业务永远在线
5
传统容灾模式投入大,利用率低,如何提升投入产出比?
优先站点
仲裁盘1
存储阵列A
存储阵列B
仲裁设备
• 仲裁设备:物理服务器或虚拟服务器 • 仲裁链路:IP可达即可 • 仲裁模式:支持静态优先和第三方仲裁双重模式 • 仲裁粒度:以业务(pair或一致性组)为粒度仲裁。
无第三方仲裁站点
• 优选:将仲裁设备部署在优先站点 • 备选:不部署仲裁设备,设置站点间的静态优
通用方案:站点间链路故障,业务全部切换到一 个站点运行
HyperMetro方案: • 每个业务一致性组,制定独立的仲裁优先策略,
即一部分一致性组的优先站点设置在站点A,另 一部分一致性组的优先站点设置在站点B. • 链路故障时,部分业务在站点A运行,部分业务 在站点B运行,业务性能不下降。 • 链路故障恢复时,完成双边差异化数据同步
华为阵列双活解决方案-售前培训 HCS-Solution-IT
课程负责人:余正华 部门:数据中心MKT
课程简介
内容简介: 本课程主要介绍华为阵列双活的相关知识,主要从容灾的挑战、华为 容灾解决方案全景图、应用场景、阵列双活的技术详细解析、亮点、 客户价值、竞争分析和案例来进行讲述
面向对象: 总代、一代、金银牌
V3同城互联端口与前段主机端口不复用
HyperMetro 数据双写流程
主机
Write IO
15
A阵列
2
双活LUN
4
3
3
跨站点双活AA集群 B阵列
4
双活成员LUN
双活成员LUN
HyperMetro双写流程
1.主机下发IO写请求 2.申请分布式锁 3.本端阵列向本端Cache写入数据,同时将写请求发送远 端阵列 4.本端写入数据成功,远端数据写入成功并返回本端阵列 写成功 5.本端和远端都写入数据成功,向主机返回写入成功
华为阵列双活解决方案解析
华为阵列双活竞争分析
案例分享
2
Page 2
IT系统业务连续的重要性
火灾 停电
设备故障
病毒爆发
3
每
小
时
停
机
损
失
648
280 200
9 63 110 160
媒体 医疗 零售业 制造业 电信 能源
来源: Network Computing, the Meta Group and Contingency Planning Research
高性能
HyperMetro性能提升30% 100KM与本地性能一致
可视化
全局拓扑、集中告警 故障自动切换、恢复
主备容灾解决方案
方案架构
生产中心
VVV MMM
VVV MMM
WAN
容灾中心
VVV MMM
VVV MMM
SAN Other
SAN
HyperReplicaiton
华为
华为
Other
9
亮点
秒级PRO
FC/SIPAN SAN
数据实时同步
生产 存储
IP网络
IP网络
仲裁设备
基本原理
在数据中心A和数据中心B各部署一套华为OceanStor V3 存储,部署为双活模式,为两数据中心业务主机同时提供 读写服务。任意数据中心故障,数据零丢失。
HyperMetro存储双活设计
A-A 架构: 双活LUN,双站点均可读写,数据实时同步 高可靠性设计:双重仲裁机制,跨站点坏块修复,提高系
≤100km
>100km
本地生产中心
同城容灾中心
7
异地容灾中心
双活数据中心解决方案
方案架构
生产中心1
VVV MMM
VVV MMM
WAN
生产中心2
VVV MMM
VVV MMM
SAN Other
SAN
HyperMetro
华为
华为
Other
8
亮点
真双活
6层双活架构,业务级双活; 业务0中断,数据0丢失;
HyperMetro仲裁设计--故障场景处理
单点故障场 景
QS
S1
S2
QS
S1
S2
支持10GE、8G FC以及16G FC互联协议
同城链路SLA设计
链路复用(包括心跳互联、双活、复制等),组网简单 优先传输:心跳 > 双活 & 同步复制IO流 > 异步复制IO
流
仲裁链路设计
支持10GE、GE网络,带宽2Mbps以上,IP可达
仲裁设备 14
最佳实践
组网原则
HyperMetro同城互联网络与主机、存储互联网络保持 一致、简化组网
21
按业务粒度仲裁—一致性组仲裁
通用方案
站点A
站点B
按业务粒度仲裁
站点A
站点B
以业务粒度仲裁,链路故障,业务体验不下降
WebSite OA CRM ERP
WebSite OA CRM ERP
WebSite OA CRM ERP
WebSite OA CRM ERP
服务器 优先站点
服务器
服务器
服务器
ERP一致性组 CRM一致性组 OA 一致性组 Web一致性组
为什么要做容灾? 华为容灾解决方案OverView
华为阵列双活解决方案解析
华为阵列双活竞争分析
案例分享
12
Page 12
HyperMetro阵列双活架构
数据中心A
数据中心B
FC/IP SAN
生产 存储
Oracle RAC集群 VMware vSphere集 群 FusionSphere集群
……
WAN
先级(优先站点故障,业务将无法继续运行)
18
双活仲裁配置
A
DC1
Qs 12
网络配置
Host(Redhat/Suse Linux)上两个端口绑定。 每个控制器提供一个GE/10GE端口作为仲裁端口,所有
端口配置为同一个网段的IP地址即可。 如果不绑定端口,可以使用其中一个端口连接阵列A,
另一个端口连接阵列B,则划分为2个VLAN。
统可靠性 高性能设计:提供多种性能优化手段,减少站点间交互延
时,业务性能提升30% 灵活扩展设计:支持异构,支持与快照、远程复制联动,
可扩展为两地三中心容灾方案
13
HyperMetro组网设计
Host
Host
FC/IP SAN
10GE / FC
FC/IP SAN
同城互联及仲裁网络设计
网络互联需求
15
HyperMetro 数据一致性保障
应用层数据一致性保障
数据中心A
数据中心B
主
主
机
Байду номын сангаас
应用集群
机
跨站点数据库、应用集群部署,共享存储架构 IO双写,数据实时一致
存储层数据一致性保障
跨站点双活AA集群 双活LUN分布式锁互斥
阵 列 A
双活成员LUN
阵 列 B
双活成员LUN
I/O双写确保数据一致 系统正常情况下,任意应用IO数据下发,都要同时写到两台 阵列才返回主机,确保两台阵列数据实时一致;
19
静态优先模式
静态优先 阵列 A
仲裁部署
心跳丢失
阵列 B
1、双活心跳机制:阵列周期性发送心跳,以确认远端阵列是否正常工作 2、静态优先模式:当与远端阵列心跳异常时,约定A”存活”,B”自杀” 3、约束与限制:如果阵列A故障,B阵列仍然按照心跳异常处理,B”自杀”导致业务中断 4、部署建议:优选第三方仲裁模式,当A与B失去联系时,通过仲裁来区分设备故障和中间链路 故障这两种场景
GE/10GE网络
B
存储A
Storage DC2
仲裁组网连线
链路要求
时延:建议时延RTT ≤ 50ms。 带宽:建议带宽≥10Mb/s。 丢包率:≤ 0.1%。 不支持NAT转换
B
Storage
仲裁服务器配置
操作系统:Redhat 6.x,Suse 11,要求64bit。 硬盘空间:推荐100G。 内存:推荐8GB
单存储不可用时,记录数据差异 其中一台存储不可用时,仅写正常存储,同时将业务运行时 间段的数据变化记录到DCL(Data Change Log)空间,待 不可用阵列修复好并接入系统后,通过DCL记录的信息,将 数据增量写入存储;
分布式锁机制(DLM) 通过分布式锁机制,确保主机对同一存储地址的数据访问时, 由其中一台写入,确保数据一致性。
链路故障,导致非优先站点全部 故障,所有业务切换到站点A
链路故障,站点A和站点B可按 设定优先级分别对不同业务系统 提供服务
22
双活仲裁模式
优先 优先
双活Pair 001 双活Pair 002 双活Pair 003
优先 优先
双活Pair 001 双活Pair 002 双活Pair 003
优先 双活一致性组 001
A“
异地容灾中心 SAN
A“
10
亮点
高安全
3份数据 容灾范围更大
平滑扩展
同城平滑扩展到两地三中心 级联、并行灵活部署
可视化
全局拓扑、集中告警 自动化,一键式容灾演练、恢复
本地高可用解决方案
方案架构
V
V
V
M
M
M
V
V
V
M
M
M
Other
SAN
Huawei
11
亮点
业务级高可靠
业务0中断 数据0丢失
课程目录
IO级的数据复制功能,RPO≈0;
TCO低
存储高、中、低端互通 异构、利旧
可视化
全局拓扑、集中告警 自动化,一键式容灾演练、恢复
两地三中心容灾解决方案
方案架构
生产中心
A
SAN
A
同/异步复制
级联架构
同城容灾中心
SAN
A’
异步复制
生产中心
A
SAN
A
同/异步复制
并行架构
同城容灾中心
SAN
A’
异步复制
异地容灾中心 SAN
高端存储只能复制到高端存储,容灾设备利用率低,如何提升投入产出比? 容灾中心的资源如何更好的利用和共享,降低容灾TCO? 灾备数据如何有效利用,实现增值?
容灾系统管理范围广、难度大,如何简化?
人力有限,如何高效地完成容灾业务来支撑企业持续运作? 容灾系统建设涉及服务器、网络、存储等设备,系统复杂,容灾业
课程目标: 通过本课程学习,学员应了解华为容灾解决方案进展,熟悉华为阵列双 活特性,掌握华为阵列双活的客户价值和亮点,并在市场拓展中进行应 用
版本信息(含发布/修改时间): 发布时间:2016-12-09 本次修改时间2016-12-09
1
课程目录
为什么要做容灾? 华为容灾解决方案OverView
务众多,如何管理和维护?
课程目录
为什么要做容灾? 华为容灾解决方案OverView
华为阵列双活解决方案解析
华为阵列双活竞争分析
案例分享
6
Page 6
华为容灾解决方案全景图
本地高可用方案
本地高可用解决方案
同城容灾方案
双活数据中心解决方案 主备容灾解决方案
异地容灾方案
两地三中心容灾解决方案 主备容灾解决方案
20
第三方仲裁模式
心跳 异常
抢占仲 裁设备
分裂成 子集群
存活/ 自杀
说明:非优先站点延迟发起抢占命令,以保证优先站点优先存活
1、集群心跳机制:阵列周期性发送心跳,以确认远端阵列是否正常工作。 2、触发仲裁的条件:只有与远端阵列心跳异常时,才会触发仲裁。 3、仲裁设备故障:仲裁设备故障,不影响双活业务,且自动转换为静态优先模式
单位: 金融 万美元 服务
影响IT系统业务连续性的灾难类型
设备故障
高
数据损坏
磁盘故障
每
应用中断
年
组件故障
的
发
网络问题
生
频
电源故障 空调故障
率
区域性灾难
统计显示: 97%的局部故障会导致 企业对外业务运行中断; 3%的全局故障引起企业 数据丢失,可能导致企业 消亡;
数据中心故障
建筑火灾
恐怖行动/国内动乱
、复制等其它特性混合部署,建议预留Pool的百分之五空间。 双活在故障后的恢复过程中,数据同步依赖DCL进行增量同步,同步速率可以随时手动修改。
17
HyperMetro仲裁设计-仲裁部署方案
仲裁部署
存储资源池
有第三方仲裁站点(推荐)
• 仲裁设备部署在第三方站点,与双活的两个数 据中心处于不同的故障域
16
双活增量同步原理
网络配置
1
6
① 主机写IO下发至阵列
3 4 双活Pair
② 记录本端阵列双活Pair的DCL,该IO位置为脏。 ③ 同时写本端和远端阵列cache。 34 ④ 远端阵列和本端阵列均返回写成功。
⑤ 清除DCL脏数据。
2
⑥ 返回主机写IO成功。
DCL
DCL 5
DCL在创建双活Pair时,自动在该LUN所属Pool内创建,对用户不可见 DCL空间预留:如果阵列只部署HyperMetro双活,建议预留Pool的千分之一空间。如果和快照
23
双活Pair仲裁
优先
双活Pair之间的优先阵列可以不相同 仲裁时按Pair进行仲裁,Pair位于优先阵列侧 的LUN将优先发起仲裁抢占行为
双活一致性组仲裁
优先
双活一致性组内的双活Pair可以拥有不同的 优先阵列,但是一致性组内所有Pair的优先 策略将失效,将使用一致性组的优先策略 一致性组删除后,原Pair将继续使用自己的 优先策略 双活一致性组除仲裁策略外,IO下发时也将 保持其顺序,建议同一种业务或者有严重相 关业务配置为双活一致性组。