华为HyperMetro SAN与NAS一体化双活解决方案
存储双活各大厂商实现解析
SVC-ESC IO流
读IO,读本地站点A主机向站点ASVC发起读请求SVC读本地缓存,如中有刚返回主机,如无,读本地存储写IO主机向SVC写I/O请求,同站点的SVC节点将写I/O写入缓存,同时将写I/O同步至另一站点的SVC节点另一站点的SVC节点将写I/O写入缓存,并回复响应两个站点的SVC节点陆续将缓存写入各自站点的存储当中仲裁支持IP,磁盘模式,防止脑裂
I/O GROUP架构当一个IOGROUP故障,虚拟卷不能被 其它 IOGROUP自动接管一般采用温备方式手动替换nodeCache当一个node失效后,该IOG catche 失效,性能有所下降
SVC-ESC
Node1
Node2
Node3
Node4
Node5
Node6
Node7
Node8
StorageA
VPLEX构建双活数据中心
仲裁第三站点Witness 通过IP 方式进行仲裁,防止脑裂
多活架构多活架构多控制器可并发访问制定虚拟卷当一个控制器故障时,本地其它控制器接管
IO流本地读取,双向直写写IO到存储层cache,写完成
链路FC链路
分布式缓存一致性
基于目录的分布式缓存一致性可跨所有引擎高效维护缓存一致性
华为 HyperMetro写请求流程(FS)
IO流主机下发写请求到active租户的文件系统。文件系统将写请求下发到HyperMetro管理模块本端存储系统记录写请求的LOG信息。执行双写:双活管理模块同时将该写I/O写入本端Cache和远端Cache。两端Cache向双活管理模块返回写I/O结果。管理模块返回写请求结果到文件系统存储系统返回写结果给主机判断双写是否成功 1)都写成功:清楚log 2) 如果 有一端失败,log转成DCL,记录本地Lun和远端lun的数据差异
基于华为高端NAS存储双活的POC测试
基于华为高端NAS存储双活的POC测试【摘要】近年来,银行业积累了越来越多的非结构化数据,在业务场景和存储系统建设上都在不断进行优化。
本文以作者所在企业的业务需求以及存储系统优化实际出发,在高端NAS存储双活系统上线前进行了深度POC测试。
从双活系统组网、架构健壮性以及业务系统适配上进行了多维度的测试,并形成了本POC测试报告,最终作为行里高端NAS双活系统规划和建设的依据。
1. 项目背景我行自2018年开始建设NAS存储资源池,从而正式开启了业务数据的存储架构优化之路,对于文件类的数据由先前的GPFS向NAS存储逐步迁移转型。
此外,结合存储系统分级体系建设以及业务系统的分级标准,在NAS存储资源池建设上同样也进行了分级存储建设。
为此,近两年来随着新核心系统的建设我行开始调研并构建高端NAS存储资源池。
同时,在同城双中心构建高端NAS存储的双活架构以满足我行新核心、重要及重要支撑系统的文件共享需求及其文件的高可用需求。
然而,高端NAS双活在我行首次实施,无论是该技术本身在我行网络架构中的适配性,还是在业务场景中的匹配上,甚至是存储运维人员对于这一新技术的全面掌握上都存在不确定性,甚至是盲点。
因此,运维部门作为该项目建设的牵头部门,开展了深度的高端NAS双活POC测试。
2. 测试目的和测试思路本项目计划通过深度的POC测试对高端NAS双活系统在应用场景、安全性以及功能性上进行充分验证,然后形成详尽的POC测试报告,最终作为高端NAS双活系统的规划和建设依据。
测试目的主要包括以下方面:第一,验证高端NAS双活架构在我行分区域建设的网络架构中的组网可行性。
第二,验证高端NAS双活架构在各种单点和双点故障场景中的自身架构健壮性。
第三,验证基于细粒度的单个业务系统的计划性站点切换演练的易用性和安全性。
对于POC测试原则最重要的是真实模拟或尽量贴近生产实际,因为在客户真实环境中的POC测试是最有说服力的,尤其是网络环境的真实性。
华为医院“一体化双活”存储系统解决方案
医院“一体化双活”存储系统解决方案医院信息化对存储挑战市县级、三乙医院的信息化系统往往比较完善,已经建成了HIS、PACS、LIS、RIS、手麻等多套信息化系统,涉及到病人挂号、取药、缴费、手术、住院、健康档案等各个环节,并且内容还在医疗健康范围内不断扩大。
近几年随着业务规模的不断扩大,信息化系统的压力急剧上升,原有的系统开始逐渐吃力,而新兴业务又在快速增长,严重的卡顿严重影响工作效率甚至影响医患之间的和谐关系,更多的设备增加了管理复杂度,尤其是数据的可靠性和业务的连续性随着设备的增加不断下降。
因此,需要对其信息化系统进行升级应对不断增长的业务需求,而作为多系统交互的数据共享平台,如何更加合理的整合,保证数据资产的可靠性、高效性、可用性、可管理性,尤其迫在眉睫。
而对于其核心存储平台,承载高性能系统(如HIS),大容量系统(如PACS)等核心业务的运行及存储,其建设需求应能够满足:1、统一:融合的存储平台,单台设备除了要能够满足业务系统对块数据(数据库等)高性能表现的诉求外,也要满足文件类处理的要求,充分满足块和文件两种类型应用数据的统一管理诉求,最大化减少架构复杂。
2、高可靠:部件、设备、系统级可靠,能够在部件故障、设备故障甚至机房故障时,都不会引起关键信息化系统(如HIS、PACS)的业务停机和数据丢失。
3、高性能:对于HIS核心系统,其业务的时延往往成为影响病人体验的一个重要指标。
时延大,病人需要花更多的时间排队等待,医生需要花更多的时间开具处方,这些不仅会影响工作效率,而且会引起矛盾。
4、领先性:新设备无论从架构、系统设计、硬件接口还是软件功能方面均具有前瞻性,保证设备的使用周期内能够满足医院未来的发展需要,同时满足扩容和性能升级等简单的需求。
5、高效率利旧:这些医院往往已经建成信息化系统,对原有系统的平滑改造、数据的平滑迁移是采用新存储时必须充分考虑的要素,要做到新设备上线对业务影响最小。
HCS-Solution-IT-华为阵列双活解决方案-02配置报价指导
控制模块
双控制器 自动变频,降低能耗 自带风扇模块(即风扇集成在控制模块中,但可以独立维护)
管理模块
1+1冗余 支持热插拔 支持多控Scale-out互联,实现心跳
电源模块
1+1冗余 转换效率高达94% 支持240V高压直流
接口模块
16个接口模块槽位,支持热插拔 接口类型:8Gb/16Gb FC、GE、10GE TOE、 10GE电口、 10GE FCoE、12Gb SAS; V3R2,V3R3还支持56Gb IB、 SmartIO卡,可配置重删压缩加速卡
选择产品型号
选择对应产品型号(5300 V3、5500 V3、5600 V3、5800 V3、6800 V3)
选择SAN or SAN+NAS一体化
*V3R1版本供选择SAN特性, SAN与NAS一体化特性采用V3R2报价
2,4,8控
选择控制器数
5300 V3、5500 V3、5600 V3、5800 V3 6800 V3
6800V3
6U独立机头 3200 8 256GB / 512GB/1TB
硬件规格 控制框形态 支持磁盘数 最大控制器数 Cache容量配置(双 控) 最大前端主机端口数 (双控) 软件规格
2U盘控一体 3U独立机头 750 1000 8 8 48GB /96GB 64GB / 32GB/64GB /128GB 128GB
HyperMetro阵列双活
SmartQos 智能服务质量控制 SmartDedupe & SmartCompression
★蓝色粗体为SAN与NAS都支持的特性
智能
SystemReporter 系统报表软件 Smartmotion 智能数据迅移
某银行核心系统基于华为高端NAS存储双活实践
某银行核心系统基于华为高端NAS存储双活实践摘要:对于中小金融机构来讲,由于历史原因和早期有限的业务场景,大多存储协议都较为单一,主要以集中式SAN存储为主。
随着企业的业务发展,非结构化数据不断积聚,而且其年增长率要远高于结构化数据。
同时,非结构化数据也变得更加重要。
无论是对业务本身,还是做数据挖掘,这些非结构化数据已经成为各企业的宝贵资产。
为了解决不同类型数据的合理存放问题,各企业都开始优化存储架构。
集中式FC SAN存储以其高吞吐、低延迟特性满足数据库类的应用场景。
NAS文件存储以其组网简单,即插即用的特性,满足业务系统文件共享的需求。
而对象存储则用于处理海量非结构化数据。
近年来,随着我行业务系统和业务规模的快速发展,业务系统已经积累了越来越多的非结构化数据。
但这些非结构化数据基本都存储在传统集中式的块存储中。
其中文件类的数据存放在构建在块存储之上的IBM GPFS并行文件系统上。
为了优化文件类数据的存储,拟采用NAS文件存储替换GPFS架构。
此外,依托NAS存储构建文件交互平台。
本文阐述了我行基于华为高端NAS存储双活项目建设背景和必要性、建设方案、项目创新点、技术方案以及项目成效等。
一、项目背景和建设必要性目前,我行的非结构化数据主要存储在构建于传统集中式块存储之上的IBM GPFS并行文件系统中。
这些非结构化数据的文件数量和容量随着业务规模的发展呈逐年激增的趋势,而这种使用存储的方式灵活性不高,同时带来了过高的成本开销。
GPFS 构建在FC SAN存储之上,消耗了较多的SAN存储资源以及中间的FC交换网络资源。
另外,由于和数据库类的应用争抢存储资源,也给这些联机交易类系统带来了一定的性能冲击。
随着行里的业务种类越来越丰富,不同类型数据的合理存放成为亟待解决的问题。
为此,我行2018年引入了中低端NAS存储设备,用于存储文件类的数据,为数据的分类存储提供了便利,使得存储的使用方式更趋于合理化。
华为存储双活规划设计指南
HyperMetro仲裁设计
组合故障场景
QS
S1
S2
QS
S1
S2
QS
S1
S2
QS
S1
S2
QS
S1
S2
QS
S1
S2
处理结果
故障场景:S1与QS、S2与QS链路同时或先后中断 处理结果:S1 、S2继续运行,自动进入静态优先模式
故障场景:阵列间、S2与QS间链路同时或先后中断 处理结果:S2失效,S1站点继续运行
数据初始同步时间减小90%,数据初始同步链 路带宽占用减小90%
FastWrite —双写性能优化
主机t
通用方案
OceanStor V3存储
OceanStor V3存储
主机
100KM
① Write Command ② Transfer
Ready ③ Data Transfer
8G FC/10GE
目录
1. HyperMetro双活原理 2. HyperMetro功能特性介绍 3. 双活交付前信息收集 4. 交付方案规划和设计 5. 交付及基础操作
HyperMetro数据一致性保障
数据中心A
主 机
应用集群
数据中心B
主 机
跨站点双活AA集群 双活LUN分布式锁互斥
阵 列 A 双活成员LUN
阵 列 B 双活成员LUN
故障场景:S1故障,同时S2与QS间链路中断 处理结果:S1、S2失效,业务中断
故障场景:QS故障后、S2再故障 处理结果:QS故障后,S1、S2继续运行,并自动进入静态优先模式;S2再 故障,S1继续运行 故障场景:QS故障后,S2再故障 处理结果:QS故障后,S1、S2继续运行,并自动进入静态优先模式;S1再 故障,S2失效,业务中断 故障场景:QS故障后,阵列间链路再中断 处理结果:QS故障后,S1、S2继续运行,并自动进入静态优先模式;阵列 间链路再故障,S2失效、S1继续运行
宏杉科技双活存储解决方案介绍
MacroSAN 双活存储解决方案介绍杭州宏杉科技有限公司1. 解决方案概述在信息社会里,数据的重要性已经毋容置疑,作为数据载体的存储阵列,其可靠性更是备受关注。
尤其在一些关键应用中,不仅需要单台存储阵列自身保持高可靠性,往往还需要二台存储阵列组成高可靠的系统。
一旦其中一台存储阵列发生故障,另一台可以无缝接管业务。
这种两台存储都处于运行状态,互为冗余,可相互接管的应用模式一般称之为双活存储。
由于技术上的限制,传统的双活存储方案无法由存储阵列自身直接实现,更多的是通过在服务器上增加卷镜像软件,或者通过增加额外的存储虚拟化引擎来实现。
通过服务器上的卷镜像软件实现的双活存储,实施复杂,对应用业务影响大,而且软件购买成本较高。
通过存储虚拟化引擎实现的双活存储,虽然实施难度有一定降低,但存储虚拟化引擎自身会成为性能、可靠性的瓶颈,而且存在兼容性的限制,初次购买和维护成本也不低。
宏杉科技的对称双活存储(Symmetrical Dual Active Storage,简称SDAS)是一项专门针对双活存储方案的创新技术。
通过宏杉科技对称双活存储技术,可以不需要引入任何第三方软硬件,直接通过两台同档次的MS系列存储阵列实现两台存储的双活工作,互为冗余。
当其中一台存储发生故障时,可由另一台存储实时接管业务,实现RPO、RTO为0。
这是一种简单、高效的新型双活存储技术。
宏杉科技的SDAS技术,不仅支持近距离的双活存储系统,而且支持上百公里甚至更远的远距离双活数据中心。
近距离的双活存储可以采用更加高效的光纤交叉直连的方式进行组网部署,远距离的双活数据中心采用交换机连接方式,再配以仲裁者机制进行组网部署。
宏杉科技的SDAS两套存储之间的链路不仅可以支持10GE以太网,而且在业界率先支持40GE以太网技术。
40GE具有目前以太网应用领域中的最高的传输带宽,可以大大降低同步数据传输时延。
目前宏杉科技的MS3000、MS5500、MS7000存储产品都已经支持对称双活存储技术。
阵列双活容灾解决方案
按业务粒度仲裁— 一致性组仲裁
WebSite OA CRM ERP
WebSite OA CRM ERP
WebSite OA CRM ERP
WebSite OA CRM ERP
通用方案
站点A
站点B
服务器 优先站点
服务器
按业务粒度仲裁
站点A
站点B
服务器
服务器
ERP一致性组 CRM一致性组 OA 一致性组 We b 一致性组
可视化
全局拓扑、集中告警 自动化,一键式容灾演练、恢复
本地高可用解决方案
方案架构
V
V
V
M
M
M
V
V
V
M
M
M
Other
SAN
Hu a we i
亮点
业务级高可靠
业务0中断 数据0丢失
课程目录
为什么要做容灾? 华为容灾解决方案OverVie w 华为阵列双活解决方案解析 华为阵列双活竞争分析 案 例分享
华为容灾解决方案全景图
本地高可用方案
本地高可用解决方案
同城容灾方案
双活数据中心解决方案 主备容灾解决方案
异地容灾方案
两地三中心容灾解决方案 主备容灾解决方案
≤1 0 0 km
>1 0 0 km
本地生产中心
同城容灾中心
异地容灾中心
双活数据中心解决方案
方案架构
生产中心1
VVV M MM
VVV MMM
HyperMetro 仲裁设计-仲裁部署方案
仲裁部署
有第三方仲裁站点(推荐)
存储资源池
• 仲裁设备部署在第三方站点,与双活的两个数 据中心处于不同的故障域
双活解决方案
双活数据中心间通过专用网络连接,采用多路径、高带宽的网络架构,确保网络通信的稳定性和低延迟。网络设计包括:
-双向冗余网络连接,避免单点故障。
-虚拟路由器冗余协议(VRRP)实现网络设备的冗余。
-分布式拒绝服务(DDoS)防御措施,确保网络安全性。
3.存储设计
存储系统采用分布式存储技术,实现数据的冗余存储和实时复制。关键特性包括:
2.网络设计
双活数据中心之间采用高速专线连接,确保网络带宽满足业务需求。同时,采用虚拟私有云(VPC)技术,实现两个数据中心之间的内网互通。
3.存储设计
双活数据中心采用共享存储架构,通过存储复制技术(如SRDF、HyperMetro等)实现数据实时同步。此外,采用存储虚拟化技术,提高存储资源利用率,降低运维复杂度。
数据库系统采用双活配置,通过数据库镜像或复制技术,实现数据的实时同步。设计重点包括:
-数据库事务日志同步,保证数据一致性。
-自动故障恢复机制,减少人工干预。
6.应用设计
应用层采用微服务架构,服务间通过服务总线进行通信,提高系统的灵活性和可扩展性。设计要点包括:
-服务冗余部署,确保服务的高可用性。
-服务注册与发现机制,实现服务动态路由。
四、实施方案
1.硬件设备选型与采购:根据业务需求,选择合适的硬件设备,包括服务器、存储、网络设备等。
2.软件系统部署:在两个数据中心部署相同的软件系统,包括操作系统、数据库、中间件、应用系统等。
3.数据同步:配置存储复制和数据库镜像,实现双活数据中心之间的数据实时同步。
4.网络配置:配置双活数据中心之间的网络连接,确保内网互通,并设置防火墙、负载均衡等安全策略。
2.数据一致性需求:要求双活数据中心之间的数据实时同步,保证数据一致性和完整性。
华为SAN NAS一体化阵列双活解决方案
• NetApp MetroCluster (SAN+NAS)
• IBM HyperSwap
特点:非网关/数据级镜像/紧耦合
NAS网关
控制器
控制器
NAS网关
控制器
控制器
• HDS GAD+HNAS 特点:非网关SAN+NAS网关/设备级隔离/松耦合
13
• Huawei HyperMetro(SAN+NAS) 特点:非网关/设备级隔离/松耦合/一体化
Fusion Sphere
单数据中心
1
2
3
5
站点A
站点B
主备数据中心
4
5
6
站点A
站点B
双活数据中心
容灾等级
7
目录
1 业务连续性挑战 2 典型业务连续性需求解析 3 业界阵列双活技术概览 4 华为SAN/NAS一体化阵列双活解决方案 5 成功故事
6
医院业务:结构化与非结构化数据并
华为SAN NAS一体化阵 列双活解决方案
目录
1 业务连续性挑战 2 典型业务连续性需求解析 3 业界阵列双活技术概览 4 华为SAN/NAS一体化阵列双活解决方案 5 成功故事
2
IT系统业务连续的重要性
火灾
设备故障
停电
病毒爆发
3
每 小 时 停 机 损 失
单
位
:
万
美
9
元
648
280
200
160
63
数据库集群
XXX 的数据
个人信息(姓名,年龄,身份证 号,卡号….)
图片信息(卷宗、笔录扫描 件、录音与.)
浅谈华为存储双活技术
浅谈华为存储双活技术目录浅谈华为存储双活技术 (1)第一章建设背景和趋势 (2)第二章DR与BC分析 (2)第三章双活建设目标 (4)第四章双活解决方案 (4)第五章客户价值 (7)第六章华为双活技术架构 (8)6.1 华为双活数据中心的定义及分类 (8)6.2 双活数据中心架构 (9)6.3 双活数据中心部署 (10)第七章存储层双活技术介绍 (12)7.1 AA双活架构 (12)7.2 高可靠技术 (15)7.3 高性能技术 (28)7.4 高可扩展性 (32)第一章第二章建设背景和趋势随着信息化技术的飞速发展,信息系统在各种行业的关键业务中扮演着越来越重要的角色。
在通讯、金融、医疗、电子商务、物流、政府等领域,信息系统业务中断会导致巨大经济损失、影响品牌形象并可能导致重要数据丢失。
因此,保证业务连续性是信息系统建设的关键。
目前,各行业普遍通过建设灾备中心来提高关键应用的业务连续性,在灾备中心保存生产数据副本。
传统灾备部署方式为一个生产中心对应一个灾备中心,灾备中心平时不对外提供业务访问。
一旦生产中心发生灾难,业务瘫痪,无法短时间恢复时,灾备中心才应需启动以提供业务访问。
这种灾备系统面临以下挑战:●当生产中心遭遇供电故障、火灾、洪灾、地震等灾难时,需要手动将业务切换到灾备中心,有可能需要专业的恢复手段和长时间调试,业务中断时间长,无法保证业务连续运行。
●灾备中心不能对外提供服务,常年处于闲置状态,资源利用率低。
企业数据中心宕机的原因,如下图:第三章DR与BC分析随着数字化业务的发展,业务竞争的日益激烈,如何保障数据的安全并实现业务连续,这对置身其中的每个企业都具有重大的意义,也是CIO们所无法回避的问题。
对于银行交易结算、电信计费等核心业务来说,对数据中心的要求也不再只停留在生产中心瘫痪时启动灾备中心,保证关键数据的绝对可靠还远远不够,业务连续运行已经成为普遍性的诉求。
对企业而言,业务连续性是一整套方案,在发生灾难或灾难之后甚至是遭遇一个轻微的破坏时,企业可以通过业务连续性计划来恢复业务运行。
华为NAS解决方案及场景介绍
华为NAS存储特点:方案可靠
主机应用集群 (共享卷挂载双活文件系统)……
Switch
HyperMetro
Switch
OceanStor V5
OceanStor V5
一台设备
一台设备可同时部署文件和数据库双活服务, 保障关键业务99.9999%可用性。
一套仲裁
SAN与NAS共用一套仲裁,确保链路故障时同 一站点提供服务,保障数据一致,并支持仲裁 主备部署,全链路无单点故障。
华为NAS存储特点:系统可靠
RAID 2.0+
资源智能分配
底层介质虚拟化 + 上层资源虚拟化,解决数 据资源的智能分配问题。
20倍重构速度
缩短数据重构时间,1TB数据仅需30分钟,是 传统RAID技术的20倍 ,降低重构过程对业务 的影响和多盘失效的概率。
自检自愈
分布式热备空间,当系统检测到故障时,硬 盘中有空闲的空间(CK),可自动启动重构, 在提升可靠性的同时大大降低了管理成本。
华为NAS解决方案及场景 介绍
目录
1 趋势与挑战 2 华为NAS解决方案与优势 3 华为NAS典型行业应用场景
非结构化数据快速增长
金融票据电子化
15.3
2014
20.4
2015
24.4
2016
办案卷宗电子化
33.7
2017
43.4
2018
医院去胶片化
54.3
2019
70. 2
2020
单位:EB 来源:IDC
空间节省
在线重删压缩,在数据下盘前进行, 减少需要保存的数据量,VDI场景数 据缩减率高于3:1 。
提升SSD寿命
在线重删压缩减少主机需要写入的次 数和数据量,以此达到延长SSD的使 用时间,保护用户投资价值。
双活数据中心解决方案
双活数据中心解决方案目录一、内容概括 (2)1.1 背景与挑战 (2)1.2 双活数据中心定义 (3)1.3 双活数据中心优势 (4)二、双活数据中心架构设计 (5)2.1 总体架构 (7)2.2 服务器与存储架构 (8)2.3 网络架构 (9)2.4 虚拟化技术应用 (11)三、双活数据中心实施步骤 (12)3.1 项目规划与准备 (14)3.2 硬件部署与配置 (15)3.3 软件安装与调试 (17)3.4 测试与验证 (18)四、双活数据中心运维管理 (19)4.1 运维流程 (20)4.2 监控与管理工具 (22)4.3 故障处理与恢复策略 (23)4.4 安全性与合规性保障 (24)五、双活数据中心案例分析 (26)5.1 国内外成功案例介绍 (28)5.2 案例分析 (28)六、双活数据中心发展趋势与展望 (30)6.1 新技术应用 (31)6.2 行业趋势分析 (32)6.3 未来发展方向 (34)七、总结与建议 (35)7.1 双活数据中心价值评估 (35)7.2 实施与推广建议 (37)一、内容概括本解决方案旨在解决企业在构建双活数据中心时所面临的一系列技术和管理问题。
该方案在结构上兼顾灵活性和安全性,注重提升数据中心间的协作能力和冗余性。
方案首先定义了双活数据中心的目标与要求,强调数据中心之间的实时数据同步、负载均衡以及故障切换机制的重要性。
详细介绍了双活数据中心的架构设计,包括网络架构、存储架构以及计算资源分配等关键方面。
本方案还涉及数据中心运维管理的优化措施,包括资源监控、故障预警与处置流程等。
本解决方案还讨论了如何确保数据安全性和合规性,包括数据加密、访问控制以及审计日志管理等。
本方案总结了实施过程中的关键步骤和潜在风险点,并提出了针对性的建议和解决方案,以帮助企业在实施双活数据中心过程中实现平稳过渡和提升运营效率。
1.1 背景与挑战随着云计算、大数据、物联网等技术的快速发展,企业业务需求呈现出多样化和实时性的特点,对数据中心提出了更高的要求。
华为HyperMetro SAN与NAS一体化双活解决方案
仲裁
15
一体化双活:一台设备
SAN与NAS并行架构图
iSCSI/FC/FCOE NFS/CIFS/FTP/HTTP
一体化定义
实现原理
创新设计
免网关
块和文件一体,无需额外购买NAS网关,购置 成本降低15%
Block Service
File Service
并行架构
SAN与NAS并行访问,为不同业务提供最优访 问路径,访问性能最优
Local storage array
Disk
IP/FC
Disk
Remote storage array Same-city network between data centers
20
一体化双活数据一致性保障
站点A 站点B
一体化定义
实现原理
创新设计
存储层数据一致性保障 I/O双写确保数据一致
主 机
⑤
⑧
LOG
③ ④
⑤
④
• HyperMetro管理模块返回写请求结果到文件系统。 • 存储系统将写I/O结果返回给主机。 • 判断双写是否成功。
Remote storage array
Primary Cache
Secondary Cache
› 如果两端都写成功:清除LOG。 › 如果有任意一端写失败:LOG转换成DCL,记录差异。
Storage POOL
RAID 2.0+
RAID2.0+
数据快速恢复,速度相对传统技术提升20倍, 多盘失效风险降低95%
16
一体化双活:一套仲裁
仲裁部署
双活SAN服务 双活NAS服务
一体化定义
实现原理
浅谈华为存储双活技术
浅谈华为存储双活技术目录浅谈华为存储双活技术 (1)第一章建设背景和趋势 (2)第二章DR与BC分析 (2)第三章双活建设目标 (4)第四章双活解决方案 (4)第五章客户价值 (7)第六章华为双活技术架构 (8)6.1 华为双活数据中心的定义及分类 (8)6.2 双活数据中心架构 (9)6.3 双活数据中心部署 (10)第七章存储层双活技术介绍 (12)7.1 AA双活架构 (12)7.2 高可靠技术 (15)7.3 高性能技术 (28)7.4 高可扩展性 (32)第一章第二章建设背景和趋势随着信息化技术的飞速发展,信息系统在各种行业的关键业务中扮演着越来越重要的角色。
在通讯、金融、医疗、电子商务、物流、政府等领域,信息系统业务中断会导致巨大经济损失、影响品牌形象并可能导致重要数据丢失。
因此,保证业务连续性是信息系统建设的关键。
目前,各行业普遍通过建设灾备中心来提高关键应用的业务连续性,在灾备中心保存生产数据副本。
传统灾备部署方式为一个生产中心对应一个灾备中心,灾备中心平时不对外提供业务访问。
一旦生产中心发生灾难,业务瘫痪,无法短时间恢复时,灾备中心才应需启动以提供业务访问。
这种灾备系统面临以下挑战:●当生产中心遭遇供电故障、火灾、洪灾、地震等灾难时,需要手动将业务切换到灾备中心,有可能需要专业的恢复手段和长时间调试,业务中断时间长,无法保证业务连续运行。
●灾备中心不能对外提供服务,常年处于闲置状态,资源利用率低。
企业数据中心宕机的原因,如下图:第三章DR与BC分析随着数字化业务的发展,业务竞争的日益激烈,如何保障数据的安全并实现业务连续,这对置身其中的每个企业都具有重大的意义,也是CIO们所无法回避的问题。
对于银行交易结算、电信计费等核心业务来说,对数据中心的要求也不再只停留在生产中心瘫痪时启动灾备中心,保证关键数据的绝对可靠还远远不够,业务连续运行已经成为普遍性的诉求。
对企业而言,业务连续性是一整套方案,在发生灾难或灾难之后甚至是遭遇一个轻微的破坏时,企业可以通过业务连续性计划来恢复业务运行。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计显示:
• 97%的局部故障会导致企业 对外业务运行中断; • 3%的全局故障引起企业数据 丢失,可能导致企业消亡;
区域性灾难
自然灾害 恐怖袭击/战争
数据中心故障
低
单次发生的损失
高
如何有效应对故障和灾难对业务连续性带来的挑战?---建设容灾系统
4
IT系统建设双活容灾势在必行
方案优势 方案不足 方案不足
应用集群
主 机
• 系统正常情况下,任意应用IO数据下发,都要同时写到两台阵
列才返回主机,确保两台阵列数据实时一致;
跨站点双活AA集群
单存储不可用时,记录数据差异
• 其中一台存储不可用时,仅写正常存储,同时数据变化记录到 DCL(Data Change Log)空间,待阵列修复好后,通过DCL
双活分布式锁互斥
• NetApp MetroCluster (SAN+NAS) • IBM HyperSwap 特点:非网关/数据级镜像/紧耦合
控制器 控制器
特点:非网关/设备级隔离/松耦合
NAS网关
• HDS GAD+HNAS 特点:非网关SAN+NAS网关/设备级隔离/松耦合
• Huawei HyperMetro(SAN+NAS) 特点:非网关/设备级隔离/松耦合/一体化
12
业界存储层双活方案解析
网关 控制器 网关 控制器 控制器 控制器 控制器 控制器
• IBM SVC • EMC VPLEX 特点:网关/数据级镜像/紧耦合
NAS网关 控制器 控制器
• • • •
HDS GAD EMC VMAX3 HPE PeerPersistence DELL Live Volume
医院业务:结构化与非结构化数据并存
HIS
病人基本信息 挂号 分诊、急诊 医生
PACS
下医嘱
LIS
数据库Βιβλιοθήκη 取药检查化验
门诊 结束
执行医嘱 入院
SAN
文件系统
缴费 出院
ICU探视 护理 输出结果 医生查房 手术/示教 医生
NAS
HIS:Hospital Information System(医院信息系统) PACS: Picture Archiving and Communication Systems(影像归档与通信系统) LIS:Laboratory Information Management System(实验室信息系统)
仲裁
15
一体化双活:一台设备
SAN与NAS并行架构图
iSCSI/FC/FCOE NFS/CIFS/FTP/HTTP
一体化定义
实现原理
创新设计
免网关
块和文件一体,无需额外购买NAS网关,购置 成本降低15%
Block Service
File Service
并行架构
SAN与NAS并行访问,为不同业务提供最优访 问路径,访问性能最优
组合故障场景
QS S1 S2
处理结果
故障场景:S1与QS、S2与QS链路同时或先后中断 处理结果:自动进入静态优先模式,业务无影响
S1
QS S1 QS S1 QS S1 QS S1
S2
故障场景:S1故障 处理结果:S2接管所有业务,继续提供服务
QS
S1 QS S1 QS S1 QS S2 S2 S2
①
⑦
Primary File System ②
DCL
Secondary File System
• 本端存储系统记录写请求的LOG信息。 • 执行双写:HyperMetro管理模块同时将该写请求写入两套存储
⑥ HyperMetro management module
Cache。
• 两端Cache向HyperMetro管理模块返回写请求结果。
• • • • • • •
•
• • •
数据、业务、网络连续性
双中心资源利用率高 业务、网络访问负载分担 端到端实时可用,自动容灾切换
Fusion Sphere
IT、网络资源利用率低,TCO高 手动切换,网络、业务中断时间长 组件多,故障恢复过程复杂,运维成本高 故障发生时,备份网络、数据是否可用?
Fusion Sphere
④
⑥
LOG
② ⑥
③
• 双写结果处理:等待两端Cache的写处理结果都返回,才向
主机返回写I/O结果。 • 判断双写是否成功。 – 如果都写成功:清除LOG。
Local cache
Same-city network between data centers
Remote cache
Local storage array
IP&FC NAS SAN
阵列与主机 间存储网络
一套仲裁
SAN
SAN IP&FC NAS
SAN与NAS共用一套仲裁,确保链路故障时同一站点提 供服务,保障数据一致
生产 存储
IP
数据实时镜像 双写心跳、配置
FC/IP
生产 存储
IP
一种网络
站点间心跳、配置、数据物理链路合一,一种网络即可 满足SAN与NAS传输
故障场景:阵列间、S2与QS间链路同时或先后中断 处理结果:S2失效,S1继续提供服务,业务无影响
S2
故障场景:S2故障 处理结果:S1接管所有业务,继续提供服务 故障场景:阵列间链路中断 处理结果:S2失效,S1继续提供服务,同时记录差 异,待恢复后增量同步配置、数据。 故障场景:S1所在阵列与仲裁服务器的链路中断 处理结果:业务无影响
⑤
⑧
LOG
③ ④
⑤
④
• HyperMetro管理模块返回写请求结果到文件系统。 • 存储系统将写I/O结果返回给主机。 • 判断双写是否成功。
Remote storage array
Primary Cache
Secondary Cache
› 如果两端都写成功:清除LOG。 › 如果有任意一端写失败:LOG转换成DCL,记录差异。
存储资源池 双重模式
仲裁盘1 存储阵列A 支持静态优先与第三方在仲裁模式,最大限度保障方案 高可用 存储阵列B
业务粒度
仲裁设备
按业务粒度仲裁,业务均衡分布,站点间链路故障时就 近访问
17
一体化双活:一种网络
站点A 站点B 主机应 用集群
一体化定义
实现原理
创新设计
链路复用
站点间心跳、配置、复制链路IP或FC,,一种网络 即可满足SAN与NAS数据传输需求
华为HyperMetro SAN与NAS一体化双活解决方案
目录
1 业务连续性挑战 典型业务连续性需求解析 业界存储双活技术概览 华为一体化双活解决方案 成功故事
2
3 4 5
2
IT系统业务连续的重要性
每 小 时 停 机 损 失
648
单 位 : 万 美 元
火灾
设备故障
280 200 9 63 110 160
结构化数据
LUN
存储需求:双活容灾
SAN双活 NAS双活
站点A 站点B
FileSystem
非结构化数据
• SAN与NAS提供数据双活容灾,支撑实 时访问
8
公安警综业务连续性需求:7x24在线
客户端 负载均衡 HA
警员需求:实时访问
• 案件信息、电子卷宗随时录入与查询
应用程序 (中间件)
XXX 的数据
数据丢失,不可挽回 经济损失,名誉损失 无冗余网络,恢复能力弱
Fusion Sphere
站点A 单数据中心 1 2
5
站点B 5 6
站点A 双活数据中心 7
站点B
容灾等级
主备数据中心 3
4
目录
1 2 3 4 5 业务连续性挑战
典型业务连续性需求解析
业界存储双活技术概览
华为一体化双活解决方案
成功故事
6
Storage POOL
RAID 2.0+
RAID2.0+
数据快速恢复,速度相对传统技术提升20倍, 多盘失效风险降低95%
16
一体化双活:一套仲裁
仲裁部署
双活SAN服务 双活NAS服务
一体化定义
实现原理
创新设计
统一管理
一套仲裁统一管理SAN与NAS双活,任何故障场景实现 相同站点提供服务,并支持在物理服务器/虚拟机/公有 云上部署
记录的信息,将数据增量写入存储;
阵 列 A
双活成员
双活成员
阵 列 B
分布式锁机制(DLM)
• 通过分布式锁机制,确保主机对同一存储地址的数据访问时, 由其中一台写入,确保数据一致性。
21
一体化双活典型故障场景处理
单点故障场景
QS S1 QS S2
一体化定义
实现原理
创新设计
处理结果
故障场景:仲裁服务器故障 处理结果:自动进入静态优先模式,业务无影响
7
医院业务连续性需求:7x24在线
客户端 负载均衡 HA
医生需求:实时访问
• 病人病历、住院信息、检查结果随时录入 与查询
应用程序 (中间件)
XXX 的数据
应用需求:A-A集群
• 数据库与文件业务提供实时在线访问
数据库集群
个人信息(姓名,年龄,身份证 号,卡号….)
图片信息(索引)(胸片, CT,B超图片….)
创新设计
数据写实时镜像
• 主机下发写I/O到双活管理模块。
Storage
①
DCL
• 系统记录LOG。
⑤ HyperMetro management module ③ ④