基于存储的双活数据中心建设方案-baidu

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于存储的双活数据中心建设方案

最近频繁接触双活数据中心,因为我们主要的客户是金融客户,很多客户对于其业务系统的的RPO与RTO要求都非常高,极端的要求RPO/RTOR近似于0。那么对于极端要求的数据中心双活存储层面的双活,并配合应用层如:VMware的VMSC,Oracle的跨站点RAC等,来实现当生产中心发生故障后实现业务的自动切换。

那么对于主流存储的双活架构主要是以下几个实现形式:

基于存储网关

即在控制器存储上层增加一套存储网关,存储将自己的lun映射给虚拟化存储网关在网关上层做LUN的Mirror以实现底层存储双活以SVC 为例,本地数据中心的双活及跨中心的同城集群双活Metro模式。

这种存储网关的模式即采用如下模式(SVC举例):

每个网关Owen相应的LUN举例如下:

主机A(系统1)写入网关---网关入写控制器---控制器写入LUN---LUN与同城存储对应的LUN实现镜像。

主机B(系统2)写入网关---网关入写控制器---控制器写入LUN---LUN与同城存储对应的LUN实现镜像。

两套网关是互备关系,系统1或2是无法同时写入到一个LUN的,这点很重要,另外为了解决高可用问题每个存储网关均是双控制器,一般至少会部署4控制器存储网关。

如果要构建一个高性能的双活存储网络,服务器写入到的网关引擎的性能就是重中的之重,SVC就是两台IBM X3550的服务器,性能堪忧,我经常遇到SVC+DS8000做同城双活的奇葩方案,典型的小驴拉高铁。

接下来我们来聊一下控制器采用A-P集群的双活模式

我们以Hp 3par存储为例,3Par不需要上层的存储网关,在控制器层直接做底层磁盘的双活,两端LUN的镜像是主站点与备站点间的Remote Copy顾名思义和SVC的双活类似,1个LUN只能被一个控制器主写入,并通过远程镜像的方式Mirror至同城站点。

如果主站点发生故障,要以实现用户无感知的应用切换,目前很多号称可以做双活的存储厂商大多是这种模式比如:宏杉,华为V5目前应该也是采用这个架构的。

这个用户的无感知切换是通过主机多路径来实现的,主机层面会同时看到巨多的到存储的路径,当然只是有主活数据中心的存储链路是负载的,另一个数据中心的存储链路是StandBy状态。

那么能够达到真正意义的双活存储呢?

高可用层面肯定是0中感知中断

性能层面可以实现双数据中心多控制器的AA及真正的LUN层面的负载均衡。

而且可以在主备站点间的双活链路发生中断后不会脑裂,主备站点访问仲裁存储(节点)的链路发生中断后,各控制器可以实现自已写入自己的存储,而不会脑裂。

我们以HDS的高端存储为例如下图:

两个数据中心的多控制器(至少4控)可以同时owner底层的磁盘或LUN,即LUN在映射阶段是同时映射给上层的控制器,这样数据链路就可以实现数据写入的多中心同时负载,这就是为什么很多五大行及大型股份制银行多采用HDS的存储架构的原因,那么采用这种A-A架构双活存储都有那些厂商呢:

EMC VMAX,HDS,华为OceanStor V6均是采用这种A-A架构的。

另外VPLE MetroCLuster是A-A还是A-P的这个有待确认,不过我记得有一次实施的时候和EMC的人聊过,他们本地是A-A的,还可以实现A-A-P就是在双活的基础上之前再购买一个冗余的。

我们双活数据中心的存储架构就聊到这了,那么如果在网络,存储,数据库,虚拟机均真正实现了双活部署那么我的数据中心高可用真的就万无一失了嘛?

答案是否的,我们前面多次聊过3-2-1原则即我的数据要有3个逻辑副本,两种介质和1份异地数据保护所以如何来构建一个真的高可靠的数据中心架构呢起码在存储层面要实现如下部署:

1、同城双活存储

2、在同城双活存储的基础之上要部署一套本地CDP的快速备份存储比如:飞康(一家不知去向的公司)EMC的RecoverPoint或hds的异步数据复制大多是采用G200或G400,这可以实现当主双活存储发生逻辑错误或整体性坍塌时(这种大多是人为的错误)可以将数据切换至本地备份存储上去。

3、本地基于应用的数据备份系统如:NBU,CommVault,新生代的比如VEEAM等等,当然也可以用我们的CloudDP数据保护一体机,不过新生代大多不支持老系统比如IBM的大机,AS400等。

4、在异地会部署一套灾备系统如果是数据级的就是CDP设备或者本地数据备份介质的异地Copy,当然也可以像五大行一样部署一套异地应用级别的灾备系统数据的同步可以通过存储复制或者基于应用的CDP或基于数据库的ADG等等。

如上所述,这才能够解决数据中心高可用的问题,我们很多用户花了大价钱购买了基于存储双活,但是由于无论是运维能力还是仲裁机制设定的不理想,发生了数据中心停机数小时甚至至数的情况就是太相信了厂商的一家之言,没有从架构层面和自身的业务层面真设计自己的数据中心高可用架构。

相关文档
最新文档