EMC双活数据中心解决方案 V4.0

合集下载

双活数据中心解决方案(最新)

双活数据中心解决方案(最新)

构建永不宕机的信息系统——双活数据中心双活数据中心解决方案目录案例分享12存储层应用层双活数据中心端到端技术架构数据中心A 数据中心B双活存储层双活访问、数据零丢失异构阵列双活应用层Oracle RAC 、VMware 、FusionSphere 跨DC 高可用、负载均衡、迁移调度双活网络层高可靠、优化的二层互联最优的访问路径≤100km 裸光纤Fusion SphereFusion Sphere接入层汇聚层核心层DC 出口网络层GSLB SLBGSLB SLB前端应用的双活(VMware )vm vm vm vm vm vm vm vm vm vm vm vmADvm vm vm vm SQL node1MSCSvCenterServervm vmvm vm APP…….APP…….SQL node2MSCSvm vm vm vm vm vm vm vm vm 大二层互通网络,跨数据中心VM 配置双活应用,使用虚拟化网关提供的镜像卷作为共享存储Weblogic业务集群管理集群vmWeblogic•vSphere Cluster HA •vSphere Cluster DRS •配置PDL 参数•Huawei OceanStor UltraPath for vSphere•配合负载均衡设备实现Weblogic 访问自动漂移和均衡VMware 配置要点业务访问效果•业务访问负载均衡•虚拟机分布按业务压力自动均衡•故障自动切换访问•Weblogic 可动态扩展•单数据中心故障恢复后,虚拟机自动回切Operating System Instance1Listener1Service1Operating SystemInstance2Listener2Service1Operating SystemInstance3Listener3Service2VIP3VIP2VIP1Shared Storage数据中心A 数据中心B服务配置策略服务名INSTANCE1INSTANCE2INSTANCE3SERVICE1PREFERRED PREFERRED AVAILABLE SERVICE2AVAILABLEAVAILABLEPREFERRED•集群“2+1”部署›适配数据中心业务分布有偏重的场景›适配两个数据中心存在优先存活数据中心的场景•Oracle RAC 仲裁原则›拥有最多节点数目的子集群(Sub-cluster with largest number of Nodes )获胜›若子集群内数目相等则拥有最低节点号的子集群(Sub-cluster with lowest node number)获胜数据中心业务分布设计访问分离减少缓存融合•访问分离›为了避免跨数据中心进行数据的交互,建议在Oracle RAC 层创建不同的service ,实现业务分离。

双活数据中心项目解决方案

双活数据中心项目解决方案
实时同步主备数据中心的数据,确保数据一致性。
灾难恢复计划
制定应对灾难事件的策略和流程,确保业务连续性。
数据同步机制
数据实时同步
通过数据同步引擎,实现 主备数据中心数据实时同 步。
数据校验
定期对数据进行校验,确 保数据一致性和完整性。
数据备份
定期备份数据,以应对意 外数据丢失或损坏的情况 。
03
实施步骤与计划
双活数据中心项目解决方案
汇报人: 202X-01-08
目录
• 项目背景介绍 • 双活数据中心架构设计 • 实施步骤与计划 • 效益分析 • 技术风险与应对措施 • 项目成功要素与建议
01
项目背景介绍
业务需求
实现跨地域的数据同步和备份
01
双活数据中心能够满足业务在多个地域的需求,保证数据实时
同步,避免单点故障。
1 2 3
数据同步延迟
双活数据中心要求数据实时同步,但网络延迟、 系统负载等因素可能导致数据同步出现延迟,影 响业务连续性。
数据冲突
在双活数据中心中,由于数据实时同步,可能导 致数据冲突,如两个数据中心同时更新同一数据 项。
数据完整性问题
数据传输过程中可能出现数据丢失、损坏等情况 ,影响数据完整性。
网络稳定性挑战
网络设备故障
双活数据中心依赖于高可靠性的网络设备,任何设备的故障都可能 导致数据传输中断。
网络带宽限制
双活数据中心需要大量数据传输,如果网络带宽不足,可能影响数 据同步速度和业务连续性。
网络延迟与抖动
网络延迟和抖动可能导致数据同步延迟和业务性能下降。
高可用性保障
负载均衡
通过负载均衡技术,将 业务流量分散到两个数 据中心,确保任一数据 中心故障时,业务仍能 正常运行。

DELL EMC ”双活“解决方案

DELL EMC ”双活“解决方案

一、总体架构图为了进一步保障核心应用的高可用性,提高生产的安全级别,计划对目前的存储系统进行虚拟化整合,并搭建双活存储系统,保证关键业务所使用的存储系统即使有一台存储系统出现故障,也不会出现业务停顿,达到更高的生产安全保障。

经讨论分析,结合系统目前的现状,我们建议存储整合的架构设计,如下图所示:如上图所示,在生产中心的SAN网络中配置一套存储虚拟化设备——EMC VPLEX,将目前的存储系统接入VPLEX,所有应用系统只需要访问VPLEX上的卷即可,接入VPLEX上的存储可以做到镜像关系(即双活)或级联关系。

建议对重要应用的数据存储在镜像的两台存储系统上。

整个方案的组成部分为:A.中心机房-光纤交换网络:由两台速度为8Gbps的光纤交换机组成光纤交换网络,为所有系统提供基于光纤协议的访问;两台光纤交换机之间互为冗余,为系统的网络提供最大的可靠性保护。

用户可自行建设冗余SAN网络。

B.中心机房-主存储系统:配置一台EMC存储系统,与当前的EMC存储通过虚拟化存储进行本地数据保护,对外提供统一的访问接口;重要应用系统的数据都保存在这两台的存储系统上;➢EMC存储系统可同时提供光纤SAN、IP SAN、NAS等多种存储模式,支持光纤盘、闪存盘、SATA盘、SAS盘、NL-SAS盘等多种磁盘混插,大大增强存储系统的可扩展性;➢支持将闪存盘作为可读写的二级缓存来使用,同时支持自动的存储分层(FAST),提高存储系统的整体性能;➢支持LUN的条带化或级联式扩展,以将数据分散到更多的磁盘上;C.中心机房-存储虚拟化:以EMC VPLEX Local作为存储虚拟化;应用系统只需要访问虚拟化存储,而不需要直接管理后端的具体的存储系统;通过存储虚拟化,可以达到两台存储之间双活,可以支持异构的存储系统,对数据进行跨存储的本地及远程保护,统一管理接口和访问接口;D.中心机房-利旧存储:除了用来做“存储双活”的存储系统外,如果还有其他的SAN存储系统,EMC建议,通过VPLEX虚拟化功能,将这些旧存储系统挂接到VPLEX虚拟化存储中,加以利用;这些存储资源将作为存储资源池共享,按需使用;(注:挂接到VPLEX后端的其他存储品牌需要在VPLEX的兼容列表内。

vplex双活数据中心解决方案

vplex双活数据中心解决方案
无间断业务运营
时间=金钱! 时间=生命!
越来越多的企业需要更可靠的应用连续性
应用的连续可用性提高数据中心的效率提高现有IT资源的效率云计算概念,随时随地访问
来自终端用户的需求促使观念的改变
IT领域对数据可靠性和连续用性要求越来越高
Recovery Point ObjectiveRecovery Time Objective
Continuous Availability, Next Generation DR, Load Balancing
VMware with VPLEX
vMotion across datacenters for non-disruptive load balancing, maintenance, and workload re-locationAutomatic failover and restart between the sites using VMware HA - no manual intervention neededThe loss of a storage array or requirement for planned downtime does not result in ANY application interruptionVMware DRS for full utilization of compute and storage resources across domains
Passive Failure Domain
Vast majority of Oracle deployments employ this protection methodologyStandby infrastructure available if primary instance failsRe-start at second instance = application outageLow infrastructure utilization because equipment at secondary instance is not actively usedPerformance limited to infrastructure at active site

双活数据中心方案

双活数据中心方案

双活数据中心方案双活数据中心方案一、介绍双活数据中心方案是一种高可用性解决方案,通过将数据和应用同时部署在两个数据中心,实现数据和应用的双向同步,提供业务连续性,降低系统故障风险。

本文档将详细介绍双活数据中心方案的各个方面。

二、架构设计1、数据中心选择- 硬件条件:选择具备足够硬件资源的数据中心,包括服务器、存储等设备。

- 网络条件:确保数据中心之间的网络带宽和延迟满足业务需求。

- 电力条件:确保数据中心具备稳定可靠的电力供应。

2、数据同步- 数据同步技术:选择合适的数据同步技术,如数据库复制、文件同步等,使两个数据中心的数据保持一致性。

- 数据同步策略:确定数据同步的频率和方式,如同步延时要求和同步方式(异步或同步)等。

3、应用部署- 应用集群化:将应用部署在多个服务器上,实现负载均衡和故障切换。

- 应用同步部署:将应用同时部署在两个数据中心,实现两地的业务连续性。

4、故障切换与容灾- 故障切换策略:定义故障触发条件和切换流程,确保故障时能够快速切换到备用数据中心。

- 容灾测试:定期进行容灾测试,验证容灾方案的可行性和有效性。

三、监控与报警1、监控系统- 监控指标:确定需要监控的指标,如服务器负载、网络流量、存储空间等。

- 监控工具:选择合适的监控工具,实时监控数据中心的各项指标。

- 监控策略:设置监控策略,包括告警阈值、告警通知方式等。

2、报警系统- 报警方式:选择适合的报警方式,如邮件、短信、方式APP等。

- 报警接收人:确定接收报警信息的人员,包括运维团队、管理人员等。

四、数据备份与恢复1、数据备份- 备份频率:确定数据备份的频率,如每天、每周等。

- 备份策略:定义备份策略,包括全量备份和增量备份等。

- 备份验证:定期验证备份数据的完整性和可用性。

2、数据恢复- 恢复时间目标(RTO):定义数据恢复的时间目标,即从故障发生到数据恢复的时间。

- 恢复点目标(RPO):定义数据恢复的点目标,即恢复到哪个时间点的数据。

双活数据中心方案

双活数据中心方案

双活数据中心方案双活数据中心方案是一种部署在不同地理位置的两个数据中心,旨在提供高可用性和灾备恢复能力。

这种方案能够确保在一个数据中心出现故障的情况下,另一个数据中心能够顺利接管服务,并保证用户体验不受影响。

以下将详细介绍双活数据中心方案的设计和优势。

1.数据复制:双活方案需要确保两个数据中心之间的数据实时复制或者近实时复制。

这可以通过数据库的主从复制、文件同步或者数据快照实现。

数据复制的目的是保持数据的一致性,以便在故障发生时能够无缝切换到另一个数据中心。

2.心跳检测和故障切换:为了监测数据中心的健康状态,通常会设置心跳检测机制,以确保数据中心之间的连接正常。

如果主数据中心出现故障,心跳检测会及时发现,并触发故障切换机制,将服务切换到备用数据中心。

故障切换的过程应该是自动化的,以减少人工干预和减少切换时间。

3.基础设施冗余:为了实现高可用性,双活方案需要在两个数据中心都配置冗余的基础设施,包括独立的电力供应、网络连接、服务器和存储设备等。

当一个数据中心发生故障时,备用数据中心能够顺利接管服务,而不会由于基础设施故障而导致服务中断。

1.高可用性:双活方案可以提供更高的可用性,因为即使一个数据中心出现故障,另一个数据中心仍然可以继续提供服务。

这种设计可以最大限度地减少服务中断的风险,并提供卓越的用户体验。

2.灾备恢复能力:双活方案能够提供更好的灾备恢复能力。

当一个数据中心发生灾难性故障时,备用数据中心可以快速接管服务,并恢复运营。

这种方案可以最大限度地减少业务损失,并提供持续的服务。

3.地理位置容灾:由于双活方案将数据中心部署在不同地理位置,可以有效应对地域性的自然灾害或人为事故。

即使一个地区受到灾害影响,另一个地区的数据中心仍然能够正常运营,确保数据安全和业务连续性。

4.故障切换和容错能力:双活方案通常自动化故障切换,减少人工干预的需要。

这种方案可以提供更快的故障恢复时间,并减少对用户的影响。

此外,双活方案中的数据复制和冗余设计可以减少单点故障的风险,提供更可靠的服务。

EMC双活数据中心解决方案 V4.0

EMC双活数据中心解决方案 V4.0

EMC数据中心容灾系统建设方案建议书EMC电脑系统(中国)有限公司Version 1.0,2014/10前言信息是用户的命脉, 近十年来信息存储基础设施的建设在用户取得长足的进步。

从内置存储转向外置RAID存储,从多台服务器共享一台外置RAID阵列,再到更多台服务器通过SAN共享更大型存储服务器。

存储服务器容量不断扩大的同时,其功能也不断增强,从提供硬件级RAID保护到独立于服务器的跨磁盘阵列的数据镜像,存储服务器逐渐从服务器外设的角色脱离出来,成为单独的“存储层”,为数据中心的服务器提供统一的数据存储,保护和共享服务。

随着用户业务的不断发展,对IT系统尤其是存储系统的要求越来越高,鉴于用户业务由于信息的重要性,要求各地各用户多中心来预防单一数据中心操作性风险。

多数据中心建设方案可以预防单数据中心的风险,但面对多数据中心建设的巨额投资,如何同时利用多数据中心就成为IT决策者的首要问题。

同时利用多数据中心就必需实现生产数据跨中心的传输和共享,总所周知,服务器性能的瓶颈主要在IO部分,数据在不同中心之间的传输和共享会造成IO延时,进而影响数据中心的总体性能。

同时,各家厂商不断推出新技术,新产品,容量不断扩展,性能不断提高,功能越来越丰富,但由于不同存储厂商的技术实现不尽相同,用户需要采用不同的管理界面来使用不同厂商的存储资源。

这样,也给用户业用户带来不小的问题,首先是无法采用统一的界面来让服务器使用不同厂商的存储服务器,数据在不同厂商存储服务器之间的迁移也会造成业务中断。

作为信息存储行业的领先公司,EMC公司针对用户跨数据中心信息传输和共享的迫切需求,推出存储VPlex解决方案,很好的解决了这些问题。

本文随后将介绍VPlex产品及其主要应用场景,供用户信息存储管理人士参考。

第一章.方案概述1.需求***计划建设两个数据中心,构成同城双生产系统,两中心之间距离不超过100公里;要求数据零丢失,系统切换时间小于5分钟;2.方案简介为了满足客户建设容灾系统的需求,我们设计了本地双活数据中心。

华为 双活数据中心解决方案

华为 双活数据中心解决方案

双活数据中心解决方案目录1.行业背景 (3)2.系统建设原则及思路 (3)3.技术方案 (5)双活数据中心基础架构设计 (5)双活数据中心网络设计 (6)双活数据中心系统设计 (6)双活数据中心系统优势 (9)浪擎CDP,最可靠的CDP (9)ACDP-恢复速度最快的CDP (10)ACDP-强大的复制,恢复.容错功能 (10)ACDP-支持报警和一键切换 (11)其他优势 (12)1.行业背景随着全球化信息技术的发展,信息化已经成为各个单位的关注热点,各行各业都在进行着信息化的改革。

信息化系统已经成为企业核心竞争力的关键条件之一。

企业信息化的时代也发生了翻天覆地的变化。

为适应我国改革开放和社会主义现代化建设的新形势对公安执法提出的新要求国家提出了以“公安信息化工作”为核心,以“科技强警”为目标的国家信息化工程—“金盾工程”的建设要求。

“金盾工程”既全国公安信息化工程,是国家电子政务建设“十二金”中重要的一部分,主要是利用现代化信息通信技术增强我国公安机关的统一指挥,快速反应,协同作战,打击罪犯的能力,以适应公安机关动态管理和打击罪犯的需要。

随着金盾工程在全国的展开信息技术的广泛应用,公安信息化建设全面加快各种业务系统的陆续建设投入使用产生了大量的数据。

随着业务数据的增加和应用数据的依赖性的增强,数据已经成为开展业务不可缺少的基础。

数据的有效汇集,集中管理,综合分析以及容灾备份的需要等处理要求日益提高。

因此,通过管理机制与技术手段相结合保障数据的一致性和业务的连续性在建设公安系统容灾机制中势在必行。

2.系统建设原则及思路1)绿色容灾,减少对生产系统的影响双活数据中心在实施和使用的过程中对原有的生产系统、硬件系统、网络系统会造成一定的影响,有的容灾系统可能需要在冻结原有的生产系统的情况下进行数据的复制;有的容灾系统可能要对硬件、网络环境进行改造,改造成系统所要求的条件;有的容灾系统对生产服务器的CPU、内存、网络等资源占用较大,这些影响或者改造对原有的系统和数据都存在一定的风险性。

双活解决方案

双活解决方案
2.网络设计
双活数据中心间通过专用网络连接,采用多路径、高带宽的网络架构,确保网络通信的稳定性和低延迟。网络设计包括:
-双向冗余网络连接,避免单点故障。
-虚拟路由器冗余协议(VRRP)实现网络设备的冗余。
-分布式拒绝服务(DDoS)防御措施,确保网络安全性。
3.存储设计
存储系统采用分布式存储技术,实现数据的冗余存储和实时复制。关键特性包括:
2.网络设计
双活数据中心之间采用高速专线连接,确保网络带宽满足业务需求。同时,采用虚拟私有云(VPC)技术,实现两个数据中心之间的内网互通。
3.存储设计
双活数据中心采用共享存储架构,通过存储复制技术(如SRDF、HyperMetro等)实现数据实时同步。此外,采用存储虚拟化技术,提高存储资源利用率,降低运维复杂度。
数据库系统采用双活配置,通过数据库镜像或复制技术,实现数据的实时同步。设计重点包括:
-数据库事务日志同步,保证数据一致性。
-自动故障恢复机制,减少人工干预。
6.应用设计
应用层采用微服务架构,服务间通过服务总线进行通信,提高系统的灵活性和可扩展性。设计要点包括:
-服务冗余部署,确保服务的高可用性。
-服务注册与发现机制,实现服务动态路由。
四、实施方案
1.硬件设备选型与采购:根据业务需求,选择合适的硬件设备,包括服务器、存储、网络设备等。
2.软件系统部署:在两个数据中心部署相同的软件系统,包括操作系统、数据库、中间件、应用系统等。
3.数据同步:配置存储复制和数据库镜像,实现双活数据中心之间的数据实时同步。
4.网络配置:配置双活数据中心之间的网络连接,确保内网互通,并设置防火墙、负载均衡等安全策略。
2.数据一致性需求:要求双活数据中心之间的数据实时同步,保证数据一致性和完整性。

双活数据中心解决方案

双活数据中心解决方案

双活数据中心解决方案双活数据中心是一种为了提高数据中心的可靠性和容错能力而采取的解决方案。

传统的单一数据中心往往会存在单点故障的问题,当数据中心发生故障时,会导致服务的中断,造成严重的损失。

而双活数据中心则通过将数据和服务分散在两个或多个数据中心中,从而实现数据和服务的高可用性和容错性。

下面将介绍双活数据中心解决方案的原理、技术和应用。

双活数据中心的原理是通过在不同地理位置建设两个相互独立的数据中心,每个数据中心都具备完整的数据和服务能力。

在正常情况下,数据和服务会在两个数据中心之间进行实时同步,用户可以通过任意一个数据中心访问数据和服务。

当一些数据中心发生故障时,系统会自动切换到另一个数据中心继续提供服务,从而实现了服务的高可用性和容错性。

为了实现双活数据中心解决方案,需要采取一系列的技术手段。

首先,需要使用高速网络来保证两个数据中心之间的实时数据同步。

常见的技术包括数据镜像、数据复制和数据同步等。

其次,需要使用负载均衡技术来处理用户的请求,将请求分发到两个数据中心中的任意一个。

常见的负载均衡技术包括DNS负载均衡、硬件负载均衡和软件负载均衡等。

最后,需要使用自动故障转移和故障恢复技术来处理数据中心的故障情况。

常见的技术包括故障切换、容灾备份和自动恢复等。

双活数据中心解决方案可以应用于各种场景。

首先,它可以应用于互联网服务提供商,以提供高可用性的互联网服务。

例如,电子商务平台可以使用双活数据中心来确保订单和支付数据的安全和可靠性。

其次,它可以应用于金融行业,以确保金融交易的可靠性和安全性。

例如,银行可以使用双活数据中心来实现跨地域的交易处理和结算。

第三,它可以应用于企业内部的数据中心,以提高企业内部系统的可用性和容错性。

例如,大型企业可以使用双活数据中心来部署企业资源计划(ERP)系统和客户关系管理(CRM)系统等。

总之,双活数据中心解决方案是一种提高数据中心可靠性和容错能力的有效方法。

通过将数据和服务分散在两个或多个数据中心中,并实现实时数据同步和自动故障转移,可以提供高可用性和容错性的数据中心服务。

双活数据中心方案对比_NetApp_MetroCluster_EMC_vplex_IBM_SVC_v1

双活数据中心方案对比_NetApp_MetroCluster_EMC_vplex_IBM_SVC_v1

NetApp Confidential - Internal Use Only
11
FibreBridge Fabric MetroCluster
FibreBridge connects to only 1 Switch (point-to-point mode). SAS shelves (via bridge) can be added to existing DS14FC Fabric MetroCluster Spindle limit: 840 applies to DS14FC. Total (DS14 + SAS) should not exceed platform limit
<=160 km
Building B
DWDM
Dark Fiber
DWDM
Aggregate X
No SPOFs – redundancy in all components and connectivity Dedicated pairs of FC switches
Aggregate Y
Aggregate X Mirror
FibreBridge Stretch MetroCluster
Each Controller connects to Every FibreBridge SAS shelves (via bridge) can be added to existing DS14 Stretch MetroCluster
• 重复数据删除技术帮助 MetroCluster解决方案节省成本 • 重复数据删除技术在源和镜像存储 系统都帮助节省成本 – 通过V系列的虚拟化技术也可以 为其他厂家的存储系统提供投资 保护和实现高效存储 • 客户可量化的容量节省*: – 平均节省25-30% – 虚拟化环境节省50-90%

华为双活数据中心解决方案

华为双活数据中心解决方案
RAID 2.0+
SmartMatrix 2.0
部件全冗余 器件优选
无中断升级 故障自愈
抗震
防腐蚀设计
大连医大附一院:全闪存双活架构,铸就医疗信息化“生命线”
来自客户的声音
华为公司此次帮助我院优化 HIS系统平台,在性能和可靠 性上取得了显著的效果,超出 了预期。我院期待与华为公司 在医院信息化建设上的进一步 合作。
2005年
2010年
2015年
华为开启数据中心双活2.0新时代
生产中心
传统建设
容灾中心
HIS/LIS/EMR/RIS
HIS/LIS/EMR/RIS
数据库集群
SAN
虚拟化资源池
SAN
生产中心
HIS/PACS
双活2.0
容灾中心
HIS/PACS
数据库集群 文件集群
业务按需 存取
双活资源池
ቤተ መጻሕፍቲ ባይዱ
OceanStor V3系列

自然灾害

单次发生的损失

如何有效应对故障和灾难对业务连续性带来的挑战---建设容灾系统
双活解决方案架构演进
主机双活
• 通过主机镜像软件实现,比 如LVM/Veritas等等
网关双活
• 通过虚拟化网关实现,比如华为VIS,EMC VPLEX, IBM SVC等等
阵列双活
• 通过阵列之间集群功能及镜像功能实现, 比如华为V3存储
switch
3、单存储故障,业 务访问另外一个中心 备份归档 存储
SAN/NAS主存
云平台 Oracle RAC集群
4、第一中心整体故障, 由第二中心全部接管
switch 双活跨数据中心集群

双活数据中心解决方案

双活数据中心解决方案

双活数据中心解决方案目录一、内容概括 (2)1.1 背景与挑战 (2)1.2 双活数据中心定义 (3)1.3 双活数据中心优势 (4)二、双活数据中心架构设计 (5)2.1 总体架构 (7)2.2 服务器与存储架构 (8)2.3 网络架构 (9)2.4 虚拟化技术应用 (11)三、双活数据中心实施步骤 (12)3.1 项目规划与准备 (14)3.2 硬件部署与配置 (15)3.3 软件安装与调试 (17)3.4 测试与验证 (18)四、双活数据中心运维管理 (19)4.1 运维流程 (20)4.2 监控与管理工具 (22)4.3 故障处理与恢复策略 (23)4.4 安全性与合规性保障 (24)五、双活数据中心案例分析 (26)5.1 国内外成功案例介绍 (28)5.2 案例分析 (28)六、双活数据中心发展趋势与展望 (30)6.1 新技术应用 (31)6.2 行业趋势分析 (32)6.3 未来发展方向 (34)七、总结与建议 (35)7.1 双活数据中心价值评估 (35)7.2 实施与推广建议 (37)一、内容概括本解决方案旨在解决企业在构建双活数据中心时所面临的一系列技术和管理问题。

该方案在结构上兼顾灵活性和安全性,注重提升数据中心间的协作能力和冗余性。

方案首先定义了双活数据中心的目标与要求,强调数据中心之间的实时数据同步、负载均衡以及故障切换机制的重要性。

详细介绍了双活数据中心的架构设计,包括网络架构、存储架构以及计算资源分配等关键方面。

本方案还涉及数据中心运维管理的优化措施,包括资源监控、故障预警与处置流程等。

本解决方案还讨论了如何确保数据安全性和合规性,包括数据加密、访问控制以及审计日志管理等。

本方案总结了实施过程中的关键步骤和潜在风险点,并提出了针对性的建议和解决方案,以帮助企业在实施双活数据中心过程中实现平稳过渡和提升运营效率。

1.1 背景与挑战随着云计算、大数据、物联网等技术的快速发展,企业业务需求呈现出多样化和实时性的特点,对数据中心提出了更高的要求。

双活数据中心解决方案

双活数据中心解决方案

双活数据中心解决方案双活数据中心解决方案介绍在现代的IT基础设施中,数据中心的高可用性和容灾能力是至关重要的。

为了确保业务的连续性和数据的安全性,双活数据中心解决方案应运而生。

双活数据中心解决方案是一种通过同时使用两个活动数据中心来实现高可用性和容灾的方法。

章节一:解决方案概述在这一章节中,我们将介绍双活数据中心解决方案的概念和目标。

我们将解释什么是双活数据中心,以及为什么它是重要的。

我们还将讨论在构建双活数据中心解决方案时需要考虑的一些关键因素,如网络连接、数据同步和故障切换等。

章节二:双活数据中心架构设计在这一章节中,我们将详细介绍双活数据中心解决方案的架构设计。

我们将讨论每个数据中心的组成部分,如服务器、存储设备、网络设备等。

我们还将讨论数据中心之间的连接方式以及数据同步的策略。

章节三:故障切换和容灾恢复在这一章节中,我们将讨论故障切换和容灾恢复的过程。

我们将介绍故障切换的触发条件,以及在发生故障时如何无缝地切换到备用数据中心。

我们还将讨论容灾恢复的策略,如数据恢复和业务恢复。

章节四:监控和管理在这一章节中,我们将介绍双活数据中心解决方案的监控和管理。

我们将讨论如何监控数据中心的性能和可用性,并提出相应的管理措施。

我们还将介绍一些常用的监控工具和技术。

章节五:安全性和合规性在这一章节中,我们将讨论双活数据中心解决方案的安全性和合规性。

我们将介绍一些常见的安全威胁和攻击,以及如何保护数据中心免受这些威胁的影响。

我们还将介绍一些合规性标准和法规,以及如何确保数据中心的合规性。

附件本文档涉及以下附件:1.双活数据中心网络架构示意图。

2.数据中心故障切换流程图。

3.监控和管理工具推荐列表。

法律名词及注释1.双活数据中心:通过同时使用两个活动数据中心来实现高可用性和容灾的解决方案。

2.高可用性:系统或服务能够在出现故障或停机情况下继续正常运行的能力。

3.容灾能力:在发生灾难性事件后能够尽快恢复业务运营的能力。

双活数据中心容灾解决方案

双活数据中心容灾解决方案

双活数据中心容灾解决方案为什么要讲双活数据中心?从应用系统和系统保护来说,分这么几个角度:首先做容灾,第一个要考虑的是主备,上图左侧是最早出现的主备模式,一般是在两个中心建互备系统,比如我在B中心,容灾系统在另外一个地方,这种模式比较容易切换。

假如A中心出问题了,就绑定在B中心,或者是把数据复制到B中心,容灾资源是闲置着,承担着容灾的任务。

另外真的出问题了,我得需要一个定位,因为并不能确认它是否确实不能用了,所以,要确保这个业务完整,数据也不丢,定的时间加上切换流程,至少得0.5小时,甚至更长,甚至一两天,这样导致弊端很多。

后来为了节约资源,发展到现在双中心互备,A中心一部分做生产,B中心也一部分做生产,在原来的储备方式上做了一个改进,优点是因为这两个中心都有生产业务运行,可通过资源共享技术节省资源。

但仅仅是计算源,对于存储来说,由于这个存储空间必须要保证完整来做,所以没有办法充分利用起来,还是闲置状态。

针对这种问题,我们现在又有了双活并行模式,同一个系统,两个中心都可以承担业务,同时对外服务,坏掉任何一方不影响。

这是非常理想的一种状态,今天主要讲的是要实现这种架构或部分实现,需要哪些技术,需要做哪些工作,只是简单的讲,不一定很深入,也希望能够和大家一起沟通交流,看有没有更好更优的方案。

我主要从应用到基础设施的角度来讲。

因为从整个应用架构来看,咱们有一些业务可能是有接入层,下面是应用逻辑,后面包括还有一些接口,再下面是数据层,再下面是基础架构,有可能有存储和网络,这么几层,每一层都会有相应的双活实现技术。

例如应用层可能有各种集群,数据层可能有一边同时可读写,或一边只能读等。

再如基础架构层,在网络上对稳定性和带宽吞吐性能要求更高,甚至需要打通跨中心的大二层网络,存储方面则需改变一主一备的读写机制,实现同时可读写。

下面从这五个方面展开谈,一个是数据层,二是存储层,三是接入/应用层,四是虚拟化/云平台;五是技术关键点。

EMC Vplex双活数据解决方案

EMC Vplex双活数据解决方案

EMC Vplex双活数据解决方案一、方案目标本方案采用以EMC VPLEX技术为核心的双活虚拟化数据中心解决方案。

EMC VPLEX 产品能够打破数据中心间的物理壁垒,提供不同站点间对同一数据副本的共享、访问及在线移动的能力,结合VMware虚拟化技术及Cisco OTV网络扩展技术,能够实现业务及数据在站点间的透明在线移动,使用户能够在两个站点间动态平衡业务负载,最大限度利用资源,并提供接近于零RTO的高可用能力,是真正意义上的云计算基础架构。

二、方案架构EMC VPLEX双活虚拟数据中心解决方案的构成与功能如下图所示:1)基于EMC VPLEX Metro提供双活虚拟化数据中心解决方案核心功能:2)基于Cisco提供的OTV(Overlay Transport Virtualization)L2 网络延伸技术,从网络层面为虚机在线透明迁移提供条件,及最小化的RTO指标;3)基于VMware虚拟化技术、EMC VPLEX Metro、以及Cisco OTV技术三者的合力实现双活虚拟数据中心4)基于EMC Avamar为双活虚拟数据中心提供完善的数据备份保护5)基于EMC Ionix ITOI(IT Operations Intelligence)产品实现虚拟数据中心的全面集中监控管理三、方案功能3.1 EMC VPLEX方案功能EMC VPLEX 引入了一种新的体系结构,它吸收了 EMC 在 20 年设计、实施和完善企业级智能缓存和分布式数据保护解决方案的实践中取得的经验和教训。

以可扩展、高可用的处理器引擎为基础,EMC VPLEX 系列设计为可从小型配置无缝扩展到中型和大型配置。

VPLEX介于在服务器和异构存储之间,使用独特的群集体系结构,该体系结构允许多个数据中心的服务器具有对共享块存储设备的读/写访问权限。

新体系结构的独特特征包括:- 横向扩展群集硬件,允许您从小配置开始并以可预知的服务级别逐步扩展- 高级数据缓存,它利用大规模 SDRAM 缓存提高性能并减少 I/O 延迟和阵列争用- 分布式缓存吻合性,可跨整个群集自动执行 I/O 的共享、平衡和故障切换- 一个统一视图显示跨 VPLEX 群集的一个或多个 LUN(这些群集可以是在同一数据中心内相距几英尺,也可以是跨同步距离),从而实现新的高可用性和工作负载移置模式。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

EMC数据中心容灾系统建设方案建议书EMC电脑系统(中国)有限公司Version 1.0,2014/10前言信息是用户的命脉, 近十年来信息存储基础设施的建设在用户取得长足的进步。

从内置存储转向外置RAID存储,从多台服务器共享一台外置RAID阵列,再到更多台服务器通过SAN共享更大型存储服务器。

存储服务器容量不断扩大的同时,其功能也不断增强,从提供硬件级RAID保护到独立于服务器的跨磁盘阵列的数据镜像,存储服务器逐渐从服务器外设的角色脱离出来,成为单独的“存储层”,为数据中心的服务器提供统一的数据存储,保护和共享服务。

随着用户业务的不断发展,对IT系统尤其是存储系统的要求越来越高,鉴于用户业务由于信息的重要性,要求各地各用户多中心来预防单一数据中心操作性风险。

多数据中心建设方案可以预防单数据中心的风险,但面对多数据中心建设的巨额投资,如何同时利用多数据中心就成为IT决策者的首要问题。

同时利用多数据中心就必需实现生产数据跨中心的传输和共享,总所周知,服务器性能的瓶颈主要在IO部分,数据在不同中心之间的传输和共享会造成IO延时,进而影响数据中心的总体性能。

同时,各家厂商不断推出新技术,新产品,容量不断扩展,性能不断提高,功能越来越丰富,但由于不同存储厂商的技术实现不尽相同,用户需要采用不同的管理界面来使用不同厂商的存储资源。

这样,也给用户业用户带来不小的问题,首先是无法采用统一的界面来让服务器使用不同厂商的存储服务器,数据在不同厂商存储服务器之间的迁移也会造成业务中断。

作为信息存储行业的领先公司,EMC公司针对用户跨数据中心信息传输和共享的迫切需求,推出存储VPlex解决方案,很好的解决了这些问题。

本文随后将介绍VPlex产品及其主要应用场景,供用户信息存储管理人士参考。

第一章.方案概述1.需求***计划建设两个数据中心,构成同城双生产系统,两中心之间距离不超过100公里;要求数据零丢失,系统切换时间小于5分钟;2.方案简介为了满足客户建设容灾系统的需求,我们设计了本地双活数据中心。

整体架构如下:上图是双活数据中心总体框架,包括双活存储系统、双活数据库系统、双活应用系统和双活网络系统。

我们将利用存储双活技术和主机集群技术实现数据库系统的双活,利用负载均衡设备实现应用系统在两个数据中心内的负载均衡,利用动态域名确保两个数据中心的网络双活。

双活数据中心可以实现业务系统同时在两个节点同时工作,达到负载均衡的目的。

当生产节点出现故障时,业务系统还能够在第二生产节点上正常工作,实现业务零切换。

第二章.双活数据中心架构设计通过对***具体需求的分析,我们建议客户采用双活数据中心架构设计。

1.数据库系统双活架构设计在这个架构中,存储层除了采用EMC VNX存储系统或者其他厂商存储系统(第三方主流存储系统见EMC Vplex兼容性列表)外,还引进了EMC全新一代数据整合系统VPLEX,由VPLEX实现存储系统高可靠性和同城范围内数据高效共享。

1.1本地存储高可靠性保证在本方案中,首先我们要满足客户对生产中心存储系统高可靠性的需求。

目前的IT系统架构中,从应用服务器、数据库服务器到网络等各个部分都已经提供了高可靠性的设计,唯独存储系统很少有高可靠性方案的设计,这主要基于两个原因:●存储系统自身已经有高可靠性设计,控制器、电源、链路等都是冗余设计,可靠性较高,一般情况下很少会发生整体故障,导致数据不可访问。

●没有非常合适的技术来实现存储系统的高可靠性保证现在EMC推出了全新架构的数据整合解决方案——VPLEX,VPLEX首先实现了本地存储系统的整合及高可靠性设计,而且是硬件级别的解决方案。

在本项目中,生产中心VPLEX首先将两台EMC DMX3/4(仅以DMX存储为例说明,下同)整合在一起,实现存储级别的HA系统。

如下图显示:1)在两台DMX3/4中分别划出两个LUN,LUN-A和LUN-B●LUN大小一样●RAID的保护方式一样●为了保证性能所分布的硬盘类型和数量最好也一样将这两个LUN同时映射给VPLEX(通过图中虚线链路),VPLEX可以将这些LUN进行再次RAID保护,目前VPLEX支持的RAID保护级别为:●RAID 0●RAID 1●分布式RAID 1在实现本地存储HA系统时,使用RAID 1保护方式,形成一个虚拟LUN (V-LUN)。

2)VPLEX通过光纤链路(图中实线链路)将V-LUN分配给主机,主机可以进行读写操作3)当主机向V-LUN写入I/O时,先写入V-LUN,然后再继续写入到两台DMX3/4存储系统中4)当其中一台存储设备发生故障,整个存储系统能够继续工作,主机访问存储不会受到任何影响1.2双活数据中心数据保护本次项目客户要求首先实现本地存储高可靠性保护外,还需要实现双活数据中心,既两个数据中心的业务同时运行,任何一个数据中心出现问题,业务都会继续运行。

1.2.1通过VPLEX进行数据读写首先在第二生产节点上,DMX3/4存储系统给VPLEX 分配一个LUN,VPELX 产生一个V-LUN。

如下图显示:其次,通过两个节点的VPLEX产生一个分布式虚拟LUN,采用分布式RAID 1保护。

如下图显示:两个节点的主机都能够访问到这个虚拟LUN,两节点的主机都能够同时访问这个分布式虚拟LUN。

由于我们提供的是双活数据中心,两个节点中的数据要实时一致,所以在写入数据时,要确保数据被同时写入到两个节点中,这样才能保证数据两节点之间的数据一致性。

如下图所示:1)在生产节点的主机产生I/O;2)向VPLEX写入I/O, I/O通过VPLEX之间的光纤链路发送到第二生产节点的VPLEX上,3)I/O同时写入到两个节点中的DMX3/4存储系统中;4)第二生产节点的VPLEX向生产节点VPLEX发出写I/O完成的确认信息(ACK);1.2.2通过VPLEX进行数据读取EMC VPLEX是一个集群系统提供分布式缓存一致性保证,能够将两个或多个VPLEX的缓存进行统一管理,从而使主机访问到一个整体的缓存系统。

当主机向VPLEX的摸一个缓存区域写I/O时,VPLEX缓存将锁定这个缓存区域,同一时刻其他主机是无法向这个缓存区域写入I/O的。

但是,当主机读取I/O时,VPLEX 缓存允许多个主机访问一个缓存区域,尤其是主机访问其他VPLEX集群中其他VPLEX所管理的数据时,统一个缓存管理会将这个I/O的具体位置告知主机,主机直接访问。

如下图显示:1.2.3主机故障切换我们将1个RAC的集群中的两台主机分别放置在生产和第二生产节点上,这两台主机形成一个跨数据中心的集群系统,如图中RAC1-1和RAC1-2,RAC2-1和RAC2-2。

这种设置保证了正常情况下,两节点的主机同时工作;一旦其中一个节点的主机出现故障,业务会无缝的被另外一个节点的主机所接管。

此时,RAC 的心跳线需要通过网络来进行连接。

1.2.4存储故障切换主机故障切换由RAC集群保证,存储系统故障切换则由EMC VPLEX保证。

●EMC VPLEX中设计了一个重要的部件——VPLEX WitnessWitness安装在客户提供的VMware ESX Server 上运行的虚拟机,Witness 最好与两个VPLEX 集群不在同一地点,但是考虑到实际情况,也可以将Witness 放置在生产节点。

VPLEX Witness 使用IP 连接监视两个VPLEX 群集之间的系统“心跳”信号。

通过监视这些心跳信号,VPLEX Witness 可以区分站点故障和站点分区。

VPLEX Witness 让应用程序能够承受任何存储故障的影响,包括同时影响整个存储设备机架的故障。

VPLEX Witness 与服务器群集软件和AccessAnywhere 相结合,形成了一套端到端的解决方案,允许在服务器出现故障时自动重启。

对于双活数据中心的部署,VPLEX Witness 能为客户提供具有零恢复点目标(RTO) 的高可用性解决方案。

●由于在生产节点已经通过VPLEX实现存储的HA,所以一个存储系统出现故障,不会影响到整个系统的正常运行。

如图所示:●第二生产节点存储系统出现故障,不会影响到整个系统的正常运行。

如图所示:●VPLEX系统故障VPLEX系统自身是全冗余设计,可用性能够达到99.999%,但是为了防止VPLEX自身出现故障,VPLEX自身有一整套放置系统故障的处理流程,在这个过程中就要结合上面我们提到的Witness。

如下图所示:上图中,①—⑦种情况中,业务正常工作;⑧—⑩种情况中,业务暂停,需要少量人工干预将业务恢复,时间不会超过10分钟。

1.2.5生产节点发生灾难如果生产节点发生灾难,则所有业务要切换至第二生产节点,其过程如上图所示情况⑨,需要少量人工干预,在这种情况下人工干预是指将V-2暂时中断的工作重新启动,主机能够重新访问存储系统,最终业务恢复。

1.2.6生产节点恢复生产节点修复后,需要重新将生产节点和第二生产节点的VPLEX关联起来。

在VPLEX上重新通过两个节点的VPLEX产生一个分布式虚拟LUN,采用分布式RAID 1保护,此时业务可以正常运行,第二生产节点与生产节点之间的数据在后台进行复制,直到两边数据一致。

在这个过程中,我们还需要将VPLEX的Witness修复,在其中定义生产节点为主节点。

2.网络系统架构设计2.1互联网接入部分该部分内容EMC只是根据其他用户的经验提供一些建议,具体设计与实施还需要专业的网络系统厂商或集成商提供。

建议两个生产分别租用两条互联网出口线路,一条联通线路,一条电信线路。

在每条线路出口处,分别透明部署一台智能抗攻击设备,用以抵挡来自互联网的Dos/DDos等攻击,保护内部用户和服务器的安全。

在两台抗攻击设备后,分别部署两台链路负载均衡设备,用来实现多广域网线路选路和冗余备份,使用户可以通过最快线路访问***业务系统,加快了数据中心访问速度。

同时,当任何一条线路故障,用户依然可以通过另一条广域网线路访问数据中心服务器,提高了数据中心的可靠性。

链路负载均衡设备可实现多条internet接入链路的负载均衡,可以同时实现outbound流量和inbound流量双向的负载均衡。

链路负载均衡设备会通过多种方式检测两条链路的健康状况,一旦发现其中一条链路故障,会立即将所有用户流量定向至其它可用链路,从而实现Internet 连接的高可用性。

主要的方法有:为了确保ISP链路的畅通,链路负载均衡设备将采用Ping的方法,不仅仅检查和其相连的路由器的端口是否可达,还可以检查该链路后续路由节点的连通性(10跳),已确保整个路径的畅通。

针对所有的网络环境(包括禁止ICMP的ISP),链路负载均衡设备提供了丰富的4~7层检查方式,并可以通过多种检查结果的“与”和“或”运算结果,最终准确判断链路的健康状况。

相关文档
最新文档