存储级数据容灾方案模板教材
存储整合和容灾方案建议书.doc
存储整合和容灾方案建议书1XX厅存储整合和容灾方案建议目录1 用户现状和需求分析(3)2 方案(4)2.1用户数据类型分析和所适合的存储架构分析(4)2.2数据集中存储平台架构概述(5)2.3NAS网络实现分析(6)2.4集中数据保护平台和流程概述(6)2.4.1 利用Netapp技术实现数据保护概述(7)2.4.2 利用第三方集中备份管理软件实现数据保护概述(8) 2.5图片文件上带归档概述(10)2.6数据容灾保护概述(11)2.6.1 中间链路选择和容灾架构描述(12)2.6.2 数据复制方式的选择(14)2.6.3 容灾机房磁盘阵列的选择和配置建议(15)2.6.4 容灾平台的扩展考虑(15)2.6.5 容灾数据的利用考虑(16)2.7集中存储平台的性能保证(16)2.8数据访问安全性的保证(17)2.9集中存储平台扩展性保证(19)2.9.1 网络访问协议的扩展支持(19)2.9.2 性能和容量的扩展支持(19)2.9.3 Netapp存储系统的无缝在线升级能力(20)2.10管理和使用简便性保证(20)1用户现状和需求分析XX厅目前整个业务系统在存储系统上采用了分散存储的架构,即各个应用系统都采用主机自带的磁盘来存储各自的业务数据,这种数据分散存储的架构在数据管理、数据保护上都给用户带来了不小的困难,导致数据管理复杂,数据保护不到位的情况。
另外,这种数据分散存储的架构,也导致了存储资源无法很好的实现共享,最终导致存储资源浪费比较严重。
随着XX厅各类业务系统的发展,上面说述的架构越来越没法满足用户的需求,同时其所导致的各类矛盾和问题也越来越严重,因此用户希望通过本项目的建设,在新的IT架构中实现如下的目的:实现业务数据的集中存储:搭建一个数据的集中存储平台用来整合整个业务系统的所有业务数据,在实现数据集中存储的情况下,实现数据的集中管理,简化管理流程节约管理成本。
同时在数据集中存储的基础上,实现一个数据集中保护平台和流程,加强对业务数据的保护力度;实现数据的容灾保护:利用XX厅现有的机房环境(目前用户在不同楼层搭建了两个独立的机房)实现不同楼层两个机房之间的数据容灾保护,并且所采用的容灾技术必须具备良好的扩展性,以便于在以后需要的时候,可以把该容灾架构非常方便的拓展到更远距离的容灾保护(如同城容灾或异地容灾);大量小文件的归档上带:根据用户需求,需要每个月实现对大量小文件的归档上带,考虑到目前的文件数已经接近1000万,并且文件数量还会随着业务的发展快速增长,因此必须提供一个很好的方法来实现这大量小文件的快速归档上带2方案2.1用户数据类型分析和所适合的存储架构分析考虑到用户的业务系统所涉及的数据,从数据的类型来分析,主要可以分为如下几类数据:结构化数据:主要指那些基于数据库系统来实现数据存储和访问的数据(不论该数据库系统采用文件方式或裸设备方式来建库)非结构化数据:主要是指那些直接利用文件系统来存储和访问的文件,如用户目前所具有的大量的小图片文件半结构化数据:如一些邮件系统或办公自动化系统所相关的业务数据针对这些不同类型的业务数据,本方案建议采用不同的存储架构来支持对这些不同类型业务数据的存储和访问:对于结构化和半结构化数据:考虑到目前用户的应用平台基本上都采用Windows平台,因此建议用户采用SAN架构来支持对这些类型的业务数据的存储和访问,这样就能充分发挥SAN 架构的高性能和高稳定性,从而保证这些数据所对应的应用系统的高效稳定运行。
数据存储与容灾课件模块八数据容灾与应用
• 方案2: 区域网数据容灾+交互式数据备份。
两幢大楼相互作为容灾点,并且采用相互式数据备份,就是在两幢
大楼各设立一台备份服务器来管理两个大楼内部及大楼之间的数据 备份并且两台备份服务器相互备份,以保证当一台备份服务器出现 故障,另一台备份服务器能接管其所有的备份任务。
• 方案3: 远程交互式数据备份或远程集中式数据备份。
EMC 认证专家
30
IP SAN 容灾及备份方案
EMC 认证专家
31
方案描述
• 方案1: 区域网数据容灾+集中式数据备份。
由两部分组成: 其一,两幢大楼相互作为容灾点,以保证某一服务
器或某一大楼出现故障或自然灾害时容灾点数据接替其任务继续工 作,从而保证业务的不间断进行; 其二,系统还将采用集中式数据 备份,即采用一台备份服务器来集中管理两个大楼内部及大楼之间 的数据备份。
(1) 强大的一级灾难抗御能力。 (2) 有效防止物理设备损伤产生的灾难后果。 (3) 提供99.9999%的安全机制。 (4) 实时数据复制提供强大的数据交换能力
EMC 认证专家
3
容灾技术的分类
• 容灾,
是在数据容灾的基础上,在异地建立一套完整的与本地生产系
统相当的备份应用系统(可以是互为备份)
2019/4/15© Copyright SEI ECNU . All Rights Reserved.
19
19
• 图8 5点对点城域以太网设计
EMC 认证专家
Author: NK Jiang
2019/4/15© Copyright SEI ECNU . All Rights Reserved.
20
• 广域网体系的远程故障切换机制的流程(软件方式)如下。
(完整版)存储级数据容灾方案
1.用户现状与需求1.1.用户IT系统现状用户现有系统包括数据库、应用、WEB、邮件等系统,虽然是双机架构,但是其稳定性和可靠性都没有达到核心系统应该具备的标准,而且直连的存储架构对于性能和管理型都有一定的局限性。
业务数据是企业业务的生命线,如何保护好计算机系统里存储的数据,保证系统稳定可靠地运行,并为业务系统提供快捷可靠的访问,是系统建设中最重要的问题之一。
为了保护业务系统的关键业务数据,我们必须对这些数据进行有效的备份,并支持快速恢复。
通过备份的方式将文件、数据库等重要数据做一个副本,只能在本地建立数据保护。
但因意外(如火灾、地震等)停止工作时,随之而来的损失更是不可估量,为避免类似风险的存在,就需要建立异地容灾系统,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作,保证业务稳定运行。
1.2.用户需求1.2.1.建设目标从容灾的级别来说,可以规划数据级容灾和应用级容灾,根据业务种类多,业务方式多样化的特点,仅建设一个数据级容灾是不够,容灾发生时,业务快速的恢复是容灾系统的一大需求。
应用级容灾是建立在数据级容灾的基础上,在容灾切换时,除了切换核心的数据库数据外,还包含了IP地址切换(按客户需要选择),中间件服务,用户级业务。
应用级容灾从流程上实现了全业务的连续性需求。
从我们的灾难系统建设经验出发,xxx有限公司可以考虑以下业务连续性计划目标:RPO(最大允许数据丢失时间):零数据丢失RTO(最大允许宕机时间):30分钟应用级容灾需求1.2.2.需求分析用户需要保障数据的长期安全可靠的,数据对于灾难的安全性和可恢复性:灾难切换时间要求灾难系统切换时间不超过30分钟,最好在10分钟内实现。
多种灾难切换方式提供自动灾难系统切换和手动灾难切换方式计划内维护要求提供计划内维护支持能力,计划内维护切换时间不多于10分钟数据丢失性要求原则上要求零数据丢失,可以依据情况进行调整数据同步方式提供同步和异步两种方式备份和灾难备份方式采用物理备份方式实现物理部件失败要求支持部分磁盘,文件系统,主机,磁盘柜等各种物理部件失败导致的失败保护。
数据容灾方案范文
数据容灾方案范文数据容灾方案是组织或企业在面临硬件故障、网络中断、自然灾害等情况下保护数据安全和可用性的一种紧急处理措施。
数据容灾方案是建立在数据备份和恢复的基础上,通过多重手段保障数据的完整性、可靠性和可用性,以最小化数据丢失和中断时间。
下面是一个1200字以上的数据容灾方案。
一、需求分析在制定数据容灾方案之前,首先需要对组织或企业的数据需求进行分析,包括以下几个方面:1.数据的重要性和敏感性:确定哪些数据是组织或企业最重要的,哪些是次要的,哪些是不需要长期备份的。
2.数据的容量和增长:了解目前数据的总量和增长趋势,以确保容灾方案能够满足现有和未来的数据需求。
3.数据的时效性:确定数据的时效要求,即数据需要在多长时间内恢复到可用状态。
二、备份策略数据备份是数据容灾方案的核心,通过定期备份数据,可以保证在数据丢失或损坏时能够及时恢复。
备份策略应包括以下几个要素:1.定期备份:根据需求分析中确定的数据增长率和时效要求,制定定期备份的频率,可以是每天、每周或每月进行一次备份。
2.多重备份:将数据备份到不同的媒介上,如硬盘、磁带、云存储等,以防止单点故障。
3.增量备份:只备份发生变化的数据,以减少备份时间和存储空间。
4.保留备份:根据需求保留一定时间的备份,以便在需要时进行恢复。
三、数据同步和复制数据同步和复制是保证数据容灾的关键,通过将数据复制到不同的存储设备或地理位置上,可以防止数据在单一地点丢失或损坏。
数据同步和复制应包括以下几个方面:1.远程复制:将数据备份到远程地点,通常是另一个数据中心或云存储服务提供商,以保证数据在本地发生灾难时能够快速恢复。
2.实时同步:将数据实时同步到远程地点,以确保远程备份始终是最新的。
3.异地复制:将数据备份到地理上分离的位置,以防止区域性自然灾害对数据的破坏。
四、容灾设施和设备在制定数据容灾方案时,需要考虑搭建相应的容灾设施和配置适当的设备,以确保容灾方案的可行性和可靠性。
存储灾备方案
存储灾备方案关键信息项:1、灾备方案的目标和范围业务连续性要求:____________________________数据保护级别:____________________________涵盖的系统和应用:____________________________2、灾备技术和策略备份方法(全量、增量等):____________________________存储介质和设备:____________________________数据恢复点目标(RPO):____________________________数据恢复时间目标(RTO):____________________________ 3、灾备设施和资源灾备数据中心位置:____________________________网络连接和带宽:____________________________服务器和存储配置:____________________________4、测试和演练计划定期测试频率:____________________________演练场景和范围:____________________________测试结果评估和改进流程:____________________________5、责任和角色灾备团队成员职责:____________________________供应商责任:____________________________6、成本和预算初始投资预算:____________________________运营和维护成本:____________________________7、法律和合规要求数据隐私法规遵循:____________________________行业标准和认证:____________________________1、引言11 本协议旨在确立存储灾备的全面方案,以确保在面临灾难或突发事件时,关键业务数据和系统能够及时恢复,保障业务的连续性和稳定性。
ibm存储容灾方案v.03
存储容灾解决方案目录1.1信息系统现状 (3)1.1.1存储系统现状 (3)1.1.2备份系统现状 (4)1.1.3没有一套完善的容灾保护机制 (6)1.2信息中心存储系统建设需求分析 (7)1.2.1存储系统要求 (7)1.3信息中心智能保护系统建设需求分析 (10)1.3.1智能保护系统设备要求 (10)1.4集中存储备份智能保护的建设目标 (11)二、系统建设方案 (12)第一期规划 (12)2.1存储系统总体设计 (12)2.1.1方案总述 (12)2.1.2方案拓扑示意图 (13)2.1.3方案关键优势 (13)2.1.4方案配置 (14)2.1.5存储系统建设所能达到的效果 (15)第二期规划 (15)2.2虚拟化系统总体设计 (15) (15)2.3.1方案拓扑示意图 (16)2.3.2方案关键优势。
(16)2.3.3虚拟化系统建设所能达到的效果 (17)2.3.4VMware服务器虚拟化方案设计 (19)一、概述1.1信息系统现状1.1.1存储系统现状目前业务系统主要应用系统有文件服务器(windows)、应用服务器(windows)、邮件服务器(windows)、防病毒服务器(windows)、HR服务器(windows)和ERP服务器(SUN小机)。
目前应用系统均运行在独立的服务器中,一方面服务器本身容量空间有限,随着业务数据的不断增长,空间已基本饱和,另一方面数据安全性没有保障,服务器故障将面临整个业务系统数据丢失(单台服务器故障,怎么会造成整个数据丢失)。
应用系统的高性能存储空间及数据保护工作是信息中心最为重视的现有存储系统情况统计:(表格把客户目前服务型号及硬盘分布要写的详细些,表格我会提供)从上表情况来看,所有业务系统的数据都存放在本地硬盘上,本地硬盘存储具有如下缺陷:✓单硬盘或者原始RAID方式,故障率高,安全性低。
✓性能低下,影响应用主机性能。
✓磁盘容量性能扩展性差。
存储级数据容灾方案模板资料
1.用户现状与需求1.1.用户IT系统现状用户现有系统包括数据库、应用、WEB、邮件等系统,虽然是双机架构,但是其稳定性和可靠性都没有达到核心系统应该具备的标准,而且直连的存储架构对于性能和管理型都有一定的局限性。
业务数据是企业业务的生命线,如何保护好计算机系统里存储的数据,保证系统稳定可靠地运行,并为业务系统提供快捷可靠的访问,是系统建设中最重要的问题之一。
为了保护业务系统的关键业务数据,我们必须对这些数据进行有效的备份,并支持快速恢复。
通过备份的方式将文件、数据库等重要数据做一个副本,只能在本地建立数据保护。
但因意外(如火灾、地震等)停止工作时,随之而来的损失更是不可估量,为避免类似风险的存在,就需要建立异地容灾系统,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作,保证业务稳定运行。
1.2.用户需求1.2.1.建设目标从容灾的级别来说,可以规划数据级容灾和应用级容灾,根据业务种类多,业务方式多样化的特点,仅建设一个数据级容灾是不够,容灾发生时,业务快速的恢复是容灾系统的一大需求。
应用级容灾是建立在数据级容灾的基础上,在容灾切换时,除了切换核心的数据库数据外,还包含了IP地址切换(按客户需要选择),中间件服务,用户级业务。
应用级容灾从流程上实现了全业务的连续性需求。
从我们的灾难系统建设经验出发,xxx有限公司可以考虑以下业务连续性计划目标:RPO(最大允许数据丢失时间):零数据丢失RTO(最大允许宕机时间):30分钟应用级容灾需求1.2.2.需求分析用户需要保障数据的长期安全可靠的,数据对于灾难的安全性和可恢复性:灾难切换时间要求灾难系统切换时间不超过30分钟,最好在10分钟内实现。
多种灾难切换方式提供自动灾难系统切换和手动灾难切换方式计划内维护要求提供计划内维护支持能力,计划内维护切换时间不多于10分钟数据丢失性要求原则上要求零数据丢失,可以依据情况进行调整数据同步方式提供同步和异步两种方式备份和灾难备份方式采用物理备份方式实现物理部件失败要求支持部分磁盘,文件系统,主机,磁盘柜等各种物理部件失败导致的失败保护。
存储容灾备份技术课程
备份的类型
全备份
Sun. Mon. Tue. Wed. Thu. Fri. Sat. Sun.
• 每天全备份 • 易于管理
差异备份
Sun. Mon. Tue. Wed. Thu. Fri. Sat. Sun.
• 每周一天全备份 • 本周其余每天备份和全备份
的差异部分
增量备份
Sun. Mon. Tue. Wed. Thu. Fri. Sat. Sun.
Disk Storage
Tape Library
备份数据通过SAN传送,对L AN的带宽无影响
需要占用服务器资源
Disk Storage
Tape Library
备份数据直接存入备份存储 对LAN及服务器均无影响 成本高,兼容性低
网络备份
• 网络备份的问题
这种基于LAN的备份解决方案将强制备份数据通过LAN 进行传输,因此在备份过程中网络就会超负荷。
– 逻辑损坏比物理损坏更为严重,因为逻辑损坏 不易被发现,潜伏期长,当发现数据有错误时 可能已经无法挽回
数据失效分析
病毒和自然灾 害 其它 15% 5%
• 硬件故障和软件错误可以 靠硬件冗余来解决
• 而病毒、错误操作等灾难
硬件故障或软 件错误
必须靠备份来解决
50%
错误操作 30%
为什么要搭建备份系统?
• 数据恢复时间
– 即在出现灾难的时候,我们能够多快地恢复全 部数据,重新开始正常的业务。
关系-备份窗口/备份时间
备份窗口
备份时间 备份窗口大于备份时间
备份窗口
备份时间
增量备份
备份窗口小于备份时间
日志备份
使用快速备份设备
存储数据容灾技术及解决方案精选
浪潮存储数据容灾技术及解决方案精选随着计算机信息系统的不断发展,用户的核心业务越来越依赖于信息系统的可靠运行,信息系统中的关键业务数据已经成为用户最为重要的资产。
据统计数字表明,美国在2000年以前的10年间,发生过灾难的公司中,有55%当时倒闭,剩下的45%中,因为数据丢失,有29%也在两年之内倒闭,生存下来的仅占16%。
因此对大型关键企业的业务应用系统的连续性运行是企业的关键,是企业的命脉。
此次,“5.12汶川大地震”对当地信息化建设的灾难性摧毁,也向我们敲醒了警钟,在信息化社会中,对数据安全的保护刻不容缓。
要保证数据的安全和高可靠性,就需要建设一个对各种情况都可以抵御或者化解的本地和异地的容灾系统。
容灾系统的核心就在于将灾难化解,一是保证企业数据的安全,二是保证业务的连续性。
数据的安全需要保证用户数据的完整性、可靠性和一致性。
数据安全是容灾系统的基础,也是容灾系统能够正常工作的保障;业务连续性是容灾系统的建设目标,它必须建立在可靠的数据备份的基础上,通过应用系统、网络系统等各种资源之间的良好协调来实现。
目前市场上有多种成熟的容灾技术可以选择,这些容灾技术最主要的技术差异在于数据复制的发起平台和接受平台。
根据这些平台的不同,可以分为:基于主机的复制技术、基于磁盘阵列的复制技术、基于智能SAN 虚拟存储设备复制技术和基于虚拟带库系统的复制技术。
一、基于主机复制技术基于主机复制技术,简单地说,就是通过安装在服务器的数据复制软件,或是应用程序提供的数据复制、灾难恢复工具(如数据库的相关工具),利用TCP/IP网络连接远端的容备服务器,实现异地数据复制。
所需的成本较低,用户不需更换太多现有的系统架构,也不用担心后端存储系统的兼容性问题,只需支付软件的授权费和灾备端的硬件设备费用即可。
如果是在服务器数量较多的环境下,管理上的复杂程度就会增加,整体的投入成本也会增加。
它的另一个缺点是软件安装在应用程序主机上,运行时会消耗主机的运行资源,如果硬件的等级不高,就可能给应用程序带来影响。
数据库容灾系统方案
1.1 容灾系统1.1.1 容灾系统简介业务连续性和灾难恢复是大多数大型应用系统最先考虑的问题。
监测数据和内容的快速变化,意味着应用系统必须在一个24×7的环境中运营,并且必须能够迅速、高效地处理难以预见的业务系统中断。
由于至关重要且相互依存的业务事务越来越容易受到业务系统中断和停机时间的损害,因此变得更为紧要。
影响业务的停机时间可能是计划的或计划外的。
计划外停机时间可能是由硬件或系统故障、数据/存储故障、人为错误、计算机病毒、软件故障、自然灾害或恶意行为引起的。
某项业务可能还要不得不承受因计划维护(如系统升级)而造成的计划停机时间。
而灾备系统是当今保护核心资产(数据)的最有效解决方案,它能够使数据在24×7的基础上可用,而无论是否发生灾难或其他中断。
本结将讨论灾难备份及恢复技术,并说明它如何成为业务连续性基础架构中的一个关键因素。
目前,针对Oracle数据库的远程复制、容灾主要有以下几种技术或解决方案:1)基于存储层的容灾复制方案这种技术的复制机制是通过基于SAN的存储局域网进行复制,复制针对每个IO进行,复制的数据量比较大;系统可以实现数据的同步或异步两种方式的复制。
对大数据量的系统来说有很大的优势(每天日志量在60G以上),但是对主机、操作系统、数据库版本等要求一致,且对络环境的要求比较高。
目标系统不需要有主机,只要有存储设备就可以,如果需要目标系统可读,需要额外的配置和设备,投资较高。
2)基于逻辑卷的容灾复制方案这种技术的机制是通过基于TCP/IP的网络环境进行复制,由操作系统进程捕捉逻辑卷的变化进行复制。
其特点与基于存储设备的复制方案比较类似,也可以选择同步或异步两种方式,对主机的软、硬件环境的一致性要求也比较高,对大数据量的应用比较有优势。
其目标系统如果要实现可读,需要创建第三方镜像。
这种技术和上面提到的基于存储的复制技术相比较适合于超大数据量的系统,或者是应用系统的容灾复制。
分布式存储系统设计方案——备份容灾(五篇模版)
分布式存储系统设计方案——备份容灾(五篇模版)第一篇:分布式存储系统设计方案——备份容灾分布式存储系统设计方案——备份容灾在分布式存储系统中,系统可用性是最重要的指标之一,需要保证在机器发生故障时,系统可用性不受影响,为了做到这点,数据就需要保存多个副本,并且多个副本要分布在不同的机器上,只要多个副本的数据是一致的,在机器故障引起某些副本失效时,其它副本仍然能提供服务。
本文主要介绍数据备份的方式,以及如何保证多个数据副本的一致性,在系统出现机器或网络故障时,如何保持系统的高可用性。
数据备份数据备份是指存储数据的多个副本,备份方式可以分为热备和冷备,热备是指直接提供服务的备副本,或者在主副本失效时能立即提供服务的备副本,冷备是用于恢复数据的副本,一般通过Dump的方式生成。
数据热备按副本的分布方式可分为同构系统和异步系统。
同构系统是把存储节点分成若干组,每组节点存储相同的数据,其中一个主节点,其他为备节点;异构系统是把数据划分成很多分片,每个分片的多个副本分布在不同的存储节点,存储节点之间是异构的,即每个节点存储的数据分片集合都不相同。
在同构系统中,只有主节点提供写服务,备节点只提供读服务,每个主节点的备节点数可以不一样,这样在部署上会有更大的灵活性。
在异构系统中,所有节点都是可以提供写服务的,并且在某个节点发生故障时,会有多个节点参与故障节点的数据恢复,但这种方式需要比较多的元数据来确定各个分片的主副本所在的节点,数据同步机制也会比较复杂。
相比较而言,异构系统能提供更好的写性能,但实现比较复杂,而同构系统架构更简单,部署上也更灵活。
鉴于互联网大部分业务场景具有写少读多的特性,我们选择了更易于实现的同构系统的设计。
系统数据备份的架构如下图所示,每个节点代表一台物理机器,所有节点按数据分布划分为多个组,每一组的主备节点存储相同的数据,只有主节点能提供写服务,主节点负责把数据变更同步到所有的备节点,所有节点都能提供读服务。
数据存储灾备方案
3
人工智能与机器学习
人工智能和机器学习技术在数据存储灾 备领域的应用不断加深。这些技术可以 帮助企业更好地理解数据、预测数据趋 势、优化存储资源分配等。
数据安全与合规的挑战与机遇
数据隐私保护
随着数据泄露事件的频发,数据隐私保护成为一项重要的任务。企业需要采取更 加安全的数据存储和备份措施,以保障用户的数据安全和隐私。
。
灾备级别
根据对灾难应对的能力和 要求不同,灾备可分为基 本级、增强级和高级三个
级别。
02
数据存储灾备技术
本地备份与远程备份
本地备份
在本地设备上创建数据备份,如服务 器、磁盘阵列等。这种备份方式快速 、高效,但存在数据安全风险,如设 备故障或火灾等意外事件。
远程备份
将数据备份到远程位置,如云端、其 他数据中心或远程服务器。这种备份 方式可以降低本地数据安全风险,但 需要稳定的网络连接和足够的带宽。
合规要求
各国政府对数据安全的重视程度不断提高,出台了一系列关于数据保护的法规。 企业需要遵守这些法规,同时也可以通过这些法规来提高自身的合规管理水平。
数据存储灾备的未来发展方向
多元化备份
未来,数据备份不仅限于单一的数据中心或云端,而是采用多元化的备份方式,包括远程数据中心、 云端、本地等多种备份方式相结合。
备份数据的存储介质与格式
存储介质
备份数据可以存储在硬盘、磁带 、闪存等不同介质中。选择合适 的存储介质可以降低成本和提高 性能。
存储格式
备份数据可以以不同的格式进行 存储,如文件、数据库、镜像等 。选择合适的存储格式可以降低 恢复成本和提高恢复效率。
பைடு நூலகம்
数据备份的恢复策略
快速恢复
存储容灾方案
-利用存储管理软件实现数据的自动复制和多副本存储。
4.3异地容灾中心
4.3.1位置选择
-选择地理位置远离主数据中心的区域。
-确保具备稳定的电力供应和网络连接。
4.3.2设施配置
-配置与主中心相当的存储和网络设备。
-实施相同的备份和恢复解决方案。
4.3.3切换策略
-在主中心发生故障时,自动或手动切换到容灾中心。
-在发生灾难时,实现快速的数据恢复和业务连续性。
-遵循国家和行业的相关法律法规,确保方案合法合规。
2.2原则
-数据保护与业务需求相结合。
-采用成本效益高的解决方案。
-确保方案的可扩展性和灵活性。
三、现状分析
3.1数据重要性评估
-关键业务数据:对业务运营至关重要,丢失或损坏将严重影响企业运作。
-非关键业务数据:对业务运营影响较小,可在较长时间内恢复。
3.2现有数据保护措施
-定期本地备份:已有定期在本地进行数据备份的流程。
-有限的硬件冗余:关键硬件有一定程度的冗余配置。
四、容灾策略设计
4.1备份策略
4.1.1备份类型
-全备份:对全部数据进行周期性备份。
-增量备份:仅备份自上次全备份后的更改。
-差异备份:备份自上次全备份后的所有更改。
4.1.2备份频率
2.软件冗余:通过存储管理软件,实现数据的多副本存储,确保数据安全。
五、异地容灾中心建设
5.1容灾中心选址
根据企业业务特点和地理位置,选择合适的容灾中心地点。
1.距离原数据中心较远,避免自然灾害的相互影响。
2.交通便利,便于运维管理。
3.电力、网络等基础设施完善。
5.2容灾中心配置
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.用户现状与需求1.1.用户IT系统现状用户现有系统包括数据库、应用、WEB、邮件等系统,虽然是双机架构,但是其稳定性和可靠性都没有达到核心系统应该具备的标准,而且直连的存储架构对于性能和管理型都有一定的局限性。
业务数据是企业业务的生命线,如何保护好计算机系统里存储的数据,保证系统稳定可靠地运行,并为业务系统提供快捷可靠的访问,是系统建设中最重要的问题之一。
为了保护业务系统的关键业务数据,我们必须对这些数据进行有效的备份,并支持快速恢复。
通过备份的方式将文件、数据库等重要数据做一个副本,只能在本地建立数据保护。
但因意外(如火灾、地震等)停止工作时,随之而来的损失更是不可估量,为避免类似风险的存在,就需要建立异地容灾系统,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作,保证业务稳定运行。
1.2.用户需求1.2.1.建设目标从容灾的级别来说,可以规划数据级容灾和应用级容灾,根据业务种类多,业务方式多样化的特点,仅建设一个数据级容灾是不够,容灾发生时,业务快速的恢复是容灾系统的一大需求。
应用级容灾是建立在数据级容灾的基础上,在容灾切换时,除了切换核心的数据库数据外,还包含了IP地址切换(按客户需要选择),中间件服务,用户级业务。
应用级容灾从流程上实现了全业务的连续性需求。
从我们的灾难系统建设经验出发,xxx有限公司可以考虑以下业务连续性计划目标:RPO(最大允许数据丢失时间):零数据丢失RTO(最大允许宕机时间):30分钟应用级容灾需求1.2.2.需求分析用户需要保障数据的长期安全可靠的,数据对于灾难的安全性和可恢复性:灾难切换时间要求灾难系统切换时间不超过30分钟,最好在10分钟内实现。
多种灾难切换方式提供自动灾难系统切换和手动灾难切换方式计划内维护要求提供计划内维护支持能力,计划内维护切换时间不多于10分钟数据丢失性要求原则上要求零数据丢失,可以依据情况进行调整数据同步方式提供同步和异步两种方式备份和灾难备份方式采用物理备份方式实现物理部件失败要求支持部分磁盘,文件系统,主机,磁盘柜等各种物理部件失败导致的失败保护。
站点失败要求支持由于火灾,电力以及其他因素导致站点失败的数据保护。
逻辑失败要求支持由于数据块腐败导致的数据库无法启动,数据丢失等逻辑失败保护人类错误失败要求支持由于人类误操作以及入侵等导致人类错误失败导致的数据保护或者恢复。
生产系统的性能影响要求生产系统性能影响不超过5%生产系统可用性要求容灾系统不会降低生产系统可用性网络链路分钟级别短暂故障要求不会对生产系统产生影响网络链路小时级别长期故障要求不会对生产系统产生影响网络链路密集的秒级别短暂故障要求不会对生产系统产生影响网络链路容错支持网络链路的容错,可以利用网络的备份链路,比如多路网卡等灾难系统的硬件故障由于灾难系统硬件故障导致的灾难系统不可用不会对生产系统产生影响,比如网卡,磁盘以及控制卡等灾难系统的软件故障由于灾难系统软件故障导致的灾难系统不可用不会对生产系统产生影响,比如灾难系统管理软件部件等网络协议采用IP网络实现网络带宽一般的百兆或者千兆带宽RTT要求R TT要求在10ms以内即可满足要求,可以容忍部分时间的30ms响应在线实施要求要求在备份系统实施期间保持生产系统运行存储系统失败的原址运行在生产系统主机可用的情况下可以支持系统原址运行部分文件失败的原址运行在部分文件失败的情况下可以支持系统原址运行2.建议方案2.1设计原则通过对用户具体环境和需求的分析,我们在针对性的方案设计上应遵循以下原则:➢最高的性价比,根据用户的实际需求,提供合适的解决方案,在有限的资金许可范围内提供符合需求的方案。
➢优化的策略,关键业务系统和一般应用系统优先级的策略化,需要确保关键业务系统的数据不丢失。
➢广泛的适用性,支持异构平台,产品可以适应不同类型的应用、数据以及主机存储设备。
2.3.8容灾方案设计目前有很多种容灾技术,分类也比较复杂。
根据用户应用系统特点的不同,应用系统持续服务紧迫性的区别,应有针对性的选择容灾系统方案。
(1)基于应用程序容灾解决方案◆方案优点•应用程序在本地、远端双写I/O;•该方案能够实现业务系统在发生灾难时自动切换,保证业务的完全连续性;◆方案缺点•投资非常高,容灾软件价格昂贵;•实施复杂,应用系统需要重新搭建;•该方案完全由软件实现,需消耗主机系统资源,效率底;(2)基于数据库复制的远程容灾解决方案◆方案优点•数据库本身的远程复制(Oracle DB Guard);•实施相对简便,支持异构存储;◆方案缺点•只能复制数据库文件,实现数据库容灾;•需要重新调试、安装数据库;•停机时间较长;(3)基于主机的远程数据复制软件容灾解决方案◆方案优点•复制软件在卷管理器层面截获I/O,远程复制•支持异构存储;•可以实现应用的实时、自动切换;◆方案缺点•需要重新配置存储卷,停机时间较长;•新增容灾系统需要增加软件授权;(4)基于存储的远程数据复制容灾解决方案◆方案优点•智能存储远程数据复制,技术较成熟;•设备、软件投资费用低;•实施简便,应用系统仅需短时间停机;•不需要对应用、数据库重新安装调试;◆方案缺点•只支持同一厂商同一系列存储;•不能实现应用的实时、自动切换;根据用户的应用特点:建议使用基于存储的容灾方案。
2.3.9系统整体架构本地灾备中心服务器均采用原有服务器,所有服务器配置HBA卡,连接至用户现有光纤交换机;新增存储加入SAN网络,存储空间可根据业务需求,自由划分给多套系统使用;新增一台备份服务器,安装NBU服务端,新增一台HDS虚拟带库作为备份介质保存备份数据,实现SAN备份。
主数据中心和灾备中心之间通过高速光纤链路连接,为数据复制和备份提供了很好的链路基础。
利用HDS 容灾管理软件TrueCopy实现磁盘阵列之间数据的复制。
建立同城异地容灭系统,通过数据同步保证在总部运行中心出现重大灾难故障时,能启用灾备中心进行正常交易。
异地备份中心容灾中心新增容灾服务器、容灾交换机,新增的HDS AMS 2100作为容灾存储设备,该备份中心只需要保存业务系统数据一份可用的备份。
当本地机房瘫痪时,容灾服务器接管ERP及交易系统。
3.灾备中心运行维护方案3.1.解决方案选择保持业务持续性,恢复业务处理的方法可以包括与冷、温或热站点供应商签订商业合同、移动站点、镜像站点、与内部或外部机构签订互惠协议、与设备供应商签订服务水平协议(SLA)。
另外,在制定系统恢复策略时应该考虑诸如独立磁盘冗余阵列(RAID)、自动故障切换、不间断电源(UPS)和镜像系统等技术。
业务持续性计划必须包括在比较长的期间在备用设施中恢复和执行系统运行的策略。
通常,有三种备用站点可供选择:由机构拥有或运行的专用站点与内部或外部实体签订的互惠协议或协议备忘录商业租用设施无论选择哪种类型的备用站点,设施必须能够支持应急计划中所定义的系统操作。
三种站点类型可以根据运行的准备程度进行分类。
这样的话,站点可以被确定为冷站点、温站点、热站点、移动站点和镜像站点。
根据BIA的结果和银联对业务持续性的要求,选择的解决方案可以描述为:(1)建立异地容灾中心将完全复制生产中心的数据,并实现两中心间的数据实时同步,其功能为:a.正常工作状态下,灾备中心将配置为生产中心的完全数据复制,以保证当生产中心发生灾难时,数据的完整性。
b.当生产中心的存储系统及数据不可访问时,可以通过对备份数据中心的数据的访问。
(2)建立灾备中心,生产中心的数据将完全复制到灾备中心,允许存在一定的时间差,但应满足RPO和RTO要求。
灾备中心配置有与生产中心架构相同的服务器系统,在生产中心无法运行的情况下接替生产中心的生产业务,实现对业务持续性的要求。
a.正常工作状态下,备份中心将配置为生产中心的数据复制源,以最大限度的不影响生产中心的主机和存储系统的性能。
b.当生产中心灾难发生时,灾备中心的完全复制数据将用于生产数据中心的数据同步,以保证当生产中心灾难发生时,灾备中心没有数据丢失;业务可以恢复运行。
3.2.业务持续性策略3.2.1.日常运行状态在没有任何异常情况发生的情况下,系统按照正常的运行状态运转,工作人员按照各自的岗位职责开展工作。
定期将工作内容和工作结果向上级管理人员汇报并接受上级管理人员的监督和检查。
3.2.2.切换流程切换流程分计划内切换流程和计划外切换流程,首先讨论计划为切换流程。
1. 发现并确定灾难情况运行中心运行保障室是负责发现可能导致业务系统灾难的事件的主要部门。
同时,网络维护室、系统维护室和安全管理室等其它部门应该将所发现的可能导致灾难的时间随时向运行保障室报告。
2. 通知负责恢复的人员运行保障室按照预定程序通知业务持续管理小组的值班人员,值班人员需要监控事件的发展,必要时将向业务持续小组负责人通报。
当发生可能导致业务处理中心的情况后,需要通知以下人员:◆信息中心主管◆业务持续管理小组负责人◆业务持续行政小组负责人◆负责维护发生以外事件的系统的部门负责人3. 判断异常影响程度,启动BCP计划启动BCP计划是业务持续管理小组和/或业务持续行政小组的职责。
通常由业务持续管理小组和/或业务持续行政小组的负责人宣布BCP计划的启动。
在被授权的组织会负责人确定需要启动灾备站点后,宣布BCP计划启动。
按照BCP所定义的工作内容,损害评估小组和灾难恢复小组开始工作。
4. 激活灾备站点在通知恢复的人员过程中,灾备站点的值班人员必须被通知并立即投入工作,做好业务运行环境的检查等工作。
关闭可能对恢复业务运行有影响的任何应用系统,做好恢复业务运行的准备。
在收到BCP启动的通知后,按照BCP所定义的操作流程,与生产中心陪着或独立执行业务恢复工作。
5. 发布公告业务持续管理小组的相关成员按照BCP所定义的工作内容向外发布公告6. 提供业务恢复所需的服务在业务恢复以及业务在灾备站点运行期间,内部和外部的支持团队以及相关工作人员按照BCP所定义的工作内容为业务的持续运行服务。
对于计划内切换流程,其大部分内容与计划为流程相同,通常由通知负责恢复的人员开始,直到提供业务恢复所需的服务。
计划内切换可能是由于演习或需要进行站点级的设备维护造成的,有很强的计划性,灾备站点人员应该提早完成恢复业务运行的准备工作,如所有工作人员到位等。
3.2.3.非切换异常处理流程切换流程用于处理不会导致业务切换的异常事件,如部分设备的损坏没有影响业务处理的正常运行,或备份中型和/或灾备中心发生异常等。
虽然这些异常事件不会对业务的运行造成直接影响,但是使系统整体的稳定性降低,业务运行的风险加大了,而且这样的事件大量存在,应该引起足够的重视。
初步计划的非切换异常处理流程如下:1. 发现并确定灾难情况运行中心运行保障室是负责发现可能导致业务系统灾难的事件的主要部门。