XX银行灾备系统建设
银行灾备方案
![银行灾备方案](https://img.taocdn.com/s3/m/23211e97250c844769eae009581b6bd97f19bcd8.png)
银行灾备方案近年来,随着科技的不断发展,金融行业的信息系统也越来越复杂和庞大。
然而,随之而来的是与之相伴的各种灾难风险。
无论是自然灾害、网络攻击还是人为失误,这些威胁都可能对银行的正常运营和客户的资金安全造成严重影响。
因此,制定健全的银行灾备方案,成为保障金融体系安全运转的重要措施之一。
一、灾备体系的建立银行灾备方案的首要任务是建立一个完备的灾备体系。
该体系应包括两个关键的要素:一是远程数据备份系统,二是灾备数据中心。
远程数据备份系统可以实现实时数据备份,确保即使在发生灾难的情况下也能保持数据的完整性。
而灾备数据中心则是一个被动式应急中心,可以在系统遭受破坏或无法正常运行时发挥作用。
二、数据保护与备份数据是银行最宝贵的财富之一,也是信息系统的核心。
因此,科学合理的数据保护与备份策略至关重要。
银行应该设立专门的数据备份中心,每天定期对核心数据进行备份,以防数据丢失。
此外,定期测试备份数据的可用性也是非常必要的,只有在真实的演练中,才能真正检验备份系统的可靠性。
三、恢复计划的制定一旦银行遭受灾害,恢复计划将变得至关重要。
恢复计划是指一套行之有效的步骤和方法,以保证银行能够在灾难发生后尽快恢复正常运营。
在制定恢复计划时,银行应充分考虑各种可能的灾难情景,制定应对措施,并对关键的业务和系统进行优先级排序。
四、灾害演练与评估灾害演练是为了模拟真实的灾难情景,检验灾备方案的有效性。
灾害演练应包括两个阶段:内部演练和外部演练。
内部演练主要针对银行内部员工,通过模拟灾难情景,检验员工的应急反应和合作配合能力。
而外部演练则是与其他金融机构、监管机构等进行合作,以检验不同机构在灾害情景下的应对能力。
五、定期更新与改进灾备方案并非一劳永逸的,随着科技的不断更新和体系的变化,方案也需要进行定期的更新和改进。
银行应建立一个固定的审查机制,每年至少进行一次灾备方案的评估,并根据评估结果进行相应的修订和改进。
结语银行灾备方案是保障金融体系安全运转的重要保障措施。
兴业银行数据中心灾备体系建设、管理与思考
![兴业银行数据中心灾备体系建设、管理与思考](https://img.taocdn.com/s3/m/6913d431b14e852459fb57a2.png)
兴业银行数据中心灾备体系建设、管理与思考作者:詹志辉来源:《中国金融电脑》 2016年第1期商业银行数据中心灾备体系建设与管理是复杂的持续性系统工程,建设周期长、实施难度大,不仅技术要求高,而且考验管理水平,涉及科技战略、IT 治理、运维管理等诸多内容。
在过去的十多年里,国内商业银行的灾备建设取得了丰硕的成果。
兴业银行也围绕有关监管要求与业务连续性目标,不断优化数据中心灾备体系架构,并基于ISO20000、ISO27001 等国际标准体系提升包括业务连续性管理在内的运维管理水平,为实现“百年兴业”的战略目标奠定坚实基础。
一、灾备体系建设历程兴业银行数据中心灾备体系建设总体经历了数据大集中、主备中心、两地三中心、多活中心等阶段。
第一个阶段是数据大集中阶段。
2000 年兴业银行实现了全行数据与业务处理的整合集中,降低了基础架构的复杂度,加强了生产中心的统一管理,但与此同时也在一定程度上带来了系统集中的风险。
由数据大集中引发的风险轻则降低银行的服务水平、阻碍业务的正常运营;重则导致大范围、长时间停业,使银行面临信用危机以及不良社会影响。
因此,在完成数据大集中后,兴业银行立即开始思考灾备中心建设,并最终选择上海作为异地灾备投产地点。
第二个阶段是主备中心阶段。
2002 年兴业银行开始进行核心业务系统灾备体系建设,2003 年8 月完成核心业务系统异地灾备系统在上海运行中心的上线运行。
与之相对应的网络架构也由以福州机房为核心的单点星型网络提升为以福州、上海机房两地为核心的双星型网络。
这一阶段上海运行中心作为异地灾备中心主要承担核心业务系统异地灾备环境的日常运维管理。
第三个阶段是两地三中心阶段。
由于单纯的异地灾备系统在主生产站点发生灾难时仍存在一定的数据丢失的可能性,2006 年兴业银行基于同城同步、远程异步的存储多跳容灾数据复制技术,实现了以福州中山机房为生产中心、元洪机房为同城灾备中心、上海江宁路机房为异地灾备中心的核心业务系统两地三中心灾备体系架构,确保在单一站点发生灾难的场景下实现数据零丢失。
开发银行灾备系统建设的思考
![开发银行灾备系统建设的思考](https://img.taocdn.com/s3/m/1c6452765acfa1c7aa00cc36.png)
I I I 墨
随 着 灾 备 建 设 的 逐 步 完 善 和 每 年 的
根据开发 银行 的业务连续性总 为主的数据中心和灾备体系。
演练 ,特 别是桌面演练 、流程演练 体 规 划要 求 ,采 用两 地 三 中 心架 构
开发银行 已经开展 了北京稻 香
北 湖新生产 中心 、北京怀柔同城 灾备 等多项工 作的开 展和深入 ,开发银 建设生产 中心 、同城 灾备中心 ( 深圳观 中心和西安’ 7 产灞异地数据 中心的规 行 更加深刻地感 受到只有所有 相关 京亦庄 )和异地灾备中心 (
砚 IVe p i l iw on t
立 异 地 灾 备 中心 ,灾难 恢 复 等 级 达 到 《 息 安 全 技 术 信 息 系 统 灾 难 恢 信
和 应 用 局 限 性 。 目前 应 用 比较 多 的 的技 术包 括 以 下几 大 类 。 ( ) 于存 储 的复 制技 术 1 基
建 设提供 了多种可选 的容 灾技术 ,
每 种 容 灾 技 术 都 有 自身 的技 术 表等管 业 务条 线 的有 效 业 务恢 复 预 案和
理类 系统 ,支撑 银行 内部的 1常运 相 应 的演 练 验 证 体 系也 同样 重要 。 3
22 / 国 融 脑 0 中 金 电 29 14
行 。该 类 系 统 经 过 近 几 年 的 建 设 和 完 善 ,在 同城 灾 备 中心 已经 完 成 部
复 规范 》中的第5 实时数 据传输 级 及 完整 设备支持 。业务 的发展和监
署 ,部分关键 系统还将考虑进行异
国内常见 的容灾解决方 案 ,由 地灾备部 署。第三类 ( 非实 时 ):
银 行提供 数据 与 系统 的灾备服 务 , 此 ( 时 ,客 户服 务 )涉 及 账 户 、交 成系统的恢复和业务的恢复。 实 易 、支 付 和 渠 道 的 重要 系 统 ,也 称
兴业银行数据中心灾备体系规划建设和管理汇报材料
![兴业银行数据中心灾备体系规划建设和管理汇报材料](https://img.taocdn.com/s3/m/52ae1b58ba0d4a7302763af5.png)
做好新形势下应急管理工作(2/2)
队伍建设方面:跨区域运维人员的成长培养、技术序列和绩效 评定等管理与激励机制,需设计和建立一个公平合理的平台, 保持运维人员结构的合理性。
集团化、国际化方面:各集团子公司IT营运水平参差不齐,部 分行业子公司包括IT基础设施在内的运维存在较大的风险。国 际化不可避免的带来不同地域的文化冲突。
机 房
r21
浦江
东宁
机机
山
r2
机
房
clone
clone
房房
clone
FCIP
磁带库
核心备机
核心主机
/数据处理备机 /数据处理主机
核心同城灾备主机 磁带库 /数据处理备机
核心异地灾 备主机
磁带库
核心新一代支撑平台、 历史数据检索、核心查 询、磁带库服务器
各分行
核心新一代支撑平台、 历史数据检索、核心查 询、磁带库服务器
十二五规划及执行情况
核心内容
建设 双活中心
双活两能一体化
锻造预警 与应急能力
组织架构调整 课题
研究
合规
推动总分行 一体化运作
系统 建设
创新
132
共享
品质
量化 管理
贯标 认证
Hale Waihona Puke 轮岗 培训以双活中心建设为重点,构建高可信、 安全稳定低成本 双活两能一体化 一体化、安全稳定的IT营运服务体系 协同创新可持续 主动合规负责任
商业银行灾备体系建设方法分析
![商业银行灾备体系建设方法分析](https://img.taocdn.com/s3/m/e1df3711650e52ea551898aa.png)
商业银行灾备体系建设方法分析(发表于《金融电子化》2010年10月刊)2012-03-23 16:26阅读(31)评论(0)商业银行灾备体系建设方法分析随着金融业务对信息系统的依赖性日益增强,商业银行越来越重视生产中心信息系统的高可用性,投入了大量资源和人员。
但是,在灾备体系建设方面,一方面由于起步较晚,另一方面由于我国还没有发生过导致银行生产中心瘫痪的灾难性事件,所以各家商业银行的经验并不是很丰富。
本文在分析并明确灾备工作定位的基础上,归纳设计了灾备体系框架,并介绍了建设灾备体系的基本步骤,以供参考。
一、灾备工作定位对企业来说,造成关键业务功能或流程中断的时间超过企业最大容忍程度的突发事件,都可以认为是灾难。
对商业银行来说,由于几乎所有金融业务都依赖于信息系统的支撑,所以灾备管理通常是指信息系统的灾难备份与恢复管理,目的是为了应对生产中心信息系统发生严重故障或者瘫痪,已不能在可接受的时间内在生产中心本地恢复,通常需要将信息系统切换到灾备中心运行的情况。
灾备管理、应急管理、业务连续性管理和风险管理是经常容易混淆的几个概念。
根据巴塞尔协议,商业银行风险管理包括对市场风险、信用风险和操作风险的识别、评估、监控、缓释和控制。
业务连续性管理主要针对可能导致业务中断的风险或者已经发生并导致业务中断的事件进行管理。
应急管理主要关注对各种突发事件的应急处置,该突发事件不一定会导致业务中断,但一定会对业务造成影响。
可见,业务连续性管理和应急管理都是风险管理的组成部分,并且业务连续性管理与应急管理之间存在一部分交集,这个交集就是对导致业务中断的突发事件的管理。
灾备管理是业务连续性管理和应急管理交集中的一种极端特殊情况,是专门针对IT灾难的。
上述各个概念之间的关系及举例如下图所示:二、灾备体系参考框架灾备体系建设是一项庞大而复杂的系统工程,必需在清晰、合理的框架指导下,协调有序地开展工作。
灾备体系建设需要从管理技术、管理和业务三个方面进行,三者之间相辅相成,是灾备体系不可或缺的有机组成部分。
华夏银行数据中心灾备体系建设实践
![华夏银行数据中心灾备体系建设实践](https://img.taocdn.com/s3/m/4c264174c950ad02de80d4d8d15abe23482f0394.png)
华夏银行数据中心灾备体系建设实践华夏银行作为中国领先的银行机构,在金融行业中扮演着重要的角色。
随着信息技术的发展,数据中心的重要性日益凸显。
为了保障系统安全和业务连续性,华夏银行积极进行数据中心灾备体系的建设,并取得了显著的实践成果。
一、灾备体系建设背景和意义1.1 背景说明随着金融业务的不断拓展和海量客户的数据需求增长,华夏银行数据中心承载着极其庞大的信息系统,其中包括高频的交易系统、客户资料管理系统等核心系统。
在技术日新月异的今天,数据中心的稳定与安全对于银行的正常运营尤为重要。
1.2 意义灾备体系的建设能够有效提供数据中心的可用性和可靠性,确保业务的连续性,并在灾害事件发生时迅速恢复。
在金融领域,保护客户的财产安全和信息安全至关重要,同时也能减少业务中断对银行声誉和市场竞争力的负面影响。
二、灾备体系的架构设计2.1 业务需求分析根据华夏银行的业务特点和数据中心运营需求,进行了全面的业务需求分析。
通过对业务影响性、恢复优先级和系统关联程度的评估,确定关键业务系统和数据,以确保在灾备时优先确保核心业务的连续性。
2.2 灾备体系架构华夏银行灾备体系采用了主备互备的架构设计。
通过在两个地理位置相距较远的数据中心之间建立主备关系,确保数据实时备份和容灾切换。
同时,通过引入云计算和虚拟化技术,提高数据中心的资源利用率和灵活性,确保系统的高可用性和弹性扩展性。
2.3 储备设备和带宽灾备体系建设过程中,华夏银行缺乏备用设备和带宽将会成为一个关键挑战。
为了应对这个问题,银行充分调研市场,选择了稳定可靠的供应商,提前储备了冗余设备,并通过优化网络架构来增加网络带宽的可靠性和容量,以满足灾备时的数据传输需求。
三、关键技术支持3.1 数据同步技术为了保持主备数据的同步,华夏银行采用了实时数据同步技术。
通过使用高性能异步复制和快照复制技术,实现了数据在主备数据中心之间的实时复制,并确保主备数据的完整性和一致性。
3.2 虚拟化技术虚拟化技术在华夏银行的灾备体系建设中起到了重要的作用。
交通银行灾备体系建设及创新实践
![交通银行灾备体系建设及创新实践](https://img.taocdn.com/s3/m/93b94e6771fe910ef02df8b2.png)
交通银行灾备体系建设及创新实践作者:郑仕辉来源:《中国金融电脑》 2016年第1期商业银行信息系统的安全、稳定运行关系着国家金融安全和社会稳定,为了防范灾难和风险,保障业务连续性,在过去的十年中,国内商业银行相继建立了同城和异地灾备中心,“两地三中心”成为商业银行普遍采用的灾备建设模式。
灾备系统建设投资巨大,商业银行的灾备系统建设普遍面临如下问题:一是由于大规模、关联复杂的IT系统灾备切换技术复杂、风险极高,商业银行的灾备系统往往处于“有备份、无切换”的状态,灾备系统的有效性没有经过真实切换的验证;二是生产系统环境不断变化,灾备系统的维护成本高,可用性难以保障;三是灾备中心用于备份的服务器往往处于空闲状态,虽然一些银行将灾备系统同时用于开发测试,但其资源仍没有得到充分有效的利用,尤其是采用大型机运行核心或贷记卡系统的商业银行,其灾备大机的资源十分昂贵。
交通银行2006 年完成了数据大集中,在上海张江交通银行数据中心副总经理郑仕辉建立了数据中心,于 2007 年将海外分行系统从香港迁移到张江数据中心运行,实现了境内外一体化的数据中心运行。
为保障业务连续性,交通银行于2007 年在上海浦西漕河泾建立了同城备份中心,2008 年在武汉建立了异地灾备中心,形成了“两地三中心”的灾难备份体系。
在灾备建设过程中,交通银行针对前述问题进行了深入探索和实践,通过自主创新,建立了完善的灾难备份体系。
一、交通银行“两地三中心”建设规划为了指导灾备体系建设,在实现大集中之后交通银行就制定了“两地三中心”的发展规划,确定了灾备建设“统筹规划、分步实施;控制成本、保障有效;面向业务、分级灾备;平战结合、资源共享”的指导方针。
首先,对“两地三中心”建设的目标、灾备等级、技术路线等进行总体规划,在灾备的建设次序上,采取“先同城、后异地”的策略。
其次,在确保灾备系统有效性的基础上,采取各种技术和管理手段,尽可能降低灾备系统的投资成本。
工商银行灾备及生产运维体系建设
![工商银行灾备及生产运维体系建设](https://img.taocdn.com/s3/m/5e36909a5acfa1c7ab00cc5b.png)
工商银行灾备及生产运维体系建设作者:钱斌来源:《中国金融电脑》 2016年第1期工商银行在数据中心建设运营过程中始终坚持“安全生产运行第一”和“第一时间恢复生产”的指导思想。
近年来,工商银行信息系统处理的业务量逐年攀升、屡创新高,手机银行等电子银行渠道已成为工商银行交易量的主要增长点,互联网和移动终端业务以及第三方支付业务快速发展,小额高频交易增长明显。
同时,随着互联网金融的蓬勃发展和客户需求的日益多元化,工商银行正在加快构建电商平台(融E 购)、直销银行平台(融E 行)和即时通讯平台(融E 联)三大互联网金融服务产品体系。
在此背景下,工商银行信息系统总体保持了安全稳定运行态势,核心信息系统主要业务时段可用率保持在99.99% 的较高水平。
本文重点介绍工商银行数据中心信息系统灾备管理的相关情况。
一、完成“两地三中心”灾备体系部署一直以来,工商银行高度重视并积极推动数据中心灾备体系和系统高可用性建设。
早在2004 年,工商银行就在国内同业中率先建立起“两地两中心”的数据中心异地灾备架构,并于2009 年启动“两地三中心”数据中心新架构研究。
2014 年6 月上海嘉定同城数据中心正式投产启用,在业界率先成功实现数据中心同城双中心全业务切换运行,标志着“两地三中心”工程初见成效。
工商银行信息系统灾备体系已达到了国际灾备标准SHARE-92 定义的七级水平和国务院信息化办公室《重要信息系统灾难恢复指南》六级的高灾备等级标准要求。
在此基础上,2014 年11 月工商银行首次采用临时通知的方式,成功实施同城核心系统切换运行,实施过程采用“一键式”切换工具,主机核心系统切换时间控制在分钟级;2015 年11 月,工商银行又成功实施了核心系统第三次切换运行,并在嘉定同城园区连续运行一周,验证同城环境的可用性,达到预期效果。
异地灾备方面,工商银行连续7 年采取临时通知方式组织实施全行业务级灾备应急切换和恢复演练,验证异地灾备部署的效果。
华夏银行数据中心灾备体系建设实践
![华夏银行数据中心灾备体系建设实践](https://img.taocdn.com/s3/m/8df6eff959eef8c75ebfb37e.png)
华夏银行数据中心灾备体系建设实践作者:易永丰来源:《中国金融电脑》 2016年第1期华夏银行按照监管、主管部门对业务连续性的要求,经过几年的努力,截至2014 年底,完成了总、分、支一体化的三级灾备体系建设,并通过力求真实、常态化的灾备切换演练,“一键式灾备切换平台”、“灾备私有云”等技术创新,以及业务、技术有效联动机制,形成了具有华夏银行特色的灾备体系架构。
2015 年,本着“同城双活、异地负载、快速切换、持续运行”的建设原则,华夏银行制定了灾备优化方案,并先后试点实现了基于不同技术架构的“双活”应用系统。
一、华夏银行数据中心灾备建设特点1. 总分行灾备一体化,信息系统全覆盖华夏银行总行已完成以北京亦庄为生产中心、西三旗为同城灾备中心,苏州为异地灾备中心的“两地三中心”灾备建设,目前正在实施灾备架构优化,从“大异地”向“多中心并重”的方向持续优化演进。
华夏银行信息技术部副总经理兼数据中心主任易永丰华夏银行总行异地灾备中心于 2014 年 4 月投产,按照“全部覆盖、分级建设”的策略实施,实现了支撑全部重要业务的38 套系统的应用级灾备及其余全部系统的数据级灾备,应用级灾备系统的恢复时间(RTO)小于1 小时,数据保护级别(RPO)小于5 分钟;华夏银行总行同城灾备中心于2012 年底完成建设,实现了总行19 套对客服务的关键系统的应用级灾备和全部系统的数据“零丢失”保护,系统恢复时间小于30 分钟,数据保护级别为0。
2013 年9 月华夏银行通过同城灾备切换方案将生产中心切换到了亦庄数据中心,将西三旗变为了同城灾备中心。
华夏银行在加强总行集中系统灾备建设的同时,还秉持“全行灾备一盘棋”的理念,于2014 年底完成了全部一级分行的同城灾备中心建设,实现了分行“网络双活”的目标;所有支行通过第三条有线线路或3G(4G)无线备份网络接入分行同城灾备中心,实现通信链路级的灾备;同时,依托异地灾备中心私有云,创新实现了对分行所有重要信息系统的“集中式异地灾备”,34 家一级分行102 套系统共享总行异地灾备中心的2 套物理主机、存储和网络资源,当某分行发生灾难时,可立即激活启动相应分行灾备系统及时恢复服务。
商业银行灾备体系建设方法分析
![商业银行灾备体系建设方法分析](https://img.taocdn.com/s3/m/c40c5dfec67da26925c52cc58bd63186bdeb925d.png)
商业银行灾备体系建设方法分析一、需求分析商业银行灾备体系建设的首要任务是进行需求分析。
首先要明确银行所面临的灾备需求,包括业务持续性需求和数据安全性需求。
其次,要考虑灾备体系的规模和范围,例如是否需要建设多个数据中心或灾备中心。
同时还需要分析银行的业务流程和数据流动,确定关键业务、关键数据和关键系统,以便有针对性地进行灾备体系建设。
二、风险评估在灾备体系建设之前,商业银行需要进行风险评估,确定可能会遇到的各种灾害和紧急情况,并评估对银行业务和数据的潜在影响。
这些风险包括自然灾害、人为事故、设备故障等。
在评估的基础上,商业银行可以制定相应的预防和应急措施,以减轻潜在的风险。
三、架构设计灾备体系的架构设计是商业银行灾备体系建设的核心环节。
架构设计应该符合银行的业务需求和风险评估的结果,确保在灾害或紧急情况下能够实现业务的持续性运行和数据的安全性。
架构设计应该包括数据中心的布局、灾备设备的选择和配置、网络拓扑设计、灾备流程的设计等。
四、设备选型灾备体系的设备选型是商业银行灾备体系建设的重要环节。
在设备选型过程中,商业银行应该考虑设备的可靠性、性能、扩展性和兼容性等因素。
同时还要考虑设备的投资成本和运维成本,以确保投资回报率。
设备选型应该综合考虑商业银行的业务需求、架构设计和风险评估的结果。
五、数据备份商业银行灾备体系建设的关键环节之一是数据备份。
商业银行需要制定完善的数据备份策略,包括备份的频率、备份的存储介质、备份的存储位置等。
同时还要考虑数据备份的恢复性和可靠性。
商业银行还需要定期测试数据备份方案,以确保备份的完整性和可恢复性。
六、应急响应商业银行在灾备体系建设之后,还需要建立完善的应急响应机制。
这包括灾备演练、应急预案的编制、人员培训等。
商业银行需要定期进行灾备演练,以验证灾备体系的有效性和可行性。
应急预案应该涵盖各类灾害和紧急情况的应对措施和流程,并确保相关人员熟悉和掌握应急预案。
七、监控与管理商业银行灾备体系建设完成后,需要建立健全的监控与管理系统。
银行异地灾备建设方案_NBU52
![银行异地灾备建设方案_NBU52](https://img.taocdn.com/s3/m/0b6c88bc03d276a20029bd64783e0912a2167ccc.png)
银行异地灾备建设方案_NBU52专业资料word 完美格式XX 银行异地三期系统灾备建设方案赛门铁克软件(北京)有限公司2013年3月目录第1章现状与需求 ......................................................................3 1.1 综述 . (3)Your Infrastructure. Your Information. Your Interactions. Only Symantec Protects Them All.1.2 灾备建设目标 (3)1.3 系统信息 (3)第2章方案描述 (8)2.1 设计规划 (8)2.2 整体架构 (8)2.3 配置说明 (9)第3章技术要素 (11)3.1 备份数据自动复制(A.I.R) (11)3.2 SAN-Client架构 (11)第4章 NetBackup 5220产品介绍 (13)第1章现状与需求1.1 综述本方案涵盖XX银行灾备建设异地三期,灾备等级为1-3级的31个系统,共有各类型主机约110台,总数据量7.5TB。
这些系统部署在西三期和Site2两个同城机房,方案目标是实现所有系统本地数据集中备份和苏州灾备中心的异地数据容灾。
1.2 灾备建设目标本方案要实现的灾备建设目标为:3级重要系统异地灾备恢复能力RTO,RPO小于24小时;其余的1、2级系统RTO为1-2天;RPO 为1-7天。
1.3 系统信息下表是31个系统的详细信息,包括系统名称、服务器类型、数据量等:第2章方案描述2.1 设计规划本方案针对三期系统灾备异地建设,建议采用在同城两个生产中心建立一套备份系统,将数据集中备份,然后再由专用设备自动复制备份数据至苏州灾备中心的设计思路,来实现异地容灾。
专用备份设备需具有对备份数据实时重复数据删除能力,同时有良好的数据重删比率。
这样备份数据经过优化缩减,可更好的适应网络远程传输。
某股份制商业银行数据中心灾备建设经验
![某股份制商业银行数据中心灾备建设经验](https://img.taocdn.com/s3/m/b14dd1481611cc7931b765ce05087632311274dd.png)
某股份制商业银行数据中心灾备建设经验一、灾备定义与演进此后,人们进行灾难恢复规划时,将保护IT系统的灾备范畴拓展到 IT 所支持的业务领域,并根据保护业务的要求衡量灾备的目标——哪些业务最重要?哪些业务需要最先恢复?美国“9·11 恐怖袭击事件”后,全球用户升了对灾备的重视程度,异地灾备建设一时成为趋势,并且从全面风险管控的角度出发,以及IT技术的不断更新,灾备的范畴从传统的数据和系统备份、恢复,业务连续性规划、灾难恢复规划、灾备演练、灾备从业资质认证、人才培养、法律法规制定等方面,拓展到了通信保障、危机公关、紧急事件响应、第三方合作机构和供应链危机管理等。
二、某行灾备架构设计1.存储建设概况我行生产类业务系统均部署于全冗余架构的共享存储中,存储平台使用阵列双活架构,两台高端存储同时通过FC SAN网络向上层主机集群提供业务访问,两台存储之间进行实时数据同步。
当出现设备、链路等因素导致其中一台存储不可被访问,存储底层进行故障切换而不会停止数据读写,主机上层对底层的故障切换无感知,业务不中断,真正做到了RTO和RPO都为零的本地高可靠容灾。
2.数据级备份系统建设情况我行哈密主机房和乌鲁木齐机房各部署一套备份一体机,同时管理后端物理带库或其他备份介质数据备份采用D-D-T的介质存储策略,数据优先备份到备份一体机,数据消重后,定期自动化转储到带库并进行自动出库,提高数据的安全性。
满足数据快速备份和恢复的要求。
对VMWARE虚拟化、oralce数据库进行SANClient备份,主机系统进行LAN备份。
备份系统灵活、扩展性强;管理简单,自动化运行,减少人为干预;对“结构化”和“非结构化”数据进行重复数据删除;对各系统的不同类别保护对象进行全方位保护,如:虚拟化、应用程序、配置、数据库、操作系统等;将存储的的快照和复制功能纳入到管理平台进行统一管理,备份软件的RD功能进行应用感知,可以和存储的管理软件集成,无缝支持存储的快照等功能,直接进行快照调用和管理。
银行异地灾备系统建设方案
![银行异地灾备系统建设方案](https://img.taocdn.com/s3/m/505a8ae743323968001c9287.png)
银行异地灾备系统建设方案目录银行异地灾备系统建设方案 (1)1 项目概述 (3)1.1 项目背景 (3)1.2 规范要求 (3)1.3 建设现状 (4)1.4 紧迫性 (5)2 需求分析与建设目标 (5)2.1 不足和挑战 (6)2.2 灾备需求 (6)2.3 规划阶段 (8)3 设计方法与思路 (10)3.1 理论依据 (10)3.2 方法论 (10)3.3 技术路线 (12)4 技术方案 (12)4.1 系统设计 (12)4.2 总体架构 (13)4.3 异地灾备主机方案 (17)4.4 灾备网络方案 (19)5 异地灾备细则 (19)5.1 数据级灾备建设 (19)5.2 应用级灾备建设 (21)本文是某商行异地灾难备份方案的一份详细、完整的最佳实践建议书。
包括需求分析、设计方法思路、技术方案详解、异地灾备细则。
1 项目概述1.1 项目背景某行金融电子化工作经过多年的发展,信息技术已得到广泛的应用,主要业务系统如核心业务、现代化支付、中间业务及卡前置等都实现信息电子化,综合性多功能的金融信息化服务体系已初步形成。
某行业务对信息化依赖程度越来越高,信息系统安全问题对业务的影响突出。
数据集中的同时也意味着风险相对集中,在地震、火灾、水灾、疫情、计算机病毒、黑客攻击等灾难事件不断集中爆发,为确保某行信息系统安全和业务持续运行已成为一项重要而艰巨的任务。
某行的业务经营体系不断发展,业务领域不断拓展,业务覆盖区域不断扩大。
在这种情况下,某行目前的核心业务系统已经实现了数据的本地自动备份,未进行完整的灾难备份体系建设。
一旦因为机房、建筑物损坏等较大规模的灾难引起数据丢失或者信息系统长时间宕机,将造成某行全省范围内的业务停顿,相关单位和个人无法从事有关金融业务,不仅造成严重不良的社会影响,更影响金融行业的稳定。
某行信息系统灾难备份体系建设以及业务连续体系建设的重要开端,异地灾备系统工程建设的建设实施,为某行后续的业务连续体系建设打下坚实的基础。
灾备体系建设为龙江银行发展打造坚固的屏障——访龙江银行副行长许永辉
![灾备体系建设为龙江银行发展打造坚固的屏障——访龙江银行副行长许永辉](https://img.taocdn.com/s3/m/23ac1217c5da50e2534d7f06.png)
22 0中 金 电 27 0 / 国 融 脑 11
I I I 墨
掌控难 、日后维护投入大等。在此情况下 ,经过权衡 、
比较 、调 研 和 论证 ,龙江 银行 最 后 选择 租 赁 哈尔 滨 国裕 中 国金 融 电脑 :龙 江银 行 如何 推 动 灾备体 系建
设 ?有 哪 些技 术特 点? 目前进展 如何 ?
数据中心作为主数据中心 。
外包 服 务方 式 的优 势显而 易见 。一是 建 设 时 间短 ,
可供 借 鉴和 推 广 的案 例 。
中 国金 融 电脑 :在 不影 响 柜 面营 业 的前提 下 ,
龙 江银 行 如何 实现 数据 中心 的 异地 迁 移 ? 其 中遇 到 了哪
些难题 ?如 何应 对 ?
中国金 融 电脑 :在 数 据 迁移 的过程 中 ,龙 江银
行 的 基 础 设 施 建 设 采 用 了外 包方 式 ,是 基 于 怎 样 的 考
许永辉 :在 “ 三行一社”基础上重新组建 的龙江银 等 ,并 将 硬 件 分 阶段 分批 次迁 移 ,实 现 了 高可 靠 、低风
行 自成 立 以来 ,信 息科 技 面 临 诸 多挑 战 ,如业 务系 统分 险 、短 中断 的项 目 目标 。 数 据 中心迁 移 毕 竟是 一 项过 程 复 杂 、涉 及 面 广 、实
许 永辉 :龙江 银行 成 立之 初 ,临 时将 大 庆分 行 数据
中心作为主数据 中心。随着业 务的快速发展 ,龙江银行
省 内外 的分 支 机 构 达 N 1 o 个 ,员工 4 0 多人 ,庞 大 5多 50
的机构需要更加完善 、可靠的I 系统来支撑。大庆分行 T
的数 据 中心 机 房在 规 模 、等级 、环境 等 方 面 已经 无 法满
建行XX分行灾难备份系统规划
![建行XX分行灾难备份系统规划](https://img.taocdn.com/s3/m/3e26956cda38376baf1faee3.png)
1、概述随着计算机技术和通讯技术的高速发展,以计算机和通讯技术为基础的金融电子化系统得到了飞速发展。
建设银行xx分行为了发挥计算机城市综合网系统的最大优势,在市场竞争中保持建设银行现有的科技优势,能够给大行业大企业提供全省范围内的优质服务,加强城市综合网系统的安全运行。
规划将建设银行xx分行全省范围内的客户数据帐务信息,集中到省分行运行中心统一处理,这是计算机应用技术发展的必然,也是建设银行xx分行业务发展的需要。
随着数据集中处理的实施,可以预计,建行的业务运作、经营管理将越来越依赖于计算机网络系统的可靠运行。
建设银行所提供金融服务的连续性以及业务数据的完整性、正确性、有效性,会直接关系到我们建行的生产、经营与决策活动。
一旦因自然灾害、设备故障或人为因素等原因引起计算机网络系统停顿导致信息数据丢失和业务处理中断,将会给建设银行xx分行造成巨大的经济损失和声誉损害,受到致命的打击。
将全省客户帐务数据集中统一处理,因数据集中处理伴随而来的运行风险将因为灾难发生大大增加。
生产运行主机系统及其配套设备一旦发生故障,就会导致在全省建设银行范围内所有营业柜台停止营业的风险。
会计、储蓄、信用卡等建设银行的三大主营业务的停业,建设银行xx分行面临的将是灾难性打击。
因此,生产运行系统的灾难备份系统就显得格外重要。
我们认为,一旦实施全省数据集中,灾难备份系统应该与生产运行应用系统(全省集中)同步投入使用,保证全省数据集中处理系统的运行安全。
根据建设银行xx分行数据集中处理领导小组的统一安排,1999年10月10日到10月20日,分行科技处组织人员在成都市龙泉,进行封闭式工作,制定城市综合网系统全省数据集中处理规划,本应用系统灾难备份系统建设规划是其中很重要的分部。
1.1 计算机系统灾难备份概念简介1.1.1 计算机系统灾难定义计算机系统灾难是指造成重要业务数据丢失,使业务中断了不可忍受的一段时间的计算机系统事故,这些事故导致银行丧失了全部或部分业务处理能力,引起企业营业收入下降、信誉降低和形象受损,甚至威胁其生存。
商业银行容灾系统建设方案
![商业银行容灾系统建设方案](https://img.taocdn.com/s3/m/791b5fe17d1cfad6195f312b3169a4517623e55a.png)
商业银行容灾系统建设方案王刚【摘要】根据商业银行对容灾中心的定位描述,容灾系统不仅具有基本的容灾功能,而且是连接生产核心系统与辅助系统的桥梁。
因此,建设容灾系统具有十分重要的现实意义。
鉴于容灾系统建设是一个涉及面广、专业性强的系统工程,本文对容灾系统建设的总体原则和思路进行了研究,探讨各种容灾可用技术,并进行分析对比,提出了系统构架,对商业银行容灾系统的建设具有参考价值。
%According to the commercial Banks located in the disaster center of the description, the disaster recover system disaster not only has basic functionality, but also is a bridge connecting production core system and auxiliary system. Therefore, construction of the disaster recover system has very important practical significance. Given disaster recover system construction is a wide range and specialized system engineering, this paper general principles and ideas for the construction of the disaster recover system are studied, discussed all kinds of disaster available technology, and carries on the analysis comparison, proposed the system architecture,it has the reference value the commercial bank disaster recover system construction.【期刊名称】《计算机系统应用》【年(卷),期】2013(000)011【总页数】7页(P74-80)【关键词】商业银行;容灾系统;总体原则;系统构架;建设方案【作者】王刚【作者单位】陕西省汉中市邮政局信息技术局,汉中 723000【正文语种】中文由于银行业务对计算机系统的依赖性越来越大,金融数据处理的高可靠性显得非常关键,一旦数据由于某种灾难发生永久性丢失,其社会影响和经济损失不可估量,后果不堪设想.银行系统的灾难主要有自然灾难和人为灾难,为应对灾难的发生,商业银行必须制定和建立完备的灾难恢复系统.容灾恢复系统建设的核心目标是在尽最大可能地保证容灾系统中的数据与生产系统中的数据一致性的基础上,确保备份数据安全、可用.该系统必须建立在成熟、稳定的软硬件平台基础上,保证数据备份的完整和灾难发生时应用接管的可靠[1].通过建立完善的容灾安全控制体系和可靠的运行管理机制,保障容灾系统稳定、安全运行.按照各业务系统及子系统的重要性和各业务系统的恢复等级,制定合理的数据备份与容灾策略,优先保障关键业务数据的完整和关键业务的快速恢复.目前容灾中心所采用的技术方案主要有两类,即基于存储系统的同步数据容灾方案和基于数据库的归档日志追加数据级容灾方案.1 容灾建设可用技术分析在应用系统层、数据库管理层、操作系统卷管理层、存储网络(SAN)层和存储设备层,均有相关的数据复制技术方案,可用于容灾系统建设中[2].1.1 基于应用层的容灾技术1.1.1 实现原理生产系统中的应用程序通过数据复制转发的模式,将交易数据传送到部署于容灾中心的灾备系统.由生产系统和容灾系统处理相同的交易数据,以确保两边数据的一致性.其原理如图1.图1 基于应用层的容灾原理1.1.2 实现方式应用层容灾在异地容灾中心建立一套完整的应用系统,当灾难发生时,异地容灾系统会检测到灾难的发生,在保证用户数据的完整性、可靠性、一致性的前提下,实时进行切换,由异地应用层容灾系统向用户提供不间断的业务服务.基于应用层的容灾方案有同步和异步两种实现方式.同步方式是指生产中心应用系统交易处理完成后,同时将交易请求转发给容灾中心应用系统[3].只有当两个系统都处理完成后,才向客户端返回交易处理结果.异步方式是指生产中心应用系统交易处理完成后,立刻向客户端返回交易处理结果.生产中心应用系统可以在一定时间之后,以报文或者批量文件的方式,将交易转发到容灾中心应用系统重新执行.异步方式对应用程序性能的影响小,但容灾中心数据更新方面与生产中心相比会有延迟.1.1.3 优缺点分析(1) 优点: 容灾系统处于热备用状态,随时可以提供服务; 传输交易发起数据,对网络带宽要求较低.(2) 缺点: 如果采用同步方式,数据处理速度较慢;数据一致性完全由应用软件控制,软件开发面临新挑战,技术实现难度大.1.2 基于数据库的容灾技术1.2.1 实现原理在生产中心和容灾中心采用相同的数据库,生产中心为主数据库,容灾中心为备用数据库.当修改主数据库时,生成的更新数据发送到备用数据库,其原理如图2.如果主数据库出现了故障,备用数据库即可以被激活并接管生产数据库的工作.图2 基于数据库的备份原理1.2.2 实现方式备用数据库可以是物理备用数据库,也可以是逻辑备用数据库.(1) 物理备用数据库: 物理备用数据库通过接收主数据库日志并应用日志的方式与主数据库保持同步.物理备用数据库在应用日志时,是基于数据块级别来操作.因此,要求备用数据库和主数据库具有相同的物理结构,而且备用数据库只能处在恢复状态和只读打开两种状态中的一种[4].(2) 逻辑备用数据库: 逻辑备用数据库与主数据库只要求逻辑结构相同,物理结构可以不同.它通过接收主数据库的日志,并转化为 SQL 语句,在备用数据库中运行的方式,与主数据库保持同步.逻辑数据库除了用于灾难恢复之外,也可以用于其他的用途,它允许用户根据需要随时进行查询以及随时生成报表,还可以建立自己的数据库对象,进行读写操作.逻辑备用数据库与物理备用数据库相比,其优点在于数据库可以一直处于打开状态,以提供查询、统计等功能,但是,逻辑备用数据库目前具有一些无法克服的缺点:由于需要将归档日志转换为SQL 语句再重新执行,对系统的性能要求很高; 逻辑备用数据库不支持主数据库表中使用一些特殊的数据类型; 逻辑备用数据库要求主数据库表中的数据必须唯一标识,也就是说必须具有主键或者唯一索引.1.2.3 优缺点分析(1) 优点: 对存储设备透明; 灾难发生时,备用数据库系统可快速就绪.(2) 缺点: 最大保护和最高可用模式,对于主数据库系统资源占用很高; 最大性能模式在灾难发生时,有数据丢失; 要求主数据库和备用数据库的操作系统和数据库版本一致.1.3 基于操作系统卷管理层的容灾技术1.3.1 实现原理生产中心的主机同时识别来自于生产中心和容灾中心的存储设备上的磁盘,利用操作系统所配置的卷管理器,实现生产中心的逻辑卷和容灾中心的逻辑卷之间的实时同步数据复制.其原理如图3.当生产中心发生突发性灾难时,可以在容灾中心服务器上激活相应的卷组和逻辑卷,进而启动数据库和应用系统,实现业务系统快速恢复.图3 基于操作系统卷管理层的容灾原理1.3.2 实现方式基于操作系统卷管理器的数据复制方式分为同步复制和异步复制.同步复制是指操作系统将更新数据写往本地连接的磁盘系统,同时将数据转发给远端连接的磁盘系统.这两个写操作是同时进行,只有当两个系统都拥有数据的拷贝以后,本地系统才会向处理器返回一个 I/O 完成指示[5].应用进程会等待写 I/O操作完成,才能够进行下一个数据写操作.同步复制方式工作原理见图4.图4 基于操作系统的同步复制方式远程容灾异步方式下,通过时间戳、分组号可以保证数据的一致性和完整性,并在灾难发生时的数据丢失最少,恢复时间短.生产系统所发出的 I/O 操作至本地存储系统,本地存储系统处理结束后即通知主机本次 I/O 结束.然后,本地生产存储系统将多个累计的写 I/O 异步的,不一定按顺序的传送到备份中心的存储系统中,由于 I/O 操作不是同步的传送到备份中心,在异步方式下,就存在数据的传送顺序与实际的数据的操作顺序不一致问题.为了解决这一问题,容灾系统对每个写入生产中心存储系统的I/O 都打上一个时间戳(Time Stamp)并进行一致性分组,在数据传输至备份中心时,备份中心存储系统严格按照此时间戳的时间顺序重新排列并写入相应的逻辑卷中,从而保证了备份数据的逻辑一致性与完整性.异步复制方式工作原理见图5.图5 基于操作系统的异步复制方式1.3.3 优缺点分析(1) 优点: 对存储子系统透明,生产和容灾中心可部署不同的磁盘阵列,容灾结构相对简单.(2) 缺点: 远程数据复制操作占用较多主机的资源; 生产中心应用系统的写操作性能受生产和容灾中心传输距离影响较大.1.4 基于存储系统的容灾技术1.4.1 实现原理基于存储系统的容灾技术,是利用存储设备控制器中嵌入的远程复制功能,配合数据复制软件、卷管理软件,在相同类型的存储子系统之间进行同步复制和异步数据复制,可以实现生产中心和容灾中心数据备份,尽量保持生产系统的存储数据逻辑卷与备份系统存储数据逻辑卷的一致性[6].这种技术可以不依赖于主机和应用软件,而靠存储系统的大量硬件技术来实现.1.4.2 实现方式基于存储系统的远程拷贝形式分为同步复制和异步复制两种[7].(1) 同步复制(Synchronous Writes): 来自主机的数据被写往本地连接的磁盘系统,该系统将数据转发给远端连接的磁盘系统.只有当两个系统都拥有数据的拷贝以后,本地系统才会向主机返回一个 I/O 完成指示.同步远程拷贝能够在远端提供最新的数据,但应用程序会因等待所有 I/O 操作的完成而被延迟.工作原理如图6:图6 基于存储系统的同步复制原理(2) 异步复制(Asynchronous Write): 来自主机的数据被写往本地连接的磁盘系统后,该系统立即向主机返回一个I/O完成指示.数据在很短的一段时间以后被送往一个远端磁盘系统.异步远程拷贝对应用系统的性能影响最小,但远端磁盘系统在数据的更新程度上与本地系统相比会有一个延迟.工作原理如图7.图7 基于存储系统的异步复制原理如果在异步复制方式中,远端磁盘在写入数据块时不考虑发生的先后顺序,这种方式也称全局拷贝(Global Copy),在全局拷贝的情况下,比如某一时刻主机对本地磁盘发起了A、B、C、D、E 五个块的写盘请求,本地的磁盘系统的写顺序是 A,B,C,D,E.但是由于线路等原,远端磁盘系统的接收顺序可能是A,C,B,D,E,并按此循序写盘.为了解决本地磁盘和远端磁盘可能存在的数据块在读写顺序的差异,磁盘系统提供有一致性组的异步远程数据拷贝.1.4.3 优缺点分析(1) 优点: 对系统性能影响很小,数据一致性较好.(2) 缺点: 两边的存储设备必须是同构的,对线路带宽的要求通常也较高; 灾难发生时,可能导致灾备中心数据不一致,严重时有可能造成数据库无法启动.1.5 基于SAN的容灾技术1.5.1 实现原理在存储交换机与存储磁盘阵列之间增加一个存储数据逻辑管理层,用以管理其后面的所有磁盘阵列并可形成存储池,同时,通过这一层设置数据级容灾保护机制和数据备份策略,以增量的方式或持续复制的方式将生产中数据通过高速网络复制到远端的容灾中心的存储设备中.具有存储数据逻辑管理层功能的设备即可以是 SAN 交换机和高级存储设备磁盘控制器,也可以是专用于 SAN 卷管理的设备.1.5.2 实现方式基于 SAN 的容灾技术方案实现方式也有同步复制和异步复制两种,其实现原理基本与基于存储系统的远程拷贝方式基本相同,如图8.图8 基于 SAN 的容灾原理1.5.3 优缺点分析(1) 优点: 数据复制过程对于应用系统透明,对主机性能无影响,生产中心和容灾中心可部署异构磁盘阵列; 采用专用的 SAN 卷管理设备,可减小磁盘阵列控制器处理压力.(2) 缺点: 采用专用的 SAN 卷管理设备,在数据存储路径上增加一层,对线路带宽的要求也较高.1.6 容灾技术对比分析综上所述,每种容灾技术都有其各自的特点[8-11],具体情况如表1:表1 容灾系统对比分析项目基于应用系统基于数据库系统基于操作系统基于存储系统基于SAN备份内容数据库数据数据库数据整个磁盘数据整个磁盘数据整个磁盘数据传输的内容交易数据数据库归档日志整个磁盘的增量数据块整个磁盘增量数据整个磁盘增量数据传输的安全性中高高高高异步方式对数据丢失影响较少较多由数据复制缓冲区及数据块大小决定少少对生产主机性能影响有影响影响较大影响较大影响较小影响较小对数据库的要求无版本一致版本一致版本一致版本一致网络带宽的要求较高高很高很高很高实现的难易程度很复杂复杂较容易容易容易维护工作的难易很复杂复杂较容易容易容易恢复时间短长较短较短较短对存储设备要求无无无无无2 容灾系统架构为了保证业务系统关键功能的不间断运行,以及所有生产数据的完整和安全,容灾中心在商业银行IT 总体规划中具有重大意义.依据 IT 总体规划中“两地三中心”的建设模式,容灾系统建设包括同城灾备中心建设和异地灾备中心建设两部分内容,见图 9.其中,同城灾备中心与生产全国中心的所有生产数据完全一致.在生产全国中心发生灾难时,金融关键业务的关键功能应能实时切换到同城灾备中心,实现关键业务功能的不间断运行,其它相关业务系统可在短时间内恢复运行[12].异地灾备中心与生产全国中心的所有生产数据存在一定差异.在生产全国中心与同城灾备中心同时发生灾难时,生产数据应该能够恢复到要求的时间点,关键业务系统的关键功能可在有限时间内恢复运行.图9 容灾系统目标架构2.1 容灾系统方案的研究容灾不是简单的备份,而是当灾难发生时,能全面及时地恢复整个系统.容灾系统可以分为三个级别:数据级容灾、系统级容灾、应用级容灾.针对不同信息系统的应用、特点和需求,各种容灾技术既可以单独使用,也可以组合使用[13].根据银行业务系统的具体情况,选择合适的技术或技术组合,是容灾系统建设方案的基础. 2.1.1 基本概念衡量容灾系统性能的有两个指标: (1)恢复时间目标(RTO),是系统所能容忍的应用停止服务的最长时间,RTO 值越小就表示容灾系统恢复能力越强; (2)恢复时间点目标(RPO),是反映恢复数据完整性的指标,表示业务系统所能容忍的数据丢失量. 建设容灾系统的最基本目标是保证业务的连续性,业务的连续性研究包括两个重要方面: (1)业务连续性管理(BCM),BCM是一项综合管理流程,包括基础数据、应用系统、业务的灾难备份与恢复计划; (2)业务连续性计划(BCP),BCP是为避免关键业务功能中断,减少业务风险而建立的控制过程,包括支持关键业务功能的人力、物力、和所需要的基本服务的连续性保证[14].2.1.2 同城容灾综合考虑各种技术实现方案对生产系统性能影响程度及实施难度、容灾系统同步要求、各专业银行同城容灾技术方案及同城容灾业务指标的要求等因素,在同城容灾方案中选用基于存储系统的同步技术方案是比较合适的.如果同城容灾中心与生产中心距离超过 50km,将使用基于存储系统的异步技术方案.基于存储系统的方案可实现:(1) 恢复点目标很小,业务系统基本没有数据丢失;(2) 数据同步工作由存储设备完成,对应用系统主机透明;(3) 商业银行的实际使用表明,基于存储系统的数据同步方案实施简单.2.1.3 异地容灾在生产全国中心与同城灾备中心同时发生灾难时,生产数据应该能够恢复到要求的时间点,关键业务系统的关键功能可在有限时间内恢复运行.根据技术成熟度、对生产应用系统性能影响度,基于存储系统的异步容灾技术和基于数据库的最大性能容灾方案均能满足要求.2.1.4 多中心连接模式的选择在“两地三中心”间实现基于存储系统的异步数据传输模式,有多跳、分发两种基本模式及多跳与分发相结合的模式,如图10、图11.2.1.5 两种模式的区别多跳模式中,生产中心存储设备上的变化数据同步更新到同城容灾中心相应的存储设备上,而异地容灾中心的数据则来自于同城容灾中心,通过异步模式以减小对同城容灾设备的影响.同城容灾中心和异地容灾中心的数据均来自于生产中心磁盘,同城容灾中心与生产中心保持存储设备同步连接,而异地容灾中心与生产中心设备保持异步连接模式.通过原理分析可发现两种模式存在如下区别:图10 多跳模式图11 分发模式(1) 异地容灾同步数据时间不同多跳模式中,异地容灾数据需要经同城中心进行中转而得到,而分发模式中异地容灾中心数据直接来自于生产中心.(2) 压力点不同多跳模式的压力主要存在于同城容灾中心存储设备上,而分发模式的压力则在生产中心的存储设备上.(3) 抗灾难性能力对于多跳模式,如果同城容灾中心存储设备出现故障,则异地容灾中心与生产中心同步断开; 对于分发模式,如果生产中心存储设备出现问题,同样存在异地生产中心与同城容灾中心无法同步的问题.2.1.6 两种模式的融合多跳与分发相融合的模式,结合了多跳与分发的技术优势,解决了数据中心间潜在的无法数据同步的风险,其原理如图12.图12 多跳与分发相结合的模式3 结束语基于存储系统的容灾方案,无论采用同步模式还是异步模式,均需要一个前提条件: 两边必须部署同品牌、同级别的存储设备.这一特点与成本预算有着直接的关联关系.在现有可行方案中,基于 SAN 的容灾技术可以从底层化解同构问题.为了将存储设备从数据同步的压力中解放出来,可在 SAN 交换机上或 SAN 交换机这一层采用专用的硬件设备,完成数据同步策略管理及异构设备的支持.其不足之处是增加了底层数据传输层次和维护难度.参考文献【相关文献】1 郭继君.大集中模式下存储容灾系统设计方案.华南金融电脑,2002,(9):42-46.2 施蓓莉.基于HP主机平台加EMC/EVA存储的银行业务系统灾备实现.上海交通大学,2008:4-16.3 杨柳明.论商业银行容灾系统建设.广西金融电脑,2008,(2):56-59.4 王德军,王丽娜.容灾系统研究.计算机工程,2005,31(6):43-46.5 刘迎风.容灾技术及其应用.计算机应用研究,2002,19(6):11-15.6 徐鹏,薛建新.数据中心容灾系统研究.计算机工程与设计,2007,28(33):22-27.7 许福忠.银行交易系统灾备技术研究与应用.国防科技大学,2006:7-17.8 叶嘉铭,胡晓勤.多数据库容灾系统的设计与实现.计算机工程与设计,2012,33(12):241-245.9 蔡皖东,何得勇.一种网络容灾系统的设计与实现.计算机工程,2004,30(7):116-118.10 于新华,刘川意.远程容灾系统设计框架.计算机工程与应用,2006,42(24):31-34.11 武鲁,李钟华.基于集群服务器的容灾系统的副本管理研究.计算机应用研究,2006,23(6):76-78.12 陈汶滨,吕曼曼.容灾备份系统研究.计算机安全,2009,(7):70-71.13 施云龙,韩广琳.浅谈银行系统柜面服务器集群的容灾备份方案.福建电脑,2006,(5):69-71.14 杨景发.商业银行四地容灾系统的设计与实现.上海交通大学,2011:6-43.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
银行灾备系统建设
在建设灾备系统的过程中,XX银行遵循国际灾备组织的科学方法论,在风险分析、业务影响、灾备策略、技术方案、业务连续性等灾备建设的各环节,借力专业服务商的能力与经验,在较短的时间内快速、高效地完成XX银行灾备系统的建设工作。
近年来,随着业务的高速发展,XX银行信息化建设的力度也越来越大,各类系统和数据逐步实现大集中,IT对业务的整体覆盖率达到84%。
IT的大集中也带来了系统风险的集中。
作为银行业务连续运行的保障,灾备系统建设一直都是科技部门的一项重要工作。
XX银行十分重视这项工作,其灾备系统建设经历了数据异地备份、灾备系统外包和自建灾备中心等几个阶段。
本文将对XX银行的灾备系统建设进行回顾和思考,并探讨了下一步的建设思路。
一、建设灾备系统的必要性
1.银行业务发展的需要
相关资料表明:金融行业在灾难停机两天内所受损失为日营业额的50%,如果在两个星期内未能恢复信息系统的正常运作,75%的公司将出现业务停顿,43%的公司可能再也无法开业,没有实施灾备系统措施的企业60%将在灾难后的2~3年间破产。
由此可见,灾备和业务连续性建设直接关系银行生死存亡和可持续性发展的关键问题。
2.监管合规性的要求
一直以来,监管部门对银行信息科技风险管理给予了高度重视,近期也已连续发布了一系列的监管指引和要求。
银监会下发的《商业银行数据中心监管指引》中明确要求:商业银行应于取得金融许可证后两年内,设立生产中心;生产中心设立后两年内,设立灾备中心;总资产规模一千亿元人民币以上且跨省设立分支机构的商业银行应设立异地灾备中心,灾难恢复等级达到《信息安全技术信息系统灾难恢复规范》中的第5级实时数据传输及完整设备支持。
业务的发展和监管,都要求必须建立起完善的灾备体系和业务连续性保障体系。
二、灾备系统建设思路
如何建设灾备系统需要周密规划:除了要考虑技术实现外,还要考虑各类业务的不同需要;除了考虑资源投入外,还要考虑产出和利用;除了考虑通用的灾备模式,还要考虑自身的情况和能力。
总之,没有所谓最好的灾备系统,只有最符合自身需要的灾备系统。
1.建设模式选择
目前,国内银行在进行灾备体系建设时一般有自建和外包两种模式,各有优缺点。
自建是指银行独立建设数据中心,此模式具有较高的可靠性与安全性,但投入大、周期长,对银行技术人员的能力要求较高,适用于大型金融机构。
外包是指由专业服务商在其数据中心内为银行提供数据与系统的灾备服务,此模式也能达到一定可靠性,投入小、周期快,对银行
人员能力要求相对较低,适用于中小型金融机构。
2.灾备技术选择
计算机和通信技术的发展,特别是存储技术的发展,为灾备系统建设提供了多种可选的容灾技术,每种容灾技术都有自身的技术特点和应用局限性。
目前应用比较多的的技术包括以下几大类。
(1)基于存储的复制技术
国内常见的容灾解决方案,由存储厂家提供技术实现生产中心存储设备与灾备中心存储设备的直接镜像,将数据以同步或异步的方式复制到远端。
其优点是将数据与应用分开,对主机系统的运行资源影响比较小,缺点是必须在本地端和灾备端分别配置两套相同的存储系统。
(2)基于主机的复制技术
通过安装在服务器的数据复制软件,实现异地数据复制。
该技术的优点在于成本相对较低且能兼容不同厂家的存储设备,缺点是会占用主机的资源。
(3)基于数据库的复制技术
基于数据库的容灾技术传输的是数据库指令或者重作日志文件。
该技术与存储类型和服务器平台无关,具有较好的使用灵活性。
3.根据系统分类选择灾备部署
银行应用系统根据其处理的业务种类可分成以下几类。
第一类(实时,客户服务)涉及账户、交易、支付和渠道的重要系统,也称银行核心系统,为客户直接提供服务。
XX银行2007年就已实现同城和异地的灾备建设,每年灾备演练都会以核心系统作为主要的演练内容。
第二类(准实时,员工服务)行政办公、财务、信贷、报表等管理类系统,支撑银行内部的日常运行。
该类系统经过近几年的建设和完善,在同城灾备中心已经完成部署,部分关键系统还将考虑进行异地灾备部署。
第三类(非实时):培训、档案、稽核、分析等系统,大部分已实现数据级备份,未来将考虑对其中的关键系统进行系统备份。
4.业务连续性是灾备建设的关键
灾难备份和业务连续性的发展自20世纪70年代开始,经历了IT系统的灾备和恢复、业务恢复预案体系建立到9.11之后的业务连续性管理的提出和发展。
2011年银监发【104】号《商业银行业务连续性监管指引》也对于银行业务连续性提出了严格和具体的要求。
经过多年的建设和发展,XX银行也深刻感受到灾备系统的建设只是提供了技术的保障,能否取得预期的效果和保障业务的恢复,关键是业务连续性计划,需要领导的高度重视、相关业务部门的积极参与和掌握,要保障在灾难情况下,各个方面能各司其职、有效组织、高效协同地完成系统的恢复和业务的恢复。
灾难情况下,IT的恢复固然是非常重要的基础,但IT恢复以后,业务数据的完整性检查和交易补入、相关公关部门的有效沟通和协调、监管机构的报告和指导、行领导的决策和组织、各个业务部门和业务条线的有效业务恢复预案和相应的演练验证体系也同样重要。
随着灾备建设的逐步完善和每年的演练,特别是桌面演练、流程演练等多项工作的开展和深入,XX银行更加深刻地感受到只有所有相关人员都能掌握相应的预案和流程,把灾备和业务连续性当做常态化工作,才能真正保障在灾难和系统严重故障时,整个业务连续性体系有效运作和快速恢复,保障XX银行对客户的服务持续有效。
三、XX银行灾备系统建设情况
XX银行以批发业务为主,客户数和交易量较少,但是单笔金额大,安全性要求高。
从2005年开始,XX银行与人民银行清算中心无锡主站合作,采用外包方式建立数据级的远程备份中心。
2006年,银行业务发展和监管部门要求对XX银行灾备系统建设提出了迫切要求,在自身基础设施条件和技术力量不足的条件下,通过采购专业灾难恢复服务商的资源和服务,快速建立起XX银行的灾备体系,同时与专业服务商共同建设灾备系统的过程中,也培养和锻炼了自己的灾备团队。
在建设灾备系统的过程中,XX银行遵循国际灾备组织的科学方法论,在风险分析、业务影响、灾备策略、技术方案、业务连续性等灾备建设的各环节,借力专业服务商的能力与经验,在较短的时间内快速、高效地完成XX银行灾备系统的建设工作。
根据XX银行的业务连续性总体规划要求,采用两地三中心架构建设生产中心、同城灾备中心和异地灾备中心,分别应对不同类型的灾难模型。
基于局部较小灾难性事件,可以切换至具有高指标、低成本、距离较近、切换方便的同城灾难备份中心;基于发生大范围、较严重的灾难性事件,总行的IT运行、业务系统和管理指挥体系受到破坏,则需启用远程异地灾难备份中心恢复运营。
在灾备建设过程中,对于关键技术的选择,XX银行对业界主流的容灾技术进行评估及衡量,最后采用较为成熟的基于高端智能存储系统的解决方案,实现同城灾备中心核心系统数据零丢失,灾备系统的切换快速、安全、可控。
同时,考虑到外包灾备系统是一个的过渡性系统,基于风险分析、投入产出和技术实现等多方面权衡,决定采取“大同城、小异地”的灾备部署策略。
四、建设思路
根据整体业务发展策略和集团化要求,XX银行计划逐步转向建立自己的,并以自主管理为主的数据中心和灾备体系。
经过认真研究,XX银行将采用“大异地、小同城”的模式建立两地多中心的建设,并且考虑到业务特点,逐步建立多中心双活的生产灾备体系,在同城建立必要的关键系统,保障一旦出现系统严重故障时的快速系统切换和恢复,在异地建立与生产中心等配的系统和设备,根据各个应用系统的特点和业务需求,与生产中心形成主备模式、双活模式和负载均衡模式
的多模式双活中心运行,如像数据库和核心业务采用主备模式运行,对于网上银行等能支持双活模式和负载均衡模式的系统采用双活模式运行。
同时,在灾备中心的规划建设中,还需考虑与开发、测试、验收等多种系统环境需求的结合,保障相应的投资和系统在提供高可用性保障能力的同时,合理充分利用系统设备资源,发挥更大的效益。
在建设灾备系统的过程中,XX银行遵循国际灾备组织的科学方法论,在风险分析、业务影响、灾备策略、技术方案、业务连续性等灾备建设的各环节,借力专业服务商的能力与经验,在较短的时间内快速、高效地完成XX银行灾备系统的建设工作。