山东检验检疫信息系统灾难恢复体系的研究与建设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Science &Technology Vision
科技视界0概述
近年来随着信息化应用水平的发展,如何确保应用系统在极端情况下持续安全运行逐渐成为我们面临的重要课题。
灾备的目的是确保灾难发生后业务立即恢复,应用能够尽快投入使用,采用的各种技术不论是数据备份、数据复制还是灾备技术,无非都是围绕着业务连续来进行,这些技术是灾备的关键环节。
目前,我局CIQ2000、电子内务等核心应用的应急备份系统基本建立,其他系统也实现了数据级备份。
但我局现有的备份限于以前资金、设备的限制,目前仅限于核心应用和重点应用,未能覆盖所有应用,且仅是数据库层面的备份,应用层面还没有备份;现有的备份主要定位于应急备份,备份系统处理能力小于生产环境主机,发生故障切换时只能承担部分业务,而且运行速度明显比生产系统慢。
以CIQ2000综合业务为例,一次数据恢复至少需要1-2小时时间,并且会产生部分业务数据丢失,将会给检验检疫业务带来很大损失;由于业务系统不断优化升级,部分应急预案得不到及时更新,有的内容过时、甚至失效。
因此,如何确保数据安全、系统持续高效运行是信息化工作人员面临的重要问题。
进一步树立风险防范意识,完善信息系统应急处置预案,建立风险防范长效机制,按国家、总局标准构建山东局高起点、高性能、全覆盖的信息系统备份及灾难恢复体系势在必行。
1国内外对信息系统灾难恢复体系的研究现状
目前国外有一些备份及灾难恢复体系建设成熟的案例,案例成本都相当高;行业内个别兄弟局实施的备份及灾难恢复体系的建设只是局限于CIQ2000核心业务系统,且只是达到应急备份水准,对于外围系统数据库及OA 系统仅是达到了数据级备份,对于应用服务器都没有任何的备份。
经过对各兄弟局进行详细调研,总结归纳如下共性问题:
(1)备份环境与生产环境不匹配。
系统内各局的备份主要定位于应急备份,备份系统处理能力小于生产环境主机,发生故障切换时只能承担部分业务,而且运行速度明显比生产系统慢。
(2)备份系统未达到全覆盖。
系统内各局现有的备份都限于资金、设备的限制,目前仅限于核心应用和重点应用,未能覆盖所有应用。
(3)应急预案有待进一步完善。
由于业务系统不断优化升级,部分应急预案得不到及时更新,有的内容过时、甚至失效。
因此,比较全面的解决方案未有先例。
无法满足目前复杂业务信息系统的备份及灾难恢复的要求。
2信息系统灾难恢复体系的研究与建设
结合山东检验检疫工作实际,利用业界先进的、成熟的软件产品对现有的CIQ2000等主要电子业务信息系统的应急体系进行升级改造,进一步加强信息备份、灾难恢复以及业务连续性管理,提高应对突发事件的响应能力。
按照国信办《重要信息系统灾难恢复指南》和质检总局《检验检疫重要业务系统灾难恢复指南(试行)》有关要求,灾备体系的建设要着重做好等级设置、资源要素、恢复策略及预案、应急演练和日常维护几个方面的工作。
等级设置就是我们将全面梳理现有的应用系统,根据其使用范围、频率和在业务工作中的重要性确定其合理的备份等级,总局对直属局的核心业务系统的备份等级建议设定为第5级,即:使用远程数据复制技术把生产系统的数据经通信网络实时复制到备用场所;在灾
难恢复时,业务功能可在很短时间内(5-30分钟内)恢复,但数据会有少量丢失。
目前我局核心应用系统主要包括:CIQ2000、电子通关、电子内务等,其他系统等级根据业务情况进行确定。
资源要素是实现备份机灾难恢复必备的条件,包括:备用基础设施(机房)、备用数据处理系统(主机、软件)、备用网络系统、数据备份系统、技术支持能力、运行维护管理能力和灾难恢复预案七个方面。
(1)备用基础设施
备用基础设施是灾难恢复所需的、支持灾难备份系统运行的建筑、设备和组织。
我们已经有瞿塘峡路70号灾备机房,同时对UPS、空调等动力设备进行升级改造,为达到更高级别的备份等级提供基础保障。
之前部分应急备份系统已迁移到该机房,实现同城异地备份。
(2)备用数据处理系统
备用数据处理系统一般由备用的主机、存储、软件组成。
灾备机房的硬件设施(服务器、存储、光纤交换机)以及软件环境(Vmware 虚拟化软件、Oracle GoldenGate 软件)等已经采购,为本项目实施提供了物质保障。
(3)备用网络系统
备用网络系统包含备用网络通信设备和备用数据通信线路,此部分是建设容灾备份及恢复体系的关键技术支持点。
此次容灾备份及恢复体系建设备用网络层面主要研究工作如下:整体架构描述:研究整网采用何种架构设计思路,使其具有数据冗余和网络冗余能力。
探索双线路和主备设备的设计理念,可以保证网络的畅通运行,在出现线路或者设备故障时,整网都能实现自动切换。
设备之间启用BGP 和OSPF 动态路由协议,将全网的路由进行有效地计算和规划,动态路由协议可以提供最优的网络路径选择,提高网络的运行速度,为网络提供了故障切换和恢复功能。
灾备中心:灾备中心的网络架构将沿用数据中心架构设计思路,具有数据冗余和网络冗余功能。
双线路和主备设备的设计思路,可以保证网络的畅通运行。
灾备中心与分支局之间采用双线路连接,两条线路类型都采用MSTP 10M 线路连接,两条线路互为冗余备份,灾备中心与数据中心之间连接采用1000M 裸光纤,保证了内部数据的同步速度。
(4)数据备份系统
数据备份系统一般由数据备份的硬件、软件和数据备份介质(以下简称“介质”)组成,此部分是建设容灾备份及恢复体系的重要环节。
此次容灾备份及恢复体系建设数据备份层面主要研究工作如下:研究利用Oracle GoldenGate 软件,将Ciq2000、电子通关、电子转单等核心业务数据库数据实时复制到备份机房中的备份数据库中,使数据延迟限制在10秒中以内。
研究利用Vmware 虚拟化技术将电子监管应用服务器、统计日报送通讯机等迁移到VMware 服务器虚拟化群集平台中。
在灾备机房新搭建一套VMware 服务器虚拟化群集平台,研究利用quest 公司的vranger 软件定时将中心机房的虚拟机增量复制到灾备机房。
容灾备份及恢复体系建成后,核心业务灾备拓扑示意图如图1。
(5)技术支持能力
对灾难恢复系统的运转提供支撑和综合保障的能力,以实现灾难恢复系统的预期目标。
包括硬件、系统软件和应用软件的问题分析和处理能力、网络系统安全运行管理能力、沟通协调能力等。
我局有专业的计算机人才和专业的硬件、软件以及网络运行维护公司提供技术支撑和综合保障支持。
(6)运行维护管理能力
包括运行环境管理、系统管理、安全管理和变更管理等。
将制修订
山东检验检疫信息系统灾难恢复体系的研究与建设
田建荣王宏志宋琳琳郭曙超
(山东出入境检验检疫局,山东青岛266001)
【摘要】本项目结合山东检验检疫工作实际,按照国信办《重要信息系统灾难恢复指南》和质检总局《检验检疫重要业务系统灾难恢复指南(试行)》有关要求,利用业界先进的、成熟的软件产品对现有的CIQ2000等主要信息系统的应急体系进行升级改造,着重做好等级设置、资源要素、恢复策略及预案、应急演练和日常维护几个方面的工作,通过以上工作进一步加强信息备份、灾难恢复以及业务连续性管理,提高应对突发事件的响应能力。
【关键词】信息系统;灾难恢复;Goldengate 软件;vranger 软件
66
. All Rights Reserved.
Science &Technology Vision 科技视
界
一系列管理制度,如备用计算机机房运行管理制度、硬件和网络运行管理制度、操作系统、数据库、应用软件等运行管理制度、电子传输数据备份系统运行管理制度等以确保灾备中心正常运行维护管理。
(7)灾难恢复预案
定义信息系统灾难恢复过程中所需的任务、行动、数据和资源的文件。
将修订我局《电子业务系统应急处置工作规范》用于指导相关人员在预定的灾难恢复目标内恢复信息系统支持的关键业务功能。
恢复策略及预案下一步将根据国家、总局规范和我局相关作业指导书要求进行全面梳理,查漏补缺、优化完善、定期升级,在实用的基础上做到全覆盖。
应急演练是对备份系统及应急预案的验证,将研究建立制度化的管理模式定期进行,确保发生问题时能够在第一时间启用。
日常维护是关键,下一步将加强制度建设,利用先进的技术手段建立统一的运维监控平台,研究建立信息安全风险分析和预警机制,做到未雨绸缪、防范在前,有效应对突发事件。
3信息系统灾难恢复体系研究技术方案方面
本方案采用Oracle 公司的Goldengate 软件作为数据库容灾备份软件,和针对CIQ2000系统的数据特点自主开发的管理控制软件,实现了CIQ2000、电子通关、电子内务等系统的同城异地容灾备份。
采用Vmware 公司的虚拟服务器技术将电子转单通讯机、电子报检通讯机、废物原料通讯机、电子监管应用服务器、电子通关应用服务器、统计日报送等应用迁移到到服务器虚拟群集平台中运行。
解决了以上这些系统的单点故障问题。
采用quest 公司的vranger 软件定时将中心机房的虚拟机增量复制到同城异地容灾灾备机房,实现了服务器虚拟群集平台中运行的应用异地容灾备份。
通过以上方案,中心机房一旦主系统出现重大故障或灾难,备份平台可迅速启动并接管核心业务系统,确保业务持续运行。
4结论
通过容灾备份及恢复体系的建设,利用瞿塘峡路70号机房,购置的主机、网络、数据备份
设备,利用虚拟化技术、Oracle GoldenGate 和vRanger Pro 技术,实现核心应用系统“数据+应用”的第5级备份,实现其他应用数据定期备份、异地存放、虚拟主机备用的第3级备份。
[1]法勇.检验检疫业务系统备份与恢复方案分析[J].检验检疫科学,2004.[2]赵祖亮.青岛检验检疫局网络安全解决方案[J].计算机应用技术,2004.
[3]L eszekA .Ma eiaszek 著.金芝译需求分析与系统设计汇编[M].北京:机械工业出版社,2003:60-80.
[4]重要信息系统灾难恢复指南[Z].国务院信息办.
[5]CIQ2000综合业务系统技术手册[Z].国家质检总局信息中心.[6]电子监管系统技术手册[Z].国家质检总局信息中心.
[7]检验检疫重要业务系统灾难恢复指南[Z].国家质检总局信息中心.
[8]李干池.数据挖掘预测技术在CIQ2000中的应用[Z].检验检疫科学,2008.
[责任编辑:汤静]
图1山东出入境检验检疫局核心业务灾备拓扑图
(上接第37页)教学团队中软件开发的教师组织实施和完成,组建学生团队,共同完成项目的开发任务,学生团队在老师的指导下,自主学习,自主开发,查阅资料,做中学,学中做,提高项目的开发能力。
最后,对整个系统进行整体组装和调试,学生团队通过整合项目的各部分内容,进行完整系统化设计,以及通过反复飞行调试,与开发组项目团队讨论,修改参数,直到飞行器能够稳定的飞行。
3结论
项目的实施过程,也就是学习的过程,在工作中学习,做中学,学中做,以行动为导向,以任务为驱动的新型的教学理念,改变传统的以课程为核心的教学体系。
传统的教学方法,嵌入式理论知识非常枯燥,学生难掌握,难理解,对学习嵌入式知识感到害怕,毕业后不敢从事这方面的岗位的现状。
通过团队的项目化教学,学习课程知识不枯燥,提高了学生的学习兴趣,,开发项目的能力和实践能力得到了提高。
4教学思考
对于实际项目,要用到各方面的知识,不仅仅是专业知识,还有许多非专业知识,包括法律法规,数学,外文等各重归于方面的知识,从接到一个项目到完成项目过程中,教学团队需要各方面的协调和技术
攻关,包括产品的涉及到的专业法律法规,资料查阅,设计方案的实施等工作。
需要团队合作,同时,项目通过服务于社会,在社会中检验,一方面会得到社会的认可,另一方面能提高学生的实践能力和社会阅历;最后,能对知识的活用,教学项目一方面要考虑学校教学的需要,另一方面,要能使学生对学到知识的应用。
总之,团队教学形式在许多方面不够成熟,不够完善,需在实践中加以完善。
高职院校学生的特点,以及对现有教学形式进行调查,传统的教学方式已越来越不能适应发展需要
,提出团队式的教学模式不管在理论和实践上有一定的创新。
[1]巩海霞,唐飞,涂俊梅.高职院校“教学团队”内涵及其目标[J].中国科教创新导刊,2012(28).
[2]徐平利.工学互动组合:重构高职教育双师型教学团队的新思路[J].教育发展研究,2007(2).
[3]马彦纯,苏炜.高职院校学习型教学团队建设初探[J].高职教育,2011(6).
[4]约翰逊.社会学理论[M].南开大学社会学系,译.北京:国际文化出版公司,1988,446,225.
[5]庞庆霈.四旋翼飞行仿真器的建模及控制方法的研究[D].中南大学,2009:9-15.
[责任编辑:薛俊歌]
67
. All Rights Reserved.。