统一档案数据存储管理平台建设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统一档案数据存储管理平台建设
马跃福;王平;杨静
【摘要】@@ 一、数字化档案信息存储体系rn随着社会信息化程度的不断提高,各级档案馆也将逐步成为海量数字化档案信息的存储中心.建设安全、可用的数字化档案信息存储体系将成为现代档案馆的一个极其重要的内容.目前数字化档案信息存储体系一般包括存储、容灾、备份和归档四方面的内容.
【期刊名称】《档案与建设》
【年(卷),期】2010(000)010
【总页数】3页(P28,37-38)
【作者】马跃福;王平;杨静
【作者单位】江苏省档案局,江苏南京,210008;江苏省档案局,江苏南京,210008;江苏省档案局,江苏南京,210008
【正文语种】中文
一、数字化档案信息存储体系
随着社会信息化程度的不断提高,各级档案馆也将逐步成为海量数字化档案信息的存储中心。建设安全、可用的数字化档案信息存储体系将成为现代档案馆的一个极其重要的内容。目前数字化档案信息存储体系一般包括存储、容灾、备份和归档四方面的内容。
1、存储
存储架构分为3种:DAS(直连存储)、NAS(网络附加存储)、SAN(网络区
域存储)。在档案系统应用中NAS和SAN架构最为适合:NAS数据结构是基于文件系统,因此NAS架构应用于档案文件的存放,可以经济高效地实现档案电子化;SAN数据结构基于数据块,因此SAN架构适用于档案数据库的构建,可以高性能地实现档案数据的查询和管理。
考虑完架构后,要考虑存储产品自身的可靠性,如存储控制器是否冗余、存储相关设备是否冗余、存储构造的合理性、存储自身的数据安全保护等等。一个可靠的存储系统必须至少拥有2个或以上的高性能控制器,以保证核心控制的可靠性;必
须拥有至少N+1设备冗余(电源、风扇、通道卡等);存储构造应当采用交换或点对点模式,来确保内部的数据传输性能及容错性;存储自身的数据安全保护涉及硬盘raid级别、故障监测、数据快照支持和远程数据复制支持。
2、容灾
容灾顾名思义就是为了预备灾难发生时所做的预防应急措施。在规划远程容灾系统方案时,应根据具体要求明确方案所要达到的目标。因为不同的灾难恢复目标,可以使用不同的灾难恢复技术实现方案,相应地,投资规模和运行成本也将会不同。根据信息中心的实际状况,档案馆选择容灾系统方案时应考虑以下几点:
目标-1:应对灾难的种类
有许多计算机系统内部以及计算机所处环境中的潜在因素可能会造成数据丢失情况的发生。据不完全统计,造成数据丢失的事件中,软硬件和网络故障占11%左右,断电和电源故障占50%左右,火灾地震爆炸和雷电等灾害占18%左右,人为因素占17%左右,其他因素占4%左右。为应对不同的灾难,主中心和灾备中心的选
址也会不一样。例如为抵御地震灾害,主中心和灾备中心应选择在不同的城市,而不宜选择同城;为抵御长时间停电故障,主中心和灾备中心就应选在由不同的输变电网络和电厂覆盖的区域。
只有明确灾难恢复方案所要应对的灾难的种类,才能科学地选择主中心和灾备中心的地理位置。
目标-2:恢复时间目标(RecoveryTimeObjective)
恢复时间目标(RecoveryTime Objective-RTO)是灾难发生后业务能够容忍的停顿时间,或者说灾难发生后,恢复业务运行所需要的时间。一般来说,恢复时间(RTO)越短,那么灾难恢复方案的成本就越高,但是造成的业务损失就越小;反之,恢复时间(RTO)越长,灾难恢复方案的成本较低,但是造成的业务损失就较大。
最佳的恢复时间目标(RTO)应为业务影响(损失)曲线和方案成本曲线的交点所对应的时间。比最佳恢复时间更短的目标将造成投资浪费;而比最佳恢复时间更长的目标,灾难发生造成的损失会大于方案投资成本,所以灾难损失的风险较大。目标-3:恢复数据目标(RecoveryPointObjective)
恢复数据目标(RecoveryPoint Objective-RPO)是灾难发生后业务能够容忍的数据丢失量,或者说灾难发生造成的数据丢失量。一般来说,恢复数据目标(RPO)越高(即丢失的数据越少),方案的成本越高,但是由于灾难造成的业务损失就越小;反之,恢复数据目标(RPO)越低(即丢失的数据较多),方案的成本较低,但灾难造成的业务损失也较大。
最佳的恢复数据目标(RPO)应为业务影响(损失)曲线和方案成本曲线的交点所对应的目标。比最佳恢复数据目标更高的目标,将造成投资浪费;而比最佳恢复数据目标更低的目标,灾难发生造成的损失会大于方案投资成本,所以灾难损失的风险较大。
目标-4:确定关键业务数据(需灾备保护的数据对象)
按照数据的重要和关键程度,大致将IT系统的所有数据分为三大类:
客户服务类数据:指那些支持数据中心核心产品和服务所需数据,该类数据的恢复
时间目标(RTO)一般在一小时内,而且不允许数据丢失。
业务支持类数据:指那些业务运行所需数据,该类数据的恢复时间目标(RTO)一般小于24小时。
可延缓数据:其他数据如办公室OA等,该类数据的恢复时间目标(RTO)一般小于48小时。
考虑到上述三类数据之间的互相耦合和关联,一般来说,客户服务相关的数据约占数据总量的80%;业务支持数据约占15%;可延缓数据约占5%。
综合以上因素选择适合的容灾模式和机制是非常重要的,可以帮助最大限度避免损失。
3、备份
备份是保证数据安全的最后一道屏障,因为无论是存储还是容灾,所有数据均为在线存放,而备份的数据既可以在线存放,也可以通过磁带等介质离线保存,在线保存的数据可以快速恢复,离线保存的数据可以存放在一个更为安全的特殊环境中。一个大范围的灾难造成本地及容灾系统的数据完全不可用时,通过该备份数据,可以尽可能完整地恢复至可用数据,减少损失。若是由于人为操作失误造成的数据丢失,那么磁盘等介质在线备份的数据可以较快地检索出之前的正确数据。
因此如果在条件允许的情况下,可以考虑磁盘备份和磁带备份相结合,从而尽可能地保障数据安全。现今众多的备份软件越来越好地支持灾难备份恢复,能够通过灾难恢复介质恢复至灾难前的数据、系统设置等,从而更加快速的恢复业务系统。
4、归档
备份的目的就是为了恢复,保证在出现意外情况时保证业务的连续进展;特别是在线备份,对速度的要求相对较高,但对容量的要求则相对较小。
归档的目的与备份完全不同。档案馆保存着大量的数据,其中的60%-80%今后可能很少使用到,但这些数据必须保留以备查询。简言之,归档的目的是为了保证数