关于民航数据库系统一次故障的分析与探讨

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关于民航数据库系统一次故障的分析与探讨
摘要:提出对于民航数据库系统一种启动故障的处理。

由于多种原因可以导致系统启动故障,或启动后效率低下,本文仅针对表空间、磁盘存储空间等问题引发的启动故障进行分析探讨。

关键词:民航数据库系统、表空间、表空间利用率
随着民航事业的不断发展,对航空气象信息的要求也不断提高。

民航数据库系统,是一个能够实时分享各地气象信息、为航班提供准确、可靠气象数据的系统。

可用于全国机场的航空气象服务,以及气象研究等。

1 民航数据库系统的构成与原理
1.1民航数据库系统的数据来源
民航数据库系统主要通过从多种渠道获取气象数据,包括以AFTN网络、自动观测数据、WAFS资料、卫星资料、雷达资料和数值预报产品等。

1.2民航数据库系统的构成
整个系统分为业务处理和业务展示两个部分。

业务处理部分主要包括通讯前置系统和气象信息数据库,业务展示部分主要分为气象预报应用平台和气象服务应用平台两大部分。

各地区气象数据库通过通讯前置系统从各航站或各种数据源获取各种相关的气象数据,将数据进行分类、解析和处理后,按规则存储在相关的数据库中。

气象预报应用平台从数据库中提取相关数据,以图形方式展现给气象预报人员,为航空气象预报提供服务。

气象服务应用平台从数据库中提取相关产品,以C/S或B/S的方式向各种用户提供航空气象服务。

通讯前置系统是民航数据库系统中的基础系统之一,它主要实现航站内各类气象资料的接受、质量检查、格式转换处理,并根据事先确定的规则向航站内其他系统和地区中心进行分发资料,实现地区中心与航站之间的数据交换。

1.3民航数据库系统运行原理
民航数据库系统的主服务器部分,运行原理包括资料处理和数据库管理两部分。

资料处理共有12个进程,分别可对应处理的气象信息包括:民航报告、常
规报告、自动观测资料(AWOS)、风温廓线仪、自动站资料、Bufr资料(世界气象组织提出的气象资料编码结构,主要面向气象卫星风矢量)、Grib资料(同为编码结构,主要面向世界区域预报系统的风温资料)、Fax资料(气象传真图)、卫星云图资料、本地图形图像资料、多媒体资料、雷达资料。

数据库管理采用客户机服务器方式,可对资料处理、数据库等进行实时监控和管理。

主要提供以下功能:系统登录、资料处理、数据库管理、数据库恢复、日志和统计、用户管理、进程管理、系统配置、窗口管理、帮助等。

其告警功能可对资料处理子系统的运行异常、服务器端运行异常、监控进程运行异常、数据库的运行异常以及资料处理过程中的特殊情况进行告警。

2 Oracle数据库表空间简介
民航数据库系统,使用甲骨文公司的Oracle9i数据库,构架在IBM公司的AIX系统中。

Oracle数据库系统是目前世界使用最广泛的计算机数据库系统,是构建大型应用数据库的首选。

2.1 数据库表空间原理
Oracle数据库被划分成称作为表空间的逻辑区域——形成Oracle数据库的逻辑结构。

一个Oracle数据库能够有一个或多个表空间,而一个表空间则对应着一个或多个物理的数据库文件。

表空间是Oracle数据库恢复的最小单位,容纳着许多数据库实体,如表、视图、索引、聚簇、回退段和临时段等。

2.2数据库表空间的作用
其主要作用包括:控制用户所占用的表空间配额;控制数据库所占用的磁盘空间;灵活放置表空间,提高数据库的输入输出性能,可以对表空间进行独立备份;进行数据大表的排序操作;日志文件与数据文件分开放,提高数据库安全性。

3 数据库故障现象介绍
2013年10月初,数据库系统存在大量报文积压,MQ通道报错,机务员按照常规处理办法,对数据库服务器进行重新启动。

再次启动时,系统报错,如图:
由图可知,数据库接口已经启动,MQ通道已经启动,数据库启动报错,“There is not enough space in the file system”。

然后最下方却提示“Started server Successfully!”。

此时说明为,系统服务器运行进程无错,存储空间不足。

经查证,确认为服务器运行日志空间不足。

删除该类别日志文件后,服务器
可以启动。

但仍然处理速度缓慢,收发的报文存在堆积现象。

所以开始查找服务器存在的其他问题。

使用数据库管理系统登录到服务器,查看服务器运行情况。

发现磁盘空间利用率差。

正常情况应该如图:
其中表空间利用率已满,如图:
应用库已经89.9%,历史库已经76.5%,均已经超过警戒值。

4 数据库系统故障的解决
4.1表空间问题的处理
为缓解数据库空间问题,提高整理效率,先检查临时表空间使用情况。

发现临时表空间已经100%使用。

所以先释放临时表空间,为今后各项工作提高效率。

如图:
在数据库表空间状态查询页面下,即可右键单击temp表空间选项,选择释放临时表空间TEMP。

很快临时表空间,即可释放完毕。

然后选择释放历史库和应用库,在右侧对话框中打勾,然后选择释放空间即可。

如图;
整理表空间需要时间,大概在4-6小时左右。

本次表空间浪费情况特别严重,粗率统计历史库和应用库释放空间,总计花费超过60小时。

4.2磁盘空间的进一步优化
为了进一步提供空间利用率,可以将保存在服务器端的各种数据文件迁出到本地计算机保存,以节省服务器端的空间。

文件迁出前需要先对数据库内文件进行归档封存,文件归档是对数据库内数据的一种保护措施。

因为数据库内的数据信息,时刻处于更改的读写状态,同时并非是我们可以直接解读的完整信息。

对数据文件进行归档处理,可以保证数据内容的完整,同时各种信息分类明确、清晰。

如图;
选择资料处理--人工归档,在左侧选择需要归档的类别,在右侧上方选择时间。

人工归档,一般需要2-6小时,视服务器内存储数据多少而定。

同时,由于本次服务器内存储空间不足,归档过程非常缓慢。

大概用时近10小时。

归档后的文件,就可以进行迁出了,如图:
通常为了将服务器中的数据彻底迁出,以便节约服务器内存储空间,对开始时间段的选择会非常靠前。

截至时间段选择距离现在有1个月左右的时间,以便现有数据的近期内使用。

如图:
并非数据迁出后,数据库就再也没有选定时间段内的文件资料。

因数据库一直处于联网运行状态,在与其他航站数据库或地区中心数据库进行数据交换后,可能会有部分选定时间段内的数据再次进入,并保留在服务器内。

所以选择迁出时间段时,会多选择一大段时间,确保上次迁出后的文件,在经过数据交换存入服务器后,可以再次被迁出。

文件归档时间视服务器端文件资料多少而定,一般2-3个月左右的资料需归档6-10小时。

本次文件归档持续近14小时,属于超长时间了。

然后选择本地保存路径,已方便刻录光盘保存或转移至其他大容量存储器长期保存。

如图:
各选项选择完毕后,点击开始筛选文件。

待系统筛选完毕后,点击下方的开始迁出。

如图:
迁出中界面:
整个过程,视系统内归档文件多少而定。

一个月内的数据归档迁出时间,大概需要2-4小时左右。

本次迁出归档文件,大概使用时间为8小时,有近12G的数据迁出服务器。

经过处理系统日志存储空间,清理数据库表空间、释放表空间被浪费的碎片,归档和迁出数据文件。

现在服务器的工作效率得到了显著提高。

确保定期按计划进行维护,即可以确保数据库系统长期稳定的运行。

参考文献
[1] 《民航气象数据库系统发布》,王慧清,民航甘肃空管分局,《信息通信》2013年8月
[2] 《关于民航气象数据库系统的一次故障分析及处理办法》,张宏伟,民航东北空管局气象中心,《民营科技》2008年10期
[3] 《民航气象数据库系统资料处理流程解析》,赵普洋,民航大连空中交通管理站,《信息与电脑(理论版)》2012年11期
[4] 《浅析民航气象传真广播系统二期工程的实际使用意义》,孙美选,民航华东空管局气象中心,《科技致富向导》2013年第21期
[5] 《民航气象第三级数据库系统管理维护和典型故障处理》,梁帆,民航桂林空管站,《硅谷》2011年第24期
作者金矿,1980-08-08,男,籍贯辽宁省锦州市,现居住吉林省长春市,助理工程师,研究方向为计算机数据库系统。

相关文档
最新文档