基于数据挖掘的飞行参数处理方法研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Ξ基于数据挖掘的飞行参数处理方法研究3

梁建海,孙秀霞,杜 军

(空军工程大学工程学院,陕西西安710038)

[摘要]文中在分析飞行参数数据特征的基础上,建立基于多维数据模型的飞行参数数据仓库,实现了模式可复用的飞参挖掘系统软件的设计与应用,有效解决飞参数据知识发现和模式发现问题。最后,实现了飞参关联规则的有效挖掘。

[关键词]飞行参数;时间序列;数据挖掘;知识发现

[中图分类号]V247 [文献标识码]A

The Research of Fl ight Da ta D isposi ng Techn ique Ba sed on Da ta M i n i ng

L I AN G J ian2hai,SUN X iu2x ia,DU Jun

(D epartm en t of A u tom atic Con tro l,T he Engineering In stitu te of A irfo rce Engineering Schoo l,X i’an710038,Ch ina) Abstract:O n the basis of analyzing the essence of fligh t data,th is paper set up data w arehou se of fligh t data w h ich have m u lti2di m en si onal model.T he design and app licati on of softw are of fligh t data m in ing w ith the reu sed pattern is realized in th is paper.T he KDD and pattern discovery of fligh t data is realized effectively.A t last,the associati on ru le of fligh t data is m ined efficien tly.

Key words:fligh t data;ti m e series;data m in ing;know ledge discovery

1 引 言

飞行参数是飞机飞行过程中记录的各种参数信息,对飞行动作识别、设备性能趋势分析和飞行事故鉴定具有重要的作用。飞行参数历史数据库蕴含有丰富的信息和模式,建立数据仓库进行信息和知识的有效挖掘为解决问题提供了有效的手段。

数据挖掘理论是数据处理领域强有力的方法和工具[1],该理论将数学分析的结果和工程应用背景有机结合,在知识经验指导下寻找数据的内在规律,发现隐含、未知的有效信息并为决策提供依据。

2 数据挖掘技术与时序数据库数据挖掘是研究从大型数据库中模式发现技术的可行性、有用性、有效性和可伸缩性的问题,是数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取和信息检索等多学科共同研究的对象。2.1 数据挖掘特点

数据挖掘致力于从数据集中发现出有用的规律和知识。特点有:1、强调待发现规律的未知性,不预先作硬性、严格的规定。2、目标更为具体,认为系统行为不都是规律性的,不必要求拟合全体数据。3、数据分析时不单纯运用数学知识进行处理,有人工智能领域的模式识别和机器学习的思想和技术。4、挖掘的目标可以根据具体情况灵活选择,数据分析的形式比较灵活。上述特点决定了数据挖掘技术成为数据库研究中最活跃和最有发展前景的领域。

2.2 数据挖掘目标与方法

数据挖掘通过关联性、分类、聚类、异常性、趋势分析等知识发现活动,寻找频繁模式、关联规则、分类规则、聚类模式、异常模式、周期性规律。目标可分四个方面:趋势分析、相似性搜索、与时间有关的序列模式挖掘和周期模式挖掘。

关联规则发现大量数据中项集之间有趣的关联或相关联系[2]。分类规则用于提取描述重要数据类的模型或预测未来的数据趋势。聚类模式

Ξ收稿日期:2004208220 修订日期:2004211222

基金项目:空军装备预研项目,数据挖掘技术在飞参处理中应用研究

作者简介:梁建海(1974—),男,江苏徐州人,博士研究生,主要研究方向:故障诊断与预测,数据仓库挖掘技术。

在划分未知类的情况下,将数据对象分成多个类或簇。异常性分析发现不符合一般行为或模型的数据对象。周期性趋势分析发现对象随时间变化的趋势和规律。

2.3 时间序列数据库

时间序列中的值是在按时间顺序在等时间间隔条件下测得的。时序数据库是指随时间变化的序列值或事件组成的数据库,能够实现对时间序列数据的存储和操作,包括对序列的选择、投影、连接以及对序列的各种查询操作。时间序列数据的最大特点在于可以利用时序建模和回归方法进行预测。

3

 飞行参数数据特点与挖掘目标

飞行参数具有状态点的不可重复性,即代表的系统状态不可能完全复现。除飞行时间和接通次数外,绝大多数飞参数据具有不可叠加性,即数据简单相加不产生任何实质意义。这些特点决定了飞参的处理方法具有其特殊性。对飞行参数在单帧、时序曲线和数据仓库下的特点和挖掘方法进行如下分析,如图1所示。

图1 飞行参数特征与方法分析

3.1 单帧参数

飞行参数按帧记录,包含位置参数、运动参数、操纵参数、主系统状态参数和报警参数。单帧参数挖掘的重点是参数相互关系,如飞机操纵时参数间的同步速率、滞后时间和门限差值,用于操纵灵敏度、稳定性判断。研究参数分布规律可对系统设备良好、预警和故障状态进行判断。3.2 时序曲线

飞机工作时的综合性和复杂性使飞机的全系统模型无法用于预测。时间序列分析可进行基于归纳的有效预测,产生结合可性度的预测区域。进行飞行参数时序分析不能简单地从纯数学的观点去拟合数据,需要从非线性系统和动力学系统抽取时序特征。确定目标数据曲线,抽取相应A RM A 时序的模型阶数或建立回归模型再进

行预测。

3.3 数据仓库

飞行参数操作数据库是个历史的、海量的、复合数据源的数据库[3],由于参数本身的意义十分明确,预处理的工作也相对简单,易建成数据仓库。数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,可在进行有效数据挖掘的基础上支持管理人员的决策[4]。

4 飞行参数预处理和数据仓库

飞行参数的操作数据库与数据仓库的区别:・数据仓库中的数据时间期限要远远长于操作型系统中的数据时间期限。操作型系统的时间期限一般是60~90天,而数据仓库中数据的时间期限目标是5~10年。

・操作型数据库含有“当前值”的数据,这些数据的准确性在访问时是有效的,同样当前值的数据能被更新。而数据仓库中的数据仅仅是一系列某一时刻生成的复杂的快照。

・操作型数据的键码结构可能包含也可能不包含时间元素,如年、月、日等。而数据仓库的键码结构总是包含某时间元素。因此,需要对飞参数据库进行预处理后建立相应的数据仓库。4.1 飞参预处理方法

飞参数据采集设备的故障,库文件的输入错误,数据传输的错误都会造成数据不完整性,含噪声和不一致。数据预处理能够提高数据质量和挖掘结果的质量,排除数据中的干扰。预处理的步骤是数据清理、数据集成、数据变换和数据归约。

(1)飞参数据清理方法。根据数据帧标志对数据的有效性进行标识,根据飞行手册的性能参数范围删除孤立点,对于噪声数据根据飞行日报表按数据段进行保留或平滑处理。

(2)飞参数据集成方法。对多数据源数据进行多传感器的数据融合,同性质参数如:气压高度和无线电高度,指示空速和真空速,磁航向和真航向;计算参数如:M 数、真空速和升降速度等。

(3)数据变换方法。采用最小-最大规范化方法对原始数据进行线性变换,按比例映射到特定区间,一般为[0.0,1.0]。

(4)数据归约方法。采用基于序列变化模式的直线子段表示方法(方法):从序列中选

相关文档
最新文档