基于大数据的通信电源监控系统的设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于大数据的通信电源监控系统的设计
曾崧;付圻
【摘要】数据挖掘是进行海量数据处理的重要方式.利用粒计算理论对通信电源监控系统的数据进行有效的分解、归一,从而为掌握电源运行特性提供有效的数据基础.为了提高粒计算的有效性,采用粒计算的三元法对模型进行了改进.改进的算法在不影响原算法特性的基础上,极大地提高了海量数据的处理能力,为通信电源的智能监控提供了良好的方法.%Data mining is an important way to deal with massive data.The granular computing theory was utilized to effectively decompose and normalize the data of the communication power supply monitoring system,so as to provide an effective data base for grasping the power operation characteristics.In order to improve the effectiveness of particle calculation,the grain calculation of ternary method was used in this model to improve the model.The improved algorithm can greatly improve the processing capacity of massive data without affecting the characteristics of the original algorithm,and provides a good method for intelligent monitoring of communication power supply.
【期刊名称】《电源技术》
【年(卷),期】2017(041)011
【总页数】3页(P1649-1651)
【关键词】通信电源;数据挖掘;分层粒化归一;智能控制
【作者】曾崧;付圻
【作者单位】长江工程职业技术学院,湖北武汉430212;长江工程职业技术学院,湖
北武汉430212
【正文语种】中文
【中图分类】TM73
1 通信电源数据管理特性分析
通信电源是移动通信的基础设施,是基站的动力支撑设备。
为了保障移动通信的可靠性,对通信电源进行实时的监控是必要的手段。
基站电源的监控系统需要对基站中的各种低压配电、直流开关电源、油机、蓄电池等系统的各项性能指标进行有效的监测,实时的判断,并智能地决定其运行的状态,从而为整个系统的智能控制提供有效的支持。
同时,整个电源系统的运行环境也对电源的状态有着重要的影响。
因此,环境的温度、湿度等信息和控制设备也属于被监控的对象,从而构成了一体化的通信电源状态监控体系。
而在监控的过程中,各种数据纷繁复杂,给有效的分析造成了不利的影响,因此,采用数据挖掘技术对数据进行有效地分析是解决这一问题的重要方式。
2 基于粒计算方法的大数据挖掘方法的研究
数据挖掘是处理大数据的重要方式,主要目的是对所采集数据进行有效的分析,从而总结及发现数据中蕴含的知识和相应规律,并形成对实际生产过程的指导或管理意见。
数据挖掘不仅仅是对特定数据序列的整理和查询,而且是对这些数据的微观处理和宏观的统计,因此,常规的数据库处理方法已经不能满足相应的需求,而机器学习、神经网络、模式识别、数理统计等方法都成为数据挖掘的重要方式。
在众多的方法中,粗糙集方法是近年被大家关注较多的一种方法。
粗糙集理论主要善长于处理三种类型的数据,这三种类型分别为所采集数据完整性
不强、数据精确度不高、数据的一致性有待进一步改进。
在通信电源系统中,所采集的数据受各种环境影响较大,尤其对于偏远地区的基站,其主要的电源是可再生性能源,而此类电源系统波动性大,数据非线性强,预测难度大,因此特别适合利用粗糙集理论来解决相应的问题。
粗糙集理论与其他数据挖掘理论相比较,最明显的特点是不需要该问题的先验知识,数据特性的挖掘和分析直接利用当前数据进行分析和推理,从中发现数据当中所隐含的知识,揭示数据中所潜在的规律,因此是一种天然的数据挖掘或者知识发现方法。
与其他的数据分析方法具有很强的互补性。
粗糙集理论的核心是“知识”[1],所谓的“知识”是一种带有特定性质的信息处
理方式,也是对现实或抽象的外界信息或对象进行分类的能力,并以此分类形成各个带有某种特征的信息集合的过程。
对于通信电源的各个监控数据而言,其处理主要经历五个环节,这五个环节分别为:(1)利用底层数据采集系统对电源系统的电压、电流、功率、蓄电池状态、各开关状态进行有效的采集,采集后的结果是一组繁杂多变的数据,而这些数据可能随天气的变化、设备的老化程度等因素有较大的变化,有些变化有一定的意义,需要在数据决策中重点分析,而有些数据只是偶然发生的,只是数据的干扰项,所以在进行利用粗糙集理论构建通信电源数据集合时,需要对数据进行相应的预处理,而粗糙集理论的优势就是可以实现对数据特征进行更准确的提取;(2)由于采集数据的杂乱性,所以数据处理的第二个环节就利用粗
糙集理论的数据约简特性,对采集数据中的噪声数据去除,也就是对数据集进行降维操作,这一过程为通信电源监控系统的数据准备过程。
数据降维的方法很多,如PCA(Principal component analysis,主成分分析)、LDA(Linear discriminant analysis,线性判别分析)、LTSA(Local tangent space alignment,局部切空间
排列)、Laplacian Eigenmaps(Laplacian 特征映射)、Isomap(等距映射)、
LLE(Locally linear embedding,局部线性嵌入)、MVU(Maximum variance
unfolding,最大方差展开)、LPP(Local preserving projection,局部保留投影)等,而针对通信电源的数据准备过程中,本设计可以利用PCA算法进行有效的数据处理。
具体的说,PCA方法就是利用矩阵分析方法进行数据集合特征值和特征向量的求
解过程。
主要的过程是利用系统协方差矩阵,按照特征值的重要程度,剔除不重要的特征值,保留相应的重大特征值,从而达到减少特征向量个数的目的。
当一个问题的特征向量少了,它的线性空间的基数就会相应的减少,从而达到降维的目的。
PCA的数据处理可以利用MATLAB自带的实现方式进行操作,也可以自行利用程序进行操作,图1为相应的PCA代码图。
图1 PCA代码
经过PCA算法进行过滤的数据具有了一定的数据的导向性,基本能够体现系统的
本质,那么此刻,就需要进入到粗糙集处理的下一步(3)数据挖掘阶段。
系统的数
据经过前两步的处理过程,对于通信电源监控系统明显的干扰项已经去除,数据的维度也已经进行了调整,而进一步的数据处理就是利用数据挖掘技术达到三个目的:第一个目的是通过数据的分类处理,挖掘出数据之间的关联关系,形成监控对象的有效分析模式;第二个目的是详细地分类处理使通信电源系统中的海量数据库形成多种数据表达和显示的方式,从而帮助工作人员形成系统的数据分析结果;第三个目的是利用数据挖掘技术对数据库内不完整、不准确、冗余数据及自相矛盾的数据以最稳定和快捷的方法进行识别和纠正。
在本设计中,将粒计算与决策树相结合,构造了以通信电源稳定性工作和经济性工作为前提的对象模型,利用粒计算思想对各对象进行粒度的分类和计算,并利用粒度计算的结果对对象元素进行分类排序,排序结果利用决策树进行分类划分。
而本设计中决策树采用最优二叉树来实现对象的多分类划分,具体的构建方法分为四步,具体过程如图2所示。
图2 基于粒计算决策树的构建步骤
如图2所示,利用基于粒计算的决策树构建需要四个步骤,分别为∶(1)利用粒计
算原理对通信电源的监控对象进行有效的分析,分析的原则遵循三元论原理,对通信电源中的低压配电单元、蓄电池单元、环境空调单元、油机单元等几类对象进行分类元素分解,形成有效的结构化信息体系;(2)根据第一步的结果分析结构化信
息体系,形成粒样本,每一个粒样本针对一个所监控的元对象;(3)分析粒样本对
象所包含的属性,依据属性值确定粒样本的相应粒度;(4)根据每个对象所形成的
粒信息模型构建最优二叉决策树。
并结合树及模型完成整个监控系统的最后两步,一个是数据的解释和评估,另一个是数据的决策。
粒计算决策树的构建过程是整个系统的关键所在,最优二叉树也称为哈夫曼树[2],特点是叶结点为相应的分析元素,从根结点到达相应叶结点所经过的结点构成路径,当叶子结点的权值越高时,所经过的路径最短,从而形成以每一个监控对象为分枝的最优二叉决策树,算法步骤如下:
Step1∶根据通信电源各监控元素的分类信息,计算每一个分类Xi(i=1,2,…,k)的相应粒度,得到一个归属于对象样本模型的粒度值集合 D=(d1,d1,…,di,…,dk)。
Step2∶为每一个通信电源构建一棵二叉树,因此该二叉树只有一个粒,如果通信电源中需监控的对象只有两个,则这两个粒作为二叉树的左、右子树,重要程度高的作为左子树,另一个作为右子树,综合考虑两个粒后形成综合粒度形成根结点,则一棵仅有两个监控对象最优二叉树构建完毕。
Step3∶如果监控对象多于两个,则对相应的监控对象进行排序,从而对这一序列进行构建,构建的过程是:先选出重要程度最小的两个对象,按照Step2的方法
构建子树,生成的树根形成新的粒度特性并按其重要程度形成新的权值,将这个权值放进排序集合再进行排序,再从最小的权值中选两个,构建相应的分支树,以此类推,形成一棵完整的最优二叉树。
图3为构建的决策树,其中S1...S6为重要程
度排序。
图3 粒-最优二叉树
按照以上步骤构建哈夫曼树后,可以有效地形成监控对象的信息模型,从而为海量的数据处理与决策形成有效的基础。
3 结语
本文利用最优二叉树结合粒计算的三元论原则,实现了对通信电源海量监控数据的分类计算,可以有效减少冗余数据,加快数据的决策过程。
经过MATLAB的仿真验证,应用粒计算来解决多变性监控数据,具有一定的应用价值。
参考文献:
[1]卫婷.基于粒计算的海量数据挖掘算法研究[D].重庆:重庆邮电大学,2007:19-21.
[2]陈丽芳,陈亮,刘保相.基于粒计算的哈夫曼树SVM多分类模型研究[J].计算机科学,2016(1):64-67.。