基于大数据的电力信息网络流量异常检测机制
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于大数据的电力信息网络流量异常检
测机制
摘要:随着网络应用范围的不断扩展,出现了许多不同类型的网络,网络上
传输的数据类型增多,网络拥塞频率比以前也大幅增大,如何保证网络系统的正
常运行显得尤为重要。
基于大数据的发展为网络流量异常检测提供了很好的方法。
网络流量是一种描述网络运行情况的重要指标,对网络流量异常行为进行检测,
可以发现不正常的网络状态和危险,及时发展网络上出现的问题。
因此,如何建
立高正确率的网络流量异常检测模型成了应对目前网络流量异常问题的关键。
本
文主要介绍了网络异常流量的分类和检测方法概述,并简单地介绍了大数据环境
下网络异常的检测,最后进行了仿真试验,希望能为网络异常检测发挥自己更大
的力量。
关键词:网络安全;流量异常检测;电力信息;安全机制
1网络异常流量分类
对于网络流量的异常检测其实是将网络流量进行分类,一种是处于正常状态
下的网络流量状态,另一种则是处于异常状态下,我们所设计的方法就是要及时
的检测出处于异常情况下的网络流量,以及在日常维护过程中提前做出有效的相
关防范措施。
网络流量异常实际上是一种网络流量模式,这种模式会对日常的网
络使用产生不良影响,产生网络异常的原因包括:无可使用的网络存储以及网络
配置错误等;网络的不良使用,如大量频发的P2P应用模式对网络流量所造成的
影响。
网络异常流量大致分为以下几种类型:Alpha Anomaly、D Dos、Port Scan、Network Scan、Worms 和 Flash Crowd。
2网络流量的测量方法概述
对于网络流量的检测其实是为了规范网络环境,优化网络配置,提高用户的
使用效率,目前对于网络流量的测量方法主要分为两类,一种为主动测量方式,
另外一种则为被动测量方式,二者的区别在于,主动测量方式会额外增加网络流
量负担,产生不要的网络拥堵:
(一)主动测量技术
主动测量实际上是在两个指定端点之间加入网络流量从而测试两端点的性能,因此在测量过程中,两端点之间会产生新的流量。
主动测量的方法存在弊端,因为,增加两端点之间的流量本身会加重网络负载,额外的网络流量可能会产生网
络拥堵,产生额外的问题,对用户的使用可能会带来不便。
(二)被动测量技术
被动测量的方法不是向两个指定端点之间加入流量,而是在一个特殊位点来
检测流量,如使用路由器或交换机收集数据。
被动测量的优点在于不会产生附加
流量,不会增重网络负担,因此,被动测量的技术的开发也在不断增加,越来越
广泛地应用到实际生活中。
被动测量获得的数据是一些大小不一的分组信息,可
以用来进行各种流量分析,被动测量技术的发展有利于互联网的发展。
3大数据环境下的网络流量异常检测
由于网络应用的逐渐延伸,产生巨大的网络数据,对于海量的数据处理,传
统计算平台已经无法满足,因此,人们开发了云计算平台,云计算平台整合全网
络全部可利用数据,将大问题分解为很多小问题,最后更好地解决问题。
HDFS 作为 Hadoop 系统的主要核心之一,对数据进行分布储存,且即使是
配置相对较低的机器也可以具备强大的存储能力,在扩展能力和容错能力方面也
具备良好的性能,在计算机复杂的环境中,局部出现失误也不会影响整体的性能。
HDFS的特点就在于对于复杂且庞大的数据,具有超高的存储能力,HDFS的数据
处理信息通常为数百MB甚至数百TB。
但对于稍小数据量的信息,它的处理能力
就稍显薄弱。
在数据访问方面,能够实现频繁地对一次写入多次读写的任务进行
处理,数据越大读取效率越高。
Map Reduce 是在大规模集群上处理海量数据的并行计算模型,Map Reduce
具备简单易扩展的特点,因此,Map Reduce在日志分析、海量数据查找排序等领
域使用较广。
Map Reduce 基本思想是借助映射(map)和规约(Reduce),将处理过程分为 Map和 Reduce操作,每个阶段的输入和输出都以〈key,value〉键值对的形式表示。
HDOOP平台的工作原理实际上是将大型网络流量异常检测任务分为规模较小的任务,每一个小任务由不同的处理点完成,最后汇总到总的管理点,统一分析处理,得到最终的检测结果。
大数据环境下的网络流量异常检测模型的工作步骤为:
(1)首先采集网络流量数据,通常将处于网络入侵的时的数据作为网络流量异常测试。
(2)对最初的网络流量数据进行第一步优化处理,减少数据样本的量。
(3)由Map Reduce将上步所或许的网络数据信息划分为规模较小的样本,然后由各个处理点进行处理。
(4)异常检测结果反馈给管理点,得到训练样本异常检测的最终结果。
4仿真实验环境
为了测试网络流量异常检测的有效性,在Matlab 2014平台进行仿真模拟实验。
通常情况下网络系统状态是正常的,如果存在一些非法入侵行为时,网络流量就会呈现一种异常状态,其中拒绝服务攻击出现频率最高,为此,选择该情况作为网络流量异常检测的测试对象。
当出现行为时,网络流量的值会发生突变,变化曲线产生突变峰。
根据上述模型的工作过程,对网络流量数据进行检测,统计它们的检测正确率,每一种模型运行5次,并统计检测它们的误检率。
与对比的网络流量异常检测模型相比,本文模型的网络流量异常检测正确率明显提高,可以对网络流量异常行为进行准确、有效的检测,同时,网络流量异常的误检率显著减少,降低了网络流量异常检测的错误数量,获得了十分理想的网络流量异常检测结果。
对于大数据的网络流量异常检测,检测实时性十分关键,为此统计两种模型
的网络流量异常检测时间,本文模型的网络流量异常检测时间大约是对比模型的
加快地加快了网络流量异常检测的速度,这主要是由于本文模型采用HDOOP模型
将大数据的网络流量异常检测任务划分为多个子任务,通过管理节点对检测结果
进行融合,减少了网络流量异常检测的建模时间,可以满足网络流量异常的实时性。
5结语
网络的发展是迅速且多元化的,网络的应用深入到千家万户,随着网络应用
范围的不断扩大,网络上传输的数据也逐渐增多,用户在使用过程中有时会出现
卡顿的现象,不仅如此,用户数量的增加使得网络犯罪的概率也在逐渐增大,面
对现状,如何保证网络的安全性及网络的正常运行是我们亟须考虑及解决的问题。
网络流量作为评价网络运行情况的重要指标,对其进行检测有利于我们对网络情
况进行实时检测,因此,设计高效的网络流量异常检测方法是解决网络运行情况
不良的解决方法。
参考文献:
[1]杨青.基于大数据分析的网络异常流量检测[J].机械设计与制造工程,2018,47(11):78-82.
[2]李进文.基于云计算的网络异常检测算法研究[D].河南:郑州大学,2015.。