探索基于大数据分析技术的智能运维体系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
技术
Special Technology
D
I G I T C W 专题
58DIGITCW
2019.09
整体而言,我国互联网金融的发展起步较晚,运维体系有很大的改进空间,将大数据技术融合到智能运维体系中,可以挖掘数据的潜在价值,并且实时进行监控,做好事前预测和事故处理工作。针对传统运维方式的不足之处,本文从新的角度对智能运维体系进行了研究,具有一定的积极意义。
1 大数据分析技术智能运维体系的构建
目前,IT 运维环境日益复杂,需要管控的对象日益庞大,传统的运维体系在应用过程中显得捉襟见肘,所以需要应用大数据分析技术构建智能运维体系。1.1 采集
本文以某工商银行的管理系统为例,并且采访了相关的专家,根据专家的意见,确定了模型的数据范围,比如登录日志、交易日志等,以2017年1~12月的数据为主要参考对象,在此基础上进行了加工处理,并且分为登录、登出、失败、交易和异常五大指标,然后对这些指标进行汇总,建立了相关的时间序列。1.2 探索
在对数据进行探索时,需要将数据进行分类,比如分为训练集、验证集等,并且对五大指标进行观察,可以选择10分钟为一个时间粒度。经过探索发现,工作日的上午和下午都会有两个波峰,趋势相似,但是幅度有所区别,而非工作日,比如周末、法定假日等,交易量明显减少。如果系统出现故障,那么交易量会急速下降,而当故障解除后,交易量会逐渐回到正常水平。因为系统日志记录存在一定的误差,也没有对出现异常的原因进行分析,加上登录失败可能是由于密码错误引起的,所以本文以登录、登出和交易这三大指标为主要研究对象。
2 大数据分析技术智能运维体系的拓展
2.1 开发
首先,要对数据进行预处理和预分析,可以通过数据的集合,观察系统亚健康状态时变量的情况和特征,找到规律。一般而言,系统发生故障时,系统变量会有所降低,而且在故障发生之前,这种降低已经出现,只是比较缓慢,需要经过多个周期。
其次,要建立参考区间,对历史数据进行全面的分析,确定不同时间段内变量的波动区间。为了保证序列能够进行对比,我们需要将数据进行统一的处理,形成标准数据。公式为Vit=Iit/ηit ,其中Iit 指的是t 时刻第i 个变量的输入值,而ηit 指的是标准化系数,也就是均值,而Vit 指的是经过处理后的变量值,也是频数相对率。
再次,因为变量标准化需要获取当日均值,而在进行实时监控时,要引入因子指标,计算出不同时刻频数占总频数的比值。一般而言,上班时间开始时,系统的变异系数相对较低,约等于0.2。
最后,在预警信号的产生方面,需要对变量的相对值和边界值进行加权计算,这样能够提高信号的准确性。对于一些突发式的故障或者是黑客的攻击等,该系统并不适用,所以在应用的过
程中,还要具体情况具体分析。2.2 检验
在对智能运维体系模型进行检验时,需要做好概念的分析工作,比如系统故障,假设15个工作日,其中有8次波形异常,而系统亚健康状态发生时间在波形异常之前,如果缺乏记录,就会影响频数最低点记录的真实性,而且会产生较大的误差。至于波形异常,包括波形显著上升、显著下降和平稳时间过长三类。经过检验,发现故障点共有13个,有10次识别成功并且进行了预警,而波形异常情况共有20次,有18次成功识别。在对信号进行统计后,发现智能运维体系的准确率为77%,漏报率为23%,而且预报的平均时间比故障时间提前了将近半小时,能够很好地保证系统运行的效果,并且为故障的及时解决争取到了宝贵的时间[1]。2.3 应用
大数据分析技术智能运维体系的流程如图1所示,在模型应用过程中,发现能够准确预测和判断系统的亚健康状态,尤其是在2017年10月份,系统运行出现高峰,在这一期间运维体系发挥了得天独厚的优势,对故障进行了多次预警,帮助和协调工作
人员顺利完成维护工作,减少了可能出现的损失。
图1 大数据分析技术智能运维体系
3 大数据分析技术智能运维体系的优化
为了保证智能运维体系达到最佳效果,对所有故障都能够进行准确的判断和预警,需要从以下三方面入手:
第一方面,扩大数据来源。在数据采集方面,要打破纵向和横向的局限,扩大数据的周期,比如选择十一五期间某银行的数据,这样可以减少系统用户行为受到季节或者是特殊日期的影响,从而保证结果的真实性。另外,可以对数据进行分类,分为管控数据、配置数据、作业数据、容器数据以及集成数据等,同时还要做好故障的定位工作。
第二方面,丰富算法规则。可以引入新的变量,然后结合关键指标的变化情况,建立决策树或者是使用神经网络算法,提高预测结果的精度,降低外界因素的干扰。如果输入和输出存在正相关的关系,那么就可以对向量进行分解,然后调节各个分量之和的参数,让最终结果能够接近真实结果,如图2所示。
第三方面,结合专业经验。在对数据进行定量分析和定性分析时,不能停留在表面,而是需要与大数据领域的专家进行沟通和交流,并且根据故障发生的场景,总结出故障的特点,然后形成模型,这样能够保证当再次发生同样的故障时,可以及时采取
探索基于大数据分析技术的智能运维体系
钟茂年
(中兴通信股份有限公司,深圳 518057)
摘要:新的时代背景下,大数据分析技术的价值日益凸显,在社会各领域发挥着积极的作用。本文以银行为例,探讨了基于大数据分析技术的智能运维体系,从构建、拓展、优化和保障四方面进行了分析,希望能够为相关的工作提供一定的参考,促进智能运维体系的良好发展。
关键词:大数据;智能运维;故障;信号doi :10.3969/J.ISSN.1672-7274.2019.09.039中图分类号:F832.2 文献标示码:A 文章编码:1672-7274(2019)09-0058-02
Special Technology
专题技术
DCW
59
数字通信世界
2019.09
(上接第14页)为O (KMN )。因为GOMP 算法一次迭代匹配多个原子,迭代次数s 往往比K 小很多,因此GOMP 算法大幅度降低了算法的计算复杂度。此外,由于K=M ,M 值得注意的是,虽然测量矩阵的相干性最小化不占用接收端的信道重构时间,但由于其通过循环迭代实现,需要一定的硬件消耗,因此针对高精度需求的场景可以采用M-GOMP-op 算法,而在一般的场景中采用M-GOMP 算法即可。 5 结束语 本文结合测量矩阵相干性最小化和快速的原子选择给出一 种高精度低复杂度的信道估计方法,即M-GOMP-op 算法,它通过相干性最小化实现高估计精度,通过LS 算法选择原子,实现低计算复杂度。理论分析和计算机仿真表明,M-GOMP-op 算法在提高信道估计精度的同时可以大幅度降低算法的计算复杂度。M-GOMP-op 算法的提出为5G 无线通信实现高效且准确的信道估计提供了一个有效的解决方法。参考文献 [1] G ao Hongyuan ,Su Yumeng ,Zhang Shibo ,et al. Antenna selection and power allocation design for 5G massive MIMO uplink networks[J]. China Communications ,2019,16(4): 1673-5447. [2] J . T. Dias ,R. C. Lamare ,Y . V . Zakharov. BEM-based channel estimation for 5G multicarrier systems[C]// WSA 2018,22nd International ITG Workshop on Smart Antennas. Bochum ,Germany : VDE Press ,2018: 1-5. [3] V . Adinarayana ,K. Murali Krishna ,P. Rajesh Kumar ,et al. Performance comparison of compressive sparse channel estimation and feedback in 5G for hyper MIMO system[C]//2017 IEEE International Conference on Circuits and Systems (ICCS ). Thiruvananthapuram ,India : IEEE Press ,2017: 297-301.[4] K . Chelli ,P. Sirsi ,T. Herfet. Sparse doubly-selective channels : Estimating path parameters unambiguously[C]// 2017 European Conference on Networks and Communications (EuCNC ). Oulu ,Finland : IEEE Press ,2017: 1-5.[5] G e Ljun ,Zhang Yue ,Chen Gaojie ,et al. Compression-based LMMSE channel estimation with adaptive sparsity for massive MIMO in 5G systems[J]. IEEE Systems Journal ,2019: 1-11. [6] X iang Ren ,Wen Chen ,Wang Zijian. Low coherence compressed channel estimation for high mobility MIMO OFDM systems[C]// Global Communications Conference (GLOBECOM ),2013 IEEE. Atlanta ,GA : IEEE Press ,2013: 3389-3393. [7] C hen Jungchieh ,Wen Chaokai ,Ting Pangan. An efficient pilot design scheme for sparse channel estimation in OFDM systems[J]. Communications Letters ,IEEE ,2013,17(7): 1352-1355. [8] I . Khan ,D. Singh. Efficient compressive sensing based sparse channel estimation for 5G massive MIMO systems[J]. AEU-International Journal of Electronics and Communications ,2018,89: 181-190. [9] W ang Jian ,Seokbeop Kwon ,Byonghyo Shim. Generalized orthogonal matching pursuit[J]. IEEE Transactions on Signal Processing ,2012,60(12): 6202-6216. [10] E . J. Candes. The restricted isometry property and its implications for compresses sensing[J]. Comptes Rendus Mathematique ,2008,346(9): 589-592. [11] 范馨月,苏艳涛,周非.一种低复杂度稀疏信道估计算法[J].计算机工程, 2016,42(16):120-130. [12] 苏艳涛.基于压缩感知的双选择性稀疏信道估计算法研究[D].重庆邮电大 学,2016. [13] 苏艳涛,檀童和,李志立.一种新颖的低复杂度稀疏信道估计算法实现[J]. 广东通信技术,2016(1):18-22. 既有的故障解决措施进行解决[2] 。 图2 神经算法 4 大数据分析技术智能运维体系的保障 4.1 定位 对于金融机构而言,如果想要保证大数据分析技术智能运维体系正常运行,需要做好定位工作,尤其是要明确智能运维体系的特点以及能够取得的效果。另外,还要注意执行的方式,是选择个性化还是侧重于安全,是兼顾效率和安全,还是强调体系的整体性。从客观角度看,随着大数据分析技术的日益成熟,智能运维体系在金融机构日常运行和管理的重要性日益凸显,所以安全问题逐渐受到人们的重视,所以在明确体系定位上,既要从整体角度考虑问题,也要确保体系的安全[3]。4.2 规范 对于智能运维体系所需要和涉及的信息,要做好统一工作,比如用户信息、口令信息等,并且做好监控和管理工作,尤其是要做好实时更新工作。在信息认证方面,众所周知,身份认证十分关键而且必不可少,如何对用户信息进行集中管理,是一项十分艰巨的任务,稍有不慎,可能会与监管工作存在一定的冲突,而且进行改动时,可能涉及密码保存的形式,所以需要认真考虑。另外,在流程和权限方面,也要从全局的角度考虑,避免对整个金融机构的运营产生不良影响。虽然智能运维体系能够起到很好的预警作用,但是由于金融机构的活动众多,客户广泛,所以必须要规范金融活动的流程,而且要明确工作人员的责任,做好分工,比如在授权方面,需要金融机构领导批准和签字,工作人员未经许可,不得从事权限以外的活动。4.3 人员 无论是管理人员,还是技术人员,都要提高自身工作水平和素质,保障智能运维体系的稳定运行。在过去很长一段时间内,由于工作人员水平低下,导致金融机构蒙受损失的情况时有发生,所以要对这类人员进行培训,提高他们的能力,打造素质过硬的员工队伍,同时也要做好宣传工作,让智能运维体系深入人心,在机构和单位内部形成良好的氛围和环境。只有工作人员了解智能运维体系的特点,才能真正提高运维水平,并且提高服务水平。 5 结束语 综上所述,基于大数据分析技术的智能运维体系在应用过程中取得了很好的效果,提高了系统预警的质量,保证了系统的稳定运行,极大地减轻了工作人员的负担和压力。但是在具体的应用过程中,还有很大的提升空间,所以在未来的发展中,智能运维体系还需要不断丰富内容和形式,与时俱进。参考文献 [1] 李刚.基于大数据及云计算的电务综合运维技术研究[D].中国铁道科学研究院,2018. [2] 陈庆.浅谈数据中心设备及机房的智能化运维管理[J].中国金融电脑,2018(03):58-61. [3] 张帝,李庆华.关于运维自动化建设若干关键点的思考[J].中国金融电脑,2018(08):43-45.