基于AHP和k-means算法的电力用户信用度评价
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于AHP和k-means算法的电力用户信用度评价
胡亚红;方豪达;江大川;邵长领;刘瑞
【摘要】目前电力用户的信用度得到了高度的重视.如何评价用户的信用度是电力企业需要解决的重要问题.通过分析电力用户的特性,建立了居民用户和企业用户的信用度评价指标体系.在此指标体系的基础上,使用层次分析法计算出用户的信用度,并根据计算结果为电力用户进行信用等级划分.为弥补层次分析法主观性较强的缺点,使用k-means算法对层次分析法的结果进行检验和修正,得到最终的电力用户信用度等级.实验结果表明电力用户信用度评价算法有效可行.
【期刊名称】《浙江工业大学学报》
【年(卷),期】2018(046)005
【总页数】7页(P515-521)
【关键词】电力用户信用度;层次分析法;k-means算法;评价
【作者】胡亚红;方豪达;江大川;邵长领;刘瑞
【作者单位】浙江工业大学计算机科学与技术学院 ,浙江杭州 310023;中国移动通信集团浙江有限公司岱山分公司 ,浙江岱山 316200;华立科技股份公司 ,浙江杭州 310023;华立科技股份公司 ,浙江杭州 310023;华立科技股份公司 ,浙江杭州310023
【正文语种】中文
【中图分类】TM732
近年来电力市场蓬勃发展,对电力系统进行全方位的评估也越来越重要.电力用户是电力系统重要的组成部分,很有必要对其进行信用度管理.当用户拖欠的电费超过一定额度,或者用户产生某些违规用电行为时,信用系统需要给出警示,通知电力管理部门对用户采取一定措施,如催缴、罚款和断电等.目前,电费的缴纳情况已纳入个人的诚信记录.有效地进行电力用户信用度管理,可以提高用户的诚信意识,减少欠费和违法用电行为,帮助电力公司减轻运营负担,获得良好的经济效益和社会效益.现在已经有一些评价电力用户信用度的模型.卢雯嘉等[1]提出利用遗传算法和BP神经网络建立电力用户评价模型.该方法充分发挥了遗传算法和神经网络的优势,使构成的模型具有两者的优点.王辉[2]从用户的购电水平、信用状况、潜在价值、用电特性和可持续能力5 个方面构建了电力用户评价指标体系,并使用J2EE 开发模式实现了电力用户信用评价及预测系统.杨尚东等[3]利用LVQ神经网络建立了企业用户风险识别系统,以期在电力大客户发生欠费前对其财务状况进行检测,以分析和预测其欠费发生的风险.朱莹[4]按用电类别、电价类别和行业分类等对电力用户进行了分类,并对不同类别的用户建立了相应的评价模型.王绵斌[5]采用层次分析法和理想点法来分析计算用户的信用等级.许盈盈[6]主要考虑了用户的缴费信息及财务信息,利用KMV信用等级评价管理模型.汪莉[7]通过德菲尔法构建了电力客户信用评分指标,并建立了AHP-logistic混合信用评分模型.
现有的研究成果有些使用了主观性评价方法,有些使用了客观性的评价方式.为了充分体现电力用户信用度评价的公正性和客观性,笔者通过分析电力用户的特点,恰当地选取影响用户信用度的相关指标,建立了信用度评价的指标体系.层次分析法(Analytic hierarchy process,AHP)广泛地应用于各类评价系统中[8-10],k-means聚类算法能够有效地进行对象分类[11].笔者首先使用主观性较强的层次分析法进行信用度的计算,之后使用客观性强的k-means算法修正得到的信用度,
从而提高了用户信用等级计算的准确性.内容组织结构如下:1) 建立电力用户信用度的评价指标体系;2) 给出信用度评价公式和数据预处理的方法;3) 介绍基于AHP和k-means算法的电力用户信用度评价算法;4) 以居民电力用户为例,给出电力用户信用度评价实例;5) 总结并给出下一步的研究方向.
1 电力用户信用度评价指标体系的建立
影响电力用户信用度的指标很多,前人的研究也
给出了多种指标体系[12-13].结合已有的研究成果和电力用户的特性,笔者提出了一套电力用户信用度评价指标.由于居民用户和企业用户的属性相差较远,因此为居民用户和企业用户分别建立了评价指标体系.
影响居民用户信用度的关键因素有用户缴费情况、用电贡献和违规用电记录等.其中,用户缴费情况对应的指标包括累计欠费金额、累计欠费率和累计欠费次数.累计欠费率定义为累计的欠费额/三年应缴的电费.用电贡献的对应指标有累计用电电量和月平均缴费额.违规用电记录的对应指标有累计窃电次数、累计窃电电量和累计违规用电次数.所有累计值均是三年的累计值.居民用户的具体指标体系结构如图1所示.
图1 居民用户信用度评价指标体系Fig.1 Credit index system for resident power consumers
影响企业用户信用度的关键因素比较复杂.除了上面提到的因素外,还包括企业容量占比、企业注册资金、企业负债率和用电管理等多个因素.图2给出了企业用户的信用度评价指标体系.图2中,企业的类型可以分为非工业电力用户、普通工业电力用户、大工业电力用户、商业电力用户和农业电力用户.
图2 企业用户信用度评价指标体系Fig.2 Credit index system for company power consumers
2 信用度的定义和数据预处理
2.1 用户信用度的定义
从上述的信用度指标可以看出:信用度指标可以分为两类,即信用度贡献指标和信用度损失指标.信用度贡献指标是指能够提高用户信用度的指标,如用户的正常用电量、按时缴费和进行电力设备节能改造等.相应地,信用度损失指标则指会降低用户信用度的指标,如用户违规用电、窃电和欠费等等.
以居民电力用户为例,月平均缴费额和累计用电电量属于信用度的贡献指标,这类值越大,用户信用度越高.而累计欠费金额、累计欠费率、累计欠费次数、累计窃电次数、累计窃电电量和累计违规用电次数这几个指标,反映的是用户不良的用电表现,属于信用度损失指标.
用户信用度可定义为
用户信用度值
(1)
其中信用度贡献值计算式为
信用度贡献值
式中:coni为信用度贡献指标i的值;wi为该指标对应的权值;n为信用度贡献指标的个数.式(1)中信用度损失值计算式为
信用度损失值
式中:lossj为信用度损失指标j的值;wj为该指标对应的权值;m为信用度损失指标的个数.从式(1)不难看出:用户信用度的取值范围是[0,1].根据电力用户信任度的相关指标值及其权值,就可以计算出其信用度.
2.2 电力用户信用度指标数据预处理
电力用户信用评价指标体系是一个多指标多层次的综合评价体系.由于各评价指标的性质不同,其单位和量级往往差别很大,绝对值小的指标在评价中的作用有可能被绝对值大的指标所掩盖.因此,必须对原始指标的数值进行相应的预处理,以消
除由于量级和单位的差别对评价结果的影响.
假设需要对n个用户进行分析.每个用户有m种评价指标,将第i个用户的第j个
指标记为xij(i=1,2,…,n;j=1,2,…,m).那么n个用户的评价指标值可以用矩阵X表示为
采用极值法进行各指标的无量纲化.具体算法分为两步:
1) 求各列指标的极值.第j列的最大值maxXj,最小值minXj的计算式为
maxXj=max{x1j,x2j,…,xnj}
(2)
minXj=min{x1j,x2j,…,xnj}
(3)
式中j=1,2,…,m.
2) 标准化,即求出每个元素xij对应的无量纲化数值计算式为
(4)
3 电力用户信用度评价算法描述
3.1 基于AHP的信用度评价
采用层次分析法AHP进行各信用度评价指标的权值计算.AHP是一种定性与定量
相结合的、系统化的以及层次化的分析方法[14-16],是进行权值计算时常用的工具.
3.1.1 建立层次结构模型
根据第1节建立的电力用户信用度评价指标体系,居民用户和企业用户的AHP层次结构模型分别如图1,2所示.模型分为三层,最上层为目标层,最下层为方案层,中间是准则层.
3.1.2 构造成对比较矩阵
一般地,对于n个指标A1,A2,…,An进行两两的比较,可以使用成对比较矩阵.成
对比较矩阵定义为
式中:数值aij为指标Ai与指标Aj比较的相对重要性,且上述指标比较尺度在
1~9之间,如表1所示.
表1 AHP评价尺度Table 1 AHP evaluation criteria成对比较标准定义内容1同等重要两个指标具有同等重要性3稍微重要Ai比Aj略显重要5重要Ai比Aj重
要7明显重要Ai比Aj明显重要9绝对重要Ai比Aj重要很多2,4,6,8用于上述标准之间的折中值上述数值的倒数Aj和Ai的重要性比较
3.1.3 一致性检验
为保证系统中使用的成对比较矩阵的有效性,需进行一致性检验.
在成对比较矩阵A中,若aik·akj=aij,则称A为一致阵.若成对比较矩阵是一致阵,取对应于最大特征根n的归一化特征向量w=[w1,w2,…,wn]作为权向量.若成对比
较矩阵不是一致阵,则用其最大特征根λ对应的归一化特征向量作为权向量w,
且Aw=λw.
需要对成对比较矩阵A进行一致性检验,以确定其可用性,使用的指标是一致性
比率.
定义1 一致性指标将CI和随机一致性指标RI(表2)进行比较,可以得到一致性比
率CR,定义
表2 随机一致性指标RI的数值Table 2 Values of
RIn1234567891011RI000.580.901.121.241.321.411.451.491.51
当CR<0.1时,认为A具有可以接受的一致性,其归一化特征向量可以作为权向量.否则要重新构造成对比较矩阵,即对A中各元素的取值加以调整.
3.2 使用k-means算法划分用户等级
层次分析法在权值的确定过程中主观成分相对较重.为了更加客观、准确地评价电力用户的信用度,应结合客观算法对用户信用度进行评价.k-means算法也称为k-均值算法,是一种使用广泛的聚类算法.它属于典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大.该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标,具有较强的客观性[17-18].
k-means算法以k为参数,把需要进行分类的n个对象分为k个簇,簇内对象具有较高的相似度.相似度的计算根据簇内对象的平均值进行[19-20].
假定有n个对象,每个对象有w个属性.k-means算法的描述如下:
输入:簇的数目k和n个对象
输出:k个簇,使误差平方和最小
k-means算法步骤为
1) 任意选择k个对象作为初始的k个簇中心,
每个对象的属性值初始地代表了一个簇的属性平均值.第i个簇的平均值记为
2) 计算每个对象与各簇平均值的距离,将对象赋给最近的簇.距离采用欧式距离,定义为
式中:xi,yj为对象i,j;xiu为xi的第u个属性值.
3) 计算每个簇中对象的算术平均值作为新的聚类中心,i=1,2,…,k.
4) 误差平方和准则函数为
式中:x为簇中Xi的一个对象;为簇Xi中对象的算术平均值.
5) 若E小于给定的阈值,算法结束;否则返回步骤2).
使用k-means算法对电力用户进行分类,对基于AHP方法得到的用户信用度计算结果进行检验和修正.
3.3 结合AHP和k-means进行用户信用度评价
为了能够更准确地评价用户的信用度,可将AHP方法计算出的信用度值和k-means方法计算的信用度值进行加权平均计算,即
用户i的信用度值=α×AHP法计算出的值+
β×k-means法计算出的值
(5)
式中ɑ+β=1.调节ɑ,β的值就可以调节主客观算法对信用度计算的影响.
4 电力用户信用度评价实例
鉴于居民用户和企业用户的信用度计算方法类似,以居民电力用户为例,进行电力用户信用度的计算.
4.1 数据预处理
选取了10 位电力用户的数据,对他们进行信用评价.用户原始数据如表3所示,预处理后的数据如表4所示.
表3 电力用户信用指标数值Table 3 Original value of the indexes户号累计欠费金额/元累计欠费率累计欠费数/次月平均缴费额/元累计用电电量/(kW·h)累计窃电数/次累计窃电电量/(kW·h)累计违规用电数/次10.000.000497.5716
898.6000.0002846.990.131319.1412 440.2100.00030.000.000352.0711 957.0900.00140.000.000138.064 688.83156.75050.000.000159.525
417.6600.0046600.960.081316.2013 662.741133.8917666.240.082378.2016 242.404357.0608793.560.152222.6010 319.723197.2839979.500.63327.522 941.583148.11210446.880.131142.356 484.532843.171
表4 预处理后的数据Table 4 Preprocessed value of the indexes户号累计欠费
金额累计欠费率累计欠费数月平均缴费额累计用电电量累计窃电数累计窃电电量累计违规用电次数
10.000.000.001.001.000.000.000.0020.860.210.330.620.680.000.000.0030.00 0.000.000.690.650.000.000.3340.000.000.000.240.130.250.070.0050.000.000. 000.280.180.000.001.3360.610.130.330.610.770.250.160.3370.680.130.670.7 50.951.000.420.0080.810.240.670.420.530.750.231.0091.001.001.000.000.00 0.750.180.67100.460.210.330.240.250.501.000.33
4.2 基于AHP的用户信用度评价
4.2.1 权值的计算
各层次的成对比较矩阵需要根据用户资料数据、专家意见和决策分析人员的经验经过反复研究确认.表5~8给出了专家对居民用户信息分析后给出的各评分表,据此可以得到各对应的成对比较矩阵.
表5 准则层打分Table 5 Scores for criterion layer准则层缴费情况用电贡献违规用电记录缴费情况1/13/14/1用电贡献1/31/13/1违规用电记录1/41/31/1 表6 相对于缴费情况打分Table 6 Scores for the index of payment缴费信息累计欠费金额累计欠费率累计欠费次数累计欠费金额1/13/15/1累计欠费率
1/31/13/1累计欠费次数1/51/31/1
表7 相对于用电贡献打分Table 7 Scores for power consumption用电贡献月平均缴费额累计用电电量月平均缴费额1/13/1累计用电电量1/31/1
表8 相对于违规用电记录打分Table 8 Scores for illegal power usage违规用电累计窃电次数累计窃电度数累计违规用电次数累计窃电次数1/15/14/1累计窃电度数1/51/12/1累计违规用电次数1/41/21/1
表5对应的成对比较矩阵为
经计算CR=0.071 3<0.1,此成对比较矩阵通过一致性验证.
缴费信息对应的成对比较情况见表6,其对应的成对比较矩阵为
经计算CR=0.037 2<0.1,此成对比较矩阵通过一致性验证.
表7对应的成对比较矩阵为
经计算CR=0.000 0<0.1,此成对比较矩阵通过一致性验证.
表8对应的成对比较矩阵为
经计算CR=0.091 9<0.1,此成对比较矩阵通过一致性验证.
利用这些矩阵可以进一步计算出各指标的权值,如表9所示.其中累计欠费金额、月平均缴费额、累计欠费率和累计窃电次数排在权值前4 位,较符合实际.
表9 指标权值Table 9 Weight of indexes指标权值累计欠费金额0.385 1累计欠费率0.158 4累计欠费次数0.064 5月平均缴费额0.204 1累计用电电量0.068 0累计窃电次数0.081 2累计窃电电量0.023 1累计违规用电次数0.015 7
4.2.2 信用度计算
根据表9中各指标的权值和表4给出的预处理数据,使用信用度计算式(1),进行最初的信用度值计算,得到表10中显示的用户初始信用度值.
表10 用户信用度值Table 10 Consumers’ credit values户号12345678910信用度值1.000.310.970.720.770.370.340.190.000.18
以用户2为例,无量纲化后,他的信用度贡献指标值分别为月平均缴费额0.62,累计用电电量0.68.他的信用度损失指标值分别为累计欠费金额0.86,累计欠费率0.21,累计欠费次数0.33,累计窃电次数0,累计窃电电量0,累计违规用电次数0.则信用度贡献值为
0.62×0.204 1+0.68×0.068 0=0.172 8
同理,信用度损失值为
0.86×0.385 1+0.21×0.158 4+0.33×0.064 5+
0×0.081 2+0×0.023 1+0×0.015 7=0.385 7
根据式(1),用户2的信用度为
0.172 8÷(0.178 2+0.385 7)=0.31
通常对用户是按照信用度等级进行管理的,因此需要将信用度的数值转化为对应的信用度等级.信用度等级和信用度数值对照表见表11.表12给
出了表10中各个用户的初始信用等级划分.
表11 信用度等级对照Table 11 Credit rank reference信用度值信用度等级
≥0.90A0.75~0.89B0.50~0.74C0.20~0.49D<0.20E
表12 用户信用度等级划分Table 12 Rank of each power consumer户号12345678910信用度等级ADACBDDEEE
4.3 使用k-means算法进行用户等级划分实例
利用k-means算法对表4中的电力用户数据进行处理.因为用户等级分为5 类,因此随机选取5 个用户数据(例如用户1,2,4,5,8)作为各初始类中心(表13).迭代10 次后算法收敛,得出5 个类中心及每个类所包含的电力用户信息,如表14所示.
根据k-means算法得到的分类结果,结合各指标的权值,再对10 位用户进行信用度计算,得到的用户信用度值,如表15所示.
表13 初始聚类中心Table 13 Initial clustering centers类中心累计欠费金额累计欠费率累计欠费数月平均缴费额累计用电电量累计窃电数累计窃电电量累计违规用电次数
10.000.000.001.001.000.000.000.0020.860.210.330.620.680.000.000.0030.00
0.000.000.240.130.250.070.0040.000.000.000.280.180.000.001.3350.810.240. 670.420.530.750.231.00
表14 电力用户分类结果Table 14 Clustering result of power consumers类户号累计欠费金额累计欠费率累计欠费数月平均缴费额累计用电电量累计窃电数累计窃电电量累计违规用电次数
11,30.000.000.000.850.830.000.000.1722,60.740.170.330.620.730.130.080.17 34,50.000.000.000.260.160.130.040.1747,8,90.830.460.780.390.490.830.280. 565100.460.210.330.240.250.501.000.33
表15 使用k-means得到的用户信用度值和信用度等级Table 15 Credit values and credit ranks by k-means algorithm户号12345678910信用度值
0.990.330.990.810.810.330.180.180.180.18信用等级ADABBDEEEE
对比表12,15,AHP和k-means计算出的结果基本一致,仅用户4,7的等级分类有一些出入.
4.4 最终用户信用度值的确定
当考虑AHP和k-means算法对最终的用户信用度值计算同等重要时,可取
α=β=0.5.则最终的信用度值计算结果和用户信用度等级如表16所示.
表16 用户最终信用度值和信用度等级
Table 16 Final credit values and credit ranks for power consumers
户号12345678910信用度值1.000.320.980.770.790.350.260.190.090.18信用等级ADABBDDEEE
由表16可以看到:电力用户1,3信用度等级高,他们的用电习惯良好,是值得信赖的用户;用户4,5是B等级,他们用电习惯良好,有一定的用电贡献;用户2,6,7有一定次数的违规和欠费行为,造成一定的用电损失;而用户8,9,10属于用电情节比较恶劣的,这些用户违规用电次数很多,用电贡献远小于违规行为
所造成的损失,需要着重管理.
5 结论
通过对电力用户特性的分析,分别提出了居民用户和企业用户的信用度评价指标体系.为了能够准确、客观地评价用户的信用度,结合层次分析法和k-means算法构建了电力用户信用度的评价模型.首先通过AHP方法计算电力用户各个评价指标的权值,并给出初始的用户信用度等级.再用k-means方法对AHP方法计算的信用度进行检验和修正.算法的解释和验证以居民用户为例进行.实验结果表明笔者提出的方法有效可行.后续的研究将着重考虑如何在已有的用户信用度计算模型的基础上,完善信用度管理体系,并对不同信用度的用户提供不同类型的服务,以鼓励用户提高自身的信用度水平.
参考文献:
【相关文献】
[1] 卢雯嘉,栗秋华,周林.基于遗传算法和BP神经网络的电力用户信用评价模型[J].电力需求侧管理,2009,11(6):30-34.
[2] 王辉.基于J2EE的电力用户信用评价系统[J].黑龙江科技信息,2009,34:303-306.
[3] 杨尚东,乞建勋,李星梅.基于LVQ神经网络的供电企业用户信用风险识别[J].统计与决
策,2006,23(12):157-158.
[4] 朱莹.电力客户信用评估方法研究[D].上海:上海交通大学,2010.
[5] 王绵斌.供电企业规避电费回收风险的客户信用评价方法[J].华东电力,2007,35(1):21-25.
[6] 许盈盈.电力客户信用等级评价系统的设计与实现[D].大连:大连理工大学,2009.
[7] 汪莉.电力客户信用评价体系研究[D].北京:华北电力大学,2011.
[8] 蒋美仙,徐畅,禹美凤,等.基于AHP和目标规划的物流配送中心集成选址模型研究[J].浙江工业大学学报.2012,40(5):562-566.
[9] 何荣军,卢艳,王钧,等.基于AHP模糊评价法在草菇蛋卷研制中的应用[J].浙江工业大学学
报.2015,43(1):73-76.
[10] 潘国强.基于Fuzzy—AHP的物流企业经营风险评价模型及实证研究[J].浙江工业大学学
报.2013,41(3):237-241.
[11] 龙胜春,傅佳琪,尧丽君.改进型k-means算法在肠癌病理图像分割中的应用[J].浙江工业大学学报.2014,42(5):581-585.
[12] 周嵩.浅谈电力用户用电信息采集系统大数据在用户行为研究中的应用[J].华东科技(学术版),2014(8):271-271.
[13] 辛洁晴,夏正侃,高亦凌.基于事故树的窃电损失要因分析[J].电力系统及其自动化学
报,2014,26(3):47-51.
[14] 张炳江.层次分析法及其应用案例[M].北京:电子工业出版社,2014.
[15] NAYAK P V. Analysis of strategic initiatives using AHP[M]. Berlin:Lambert Academic Publishing,2012.
[16] CAPUTO A C,PELAGAGGE P M,SALINI P. AHP-based methodology for selecting safety devices of industrial machinery[J]. Safety science,2013,(53):202-218.
[17] WU J. Advances in k-means clustering: a data mining thinking[M]. Berlin Heidelberg: Springer,2012.
[18] 毛国君,段立娟,王实.数据挖掘原理与算法[M].北京:清华大学出版社,2012.
[19] ZHU M,WANG W. Improved initial cluster center selection in k-means clustering[J]. Engineering computations,2014,31(8):1661-1667.
[20] HITENDRA T S,VISWANATH B,ESWARA R. A hybrid approach to speed-up the k-means clustering method[J]. International journal of machine learning and cybernetics,2013,4(2):107-117.。