熵值法的原理及实例讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
熵值法
1.算法简介
熵值法是一种客观赋权法,其根据各项指标观测值所提供的信息的大小来确定指标权重。设有m 个待评方案,n 项评价指标,形成原始指标数据矩阵n m ij x X ⨯=)(,对于某项指标j x ,指标值ij X 的差距越大,则该指标在综合评价中所起的作用越大;如果某项指标的指标值全部相等,则该指标在综合评价中不起作用。
在信息论中,熵是对不确定性的一种度量。信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性就越大,熵也越大.根据熵的特性,我们可以通过计算熵值来判断一个方案的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响越大!因此,可根据各项指标的变异程度,利用信息熵这个工具,计算出各个指标的权重,为多指标综合评价提供依据!
2.算法实现过程
2.1 数据矩阵
m
n nm n m X X X X A ⨯⎪⎪⎪⎭⎫ ⎝⎛=
1111其中ij X 为第i 个方案第j 个指标的数值 2.2 数据的非负数化处理
由于熵值法计算采用的是各个方案某一指标占同一指标值总和的比值,因此不存在量纲的影响,不需要进行标准化处理,若数据中有负数,就需要对数据进行非负化处理!此外,为了避免求熵值时对数的无意义,需要进行数据平移:
对于越大越好的指标:
m j n i X X X X X X X X X X X nj j j nj j j nj j j ij ij ,,2,1;,,2,1,1),,,min(),,,max()
,,,min(212121' ==+--=对于越小越好的指标:
m j n i X X X X X X X X X X X nj j j nj j j ij
nj j j ij ,,2,1;,,2,1,1),,,min(),,,max(),,,max(212121' ==+--=为了方便起见,仍记非负化处理后的数据为ij X
2.3 计算第j 项指标下第i 个方案占该指标的比重
),2,1(1m j X
X P n i ij
ij ij ==∑= 2.4 计算第j 项指标的熵值
1
e 0,ln 10ln ,0,)log(*1≤≤=≥>-=∑=则一般令有关,
与样本数。式中常数为自然对数,其中m k m k e k P P k e j n
i ij ij j 2.5 计算第j 项指标的差异系数。
对于第j 项指标,指标值ij X 的差异越大,对方案评价的作用越大,熵值就越小
j j e g -=1 , 则:j g 越大指标越重要
2.6 求权数
m j g
g W m j j
j
j 2,1,1==∑= 2.7计算各方案的综合得分
),2,1(*1n i P W
S ij m j j i ==∑=
3.熵值法的优缺点
熵值法是根据各项指标指标值的变异程度来确定指标权数的,这是一种客观赋权法,避免了人为因素带来的偏差,但由于忽略了指标本身重要程度,有时确定的指标权数会与预期的结果相差甚远,同时熵值法不能减少评价指标的维数!
理解熵值法
1. 1
学习熵值法,熵值法是一种理论的数学方法,从计算机科学角度上看,属于一种算法。要运用熵值法当然要理解它,搞懂它。
2. 2
熵值法原理:熵的概念源于热力学,是对系统状态不确定性的一种度量。在信息论中,信息是系统有序程度的一种度量。而熵是系统无序程度的一种度量,两者绝对值相等,但符号相反。根据此性质,可以利用评价中各方案的固有信息,通过熵值法得到各个指标的信息熵,信息熵越小,信息的无序度越低,其信息的效用值越大,指标的权重越大。
3. 3
具体的方法步骤见附图课件。
END
利用Excel进行熵值法计算求解
1.给出算例,题干是购买教车的一个决策矩阵,给出了四个方案供我们进行
选择,每个方案中均有相同的六个属性,我们需要利用熵值法求出各属性的权重,级在方案中的贡献度。
2.一:求第j个属性下第i个方案Ai的贡献度,公式为附图一,在excel
中,先求出各列的和,然后用每行的数值比上列和,形成新的矩阵,如附图2所示。
3.求出所有方案对属性Xj的贡献总量,用附图一所示的算法。在excel操
作中,将刚才生成的矩阵每个元素变成每个元素与该ln(元素)的积,如附图2所示。
4.求出常数k,k为1/ln(方案数),本例中有4个方案,4中车的类型,所
以求得k为
0.721348,再求k与新矩阵每一列和的乘积,这样获得的6个积为所有方案
对属性xj的贡献度。至此所有的Ej就求出来了。
5.dj为第j属性下各方案贡献度的一致性程度。dj=1-Ej,利用上面求得的
Ej,可以得到dj
6.各属性权重为对应的dj与所有dj和的商。dj的和为 0.22478 ,求得各
属性的权重为0.14 0.07 0.49 0.16 0.04 0.10
7.所以在购买汽车时,据所提供信息,利用熵值法计算得出的权重为油耗占
14%,功率占7%,费用占49%,安全性占16%,维护性占4%,操作性占10%。故我们在进行购买决策时,更多是考虑车型的价格和安全性等重要因素。这是从权重角度考虑的。
8.就本例而言,每个车型每个指标的得分与其权重的乘积之和为其综合评价
值,这样求得本田5.118分,奥迪18.32分,桑塔纳8.216分,别克12.495分。所以综合评价排序为奥迪、别克、桑塔纳、本田。