基于集成综合评价法的气象服务满意度分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于集成综合评价法的气象服务满意度分析
崔更新
2013年6月
基于集成综合评价法的气象服务满意度分析
作者姓名:崔更新
学院名称:数学学院
指导教师:杨国孝教授
答辩委员会主席:史福贵教授
申请学位:硕士专业学位
学科专业:应用统计
学位授予单位:北京理工大学
论文答辩日期: 2013年6月
The analysis of meteorological service satisfaction based on the comprehensive evaluation method
Candidate Name:GengXin Cui
School or Department: School of Mathematics
Faculty Mentor: Prof. Guoxiao Yang
Chair, Thesis Committee:Prof. Fugui Shi
Degree Applied: Professional Master Degree
Major:Applied Statistics
Degree by: Beijing Institute of Technology
The Date of Defence:June,2013
基于集成综合评价法的气象
服务满意度分析
北京理工大学
研究成果声明
本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。
尽我所知,文中除特别标注和致谢的地方外,学位论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京理工大学或其它教育机构的学位或证书所使用过的材料。
与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。
特此申明。
签名:日期:
关于学位论文使用权的说明
本人完全了解北京理工大学有关保管、使用学位论文的规定,其中包括:①学校有权保管、并向有关部门送交学位论文的原件与复印件;②学校可以采用影印、缩印或其它复制手段复制并保存学位论文;③学校可允许学位论文被查阅或借阅;④学校可以学术交流为目的,复制赠送和交换学位论文;⑤学校可以公布学位论文的全部或部分内容(保密学位论文在解密后遵守此规定)。
签名:日期:
导师签名:日期:
摘要
自从进入21世纪,顾客满意度受到越来越多行业的重视,都对其进行了大量的研究。
公共服务满意程度就是指公众对行政服务的效果的感知与他们的期望值相比较后形成的一种失望或愉快的感觉程度的大小。
同样,气象服务满意度就是指公众在接受气象服务之后对其效果的感知与自身的期望值相比较产生的一种心理感受,可以用一种量化指标进行细化。
研究公众对气象服务满意度的具体情况,能够改进气象服务的质量,提高气象服务满意度,减少顾客的抱怨和顾客流失,树立良好的公众形象和口碑。
本文参阅了国内外的相关文献,在所建立的公众气象服务满意度评价指标体系的基础上,并结合我国的气象行业特点,构建了气象服务满意度的集成综合评价法模型,应用2010年全国公众气象服务评估调查数据,分别运用主成分分析技术和熵值法进行分析,得出两种排序结果。
为了结合两种方法的优势,先对两种排序结果进行一致性检验,在通过一致性检验的前提下对两种排序结果进行集成,最终得出相对合理和科学的气象服务满意度排序。
关键词:主成分分析;熵值法;集成综合评价法;气象服务满意度;排序
Abstract
Since entering the 21st century, more and more industries pay attention to the customer satisfaction and do a lot of research on it. Public service satisfaction, which originated from the contrast between the customer experience of the administrative services and their expect, forms a kind of disappointment or the feeling of happy. Similarly, it is also a kind of quantitative index describing the feeling formatted by the public perceptible effect of meteorological service compared with their expect value. If we know the specific circumstances of Meteorological services satisfaction, we can improve the quality of meteorological services andmeteorological services satisfaction, reduce customer complaints and the loss of customers. At last, we can establish a good public image and reputation.
In this paper, we review related papers at home and abroad and construct aintegrated comprehensive evaluation model of meteorological service satisfaction in combination with the characteristics of meteorological industry based on public weather service satisfaction evaluation index system. Through appling principal component analysis and entropy value method on the assessment survey data of national public meteorological service in 2010, we get two ranking results. First, if the two ranking results pass the consistency examination, then use integrated comprehensive evaluation method to get the relatively reasonable and scientific meteorological satisfaction ranking.
Key Words: principal component analysis; entropy method; integrated comprehensive evaluation method; meteorological service satisfaction; rank
目录
摘要 (I)
ABSTRACT (II)
第一章绪论 (1)
1.1研究背景 (1)
1.2国内外研究现状 (1)
1.2.1国外研究现状 (1)
1.2.2国内研究现状 (2)
1.3研究方法 (2)
1.4研究的意义 (2)
1.5文章的创新之处 (3)
第二章气象服务满意度评价的理论基础 (3)
2.1满意度的相关概念 (3)
2.2公共服务的顾客满意度 (3)
2.3顾客满意度的指数模型 (4)
第三章数据来源及其处理 (6)
3.1数据来源 (6)
3.2数据的预处理 (7)
第四章主成分分析 (8)
4.1主成分分析的理论基础 (8)
4.2主成分分析 (8)
4.3主成分排序结果 (15)
第五章熵值法 (16)
5.1熵值法的原理 (16)
5.2熵值法 (16)
5.3熵值法排序结果 (17)
第六章集成综合评价法 (19)
6.1Kendall-W协和系数 (19)
6.2Copeland计分排序法 (20)
6.3集成综合评价法排序结果 (20)
第七章结论和讨论 (22)
参考文献 (23)
致谢 (25)
第一章绪论
1.1 研究背景
气象事业是科技型、基础性的社会公益事业。
随着社会的日益发展,人们对气象服务的要求进一步提高,简单的气象信息已经不能满足整个社会的需求。
改革开放以来,我国气象事业取得了长足发展,初步建立了天气、气候业务和科研体系,提高了气象监测、预报、预测和服务水平,在防灾减灾、经济建设、社会发展和国防建设中发挥了重要作用。
2004年,我国正式提出构建服务型政府,服务型政府最基本的特征就是满足社会公共需求,提供充足的优质公共产品和公共服务。
社会公众对气象服务的需求和质量要求在不断提高,强化气象工作的社会管理和公共服务职能已经成为了气象部门的日常工作目标。
社会公众对气象服务的满意度评价是公共气象服务社会效益评价的重要内容,通过对气象服务满意度的评价,可以深入了解公众对气象服务的满意度状况,为改进气象服务水平提供科学并且客观的决策支持。
1.2 国内外研究现状
1.2.1 国外研究现状
随着社会、经济和科技的发展,气象服务对经济建设、社会发展和人民生活的影响日益明显。
随着气象服务的发展,各国的气象服务呈现出商品化的特点,与各行各业都有密切的联系[1]。
国外包括美国,澳大利亚,英国等国家都非常重视气象效益评估,都把各种气象指标纳入考核之中,各种模型也比较成熟[2]。
21世纪美国学者Dutton[3-4]对美国各个行业GDP产值受到天气和气候的影响进行估计,结果显示美国近三分之一的GDP受天气气候的影响极为敏感。
美国政府和学术界认为,气象服务是一个与社会经济有着密切联系的巨大市场,气象因素在生产力中起到非常重要的作用。
21世纪,面对市场化的国际大环境,世界气象组织提出了指导世界各国开展气象服务的经济框架,从经济方面为国际气象事业的发展提出科学、可行的建议,为各国的气象组织和决策者提供帮助。
1.2.2 国内研究现状
中国是最早参加世界气象组织关于气象效益评估工作的发展中国家。
在20世纪90年代,中国将顾客满意度研究引入气象领域,并将其作为衡量公众气象服务效益的一项重要指标[5]。
自20世纪90年代到2009年,公众气象服务评价调查在我国共进行了3次[6],只以“公众对气象服务的总体满意程度”这项单一指标为主,但因当时还没有形成统一的度量指标,所以公众气象服务“满意率”和“满意度”均被采用过,中国气象局公共气象服务中心成立之后,公众气象服务评价工作应业务化的要求于2009、2010年中国气象局联合国家统计局开展了全国公众气象服务调查评价工作,也取得了一些研究成果[7-9],同时,认识到公众气象服务评价中的核心问题——满意程度的度量是最值得探讨和研究的关键所在。
1.3 研究方法
对于多指标综合评价常用的方法有指数评价法、模糊评价法,多指标加权评价法等。
指数评价法实际上各评价因子的作用往往难以等同,各因子对总体评价目标而言存在权重的差异,指数评价法并不十分精确,而且在分析主要影响因素方面还力不从心[10];模糊评价法计算繁琐,不易操作,不能确定主要因子[11];多指标加权评价法还存在一些现在不能解决的问题,如选着哪几种评价指标更加科学、合理,如何正确衡量各评价指标之间的相对重要性及更科学地为各指标分配权重等[12]。
本文集成主成分分析和熵值法的排序结果形成集成综合评价法,得出科学合理的排序结果。
1.4 研究的意义
1.气象服务是气象事业的出发点和归宿,是气象事业发展的根本。
气象与人民群众的生产、生活密切相关,做好公共气象服务效益的评估工作有着重要的意义。
通过研究公众对气象服务满意度的具体情况,能够改进气象服务的质量,提高气象服务满意度。
2.有关气象的传统研究多集中于对公共气象服务满意度的定性描述分析以及简单的量化描述性分析,缺乏一定的统计理论支撑。
本文采用了一种从未在气象方面应用的统计分析方法—集成综合评价法,试着构建气象服务满意度的数学模型,将多个变量之间的相关性和单个变量的不确定性融合其中,对所研究的多指标之间的关系进行量化分析,从统计的角度研究公共气象服务的效益评价问题,使研究更加科学,研
究结果更具有可信度。
1.5 文章的创新之处
和以往的气象服务效益评估的研究相比,本文创新性地引入了集成综合评价的分析方法,同时考虑了相关性和不确定性两个方面,建立了公众气象服务的满意度的数学统计模型,使得分析研究的结果更具有科学性和说服力,也丰富了我国关于气象服务满意度的研究现状。
第二章气象服务满意度评价的理论基础
2.1 满意度的相关概念
满意是一种基于主观感知的对某项行动、组织、个人等持认可的心理感受或心理状态,包括认知、情感、态度、情绪和信念等。
1936年,学者卡多左(Cardozo)首次将“顾客满意度”(Customer Satisfaction, CS)概念引入了营销领域,开始对顾客满意与不满意进行研究,被学术界认为是“顾客满意”在营销领域的最早研究[13]。
顾客满意度的定义很多,至今还没有统一的定义。
ISO 9000:2000中,对顾客满意的定义为“顾客对其要求已被满足的程度的感受”[14]。
从本质上来说,顾客满意度反映的是顾客的一种心理状态,它来源于顾客消费了企业提供的某种产品或服务所产生的感受与自己的预先期望所形成的对比,也就是说,这里的"满意"不是一个绝对的概念,而是一个相对的概念。
近年来,Anderson,Fornell和Lehman在总结前人的基础上,将顾客满意区分为某次特定交易的满意和累积的满意两种。
特定交易的满意是指顾客在购买了某种商品后的感受,提供了对某种特定商品或服务绩效的针对性信息;累积的满意是指顾客对先前购买某种产品或服务所有经历的总体评价[15]。
2.2 公共服务的顾客满意度
除营销领域之外,“满意”的概念还被应用到公共服务领域。
20世纪80年代后,随着西方“新公共管理运动”的兴起,“公众满意”受到社会的广泛关注。
企业管理学中的顾客满意概念被引入到政府公共服务中来,政府的主要职责既然是根据公众的需要提供公共服务和产品,那么就必须以公众的满意程度作为政府公共服务质量的评
判标准。
公共服务满意程度就是指公众对行政服务的效果的感知与他们的期望值相比较后形成的一种失望或愉快的感觉程度的大小[16]。
作为政府公共服务的重要组成,20世纪90年代气象部门将满意程度研究引入气象领域,将其作为衡量公众气象服务效益的一项重要指标。
2.3 顾客满意度的指数模型
无论是在企业还是在公共服务部门,“顾客满意度”都处于核心地位,对提高企业业绩,改善政府部门形象有着至关重要的作用。
那如何提高“顾客满意度”就成了一个亟待解决的问题。
然而,“顾客满意度”是一个主观概念,不能直接测量。
为此,许多学者在顾客满意度的基础上建立了顾客满意度模型,根据模型来对顾客满意度进行测评。
其中以下三个是目前最有代表性的顾客满意度指数模型:
(1)瑞典的满意度指数模型(Sweden Customer Satisfaction Barometer,简称SCSB)
瑞典是世界上第一个尝试在全国范围内测量顾客满意度的国家,在期望差异理论的基础上,瑞典于1989年构建了全国性顾客满意度指数模型(SCSB)[17]。
SCSB在测量顾客满意度方面发挥着很大的作用,它能帮助瑞典提高行业的产业质量,增强行业的竞争力。
SCSB的模型结构如下图2.1所示,包括顾客预期、感知质量、顾客满意度、顾客抱怨和顾客忠诚5个结构变量。
这5个变量间形成6中关系,可以用两个函数来表示瑞典顾客满意度模型:
f购前期望,感知表现,即“顾客满意度”可以用有关购前期望1.顾客满意度=()
和感知表现的函数来表示。
f顾客满意度,转移壁垒,顾客抱怨,即可以用顾客满意度,转
2.顾客忠诚度=()
移壁垒和顾客抱怨表示出顾客忠诚度。
所谓转移壁垒其实就是企业竞争优势的位差.它的存在说明了为什么各战略群的收益水平会有差别。
为了保护企业免遭过度竞争的干扰,一些满意度较低的企业将不得不提高或设置新的转移壁垒。
图2.1
(2)美国的满意度指数模型(American Customer Satisfaction Index,简称ACSI)
1990年,美国开始构建美国顾客满意度指数(ACSI)[18-19]模型,它是一种新型的以顾客为基础、用来评价并改善组织绩效的一种评价体系。
该模型如下图2.2,包括感知质量、顾客预期、感知价值、顾客满意度、顾客抱怨和顾客忠诚6个指标。
者6个变量之间形成了9种关系。
其中,感知质量、顾客预期和感知价值是自变量,顾客抱怨和顾客忠诚是因变量。
根据这个模型可以列出一个由多元方程组成的计量经济模型,输入被访者的分数,就可以得出顾客的满意度得分。
图2.2
(3)欧洲的满意度指数模型(Europe Customer Satisfaction Index ,简称ECSI)
欧洲顾客满意度指数模型(ECSI)[20]是在欧洲质量组织、欧洲质量管理基金会等
机构的共同组织下而研究构建的。
ECSI是在ACSI 模型的框架基础上构建的顾客满意度评价模型,如下图2.3模型包括6个变量:顾客期望、企业形象、质量感知、价值感知、顾客满意和顾客忠诚,变量之间形成了10种关系。
较ACSI模型少了顾客抱怨指标,增加了企业形象指标。
图2.3
第三章数据来源及其处理
3.1 数据来源
本文的数据来自于2010年全国公众气象服务评估调查数据[10],调查内容为三个方面,即公众气象服务评价、公众气象服务现状和公众气象服务需求。
入户和电话调查了我国31个省(自治区、直辖市)的152个城市和146个县,调查有效样本为51800个,其中城市样本33500个,农村样本为18300个,分别占比64.7%、35.3%。
被调查者涉及不同年龄、学历、职业人群等,其中男性样本和女性样本基本相等,分别占比50.5%、49.5%。
本文将在所建立的公众气象服务满意度评价指标体系[21-22]的基础上(见下表3.1),对全国31个省市的气象服务满意度排名进行实证研究,介绍满意度排名的模型以及步骤,最终计得出各个省市的排名。
表3.1公众气象服务评价满意度指标体系的构成
一级指标
二级指标
三级指标 变量
公众气象 服务总体 满意度
气象服务 信息内容
通俗性
1x
实用性 2x
准确性 3x 表现形式 4x 种类丰富性 5x
气象服务 信息发布 发布的及时性 6x 发布渠道的多样性 7x 获取的方便性 8x
气象知识
宣传普及
宣传普及渠道
9x 可读性
10x 趣味性 11
x
气象常识普及面
12x
133.2 数据的预处理
每个样本都有13个三级指标,分别用变量12313,,,......,x x x x 表示,如表3.1所示。
每个三级指标都分为5个等级,分别为 1.满意;2.比较满意;3.一般;4.不满意;5.说不清。
本文对这5个等级分别量化为100,80,60,0,平均分。
然后运用客观赋权法[23]对二级和三级指标进行赋权(见表3.2),最后可以计算出*ij i ij C C W 。
最终通过三级指标折算权重加权得到各个样本各个指标的得分。
表3.2 公众气象服务满意度指标体系各级权重分布(单位:%) 二级指标 二级指标权
重(i C )
三级指标 三级指标权重(ij W ) 三级指标折算权重
(ij C ) 气象服务 信息内容
42.4% 通俗性 8.0% 3.4% 实用性 21.5% 9.1% 准确性
66.6%
28.2%
表现形式 1.3% 0.6% 种类丰富性 2.6% 1.1%
气象服务
信息发布24.9%
发布的及时性66.5% 16.5% 发布渠道的多样性13.5% 3.4% 获取的方便性20.0% 5.0%
气象知识
宣传普及32.8%
宣传普及渠道21.1% 6.9% 可读性9.2% 3.0%
趣味性 2.5% 0.8% 气象常识普及面18.9% 6.2% 及时获取气象灾害防御
知识
48.3% 15.8%
合计100.0% 合计300.0% 100.0%
第四章主成分分析
4.1 主成分分析的理论基础
在研究某一事物时,为了更加全面,准确地认识事物的本质,人们一方面为了得到更加全面的信息而尽可能考虑多的指标,另一方面随着指标的增多不可避免的增加了问题的复杂性,信息隐藏在多个变量之间,往往难以发现。
为了解决上述问题,人们自然希望在解决问题时涉及较少的变量,但是能够蕴藏较多的信息。
主成分分析[24]也称主分量分析,是有霍特林于1933年首先提出的。
主成分分析是利用降维的思想,在损失很少信息的前提下将多指标化为少数几个综合指标的一种统计分析方法。
主成分是原始变量的线性组合,且各个主成分之间独立不相关,这样在研究复杂问题时就可以只考虑几个主成分而不会损失太多信息,从而更容易抓住事物的主要矛盾,揭示事物的本质。
4.2 主成分分析
对于传统的主成分分析几乎都是从相关系数矩阵出发求解主成分,这从一定程度上就会造成原始信息的流失。
考虑到本文所用数据各个指标之间处于同一量纲级别,
同时也为了避免原始信息的流失,故本文从协方差矩阵求解主成分,这也最大限度地保留了原始信息,提高了精度。
首先,运用KMO(Kaiser-Meyer-Olkin-Measure of Sampling Ade-quacy)检验[24-25]、巴特莱球形检验(Bartlett test of sphercity)[24-25]和相关性矩阵来验证原始数据是否能够运用主成分分析。
KMO检验是从比较原始变量之间的简单相关系数和偏相关系数的相对大小出发来进行的检验。
当所有变量之间的偏相关系数的平方和,远远小于所有变量之间的简单相关系数的平方和时,变量之间的偏相关系数很小,KMO值接近1,变量适合进行主成分分析。
巴特莱球形检验是从整个相关矩阵出发进行的检验,检验的原假设是相关矩阵为单位矩阵,如果不能拒绝原假设,说明原始变量之间相互独立,不适合进行主成分分析。
根据表4.1,得知KMO的值为0.91,且巴特莱特球形检验的P值小于0.05,所以拒绝原假设,认为变量之间适合进行主成分分析。
表4.1 KMO 和 Bartlett 的检验
取样足够度的
Kaiser-Meyer-Olkin
度量
0.91
Bartlett 的球形度
检验近似卡方241757.46 df 78.00 Sig. 0.00
相关矩阵的直观检验是根据相关系数矩阵中所反映的原始变量之间的线性相关大小来检验主成分分析的适用性。
如果相关系数矩阵的大部分相关系数都小于0.3,说明原始数据之间的相关关系不大,不适合主成分分析。
相反,则适合进行主成分分析。
由表4.2得出各个变量之间的相关系数大部分都大于0.3,得出原变量适合进行主成分分析。
综上所述,从3个方面验证得出一致的结论,认为原始变量适合进行主成分分析。
表4.2相关矩阵
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 相关
系数
x1 1.00 0.53 0.36 0.40 0.37 0.37 0.33 0.33 0.29 0.32 0.28 0.25 0.26 x2 1.00 0.45 0.41 0.38 0.37 0.34 0.34 0.29 0.33 0.30 0.27 0.28 x3 1.00 0.38 0.35 0.35 0.29 0.27 0.27 0.26 0.30 0.29 0.30 x4 1.00 0.55 0.34 0.40 0.38 0.28 0.34 0.33 0.31 0.30 x5 1.00 0.34 0.42 0.39 0.32 0.34 0.36 0.34 0.33 x6 1.00 0.46 0.43 0.36 0.35 0.32 0.31 0.35 x7 1.00 0.57 0.36 0.39 0.36 0.34 0.34 x8 1.00 0.35 0.38 0.34 0.33 0.35 x9 1.00 0.53 0.48 0.51 0.47 x10 1.00 0.52 0.44 0.43 x11 1.00 0.49 0.45 x12 1.00 0.61 x13 1.00 Array
图4.1 碎石图
碎石图[24-25]是根据原始数据相关矩阵特征值的大小即主成分方差大小的顺序画出的主成分方差随主成分个数变化的散点图。
根据图 4.1,碎石图像个山崖,从第一个主成分开始,曲线迅速下降,然后下降平缓,到第三个主成分变化趋势已经很缓慢。
故只需要保留3个主成分即可。
从表4.3得知,各主成分解释原始变量总方差的情况。
第一个主成分的方差为55.97,提取了原始变量 61.15%的信息,第二个主成分的方差为18.97,提取了原始变量20.73%的信息,以此类推,可以得知各个主成分保留原始变量的信息,三个主成分总共提取了原始变量91.04%的信息。
可见,选取3个主成分损失的信息量不足10%。
综合上述两方面,选择提取三个主成分是合理的。
表4.3解释的总方差
主成分
初始特征值a 提取平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 55.97 61.15 61.15 55.97 61.15 61.15 2 18.97 20.73 81.88 18.97 20.73 81.88 3 8.39 9.16 91.04 8.39
9.16 91.04
4 2.70 2.9
5 94.00 5 2.2
6 2.4
7 96.47 6 1.44 1.57 98.04 7 0.90 0.9
8 99.03 8 0.30 0.32 99.35
9 0.26 0.29 99.64 10 0.25 0.27 99.91 11 0.04 0.05 99.96 12 .03 .03 99.99
13 .01
.01
100.00
从公因子方差表4.4,可知各个主成分提取原始变量的信息。
变量1x 的方差为0.41,前3个主成分提取原始变量1x 中0.10的信息。
若对原始变量1x 进行标准化处理,即标准化处理以后1x 的方差为1,进行主成分分析以后,3个主成分提取原始变量1x 中0.24的信息。
以此类推,可以得知提取其他原始变量的信息。
3个主成分提取原始变量的信息最少的也有20%以上,最高的达到了100%。
从而得出,对原始变量进行主成分
分析,损失的原始变量信息很有限。
表4.4公因子方差
原始重新标度
初始提取初始提取
x1 0.41 0 .10 1.00 0.24
x2 3.32 1.04 1.00 0.31
x3 49.24 49.22 1.00 1.00
x4 0.02 0.00 1.00 0.23
x5 0.06 0.01 1.00 0.23
x6 10.95 10.79 1.00 0.99
x7 0.53 0.16 1.00 0.30
x8 1.16 0.33 1.00 0.28
x9 3.05 1.08 1.00 0.35
x10 0.44 0.12 1.00 0.28
x11 0.04 0 .01 1.00 0.29
x12 3.09 1.46 1.00 0.47
x13 19.21 18.99 1.00 0.99
通过成份矩阵(表4.5)可以写出原始变量和主成分的近似表达式。
若采用重新标度的变量,则可以得到标准化以后的原始变量和主成分的近似表达式。
根据成份矩阵,可以得出原始变量和主成分的近似表达式:
10.27*10.09*20.13*3
x prin prin prin ≈++
20.94*10.20*20.34*3
x prin prin prin ≈++
36.80*11.69*20.36*3
x prin prin prin ≈--
40.06*10.02*20.02*3
x prin prin prin ≈++
50.10*10.05*20.03*3
x prin prin prin ≈++
61.62*11.16* 2.61*3
x prin prin prin ≈++
70.28*10.21*20.19*3
x prin prin prin ≈++
80.40*10.32*20.26*3
x prin prin prin ≈++
90.70*10.76*20.15*3
x prin prin prin ≈++
100.25*10.24*20.07*3
x prin prin prin ≈++
110.08*10.07*2+0.01*3
x prin prin prin ≈+
120.75*10.94*20.13*3
x prin prin prin ≈+-
132.18*1 3.62*21.06*3
x prin prin prin
≈+-
其中:1,2,3
prin prin prin分别表示标准化以后的第一、二、三主成分。
表4.5 成份矩阵
原始重新标度
成份成份
1 2 3 1 2 3
x1 0.27 0.09 0.13 0.42 0.13 0.20
x2 0.94 0.20 0.34 0.52 0.11 0.19
x3 6.80 -1.69 -0.36 0.97 -0.24 -0.05
x4 0.06 0.02 0.02 0.44 0.15 0.13
x5 0.10 0.05 0.03 0.42 0.20 0.11
x6 1.62 1.16 2.61 0.49 0.35 0.79
x7 0.28 0.21 0.19 0.38 0.29 0.27
x8 0.40 0.32 0.26 0.37 0.29 0.24
x9 0.70 0.76 0.15 0.40 0.43 0.09
x10 0.25 0.24 0.07 0.37 0.36 0.10
x11 0.08 0.07 0.01 0.40 0.35 0.04
x12 0.75 0.94 -0.13 0.43 0.53 -0.07
x13 2.18 3.62 -1.06 0.50 0.83 -0.24 成份得分系数矩阵给出了用原始变量表示主成分的系数信息。
根据成份得分系数矩阵表4.6可以得到:
标准化2368910.03*0.85*0.10*0.01*0.02*prin Z Z Z Z Z =++++
12130.02*0.17*Z Z ++
标准化2367820.02*0.62*0.20*0.01*0.02*prin Z Z Z Z Z =-+++
91012130.07*0.01*0.09*0.84*Z Z Z Z ++++
标准化1236730.01*0.07*0.30*1.03*0.02*prin Z Z Z Z Z =+-++
891012130.03*0.03*0.01*0.03*0.56*Z Z Z Z Z +++--
其中,1213,,...,Z Z Z 分别为1213,,...,x x x 标准化以后的变量。
表4.6 成份得分系数矩阵
成份 1
2 3 x1 0.00 0.00 0.01 x2 0.03 0.02 0.07 x3 0.85 -0.62 -0.30 x4 0.00 0.00 0.00 x5 0.00 0.00 0.00 x6 0.10 0.20 1.03 x7 0.00 0.01 0.02 x8 0.01 0.02 0.03 x9 0.02 0.07 0.03 x10 0.00 0.01 0.01 x11 0.00 0.00 0.00 x12 0.02 0.09 -0.03 x13
0.17
0.84
-0.56
4.3 主成分排序结果
通过以下公式可以计算出各个样本的综合得分:
123123
*1*2*3
prin prin prin score λλλλλλ++=
++
其中,123λλλ,,为原始变量协方差矩阵的前三个特征值,也是前三个主成分的方差。
最后,对主成分分析得出的各个样本的得分按着城市进行均值化处理,各个城市的主成分得分以及排序如下表4.7所示:
表4.7主成分得分及排序
城市 主成分得分
排序 辽宁 0.26 1 黑龙江 0.26 2 吉林 0.14 3 陕西 0.13 4 内蒙 0.1 5 江苏 0.08 6 安徽 0.08 7 山西 0.08 8 河南 0.08 9 山东 0.07 10 重庆 0.05 11 四川 0.04 12 宁夏 0.03 13 广东 0.02 14 湖北 0.01 15 浙江 0 16 海南 0 17 甘肃 -0.01 18 河北
-0.03
19
江西 -0.03 20 广西 -0.04 21 新疆 -0.04 22 上海 -0.05 23 青海 -0.08 24 福建 -0.09 25 湖南 -0.12 26 北京 -0.18 27 天津 -0.19 28 云南 -0.21 29 贵州 -0.22 30 西藏
-0.36
31
第五章 熵值法
5.1 熵值法的原理
设有n 个样本,m 项评价指标,形成原始指标数据矩阵()ij n m X X ⨯=,对于某项指
标j x ,指标值ij x 的差距越大,则该指标在综合评价中所起的作用越大;反之越大。
若某指标值全部相等,则该指标在评价中不起任何作用。
在信息系统中用
()()()1
ln m
j j j j H X P X P X ==-∑表示信息熵,是系统无序程度的度量,信息是系统有序程度的度量,二者符号相反,绝对值相等。
信息熵越大,信息的无序度越高,其信息的效用值越小,该指标的权重也应越小;反之,信息的熵越小,信息的无序度越低,信息的效用值越大,该指标的权重也应越大。
因而,可以利用信息熵,根据各项指标的变化,计算出各指标的权重,为多指标综合评价提供科学依据。
5.2 熵值法
主成分分析考虑了各个指标之间的相关性关系,但是没有考虑到各个指标本身的不确定性变化。
所以,本文采用熵[26]去度量这种不确定性,同时也克服了主成分分析得出的三个主成分权重之和小于1的缺点。
熵是对不确定性的一种度量,根据熵的特。