关于我国环境污染的因子分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于我国环境污染的因子分析
摘要:文章采用因子分析法对全国31个省、自治区、直辖市的环境污染进行了分析、评价,并运用统计软件spssl8.0对数据进行了处理、计算。通过分析表明我国目前环境污染较为严重,其中河北、山东、广东、重庆几省的综合污染最为严重。文章的分析评价可以为我国的环境污染防治提供一定的数据支持。同时因子分析模型能简化数据结构,减少信息冗余,识别环境污染的主要因素,为各地区环境整治提供了客观、科学、准确的量化指标。
关键词:因子分析环境污染贡献率
中图分类号:f205 文献标识码:a
文章编号:1004-4914(2013)03-008-02
一、引言
由于人们对工业高度发达的负面影响预料不够,预防不利,导致了全球性的三大危机:资源短缺、环境污染、生态破坏。环境污染不仅会给生态系统造成直接与间接的破坏和影响,如沙漠化、森林破坏、温室效应、酸雨和臭氧层破坏,而且影响人类的生活质量、身体健康和生产活动。严重的污染事件不仅带来健康问题,也造成社会问题。据统计,我国2010年度环境污染治理投资总额已高达2566亿元,环境保护刻不容缓。评价各地区环境污染程度以及确定污染类型,能够为环境保护的科学决策提供基础的数据支持。当前,国家统计局提供的关于各地区环境污染程度的统计数据有23大类
之多,且各组数据间有大量的信息交叉和冗余,很难以直观的方式予以表达。为此,本文将因子分析模型引入到环境污染处理中,首先通过降维技术把多个相关的数据组转换成少数主因子,简化了数据结构;其次通过因子旋转使主因子之间互不相关,减少了信息的交叉;最后根据因子载荷矩阵分别计算各地区主因子得分情况,然后根据各因子的方差贡献率,计算总因子得分。这时即可直观地看出各个地区环境污染的主要影响因素。
二、因子分析理论
(一)因子分析概述
因子分析的最初设想的基本思想是用少数几个潜在指标(因子)的线性组合来表示实际存在的多个指标。因子分析的主要应用有两个方面:一方面是寻求基本结构,简化观测系统,即构造一个因子模型,确定模型中的参数,然后根据分析结果进行因子解释;另一方面是对变量或样本进行分类,对公共因子进行估计,并进一步分析。因子分析的基本目的是用少数几个随机变量来描述多个变量间协方差关系,其基本思想是,根据相关性大小对变量分组,使组内变量间高相关、组间变量低相关,每组变量代表一个基本结构就是因子。
(二)因子分析的数学模型
用矩阵表示:x=af+ε且满足:
(1)m≤p;
(2)即f与ε是不相关的;
(3)d(f)=im即f1……fm不相关且方差皆为1,im表示m阶单位矩阵。ε1……εm不相关且方差不同。
其中x是可观测的p个指标所构成的p维随机向量,f=(f1……fm)’是不可观测的向量,f称为x的公共因子;aij成为因子载荷,是第i个因子在第j个公共因子上的负荷,它反映了第i个因子在第j个公共因子上的相对重要性,ε是特殊因子,它包含了随机误差。
(三)模型的统计意义
模型中公共因子f1……fm是在各个原观测变量的表达式中都共同出现的因子,f=(f1……fm)’是对所有的xi(i=1,2,…,p)都起作用的因子,故称为x的公因子,且公因子是相互独立的不可观测的理论变量,它们的含义必须结合具体问题的实际意义而定。εi叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,即εi只对xi起作用,并且各特殊因子之间以及特殊因子与所有公共因子之间都是相互独立的。
模型中载荷矩阵a中的元素(aij)pm为因子载荷,因子载荷aij是xi与fi的协方差也是xi与fj的相关系数,它表示xi依赖fj的程度,反映了第i个变量在第j个公共因子上的相对重要性。aij的绝对值越大,表明xi与fj的互相依赖的程度越大或称公共因子fj对于xi的载荷量越大。为了得到因子分析结果的经济解释,
因子载荷矩阵a中有两个统计量十分重要,它们是变量共同度和公共因子的方差贡献。
因子载荷矩阵a中第i行元素之平方和记为hi2,称为变量xi 的共同度。它是全部公共因子对xi的方差所做出的贡献,反映了全部公共因子对变量xi的影响。hi2大表明x的第i个分量xi对于f的每一分量f1……fm的共同依赖程度大。
将因子载荷矩阵a的第j列(j=1,2,…,m)的各元素的平方和记为gj2,我们称其为公共因子fj对x的方差贡献。gj2就表示第j个公共因子fj对于x的每一分量xi(i=1,2,…,p)所提供方差的总和,它是衡量公共因子相对重要性的指标。gj2越大,表明公共因子fj对x的贡献越大,或者说对x的影响和作用就越大。如果将因子载荷矩阵a的所有gj2(j=1,2,…,m)都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。
(四)因子分析的一般步骤
1.原始数据的标准化。标准化的目的在于消除不同变量的量纲影响,而且标准化不会改变变量的相关系数。
2.计算标准化数据的相关系数矩阵,并求出相关系数矩阵的特征值和特征向量。
3.进行正交变换,通过使用方差最大法。其目的是使因子载荷两极分化,而且旋转后的因子仍然正交。
4.确定因子个数,计算因子得分,进行统计分析。
三、环境污染的因子分析
(一)原始数据的选取
原始数据(2010年统计年鉴)为我国各省、直辖市工业和生活污染物排放量。其中:x1为生活污水排放量(万吨),x2为生活污水中化学需氧量排放量(万吨),x3为生活二氧化硫排放量(万吨),x4为生活烟尘排放量(万吨),x5为工业固体废物排放量(吨),x6为工业废气排放量(亿平方立米),x7为工业废水排放量(万吨)。
(二)因子分析的输出结果
将上述原始数据标准化处理后,经spss18.0统计软件分析可以得到变量相关系数矩阵。结果表明7个变量之间的相关性很高,适合用因子分析来研究变量之间的内部依赖关系。
因子分析的关键就是利用相关系数矩阵求出相应的因子特征值和累计贡献率,用spss18.0统计软件可得到总方差解释表。结果表明取其中3个因子已提供了原资料85.333%的信息,满足因子选取原则:m个因子的累计贡献率大于或等于85%。同时还表明旋转前后的总累计贡献率没有发生变化,即总的信息量无损失。
因子分析的主要目的是将具有相近的因子载荷的各变量置于一个公因子之下,当初始因子不能典型的代表变量的含义时,对因子载荷矩阵采用旋转方法,并施以25次正交旋转,使因子载荷值向两极端发展,以便对因子的意义作出更合理的解释。
成分矩阵和旋转成分矩阵表明:旋转前后因子载荷的变量结果