我国工业污染分布状况研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

我国工业污染分布状况研究

(广东商学院经济学院广州 510320)

摘要:环境污染越来越受到我国的重视,而工业污染是造成环境污染的重要原因。为了

对我国的环境污染分布状况进行深入了解,本文从总量出发,利用聚类分析和因子分析

法分析了我国工业污染的分布情况,并探讨了各类地区工业污染差异的原因,为我国进

行侧重点治理环境污染提出可行性建议。

关键词:工业污染;可靠性分析;聚类分析;因子分析

一、引言

在当今世界,不论是富裕国家还是贫穷国家,都面临着共同的环境危机,环境危机是人类社会生存和发展诸多危机中的一个,它实质上影响着人类能否得到可持续发展,人类文明能否持续下去的问题。近十几年来,我国国内生产总值实现了较高的增长速度。2002年我国国内生产总值达102397.9亿元,并实现了8%的惊人增长速度。但与此同时,也创造出449.1927亿吨的工业污染。那么,究竟8%的增长速度是否能反映出我国的经济发展真实水平呢?据调查分析,在目前我国的环境污染70%是来自工业污染。我国的工业化正处在加速发展阶段,在今后相当一段时间内仍将保持较高的增长速度,如不及时采取有效的措施,我国的工业污染必将会越来越严重,并会制约我国工业的发展,带来一系列的环境问题,最终危及我国的可持续发展的实现。

本文抽取了2002年我国31个省市自治区(不包括香港、澳门、台湾)作为样品,选取了六个主要反映工业污染情况的指标:工业废气排放总量、工业二氧化硫排放量、工业烟尘排放量、工业粉尘排放量、工业废水排放量、工业固体废物产生量,目的是要得出我国工业污染的分布图,并分析其差异的原因,为我国抓住重点区域治理工业污染提供参考与建议。

二、运用可靠性分析判断指标的可信度

可靠性分析是一种判断量表结构是否合理,或者说是所选择的指标是否全面反映对应事物特征,以及指标取值可信程度的分析方法。为了提高测试的可靠性,首先运用可靠性分析检测6个指标的可信程度,指标体系如表1。

表1 指标体系

进行可靠性分析时,最常用的度量统计量是Cronbach α系数。Cronbach α系数可被看作相关系数,即该量表与所含其他可能项目数的量表之间的相关系数。其大小可以反映量表受随机误差影响的程度,反映测试的可靠程度。Cronbach α系数值越大,则量表受随机误差的影响越小,测试越可靠。

下面利用SPSS12.0软件中的Reliability Analysis过程得出Cronbach α系数,结果如下:

Reliability Coefficients

N of Cases = 31.0 N of Items = 6

Alpha = 0.7515

Cronbach α系数(结果中的Alpha)为0.7515,故认为该数据的可靠性程度较高。再考察剔除某变量后,是否有助于提高整个量表的可靠性。剔除某变量后的统计量表如下:Item-total Statistics

Alpha if Item Deleted

X1 0.7786

X2 0.6506

X3 0.6119

X4 0.5982

X5 0.7413

X6 0.7807

由以上运行结果中看到,剔除x2、x3、x4、x5这四个变量后得到的可靠性系数(表中的Alpha if Item Deleted)都比原来的0.7515要低,因此没必要剔除这四个变量。另外,虽然剔除x1、x6这两个变量后得到的可靠性系数比0.7515要大,但提高的幅度很小,也就是说剔除这两个变量后对原来量表的可靠程度影响不大。为了保持指标的完整性,以及更有利于综合分析问题,我们保留x1、x2这两个指标。

三、运用聚类分析对样品分类

聚类分析是一种在样品或指标事先没有分类的情况下,按一定的距离和分类方法对其进行分类的一种统计方法。它的基本思想是:首先将一定数量的样品或指标各自看成一类,然后根据样品(或指标)的亲疏程度,将亲疏程度最高的两类进行合并;然后考虑合并后的类之间的亲疏程度,再进行合并;重复这过程直至将所有的样品(或指标)合并为一类。

由于研究的目的是要得出工业污染的分布状况,因此借助聚类分析对样品进行分类,进而得出分布的规律。利用SAS对样品进行聚类(结合实际情况,选取的距离为欧氏距离,聚类方法为ward离差平方和法),并根据聚类图以阈值为3,将31个样品分为4类,具体分类如下:

图1 我国31个省市工业污染分布聚类图

第一类:山东、河北、山西、辽宁

第二类:河南、江苏、四川、广东、湖南、广西、浙江

第三类:湖北、陕西、安徽、内蒙古、贵州、江西、黑龙江、重庆、福建、云南、上海、吉林、甘肃

第四类:新疆、天津、宁夏、北京、青海、海南、 西藏

以上利用聚类分析对样品进行了分类,但此时仍然不能判断各类省市自治区的工业污染程度,还不能对它们进行质的判断。因此,为了弥补聚类分析的这个缺陷,我们引入因子分析方法,目的是要计算31个省市自治区的工业污染综合得分,从而判断每类省市的工业污染程度。

四、运用因子分析计算工业污染综合得分

因子分析的基本思想是通过变量(或样品)的相关系数矩阵(对样品是相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述多个变量(或样品)之间的相关(相似)关系,这少数几个随机变量是不可观测的,通常称为因子。将因子表示为变量的线性组合,所得到的计算结果称为因子得分,它是对各个变量中共同出现的因子的估计值,利用它可以做进一步的分析。

利用SPSS12.0的Data Reduce 过程,并以累计贡献率大于85%的原则提取主因子的个数为2,得出如表2的方差表。

表2 方差表

fac2-1分别表示两个因子的因子得分,从而得出综合得分公式:

F=(49.395*fac1-1+37.544*fac2-1)/86.938

利用Regression (回归法)得出两个因子的因子得分fac1-1、fac2-1,结合上述公式就可以把31个省市的工业污染综合得分计算出来了,如下表3所示。

表3 我国31个省市工业污染综合得分及排名

从以上的综合得分排名表我们可以看出,辽宁工业污染综合得分的排名与聚类分析的结果存在差异。辽宁的综合得分排名为7,比江苏、四川、河南的排名低,但在聚类分析中,辽宁却和山东、河北、山西等综合得分较高的省份排在第一类,而河南、江苏却排在了第二类。聚类分析法和因子分析法在理论上应是互相支持的。两者在结果上存在不一致性,除了

相关文档
最新文档