环保意识调查问卷的Logistic模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

环保意识调查问卷的Logistic模型

李洪涛宁静方兆本

2012-7-23 11:29:08 来源:《统计与精算》2002年第4期内容提要:本文应用多元统计分析中的方差分析,logistic模型等方法对环保意识调查问卷反馈的信息进行统计分析,建立被调查企业对环境保护意识的logistic模型,进而可对企业家的环境保护意识的好坏进行判断。

关键词:logistic模型方差分析

作者简介:李洪涛,宁静,方兆本,中国科学技术大学商学院,合肥230026

引言

为了推进发展中国家环保事业的研究,了解我国企业家的环境保护意识,联合国教科文组织和联合国开发计划署委托中国科学院国际合作局由我们实施了一项名为《通过清洁生产来加强企业管理者在环境保护中的作用》的项目。该项目的旨在于改进环境管理教育,通过与国际机构合作,组织培训及对示范企业进行考察,使企业家在环境保护中发挥更大的作用。项目通过问卷和访谈两种形式进行。为了实施这个目的,需要评估出各个企业家的环保态度,进而判断哪些企

业家环保意识好,哪些需要通过环境管理教育提高环保意识。

一、数据与方法

(一)数据来源

问卷采用三种形式:随机的信件调查、有选择的发送传真、当面填写。共发放问卷480份,收回316份问卷,回收率65.8%。问卷访问范围覆盖华东、华南、西南、西北、东北五个地区,包括22个省、市、直辖市(占全国省份的68.75%),遍及20个行业。统计年鉴中这22 省市直辖市所属的工业企业数占全国总工业企业数的78.02%。从此看出,问卷的抽样省市分布比较合理,得出的信息具有一定的代表性。问卷涉及的行业分布主要集中在化工、建材、机械、电器电子和医药行业。

每份问卷包括31个问题,均为选择题。其中复选题11 个,单选题20个。每道题的选择答案为4到7个,在处理时,分别根据选择答案在被选答案中的排列顺序(即序号)来代替。

(二)方法

采用多因素方差分析模型和logistic模型。

二、建模

为了建立被调查企业家对环境保护意识的得分模型。我们先根据问卷的题目

选出与被调查者对环保态度明显相关的变量,在此基础上,计算出每家企业的环境意识得分。记为y[,0]。并检验初选变量的合理性。把y[,0]作为因变量,对问卷中其余未选入题目进行最优全子集回归,选出初步最优相关变量。对此作ANOVA 模型判断初步最优相关变量的不同水平是否对因变量有显著影响,然后选出有显著影响的变量进入企业环境意识得分的计算,得出y[,1],再以y[,1] 为因变量用新的ANOVA模型判断剩余变量是否有显著影响。如此循环直到一稳定状态,得到企业环保意识的最优计算得分标准的变量。并根据此得分建立logistic 模型,得到各企业基于问卷填写反映出的环保意识好的概率。

(一)初始变量的选择

(1)把问卷中直接反映被调查者对环保态度的题目选出,对每位企业家评分,分值从-1到+1,得到Y[,0]。

初选题目及评分标准为:

第6题:在描述本企业的近来主要成就中,以选择“对环境影响减少”在各自答案的先后顺序评分。

第9题:根据企业家所在企业通过ISO14000的情况来评分,已经通过的给最高分1,依次类推。

第11题:根据企业家认为“既要经济发展,又要保护环境”是否可行的态度评分。

第13 题:对选近年来企业已减少对环境的影响答案的企业家增加1分,否则得-1分。

第18题:根据企业家对“一票否决权”的赞成程度为他们评分。

第19题:根据企业家对“谁污染,谁治理”的原则的赞成程度为他们评分。

第22题:根据企业确保遵守环境法律法规的途径的多少来为企业家评分。

第30题:根据企业与社区群众发生环境纠纷的频度为企业家评分。

将每位企业家的八道题的得分求和,得到初始得分Y[,0]。

(2)检验初选变量的合理性:

以初次得到的企业家环保意识得分作为因变量,初选的题目作为自变量,建立回归模型。得回归方程为:

Y=7.67-0.12X[,1]-0.75X[,2]-2.10X[,3]-0.45X[,4]-0.51X[,5]+0.64X[,6]+ε其中Y代表企业环保意识得分,X[,1],X[,2],X[,3],X[,4],X[,5],X[,6],分别代表被调查企业在第9题,第11题,第18题,第19 题和第30题中所选答案,取值范围为1,2,3,4,5,6的自然数,分别代表各题的所选答案在被选答案中的标号。

从模型系数的t检验可知:取检验水平0.01,每个系数都显著的不为零,

这说明初次选入的变量虽然不能确保包括了全面的最优相关变量,但保证了各个变量都提供了一定的信息且不能互相代替。

(3)从剩余变量中选择较相关的变量

利用Y[,0]对剩余变量(题目)作最优全子集回归,根据C[,p]准则,选出如下最优子集:“X[,1],X[,2],X[,3],X[,4],X[,5],X[,6],X[,7],X[,8],X[,9],X[,10],X[,11],X[,12],X[,13],X[,14],X[,15],X[,16]”

分别代表第1题,第2题,第3题,第4题,第5题,第8题,第12题,第14题,第16题,第20题,第21题,第24题,第29题的选项及企业所属省份、地区、行业。

为了分析最优子集中的每个变量的不同水平是否对环保得分产生显著性影响,我们用多因素ANOVA模型来判别。

用企业意识得分作为因变量,最优子集中的每个选题作为一个因素,建立多因素ANOVA模型,并检验是否每个因素的所有水平的处理效应为零,即是否每个因素能通过固定模型方差分析的零假设。模型如下:

Y=μ+X[,1]+X[,2]+X[,3]+X[,4]+X[,5]+X[,6]+X[,7]+X[,8]+

X[,9]+X[,10]+X[,11]+X[,12]+X[,13]+X[,14]+X[,15]+X[,16]

检验结果为:

相关文档
最新文档