中国各地区可持续发展主要影响因素的定量研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据信息, 主要反映在数据方差和协方差上, 方差越大, 数据 中所包含的信息就越多, 若一个事物一成不变, 则无需对其 进行研究。 而因子分析方法的实质是通过一组变量的几个线 性组合来解释这组变量的方差 %协方差结构。 其数学模型为: 标准差为 ’ 的 * 个标准化基 设 &’( &!())))))&* 为均值为 " , 本变量; +’( +!())))))+, 为 , 个因子变量, ,!* 。于是有:
基于尚未见应用多元统计分析方法来确定影响各省、 市 和自治区可持续发展的主要因素的文献公开发表的事实, 本 文 试 遵 循 %&’()*+& 所 给 出 的 原 则 , 尽 可 能 最 大 限 度 地 利 用 国家统计局公布的相关指标数据, 运用因子分析方法来确立 影响中国各地区可持续发展的主要因素, 进而求得各地区可 持续发展的特征。
!"" 指标的选取及数据的初步处理 !"!
指标的选取 对区域可持续发展的测度,是一项庞大复杂的系统工 程。本文仅拟进行静态的分析, 从某一截面数据来探求各地 区可持续发展的主要影响因素和特征。 这样就可以通过对一 定间隔时段不同截面数据分析结果的比较来掌握可持续发 展的动态。在选取基本指标时, 努力遵循 %&’()*+& 关于可持 续发展的测量原则, 参照国家统计局提出的关于可持续发展 在经济、 社会、 人口、 资源、 环境和科教等六大子系统指标结 构进行。搜集到的指标主要是 !"", 年国家统计局网站 -../0
!""’ 年 FGH 增长率
工业企业增加值率 总资产贡献率 工业企业成本费用率 三资工业企业全员劳动生产率 规模以上工业企业人均工业总产值 第一产业增加值在国内生产总值中的比重 第二产业增加值在国内生产总值中的比重 第三产业增加值在国内生产总值中比重 居民消费价格指数 人均基本建设支出 (万元 > 人) 城市化率 乡镇人均用电总量 进出口总额 (万美元) 外商投资企业进出口商品总值 (万美元) 外商投资企业年未登记数 (户) 外商投资企业投资总额 (万美元) 国际旅游外汇收入 (百万美元) 接待国际旅游人数 (万人次) 就业人员占总人口的比重 人均住房建筑面积 (平方米 > 人) 年底私营企业数 (万户) 个体户数 (万户) 人均财政收入 每百人中拥有本科毕业人数 文盲人口占 ’# 岁以上人口数比例 人口自然增长率 (5。) 人均科技三项支出 (元 > 人) 人均农业综合开发支出 (元 > 人) 人均农林水利气象等部门事业费 (元 > 人) 人均文体广播事业费 (元 > 人) 人均教育事业费 (元 > 人) 人均科学事业费 (元 > 人) 人均卫生经费 (元 > 人) 人均抚恤和社会福利救济费 (元 > 人) 人均社会保障补助支出 (元 > 人) 参保人数占总人口数的比例 每百万人拥有高等学校数 (所) 每万人拥有高校教师数 (人)
83!3!
标准化 选取的指标量纲不同, 数值差距巨大, 分布各异。 为了使
它们能相互之间进行比较,必须进行无量纲化的标准化处 理。良性指标计算公式为: (>;<?><) :;<= 1 @< 不良指标计算公式为: (><?>;<) :;<= 1 @< 其 中 :;< 为 标 准 分 ; >;< 为 基 本 指 标 ; >< 为 ,8 个 地 区 第 < 个指标的均值; @< 为样本标准差。
#"" 主要影响因素的定量分析 #"!
分析原理与模型 前面选取的众多指标虽然能对各地区的发展有较全面、 完整的反映, 但要从这众多的指标和描述性计算分析表中解 读出各地区可持续发展的综合状况却是十分复杂的工作。 况 且各变量之间 (稍后将证明) 还存在极大的相关性, 相互之间 可以线性表出, 从而出现信息的重叠, 使得可能出现重复地 解释、 交叉地解释甚或是有些方面难以得到解释。而因子分 析方法就是用较少的综合指标分析存在于各基本指标中的 各类信息, 它们可以根据分析目的的要求保留原基本指标尽 可能多的信息, 而各综合指标之间又是相互独立的。这些代 表各类信息的综合指标称为因子。 因子分析具备以下几个特 点: 第一, 因子变量的数量远少于原有基本指标的数量, 对因 子变量的分析能够减少分析中的计算工作量; 第二, 因子变 量并不是原有变量的简单取舍,而是对原始变量的重新组 构, 它们能够反应原有众多指标的绝大部分信息, 不会产生 重要信息的丢失问题; 第三, 因子变量之间是相互独立的, 不 存在相关关系, 对因子变量的分析能够为研究工作提供较大 的便利; 第四, 因子变量具有命名解释性, 能够反应被其综合 的原有变量的绝大部分信息。 因子分析能够做到对原有基本指标信息的综合, 是因为
!"# 指标的基本处理 83!38 单位化计算
为了使各地区之间能够相互进行比较, 对选择的基本指 标进行单位化计算,使大多数绝对数指标转化为相对数指 标。
,9
统计与决策 !""# 年 $ 月 (下)
决 策 参 考
表! 指标 指标定义 人均国内生产总值 (元 > 人) 人均可支配收入 (元 > 人) 农村人均纯收入 (元 > 人) 人均资本形成额 (万元 > 人) 我国各地区可持续发展静态基本指标 指标 指标定义 每万人拥有中学教职工数 (人) 农民家庭年末人均住房价值 (元 > 人) 人均日生活用水量 (升) 城市园林绿地面积占土地面积的比例 清扫面积占土地面积的比例 人均生产垃圾清运量 (吨 > 人) 每万人拥有环卫机械数 (台 > 万人) 每万人拥有公共交通车辆 (标台 > 万人) 人均公共绿地面积 (平方米 > 人) 每万人拥有公共厕所 (座 > 万人) 农村居民家庭土地经营耕地面积 9亩 > 人 : 单位 FGH 用水量 (立米 > 万元 ’CCC) 单位能源消费实现国民收入 9元 > 吨标煤 : 人均宜牧土地 (亩 > 人) 人均宜林土地 (亩 > 人) 人均宜农土地 (亩 > 人) 森林覆盖率 (’CCA) 森林蓄积率 (’CCA) 平均每人生活消费能源 9千克标准煤 C": 一次能源生产总量 水资源总量 (’CCC) 人口密度 一类河占评价河长的百分比 二类河占评价河长的百分比 三类河占评价河长的百分比 四类河占评价河长的百分比 五类河占评价河长的百分比 劣五类河占评价河长的百分比 每万人拥有环保系统人员数 (人 > 万人) 工业烟尘排放量 (吨) 工业粉尘排放量 (吨) 工业固体废物产生量 (万吨) 工业固体废物综合利用量 (万吨) (万元) I三废 I综合利用产品价值 环境污染与破坏事故 (次) 人均生活污水排放量 (吨 > 人) 污染治理项目本年完成人均投资 9元 > 人 : 自然保护区面积占辖区面积的百分数 每十万人拥有书刊从业人员 (人) 每万人拥有医院床位数 (张) 每十万人拥有城镇社区服务设施数 (个) 每百万人的三种专利授权量 (项) 人均研究与发展经费支出 (元 > 人)
决 策 参 考
中国各地区可持续发展主要 影响因素的定量研究
欧阳建国, 欧晓万
(韶关市委党校, 广东 韶关 #8!"!$ )
摘
要: 本 文 选 取 9$ 个 基 本 指 标 作 为 中 国 各 地 区 可 持 续 发 展 的 基 本 评 价 指 标 , 运用因子分析
方法对基本指标进行降维处理, 得到能充分反映基本指标信息的 8" 个综合指标。这可为科学评价 各地区可持续发展进程以及制定全面、 协调、 可持续发展的宏观政策和各地区可持续发展战略提供 定量依据。 关键词: 可持续发展; 特征值; 因子分析 中图分类号: A!! 文献标识码: % 文章编号: (!""# ) 8""!?$B9C "$?"",9?",
BEE BE# BE$ BED BE4 BEC B#" B#’ B#! B#A B#E B## B#$ B#D B#4 B#C B$" B$’ B$! B$A B$E B$# B$$ B$D B$4 B$C BD" BD’ BD! BDA BDE BD# BD$ BDD BD4 BDC B4" B4’ B4! B4A B4E B4# B4$
主要反映医疗卫生事业状况、环境保护能力和环境舒适程 度; BA’、 B$# 是 说 明 人 口 增 长 和 密 集 程 度 ; BAC、 BE’ 反 应 社 会 保 障状况; B!4、 B’、 B!、 BA、 BE、 B’"、 B’’、 B’A、 B’$、 BE# 等 分 别 说 明 经 济富足程度、 经济结构、 农民生活状况和城市化率。 所以综合 地看, 因子 +’ 反应了当代人在 经 济 、 社会、 环境、 科学技术和 教育、 文化体育卫生事业等方面的生存发展能力。可以命名 为 “当 代 人 经 济 、 社会、 环境、 科技教育等生存发展状况常规 基本因子” 。可以理解为通常意义下我们所讨论的经济、 社 会、 人口、 环境和科技教育等因素, 是对我国区域发展进程影 响最大的因素, 影响率为 !D)D45。 因子 +! 也携带了基本指标 数据很大的信息量, 是一个非常重要的影响因素。特征值的 绝 对 值 在 ")# 以 上 的 主 要 有 B#D、 B$’、 B#4、 BA"、 BE$、 BAA、 B4’、 B’#、
4A5的信息,故可以确定影响我国各地区可 持 续 发 展 的 主 要 因 素 有 ’" 个 。 其 中 因 子 +’
是携带原指标数据信息量最大的一个因素, 它综合了 A" 多个基本指标的信息。有 A" 个 基本指标的特征值的绝对值在 ")# 以上。 其 中 B!C、 BA#、 BA$、 BAD、 BE!、 BEA、 B4!、 B4#、 B4$ 等 分 别说明人口素质、 教育发达程度、 科学技术 水平和政府对科学技术的投入以及文化体 育事业的投入; BE4、 BED、 BA4、 B4A、 BDC、 BEC、 B#" 等
&-0+
在这里, 1-’(!( … 4$ ; 2-’(!( … ,。 , 为达到 因 子 变 量 至 少 要 反 应 原 基 本 指 标 4"5 以 上 的信息要求的最少因子数。 可以证明有 6789&:-" 的标准化变 量 &;[&’, … &4$] 的第 2 主成分为: &!, 而且 +2-<;2&-<;2 9=’ >!:%’9?%#:, ’ >! $=.@9+2:-$9&2:-4$ "+2, &2-<129%: 其中, <;2 为载荷矩阵 0 的特征向量的 转 置矩阵, % 为载荷矩阵 0 的特征值。 !"! 因子分析过程及结论 9’: 用 残 差 即 实 际 的 相 关 系 数 与 估 计 的 相关系数的差来评估相关矩阵和因素模型。 计算再生相关矩阵和残差, 通过矩阵中残差 绝 对 值 大 于 ")"# 的 因 素 个 数 及 百 分 比 来 评 估因素模型的可行性。计算结果显示残差绝 对值大于 ")"# 的个数是 4$ 个,占所有 个 案 这说明所用的因子分析模型, 对于估 的 !5 , 算变量之间的相关系数矩阵是合适的。 并通过对其 9!: 计 算 特 征 向 量 和 特 征 值 , 进行分析、 旋转来确定因子个数。因子提取 和旋转结果如表 ! 所示。 从表 ! 可以确定 ’" 个主要因子就能反映出原有变量协方差中
Байду номын сангаас
两者之间的关系越密切; 载荷越小则说明两 者之间的关系越疏远。 表示原 ! 为特殊因子, 有变量不能被公共因子所解释的部分。 本文选用主成份法进行分析, 所以分析 模型可以简化为:
B’ B! BA BE B# B$ BD B4 BC B’" B’’ B’! B’A B’E B’# B’$ B’D B’4 B’C B!" B!’ B!! B!A B!E B!# B!$ B!D B!4 B!C BA" BA’ BA! BAA BAE BA# BA$ BAD BA4 BAC BE" BE’ BE! BEA
1 1 2223*.4.*35+637& 上 , 公 布 的 !""8 年 中 国 各 地 区 可 持 续 发
展的 88$ 项基本指标。有些指标明显重复、 有些指标在各地 区之间不具备比较性、 有少部分有缺失的指标, 均被剔除。 在 资 源 方 面 极 个 别 重 要 数 据 缺 失 !""8 年 的 , 从 国 家 资 源 网 选用了最接近年份的数据来替代。 -../0 1 1 2223’4.434737& 上, 西藏自治区有两处缺失数据, 用各方面与其接近的青海省数 据替代。 最后选取 9$ 个基本指标为分析依据 (见表 8 ) 。 港澳 和台湾地区的数据暂缺。