区域经济发展评价的多元统计方法【文献综述】

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文献综述

数学与应用数学

区域经济发展评价的多元统计方法

研究客观事物中多个变量(或多个因素)之间相互依赖的统计规律性, 它的重要基础之一是多元正态分析. 又称多元分析. 如果每个个体有多个观测数据, 或者从数学上说, 如果个体的观测数据能表为P维欧几里得空间的点, 那么这样的数据叫做多元数据, 而分析多元数据的统计方法就叫做多元统计分析. 多元统计分析是从经典统计学中发展起来的一个分支, 是一种综合分析方法, 它能够在多个对象和对个指标互相关联的情况下分析它们的统计规律, 很适合农业科学研究的特点【1】. 早在19世纪就出现了处理二维正态总体(见正态分布)的一些方法, 但系统地处理多维概率分布总体的统计分析问题, 则开始于20世纪. 人们常把1928年维夏特分布的导出作为多元分析成为一个独立学科的标志. 20世纪30年代, R.A.费希尔、H. 霍特林、许宝以及S.N.罗伊等人作出了一系列奠基性的工作, 使多元统计分析在理论上得到了迅速的进展. 40年代, 多元分析在心理、教育、生物等方面获得了一些应用. 由于应用时常需要大量的计算, 加上第二次世界大战的影响, 使其发展停滞了相当长的时间. 50年代中期, 随着电子计算机的发展和普及, 它在地质、气象、标准化、生物、图像处理、经济分析等许多领域得到了广泛的应用, 也促进了理论的发展. 各种统计软件包如SAS, SPSS等, 使实际工作者利用多元统计分析方法解决实际问题更简单方便. 主要内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、多元方差分析、直线回归与相关、多元线性回归与相关(Ⅰ)和(Ⅱ)、主成分分析与因子分析、判别分析与聚类分析、Shannon信息量及其应用【2】.

在区域经济研究过程中,描述经济现象的指标很多,过多的指标容易导致分析过程复杂化.而且变量之间可能存在一定的相关性,存在信息的重叠. 这就需要一种分析方法能克服相关性、重叠性,用较少的变量来代替原来较多的变量对复杂的区域经济问题进行深入分析、合理解释和正确评价,而这种替代可以反映原来多个变量的大部分信息. 因子分析正是解决这个问题的有效方法【3-4】. 因子分析法作为多元统计学的一个重要部分, 主要是从研究变量内部相关的依赖关系出发, 把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法. 它的基本思想是将观测变量进行分类, 将相关性较高, 即联系比较

紧密的分在同一类中, 而不同类变量之间的相关性则较低, 那么每一类变量实际上就代表了一个基本结构, 即公共因子. 对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量【5】. 因子分析主要有两种基本形式:探索性因子分析(Exploratory Factor Analysis)和验证性因子分析(Confirmatory Factor Analysis). 探索性因子分析(EFA)致力于找出事物内在的本质结构;而验证性因子分析(CFA)是用来检验已知的特定结构是否按照预期的方式产生作用. 因子分析的基本思想是寻找公共因子以达到降维的目的. 在寻找公共因子的过程中, 是否利用先验信息, 产生了探索性因子分析和确定性因子分析的区别. 探索性因子分析是在事先不知道影响因素的基础上, 完全依据资料数据, 利用统计软件以一定的原则进行因子分析, 最后得出因子的过程. 而确定性因子分析充分利用了先验信息, 是在已知因子的情况下检验所搜集的数据资料是否按事先预定的结构方式产生作用. 因此探索性因子分析主要是为了找出影响观测变量的因子个数, 以及各个因子和各个观测变量之间的相关程度;而验证性因子分析的主要目的是决定事前定义因子的模型拟合实际数据的能力【6】. 进行探索性因子分析之前, 我们不必知道我们要用几个因子, 各个因子和观测变量之间的联系如何;而验证性因子分析要求事先假设因子结构, 我们要做的是检验它是否与观测数据一致.

建立因子分析模型的目的不仅是找出主因子, 更重要的是知道每个主因子的意义, 以便对实际问题进行分析. 如果求出主因子解后, 各个主因子的典型代表变量不很突出, 还需要进行因子旋转, 通过适当的旋转得到比较满意的主因子. 因子分析模型建立后, 还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位, 即进行综合评价. 例如地区经济发展的因子分析模型建立后, 我们希望知道每个地区经济发展的情况, 把区域经济划分归类, 哪些地区发展较快, 哪些中等发达, 哪些较慢等. 这时需要将公共因子用变量的线性组合来表示, 也即由地区经济的各项指标值来估计它的因子得分.因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释. 因此, 因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的.

 在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时, 需要研究以下几个方面的问题:简化系统结构, 探讨系统内核.“从树木看森林”, 抓住主要矛盾, 把握主要矛盾的主要方面, 舍弃次要因素, 以简化系统的结构, 认识系统的内核. 构造预测模型, 进行预报控制. 在自然和社会科学领域的科研与生产中, 探索多变量系统运动的客观规律及其与外部环境的关系, 进行预测预报, 以实现对系统的最优控制, 是应用多元统计分析技术的主要目的. 进行数值分类, 构造分类模式. 在多变量系统的分析中, 往往需要将系统性质相似的事物或现象归为一类. 以便找出它们之间的联系和内在规律性. 过去许多研究多是按单因素进行定性处理, 以致处理结果反映不出系统的总的特征. 进行数值分类, 构造分类模

式一般采用聚类分析和判别分析技术【7】, 如何选择适当的方法来解决实际问题, 需要对问题进行综合考虑, 对一个问题可以综合运用多种统计方法进行分析.

近年来, 在多元统计分析方面也有不少的研究成果, 将多元统计分析应用于经济发展状况的评估. 如宋焕斌, 孙鸿鹏的基于因子分析的区域经济实力比较, 应用多元分析中因子分析法对我国31 个地区在2000 年和2005 年的经济实力进行了比较分析【8】. 张建平, 基于多元统计中的主成分法分析的区域经济发展水平的综合评价, 用主成分分析法对我国区域综合经济实力在国内的地位进行了比较, 提出了用第一主成分作为一个地区综合经济实力的度量, 并对我国31 个省(地区) 的综合经济实力进行了排序, 同时分析了区域经济差异的特点及形成原因, 取得了较理想的效果【9】. 林健朱帮助, 基于核主成分分析的区域经济社会发展的综合评价, 提出了综合评价的核主成分分析(KPCA )方法解决了主成分析(PCA)在多指标综合评价中非线性分析的不足, 具有较高的客观性【10】.

参考文献

[1] 林震岩. 多变量分析SPSS的操作与应用[M]. 北京大学出版社, 2007.8.

[2] 余家林, 肖枝洪. 多元统计及SAS应用[M]. 武汉: 武汉大学出版社, 2008.

[3] 朱建平,殷瑞飞. SPSS 在统计分析中的应用[M] . 北京:清华大学出版社,2007 :155 - 170.

[4] 何晓群. 现代统计分析方法与应用[M] . 北京:中国人民大学出版社,1998 :316 - 333.

[5] 侯景新, 尹卫红. 区域经济分析方法[M] . 北京:商务印书馆,2004 :145 - 147.

何晓群. 多元统计分析[M]. 北京:中国人民大学出版社, 2007:167-181

[7] 理查德·A·约翰逊, 迪安·W·威克恩. 实用多元统计分析[M] . 清华大学出版社,2008:374-411.

[8] 宋焕斌, 孙鸿鹏, 基于因子分析的区域经济实力比较[J]. 辽宁石油化工大学学报,2007:第27卷第四期

[9] 张建平, 基于主成分法分析的区域经济发展水平的综合评价[J]. 农业与技术,2007:第27卷第3期.

[10] 林健, 朱帮助, 基于核主成分分析的区域经济社会发展的综合评价[J] .2006

相关文档
最新文档