我国各地区经济发展的统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元统计分析

课程设计

题目:我国各地区经济发展的统计分析学院:理学院

专业:统计学

学号:

姓名:

指导老师:

2013-4-25

摘要:采用因子分析的思想和聚类分析方法对2011年我国内地31 个省、市、自治区的20项社会经济发展指标数据进行主成分因子分析,提取2个综合因子,累积贡献率达87.689%再计算综合得分,并对我国内地各地区的经济给出综合排名,最后对各地区经济进行聚类分析,将31 个省市分为4 类,分析其结果。在评价结果的基础上,对我国内地各地区经济的发展,科学规划产业布局,优化产业结构等方面提出了相应的政策建议。

关键词:因子分析;聚类分析;综合得分;经济排名

0 引言

衡量一个省(自治区或直辖市)经济发展的基本状况,应该从多方面比如从该省(自治区或直辖市)的工业生产总值、固定资产投资、居民消费水平、进出口等指标去考察。而由于这些指标都是对经济发展基本状况的反映,它们自身之间就存在着较强的相关性,这样在用这些指标反映经济发展状况时就造成了信息的大量重叠,这种信息的大量重叠有时甚至会抹杀经济发展状况的内在规律,所以如果能找到一组较少的但却包含着较多信息量的变量来研究这个问题,就更容易使人抓住主要矛盾,同时使问题得到简化。因子分析正是解决这样问题的有效方法。本文就是先运用因子分析方法,对20011年全国内地31个省、市、自治区选取影响经济发展的20项指标进行分析,提取了2个综合因子,再用这2个综合因子进行分析,从而使复杂的问题得以简化。在运用聚类分析(快速聚类)将20个指标进行分成4类,即将各地区的经济强弱分成4类分析,在给出对应的分类。选取的20项指标分别为:农、林、牧、渔业总产值(亿元);地区生产总值(亿元);粮食产量(万公斤);居民消费水平(万元);进出口(万美元);最终消费支出(亿元);财政收入(亿元);支出财政(亿元);人口(万人);城乡居民人民币储蓄存款(亿元);国有企业工业总产值(亿元);私营企业工业总产值(亿元);建筑业总产值(万元);客运量(万人);旅游收入(百万美元);教育经费(万元);城镇基本医疗保险参保人数(万人);公共图书馆个数医疗卫生机构床位(个);教职工人数(人)。

1、数据的分析

1.1 数据的收集与整理

本文的数据的20指标均来自《中国统计年鉴2012》,由于20个数据都非常大,数据量多,因此对数据进行了提取,20指标的数据提取集中在一个表中,见附表1。

1.2 指标的注释

(1)农、林、牧、渔业总产值:指以货币表现的农、林、牧、渔业全部产品的总量,它反映一定时期内农业生产总规模和总成果。也直接反映了各地区的经济

(2)地区生产总值:地区生产总值是指本地区所有常住单位在一定时期内生产活动的最终成果。

(3)粮食产量:包括稻谷、小麦、玉米、高粱、谷子及其他杂粮外的产量。

(4)居民消费水平:居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。

(5)进出口:国家(地区)与国家(地区)之间的贸易往来,进为购入,出为外销,进口和出口的综合。

(6)最终消费支出:消费支出间接的反映了地区经济发展水平,且大小与经济大致成正比(7)财政收入:居民消费支出是指城乡居民个人和家庭用于生活消费以及集体用于个人消费的全部支出。

(8)财政支出:通常是指国家或地区为实现其各种职能,由财政部门按照预算计划,将国家或地区集中的财政资金向有关部门和方面进行支付的活动,因此也称预算支出。

(9)人口:人口是一个内容复杂、综合多种社会关系的社会实体,具有性别和年龄及自然构成,多种社会构成和社会关系、经济构成和经济关系。

城乡居民人民币储蓄存款:储蓄存款指为居民个人积蓄货币资产和获取利息而设定的一种(10)存款:顾名思义存款数目的大小直接反应各地区经济的强弱。

(11)国有企业工业总产值:即国有企业或国有控股企业的工业生产总值,是评定经济水平的一重要指标。

(12)私营企业工业总产值:即私营或个体企业的工业生产总值

(13)建筑业总产值:建筑业在一定时期内完成的以价值表现的生产总量,是反映建筑业生产成果的综合指标。通过它可以了解建筑业的生产规模、发展速度、经营成果,并为国家制订经济建设计划提供依据

(14)客运量:客运量指在一定时期内,各种运输工具实际运送旅客数量。它是反映运输业为国民经济和人民生活服务的数量指标,也是制定和检查运输生产计划、研究运输发展规模和速度的重要指标。

(15)旅游收入:旅游收入是指旅游接待部门(或国家、地区)在一定时期内通过销售旅游商品而获取的全部货币收入

(16)教育经费:教育经费,是指中央和地方财政部门的财政预算中实际用于教育的费用。各地区经济费用的大小间接反应了经济的强弱。

(17)城镇基本医疗保险参保人数:城镇职工基本医疗保险是为补偿劳动者因疾病风险遭受经济损失而建立一项社会保险制度。通过用人单位和个人缴费,建立医疗保险基金,参保人员患病就诊发生医疗费用后,与医疗保险经办机构给与一定的经济补偿,以避免或减轻劳动者因患病、治疗等所承受的经济风险。

(18)公共图书馆个数:由国家中央或地方政府管理、资助和支持的、免费为社会公众服务的图书馆。

(19)机构床位:这个指标间接的反应了各个地区医疗卫生的强度,而医疗强度近似与经济城正比,这样也间接的反应了经济的强度。

教职工人数:教职工人数能反应该地区文化深度,一个地区的文化深度的大小间接的可以看出该地区经济又多强

2、因子分析模型的分析

2.1基本理论:

因子分析是一种用较少的综合变量来表达多个观测变量的多元统计分析方法。它的基本思想是:由相关性大小把变量分组,同组内的变量之间有较高的相关性,不同组的变量相关性较低。它的基本目的是用少数几个综合变量(也称“综合因子”)去刻画较多变量之间的协方差关系,而各个综合变量之间是不相关的。这样,在保证数据信息丢失最少的原则下,对高维变量空间做了降维处理,.因子分析的结果经常用于综合判定。它的数学模型可表示如下:

⎪⎪⎩⎪⎪⎨

⎧111112211221122222

1122m m m m p p p pm m p

X a F a F a F X a F a F a F X a F a F a F εεε=++++=++++=++++ 其中,

p

X X X ,,21为P 个原始变量,是均值为0,方差为1的标准化变量,p

F F F ,,21为

m 个综合因子变量,m 小于p ,ij α

为因子载荷,表示的是第i 个原始变量在第 j 个因子变

量上的负荷,如果把变量i X 看成是m 维因子空间中的一个向量,则ij α为i X

在坐标轴j F 上的投影,相当于多元回归中的标准回归系数,模型表示成矩阵形式为X=AF+E ,其中X 为原始变量向量,A 为因子载荷矩阵,F 为因子变量或公共因子,αε=E E =αε由于残差E 的影响可以忽略不记,这时数学模型就变为X = AF ,因子分析的核心问题是构造因子变量,并对因子变量进行命名解释。

2.2 具体问题的分析

本文对我国内地31个省、市、自治区经济发展的基本状况采取8个主要指标进行了主成分分析,由于多个指标量纲不同,数据缺少可比性,因此必须将原始数据标准化,使得

各个指标有可比性,做以下变换:j j

ij ij x x x δ-=*,其中,∑==n i ij j x n x 1.1,∑=-=n i j ij j x x n 12

2

)(.1δ

令这样用得到的标准化数据做因子分析。采用的统计软件是SPSS 数据处理系统得到相关系数阵表,及KMO 和 Bartlett 的检验1和表2所示:

表1 20个指标的样本相关系数阵(部分)

相关文档
最新文档