多元统计分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元统计分析课程论文
题目:中心城市综合发展水平的分析评价
专业:数学与应用数学
班级:112班
姓名:***
学号:*********
成绩:
中心城市综合发展水平的分析评价
摘要:本文多元统计中的因子分析方法,选取了反映城市综合发展水平的12个指标作为原始变量。应用SPSS统计分析软件,从中提炼出3个互不相关的公共因子,利用全国35个中心城市在3个因子上的得分,以各因予的方差贡献率作为权重,得出综合得分并排序;并用方差贡献率最大的两个因子给出各城市的因子得分图,从图上直观分析了各城市的综合发展水平,得到了良好效果。从而对全国35个中心城市的综合发展水平作出分析评价。
关键词:因子分析、因子得分、公因子、城市综合、综合得分
引言
中心城市的综合发展是带动周边地区经济发展的重要动力。在我国经济发展进程中,各个中心城市一直是该地区经济和社会发展的“引路者”。因而,分析评价全国35个中心城市的综合发展水平,无论是对城市自身的发展,还是对周边地区的进步,都具有十分重要的意义。因而,本文应用因子分析作出评价。
因子分析法是研究相关矩阵内部的依存关系,寻找出支配多个指标(可观测)相互关系的少数几个公共的因子(不可观测)以再现原指标与公因子之间的相关关系的一种统计方法。这些公因子是彼此独立或不相关的,又往往是不能够直接观测的。在所研究的问题中,以公因子(新变量)代替原指标(原变量)作为研究对象,并要求不损失或很少损失原指标所包含的信息,用公因子代替原指标所作的分析会比较简单和清楚。通常,这种方法需要求出因子结构和因子得分模型。前者通过相关系数来反映原指标与公因子之间的相关关系,后者是以回归方程的形式将指标表示为因子的线性组合。具体步骤如下:
1)对原始数据进行标准化变换,求出各指标间的相关系数矩阵;
2)建立因子模型,并确定因子贡献率及累计贡献率;
3)对因子载荷矩阵进行变换和旋转,并计算因子得分。
对于由因子模型矩阵得到的初始因子载荷矩阵,如果因子载荷之间相差不大,对因子的解释就不是很明确,因此要通过旋转因子坐标轴,使每个因子载荷在新坐标系中能按列和行向0或1两极分化。一般采取方差最大正交旋转法就能得到明确的分析结果。
表1 原始数据
指标解释:
我们选取反映城市综合发展水平的12个指标,其中8个社会指标,分别为:x1——非农业人口数(万人);x2——工业(万人);x3——货运总量(万吨);x4——批发零住宿餐饮业从业人数(万人);x5——地方政府预算内收入(万元);x6——城乡居民年底储蓄余额(万元);x7——在岗职工人数(万人);x8——在岗职工工资总额(万元)。
4个城市公共设施水平的指标,分别为:x9——人均居住面积(平方米);x10——每万人拥有公共汽车数(辆);x11——人均拥有铺装道路面积(平方米);x12——人均公共绿地面积(平方米)。
指标的选取参考了《中国城市统计年鉴中》指标的设置。原始数据来源于《中国城市统计年鉴(2004)》。
详细步骤如下:
(1)首先,在SPSS 22.0中输入变量、数据,然后将数据标准化,得到输出结果表2 。
(2)求解初始公共因子载荷矩阵。将标准化后的数据导入SPSS软件,依次选Analyze→Data Reduction→Factor,进入Factor Analysis对话框。把12个指标标量选入Variables中,点击Extraction按钮,在Method选项中选择Principal components,点击Continue按钮,回到主对话框点击OK,得到输出结果表3、4、5 。(3)因子旋转,在Factor Analysis对话框中点击Rotation对话框,选中Varimax进行方差最大化正交旋转,得到输出结果表6 。
(4)将载荷系数大小排序,在Factor Analysis主对话框中点击Options对话框,在Coefficient Display Format框中选中Sorted by size,然后点击Continue按钮,回到主对话框点击OK,得到输出结果表7 。
(5)因子得分,在Factor Analysis主对话框中点击Scores进入Factor Scores对话框,选中Save as variables,在Method选项中选择Regression计算因子得分,得到输出结果表8 。
(6)建立因子得分图,在Graphs,再出现的下拉菜单中点击Scatter,进入Scatterplot对话框,选择Simple,点击Define按钮,在弹出的Simple Scatterplot对话框中,分别选择fac1_1,fac2_1作为x轴与y轴,点击OK,即得到输出结果表9 。
(7)根据因子得分值进行进一步分析。
表2 标准化后的数据
表3 累计贡献率表4因子载荷矩阵
表5因子载荷矩阵
表6 旋转后的因子载荷矩阵
原变量x1可由各因子表示为:
x1=0.929*F1-0.183*F2+0.039*F3
原变量x2可由各因子表示为:
x2=0.806*F1-0.309*F2+0.334*F3
表7 载荷系数大小排序
表8 因子综合得分
将各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总,得出各城市的总得分F,即
F=(54.381*F1+22.077*F2+10.647*F3)/87.105