《统计学》-第10章-习题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 收集我国31个省(区、市)2007年反映经济发展情况的八项指标的数据,具体采用的指标包括:地区生产总值、工业总产值、固定资产投资、职工平均工资、居民消费水平、货物周转量、居民消费价格指数、商品零售价格指数。并对这八项指标利用主成分分析法进行降维。
数据请见2012ChinaEcoDevp.asv。该数据是2012年我国31个省(区、市)地区生产总值(亿元)、大中型工业资产总值(亿元)、按登记注册类型分全社会固定资产投资(亿元)、镇私营单位就业人员平均工资(元)、居民消费水平(元)、货物周转量(亿吨公里)、居民消费价格指数、商品零售价格指数这八项指标。
SPSS各选项操作是按照课本中的步骤,此处省。
得到的相关系数矩阵见表1,从表中的数据来看,变量之间存在着较大的相关性,最大的值能达到0.965,所以对该组数据进行主成分分析时有意义的。
表一相关矩阵
地区居民消费水平(元)地区生
产总值
(亿元)
按登记
注册类
型分全
社会固
定资产
投资(亿
元)
镇私营
单位就
业人员
平均工
资(元)
货物周
转量(亿
吨公里)
居民消
费价格
指数
商品零
售价格
指数
地区居
民消费
水平
(元)
地区居民消费
水平(元)
1.000 .374 .074 .721 .595 1.000 .374 .074 地区居民消费
水平(元)
.374 1.000 .879 .340 .575 .374 1.000 .879 地区居民消费
水平(元)
.074 .879 1.000 .120 .504 .074 .879 1.000 地区居民消费
水平(元)
.721 .340 .120 1.000 .216 .721 .340 .120 地区居民消费
水平(元)
.595 .575 .504 .216 1.000 .595 .575 .504 地区居民消费
水平(元)
.044 -.311 -.389 .090 -.229 .044 -.311 -.389 地区居民消费
水平(元)
-.417 -.112 .007 -.313 -.072 -.417 -.112 .007 地区居民消费
水平(元)
.449 .965 .826 .407 .580 .449 .965 .826
表2是SPSS输出的一项表格,称为“解释的总方差”。表中的第二列是各个主成分对应的特征值,第三列是各主成分对解释原始变量总方差的贡献率,第四列是时方差的累积贡献
率。按照“特征值大于1”的原则,SPSS提取了三个主成分,即表中的前三个主成分。这三
个成分共解释原始变量总方差的84.562%。其中特征值的大小也可以在碎石图(图1)中可以看出。
表2 解释的总方差
图1 碎石图
主成份的系数并不能直接从SPSS 的输出结果中找到。根据因子分析与主成份分析的关系,主成份的系数可以由成份矩阵除以相应的特征值的平方根得到,见表4。SPSS 输出的成份矩阵见表3, 而相应的特征值已经在表2中 给出。
表3 成份矩阵
表4 成份系数矩阵
第一主成份中,地区生产总值、固定资产投资值,货物周转量的系数及大中型工业资产比较大,可以看成是影响一个地区经济发展的生产能力指标;第二主成份中,居民消费水平、平均工资的系数比较大,那么第二主成份可以看成是影响一个地区经济发展的消费情况;第三主成份主要反映了消费价格指数和商品零售价格指数。
则第一主成份=0.3218*地区居民消费水平+0.4373*地区生产总值+0.4049*按登记注册类型分全社会固定资产投资+0.2684*镇私营单位就业人员平均工资+0.3787*货物周转量-0.1945
成份
1
2
3
地区居民消费水平(元) 0.3218 0.5490
0.0908 地区生产总值 (亿元) 0.4737 -0.2074
0.1014 按登记注册类型分全社会固定资产投资(亿元) 0.4049 -0.4156
0.0503 镇私营单位就业人员平均工资(元)
0.2684 0.5243
0.1384 货物周转量(亿吨公里) 0.3787 0.0062
0.1226 居民消费价格指数 -0.1945
0.2483
0.6984 商品零售价格指数 -0.1611 -0.3585 0.6640
大中型工业资产(亿元)
0.4783 -0.1319 0.1296
*居民消费价格指数-0.1611*商品零售价格指数+0.4783*大中型工业资产;第二主成份和第三主成份的表达式类似。
在计算主成份得分时,要注意对原始的八个变量进行标准化后再代入到上述公式中。
2. 对第1题的数据进行因子分析,解释分析结果的经济意义,并比较主成分分析和因子分析的结果。
在进行数据降维的因子分析模块中,因子提取的方法是主成份法,因子载荷矩阵旋转采用的是最大方差法。表5的“公因子方差”表显示了各个变量的共同度。从表中可以看出,除了“货物周转量”变量外其他变量的共同度都比较高。
表5 公因子方差
初始提取
地区居民消费水平(元) 1.000 .911
地区生产总值 (亿元) 1.000 .938
1.000 .916
按登记注册类型分全社会固
定资产投资(亿元)
1.000 .761
镇私营单位就业人员平均工
资(元)
货物周转量(亿吨公里) 1.000 .564
居民消费价格指数 1.000 .874
商品零售价格指数 1.000 .882
大中型工业资产(亿元) 1.000 .919
提取方法:主成份分析。
对于因子分析,因子进行了旋转,其旋转之后的方差贡献率见表2的第8-10列。从表中可以看出,经过旋转的因子其方差贡献率发生了改变。但是累积方差贡献率没有变化,这表明旋转后的因子并未对原始数据产生更多的解释,但是旋转后的成份矩阵其值更接近于1或者0。旋转前的成份矩阵见表6,旋转后的成份见表7.
表6 成份矩阵
成份矩阵a
成份
1 2 3
地区居民消费水平(元).627 .712 .103
地区生产总值 (亿元) .923 -.269 .115
.789 -.539 .057
按登记注册类型分全社会固
定资产投资(亿元)
镇私营单位就业人员平均工
.523 .680 .157
资(元)
货物周转量(亿吨公里).738 .008 .139
居民消费价格指数-.379 .322 .792
商品零售价格指数-.314 -.465 .753
大中型工业资产(亿元).932 -.171 .147
提取方法 :主成份。
a. 已提取了 3 个成份。