因子分析论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键词:因子提取正交旋转因子分析因子得分
1.问题提出
随着我国的经济的发展,人民的生活水平逐渐提高。从而家庭耐用品的拥有量也有所提高。但各省市的拥有量也存在差异。为了准确的把握各省市的情况及其差异。本文采用多变量统计因子分析的方法,对其进行定量分析。以期对各省市的耐用品拥有量的情况有个客观的把握,及反映各省市的经济发展情况。
2.耐用品拥有量指标的选择。
为了更好的反映各省市的耐用品拥有量的情况,且根据当今社会家庭拥有耐用品的档次的不同,可将其分为低,中,高档。从而本文使用2005年统计年鉴的数据。选取了具有代表的三类九个指标:
(一):低档消费耐用品:普通电话拥有量(部);
(二):中档消费耐用品:电冰箱拥有量(台),彩电拥有量(台),电视机拥有量(台),空调拥有量(台),移动电话拥有量(部);
(三):高档奢侈消费耐用品:家用电脑拥有量(台),家用汽车拥有量(辆),摄像机拥有量(台),照相机拥有量(台);
3.各省市耐用品情况分析:
1.本文所采取的定量分析方法:
本文的研究主要采取因子分析方法。因子分析是近些年来颇为流行的多元变量统计方法。它是用较少个数的公共因子的线性函数和特定因子之和来表达原有观测的每个变量,从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂的变量归纳为少数几个综合因子的一种多变量统计分析方法。当这几个公共因子的累计方差和达到85%以上时,就说明这几个公共因子反映了研究问题的大部分信息,而又不相关,信息不重叠。因子分析的数学模型用矩阵的形式表示为:X=AF+E
其中F为公共因子,E为特殊因子。
本文在对数据标准化以后,采取主成分法提取公共因子,并采用方差最大化正旋转。
2.考察原有变量是否适合进行因子分析。
表(一)是原有变量的相关系数距阵。可看到大部分的相关系数都较高,各变量呈较强的线性关系。且表(二)巴特利特球度检验和KMO检验可以看出,k值大于0.7且接近0.8是很适合进行因子分析的。所以原有变量适合进行因子分析。
原有变量的相关系数矩阵
Correlation Matrix 表(一)
空调器.375 .833 .839 .481 .577 1.000 .606 .742 .749
普通电话.389 .583 .572 .486 .403 .606 1.000 .346 .432
移动电话.622 .758 .872 .613 .699 .742 .346 1.000 .590
电冰箱.279 .768 .761 .544 .695 .749 .432 .590 1.000
巴特利特球度检验和KMO检验
KMO and Bartlett's Test 表(二)
Kaiser-Meyer-Olkin Measure of
Sampling Adequacy.
.797
Bartlett's Test of Sphericity Approx.
Chi-Square
283.481 df 36 Sig. .000
1.提取因子
在这根据原有变量的相关系数距阵,采用主成分分析法,提取因子并指定提取3个因子。
其分析结果如下表(三)。
因子分析的初始结
Communalities 表(三)
Initial Extractio
n
家用汽车 1.000 .839
彩色电视
机
1.000 .875
家用电脑 1.000 .946
摄像机 1.000 .885
照相机 1.000 .898
空调器 1.000 .889
普通电话 1.000 .987
移动电话 1.000 .812
电冰箱 1.000 .800
Extraction Method: Principal Component Analysis.
表三可以看出所有变量的共同度都大于0.8是比较高的,即各变量的信息都大部分被反应。说明本次因子提取的总体效果是理想的。
4.因子分析和因子解释
通过以上因子提取过程,选入3个公因子,其方差累计贡献率达88.127%,即反应原有信息的 88.127%见表(四)。且经旋转后分配到各因子的方差贡献率是比较合适的。我们将这3个因子作为评价全国32个省(市,自治区)百人拥有耐用品数分析的综合变量。
因子解释原有变量总方差的情况Total Variance Explained 表(四)
Compone nt
Initial Eigenvalues
Extraction Sums of Squared
Loadings
Rotation Sums of Squared
Loadings
Tota
l
% of
Varian
ce
Cumulative
%
Tota
l
% of
Varian
ce
Cumulative
%
Tota
l
% of
Varian
ce
Cumulative
%
1 6.07
5 67.497 67.497
6.07
5
67.497 67.497
3.66
9
40.761
40.761
2 1.14
6
12.738 80.235
1.14
6
12.738 80.235
3.04
5
33.830 74.591
3
.710 7.892 88.127 .710 7.892 88.127
1.21
8
13.536 88.127
4 .524 5.819 93.946
5 .193 2.145 96.091
6 .175 1.948 98.040
7 .095 1.054 99.094
8 .052 .576 99.670
9 .030 .330 100.000
Extraction Method: Principal Component Analysis.
公因子和原有变量之间的关联程度是由因子载荷值表示的。因子载荷值越高,表明该因子包含该指标的信息越多。表(五)表示初始的因子载荷矩阵。
初始因子载荷矩阵
Component Matrix(a) 表(五)