主成分分析和因子分析的区别

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

更多精彩统计学相关文章,请访问“统计之都”Capital of Statistics——
主成分分析和因子分析的区别
一、二者在 SPSS 中的实现
(一) 、因子分析在 进行因子分析主要步骤如下: 1. 2. 3. 4. 5. 指标数据标准化(SPSS 软件自动执行) ; 指标之间的相关性判定; 确定因子个数; 综合得分表达式; 各因子 Fi 命名; 例子:对沿海 10 个省市经济综合指标进行因子分析 (一)指标选取原则 本文所选取的数据来自 《中国统计年鉴 2003》 2002 年的统计数据,在沿海 10 省市经济状况主要指标 中 体系中选取了 10 个指标: X1——GDP X3——农业增加值 X5——第三产业增加值 X7——基本建设投资 X9——海关出口总额 X2——人均 GDP X4——工业增加值 X6——固定资产投资 X8——国内生产总值占全国比重(%) X10——地方财政收入
SPSS 中的实现
图表 1 沿海 10 个省市经济数据 社会消 农业增加 工业增加 第三产业 固定资产 基本建设 费品零 值 值 增加值 投资 投资 售总额 14883.3 1390 950.2 83.9 1122.6 86.2 680 663 1023.9 591.4 1376.2 3502.5 1406.7 822.8 3536.3 2196.2 2356.5 1047.1 4224.6 367 2258.4 3851 2092.6 960 3967.2 2755.8 3065 1859 4793.6 995.7 1315.9 2288.7 1161.6 703.7 2320 1970.2 2296.6 964.5 3022.9 542.2 529 1070.7 597.1 361.9 1141.3 779.3 1180.6 397.9 1275.5 352.7 2258.4 3181.9 1968.3 941.4 3215.8 2035.2 2877.5 1663.3 5013.6 1025.5
地区
GDP
人均 GDP 13000 11643 9047 22068 14397 40627 16570 13510 15030 5062
海关出 地方财 口总额 政收入 123.7 211.1 45.9 115.7 384.7 320.5 294.2 173.7 1843.7 15.1 399.7 610.2 302.3 171.8 643.7 709 566.9 272.9 1202 186.7
辽宁 5458.2 山东 10550 河北 6076.6 天津 2022.6 江苏 浙江 福建 广东 10636 7670 4682 11770 上海 5408.8
广西 2437.2
(二)因子分析在 SPSS 中的具体操作步骤
1

更多精彩统计学相关文章,请访问“统计之都”Capital of Statistics——
运用 SPSS 统计分析软件 Factor 过程[2]对沿海 10 个省市经济综合指标进行因子分析。具体操作步骤如 下: 1. 2. 3. 4. Analyzeà Data Reductionà Factor Analysis,弹出 Factor Analysis 对话框 把 X1~X10 选入 Variables 框 Descriptives: Correlation Matrix 框组中选中 Coefficients 等选项, 然后点击 Continue, 返回 Factor Analysis 点击“OK”
对话框
图表 2 Factor Analyze 对话框与 Descriptives 子对话框
SPSS 在调用 Factor Analyze 过程进行分析时,SPSS 会自动对原始数据进行标准化处理, 所以在得到计算结果后指的变量都是指经过标准化处理后的变量, SPSS 不会直接给出标准 但 化后的数据,如需要得到标准化数据,则需调用 Descriptives 过程进行计算。我们可以通过 AnalyzeàDescriptive Statisticsà Descriptives 对话框来实现: 弹出 Descriptives 对话框后, X1~ 把 X10 选入 Variables 框,在 Save standardized values as variables 前的方框打上钩,点击“OK”, 经标准化的数据会自动填入数据窗口中,并以 Z 开头命名。Descriptives 对话框
图表 3 相关系数矩阵
2

更多精彩统计学相关文章,请访问“统计之都”Capital of Statistics——
图表 4 方差分解因子提取分析表
图表 5 初始因子载荷矩阵
3

更多精彩统计学相关文章,请访问“统计之都”Capital of Statistics——
从图表 3 可知 GDP 与工业增加值,第三产业增加值、固定资产投资、基本建设投资、社会消费品零 售总额、地方财政收入这几个指标存在着极其显著的关系,与海关出口总额存在着显著关系。可见许多变 量之间直接的相关性比较强,证明他们存在信息上的重叠。
通过图表 4(方差分解因子提取分析)可知,提取 2 个因子,因为方差累积贡献率为 84.551%,接近 85%。从图表 5(初始因子载荷矩阵)可知 GDP、工业增加值、第三产业增加值、固定资产投资、基本建 设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一因子上有较高载荷,说明第一因子基 本反映了这些指标的信息;人均 GDP 和农业增加值指标在第二因子上有较高载荷,说明第二因子基本反 映了人均 GDP 和农业增加值两个指标的信息。所以提取两个因子是可以基本反映全部指标的信息,所以 决定用两个新变量来代替原来的十个变量。此时,因子得分已经在窗口中自动给出。此处还可以选择对话 框中图表 2 中的 Rotation,选择不同的旋转方式,一般较为多用的是最大方差旋转。 关于综合得分,是用第一因子和第二因子加权平均得到,权重由 方差来得到,表 4 中 7.22+1.235=8.455 第一因子权重为 7.22/8.455,第二因子权重为 1.235/8.455
总因子得分=(7.22/8.455)*第一因子得分+(1.235/8.455)*第二因子得分
(二) 、主成分分析在 SPSS 中的实现
假定现在接着要对上面的例子进行主成分分析。spss 软件中没有直接给出主成分系数,而是给出 的因子载荷(图表 5),我们可将初始因子载荷系数(注意,非旋转后的因子载荷系数)除以相应的 ,
4

相关文档
最新文档