SPSS软件进行主成分分析的应用例子
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS 软件进行主成分分析的应用例子
2002年16家上市公司4项指标的数据⑸见表2,定量综合赢利能力分析如下:
1.主成分分析的做法
第一,将EXCEL
中的原始数据导入到 SPSS 软件中;
第二,对四个指标进行标准化处理;
【1】“分析” | “描述统计” | “描述”。
【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中,此 时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。
第三,并把标准化后的数据保存在数据编辑窗口中然后利用 SPSS 的factor 过
程对数据进行因子分析(指标之间的相关性判定略)。
【1】“分析”| “降维” | “因子分析”选项卡,将要进行分析的变量选入
“变量”列表;
【2】设置“描述”,勾选“原始分析结果”和“KMO与Bartlett 球形度检验”复选框;
【3】设置“抽取”,勾选“碎石图”复选框;
【4】设置“旋转”,勾选“最大方差法”复选框;
【5】设置“得分”,勾选“保存为变量”和“因子得分系数”复选框;
【6】查看分析结果。
所做工作:
a. 查看KMC和Bartlett 的检验
KMO直接近值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;Bartlett 球度度检验的Sig 值越小于显着水平,越说明变量之间存在相关关系。
所的结论:
符合因子分析的条件,可以进行因子分析,并进一步完成主成分分析。注意:
(Kaiser-Meyer-Olk in)
KMC统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO直接近值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO直接近值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。
Kaiser给岀了常用的kmo度量标准:以上表示非常适合;表示适合;表示一般;表示不太适合;以下表示极不适合。
球度检验:
巴特利特球度检验的统计量是根据相关系数矩阵的行列式得到的,如果该值较大,且其对应的相伴概率值小于用户心中的显着性水平,那么应该拒绝零假设,认为相关系数矩阵不可能是单位阵,即原始变量之间存在相关性,适合于做主成份分析;相反,如果该统计量比较小,且其相对应的相伴概率大于显着性水平,则不能拒绝零假设,认为相关系数矩阵可能是单位阵,不宜于做因子分析。
Bartlett 球度检验的原假设为相关系数矩阵为单位矩阵,Sig值为小于显着水平,因此拒绝原假设,
说明变量之间存在相关关系,适合做因子分析。
所做工作:
b. 全部解释方差或者解释的总方差仃otal Varianee Explained)
初始特征根(Initial Eigenvalues )大于1,并且累计百分比达到80%~85%以上。
查看相关系数矩阵的特征根及方差贡献率见表3,由于前2个主成分贡献率》85%结合表4中变量不岀
现丢失,所以提取的主成分个数m=2
所的结论:
初始特征根:入1= 入2 =
主成分贡献率:r 1= r 2=
注意:
主成分的数目可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。根据入值决定主成分数目的准则有三:
1. 只取入>1的特征根对应的主成分
从Total Variance Explained表中可见,第一、第二和第三个主成分对应的入值都大于1,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。
2. 累计百分比达到80%〜85%以上的入值对应的主成分
在Total Varianee Explained 表可以看岀,前三个主成分对应的入值累计百分比达到%这暗示只要选
取三个主成分,信息量就够了。
3. 根据特征根变化的突变点决定主成分的数量
从特征根分布的折线图(Scree Plot )上可以看到,第4个入值是一个明显的折点,这暗示选取的主成分数目应有p<4。那么,究竟是3个还是4个呢根据前面两条准则,选3个大致合适(但小有问题)。
第四,计算特征向量矩阵(主成分表达式的系数)
【1】将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数据编辑
【2】然后利用“转换” | “计算变量”,打开“计算变量”对话框,在“目标变― 量”文本框中输入“ F i”,然后在数字表达式中输入“ V i/SQR(入1)” [注:入i=],即可得到特征向量F i;
【3】然后利用“转换”| “计算变量”,打开“计算变量”对话框,在“目标变
量”文本框中输入“ F2”,然后在数字表达式中输入“ V/SQR(入2)” [注:入i=],即可得到特征向量F2;
第五,计算主成分得分矩阵(主成分得分)
【1】将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分函数的表
达式;
【2】然后利用“转换” I “计算变量”,打开“计算变量”对话框,在“目标变 量”文本框中输入“乙”,然后在数字表达式中输入“ * Z (销售净利率)+*Z (资产净利率)+*Z (净资产收益率)+*Z (销售毛利率)”[注:F i =”,],即可得到特征向量Z i ;
【3】同理[注:F 2=,,,],可得到特征向量乙; 【4】求出16家上市公司的主成分值。
第六,最后利用主成分函数、综合主成分公式:
【1】将得到的特征向量与标准化后的数据相乘然后就可以得出主成分表达式;
【2】然后利用“转换” | “计算变量”,打开“计算变量”对话框,在“目标变 量”文本框中输入“ Z ”,然后在数字表达式中输入“ m*Z 1+r 2*Z 2” [注:r 1=, r 2=],即可 得到综合主成分;
【
3】综合主成分(赢利能力)值。
表5.主成分、综合主成分(赢利能力)值