SPSS对主成分回归实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《多元统计分析分析》实验报告
2012 年月日
学院经贸学院姓名学号
实验
实验成绩名称
一、实验目的
(一)利用SPSS对主成分回归进行计算机实现.
(二)要求熟练软件操作步骤,重点掌握对软件处理结果的解释.
二、实验内容
以教材例题7.2为实验对象,应用软件对例题进行操作练习,以掌握多元统计分析方法的应用
三、实验步骤(以文字列出软件操作过程并附上操作截图)
1、数据文件的输入或建立:(文件名以学号或姓名命名)
将表7.2数据输入spss:点击“文件”下“新建”——“数据”见图1:
图1
点击左下角“变量视图”首先定义变量名称及类型:见图2:
图2:
然后点击“数据视图”进行数据输入(图3):
图3
完成数据输入
2、具体操作分析过程:
(1)首先做因变量Y与自变量X1-X3的普通线性回归:
在变量视图下点击“分析”菜单,选择“回归”-“线性”(图4):
图4
将因变量Y调入“因变量”栏,将x1-x3调入“自变量”栏(图5):
然后选择相关要输出的结果:①点击右上角“统计量(s)”:“回归系数”下选择“估计”;“残差”下选择“D.W”;在右上角选择输出“模型拟合度”、“部分相关和偏相关”“共线性诊断”(后两项是做多重共线性检验)。选完后点击“继续”(见图6)②如果需要对因变量与残差进行图形分析则需要在“绘制”下选择相关项目(图7),一般不需要则继续③如果需要将相关结果如因变量预测值、残差等保存则点击“保存”(图8),选择要保存的项目④如果是逐步回归法或者设置不带常数项的回归模型则点击“选项”(图9)
其他选项按软件默认。最后点击“确定”,运行线性回归,输出相关结果(见表1-3)
图5 图6
图7
图8
图9
回归分析输出结果:
的协差阵也就是相关阵进行分解做因子分析或主成分分析),如果不需要对变量做标准化处理就选“协方差矩阵”;“输出”中的两项都选,要求输出没有旋转的因子解(主成分分析必选项)和碎石图(用图形决定提取的主成分或因子的个数);“抽取“下,默认的是基于特征值(大于1表示提取的因子或主成分至少代表1个单位标准差的变量信息,因为标准化后的变量方差为1,因子或者主成分作为提取的综合变量应该至少代表1个变量的信息),也可以自选提取的因子个数(即第二项),本例中做主成分回归,选择提取全部可能的3个主成分,所以自选个数填3。选完后点击“继续”进行下一步;③点击“旋转”(图14),按默认的“方法”下不旋转(注意,主成分分析不能旋转!)其他不用选,点击“继续”进行下一步;④点击“得分”,计算不旋转的初始因子得分(图15),选中“保存为变量”,“方法”下按默认,其他不修改,点击“继续”进行下一步。⑤“选项”下可以不选按默认(选项里主要针对缺失值和系数显示格式,不影响分析结果)
最后点击“确定”,运行因子分析。
图10
图11
图12
图13
图14
图15
由运行结果计算主成分:
表4、描述统计量
均值标准差分析 N
x1 194.5909 29.99952 11
x2 3.3000 1.64924 11
x3 139.7364 20.63440 11
表5、相关矩阵
x1 x2 x3
相关x1 1.000 .026 .997
x2 .026 1.000 .036
x3 .997 .036 1.000
Sig.(单侧)x1 .470 .000
x2 .470 .459
x3 .000 .459
表6、KMO 和 Bartlett 的检验
取样足够度的 Kaiser-Meyer-Olkin 度量。.492
Bartlett 的球形度检验近似卡方42.687
df 3
Sig. .000
表7、解释的总方差
成份初始特征值提取平方和载入
合计方差的 % 累积 % 合计方差的 % 累积 %
1 1.999 66.638 66.638 1.999 66.638 66.638
2 .998 33.272 99.910 .998 33.272 99.910
3 .003 .090 100.000 .003 .090 100.000 提取方法:主成份分析。
表8、成份矩阵a
成份
1 2 3
x1 .999 -.036 .037
x2 .062 .998 .000
x3 .999 -.026 -.037
提取方法 :主成份。
a. 已提取了 3 个成份。
由表5、6可知适合做主成分或因子分析(KMO检验通过),表7知前两个主成分(初始因子)贡献率已达99.91%,提取前两个主成分用于分析。由表8(初始因子载荷阵)和表7可计算前两个特征向量,用表8前两列分别除以前两个特征值的平方根得前两个主成分表达式:
F1=0.7066X1*+0.0439X2*+0.7066X3*(式1)
F2=-0.0360X1*+0.9990X2*-0.0260X3*(式2)
其中X1*-X3*表示为标准化变量(这是因为在进行主成分分析时是以标准化变量进行分析的,是从相关阵出发分析的,见图13的选项)。
由于主成分互不相关,可以用提取的主成分代替自变量进行回归分析,因此需要计算主成分得分来代替自变量X1-X3。主成分的计算:依据式1和2中两个主成分的表达式,对各自变量标准化后带入就可以计算出每个样品的主成分得分。但是在spss中,由因子分析提取时是用主成分法提取的,根据初始因子与主成分的关系,未旋转的初始因子等于主成分除以特征根的平方根,因此主成分得分等于因子得分乘以特征根的平方根,因此可以由因子得分计算主成分得分。前面在因子分析选项中保存了因子得分(见图15),因此计算两个主成分得分:点击“转换”—“计算变量”(图16):在弹出的窗口分别定义主成分F1=第一因子得分*第一特征根的平方根(图17)和F2=第二因子得分*第二特征根的平方根。
(3)主成分回归过程:
要做主成分回归,需要用标准化的因变量(因为自变量经过标准化处理做主成分分析,因变量需要对应做标准化)与主成分做回归,对因变量Y做标准化处理,点击“分析”—“描述统计”—“描述”(见图18),在弹出窗口中将Y调入变量,并选中“将标准化得分另存为变量”(图19)后确定完成Y的标准化。
点击“分析”---“回归”---“线性”(图20)在弹出窗口(图21)中将Zscore(y)调入因变量,F1和F2调入自变量,其他选项同前面图6-9,然后点击“确定”运行主成分回归,相关输出结果见表9