多元统计分析对应分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学生实验报告
学院:统计学院
课程名称:多元统计分析
专业班级:统计123班
姓名:叶常青
学号: 0124253
学生实验报告
一、实验目的及要求:
目的熟悉和掌握对应分析的原理和上机操作方法
内容及要求本次操作就父母与孩子的受教育程度的关系进行对应分析,分别对父亲与孩子和母亲与孩子的受教育程度做对应分析,最后再对输出结果进行详细的分析。
二、仪器用具:
三、实验方法与步骤:
打开GSS93 subset .sav数据,对变量Degree与变量padeg和madeg进行对应分析,依次选择分析→降维…进入对应分析对话框,进行进行如下设置,便可输出想要的数据的:
四、实验结果与数据处理:
按照上述方法和步骤得出以下输出结果.
对父亲受教育程度与孩子受教育程度的关系进行分析如下:
表1
High School 27 248 34 79 37 425 Junior College 1 11 2 8 3 25 Bachelor 6 43 7 47 18 121 Graduate 3 22 3 27 16 71 有效边际193 632 75 206 99 1205 表2
,
表3
第二部分摘要给出了惯量,卡方值以及每一维度所解释的总惯量的百分比信息。总惯量为0.189,卡
方值为228.193 ,有关系式228.193=0.189*1205,由此可以清楚的看到总惯量和卡方的关系。Sig.是假
设卡方值为0成立的概率,它的值几乎为0说明列联表之间有较强的相关性。表注表明的自由度为(5-1)
*(5-1)=16。惯量部分是四个公共因子分别解释总惯量的百分比。
表4
High School .064 .584 .080 .186 .087 1.000 Junior College .040 .440 .080 .320 .120 1.000 Bachelor .050 .355 .058 .388 .149 1.000 Graduate .042 .310 .042 .380 .225 1.000 质量.160 .524 .062 .171 .082
表5
列简要表
Father's Highest Degree
R's Highest Degree
Less than
HS
High
school
Junior
college
Bachel
or
Gradua
te
质量
LT High School .808 .487 .387 .218 .253 .467 High School .140 .392 .453 .383 .374 .353 Junior College .005 .017 .027 .039 .030 .021 Bachelor .031 .068 .093 .228 .182 .100 Graduate .016 .035 .040 .131 .162 .059 有效边际 1.000 1.000 1.000 1.000 1.000
第三部分的结果是在对应分析中点击Statistics按钮,进入Statistics对话框,选中Row profiles
和Column profiles 交友程序运行所得到的。
表6
表7
Junior
.062 .127 -.512 .003 .003 .100 .127 .845 .972 college
Bachelor .171 .976 .321 .069 .406 .108 .948 .042 .990 Graduate .082 .874 .395 .029 .157 .078 .875 .073 .949 有效总计 1.000 .189 1.000 1.000
a. 对称标准化
第四部分是概述行点和概述列点,是对列联表行与列各状态有关信息的概括. 其中质量是行与列的边
缘概率,也就是PI与PJ。惯量是每一行(列)与其重心的加权距离平方,可以看到II=IJ=0.189。由概
述行点表可知变量degree的状态Less than HS和Bachelor在第一维度中贡献较大分别为0.399和0.406。
状态Less than HS对第二维度贡献最大为0.416。概述列表可知变量padeg的状态LT High School在第
一维度贡献最大为0.432。状态High School对第二维度贡献最大为0.559。
第五部分是degree各状态和paged各状态同时在一张二维表上的投影. 由图可以看到父亲初中的教
育程度、高中的教育程度与孩子的教育程度有较强的关联性。
表1
第一部分是对应表,对应表是由原始数据按degree与padeg分类的列连表,可以看到总有效观测值
为1350,而不是原始数据1500。说明有效的观测数据有1350个,这是因为原始数据中有150个数据缺失。
表2
第二部分是摘要表。第二部分摘要给出了惯量,卡方值以及每一维度所解释的总惯量的百分比信息。
总惯量为0.189,卡方值为228.193 ,有关系式228.193=0.189*1205,由此可以清楚的看到总惯量和卡方
的关系。Sig.是假设卡方值为0成立的概率,它的值几乎为0说明列联表之间有较强的相关性。表注表明的自由度为(5-1)*(5-1)=16。惯量部分是四个公共因子分别解释总惯量的百分比。
.
第三部分是概述行点和概述列点,是对列联表行与列各状态有关信息的概括.由贡献部分可以看出 LT High School这一状态对第一维度的贡献最大.在表的最后维度部分对各状态特征值的贡献部分,看到除了Graduate外,其余各最高学历的特征值的分布大部分集中在第一维度上,说明第一维度反映了最高学历各状态大部分的差异.
把母亲受教育程度和子女受教育程度的各状态投影到同一张二维图上,如上图所示。由图可以看到母亲受高中的教育程度和子女受初中,高中的教育程度有较强的关联性。
五、讨论与结论
通过对应分析可以大致了解父母亲受教育程度与孩子受教育程度的关系,并且实现了对应分析理论知识与实际操作的结合,此次试验的难点在于对输出数据的具体分析思维。由以上所有分析我们可以大胆推断子女受教育程度与父母双方受教育程度有着密切的联系,父母受教育程度很大的限制着子女的受教育水平。