多元统计分析——对应分析实验报告

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元统计分析——对应分析实验报告

————————————————————————————————作者: ————————————————————————————————日期:

多元统计分析实验报告

课程名称多元统计分析实验成绩

实验内容对应分析指导老师

姓名专业班级

一、实验目的

对应分析又称为相应分析,它研究的两组离散随机变量之间的关系,这些变量为定性变量。本次实验目的为练习对应分析,熟练其操作步骤,并对结果进行说明。

二、实验数据

本文利用表2-1的数据进行分析。其中,

表2-1北京老龄化数据

生活自理能力

完全自理部分自理不能自理合计

自评健康状况很好129 14 8 151 好931 146 96 1173 一般660 116 74 850 差251 104 81 436 很差11 7 23 41 没回答15 13 24 52 合计1997 400 306 2703

将表2-1数据保存为对应分析数据形式,如表2-2所示。其中selfasses s(自评健康状况)的六个水平由1-6分别为“很好”“好”“一般”“差”“很差”“没回答”;independence(生活自理能力)的三个水平由1-3分别为“完全自理”“部分自理”“不能自理”;frenquency(频数)为各个水平下的人数,在接下来的分析中,会据其对变量进行加权再做分析。

表2-2 对应分析数据(北京老龄化数据)

三、实验过程

在spss16.0软件中,对表2-2数据做对应分析。

首先应对个案进行加权操作。选择【Date】—【Weight Cases】,出现表3对话框。选择frequency作为加权,如图3-1所示。

图3-1 加权个案

对个案加权后,开始做对应分析。选择【Analyze】—【Date Redu ction】—【Corespondence Analysis】,会出现图3-2对话画框。

图3-2 对应分析对话框

接下来对行变量和列变量进行设置。将selfassess(自评健康状况)选入Row,作为行变量,并选择【Define Range】,填写范围后点击【Update】—【Continue】,如图3-3所示;按同样的步骤,将independence(生活自理能力)选入Column(列变量),并设置列变量,如图3-4所示;最终设置结果如图3-5所示。

图3-3行变量设置

图3-4列变量设置

图3-5 对应分析设置结果

点击【OK】,便可得到对应分析结果。

四、实验过程

表4-1为对应分析的版本信息。图中显示为1.1版本。

表4-1对应分析版本信息

表4-2是列联表,列示了在各个水平下的人数。

表4-2 列联表

表4-3为对应分析总述表。表中显示了奇异值(Singular Value),第一个维度的奇异值为0.253,第二个维度的奇异值为0.125;惯量(Inertia)为特征根,就是奇异值的平方;Chi Square 值为212.593,是总样本数除以总的Inertia觉原假设,认为两个随机变量不是相互独立的,本例中就是自评健康状况和生活自理能力不是相互独立的;贡献率(Accounted for)显示,第一个维度解释了总变异的80.4%,第二个维度解释了19.6%,两个维度解释了所有的变异;接下来依次为累计贡献率(Cumulative)、奇异值的方差(Standard Deviation)、奇异值的相关系数(Correlation)。

表4-3 对应分析总述表

表4-4为行变量指标。其中Mass就是自评健康状况各个水平的选择比例;Score in Dimension为自评健康状况在各维度上的得分,此得分就是行列得分图的坐标。Inertia为总惯量在各类别的分配。从惯量指标可以看出,“很差”、“差”这两类水平对总惯量的贡献最大,分别有0.035、0.025的惯量,总惯量仅有0.079;从组成(Contribution)中Of Point toInertiaof Dimension中可以看出,第一个维度主要反映了“很差”48.4%、“差”35.6%等类别,第二个维度主要反映了“没回答”54.5%、“很差”25.8%、“差”14.7%等类别,而从Of Dimensionto Inertia ofPoint可以看出,类别“很好”、“好”、“一般”、“差”、“很差”主要反映在第一维度上,反映在第一维度上的信息占其各自总反映信息的90%左右,类别“没回答”主要反映在第二维度上,反映在第二维度上的信息占其总反映信息的98%。

表4-4 行变量指标

表4-5为列变量指标。其中Mass生活自理能力各个水平的选择比例;Score inDimension为生活自理能力在各维度上的得分,此得分就是行列得分图的坐标。Inertia为总惯量在各类别的分配。从惯量指标可以看出,“不能自理”这类水平对总惯量的贡献最大,惯量为0.046,总惯量为0.079,其解释了50%以上的总惯量;从组成(Contribution)中Of Point to Inertia o fDimension中可以看出,第一个维度主要反映了“完全自理”21.3%、“不能自理”66.6%等类别,第二个维度主要反映了“部分自理”73%、“不能自理”22.8%等类别,而从Of Dimension toInertia of Point可以看出,类别“完全自理”、“不能自理”、主要反映在第一维度上,反映在第一维度上的信息占其各自总反映信息的90%以上,类别“部分自理”主要反映在第二维度上,但是其反映在第二维度上的信息和第一维度的信息量差别不大,第二维度上反映

了59.7%的信息,第一维度上反映了40.3%的信息。

表4-5 列变量指标

图4-6为行列得分图,该图根据行列指标图中的各类别在各维度上的得分所绘制。由图中可以看出,自评健康状况“很好”、“好”、“一般”,则生活自理能力越强,越接近“完全自理”;而自评状况“差”、则更接近于“部分自理”;自评状况为“很差”、“没回答”的会接近于“不能自理”。

图4-6 行列得分图

相关文档
最新文档