最新应用SPSS软件进行列联表分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用SPSS软件进行列联表分析
在许多调查研究中,所得到的数据大多为定性数据,即名义或定序尺度测量的数据。例如在一项全球教育水平的研究中,调查了400余人的个人信息,包括性别、学历、种族等,对原始资料进行整理就可以得到频数分布表。
定义四个变量:gender(性别)、educat(学历)、minority(种族)、count(人数),其中前三个为分类变量,并且gender变量取值为0、1,标签值定义为:0表示female,1表示male;educat变量取值为1、2、3,标签值定义为:1表示学历低,2表示学历中等,3表示学历高;minority变量值为0、1,标签值定义为:0表示非少数种族,1表示为少数种族。下面做gender、educat、minority的三维列联表分析及其独立性检验。数据文件如图1所示。
图1
第一步:用“count”变量作为权重进行加权分析处理。从菜单上依次选Data--weight Cases 命令,打开对话框,如图2所示。
图2
点选Weight Cases by项,并将变量“count”移入Frequency Variable栏下,之后单击OK按钮。
第二步:从菜单上依次点选Analyze--Deseriptive Statistics--Crosstabs命令,打开列联分析对话框(Crosstabs),如图3所示。
图3
第三步:在Crosstabs对话框中,如图4将变量性别gender从左侧的列表框内移入行变量Row(s)框内,并将受教育年限编码后得到的学历变量educat移入列变量Column(s)框内(若
此时单击OK按钮,则会输出一个2*3的二维列联表)。这里要输出一个三维列联表,将变量种族minority作为分层变量移入Layer框中,并且可以勾选左下方的Display clustered bar charts项,以输出聚集的条形图,如图8图9所示。
图4
第四步:选择统计量,单击Cosstabs对话框下侧的Statistics按钮,打开其对话框,如图5 所示。
图5
在Statistics对话框内,勾选Chi-square项,以输出表2进行独立性检验。这里由于不是定距
及定比尺度测量的数据,因此可以不选择简单相关系数Correlations 项。接下来根据数据的类型而选择相应的列联相关的测量值:在定类数据Nominal 栏下,勾选列联系数Contingency coefficient 和Phi and Cramer ’s V 选项(这里Phi 系数可以不选,因它只用于2*2的列联表,但SPSS 把它与Cramer 的V 统计量放在一个选项上,也就只好一并选上了),以及Lamabda 和不确定系数Uncertainty coefficient 。也可选择定序数据Ordinal 栏下得Gamma 、Somers 的d 、Kendall 的b τ和c τ。至于Nominal by Interval 栏下的Eta 选项就不必选了,因为这里不是定距及定比尺度测量的数据。单击Continue 按钮回到Crosstabs 主对话框。
第五步:单击Crosstabs 对话框下侧的Cells 按钮,打开其对话框,如图6所示。在Cell Display 对话框内,勾选Counts(计数)栏下的Observed(观测频数)与Expected(期望频数)两个选项;并勾选Percentage 百分栏下得Row(行百分比)、Column(列百分比)和Total(总百分比)三个选项。由此,可以输出列联表(如表1)。单击Continue 按钮回到Crosstabs 主对话框。
图6
第六步:单击Crosstabs 对话框下侧的Format 按钮,打开Table Format 对话框,如图7所示。它只是一个输出格式的定义,行序(Row Order )按照Ascending(升序)还是Descending(降序)排列,系统隐含设置是按照Ascending(升序)排列(事实上,一般不必打开此对话框,只用系统隐含设置即可)。单击Continue 按钮回到Crosstabs 主对话框。
图7
第七步:在Crosstabs对话框中,单击OK按钮执行。
输出结果如表1~4所示。
表1性别、学历、种族交叉表
表2卡方检验表
表3方向性测度
表4对称性测度
在三维列联表中,结合图7图8,可以看出:非少数种族的女性低学历的比例为72.9%,高于男性低学历的比例25.8%;而相反女性高学历的比例仅为0.6%,远远低于男性高学历的比例。在少数种族中,从低学历至高学历,无论男女都是同样的递减趋势,即低学历的所占比百分比高,中等学历的所占百分比其次,最少的就是高学历的所占百分比,只不过女性这种趋势更明显,分别为75%、25%、0%。
图8
图9
χ=93.724,非常大,相应的p值小于0.001.因此在0.001的显著水在非少数种族类型中:2
平下高度显著,即拒绝:性别与学历相互独立的原假设,两者之间具有高度显著的相关关联。由聚集的条形图可以直观的看到:女性低学历比例比男性高,同时男性高学历比例又比女性高。
χ=5.926,p=0.052>0.05,因此在0.05的显著水平下,没有理由拒绝在少数种族类型内:2
两个变量独立的原假设,表示性别与学历这两个变量之间相互独立,没有显著的相关关联。
在表3的方向性测度(Directional Measures)中,有两类系数:不确定系数(Uncertainty Coefficient)和Somers’d。每种系数均有三种形式:对称的(Symmetric)、以性别为因变量的及以学历为因变量的。事实上,我们关心的是两种形式——对称的(Symmetric)和以学历为因变量的。在这里非少数种族的对称不确定系数为0.173,而少数种族的对称不确定系数为0.050;并且以学历为因变量的非少数种族的对称不确定系数为0.148,而少数种族的列联相关程度高于少数种族的。
在对称性测度(Symmetric Measures)中,Crammer的V值列联表系数、Kendall的τ系数值以及γ值(Gamma),非少数种族的上述各项值均高于少数种族的,显示出预测力以非少数种族更强。事实上,在少数种族的Crammer的V值列联表系数的近似的p值为0.052,
在0.05的显著水平下不显著。