卡方检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章假设测定I V:卡方测定
(The Chi Square Test)
壹、本单元目标
1、举例说明卡方测定适用的情况。
2、解释双变项交叉表(bivariate table)的结构,以及如何将独立性
(independence)的概念应用到交叉表的期待次数(expected frequencies)与观察次数(observed frequencies)之间的关系上。
3、说明如何将假设测定的逻辑运用在交叉表的分析上。
4、以五个假设测定的步骤说明卡方测定,以及正确的解释测定的结
果。
5、说明卡方测定的限制,以及统计显著性与实质重要性的差异。
贰、简介
本章要介绍的Chi Square (χ2) test(卡方测定)大概是社会科学研究中,最常看到的一种假设测定方法。这是因为此测定方法相当容易符合假设测定第一个步骤─基本假定设定─的要求。此测定方法是两个名目尺度变项间之假设测定的方法。因此在level of measurement 的要求方面是最基本的nominal level of measurement。这名目尺度变项不限于是二分的,也可适用在其它尺度测量的变项上。而χ2test 也是一种无参数的测定,因此在基本假定部分,我们无须知道母群体之分配特性(distribution-free)。χ2之抽样分配是一种已知之理论分配,就叫χ2分配。(所谓Chi Square是χ这个希腊字母的发音加上「平方(square)」的英文)。
这种可以相当容易符合基本假定要求的无参数测定方法,可以让我们在做拒绝虚无假设的决策时,比较有信心。这是因为做假设测定时,如果在基本假定设定(测定的第一个步骤)中的任一要求或虚无假设(测定的第二个步骤)是错误时,我们就可拒绝虚无假设。但在无参数测定方法的情况下,我们比较容易符合基本假定的要求,因此可专注在判断虚无假设是否为错误,决策的结果也比较有信心。
参、双变项交叉表
卡方测定的进行要用到双变项交叉表。此交叉表同时呈现出两个不同变项间次数分配的情况。因此,双变项交叉表可用来探索这两个变项间是否有明显的关系存在。例如,以下是表示性别与教育程度间关系的一个双变项的交叉表:
表1性别与教育程度(N=100)
性别
教育程度男女合计
大专50 边缘总数大专以下50
50 50 100
双变项交叉表由栏(columns)与列(rows)组成。各栏与各列交会的部份就是表示两个变项共同次数的格(cells)。通常我们会将自变项放在栏的位置,应变项则放在列的位置(但研究者也可能会将位置调换)。一个交叉表中的每一栏及每一列,还会有该栏或该列的总数合计(subtotals),也称之为边缘总数(marginals)。整个交叉表的样本数,则是放在栏边缘总数与列边缘总数交会处。一个交叉表应该有清楚描述此表的表名。各栏及各列也要有变项名称,以及清楚表示变项类别的标题。
很明显的是,以上的交叉表还缺乏各格的讯息。一个完整之表自然是将上面每格内填入次数。各格的次数是将样本中每一个案,依照其在两个变项上所测量到类别或分数,一一放入各格中。
参、卡方测定的逻辑
χ2test有几种不同的用法,在此我们只讨论两种,一种是所谓的「独立性考验」(the test for independence),另一为「适合度考验」(the test of goodness of fit)。
以前我们已经碰到过所谓两样本抽样时要独立抽样之概念。在此情况下,这个概念是说:选取一个样本中之个案时,不会影响到选取另一个案之机率。在χ2 test之讨论中,独立性(independence)之意义略有不同。在此测定方法的情况中,独立性的意义是指变项间的关系,而非样本。当两个变项间的关系为独立时,则一个案分类到第一个变项中某一类别的机率,是和此个案出现在另一个变项之某一类别的机率无关。一个简单的两变项间关系为独立的例子是,做为一个男人或女人(性别)和他或她是否会结婚(婚姻状况)无关。但如果两个变项的关系不是独立的话,那么一个案出现在第一变项中某一类别之机
率,是会和此个案出现在另一变项之某一类别的机率则会有关系。设想另一种极端的状况是,如果是男性就一定是大专程度的话,当我们知道某一个按为男性时,我们也就知道其为大专程度的机率为100%。
以前面的例子来说,如果性别和教育程度并无关系,即两变项为独立时,则50位男性有大专学历及大专以下程度的机率应相当接近。就如同掷一个好的骰子一样,50个男生中,应该是有一半人为大专程度,另一半为大专以下程度。50位女性的情况,也是一样。事实上如果100人平均分在4格中,自是表示说一个人到那个格中是一个random chance。因此,当两变项为独立时,样本中个案到四格之任何一格的机率均等。这种机率均等的情况,就是χ2独立性考验之虚无假设的意义。因此,χ2 test of independence之虚无假设为「变项间之关系是独立的」。
肆、卡方的计算及测定的步骤
在χ2 test of independence之虚无假设「变项间之关系是独立的」情况下,即在说如果null hypothesis为真的话,则每格中之次数(即一变项之某一类别与另一变项之某一类别间之交集的次数)是在random chance下发生的。这种虚无假设下所产生(或算出)之次数称为「期待次数」(expected frequencies)或「理论次数」。χ2test of independence即在比较实际观察到的次数(observed frequencies)与期待次数之间的差距是否大到一显著水平下所期待的。基本上,我们是要计算一检定统计值,χ2(obtained),然后和χ2(critical)值来比较。
χ2(obtained)=Σ(f o-f e)2/f e,
其中
f o=实际观察到之每一格的次数
f e=为变项间若是独立时,每一格之期待次数
而一个f e=(相对应之列边缘合计)×(相对应之行边缘合计)/N
以下就以一例来说明χ2 test of independence之步骤。