卡方检验 (Chi-square) 参数与非参数检验卡方匹配度检验 卡方独立性检验 卡方检验的前提和

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

单位格χ2
单位格χ2具有可加性 单位格χ2大于2.5,说明该因素对整个统计
检验的显著贡献较大
卡方独立性检验
检验行和列的两个变量彼此有无关联 是命名型变量, 顺序型变量相关的计算方

卡方独立性检验的公式
χ 2= ∑[<f0-f e>2/ f e]
f e=〔row total〕〔column total〕/n,
卡方分布
1. 是一系列平方和相加,没有负值 2. 当H0为真时,Chi square 的数值会小 3. 典型的卡方分布是正偏态,右侧的尾端构成临
界区域 4. 卡方分布的形状并不取决于样本数目,而是取
决于类目数目. df =C-1 5. 当卡方df 增加时,卡方的临界值增加. 6. 当卡方df 增加时,卡方分布的偏态越来越不严
性吗?
卡方匹配度检验的虚无假设-期望次数
在医生职业中,男的多还是女的多? 在外科医生中,男的是否占80%? 最喜欢的咖啡品牌
卡方匹配度检验的公式
f e=pn df =C-1 χ2= ∑[<f0-f e>2/ f e] F0:观察次数 f e :期望次数 C:类目的个数 Χ2:统计量
χ2与效应大小〔effect size〕
Phi系数,范围0至1,是一种多元相关系数 在2×2列联表时,
在多于2×2列联表时,
Phi系数:Cohen’s convension
当dfsmall=1时, Φ=0.10表示小的效应, Φ=0.30表示中等的效
应,Φ=0.50表示高的效应. 当dfsmall=2时, Φ=0.07表示小的效应, Φ=0.21表示中等的效
关系.每个个体被分类为出生顺序为1至3,及高自尊,低 自尊.这个卡方独立性检验的自学生选课的因素有上述4种,哪些因素的影响力更强?
卡方匹配度检验的例题
影响学生选课的因素有上述4种,哪些因素的影响力更强? H0: 4种因素的影响力相等 Df=3,Χ2<3>.05=7.81 求边缘和N=18+17+7+8=50 χ2= ∑[<f0-f e>2/ f e] =<18-12.5>2/12.5+ <17-12.5>2/12.5 +<712.5>2/12.5+<8-12.5>2/12.5=2.42+1.62+2.42+1.62 =8.08 推翻H0: 4种因素的影响力不同
df =〔R-1〕〔C-1〕
F0:观察次数
f e :期望次数
R :行类目的个数 数
C:列类目的个
χ 2:统计量
对手表显示的偏好程度与被试的年龄段是 否有关?
卡方独立性检验
检验行和列的两个变量彼此有无关联 是命名型变量,顺序型变量相关的计算方
法 有时变量虽为等距型,但若不符合Pearson
卡方检验 <Chi-square>
1. 参数与非参数检验 2. 卡方匹配度检验 3. 卡方独立性检验 4. 卡方检验的前提和限制 5. 卡方检验的效应大小和效力
参数与非参数检验
参数检验 用于等比/等距型数据 对参数的前提:正态分布和方差同质 非参数检验 不用对参数进行假设 对分布较少有要求,也叫distribution-free
小的效应
概念小测查: 判断正误
1. 在卡方检验中,样本数据称为观测频率. 2. 卡方检验的一个优点是它可以用于命名量表的数据. 3. 假定卡方匹配度检验采用三个类目的无偏假设.如果样
本有n=60个被试,那么每个类目的期望次数是fe=20. 4. 一个检验三个类目分布的卡方匹配度检验,研究者取了
100名被试,这个卡方匹配度检验的自由度是df=99. 5. 卡方独立性检验要求每个个体在两列变量上分类. 6. 卡方检验的自由度不依赖样本量大小. 7. 在卡方检验中,观测频率可能为分数或小数. 8. 一般来说,一个大的卡方值会容易拒绝虚无假设. 9. 卡方的数值永远不会为负数. 10. 一位研究者用卡方独立性检验,评价出生顺序和自尊的
χ 2=<17-12>2/12 +<32-30>2/30 +<11-18>2/18
+<13-18>2/18 +<43-45>2/45 +<34-27>2/27
=2.08+ 0.13+2.72+1.39+0.09+1.81=8.22 推翻H0,学业成绩和自尊水平彼此相关
卡方检验的前提和限制
1. 观察彼此独立 2. 所有 fe >=5
相关的统计前提,也可用卡方独立性检验
以下数据是学业成绩和自尊分数,求二 者的关系
被试 A B C D .. ..
学业成绩 94 78 81 65
. .
自尊分数 31 26 27 23
以下数据是学业成绩和自尊分数,求 二者的关系
H0:学业成绩和自尊水平彼此独立 Df=〔2-1〕〔3-1〕=2,Χ2<2>.05=5.99
tests 用于类目/顺序型数据 没有参数检验敏感,效力低 因此在二者都可用时,总是用参数检验
卡方匹配度检验 <Chi Square for Goodness
of fit>
用样本数据检验总体分布的形状或比率, 以确定与假设的总体性质的匹配度
是对次数分布的检验
研究情境
在医生职业中,男的多还是女的多? 在三种咖啡中,哪种被中国人最喜欢? 在北京大学中,各国留学生的比例有代表
应,Φ=0.35表示高的效应. 当dfsmall=3时, Φ=0.06表示小的效应, Φ=0.17表示中等的效
应,Φ=0.29表示高的效应.
计算上题例1, Cramer’s φ=sqrt 〔38.09/200/1〕=sqrt〔0.095〕=0.44
中等的效应
例2,Cramer’s φ=sqrt〔8.22/150/1〕=sqrt 〔0.027〕=0.23
相关文档
最新文档