第十二章卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、独立性检验的一般步骤
• 1.提出假设 提出假设 • 零假设:两项或多项分类是独立无关的(分类无 零假设 显著性差异) • 研究假设 研究假设:两项或多项分类是有关联的(分类存 在显著性差异) • 2.计算理论次数 2.计算理论次数
fe = f xi f yi N f xi为第 i格所对应的某一行之和 f yi为第 i格所对应的某一列之和
三、χ2检验的类型 χ
• 配合度检验 配合度检验:检验一个因素 一个因素多项分类的实际观 一个因素 察数与某理论次数是否一致的问题。当对连续 数据的正态检验时,亦称正态吻合性检验 • 独立性检验 独立性检验:检验两个或两个以上因素 两个以上因素的多项 两个以上因素 分类之间是否有关联 是否具有独立性 是否有关联 是否具有独立性 是否有关联或是否具有独立性的问题。 • 同质性检验 同质性检验:检验不同的总体 不同的总体在某一变量上的 不同的总体 反应是否有差异。无差异则表明两总体同质; 有差异则表明两总体异质。
二、 χ2检验的基本公式
χ =∑
2 k
( f0 − fe )
fe
2
• 即实计次数与理论次数的差的平方和除以理论次数 是与χ2分布非常近似的次数分布。 χ • 式中k为组数,f0为实际观察数(实计数),fe为理 论次数。 • 该公式是根据皮尔逊的配合度的理论公式推导而来, 该分布属于近似卡方分布,近似程度随自由度而变 化。
第二节 配合度检验
• 配合度检验(goodness of fit test ):主要用于 配合度检验(
实际观测次数与某理论观察次数 理论观察次数是否存在显著性差 实际观测次数 理论观察次数 异的分析。它适用于一个因素分为多个水平(分类) 的计数数据。
• 一、配合度检验的基本步骤
• • • • • (1)建立假设:H0:f0-fe=0或f0=fe H1:f0-fe≠0或f0≠fe (2)确定自由度: k为分类数或组数 计算理论次数只用了总数时: df=k-1 计算理论次数用到总数、平均数好标准差时:df=k-3
fe = p × N
(1) − X
(1) (2) (3)
(1) − X
S
根据Z查正态分布表
(4)
(5)
(6)
(7)
(8)
?
• 3.比率或百分数的配合度检验(例题10-6P307) 3.比率或百分数的配合度检验
理论次数 ( 率 ): f e = k 为分类数或组数 100 k
χ =
2
Leabharlann Baidu
∑
k
( f0 − fe )
方法一
• 根据概率计算的方法和乘法定理可以算出a、 b、c、d四格的理论次数 理论次数 • fa=(a+b)(a+c)/N fb=(a+b)(b+d)/N • fc=(a+c)(c+d)/N fd=(c+d)(b+d)/N • 确定自由度df=(2-1)*(2-1)=1,因为 计算理论次数涉及总数 总数
运用χ 检验时,其理论次数不得小于5. 运用χ2检验时,其理论次数不得小于5. 单元格的个案数过少时的处理方法: 单元格的个案数过少时的处理方法: (1)合并到相邻性质相近的单元格 (2)增加样本容量 (3)去除过少的个案类别 (4)使用校正公式 当期望次数小于10大于5 10大于 当期望次数小于10大于5时,用Yates’ 校正公式;期望次数小于5利用Fisher Fisher精 校正公式;期望次数小于5利用Fisher精 确概率检验法; 确概率检验法;当单元格内内容涉及到 重复测量时用McNemar检验。 McNemar检验 重复测量时用McNemar检验。
• (3)理论次数的计算:根据概率和经验计算 • (4)计算χ2值
• (5)作出推断
χ =∑
2
k
( f0 − f e )
fe
2
• 注意: χ2检验的概率是双侧概率,当计算的χ2> 注意: χ2.05或χ2.01时拒绝0假设。
二、配合度检验的应用
• 1.与常规有无差异的配合度检验 与常规有无差异的配合度检验
计算得到的 查表得到的
χ ≥ χα ,υ
2
2
;P ≤α ;P >α
χ < χα ,υ
2
2
三、四格表(2×2列联表)的独立性检验 四格表( 列联表)
因素B B1
因 素 B
边缘小计
A1 a A2 c a+c
B2 b d
a+b c+d
边缘小计
b+d N=a+b+c+d
• (一)独立样本的四格表的χ2检验 • 1.有三种计算方法(例题10-10P316)
N 理论次数: f e = k N 为总数, k 为分类数或组数
χ =∑
2
k
( f0 − fe )
fe
2
例题10-1(P302) 10-2 10-4
• 2.与正态分布有无差异的配合度检验 2.与正态分布有无差异的配合度检验
• (1)非连续变量的配合度检验 ) • 理论次数的计算步骤 理论次数的计算步骤: • 假设6个标准差包括了全体,每个等级所占的 标准差为:6σ÷k(k为等级数); • 依据各等级所占的标准差,查正态分布表,即 得各个等级所占的概率;(例题10-3P303)
六、应用χ2检验应注意抽样设计 应用χ
统计分析在依据样本的信息对总体进行推论时, 统计分析在依据样本的信息对总体进行推论时, 样本的代表性和对 最根本的一个环节是确保样本的代表性和对实验的 最根本的一个环节是确保样本的代表性和对实验的 良好的控制。 良好的控制 • 在心理与教育研究中,所收集到的数据有些是属于 定性的。获得这些数据的方式是通过调查访问和问 定性 卷,所收集到的数据仅仅是回顾性研究,多数情况 下难于对被试进行控制。又由于各种限制可能会遇 到有严重缺陷的样本,所以一定要注意取样的代表 性尽量避免出现有偏样本,在进行统计推论时要特 别小心。 •
• • • • • • 一、χ2检验的意义 二、 χ2检验的基本公式 三、χ2检验的类型 四、χ2检验所隐含的假设 五、期望次数的计算 应用χ 六、应用χ2检验应注意抽样设计
• 一、χ2检验的意义
• 1. χ2检验方法是能同时检验一个因素两项 或多项分类的实际观察频数 实际观察频数与某理论次数 实际观察频数 理论次数 分布是否一致的问题,或者说是否有显著 分布 性差异的问题。 • 实际观察频数(Observed frequencies): 实际观察频数( ) 指实验或调查中的计数数据; • 理论次数(theoretical frequencies):根 理论次数( ) 据概率原理 某种理论 概率原理或某种理论 概率原理 某种理论计算出来的次数,亦 称期望次数(expected frequencies)。
fe
2
三、二项分类的配合度检验与比 率显著性检验的一致性
假设p = q, x = f 0 , µ = f e , 当np > 5时,比率显著性检验的 公式为: p − pe x−µ f0 − fe Z= = = p0 q0 np0 q0 1 fe • 2 n 而χ 2 = Z 2 = ∑ x−µ =∑ σ
2
( f 0 − f e )2
1 fe • 2
= 2•∑
( f 0 − f e )2
fe
若p ≠ q, 则χ 2 = ∑
( f0 − fe )
fe
2
四、 χ2的连续性校正
• 1.当期望次数小于5时,用二项分布 1.当期望次数小于5 当期望次数小于 的概率计算(计算较为繁琐) 的概率计算(计算较为繁琐)
• 2.校正公式:当有一格的理论次数小于5且 n>40时。
χ =
2
N ( ad − bc − N / 2)
2
•
(a + b)(c + d )(a + c)(b + d )
(二)相关四格表的χ2检验 相关四格表的χ
• 1一般计算公式为: 一般计算公式为:
( A − D )2 χ2 =
A+ D A、D为前后两次实验或调查 中
五、期望次数的计算
• 期望次数 期望次数:无差假设成立时的数值或者 使某一理论假设成立时的数值。
• 如:男女的性别比的期望值为:1:1; • 调查时的同意与不同意的期望值为:1:1; • 调查时的同意与不同意与不置可否的期望值为: 1:1:1; • 正态分布的期望值与正态分布的概率相同。
• • • • • • •
• 关于本书(P306)例题的说明 说明
• (1)为了计算理论次数必须根据正态曲 线下某一组别所占的概率,然后用概率乘 以总数(P×N)才能求得各组的理论次数。 • (2)计算步骤是:确定组上限,计算离 差,利用公式(Z=X-X/S)求出标准分数, 根据标准分数求概率,用概率乘以总数得 理论次数。 • (3)自由度df=11-3(是因为求理论次 数时用到了总数、标准差和平均数这三个 约束条件)
χ =∑
2
k
( f0 − fe )
fe
2
方法二
• 直接用实计数计算卡方值
N(ad−bc) χ = (a +b)(c + d)(a + c)(b + d)
2 2
• 方法三
Z=
ˆ ˆ p1 − p2 ˆ ˆ ˆ ˆ (n1 p1 + n2 p2 )(n1q1 + n2 q2 ) n1n2 (n1 + n2 )
改变了或不一致的实计 数
f e = p * N ( p 各等级所占的概率
)
(2)连续变量分布的假设检验
• 对于连续随机变量分布的假设检验,其 关键步骤是:计算理论次数 计算理论次数(fe)与确定 计算理论次数 自由度(df)。 自由度 • 计算理论次数 计算理论次数是根据所选理论分布函数, 按实际分布的统计量带入函数式计算各 分组区间的理论频率,然后乘以总数即 为各分组区间的理论次数。 • 确定自由度 确定自由度是将分组的数目减去计算理 论次数时所用统计量的数目。
第十二 章χ2检验
• 掌握 • 卡方检验的基本公式 • 理论次数的计算技巧
本章考研知识点(2011)
• • 1.拟合度检验 2.独立性检验
• • • • •
第一节χ 第一节χ2检验概述 第二节 配合度检验 第三节独立性检验 第四节同质性检验与数据合并 第五节 相关源分析
第一节χ 第一节χ2检验概述
四、χ2检验所隐含的假设 χ
• • • • 1.不同的分类应具有独立性; 不同的分类应具有独立性; 不同的分类应具有独立性 2.观测数据相互独立; 观测数据相互独立; 观测数据相互独立 3.期望次数应尽量大; 期望次数应尽量大; 期望次数应尽量大 有些认为应大于5,有些认为应大于10; 有些认为应大于 ,有些认为应大于 ; 当理论次数过小时,应尽量避免使用χ 当理论次数过小时,应尽量避免使用χ2 检验。 检验。
• 2. χ2检验还能用于检验两个或两个以上 因素的多项分类之间是否有关联 是否 是否有关联或是否 是否有关联 具有独立性的问题。故χ2检验又可称为 具有独立性 独立性检验。 独立性检验 • 3. χ2检验又称列联表分析或交叉表分析 列联表分析或交叉表分析, 列联表分析或交叉表分析 因为其数据大多以列联表或交叉表呈现。 • 4. χ2检验还称百分比检验 百分比检验,因为其单元 百分比检验 格的数据是百分比。
• 3.确定自由度 3.确定自由度 • df=(R-1)(C-1) • 4.选择检验方法 4.选择检验方法
χ2 =
∑
( f0 −
fe
fe )
2
简便计算公式为:
χ2
f 02i ∑ = N − 1 f xi f yi
5.结果与解释 5.结果与解释
通过比较两个卡方值的大小作出决断 χ2值与 值的对应关系,通过查附表 χ2α,υ界值表 值与P值的对应关系 通过查附表12 值的对应关系, 得到,详见教材 得到,详见教材474页。 页
p = b (x , p 0 , n n 为总的个案数 x 为较少的个案数 p 0 为无差比率
)
• 2.Yates校正公式(计算简单) 2.Yates校正公式 计算简单) 校正公式(
χ =∑
2
(f
0
− f e − 1 / 2) fe
2
• 根据卡方值和自由度查表求概率
第三节独立性检验
• 一、概念 • 独立性检验主要是检验指两个或两个以上因 独立性检验 两个或两个以上因 计数资料是独立还是相关的问 素多项分类的计数 素多项分类 计数 题。 • 其零假设 其零假设为:两项或多项分类是独立无关的 (分类无显著性差异) • 研究假设 研究假设为:两项或多项分类是有关联的 (分类存在显著性差异) • 独立性检验一般的数据资料采用2*2或2*k, 及R*C的表格形式呈现。