教育与心理统计学第十章:卡方检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
B因素
类别1 ( B1) 类别2 (B 2) 合计
A因素
类别1 类别2 ( A 1) ( A 2)
N A1N B1/ Nt
N A 2N B1/ Nt
N A 2N B2/ Nt
N A 2N B2/ Nt
合计 N 2 B1 N B2
N A1
N A2
Nt
六、小期望次数的连续性校正
当单元格的人数过少时,处理的方法有四种: 1、单元格合并 2、增加样本数 3、去样本法 4、使用校正公式
3、同质性检验——检验不同人群总体在某一个变量的 反应是否具有显著性差异。
三、 χ2检验的基本思想
首先假设H0 成立,计算出χ2值,它表示观察值与理论 值之间 的偏离程度。根据χ2分布, χ2统计量以及自由 度可以确定在H0 成立的情况下获得当前统计量及更极 端情况的概率P。
如果P 很小,说明观察值和理论值偏离程度太大,应 当拒绝原假设,表示比较资料之间有显著性差异;否 则就不能拒绝原假设,尚不能认为样本所代表的实际 情况与理论假设有差别。
(二)相关样本四格Hale Waihona Puke Χ2 检验例题:10—11
(一)独立样本的四格表χ2检验
K2
n(ad bc)2
,
(a b)(c d )(a c)(b d )
其中n a b c d为样本容量。
因素A
因素B
分类1 分类2 合计
分类1
a c a+c
分类2
b d b+d
合计
a+b c+d N= a+b+ c+d
独立样本四格表χ2检验应掌握两种计算方法
一、独立性检验的一般问题与步骤
(一)统计假设 Ho:两因素之间无显著性差异 H1:两因素之间有显著性差异 (二)理论次数的计算 (通过样本比率来计算) (三)自由度的确定 (四)统计方法的选择 (套用公式即可) (五)结果及解释 (结果解释很重要,可以有四种解释表达方式)
二、四格表独立性检验
关”.
方法感悟
1. Χ2的计算公式中字母取值勿取错;在2×2列联 表中,a,b,c,d是有顺序的,因此在计算Χ2的值时容 易取错字母a,b,c,d的值. 2.只有当计算出的Χ2的值大于或等于Χ0.05或 Χ0.01时,我们才说两个变量“有关系”;否则就说 “没有充分的证据显示两个变量有关系”,即认为 两个变量无关系.
四、χ2检验的基本公式
χ2=
AT
T
2
实际频数A (actual frequency) 理论频数T (theoretical frequency)
五、期望次数的计算
当两个变量无关 联时,期望次数 为列联表中各个 单元格的理论次 数。即各个单元 格对应的两个边 缘次数的积除以 总次数。
双变量交叉表的期望值
Χ2=0.02,P=0.887,在这里P的概率结论是
P>0.05,两者之间的差异是不显著的。
跟踪训练
1. 研究人员选取170名青年男女大学生作为样本,对他 们进行一种心理测验,发现60名女生对该心理测验中的 最后一个题目的反应是:作肯定的有22名,作否定的有38 名;男生110名在相同的题目上作肯定的有22名,作否定 的有88名,问:性别与态度之间是否存在某种关系?试 用独立性检验的方法判断.
第十章 χ2检验 (Chi-square test)
第一节 χ2检验的原理 针对的是计数数据统计分析,表示的是对计数数据发 布情况的一个描述。一般采用列联表和交叉表的单 元格表示。一般用于一个因素的两项或多项分类的 实际观察频数与理论频数是否存在显著性差异。
换而言之:
根据样本数据推断总体的分布与期望分布是否有显 著差异,用于分类变量。
试根据上述数据,比较这两种手术对病人又发作心脏病 的影响有没有差别.
【常见错误】 在独立性检验中当Χ2 ≤2.706时,得出结论:“我
们判定又发作过心脏病和他是否做过这两种手术无关”,这里的错 误主要是结论下的太过武断.
【解】 由公式Χ2=a+bnc+add- ab+cc2b+d得 Χ2=39+135972×293+9×1617673-9+15279×125972+167≈1.780. 因为Χ2=1.780<2.706,所以我们没有充分证据显示“心脏
解:根据题意,得如下2×2列联表:
男生 女生 合计
肯定 22 22 44
否定 88 38 126
合计 110 60 170
根据列联表中的数据,利用公式计算得到 K2 的观测值为
Χ
2
=1701×10×226×0×384-4×221×2688
2
≈5.622>
5.024,所以
可以
在
犯错误的概率不超过 0.025 的前提下认为“性别与态度有
搭桥手术”、“血管清障手术”与“又发作过心脏病”有 关系,所以没有充分证据表明这两种手术对病人发作心脏 病影响有差别.
【防范措施】 在利用2×2列联表进行独立性检验时,如果Χ2 ≤2.706,
并不是表示两个分类变量没有关系,只是没有充分证据表明它们有关系 而已,所以在解题中不要滥用.
二、四格表独立性检验
第三节 独立性检验
独立性检验——检验两个或两个以上因素各种分类之间 是否有关联或是否独立的问题。
换而言之,独立性χ2检验用于两类变量的多项分类的计
数资料分析。两类变量下可以有多个因素。
例如:血型与人的性格 家庭经济状况与学业成绩
在统计整理时,通常把独立性χ2检验编制成列联表的形
式,即把一个变量的分类资料写在行内,另一个变量的分 类资料写在列内,用r表示行变量的分类项数,用c表示列 变量的分类项数,即rc列联表。 例题:表10-3学生的课外活动调查结果可以整理为2 3的 列联表。 rc列联表的自由度为df=(r-1)(c-1)
Pear son Chi-Square Continuity Correctiona
Value .020b
.000
df 1 1
Asy mp. Sig. (2-sided) .887
1.000
Exact Sig. (2-sided)
Exact Sig. (1-sided)
Lik elihood Ratio
其原假设为: H0:观察频数与期望频数没有差别
一、χ2检验的假设
1、分类相互排斥,互不相容 2、观测值相互独立 3、期望次数的大小(≥5)
二、 χ2检验的分类
1、配合度检验——一个因素多项分类的实际观察数与 某理论次数是否接近。
2、独立性检验——检验两个或两个以上因素各种分类 之间是否有关联或是否独立的问题。
例题:10-10
例题:10-10在SPSS中的统计 【性别与学生成绩.sav】
性 别 * 成 绩 分 类 Crosstabulation
C o un t
性别 男 女
Total
成绩 分类
中等以上 中等以下
23
28
17
22
40
50
Total 51 39 90
男女性别在学业水平上的实际人数情况
Chi-Squar e Tests
七、χ2检验应注意取样设计
取样一定要有代表性,防止偏样本的出现
第二节 配合度检验
一、配合度检验的一般问题 1、统计假设 2、自由度的确定 (一是实验中分类的项数;二是观察数目的统计量的个
数) 3、理论次数的计算
二、配合度的应用
1、检验无差假说 例题10—1
2、检验假设分布的概率 例题10—3
精彩推荐典例展示
易错警示
独立性检验中的易误点
例2 对196个接受心脏搭桥手术的病人和196个接受
血管清障手术的病人进行了3年的跟踪研究,调查他们
是否又发作过心脏病,调查结果如下表所示:
心脏搭桥手术 血管清障手术
合计
又发作过心脏病 39 29 68
未发作过心脏病 157 167 324
合计 196 196 392
.020
1
.887
Fisher 's Exact Test
1.000
.529
Linear -by -Linear A sso ciation
.020
1
.887
N of Valid Cases
90
a. Computed only for a 2x2 table
b. 0 cells (.0%) hav e expected count less than 5. The minimum expected count is 17.33.