第九讲卡方检验案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.85 0.04260 24
0.167
1.26 0.10888 60
0.150
0.67 0.18858 104
0.471
0.07 0.23544 130
0.277
-0.52 0.20615 114 0.035
-1.11 0.12746 70
1.429
-1.70 0.05562 31
1.161
-2.29 0.01710 9
绿色字母 17 12 20 25
蓝色字母 19 9 14 28
二、 检2 验的基本原理
理论基础是1899年皮尔逊的工作:在分 布拟合优度检验中,实际观察次数 f 与理
o
论次数 f 之差的平方除以理论次数近似服 e
从 分2 布,即:
2 K
f o f e 2 ~ f
2
df
次数 离均差
2
15.38
7
12.38
22 9.38
57 6.38
110 3.38
124 0.38
112 -2.62
80 -5.62
25 -8.62
8 -11.62
4 -14.62
f o f e 2
Z分数 P 理论次数
f e
3.03 0.00237 1 2.44 0.01201 7
0.125
-2.88 0.00396 2
0.09
N 552 S 5.07 X 154.62
■分析
其一、分组数据第1组理论次数的计算
f Np
e1
e1
p y i
e1
Z S XC1
注: =i 组上限的Z值-组下限的Z值
S
其二、拟合指标卡方值的计算
2
2
3.905
12.6
.0593
3、离散型分布的拟合检验
■例 某项民意测验,答案有同意、不置可否、
不同意3种。调查了48人,结果同意的24人 ,不置可否的人12人,不同意的12人,问持 这3种意见的人数是否存在显著差异?
4、连续型分布拟合检验(例)
对于连续随机变量的测量数据,有时不知 道其总体分布,需要根据样本的次数分布的 信息判断其是否服从某种确定的连续性分布。 ⑴检验方法
即:实际观察次数与某分布理论次数
之间无差异;
H1:
f

o
f
e
⑵数理基础
H0: f 0 f e
2 K
f o f e 2 ~ f
2
df
e
⑶依统计检验公式,计算实得卡方值

2

K

f o f e 2 f
e
f Np
e
e
⑷作出统计决断

2
( df
)
N:总数 Pe:具体类别理论概率
①将连续性的测量数据整理成次数分布表 ②画出相应的次数分布曲线; ③选择恰当的理论分布; ④进行拟合检验;
■例:下表是552名学生的身高次数分布,问这 些学生的身高分布是否符合正态分布?
身高 组中值
169~ 170 166~ 167 163~ 164 160~ 161 157~ 158 154~ 155 151~ 152 148~ 149 145~ 146 142~ 143 139~ 140
5、二项分类的配合度检验与比率显著检验
⑴设总体比率为 p, 0
p且 q
0
0
时n
p 0

5
Z
p p e
~ N 0,1
pq
00
n
p p np n p f f
Z
e
e o
e
pq 00 n
np q 00
f •1
e2
Z 2 2
f
o f
f
e
wenku.baidu.com
2

2
~
2
df 1
用的样本统计量的数目;
2、卡方检验的假设
⑴分类相互排斥,互不包容; ⑵观察值相互独立; ⑶期望次数的大小应大于或等于5(较好趋
近卡方分布的前提);
■注
①自由度小时,必须 f ,否5 则利用卡方 e 检验需要进行较正或用精确的分布 进行 检验;
②自由度大时,可以有少许类别的理论次 数少于5;
③应用卡方检验时,应注意取样设计,保 证取样的代表性,否则依据卡方检验的 结果难以保证结论的科学性;
第九讲 卡方检验
一、检2 验的功能
1、适用资料─计数数据 计数数据的统计分析,测量数据的统计
方法并不适用,卡方检验是较为常用的一 种方法。
2、卡方检验的功能
⑴拟合优度检验[例] 即通过实际调查与观察所得到的一批
数据,其次数分布是否服从理论上所假 定的某一概率分布;
■例
某广播电视台为了了解广大儿童对其提供 的6种儿童节目的偏好(态度),随机抽取 了300名儿童,问他们最喜欢哪一种节目( 每人只能选一种),得到的数据如下表:
e
■注
-如果实际观察次数与理论次数的差异越
大,卡方检验的结果就越可能拒绝无差
虚无)假设接受备择假设。
-理论次数 f越大( f)拟5 合效果 越
e
e
好。
1、卡方检验基本公式

2

K

f o f e 2 f
e
■注
K 为类别的数目;
f是o 实际观察值;
f是理论(期待)次数; e
M是: 约束条件数或利用观察数据时使
e
■结论:Z检验与卡方检验一致 (样本比率p的真正分布是二项分布)
■例
某班有100名学生,男生的有42人,问男生
的比率是否与0.5有显著差异?
①比率显著性检验
⑶同质性检验
主要用于检验不同人群母总体在某一个变 量上的反应是否有显著差异。 [例]从四所幼儿园分别随机抽出6 岁儿童若
干,各自组成一个实验组,进行识记测 验。测验材料是红、绿、蓝三种颜色书 写的字母,以单位时间内的识记数量为 指标,结果如下。问四组数据是否可以 合并分析。
分组 1 2 3 4
红色字母 24 15 20 10
节目1 节目2 节目3 节目4 节目5 节目6 85 80 55 10 40 30
问:就调查的300人而言,他们对6个节目的 偏好(体现在人数)是否存在显著的差 异?
⑵变量间的独立性检验
在对一批观察数据进行双向多项分类之 后,这两个分类特征是独立无关的还是具 有连带相关的关系?
■例
某师范大学为了了解广大师生对实行“中 期选拨”制度的态度。曾以问卷调查的形式 对977名低年级学生、790名高年级学生和 764名教师进行随机调查,调查结果:
三、卡方检验应用一——总体分布的拟合检 验(goodness of fit test 配合度检验)
由于检验内容仅涉及一个变量多项分类 的计数资料,也称one-way test) 1、配合度检验的一般问题
即检验实际观察数据的分布与某理 论分布是否有显著的差别。
2、检验过程
⑴统计假设
H0:
f

0
f
e
相关文档
最新文档