分类资料统计描述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P就很小,若P≤α,就怀疑假设,因而拒绝它;若 P >α,则尚无理由拒绝它。
第15页/共58页
从公式χ2 值的计算可知, χ2 值会随着格子 数的增加而变大,即χ2 分布与自由度有关。
当自由度为1时, χ2 =3.84时P=0.05; 当自由度为3时, χ2 =7.81时P=0.05。 自由度计算公式: ν=(行数-1)×(列数-1)=(R-1) × (C-1)
基本公式: 2 (A T )2 T
a
(a a
b)( b
a c
Fra Baidu bibliotek
c) d
2
(a b)(a c)
b
(a a
b)(b bc
同理
(a c) T21 (a b c d ) (c d ) 28.44
T12
(1
a
ac bc
d
) (a
b)
(b d ) (a b) 8.44 (a b c d)
T22
(1
a
a b
c c
d
)
(c
d
)
(b d ) (c d ) 6.56 (a b c d)
36.56
8.44
28.44
6.565
ν=(2-1)×(2-1)=1 3、确定P值,做出结论。
χ2>3.84,P<0.05,按α水准拒绝H0,接受H1,故 可认为两总体有效率有差别。
第18页/共58页
二、四格表专用公式
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
合计 65(a+c)
无效 合计 有效率(%)
4(b) 45(a+b) 11(d) 35(c+d) 15(b+d) 80(n)
91.1(p1) 68.6(p2) 81.3(Pc)
第6页/共58页
1、四格表(fourfold table)
上述表格中,
41 4
24 11 这四个格子的
数据是最基本的,其余数据都是由这四个数据
(3)自由度趋向无穷大, χ2分布趋向正态分布。 2、当自由度确定时,χ2值愈大,P值愈小;反之,
χ2值愈小,P值愈大。
第5页/共58页
(二) χ2分布的基本思想(及步骤)
例9-2:某医师研究用兰芩口服液治疗慢性咽炎疗效有 无差别,结果如下:
慢性咽炎两种药物疗效资料
药物
有效
兰芩口服液 41(a) 银黄口服液 24(c)
实际发生数A与理论频数T的差值服从χ2分布, 公式如下:
2 (A T )2 T
第14页/共58页
由公式可以看出, χ2 值是以理论数为基础的相对 误差,反映了实际数 A与理论数T的吻合程度。
在H0:π1= π2成立的条件下, ︱A-T︳是由于
抽样误差所致,故χ2值不会太大,出现大的χ2值的概率
2、理论频数T( theoretical frequency) 实际频数A :实际发生的阴性、阳性数。 理论频数T :假设H0:π1=π2= Pc 成立,理论上 应发生的阴性、阳性数。
P 65
ac
c 80 abcd 81.3%
T11
45
65 80
(a
(a b
c) c
d)
(a
b)
36.56
第9页/共58页
第12页/共58页
当两样本率相等时,实际数A与理论数T的差值为0。 由此可见: ➢ 实际数A与理论数T之间的差别等价于两样本率的差
别; ➢ 检验假设H0:四格表的构成比相同,等价于H0:两
总体率相等; ➢ 对实际数A与理论数T之间差值的检验等价于两样本
率差值的假设检验。
第13页/共58页
4、 χ2检验的基本公式
➢ 确切概率法 ➢ 拟合优度检验
第2页/共58页
第一部分 四格表资料的χ2检验
➢χ2检验的基本思想及计算步骤
➢四格表专用公式 ➢连续性校正公式
➢四格表χ2检验的条件
第3页/共58页
一、 χ2检验的基本思想(及计算步骤)
(一) χ2分布
0.5
纵高
0.4 0.3 0.2 0.1 0.0
0
f
( 2)
1
第九章 χ2检验
χ2检验(Chi-square test)是现代统计学的创始人 之一,英国人K . Pearson(1857-1936)于1900年提 出的一种具有广泛用途的统计方法,可用于两个或 多个率间的比较,计数资料的关联度分析,拟合优 度检验等等。
第1页/共58页
主要内容
➢ 四格表的χ2检验 ➢ 配对四格表的χ2检验 ➢ 行×列表的χ2检验
推算出来的,故称之为四格表。
第7页/共58页
检验两个样本率所代表的总体率是否有差异时, 若第一组发生数为a,未发生数为b,第二组发生数 为c,未发生数d,则组成这样一个表格:
四格表的表示符号
组别 发生数(+) 第一组 a 第二组 c 合计 a + c
未发生数(-) b d
b+d
第8页/共58页
合计 a+b c+d a+b+c+d
第16页/共58页
(三)四格表χ2检验的步骤
1、建立假设,确定检验水准。 H0:π1= π2,即两总体有效率相等; H1:π1≠ π2 ,即两总体有效率不等; α=0.05
第17页/共58页
2、选择检验方法,计算检验统计量
2 (41 36.56)2 (4 8.44)2 (24 28.44)2 6.56
表T的列构成
41
4 45 36.56 8.44 45 R1:0.8124 0.1876 1.000 C1:0.5625 C2:0.5625
24
11 35 28.44 6.56 35 R2:0.8124 0.1876 1.000
0.4375
0.4375
65 15 80 65 15 80
1.000
1.000
第10页/共58页
由以上可知,理论频数计算公式为:
TRC
行合计 列合计 总例数
nRnC n
第11页/共58页
3、理论频数T的特征:
(1)理论频数表的各行和各列构成比相同;
(2)各个格子上的︱A-T︳相等。
理论四格表内部构成相同(H0:π1=π2= Pc )
实际四格表(A)
理论四格表(T)
表T的行构成
2(
/
2)
2
2
( / 21) e 2 / 2
自由度=1 自由度=2 自由度=3 自由度=6
P=0.05的临界值
3 3.84 6 7.81 9
1212.59 15
18
卡方值
图7-1 不同自由度第的4页χ/共25分8页布曲线图
χ2分布的特征:
1、 χ2分布是一种连续型分布:χ2分布曲线是一
簇曲线,其形状依赖自由度的大小: (1)当自由度小于2时,曲线呈L型; (2)随着自由度的增加,曲线趋向于对称;
相关文档
最新文档