分类变量资料的统计推断

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

u p1 p2
p1 p2
S p1 p2
pc (1 pc )(1 n1 1 n2 )
pc

x1 x2 n1 n2
12
例2 某中药研究所试用某种草药预防流 感,观察用药组和对照组(未用药组) 的流感发病率,其结果见表1。问两组流 感发病率有无差别?
13
表1 用药组和对照组流感发病率比较
9 1
• (3)确定P值及推断结论
• 本 例 X2=4.90>X2=3.84,P<0.05 在 α=0.05
的水准上,拒绝H0,接收H1,差异有统计学意
义。可认为甲、乙两种白喉杆菌培养基的效果 有差别,甲培养基培养效果优于乙培养基。
45
三、行×列表的2检验
行×列表(R×C表)的检验主要用于解决多个
样本率或多个样本构成比的比较以及有序分类 资料的关联性检验。
基本公式

2
(A T )2 T

=(R-1)(C-1)

46
简化公式:
2 n

A2 nR nC
1
=(R-1)(C-1)
• 式中n为总例数,A为每格子的实际频数,nR、nC 分别为与某格子实际频数(A)同行、同列的合
组 别 观察人数 发病人数 发病率(%)
用药组
100
14
14
对照组
120
30
25
合计
220
44
20
14
计算结果
本例n1=100,p1=14%,n2=120,p2=25%, pc=20%,1-pc=80%,代入公式
0.14 0.25
u
2.031
0.20 0.80(1 100 1 120)
判断: u =2.031>u0.05=1.96,故p < 0.05。
在α=0.05水准上,拒绝H0,接受H1,差异有统 计学意义。
15
第三节 2 检验
16
2 检验用途: 1.检验两个或多个样本率及构成比之间
有无差别; 2.两属性变量间的关联分析; 3.频数分布的拟和优度检验等。
不全相同 =0.05
2 n( Ar2c 1) ... 3.422
nr nc
(4 1)(2 1) 3
54
根据 = 3 查 2 界值表,得P > 0.05,按=0.05的检验水准,不拒绝 H0,还不能认为两组儿童意外伤害类 型分布不同。
n
Sp
p(1 p) n
4
例11.1:某地随机抽取了368名5岁儿童, 检查得龋齿患病率为62.50%,试计算该 地5岁儿童龋齿患病率的标准误。
sp
p(1 p) ... 0.0252 n
5
二、总体率的区间估计
㈠正态分布法
样本含量n足够大, p和1-p均不太小,且
np与n(1-p)均≥5时 ,
p u S p
6
❖ ㈡ 查表法
❖ 当样本含量较小(如n≤50),np或n(1- p)<5时,样本率的分布呈二项分布,总体
率的可信区间可据二项分布的理论求得。
7
第二节 率的u检验
应用条件:样本含量n足够大, np
与n(1-p)均≥5 。
此时,样本率p也是以总体率为中心
呈正态分布或近似正态分布的 。
合计
90
320
410 21.95
实际数
理论数
21
(一)2 检验的基本思想
2 (A T )2
T
=(R-1)(C-1)
•2 分布:连续性分布,与自由度有关。 •2 界值表:P196 附表11-1
22
(一)2 检验的基本思想
• 首先假设H0成立,基于此前提计算出 2值,它表示观察值与理论值之间的偏 离程度。 • 根据2分布,由统计量2及自由度可 以确定在H0成立的条件下获得当前统计 量及更极端情况的概率P。
计数。
47
(一)多个样本率的比较
48
表11-4 不同季节呼吸道感染率比较
季节 感染人数 未感染人数 合计 感染率(%)

12

12
699
711
666
678
1.69 1.77

29
665
694
4.18

35
合计 88
717 2747
752 2835
4.65 3.10
49
H0 :四个季节呼吸道感染率相同 H1 :四个季节呼吸道感染率不同或不全相同
8
一、样本率与总体率比较的u检验
u值的计算公式为
u | p 0 | | p 0 |
p
0 (1 0 ) n
9
例1 根据以往经验,一般胃溃疡病患者 有20%(总体率)发生胃出血症状。现某医 生观察65岁以上胃溃疡病人152例,其中 48例发生胃出血,占31.6%(样本率)。 问老年胃溃疡病患者是否较一般胃溃疡 病患者易发生胃出血。
乙 13(10.24) 17(19.76) 30 43.33
合计
14
27
41 34.15
32
计算结果及判断
X2=2.812 本例:X2 = 2.812 < X2 0.05,1=3.84,
P>0.05
本例若对X2值不校正, X2 =4.197,得P
< 0.05,结论正好相反。
33
例 某医师用甲、乙两疗法治疗小 儿单纯性消化不良,治疗结果如表3, 问两疗法的治愈率是否相等?
17
一、四格表资料的 2 检验
四格表资料的检验主要用于两个样本率 (或构成比)的假设检验,一般制成表1 的计算格式(以阳性和阴性为例)。
18
表1 四格表资料 2 检验计算表
组 别 阳性数 阴性数 合计
甲组
a
b
a+b
乙组
c
d
c+d
合计
a+c
b+d a+b+c+d=n
19
一、四格表资料的 2 检验
20
80
24
96
2 14 90 86 30 2 220 4.125
100 120 44 176
3,且n>40时,需计算校正值。
(2)任一格的T<1或n≤40时,用确切概率计算法。
基本公式 专用公式
2
T
=(2-1)(2-1)=1 3.确定P及结论
根据 =1查 2 界值表,得0.01<P < 0.025,按=0.05的检验水准,拒绝H0, 接受H1,可认为两组发病率差别有统计学 意义,服药组流感发病率低与对照组。
27
2.四格表检验专用公式
2
ad bc2 n
(a b)(c d)(a c)(b d)
2(4.8) 9
33
38 71
36
计算结果及判断
2 26 2 736 71 2271 2.74 3338 629
本例:X2=2.74 < X2 0.05,1=3.84, P>0.05 本例若对X2值不校正, X2 =4.06,得P <
0.05,结论正好相反。
37
二、配对四格表资料的2检验
用途:用于配对定性资料差异性的假设检验 。
若b+c>40,公式为:
2 b c2
bc
若b+c≤40,需计算X2校正值: 2 b c 1 2
=1
bc
38
二、配对四格表资料的2检验
例11.7 某医师对55例类风湿关节炎患者, 分别采用免疫比浊法(ITA)与乳胶凝集 试验(LAT)法检测类风湿因子( RF ), 结果见表11-3,问两种方法检测效果有 无差别?
39
表11-3 两种方法检测RF结果比较
LAT
合计
ITA
+
-
+ 31(a) 12(b) 43
-
1(c) 11(d) 12
合计
32
23
55
40
检验步骤
H0 :B=C H1 :BC
=0.05
2 ( b c 1)2 ... 7.69
bc
根据 =1查2界值表,得0.005<P < 0.01,按 =0.05的检验水准,拒绝H0,接受H1,可认 为两种方法检出率有差别,ITA检出阳性率 高于LAT。
34
表3 甲、乙两疗法治疗小儿单纯性消化 不良的治愈率比较
组 别 发病人数 未发病人数 合计
用药组
26
7
对照组
36
2
合计
62
9
33
38 71
35
表3 甲、乙两疗法治疗小儿单纯性消化 不良的治愈率比较
组 别 发病人数 未发病人数 合计
用药组 26(28.8) 7(4.2)
对照组 合计
36(33.2) 62
例:为了解某中草药预防流感的效 果,将410名观察者随机分为两组, 观察结果如表11-1,问两组流感发 病率是否有差别?
20
表11-1 两组人群流感发病率的比较
分组 发病人数 未发病人数 合计 发病率(%)
服药组 40(50.49) 190(179.51) 230 17.39
对照组 50(39.51) 130(140.49) 180 27.78
23
(一)2 检验的基本思想
• 如果P值很小,说明观察值与理论值 偏离程度太大,应当拒绝原假设, 表示比较资料间的差异有统计学意 义;否则就不能拒绝原假设,还不 能认为 资料间有差异。
24
(二)2 检验的步骤
• 1.基本公式法:
• 条件:n>40,T>=5
2
AT 2 T
41
例3 有28份白喉病人的咽喉涂抹标 本,把每份标本分别接种在甲、乙 两种白喉杆菌培养基上,观察两种 白喉杆菌生长情况,“+”号表示生 长,“-”号表示不生长,结果如表 4。问两种白喉杆菌培养基的效果有 无差别?
42
表4甲、乙两种白喉杆菌培养基的培养结果
甲种
乙种


合计

11(a) 9 (b)

A T 0.52

T
2
ad bc n 22 n
(a b)(c d)(a c)(b d)
31
例11.6 :
表11-2 穿甲乙两种隔离服医生某传染病感染率比较
隔离服种类
感染情况
感染
未感染
合计
感染率 (%)

1(3.76) 10(7.24) 11 9.09
52
表11-5 两组儿童发生意外伤害的种类
分组 跌伤
有行为 问题
75
无行为 问题
296
意外伤害类型
碰撞 锐器割 烧烫 伤 刺伤 伤
35
25
12
118 69 33
合计 其 他 34 181
146 662
合计 371 153 94 45 180 843
53
H0 :两组儿童意外伤害类型分布相同 H1 :两组儿童意外伤害类型分布不同或
20

1 (c) 7 (d)
8
合计
12
16
28
43
本例检验步骤如下:
(1)建立检验假设
H0:总体B=C,即两种白喉杆菌培养基的效
果相同
H1: 总 体 B≠C, 即 两 种 白 喉 杆 菌 培 养 基 的
效果不同 α=0.05
(2)计算2值 本例b=9,c=1,b+c<40,
44
2 (| 9 1 | 1)2 4.90
=(R-1)(C-1)
理论频数T
TRC

nR nC n
25
1.建立假设,确定检验水准
H0 : 1=2
H1 : 1 2 , =0.05
2.计算统计量
T11= 50.49
T12=179.51
T21= 39.51
T22=140.49
26
2 (A T )2 6.36
10
计算结果及判断
u | 0.316 0.20 | 3.58 0.20(1 0.20) 152
判断:u=3.58 > u0.05=1. 64(单侧), P<0.05。
在α=0.05水准上,拒绝H0,接受H1,差异有
统计学意义。
11
二、两样本率比较的u检验
适用条件为两样本的np和n(1-p)均大于5。 计算公式为
=0.05
2 n( Ar2c 1) ... 17.2935
nr nc
(4 1)(2 1) 3
50
根据 = 3查 2 界值表,得P < 0.005,按=0.05的检验水准,拒绝 H0,接受H1 ,可认为四个季节呼吸 道感染率不同或不全相同。
51
(二)多个构成比的比较
组别 A组 B组
合计
阳性
a c
a+c
阴性
b d
b+d
合计
a+b
c+d a+b + c+d
28
表2 用药组和对照组流感发病率的比较
组别
发病人数 未发病人数
合计
用药组
14(20) 86(80)
100
对照组
30(24) 90(96)
120
合计
44
176
220
29
两种方法计算结果
2 14 202 86 802 30 242 90 962 4.125
第十一章 分类变量资料 的统计推断
1
第一节 率的抽样误差 与总体率的区间估 计
2
一、率的抽样误差与标准误
在同一总体中按一定的样本含量n抽样,
样本率和总体率或样本率之间也存在着 差异,这种差异称为率的抽样误差。 率的抽样误差的大小是用率的标准误来 表示的。
3
公式:
p
(1 )
相关文档
最新文档