分类变量资料的统计推断PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
54.81
2021/两3/7 种疗法的2年生存率是否不同?
12
甲乙两种疗法治疗肺癌生存率比较的四格表
疗法 甲
生存 22
死亡 合计(nC) 生存率%
24
46
47.83
乙
35
23
58
60.34
合计(nR) 57
47 104 (n) 54.81
假设:两疗法生存率一致为 57/104 = 54.81%
甲疗法的生存人数 T1.1 : 46×57/104=25.21 乙疗法的生存人数 T2.1 : 58×57/104=31.79 假设: 两疗法病死率一致为 47/104 = 45.19%
2021/3/7
5
二、率的u检验
1. 样本率与总体率比较
目的:推断样本率所代表的总体率 与某总体
率 0 是否相等。
公式:
| p-0 |
u=
p
| p - 0 |
u=
0 (1- 0) /n
条件:np > 5 和 n (1 - p ) > 5
2021/3/7
6
例:某地城镇25岁以上居民高血压患病率为 11%,随机抽查该地矿区25岁以上居民598 人,确诊高血压者有82人。矿区居民与城镇 居民高血压患病率有何不同?
2021/3/7 BMI与糖尿病有关
11
三、 2检验
1. 用途:推断两个或多个总体率(或总体构成 比)之间有无差别,以及配对资料的 比较。
2. 2 检验的基本思想
例: 甲乙两种疗法治疗肺癌的2年生存率
疗法 治疗人数 生存人数 2年生存率%
甲
46
22
47.83
乙
58
35
60.34
合计 104
57
0.0674(1 - 0.0674 ) 89
=0.0266 = 2.66%
√ (B): Sp =
0.0450 (1 111
0.0450
)=0.0197
=
1.97%
2021/3/7
4
例: 某地中学生就餐方式与乙肝病毒感染情况调查
就餐方式 调查人数 感染人数 感染率(%) 标准误
常在外就餐(A) 89
分类变量资料的 统计推断
广州医学院预防医学系
2021/3/7
1
一、率的抽样误差和总体率的估计
1. 率的抽样误差与标准误
(sampling error & standard error of rate ) * 率的抽样误差:由抽样造成的样本率与总体率的 差别,或样本率之间的差别。 * 率的标准误:表示率的抽样误差大小的统计指标。
= 2.34
0.01< P < 0.05
结论:可认为矿区居民高血压患病率高于城镇居民
2021/3/7
8
2. 两个样本率比较(完全随机设计)
目的:推断两样本率分别代表的总体率 1与 2 是否相等。
公式:
u = ——| p—1 -—p2—| —
S p1-_p2_________________
S p1-p2 =
6
6.74 2.66%
不在外就餐(B) 111
5
4.50 1.97%
总体率95%可信区间为 p 1.96 sp 总体率99%可信区间为 p 2.58 sp
总体感染率95%可信区间: (A): 6.74% 1.96×2.66% = 1.53% ~ 11.95%
(B): 4.50% 1.96×1.97% = 0.64% ~ 8.36%
47.83
乙
35(31.79) 23(26.21) 58
60.34
合计nR 57
47
104 n
基本公式:
(A - T) 2
2 = —————
A
T
T
TRC =
nR nC n
54.81
实际值 理论值
= (行-1)(列-1)
2021/3/7
=(R-1)(C-1)
14
3. 2检验的种类
甲疗法的病死人数 T1.2 : 46×47/104=20.79
乙疗法的病死人数
2021/3/7
TRC =
nR nC n
T2.2
: 58×47/104=26.21
T 理论值
13
甲乙两种疗法治疗肺癌生存率比较的四格表
疗法 甲
生存 AT 22(25.21)
死亡 AT
合计nC 生存率%
24(20.79) 46
S p1-p2 =
11 pc (1-pc) (— + —)
n1 n2
u = ——| p—1 -—p2—| —
S p1-p2
=
| 0.0526 - 0.1011 |
0.0725(1-0.0725)(1/988+1/682)
= 3.76 P < 0.01
结论:BMI 25者糖尿病患病率高于BMI <25者
城镇居民高血压患病率:0 =11%= 0.11
矿区居民高血压患病率:p = 82/598 = 0.14
分析目的: 推断 与 0 是否不同?
2021/3/7
7
假设:H0: = 0= 0.11, H1: ≠ 0 ≠ 0.11, =0.05
p - 0
0.14 - 0.11
u=
=
0 (1- 0) /n 0.11(1-0.11)/598
52
5.26
25
682
69
10.11
合计
1670
121
7.25
是否体重指数(BMI)不同糖尿病的患病率不同?
BMI <25 : p< = 5.26%
<
BMI 25 : p =10.11%
分析目的:
2021/3/7
推断
< 与
是否不同
10
假设:H0: <= , H1: < ≠ , = 0.05
__________________
p u sp = p - u sp ~ p + u sp
2021/3/7
3
例: 某地中学生就餐方式与乙肝病毒感染情况调查
就餐方式 调查人数 感染人数 感染率(%)常在外就餐(A) 89
6
6.74
不在外就餐(B) 111
5
4.50
合计
200
11
5.50
√ 抽样误差: Sp =
p(1- p) n
√ (A): Sp =
*公式计算 :
(1-)
p =
n
; Sp =
p(1-p) n
2021/3/7
( Sp 为p的估计值, p为 的估计值 ) 2
2. 总体率的区间估计
正态近似法:
当n足够大,若 n p > 5 和n (1-p) > 5,
则总体率 (1- ) 可信区间为:
总体率95%可信区间为 p 1.96 sp 总体率99%可信区间为 p 2.58 sp
11 pc (1-pc) (— + —)
n1 n2
(pc为两个样本率的合并率。)
条件:两样本率近似正态分布,即 n1p1 、n1(1-p1)
2021/3/7 和 n2p2、n2(1-p2)均大于 5。
9
例:某地55~70岁居民体重指数与糖尿病关系
体重指数 检查人数 糖尿病人数 患病率%
<25
988