医学统计学 定性资料的分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
65岁的胃溃疡病患者,其中有96例发生胃出
血,占31.58%,问老年患者是否较一般患者
0
易出血?
p p
9/73
样本率与总体率比较的正态近似检验
目的:推断样本是否来自某已知总体
条件:正态近似检验:np>5 同时 n(1-p)>5
u
p 0
0 (1 0 ) / n
10/73
检验假设: H0:=0, 老年胃溃疡病患者的胃出血率等于20%; H1:>0, 老年胃溃疡病患者的胃出血率大于20%。 单侧=0.05。
47 35 12.56 Tb 131 84 35 22..44 Tc 131
28/73
(39 34.44) (8 12.56) 34.44 12.56 2 2 (57 61.56) (27 22.44) 61.56 22.44 3.52
第七章 定性资料的分析
参数估计: 率的区间估计 假设检验:
u检验、 检验
2
1/73
一、率的可信区间
率的抽样误差 与均数一样,率也存在抽样误差 ,率的标准 差又称率的标准误为:
sp
p(1 p) n
2/73
(一)率的分布
★当总体率<0.5时为正偏态, ★当>0.5时为负偏态, ★当=0.5时为对称分布。
治疗组 单纯化疗 复合化疗 合 计
表 7.3 两组化疗的缓解率比较 缓解 未缓解 合计 2(4.68) 14(11.32) 16 10(7.32) 15(17.68) 25 12 29 41
缓解率(%) 16.67 48.28 39.02
40/73
H0:1=2; H1:12。 =0.05。 本例a 格的理论频数最小,T11=1216/41=4.68<5,
n>40,故考虑用校正公式计算 2 值。
2 C
( 2 15 10 14 41/ 2) 2 41 12 29 16 25
2 2.36 0.05,1 3.84
按 =1查附表3,2界值表,得P>0.05,按 = 0.05水 准不拒绝H0,差异无统计学意义。故根据本资料尚不 能认为两种疗法的总体缓解率有差别。
u
0.3158 0.2 0.2 (1 0.2) / 304
5.05 u0.01(单侧) 2.33
ຫໍສະໝຸດ Baidu
P<0.01,按=0.05水准拒绝H0,接受H1。认为老年 胃溃疡病患者的胃出血率大于20%。
11/73
7.2 两样本率的比较
目的: 推断两总体率是否相等 方法:
※两样本率比较的u 检验(u test) ※两样本率比较的2检验 (chi-square test)
2 2 2
29/73
第四步:确定 P 值,下结论
由于四格表资料为双边固定形式,即
假设行合计与列合计均固定,所以四 格表的自由度ν=1
30/73
表2 处理组 甲 乙 合计
四格表资料的基本形式 发生数 a c a+c
a+1 c-1
未发生数 b b-1 d d+1 b+d
合计 a+b c+d n
31/73
2 C
( A T 0.5) T
2
2
( a d b c n / 2) n (a b)(c d )(a c)(b d )
39/73
例7.3 比较单用甘磷酰芥(单纯化疗组)与复合使用争光霉
素、环磷酰胺等药(复合化疗组)对淋巴系统肿瘤的疗效, 问两组患者总体的完全缓解率有无差别
2 :读作卡方 2检验(chi-square test) 是现代统计学的
创始人 Karl Pearson( 1857-1936 )于
1900年提出的一种具有广泛用途的统计 方法 。
18/73
例7.2
表 1 131 例乳腺癌患者治疗后 5 年存活率的比较 处 理 存活数 死亡数 合计 39 57 96 8 27 35 47 84 131 存活率(%) 83.0 67.9 73.3
27/73
结合本例:
表1 处 131 例乳腺癌患者治疗后 5 年存活率的比较 理 存活数 死亡数 合计 存活率(%) 39 57 96 8 27 35 47 84 131 83.0 67.9 73.3
联合治疗 单纯治疗 合 计
47 96 34.44 Ta 131 84 96 61.56 Tc 131
13/73
7.2.1 两样本率比较的u 检验
如果n较小,则可以用校正的u检验
X 1 0.5 X 2 0.5 X 1 0.5 X 2 0.5 n1 n2 n1 n2 uC s p1 p2 1 1 pc (1 pc )( ) n1 n2 而当n很小时(比如n≤40时),用确切概率法
由 2界值表查得 20.05,1 = 3.84 ,即理论上
如果H0成立,则2有95%的可能 在0~3.84
之间,2 >3.84的可能性只有0.05,是一小概
率事件。
32/73
本例 2 =3.52 < 3.84 得P > 0.05。
按 = 0.05水准不拒绝H0,差别无统计学意义。 故尚不能认为单纯手术疗法与联合疗法对乳腺 癌患者治疗效果有差别。
12/73
7.2.1 两样本率比较的u 检验
条件:当n1p1、n2 p2、n1 (1p1)、n2 (1-p2)均大于5时, 采用正态近似法,其中: pc=(X1+X2)/(n1+n2)
| p1 p2 | u s p1 p2
| p1 p2 | 1 1 pc (1 pc )( ) n1 n2
p u s ,p u s
p p
5/73
例 从某地人群中随机抽取144人,检查乙型肝炎 表面抗原携带状况,阳性率为9.20%,求该地人群 的乙型肝炎表面抗原阳性率的95%可信区间。
n =144,p=9.20%
s p 0.092(1 0.092)/144 0.0241 2.41%
14/73
例7.2 某医院肿瘤科3年来共治疗乳腺癌患者 n=131例,每例均观察满5年,其中单纯手术 治疗组观察n1=84例,存活x1=57例,存活率 p1=67.9%,联合治疗(手术+术后化疗)组观 察n2=47例,存活x2=39例,存活p2=83.0%, 问两组存活率有无差别?
15/73
本例中,已知:
u
0.679 0.830 0.733 (1 0.733)(1/ 47 1/ 84)
P>0.05,按=0.05水准,不拒绝H0,差别无统计学 意义。故尚不能认为单纯手术疗法与联合疗法对乳腺 癌患者治疗效果有差别。
1.874 u0.05 1.96
17/73
7.2.2 两样本率比较的2检验
95%可信限为:9.20%±1.96×2.41% 即该地人群的乙型肝炎表面抗原阳性率的95%可 信区间为:4.48%~13.92%。
6/73
2.查表法
例4.5 有人调查29名非吸毒妇女,出狱时 有1名HIV(人免疫缺陷病毒)阳性,求阳性 率95%可信区间?
直接查附表6.2,在行n=29, 列x=1交叉
★只有当n较大、率和(1-)都不太小时,例如
n和n(1-)均大于5时,率的抽样分布近似于正
态分布。
3/73
(二)总体率的区间估计
正态近似法
查表法
4/73
1.正态近似法
条件:
样本例数n足够大,且样本率 p 和 (1-p) 都不
太小时,即 np 和 n(1-p) 均大于5时,样本率p
的抽样分布近似正态分布 。总体率的可信区间:
22/73
第二步:确定检验水准
= 0.05 (双侧检验)
23/73
第三步:计算检验统计量
2
2 (A T) T
式中: A 为实际频数(actual frequency)
T 为理论频数(theoretical frequency)
24/73
要计算 2 统计量,必须先计算H0条件下 的理论频数T :
在H0成立的条件下,即两样本来自同一总体,
则可以用合计的存活率 73.3%(即96/131)作为
总体存活率的点估计;用合计的死亡率 26.7%
(即35/131)作为总体死亡率的点估计;
25/73
表 3 131 例乳腺癌患者按 H0 计算的理论频数 H0 假设下的 5 年 处理 存活数 死亡数 合 计 存活率(%) 联合治疗 34.44 12.56 47 73.3 单纯治疗 合 计 61.56 96 22.44 35 84 131 73.3 73.3
T a 47 73.3% 34.44 T c 84 73.3% 61.56
T b 47 26.7% 12..56 T d 84 26.7% 22.44
26/73
四格表的理论频数由下式求得 :
T
RC
n R nC n
式中:TRC为第R 行C 列的理论频数, nR为相应的行合计, nC为相应的列合计。
处0.1~17.8即为阳性率95%可信区间.
7/73
二、定性资料的假设检验
样本率与总体率的比较 两样本率的比较 多个率的比较 构成比的比较 配对设计两样本率的比较 两事件数的比较
定性资料假设检验的正确应用
8
7.1 样本率与总体率的比较
例7.1 据临床经验,一般的胃溃疡病患者有 20%会出现胃出血症状。某医院观察了304例
37/73
四格表资料2检验的应用条件
2检验不校正的条件: n ≥40 且所有T ≥ 5 2检验校正的条件: n≥40 但有l≤T<5
确切概率法: 当n和T过小,如T<1或n<40时因近 似程度太差,不宜用2检验,而应改用确 切概率法。
38/73
四格表资料2检验的校正公式
2 C
35/73
2检验专用公式 四格表资料
(ad bc) n (a b)(c d )(a c)(b d )
2 2
(39 27 8 57) 131 3.52 47 84 96 35
2 2
36/73
四格表资料2检验的校正
由于2分布是一种连续性分布,附表3中2界值是根据此 连续性分布的理论公式计算出来的,但两个或多个率比 较的原始数据却属定性资料,是不连续的,故式(7.5)只 是一个近似计算公式。计算出来的2值往往偏大,相应 的P值偏小,从而人为地增加了范第一类错误的机会。 为纠正这种偏性,可采用校正2,用C2表示。
33/73
基本思想概括
若H0成立,则四个格子的实际频数A与理 论频数T之差异纯系抽样误差所致,故一
般不会很大,2值也就不会很大;在一次随 机试验中,出现大的 2 值的概率P 是很小的。
34/73
因此,若根据实际样本资料求得一个很 小的P,且P≤ (检验水准),根据小概率 原理,就有理由怀疑H0的真实性,因而 拒绝它;若P>,则没有理由拒绝H0
如生与死,有效与无效,患病与未患病,阳性
与阴性,检出与未检出,等等。
20/73
表 2 四格表资料的基本形式 处理组 甲 乙 合计 发生数 a c a+c 未发生数 b d b+d 合计 a+b c+d n
21/73
第一步:建立检验假设
H0:两总体存活率相等,即1=2; H1:两总体存活率不等,即12。
n1=84, X2=57, p2=67.9% n2=47, X2=39, p2=83.0%
n1p1、n2 p2、n1 (1p1)、n2 (1-p2)均大于5,
pc= (X1+X2)/(n1+n2)=(39+57)/(47+84)=0.733
16/73
H0:两总体存活率相等,即1=2; H1:两总体存活率不等,即12。 = 0.05。 用正态近似检验,检验统计量u为:
41/73
u检验与2检验的关系
两样本率比较时,如为双侧检验,则u检验和 四格表2检验是等价的,即自由度为1的
2=u2 ;校正u检验和四格表校正2检验也是等
联合治疗 单纯治疗 合 计
19/73
1.四格表(fourfold table)
概念:表1 中间阴影部分的四个数据为基本数据,
其余数据均由此四个数据派生出来,故称此种
资料为四格表(fourfold table)资料。
目的:四格表资料比较的是两种处理的效果。
特点:每种处理只产生两种相互对立的结果,