第11章 计数资料的统计推断-已经更换模板(李嗣生)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、用以估计总体率的可信区间
当样本含量足够大,且样本率P和(1-P)均不太小,如nP与n(1-P) 均≥5时,样本率的分布近似正态分布,可用正态分布规律估计总体 率的可信区间。公式为: 总体率95%可信区间=P±1.96Sp 总体率99%可信区间=P±2.58Sp
19:46
如上例无偿献血者HBsAg阳性率为6.28 %,标准误为0.52%,则所有无偿献血 者HBsAg总体率的95%和99%可信区 间为: 总体率95%可信区间= 6.28%±1.96×0.52% = 5.26%~7.30% 总体率99%可信区间= 6.28%±2.58×0.52% = 4.94%~7.62% 3、用于率的假设检验:见计数资料 的假设检验(如率的u检验)。两率差 异的假设检验。
P
n
式中σP 为率的标准误, 为总体率,n为样本例数, 当总体率不知时可用样本率作总体率的估计值,公式为:
SP P(1 P) n
式中Sp 为率的标准误,P为样本率,n为样本例数。
19:46
例如:某市血液中心对2196名无偿献血者进行 HbsAg检查,结果有138人检出HbsAg阳性,阳性率 6.28%,求标准误,代入公式:
19:46
两个样本率的比较
计算公式如下:
u
PC
p1 p2 S P1 P2
X1 X 2 n1 n2
p1 p2
pc (1 pc )(1 / n1 1 / n2 )
S P1 P2
式中P1 、P2为样本率,SP 1-P 2 为两样本率之差的标 准误 ,PC为合并样本率,n1和n2 分别为两样本含量, X1和X2分别为两样本的某类发生数。
式中a、b、c、d分别代表四个格子的实际数, 现仍以例为例11.7 ,见表11-3-2 ,代入公式:
(18105- 190 2)2 315 5.4627 (18 190)(2 105)(18 2)(190 105)
2
计算结果与基本公式一致。
19:46
四格表校正公式
应用基本公式和四格表资料专用公式的条件是n≥40,且 T≥5。当n≥40,但1≤T<5时,应使用校正公式,否则会使卡 方值偏大而造成结论错误。 校正公式:
19:46
率的u检验
样本率与总体率或样本率与样本率进行比较时,也要考 虑差异是否由抽样误差所致,大样本时,样本率的频数 分布近似正态分布,故可用 u 检验,其假设检验的原理、 步骤及方法与均数的u检验相同。
样本率与总体率的比较
计算公式如下:
u
p 0
p
p 0
0 (1 0 ) / n
19:46
第2节 率的u检验
19:46
总体率(或构成比)的假设检验
当两个样本率不同时,有两种可能: (1)P1 , P2所代表的总体率相同,由于抽样误差 的存在,造成的不同,这种差别在统计上叫差别无 统计学意义。 (2) P1 , P2所代表的总体率不同,即两个样本来 不同的总体,其差别有统计学意义。 现在就是要用统计学的方法进行判断到底属于 那种情况。
建立假设:H0: π1 =π2 H1: π1 ≠π2 α=0.05 计算各格子理论数(见表中): 计算x2值:本例有两个格子的理论数小于5,且n>40,故应用校正公式:
2
( 2 9 26 5 42/2)2 42 2814 7 35
3.62
确定P值: υ=(2-1)(2-1)=1 , x20.05,1= 3.84 3.62 <3.84, 故P>0.05 差异无显著性
2
( A T 0.5) T
2
( ad bc n ) 2 n 2 2 (a b)(c d )(a c)(b d )
19:46
例11.8 某地对甲、乙两零售点的猪肉进行抽查,检查其表层沙门氏菌带菌情况如下表。 试问甲、乙两零售点的猪肉表层沙门菌带菌率有无差别? 甲、乙两零售点猪肉表层沙门菌的带菌率 采样地点 阳性例数 阴性例数 合计 带菌率(%) 甲两零售点 2 26 28 7.14 甲两零售点 5 91 43 5.71 合 计 7 35 42 16.67
计算u值:
PC
127 36 0.7309 148 75
u
0.8581 0.4800 0.7309 (1 0.7309 )(1 / 148 1 / 75)
6.015
确定P值:查u界值表,u0.001=3.29,现u>u0.001,差异有极显著性 判断结果:按α=0.05 ,拒绝H0,接受H1 ,可以认为两组有效率 的差别有统计学意义,治疗组治疗效果比对照组好。
判断结果:按α=0.05 ,不拒绝H0,还不能认为甲、乙两零售点猪肉表层 沙门菌带菌率不同。本例如不进行校正, x2= 5.49,P < 0.05,得出 相反结论。
19:46
配对资料的卡方检验
和计量资料一样,计数资料也可采用配对的方式进行比较,此时 可用配对资料的x2检验。 计算公式: 当b+ C≥ 40时:
感染人数
666(a) 1288(c)
未感染人数
126(b) 497(d)
合计
792 1782
合计
1954
620
2574
表中a、b、c、d四个格子的数据是整个表的基本数据,其余数据是从 这四个数据推算出来的,这种资料称为四格表资料,或称为2×2列联列表, 是卡方检验方法中检验两种资料差异显著性的基本工作表。
式中 P 为样本率,σP为总体率的标准误,π0为已知的 总体率,n为样本含量。
19:46
例11.5 某病的年发病率对全国人口来说为8.72%。现 在某县回顾一年,抽样调查了120人,有16人发该病。 问该县该病的发病率是否高于全国该病的发病率?
建立假设:H0:π =π0 , α=0.05 计算u值:u=
19:46
例 11.6 某医师用某新药治疗类风湿 关节炎,结果见右表,问两组治 疗效果有无差别? • 建立假设: H0: π1 =π2 H1: π1 ≠π2 α=0.05
某新药治疗类风湿关节炎的疗效观察 人数 有效倒数 有效率% 治疗组 148 127 85.81 对照组 75 36 48.00 合计 223 163 73.09
TRC
n R nC n
TRC式中为行与列的格子内理论数,nR为相应行的合计数,nC为相应列 的合计数。 208 20 第1行第1列格子的T: T11 13.21 315
第1行第2列格子的T: T 12=208-13.21=194.79
19:46
第2行第1列格子的T: T 21=20-13.21=6.79 第2行第2列格子的T: T 22=107-6.79=100.21 因为表中每行每列的合计是固定的,只要求得其中一格理论数,其余三格 可利用同行或同列的合计数相减而求出。
2 ( b c ) 2 bc
当b+C<40时:
2
( b c 1) 2 bc
19:46
例11.9 某研究室用甲、乙两种血清学方法检查410例 确诊的鼻咽癌患者,结果见下表。问两种方法检验结果 或检出率间有无差?
从表中可看出结果有四种情况: a:两组均阳性的对子数为(++) b:甲法阳性,乙法阴性的 对子数 为(+-) c:甲法阴性,乙法阳性的对子数为 (-+) d:两组均均阴性的的为(--) a和d是两种结果相同部分 b和c 为不相同部分,可用b与c的差 别来比较两总个率有无差别。
2
19:46
卡方检验的基本公式
x2检验的基本公式: 2
( A T )2 T
检验的基本思想:公式中A为实际观察值,T为理论值, 它是根据检验假设来确定的,假设各样本率或比所属总体 的率或比相同(H0)。如果这一假设成立,则各样本率或比 就应该比较接近,实际数和理论数就不会相差太大,计算 的x2值就比较小;反之计算的x2值就大。因此, x2值反映 了实际数与理论数吻合的程度,但是x2值的大小,除决定 于A-T的差值外,还取决于格子数(严格说是自由度)的多 少,因为各格的(A -T)2/T 都是正值,故格子数越多, x2 值也越大。只有排除了这种影响, x2值才能正确反映A 和 T 的吻合程度,所以在查 x2 值表时必须考虑自由度的大小。
19:46
卡方检验的四种计算方法
x2检验的基本公式:
( A T )2 T
2
四格表专用公式:
(ad bc)2 n (a b)(c d )(a c)(b d )
2
行×列表公式:
配对资料的x2检验:
n( A 1) n R .nC
2
2
(b c) 2 bc
0.0628 (1 0.0628 ) SP 0.52% 2196
19:46
率的标准误的应用
1、表示抽样误差的大小
率的标准误小,说明抽样误差小,表示样本率与总体率越接近, 用样本率推断总体率的可靠性越大。反之,率的标准误越大,表示 样本率离总体率较远,用样本率推断总体率的可靠性小。医学文献 上常用P±SP表示资料的可靠性。 例如,上例样本率的可靠性可表示为 6.28%±0.52%。
19:46
表11-3-2 两组抗-HCV阳性率比较 组别 + - 合计
性乱者
献血员 合计
18(13.21)
2( 6.79) 20
190(194.79)
105(100.21) 295
208
107 315
检验步骤: 建立假设:H0: π1 =π2
H1: π1 ≠π2
α=0.05
计算各格子理论数:
2
本例 3.84<5.46<6.63 ,故0.05<P<0.01 ,差异有极显著性
•
判断结果:按α=0.05 水准,拒绝H0 ,接受H1 ,可以认为两组抗HCV阳性率有差别,性乱者抗-HCV阳性率高于献血员。
19:46
四格表专用公式
公式为:
2 ( ad bc ) n 2 (a b)(c d )(a c)(b d )
19:46
第3节 卡方检验
19:46
x2检验是一种用途较广的假设检验方法,它主要用于计数资料的统计
处理,如用来检验两个率或多个率、两个或多个构成比之间的差别等。
例如:调查1990年某山区不同年龄组蛔虫感染情况,见下表,问两组 的蛔虫感染率有无差别?
某山区不同年龄组蛔虫感染率比较
组别
1~14 15岁以上
H1:π ≠π0
1.79
0.1333 0.0872 0.0872 (1 0.0872 ) / 120
确定P值:本例 1.79<1.96 , 故P>0.05 , 差异无显著 性。 判断结果:按α=0.05 水准,拒绝H0,接受H1,可 以认为某县该病的发病率与全国该病的发病率没有差 别。
19:46
统计推断
用样本信息推论总体特征的过程。 包括: 参数估计: 运用统计学原理,用从样本计算出来的统计指标 量,对总体统计指标量进行估计。 假设检验:又称显著性检验,是指由样本间存在的差别对样 本所代表的总体间是否存在着差别做出判断。
19:46
第1节 率的抽样误差与标准误
19:46
由于抽样引起样本率和总体率或样本率与样本率之 间的差异称为率的抽样误差。 当总体率接近0.5,n>50时,样本率的分布趋向正态 分布,此时率的标准误性质与均数的标准误相同。 率的标准误是表示抽样误差大小的指标,用σP表示, 计算公式为: (1 )
19:46
第11章
计数资料的统计推断
19:46
第11章 计数资料的统计 推断
学习目标 1.掌握率的抽样误差、率的标准误的概 念, 计数资料的U检验的方法及应用条件 2.熟悉率的标准误的计算和用途 3.了解率的u检验的方法和应用条件
Biblioteka Baidu
19:46
主要内容
一、率(或构成比)的抽样误差和标准误 二、总体率(或构成比)的估计:点估计、区 间估计 三、总体率(或构成比)的假设检验 1. 率(或构成比)的 检验 2. x2检验 四、假设检验的注意事项
• •
计算x2值:
确定P值: υ =(行数-1)(列数-1)=(2-1)(2-1)=1
x20.05,1= 3.84, x20.01,1=6.63
(18 13.21) 2 (190 194.79) 2 (2 6.79) 2 (105 100.21) 2 5.4627 13.21 194.79 6.79 100.21