8_第八讲_计数资料推断概论
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H0:1=2, 两者高血压患病率相同 H1:12 ,两者高血压患病率不同 =0.05
本例 x1=386,n1=1281 ,p1=30.1%; x2=65,n2=387 ,p2=16.8%
将有关数据代入u检验公式
P < 0.001,按=0.05,拒绝H0,接受 H1,可认为5059岁男性工人和 5059岁男 性农民高血压患病率不同,工人患病率高于 农民。 ●率差95%可信区间:0.088 - 0.178
计数资料的统计推断
第八讲
计数资料统计推断内容
假设检验:二项分布u检验 , 2检验 率差或率比的区间估计
一、计数资料假设检验 -u检验
(一)单个样本率与已知总体率比较 样本率与总体率的假设检验的目的是推
断样本率所代表的未知总体率π与已知总 体率π0(一般指理论值、标准值或经大量 观察得到的稳定值)是否相等,其u检验:
二、计数资料的假设检验 - 卡方检验
Pearson Chi-square test
Karl·Pearson,1857~1936,生卒于 伦敦,公认为统计学之父。 1879年 毕业于剑桥大学数学系;曾参与激 进的政治活动,还出版几本文学作 品,并且作了三年的实习律师。 1884年进入伦敦大学学院 ,教授数 学与力学,从此在该校工作一直到 1933年。
H1:0 ,即老年患者胃出血率与一 般患者不同
=0.05
本例 0=20%,n=250,x=80 将数据代入上式:
P < 0.001,按=0.05,拒绝H0,接 受H1,可认为老年患者胃出血率与 一般患者不同,老年溃疡病患者更 容易出现胃出血。
老年溃疡病患者出血率的95%可信 区间:0.262 0.378
拒绝H0 不拒绝H0
2 检验的基本思想
建立假设
H0:两组发癌率相等,1=2= H1:两组发癌率不等, 12 =0.05
*两组的总体发癌率相等,均等于合并发癌率
= 91 /113 =80.53%
在无效假设成立的条件下, 计算每个格子的发癌情况, T(理论频数)=组例数*总体发癌率,可简化为T=(行 合计*列合计)/ n.
两分类变量间有无相关的假设检验(独 立性);
拟合优度检验(理论分布与实际分布的吻 合情况检验)。
(一) 2 检验主要类型
四格表资料的2检验 R X C表资料的2检验 列联表资料的2检验 2X2列联表的2检验
以四格表资料为例
例4、在二乙基亚硝胺诱发大白鼠鼻咽 癌的实验中,一组单纯用亚硝胺向鼻腔 灌注,另一组在鼻注的基础上加肌注维
相对比例保持不变,T值越大, (A-T)2值越 大,为消除其影响,差值定义为: (A-T)2/T
在样本量足够大时,该值服从于自由度为 =(行数-1)(列数-1) 的2 分布。
即2检验公式: 2 = (A-T)2/T
在无效假设成立时: 2值一般不会很大,出 现大的2值的概率P是很小的,若P<( 检验 水 准 ), 则 怀 疑 假 设 成 立 , 因 而 拒 绝 它 ; 若 P>( 检验水准),则没有理由拒绝它。
一般出血率:0.20
(二)两样本率比较u检验 目的是推断两样本所来自两总体率
是否相等。
u检验应用条件: 当n较大,np和n(1-p)均大于5时,
可利用样本率p的分布近似正态分布
其u检验公式为:
例:为比较工人和农民的高血压患病 率,分别调查了50—59岁男性工人和 50—59岁男性农民1281人和387人, 其高血压患者分别为386人(患病率 30.1%)和65人(患病率16.8%)。问工 人与农民的高血压患病率有无不同?
p为样本率,π0为已知总体率
u检验应用条件: 当n较大,np和n(1-p)均大于5时,
可利用样本率p的分布近似正态分布-
例 由临床经验得知,一般溃疡病患者 的胃出血率为20%,现某医师观察65岁 以上溃疡病人250例,其中80例发生胃 出血症状,问老年患者胃出血率与一般
患者是否不同?
H0:=0 ,即老年患者胃出血率与一 般患者相同
K·Pearson 最重要的学术成就,是为 现代统计学打下了坚实基础。 K·Pearson 在1893-1912年间写出18篇 《在进化论上的数学贡献》的文章, 而这门“算术”,也就是今日的统 计。许多统计名词如标准差,成分 分析,卡方检验都是他提出。
2检验的主要应用
推断两个或两个以上总体率或构成比 有无差别;
处理
发癌鼠数 未发癌鼠数 合计 发癌率
鼻注+VitB12组 52(57.18) 19(13.82) 71 73.24
鼻注组
39(33.82) 3(8.18) 42 92.86
合计
91
22
113 8பைடு நூலகம்.53
为反映所有格子的吻合情况,所有差值求 和,(A-T)=0 (正负抵消),差值和可定义 为(A -T)2 ;
生素B12,问两组发癌率有无差别?
表5 两组大白鼠发癌率的比较
处理
发癌鼠数
鼻注+VitB12组 52
鼻注组
39
合计
91
未发癌鼠数 合计 发癌率
19
71 73.24
3
42 92.86
22
113 80.53
73.2%(71) 92.9%(42) (样本率不等) 推断总体率
两总体率相等
两总体率不等
P值 小概率事件
Pearson Chi-square distribution
2 分布与P值
2 值反映了实际频数与理论频数的差值大小
2 值的大小与p值呈反比关系,即2 值越大, P值越小; 反之亦然。
2 值达到界值点,就有理由认为成立的可能
性不大,是小概率事件,因而拒绝H0 。对于
四格表资料:
2 0.05
=3.84
1、四格表资料2 检 验计算结果
本例2 值=6.48,自由度为1,查2 界 值表,得p<0.05, 按照=0.05的水准, 拒绝H0,而接受H1,可认为两组总体 发癌率不同。
2、四格表资料的应用条件
当T5,而n>40时, 选用一般计算公式 当1<T<5,而n>40时, 需计算校正公式
当T<1或n<40时,选用确切概率法
连续性校正仅用于四格表资料,当 超过四个格子时,一般不作校正。
Chi-Square Tests
Pearson Chi-Square Continuity Correctiona