第五讲 定性资料的统计分析
医学统计学定性资料的统计分析-χ2检验
29 41
48.28 39.02
H0:1=2; H1:12; =0.05。 本例a格的理论频数最小,T11=1216/41=4.68<5, n>40,故考虑用校正公式计算2 值。
2 C
( 2 15 1014 41/ 2) 12 2916 25
2
41
2 2.36 0.05,1 3.84
(二)2检验的基本思想
例4-6-1 据临床研究,一般的胃溃疡病患者有25%会出现胃出 血症状。某医院观察了300例65岁的胃溃疡病患者,其中有99例 发生胃出血,占33.0%,问老年患者是否较一般患者易出血? 表中基本数据是a,b,c,d,其余数 据都是从这四个基本数据推算出 表4-6-1 131例胃癌患者治疗后5年存活率的比较 来的,这种资料称为四格表资料。 存活率(%) 存活数 死亡数 合计治疗数
(即多个率或构成比的比较)
上述两个样本率比较的资料,其基本数据只 有2行2列,称为2 ×2表或四格表资料。当基 本数据超过2行或2列的资料,就称为行×列 表或 R × C表资料。行×列表资料的2检验 主要用于多个样本率或多个构成比之间的比 较。
2 值的计算可按前述基本公式( 2 =∑(A-
2
计算统计量Z :
z
0.33 0.25
0.25 (1 0.25) / 300
3.20
. 确定P 值和判断结果:
Z0.01=2.326,得P<0.01,按=0.05水 准拒绝H0,接受H1。 认为老年胃溃疡病患者的胃出血率大于 20%,即老年患者较一般患者易出血.
(二)两样本率的比较
3.确定P 和判断结果:=(2-1)×(2-1)= 1;查2界 值表,20.05=3.84, 所以P>0.05,按=0.05水准不拒绝H0,差别无统计 学意义。故尚不能认为单纯手术疗法与联合疗法对胃 癌患者治疗效果有差别。
医学统计学定性资料统计描述思考与练习带答案
第五章定性资料的统计描述【思考与练习】一、思考题1.应用相对数时需要注意哪些问题?2. 为什么不能以构成比代替率?3. 标准化率计算的直接法和间接法的应用有何区别?4. 常用动态数列分析指标有哪几种?各有何用途?5. 率的标准化需要注意哪些问题?二、案例辨析题某医生对98例女性生殖器溃疡患者的血清进行检测,发现杜克雷氏链杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医生得出结论:女性生殖器溃疡患者3种病原体的感染率分别为30.6%(30/98)、52.0%(51/98)和17.4%(17/98)。
该结论是否正确?为什么?三、最佳选择题1. 某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为BA. 率B. 构成比C. 发病率D. 相对比E. 时点患病率2. 标准化死亡比SMR是指AA. 实际死亡数/预期死亡数B. 预期死亡数/实际死亡数C. 实际发病数/预期发病数D. 预期发病数/实际发病数E. 预期发病数/预期死亡数3. 某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性13952人,女性19369人。
可计算出这样一些相对数:11395283.18%16774p ==, 2139521936983.08%1677423334p +==+,313952101.86/1013697600p ==万, 416774122.46/1013697600p ==万,523334176.85/1013194142p ==万, 645p p p =+71395219369123.91/101369760013194142p +==+万81677423334149.15/101369760013194142p +==+万该地男性居民五种心血管疾病的死亡率为D A. 1p B. 2p C. 3pD. 4pE. 5p4. 根据第3题资料,该地居民五种心血管病的总死亡率为E A. 1p B. 2p C. 5pD. 6pE. 8p5. 根据第3题资料,该地男、女性居民肺心病的合计死亡率为D A. 2p B. 5pC. 6pD. 7pE. 8p6. 某地区2000~2005年结核病的发病人数为015,,,a a a ⋯,则该地区结核病在此期间的平均增长速度是DA .0156a a a ⋯+++B.C.D.1-E.7. 经调查得知甲、乙两地的恶性肿瘤的粗死亡率均为89.94/10万,但经过标准化后甲地恶性肿瘤的死亡率为82.74/10万,而乙地为93.52/10万,发生此现象最有可能的原因是C A. 甲地的诊断技术水平更高B. 乙地的恶性肿瘤防治工作做得比甲地更好C. 甲地的老年人口在总人口中所占比例比乙地多D. 乙地的老年人口在总人口中所占比例比甲地多E. 甲地的男性人口在总人口中所占比例比乙地多 8. 下列不属于相对比的指标是 C A. 相对危险度RR B. 比值比ORC. 病死率D. 变异系数CVE. 性别比9. 计算标准化率时,宜采用间接法的情况是BA.已知被标准化组的年龄别死亡率与年龄别人口数B.已知被标准化组的死亡总数与年龄别人口数C.已知标准组年龄构成与死亡总数D.已知标准组的人口总数与年龄别人口数E.被标化组各年龄段人口基数较大四、综合分析题1. 为研究经常吸烟与慢性阻塞性肺病(COPD)的关系,1998~2000年间,某医生收集了356例COPD患者的吸烟史,经常吸烟(日平均1支以上,30年)的COPD 患者有231例;而同时期同年龄段的479名非COPD患者中,经常吸烟的有183例。
定性资料的统计分析最新课件
若均数与标准差不用绝对数X而用率p 表示时,即对以上两式分别除以n:
p
p
(1 )
n
sp
p(1 p) n
样本率的标准差 又称为率的标准误。
定性资料的统计分析最新课件
二项分布的累计概率
常用的有左侧累计和右侧累计两种方法。从
阳性率为 的总体中随机抽取n个个体,则:
1、最多有k例阳性的概率:
每种结果的概率
0.20.20.2=0.008 0.20.20.8=0.032 0.20.80.2=0.032 0.80.20.2=0.032 0.20.80.8=0.128 0.80.20.8=0.128 0.80.80.2=0.128 0.80.80.8=0.512
1.000
死亡数 生存数 不同死亡数的概率
可信度为95%时, u =1.96 可信度为99%时, u =2.58。
定性资料的统计分析最新课件
例1、从某地人群中随机抽取144人,检查乙型 肝炎表面抗原携带状况,阳性率为9.20%,求 该地人群的乙型肝炎表面抗原阳性率的95%可 信区间。
本例n =144,p=9.20%,可用近似正态法计算 可信区间。
0.4 P(X)
0.3
n =20 =0.5
n =5 =0.3
n =10 =0.3
n =30 =0.3
0.2
0.1
0.0 4
8 12 16 0 2 4
0246
X
定性资料的统计分析最新课件
4 8 12 16
在实际应用中,n足够大,且 不太大
也不太小,即既不接近于0也不接近于 1时,常可用正态近似原理处理二项分 布的问题。
因此,从阳性率为π的总体中随机抽取含量为 n的样本,恰有X例阳性的概率为:
定性资料的统计分析
按=0.05 水准,不拒绝 H0,差异无统计学意义。故尚不能
认为大脑两半球恶性肿瘤所占比例有差别。
8
二、配对四格表的确切概率法
在配对四格表资料中,当b+c≤20时,因配对
31
Thanks!
32
5(c) 48(d)
165
74
合计
186 53 239
10
分析思路
则在B+C=31不变的前提下,b和c的所有可能取值 为(0,31),(1,30),(2,29),(3,28),……, (28,3),(29,2),(30,1),(31,0),共32
种组合。此时,b和c服从n=31,=0.5的二项分
3、样本观察单位不同,或在有重复试验中, 重复次数不同时,应先将观察单位化成相 同的小单位,先求出以小单位为观察单位 的平均计数后再计算u值:
u |X1-X2 | X1 X2 n1 n2
X1 X1 / n1 X 2 X 2 / n2 n1、n2分别为两样本的观察单位数。当n1=
n2时,该公式与式2完全等价。
确切概率法 两事件数的比较 卡方检验应用的注意事项
2
第九节 确切概率法
3
一、四格表的确切概率法
对于普通四格表资料,当n<40或出现至少
有一个T<1时,因2检验近似程度较差,易 导致分析的偏性,2检验不再适用,应当用
四格表的确切概率法。
四格表的确切概率法本身不属于2检验范畴, 只是作为四格表2检验应用上的补充。
医学统计学定性资料统计描述思考与练习带答案
医学统计学定性资料统计描述思考与练习带答案第五章定性资料的统计描述【思考与练习】⼀、思考题1.应⽤相对数时需要注意哪些问题?2. 为什么不能以构成⽐代替率?3. 标准化率计算的直接法和间接法的应⽤有何区别?4. 常⽤动态数列分析指标有哪⼏种?各有何⽤途?5. 率的标准化需要注意哪些问题?⼆、案例辨析题某医⽣对98例⼥性⽣殖器溃疡患者的⾎清进⾏检测,发现杜克雷⽒链杆菌、梅毒螺旋体和⼈类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医⽣得出结论:⼥性⽣殖器溃疡患者3种病原体的感染率分别为30.6%(30/98)、52.0%(51/98)和17.4%(17/98)。
该结论是否正确?为什么?三、最佳选择题1. 某地2006年肝炎发病⼈数占当年传染病发病⼈数的10.1%,该指标为BA. 率B. 构成⽐C. 发病率D. 相对⽐E. 时点患病率2. 标准化死亡⽐SMR是指AA. 实际死亡数/预期死亡数B. 预期死亡数/实际死亡数C. 实际发病数/预期发病数D. 预期发病数/实际发病数E. 预期发病数/预期死亡数3. 某地⼈⼝数:男性13,697,600⼈,⼥性13,194,142⼈;五种⼼⾎管疾病的死亡⼈数:男性16774⼈,⼥性23334⼈;其中肺⼼病死亡⼈数:男性13952⼈,⼥性19369⼈。
可计算出这样⼀些相对数:11395283.18%16774p ==, 2139521936983.08%1677423334p +==+,313952101.86/1013697600p ==万, 416774122.46/1013697600p ==万,523334176.85/1013194142p ==万, 645p p p =+71395219369123.91/101369760013194142p +==+万81677423334149.15/101369760013194142p +==+万该地男性居民五种⼼⾎管疾病的死亡率为D A. 1p B. 2p C. 3pD. 4pE. 5p4. 根据第3题资料,该地居民五种⼼⾎管病的总死亡率为E A. 1p B. 2p C. 5pD. 6pE. 8p5. 根据第3题资料,该地男、⼥性居民肺⼼病的合计死亡率为D A. 2p B. 5pC. 6pD. 7pE. 8p6. 某地区2000~2005年结核病的发病⼈数为015,,,a a a ?,则该地区结核病在此期间的平均增长速度是DA .0156a a a ?+++B.C.D.1-E.7. 经调查得知甲、⼄两地的恶性肿瘤的粗死亡率均为89.94/10万,但经过标准化后甲地恶性肿瘤的死亡率为82.74/10万,⽽⼄地为93.52/10万,发⽣此现象最有可能的原因是CA. 甲地的诊断技术⽔平更⾼B. ⼄地的恶性肿瘤防治⼯作做得⽐甲地更好C. 甲地的⽼年⼈⼝在总⼈⼝中所占⽐例⽐⼄地多D. ⼄地的⽼年⼈⼝在总⼈⼝中所占⽐例⽐甲地多E. 甲地的男性⼈⼝在总⼈⼝中所占⽐例⽐⼄地多 8. 下列不属于相对⽐的指标是 C A. 相对危险度RR B. ⽐值⽐ORC. 病死率D. 变异系数CVE. 性别⽐9. 计算标准化率时,宜采⽤间接法的情况是BA.已知被标准化组的年龄别死亡率与年龄别⼈⼝数B.已知被标准化组的死亡总数与年龄别⼈⼝数C.已知标准组年龄构成与死亡总数D.已知标准组的⼈⼝总数与年龄别⼈⼝数E.被标化组各年龄段⼈⼝基数较⼤四、综合分析题1. 为研究经常吸烟与慢性阻塞性肺病(COPD)的关系,1998~2000年间,某医⽣收集了356例COPD患者的吸烟史,经常吸烟(⽇平均1⽀以上,30年)的COPD 患者有231例;⽽同时期同年龄段的479名⾮COPD患者中,经常吸烟的有183例。
第五章定性资料的统计描述精品PPT课件
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 … 足月
2020/10/25
第三章 分类资料的统计描述
7
按文化程度与分娩方式整理资料
文化程度 小学 中学 大学 合计
顺产 40 100 200 340
助产 5 20 10 35
剖宫产 5 30 90 125
合计 50 150 300 500
2020/10/25
第三章 分类资料的统计描述
19
例3:某县有人口10万人,1997年因各种疾病死亡1000 人,该年共发生结核300人,原有结核400人,1997年共 有60人死于结核,请问:
(1)该县的总死亡率为
a 300/10万
b 60/1000
c 60/ 10万
d 1000/ 10万
e 资料不足,不能计算
某 年 某 病 的 死 亡 率 = 因 该 某 年 病 的 死 平 亡 均 的 人 人 口 数 数 K
2020/10/25
第三章 分类资料的统计描述
18
3.常见率的计算: 病死率 fatality rate:表示一定时期内,患某 病的全部病人中因该病死亡者的比例。
某 年 某 病 的 病 死 率 = 一 同 定 期 时 内 期 确 内 证 因 为 某 某 病 病 死 的 亡 人 的 数 人 数 K
❖率 ❖ 构成比 ❖ 相对比
2020/10/25
第三章 分类资料的统计描述
10
常用的相对数指标
1、率 rate -频率指标或强度指标 o定义 o公式 o常见率的计算 o率的统计学意义
2020/10/25
第三章 分类资料的统计描述
11
(1)定义:它表示某现象发生的频率和强度。 说明某现象实际发生的例数占可能发生某现象 总数的比值。
卫生统计学课件第5章定性资料的描述(18-19)
女生(450) 16 14 男生(550)
16 p2 550 100% 2.9%
p3
16 30
100%
53.3%
p4
550 1000
100%
55%
流行病与卫生统计学教研室
相对比( relative ratio)
相对比是两个有关的指标之比,用以描
述两者的对比水平。两个指标可以是绝对
数、相对数或平均数;可以性质相同,也
流行病与卫生统计学教研室
绝对数:表示某事物在某时、 某地发 生的实际水平。 相对数:两个相关指标的比值,便于 相互比较与分析。
流行病与卫生统计学教研室
实例:甲、乙两地某病的发生例数分别为100 例和150例,已知两地的人口数分别为100000 人和200000人,如何判断哪地发病程度更为严 重? 绝对数:甲地发病人数<乙地发病人数 相对数:甲地发病率为10‰>乙地发病率7.5‰。
r1 r2 r3 ┇
ri ┇
rk r
死亡率 p1 p2 p3 ┇ pi ┇ pk p
流行病与卫生统计学教研室
直接法计算标准化率
已知标准组的人口数
p
Ni pi
N
已知标准组人口构成比
p
Ni N
pi
p为 标 准 化 率
pi为 各 组 实 际 死 亡 率
N
为
i
各
组
标
准
人
口
数
N为 标 准 组 总 人 口 数
k3 n3
× Pc
p1
p2 3
p3
Pc
k1 n1
k2 n2
k3 n3
√
流行病与卫生统计学教研室
定性资料的统计分析
A T 2
检验的自由度取决于可以自由取值的格子数目, 而不是样本含量n。四格表资料只有两行两列,ν =1, 即在周边合计数固定的情况下,4个基本数据当中只 有一个可以自由取值。
2 分布图形
0.5 0.4 0.3 0.2 0.1 0 0 2 4 6
1
f ( )
2
6
10
可通过 检验的基本公式来理解。
2
卡方分布: 若k个随机变量,z1,z2,…zk,相互独立且服从标
准正态分布,则随机变量x=z12+z22+…+zK2被称 为服从自由度为k的卡方分布,记作: x 2 (k )
2
( AT ) , (行数-1)(列数 1) T
2
H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
α =0.05。
(2)求检验统计量值
T11 104 174/ 200 90.48 ,T12 104 90.48 13.52
T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
表7-2 两组降低颅内压有效率的比较
组 别 试验组 对照组 合 计 有 效 99(90.48) a 75(83.52) c 174(a+c) 无 效 5(13.52) b 21(12.48) d 26(b+d) 合 计 104 (a+ b) 96 (c+d) 200 (n) 有效率(%) 95.20 78.13 87.00
( b c 1) 2 bc
, =1
本例检验步骤如下:
(1)建立检验假设
H0:总体B=C,即两种方法肝癌检出率相同
定性资料的统计描述 PPT
病名 高血压 冠心病 恼卒中 风心病
某地某年四种常见心血管病死亡率
平均人口数 172665
人数 40
死 亡 率 ( 1/10 万)
23.2
172665
11
6.4
172665
253
146.5
172665
38
22.0
常用的频率指标
• 病死率(fatality rate):表示一定时期内(通常为1年),患某 病的全部病人中因该病死亡者的比例。
选择K的要点: • 依照习惯用法以便于比较,如治愈率、某病病死率、人工流
产率等用百分率;出生率、婴儿死亡率等用千分率;恶性肿 瘤死亡率用十万分率; • 使算得的率至少保留1~2位整数。
常用的频率指标
• 发病率(incidence rate):指在一定期间内、一定人群中某病新 病例出现的频率。用来说明居民在一定时期内某病的发病水
相对数种类
• 率(rate) • 构成比(proportion) • 相对比(relative ratio)
率 (rate)
• 概念:是指某种现象在一定条件下,实际发生的观察单位数与估计 发生该现象的总观察单位数之比,用以说明某种现象发生的频率大 小或强度。常以百分率(%)、千分率(‰)、万分率(/万)、十万分 率(/10万)等表示。
定性资料的统计描述
统计描述和推断的基本内容
计量资料
统计描述
频数分布 集中趋势 离散趋势 统计图表
统计推断
抽样误差、 标准误 t,u 检验
秩和检验 方差分析
应用 正常值范围
可信区间
计数资料
相对数及其标 准化
统计图表
二项分Poisson 分布
u 2检验
第5章定性资料的统计描述
第五章定性资料的统计描述在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称分类资料或计数资料。
如性别、HIV感染情况、病情轻重等都属于分类资料。
分类资料按类别分类计数所得到的数叫绝对数,绝对数往往不便于进行相互比较。
例如甲医院某年因某病死亡105人,同年乙医院因该病死亡185人。
但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的人数不一定相等,此时需要采用相对数指标进行统计描述。
第一节常用相对数及其应用一、定性资料的频数分布与定量资料一样,定性资料也可通过编制频数分布表描述其分布特征,并通过计算一些常用的相对数指标进行统计描述和统计推断。
定性资料频数分布表又称为列联表,是用两个分类变量对同一资料进行双向分类形成的表,可用于考察两种属性的关系。
表5.1为某中学不同性别青春期少年对自身体型感觉的构成情况的列联表。
表5.1 某中学不同性别青春期少年对自身体型感觉的构成情况性别自感偏瘦正常自感偏胖男39 186 20女25 130 54列联表的横标目一般为分组变量,纵标目为结局变量。
列联表的用途主要有:1. 列出每组中各种不同结局分类后的频数。
2. 描述频数分布的特征。
3. 便于进一步对分类资料的特征进行统计描述和统计推断。
二、常用相对数指标除了用频数分布表可以全面反映定性资料的特征外,也可计算相对数指标来描述定性资料的特征。
相对数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。
(一)率率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指标。
频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在0~1之间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病学中也常称为累积发生率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
行×列ቤተ መጻሕፍቲ ባይዱ资料的 χ 检验
2
四格表资料卡方检验
进行比较, 一定是两组进行比较,实验结果是两个对 立的结果。 四格表资料表格
_____________________________________ + 合计 _____________________________________ a b a+b 第一组 c d c+d _____________________________ a+b b+d a+b+c+d 合计 ______________________________________ 第二组
A χ = n(Σ −1) nRnC
2
2
ν = (行数−1)(列数−1)
配对设计资料的两样本检验
配对设计是医学研究中常用的设计方法之一, 配对设计是医学研究中常用的设计方法之一, 配对研究常用于比较两种检验方法 二分类结果资料的配对研究常用于比较两种检验方法、 二分类结果资料的配对研究常用于比较两种检验方法、 两种培养方法、两种提取方法等的差别。 两种培养方法、两种提取方法等的差别。 配对四格表资料表格 甲种属性
用药史 曾服该药 未服该药 合计 不敏感 180 73 253 敏感 215 106 321 合计 395 179 574 耐药率( ) 耐药率(%) 45.57 40.78 44.08
Public health school, Xuzhou medical college
建立数据文件
Dose 表示服该药情况 1 2 Sensi 表示敏感情况 1 2 Weight 表示相应的频数 表示不敏感 表示敏感 表示曾服该药 表示未曾服该药
+ a c a+c
乙种属性
- b d b+d
合计
a+b c+d a+b+c+d
合计
+ -
Public health school, Xuzhou medical college
b + c > 40, b + c ≤ 40,
(b − c) χ =
2
2
χ
2
( b −c −1) =
b+c
b+c
2
ν =1
例乳腺癌患者治疗后5年存活率的比较 表3 131例乳腺癌患者治疗后 年存活率的比较 例乳腺癌患者治疗后 处理 联合治疗 单纯治疗 合计 不敏感 39 57 96 敏感 8 27 35
Public health school, Xuzhou medical college
4. 为研究静脉曲张是否与肥胖有关 观察 为研究静脉曲张是否与肥胖有关,观察 观察122对 对 同胞兄弟,每对同胞兄弟中有一个属于肥胖 每对同胞兄弟中有一个属于肥胖,另 同胞兄弟 每对同胞兄弟中有一个属于肥胖 另 一个属于正常体重, 一个属于正常体重 记录得静脉曲张发生情况 见下表,试作相关分析 试作相关分析。 见下表 试作相关分析。
Public health school, Xuzhou medical college
二、主要内容
Analyze Descriptive Statistics Crosstabs...
Public health school, Xuzhou medical college
SPSS操作过程: 操作过程: 操作过程
表4
正常体重
122对同胞兄弟静脉曲张发生情况 对同胞兄弟静脉曲张发生情况
肥胖
发生 19 12 31
未发生 5 86 91
合计 24 98 122
发生 未发生 合计
1) Weight cases Data Weight Cases... 2) analyze Analyze Descriptive Statistics Crosstabs...
某药品检验所随机抽取574名成年人, 574名成年人 例1 某药品检验所随机抽取574名成年人,研究某抗生 素的耐药性。其中179例未曾用过该抗生素, 179例未曾用过该抗生素 素的耐药性。其中179例未曾用过该抗生素,其耐药率 40.78%; 395例曾用过该药的人群中 例曾用过该药的人群中, 为40.78%;在395例曾用过该药的人群中,耐药率为 45.57%,结果见下表。 45.57%,结果见下表。 试问两种人群的耐药率是否一样? 试问两种人群的耐药率是否一样? 表8-11 某抗生素的人群耐药性情况
例2 某研究人员收集了亚洲、欧洲和北美洲人的A、B、 某研究人员收集了亚洲、欧洲和北美洲人的 、 、 AB、O血型资料,结果见下表,其目的是研究不同地 血型资料, 、 血型资料 结果见下表, 区的人群血型分类构成比是否一样。 区的人群血型分类构成比是否一样。 表8-1
地区 亚洲 欧洲 北美洲 合计
Public health school, Xuzhou medical college
定性资料假设检验的正确应用
两个率的比较: 两个率的比较: 1)当n≥40,所有 ) ,所有T>5时,用普通的卡方 时 检验公式; 检验公式; 2)当n≥40,但有理论频数 ) ,但有理论频数1≤T<5时,用 < 时 校正的卡方检验公式; 校正的卡方检验公式; 3) n<40或有 ) 或有T<1时或 时或P≈α时,用确切概 或有 时或 时 率法。 率法。
连续性校正公式: 连续性校正公式:
χ =∑
2 c
2
( A−T − 0.5) T
n 2 2
2
(| ad - bc | - ) n χc = (a +b)(c+ d )(a + c)(b+ d )
行×列表资料卡方检验
可用于检验多个样本率或构成比以推断多个总 可用于检验多个样本率或构成比以推断多个总 多个样本率 体率或构成比是否相等。 体率或构成比是否相等。
卡方检验的基本公式: 卡方检验的基本公式:
( A − T )2 χ2 = ∑ ,自由度ν = ( 行数-1)( 列数-1) T
ν =1
卡方检验的四格表专用公式: 卡方检验的四格表专用公式:
χ
2=
(ad−bc) n ν =1 (a+b)(a+c)(b+d)(c+d)
2
Public health school, Xuzhou medical college
Public health school, Xuzhou medical college
第五讲 定性资料的统计分析
Public health school, Xuzhou medical college
计量资料
每个观察单位某个变量用测量或其他定量方法 获得的定量观察结果,一般有计量单位。 体 重(kg) : 20 35 42 60 mm 皮试直径(mm): 18 16 21 28 年 龄(岁) : 25 32 65 45
计数资料
将观察单位按某种属性分组计数的定性观察结 果。 二分类: 性别:男 ,女 多分类: 民族:汉,满,回… 血型:A,B,AB,O 痰培养:阴性, 阳性
Public health school, Xuzhou medical college
等级资料
将观察单位按某种属性的不同程度或次序分成 等级后分组计数的观察结果,特点是具有半定量性 质。 痰 涂 片:阴性,可疑,阳性 血清反应:阴性,若阳性,阳性,强阳性
area 表示不同地区 1 2 3 bloodtype 表示不同血型 1 2 3 4 Weight 表示A型 表示 型 表示B型 表示 型 表示AB型 表示 型 表示O型 表示 型 表示亚洲 表示欧洲 表示北美洲
表示相应的频数
现有198份痰标本,每份标本分别用 、B两种培养 份痰标本, 例3 现有 份痰标本 每份标本分别用A、 两种培养 基培养结核菌,结果如下表, 培养基的阳性培养率为 基培养结核菌,结果如下表,A培养基的阳性培养率为 36.36%, B培养基的阳性培养率为 培养基的阳性培养率为34.34%, 试问 、 B , 培养基的阳性培养率为 , 试问A、 两种培养基的阳性培养率是否相等? 两种培养基的阳性培养率是否相等?
计数资料的统计分析
率 统计描述 构成比 相对比
点估计 统计推断 参数估计 区间估计 卡方检验
假设检验
χ 检验
2
是一种用途广泛的统计方法,主要用于: 是一种用途广泛的统计方法,主要用于: 推断两个或多个总体率(或构成比) 推断两个或多个总体率(或构成比)之间有无 差别。 差别。 四格表资料 χ2检验 四格表配对资料 χ 检验
Public health school, Xuzhou medical college
定性资料假设检验的正确应用
多个率的比较: 多个率的比较:
表中不宜有1/5以上格子的理论数小于 , 表中不宜有 以上格子的理论数小于5,或不 以上格子的理论数小于 宜有个一理论数小于1。 宜有个一理论数小于 。 不满足条件的解决方案: 不满足条件的解决方案: (a)增加样本例数 增加样本例数; 增加样本例数 (b)删去上述理论频数太小的行或列 删去上述理论频数太小的行或列; 删去上述理论频数太小的行或列 (c)将太小理论频数相邻行或列合并,但应合理。 将太小理论频数相邻行或列合并,但应合理。 将太小理论频数相邻行或列合并
表1 两种检验方法结果比较
常规培养法 荧光抗体法
+ 160 5 165
26 48 74
合计 186 53 239
+ 合计
2. 某地调查了1995-1998四个年度中小学女生的贫血状 某地调查了 四个年度中小学女生的贫血状 见下表,问各年度间学生贫血率有无差别 况,见下表 问各年度间学生贫血率有无差别 见下表 问各年度间学生贫血率有无差别?