第十章 分类变量资料的统计分析
分类变量资料统计分析
率的标准误和总体率可信区间的估计方法及意义;
u 检验和 2 检验的适用条件和计算方法。
熟悉: 率的标准化的意义和计算方法
1
常用相对数 应用相对数的注意事项 率的标准化
2
3
第一节
常用相对数
绝对数(absolute number)分类变量资料整 理后所得到的数据。
例16.3
甲、乙两地肺癌死亡率分别为23.1/10万、
12.33/10万,则两地死亡率的相对比为23.1/12.33=1.87 ,即甲地肺癌死亡率是乙地的1.87倍,RR= 1.87。
第二节 应用相对数的注意事项
计算相对数时分母不宜过小,即观察单位数应 足够多。
分析时构成比和率不能混淆(见表16-1)
2 检验
2
3
第四节
率的抽样误差和总体率的估计
一、率的抽样误差和标准误
率的抽样误差的大小用率的标准误表示。
p
1
n
Sp
p 1 p n
例16.5 欲了解某种新药对慢性乙型肝炎的疗 效,对100名患者进行治疗,其中90人有效,
试计算其标准误。
p 1 p 0.9 1 0.9 Sp 0.03 n 100
各型传染病分配治愈率相加。
表16.4 标准人口构成比计算甲、乙两医院标准化治愈率
科别
标准人口 构成比
原治愈率(%) 甲医院 65.0 94.0 乙医院 63.0 91.0
预期治愈率 甲医院 26.0 37.6 乙医院 25.2 36.4
内科 外科
0.4 0.4
传染病科
合计
0.2
1.0
分类变量资料统计分析讲义112页PPT
•
26、我们像鹰一样,生来就是自由的 ,但是 为了生 存,我 们不得 不为自 己编织 一个笼 子,然 后把自 己关在 里面。 ——博 莱索
•
27、法律如果不讲道理,即使延续时 间再长 ,也还 是没有 制约力 的。— —爱·科 克
•
பைடு நூலகம்
28、好法律是由坏风俗创造出来的。 ——马 克罗维 乌斯
•
29、在一切能够接受法律支配的人类 的状态 中,哪 里没有 法律, 那里就 没有自 由。— —洛克
•
30、风俗可以造就法律,也可以废除 法律。 ——塞·约翰逊
1、最灵繁的人也看不见自己的背脊。——非洲 2、最困难的事情就是认识自己。——希腊 3、有勇气承担命运这才是英雄好汉。——黑塞 4、与肝胆人共事,无字句处读书。——周恩来 5、阅读使人充实,会谈使人敏捷,写作使人精确。——培根
实习十 分类变量资料的统计分析—卫生学第七版
实习十 分类变量资料的统计分析——卫生学第七版(P393-394)实习目的:1.掌握率、构成比、相对比的计算及应用;正确区分率和构成比。
2.熟悉率的标准化意义、基本思想及计算方法;掌握率的标准误、总体率可信区间估计方法及率的u 检验适用条件和方法。
3.掌握χ2检验基本思想;掌握一般四格表资料、配对资料及行×列表资料χ2检验各种公式的适用条件和检验方法。
5. 某地随机抽查了初中生300人,其中近视学生有71人,计算该地初中生近视眼患病率的标准误,并估计其总体率的95%置信区间。
P =71/300×100%=23.67%()n p p s P -=1 = ()3002367.012367.0- = 0.0245n 足够大时(n >50);样本率p 或1-p 均不太小时 [ 如n p 和n (1-p )均大于5 ],按正态分布原理估计总体率的可信区间。
总体率的95%的置信区间:P ± 1.96 S P = 0.2367 ± 1.96 ×0.0245 = 0.2367 ± 0.0480 = (18.87%, 28.47%)6. 根据以往经验,一般胃溃疡患者有20%发生胃出血症状。
现某医院观察65岁以上胃溃疡患者304例,有 31.6% 发生胃出血症状,问老年胃溃疡患者是否较易出血?分析:本题中样本率为31.6 %,np 和n (1-p )≥5,可认为呈近似正态分布,故可用 u 检验 ⑴ 建立检验假设H 0:老年胃溃疡患者和一般胃溃疡患者出血发生率相同,即π=π0。
H 1:中药和西药有效率不同,即π>π0。
单侧α= 0.05⑵ 计算检验统计量u 值np p u p)1(πππσπ--=-==304)2.01(2.02.0316.0-- = 5.056⑶ 确定P 值,做出统计推断 查U 界值表,u0005.0= 3.2905,u >u0005.0,p <0.0005,按α= 0.05水准,拒绝H 0,接受H 1,差异有统计学意义,可认为老年胃溃疡患者较易出血。
分类变量资料的统计分析
56.01 30.22
14.51 32.26
卫生学(第7版) · 第十章 分类变量资料的统计分析
18
间接法
适用情况:已知被标化组的死亡总数及年龄别人 口数,但不知道各年龄组的实际死亡率。
P P r Ni Pi
标准化死亡比
卫生学(第7版) · 第十章 分类变量资料的统计分析
19
标准化死亡比:被标化组实际死亡数与预期死亡
卫生学(第7版) · 第十章 分类变量资料的统计分析
15
直接法
适用情况:已知被标化组各年龄组的实际率Pi,
用标准人口数或标准人口构成进行计算。
p'
N i pi Ni
或p'
Ci pi
其中 Ni 为第i 组标准人口数, Ni 为标准组总人数, pi 为第i 组的实际率,Ci 为第组标准人口构成。
4
相对数
• 相对数:是两个有关联的数值或指标之比。 • 常用的相对数有:
–率 –构成比 –相对比
卫生学(第7版) · 第十章 分类变量资料的统计分析
5
率(rate)
率:是指在一定观察时间内,某现象实际发生数与
可能发生该现象的总数之比,用以说明某现象发生
的频率或强度。
率
实际发生某现象的观察 单位数 可能发生该现象的观察 单位总数
图10-1 率的抽样分布图
卫生学(第7版) · 第十章 分类变量资料的统计分析
27
率的抽样分布特征
1.为离散型分布;
2.当π =1-π时,呈对称分布; 3.当n增大时,逐渐逼近正态分布。
一般认为,当nπ和n(1-π)≥5时, 可近似看
作正态分布。
卫生学(第7版) · 第十章 分类变量资料的统计分析
分类资料统计分析
普通型
重型 爆发型 合计
0.4
0.4 0.2 1.0
60.040 Biblioteka 0 20 .0 —24.0
16.0 4.0 44.0
65.0
45.0 25.0 —
26.0
18.0 5.0 49.0
注意:★标准化率不能反映率的实际水平, 只能表明相互比较资料间的相对 水平。 ★选定的标准构成不同,所得标化 率也不同,因此仅限于采用共同 标准构成的组间比较。
合计 56(a+c) 283(b+d)339(n) 16.5
四格表资料的x2检验
四格表资料: 实际数:A 理论数: T T的计算公式:
TRC
nR nC n
吸烟者与不吸烟者慢性支气管炎患病率比较
分组 患病人数 未患人数
合计患病率(%)
吸烟者 43(33.86)162(171.14)205 21.0
45.0 25.0 45.0
标准化率的计算
①选定标准: 标准组应根据研究目的选择有代表性的、稳 定的、数量较大的人群 一般可将相互比较的两组合并作为标准 ②计算 ∑Nipi 已知标准组年龄别人口数时:P’= N 已知标准组年龄别人口构成比时: ③比较得出结论
P’=∑( Ni N )pi
表7-14某市甲、乙两医院某传染病标准化治愈率
1.计算相对数时分母不宜过小 2.分析时不能以构成比代替率 3.观察单位不等的几个率,不能直接相加求 其总率 4.比较相对数时应注意资料的可比性 5.对样本率的比较应随机抽样,并作假设检 验
表7-11某地各年龄组妇女宫颈癌患病情况统计
年龄(岁)检查人数 <30 100000 患者数 3 患者构成比 (%) 患病率(1/万) 1.2 0.3
医学统计方法—分类变量资料的统计分析
常用类型: ➢率(rate) ➢构成比(constituent ratio) ➢相对比(relative ratio),等
概念:又称频率指标或强度指标,是指某一现象在一定条件 下实际发生的例数与可能发生该现象的总例数之比,用以说 明某现象发生的频率或强度。
2
91 1 4.90
bc
9 1
(3)确定P值:
查
x
2界
值表,来自得x 2 0.05,1
3.84
x2 0.01,1
6.63。
现 x2 =4.90,x2> x20.05, 故 P<0.05 (4) 做出推断结论:
按α=0.05水准,拒绝H0 ,接受H1,差异有统计学 意义,可以认为两种培养方法的效果不同, A培养基 效果优于B培养基。
计算相对数时应有足够的样本含量; 资料分析时不能以构成比代替率; 资料的对比应注意其可比性; 样本率(或构成比)的比较应考虑抽样误差。
表 某年某医院两种疗法治疗某传染病各型的治愈率(%)
病型
新疗法
传统疗法
治疗例数 治愈例数 治愈率 治疗例数 治愈例数 治愈率
普通型 350
重型
150
217
药物 甲药 乙药 合计
表1 两药物疗效的比较
有效
无效
合计
65 (57.4) 17(24.6)
82
40 (47.6) 28 (20.4)
68
105
45
150
表内蓝体数字为实际頻数,括号里数字为 理论頻数,是假设两药物疗效无差别算得
若假设H0:π1=π2成立,四个格子的实际频数 A 与理论 频数 T 相差不应该很大,即统计量x2值不应该很大。如 果x2值很大,则反过来推断A 与T 相差太大,超出了抽样 误差允许的范围,从而怀疑H0的正确性,继而拒绝H0, 接受其对立假设 H1,即π1≠π2 。
《预防医学》分类变量资料的统计分析PPT
1
当 b+c <40 时 : 2 (| b c | 1)2 ,
bc
1
❖ 行×列(R×C)表资料的 2 检验
适用于成组设计的二项或多项分类资料 (1) 公式选用条件:不能有一个格子的 T < 1 ,且
1T5 的格子数不超过总格子 数的1/5
专用公式为: 2 n( A2 1) nr nc
分类变量资料的统计分析
一、 2 –test的主要用途
➢推断成组设计两个总体率或构成比有无差别 ➢推断配对设计两个总体率有无差别 ➢推断成组设计多个总体率或构成比有无差别 ➢双向有序分类资料的关联性检验(相关分析) ➢检验频数分布的拟合优度
二、 2 –test的基本原理 四格表资料 表1 两组人群尿棕色素阳性率比较
疗法 药物 安慰剂 合计
发生 不发生
合计
62 (58.62) 79 (82.38) 141
12 (15.38) 25 (21.62)
3774Biblioteka 104178发生率 (%) 43.97 32.43 35.96
实际频数Arc
列合计数nC
行合计数nr
理论频数Trc:Trc
nr nc n
周边合计数
四格表资料的一般形式
❖四格表资料的 2 检验
专用公式
适用于成组设计的二项分类资料
• 当 n40 且所有 T5 时: 2
(ad bc)2 n
(a b)(c d)(a c)(b d)
基本公式为: 2 (A T )2 T
• 当 n40 但有 1T<5 时: 2 (| ad bc | n / 2)2 n
1)增大样本例数使理论频数增大 (首选) 2)删去理论数太小的行或列 3)将理论数太小的行或列与性质相近的邻行或
第十章 分类变量资料的统计分析(卡方检验)资料
2=6.48>02.05,1 3.84,P <0.05,按 0.05
检验水准,拒绝H0,接受H1,差异有统计学意义, 认为两疗法的有效率有差别,乙药疗效优于甲药。
P
0.05
0.01
2 2.73 3.84
6.63
四格表资料的校正公式(公式10-17、18):
2
( AT
0.5)2
T
2
( ad bc n / 2)2 n
例10-11 用两种血清学方法对100例肝癌患者进行诊 断,结果见表10-9,问两种方法检测结果有无差别?
表10-9 两种方法检测肺癌的效果比较
甲法 +
合计
乙 +
50(a) 15(c)
65
法
32(b) 3(d)
35
合计
82 18 100
表10-9 配对四格表格式
甲法
+ 合计
乙 +
a c a+c
检验水准,拒绝H0,接受H1,差异有统计学意义, 认为两疗法的有效率有差别,乙药疗效优于甲药。
P
0.05
0.01
2 2.73 3.84
6.63
四格表专用公式(公式10-16):
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
表10-7 两种药治疗动脉硬化有效率比较
同或不等。
2
≥
02.05,时,P≤0.05,按
0.0检5 验水准,拒绝
H0,接受H1,差异有统计学意义,可以认为…不同
或不等,谁大谁小。
二、 四格表资料的 2 检验
适用于成组设计的两个率的比较
例:10-9
卫生学 10.分类变量资料的统计推断
40 6 2 16 64 / 2
42 22 56 8
2
64
4.79
自由度υ=(行数-1)(列数-1)
=(2-1)(2-1)=1
查X2界值表,得 P<0.05,按α=0.05水准, 拒绝H0,可认为两组有效率差别有统计学意 义。
三、配对设计分类变量资料的X2检验
H0:π= π0
H1:π≠ π0
α=0.05 P=0.26
u p 0 0.30 0.26 0.3(1 0.3) 385
0 (1 0 )
n
1.713
查t界值表中υ为∝对应的界值,得P> 0.05,按α=0.05水准,不拒绝H0,尚不 能认为该院认为该院直肠癌患者围术期 并发症发生率与一般情况不同
1 n2
)
0.0854 0.1486 1 1 0.1258(1 0.1258) 8207 14585
0.0046
查t界值表中υ为∝对应的界值得, P< 0.01,按α=0.05水准,拒绝H0,接受H1, 可认为该人群HBV感染率有性别差异。
第三节
x2 检 验
率的抽样分布特征:
1、为离散型分布 2、π为0.5时,呈对称分布 3、当n不断增大时,二项分布逐渐逼近正 态分布 • 当nP和n(1-P)都大于5时,二项分布近 似于正态分布。
二、率的抽样误差和总体率的估计
一、率的抽样误差和标准误(sampling error and standard error of rate)
表10-9 两种血清学方法对肝癌检测的结果比较
甲法 + 乙法 合计
+
合计
50(a)
计算标准化率
11
实例分析
表10-1 2001年某地中小学学生HBsAg 检出率及构成比
学生 小学生 初中生 高中生 合计
检查人数 660 1115
1563 3338
阳性人数 6 49 56 111
检出率(%) 阳性构成比(%)
0.91
表10-2 某地2003-2005年新生儿性别比
新生儿数
90 919 109 671 125 513
男性
48 636 58 908 66 814
女性
42 283 50 763 58 699
性别比
1.15 1.16 1.15
9
二 、应用相对数时的注意事项
1.计算相对数的分母一般不宜过小; 2.分析时不能以构成比代替率; 3.观察单位数不等的几个率,不能直接相加求其平均率;
15
三、率的标准化
(二) 标准化率的计算
把原率资料按影响因素的标准构成调整后算得的率, 称为标准化率(standerdized rate)亦称为调整率。
计算标准化率的步骤:
1.方法选择:直接法和间接法 2.标准选择:① 选取包含比较各组的大范围人口构成; ② 两组合并的人口构成; ③ 其中任一组的人口构成。
年龄 20~
标准人口 Ni
1539
实际患病率 pi1
10.86
甲社区 预期患病数
Nipi1
167
乙社区 实际患病率 预期患病数
pi2
Nipi2
11.76
181
35~ 50~ 65~ 合计
1665 1584 1675 6463
21.48 34.69 53.44 ―
分类变量资料统计分析(计数)06-03-10
患病数(x) 患病数( 100 75 175
分类变量资料的描述
患病率(‰) 患病率( 20.00 30.00 23.00
3
二、相对数, 相对指标
(Relative number)
相对数— (一)相对数的意义:相对数—是两个有 联系指标之比。 联系指标之比。
相对数的优点: 相对数的优点: 1. 便于比较 2. 便于保密
21
分类变量资料的描述
吸烟组肺癌标准化死亡比
432 SM = R = 4.2912 10067 .
不吸烟组肺癌标准化死亡比S源自 = R 432 = 4.2912 10067 .
210 SM = R = 0.8620 24361 .
20122012-2-23
分类变量资料的描述
22
反推法: 反推法:
分类变量资料的描述
1995年 1995年 病例数 2032 1143 542 767 875 5359
(%) 37.92 21.33 10.11 14.31 16.33 100.00
15
20122012-2-23
四、率的标准化法
标准化率( 标准化率(standardized rate) 亦称调整率 调整率。 亦称调整率。
20122012-2-23 分类变量资料的描述 10
常用指标 (1)
患病率 ( Prevalence rate ) 发病率 ( incidence rate) 感染率 ( infect rate)
观 某 患 例 察 病 病 数 患 率= 病 ×K 平 人 数 均 口 观 期 新 病 病 数 察 内 发 某 例 某 发 率= 病 病 ×K 同 内 均 口 期 平 人 数 感 人 染 数 感 率= 染 ×K 检 人 查 数
分类变量资料的统计推断PPT课件
54.81
2021/两3/7 种疗法的2年生存率是否不同?
12
甲乙两种疗法治疗肺癌生存率比较的四格表
疗法 甲
生存 22
死亡 合计(nC) 生存率%
24
46
47.83
乙
35
23
58
60.34
合计(nR) 57
47 104 (n) 54.81
假设:两疗法生存率一致为 57/104 = 54.81%
甲疗法的生存人数 T1.1 : 46×57/104=25.21 乙疗法的生存人数 T2.1 : 58×57/104=31.79 假设: 两疗法病死率一致为 47/104 = 45.19%
2021/3/7
5
二、率的u检验
1. 样本率与总体率比较
目的:推断样本率所代表的总体率 与某总体
率 0 是否相等。
公式:
| p-0 |
u=
p
| p - 0 |
u=
0 (1- 0) /n
条件:np > 5 和 n (1 - p ) > 5
2021/3/7
6
例:某地城镇25岁以上居民高血压患病率为 11%,随机抽查该地矿区25岁以上居民598 人,确诊高血压者有82人。矿区居民与城镇 居民高血压患病率有何不同?
2021/3/7 BMI与糖尿病有关
11
三、 2检验
1. 用途:推断两个或多个总体率(或总体构成 比)之间有无差别,以及配对资料的 比较。
2. 2 检验的基本思想
例: 甲乙两种疗法治疗肺癌的2年生存率
疗法 治疗人数 生存人数 2年生存率%
甲
46
22
47.83
乙
58
35
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
行列表资料2检验应注意事项
1. 行列表资料2检验公式的应用条件: 不能有1/5以上的格子的理论数<5, 或者,不能有1个格子的理论数<1
2. 如果资料不能满足上述条件,则可以通过 (1) 在可能的情况下再增加样本量; (2)专业上允许的情况下,合并相邻的行或列; (3) 删去理论数太小的行和列
连续性校正应遵循的条件: 1. T 5, 且 N 40时, 用非校正的公式 2. 1 T < 5,且N 40时,用连续性校正公 式 3. T <1 或 N< 40, 用 Fisher 精确概率法
例10-9 某医生收集到两种药物治疗白色葡萄球 菌败血症疗效的资料,结果见表10-8,问两 种药物疗效之间的差别有无统计学意义?
99%可信区间: 3.5% 2.58 Sp
三. 两个率比较的u 检验
当np和 n(1-p) ≧5 时 样本率的分布近似正态分布— u 检验
(一) 检验步骤: 1. 建立假设, 确定检验水准α H0: H1: α =0.05 2. 选择检验方法, 计算 u 值 3. 确定 P 值, 判断结果
(二)资料类型
第一节 统计描述
一.描述指标(相对数)
1. 率(rate) : R n K N 单位: %,‰,万分率,10万分率 2. 构成比 (constituent ratio) 单位: % 特点: 3. 相对比 (relative ratio) 常用率比
• 例10-1 某研究者2000年对某校的初中生进行了近视患病 情况调查,试计算各年级近视患病率和构成比及 三年级和一年级患病率的相对比.
3. 假设检验结果有差别,只能认为总的率或构成比 有差别
4. 单向有序变量(等级资料)的行×列表,不 能用X2检验比较组间效应,如果作X2,只能说明 个处理组间的效应在构成比上有无差别。
表10-12 中药和西药对某病的疗效比较 药物 中药 西药 合计 治愈 78 85 163 好转 42 60 102 无效 32 38 70 合计 152 183 335
1. 样本率与总体率的比较 (例10-6)
计算公式:
u p p
p
(1 )
n
2. 两个样本率的比较 (例10-7) 计算公式:
u
p1 p 2 1 1 pc(1 pc)( ) n1 n 2
X1 X 2 pc n1 n 2
第三节 X2 检验 (chi-square test)
例: 某病两种疗法治愈率的比较
病型 西医组 病例数 原治愈率 (%) 预期治愈数 60 40 20 48 32 8 中西医结合组 原治愈率 (%) 预期治愈数 65 45 25 52 36 10
普通型 80 重型 80 爆发型 40
合计
200
88
98
西医标准化治愈率 P'= 88÷200 = 44%
三. 四格表资料的Χ2 检验
处理 A药 B药 合计
有效 a c a+c
无效 b d b+d
合计 a+b c+d n
1. 四格表资料的Χ2 检验的专用公式
(ad bc) 2 n 2 (a b)(c d )(a c)(b d )
df =(R-1)(C-1)=1
2. 四格表资料的Χ2 检验的校正 -- Yates 连续校正
2 2 2 2 A 43 188 19 2 n 1 586( 231 77 231 509 189 77 nRnC 1702 152 1512 1) 10.09 189 509 166 77 166 509
df=(行数-1)(列数-1) =(3-1)(2-1) =2 查X2界值表: X20.05(2)=5.99 X20.01(2)=9.21 按α =0.05,拒绝H0,接受H1,差别有统计学 意义,即可认为三家医院住院病人的院内感 染率有差别。
基本思想 检验实际频数与理论频数的吻合程度,实 际频数与理论频数越相近, X2 值越小; 反 之,实际数与理论数相差越大, X2值越大.
计算公式:
2
A T
T
2
理论频数的计算: TRC= nRnC / n df=(行数-1)(列数-1)
例10-8 某医生用A,B两种药物治疗急性下呼吸道 感染.A药治疗74例,有效68例;B药治疗63例, 有效52例.问两种药物的有效率是否有差别?
小结
计数资料的统计描述
指标: 率、构成比、相对比 计数资料的统计推断
总体参数估计:P±uαSp 率的假设检验: 样本率与总体率的比较 -- u检验 两个大样本率的比较 -- u检验 两个样本率的比较 -- χ2检验 配对设计资料的两个率比较 -- χ2检验 多个样本率的比较 -- R×C表的χ2检验
2
有效率(%) 91.89 82.54 87.59
2
A T
T
二. Χ2 检验的基本步骤 1. 建立检验假设,确定检验水准 H0: 1= 2 H1: 1 2 =0.05
2. 计算Χ2 值 资料类型不同,计算公式不同 3. 确定 P 值, 判断结果 根据查Χ2 界值表, 确定P值
年级
一年级 二年级 三年级 合计
检查人数
442 428 405 1275
患病人数 患病率 构成比
67 68 74 209 15.16 15.89 18.27 16.39 32.06 32.53 35.41 100.0
相对比
1.2
二. 应用相对数时注意事项
1. 分母不宜太小 2. 率和构成比的区别 3. 样本含量不等的几个率的平均值不等于 几个率 的算数平均值 4. 对率或构成比进行比较时,应注意资料的可比性 5. 率的标准化 6. 两样本率进行比较时应进行假设检验
2 A 2 n 1 n Rn C
A —每个格子的实际频数 nR – A所对应的行合计 nC – A所对应的列合计
例10-12. 某研究者欲比较甲、乙、丙三家医院住院 患者院内感染情况,随机抽查同一时期 住院患者感染情况,结果如下:试比较 三家医院院内感染率有无差别。
第三节
率的标准化法 (standardization)
例: 某病两种疗法治愈率的比较
病型
西医组 病例数 治愈数 治愈率 (%) 36 8 4 48 60 40 20 48 中西医结合组 病例数 治愈数 治愈率 (%) 20 60 20 100 13 27 5 45 65 45 25 45
普通型 60 重型 20 爆发型 20 合计 100
处理 甲药 乙药 合计 有效 28 (26.09) 12 (13.91) 40 无效 2 (3.91) 4 (2.09) 6 合计 30 16 46
3. 配对设计资料的2检验 例10-10 用两种不同的方法对53例肺癌患者 进行诊断,资料见表10-9. 问两种检测结果 有无差别?
甲法
+ 合计 乙 法
乙药组平均下降了13.20mmHg,标准差是4.33mmHg. 问两药降压效果是否不同? 例2. 为调查2型糖尿病发病易感因素,某研究者进行 了一项以医院为基础的病例对照研究.结果发现,在 200名糖尿病病例中, 100人有糖尿病遗传家族史; 而200名对照者中只有50人有糖尿病家族史.问糖 尿病家族史是否在两组中分布不同?
<<卫生学>>
计数资料的统计分析
环境与公共卫生学院预防医学系
闫洪涛
统计资料的类型
数值变量: 计量资料 分类变量: 计数资料 无序分类:
二项分类 多项分类 连续型计量资料 离散型计量资料
有序分类 : 变量之间有程度的差 别, 且排列有序. (等级变量)
变量的转换: 定量
定性
第十章 分类变量资料的统计分析
处理 A药 B药 合计 有效 68 52 120 无效 6 11 17 合计 74 63 137 有效率(%) 91.89 82.54 87.59
例10-8 某医生用A,B两种药物治疗急性下呼吸道 感染.A药治疗74例,有效68例;B药治疗63例, 有效52例.问两种药物的有效率是否有差别?
处理 A药 B药 合计 有效 68 (64.82) 52 (55.18) 120 无效 6 (9.18) 11(7.82) 17 合计 74 63 137
预期死亡数的比
3. 率的标准化应注意的问题
• 由于内部构成不同,影响到要比较的总率, 需要标准化处理? • 标准化率只用于比较,已经不代表实际 的水平。 • 各分组率有交叉,不能用标准化率比较 • 抽样得到的标准化率的比较,也应该进行 假设检验.
第二节 计数资料统计推断
一. 率的抽样误差和标准误 样本率和总体率或样本率之间存在的差异,称 抽样误差.率的抽样误差用率的标准误表示.(p or Sp).
+
25 (a) 11 (c) 36
2 (b) 15 (d) 17
合计
27 26 53
b+c>40:
b c 2
bc
2
当 b+c<40 时, 用校正公式. (McNemar 检验)
b c 1 2
bc
2
4. 行×列表资料的2检验 (R ×C 表资料)
基本公式:
表10-12 三家医院住院患者的院内感染率比较 医院 甲 乙 丙 合计 感染 43 19 15 77 未感染 188 170 151 509 合计 231 189 166 586
H0:三家医院院内感染率相同 H1:三家医院院内感染率不相同或不全相同 α=0.05
2 A 2 n 1 n Rn C