4.2分类变量资料的统计推断

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
17
例4.12(P64) 选择大白鼠做动物实验,评价某 抗癌新药不同剂量的抗癌效果,观测48组大白鼠,结 果见表4-11,问两种检验结果有无差别?
表4-11 某抗癌新药两种剂量的毒理实验结果比较
19
三、行×列表的χ2检验
1、多个样本率(或构成比)比较 基本数据的行数或列数大于2时,通称为行×列
零假设。
5
χ2检验(chi-square test)或称卡方检验, 是用途非常广泛的假设检验方法。
它在分类资料统计推断中的应用,包括: 两个率或两个构成比比较的卡方检验 多个率或多个构成比比较的卡方检验
6
一、四格表资料的χ2 检验
基本数据是四个数据的表格称为四格表资料 又称2行2列列联表(R=2,C=2)
表,简记为R ×C表。行×列表资料的 2检验可用
于两个以上的率(或构成比)差异的比较。
ν=(R-1)(C-1)
应用条件:T≥5,或 小于20%的格子1≤T<5
20
例4.13(P65) 欲比较某地区四家三甲医院住院 患者院内感染率有无不同,资料见表4-12,问四 家医院院内感染率差别有无统计学意义。
14
二、配对四格表资料的χ2 检验
配对设计即所比较资料除研究因素外,其它的 影响因素都尽可能相同的设计。 配对设计的资料包括: 1.同一批样品用两种不同的处理方法
2.观察对象根据配对条件配成对子,同一对子内不同 的个体分别接受不同的处理 3.在病因和危险因素的研究中,将病人和对照按配对 条件配成对子,研究是否存在某种病因或危险因素。
第二节 分类变量资料的统计推断
刘怡君 预防医学教研室
1
知识回顾
第一节 分类变量资料的统计描述 一.常用的相对数指标 二.应用相对数时应注意的问题 三.标准化法
2
教学内容
第二节 分类变量资料的统计推断 一.四格表资料的χ2检验(两个率比较) 二.配对资料的χ2检验(两个率比较) 三.行×列表资料的χ2检验(多个率或构成比比较)
15
配对资料若观察的结果只有阳性、阴性两 种可能,清点这类资料只有四种情况,将a、b、 c、d四种情况的对子数填入表格,即得到如下 配对四格表。
甲种属性
+ 合计
乙种属性
+
-
a
b
c
d
a+c
b+d
合计 a+c c+d n=a+b+c+d
注意:a、b、c、d代表对子数!
配对四格表卡方检验的应用条件
1) b+c≥40 2) b+c<40
8
1、卡方检验的基本思想
实际频数与理论频数
有效率的比较,就转变成了实际数值与理论数值的比较
9
2、四格表卡方检验的应用条件
1. n≥40 且T≥5,用卡方检验
2 ( A T )2
T
2
(ad bc)2n
(a b)(a c)(bd )(c d )
2. n≥40 且1≤T<5,用连续性校正公式
(3)单向有序的行×列表资料,不宜用卡方检验 比较两组效应。
小结
一、四格表资料的χ2检验 1. n≥40 且T≥5,用卡方检验
2. n≥40 且1≤T<5,用连续性校正公式
3. n<40或T<1,则用确切概率法
27
小结
二、配对四格表资料的χ2检验
28
小结
三、R×C表资料的χ2检验 T≥5,或小于1/5的格子1≤T<5
3
教学要求
1. 掌握四格表资料和配对四格表资料的χ2检验 2. 熟悉行×列表资料的χ2检验 3. 了解多个样本率比较的χ2分割
4
假设检验的基本思想
反证法思想
先对总体分布进行H0假设,如果样本信息不支持该假 设,则认为零假设不成立。
小概率事件
用概率的思想决定是否拒绝零假设。P<0.05,说明 样本来自假设总体的概率很小,所以在统计学上有 理由认为当前样本不是来自假设的总体,从而拒绝
分类变量 两个率的比较 n=224 Tmin>5
11
2、卡方检验的基本步骤
12
例4.11(P63) 某医院观察了28例肝硬化患者 和14例再生障碍性贫血患者的血清中抗血小板抗体的 阳性情况,结果见表4-10。问两类患者血清中抗血小 板抗体阳性率有无差异。
表4-10 肝硬化与再障血清中抗血小板抗体阳性率

2 c

( A T 0.5)2 T
c2
=
(a
(|
ad
-
bc
|
-
n 2
)2
n
+b)(c + d )(a + c)(b+
d
)
3. n<40或T<1,则用确切概率法
(行数-1)(列数-1) (2 1)(2 1) 1 10
2、卡方检验的基本步骤
例4.10(P62) 某医师为了观察甲乙两种药物治疗 动脉硬化的疗效,将患者随机分为两组,请问甲 乙两药治疗动脉硬化的疗效是否相同。
7
例4.10(P62) 某医师为了观察甲乙两种药物治 疗动脉硬化的疗效,将患者随机分为两组,结果 见表4-8,该医师认为甲乙两药治疗动脉硬化的 疗效有差别,甲药的疗效优于乙药。
表4-8 甲乙两种药物治疗动脉硬化的疗效比较
1. 该资料是何种类型资料? 2. 该医师做出的结论是否正确,为什么? 3. 该资料应该用何种统计方法?
①增加样本含量(最好) ② 删去理论数太小的行和列(丢失信息) ③ 从专业上考虑如果允许,可将太小的理论数
所在的行或列的实际数与性质相近的邻近行 或列中的实际数合并(丢失信息,甚至出假象)
(2)如果结论是拒绝零假设,只能认为各总体率 或构成比之间总的来说有差别,但并不是说它们 彼此之间均有差别。若需判断哪些组间有差别, 还需进行两两比较。
表4-12 甲乙丙丁四家医院院内感染率比较
本例资料为四行二列,称为4×2表,共有8格。
21
H0:甲、乙、丙、丁四家医院院内感染率无差别 H1:甲、乙、丙、丁四家医院院内感染率有差别
0.05
例4.14(P65) 某教育局欲调查各小学低年级学 生发生意外伤害的情况,资料见表4-13,问不同 年级小学生发生意外伤害的种类是否有差别。
ν=(R-1)(C-1)
29
表4-13 不同年级小学生发生意外伤害的种类
本例资料为三行四列,称为3×4表,共有12格。
23
(1)建立假设,确定水准
H0:三个年级小学生发生意外伤害的类型分布相同 H1:三个年级小学生发生意外伤害的类型分布不同
Βιβλιοθήκη Baidu0.05
2、行×列表χ2检验的注意事项
(1)理论频数不宜太小,若较多格子(1/5)的理论 频数小于5或有一个格子的理论频数小于1,可采取以 下措施:
相关文档
最新文档