第六章第2部分(第四节-第七节)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、配对设计四格表资料卡方检验
• McNemar检验
• 例6.11 某研究人员为研究两种检测方法的检出 率,将410份血样一分为二后,分别用甲、乙 两种方法检测其乙肝表面抗原HbsAg的表达情 况,结果如下表。试分析两种方法的检测结果 是否不同?
(1)建立检验假设,确定检验水准
– H0:B=C,即两种方法的总体检出率相同 – H1:B≠C,即两种方法的总体检出率不同
第七节 秩和检验
• 参数检验(parametric test):在总体分布类型 已知的情况下,对总体参数进行的假设检验。 • 非参数检验(nonparametric test):一种不依 赖于总体分布类型,不对总体参数进行检验的 方法,它检验的是分布而不是参数。
• 如果资料满足参数检验的条件,或者经 过变量变换可以符合参数检验条件的资 料,应该选择参数检验。 • 对于偏态分布资料、方差不齐的资料、 等级资料、一端或者两端不确切值的资 料等,才考虑非参数检验。
(3)确定P值,判断结果
– 由于 F0.05 (2,57) 3.15, F0.01 (2,57) 4.98
– 所以,P<0.01,按照α=0.05的水准,拒绝H0, 接受H1,差异有统计学意义,说明三个组的 餐后2小时血糖下降值的总体均数不全相同, 即至少有两个组的总体均数不同。
第六节 定性资料的假设检验 ――――卡方检验
(1)建立检验假设,确定检验水准 H0:1=2=3,即三种治疗方法的总体有效率相同 H1:1,2,3不全相同,即三种治疗方法的总体有效率 不同或不全相同 α=0.05 (2)选择检验方法,计算检验统计量2值
A2 2 n 1 nR nc
222 22 2 982 89 2 252 16 2 272 1 44 145 44 127 187 145 187 127 41 145 41 127 1.22
(1)建立检验假设,确定检验水准
– H0:μ1=μ2=…=μk – H1:μ1、μ2、…、μk不全相等
– α=0.05
(2)计算检验统计量F值
F
MS组间 MS组内
SS组间 / 组间 SS组内 / 组内
14.81
1 组间 k 1 2
2 组内 N k 57
(1)建立检验假设,确立检验水准
– H0:μ=μ0 – H1:μ≠μ0 – α=0.05
(2)选择检验方法,计算检验统计量t值
130.83 140 t 2.879 S/ n 12.74 / 16 X 0
(3)确定P值,下结论
查界值表,得t 0.05/2,15=2.131<2.879,P<0.05,拒绝H0, 接受H1 ,差异有统计学意义,可认为该皮鞋厂工人的血 红蛋白与正常成年男性的血红蛋白平均水平不同。
度趋于无穷大时,2卡方分布渐近于正态分布。
• 2分布曲线下右侧尾部的面积记为时,横轴上相
应的卡方Baidu Nhomakorabea即为2分布的分位数。
二、完全随机设计四格表资料的 卡方检验
• 例6.10 为研究吸烟和肺癌的关系,某研究者进行 了以医院为基础的病例对照研究,结果如下表所 示。试分析肺癌组和对照组的吸烟率是否有差别?
(1)建立检验假设,确定检验水准
– H0:1 =2,两个组的总体吸烟率相同 – H1:1≠2,两个组的总体吸烟率不同 – α=0.05
(2)选择检验方法,计算检验统计量2值
n=200>40, Tmin
nr min * nc min 100 96 48 5 n 200
– α=0.05
(2)计算检验统计量2值
– b+c=118>40,所以选用公式:
(b c ) 2 (110 8) 2 2 88.17 bc 110 8
(3)确定P值,判断结果
– 根据卡方值和自由度,查卡方界值表,得P<0.005,按α=0.05的水 准,拒绝H0,接受H1,差异有统计学意义,可认为两种方法的检 出率不同,甲法检出率高于乙法。
(3)确定P值,判断结果
– 根据卡方值和自由度,查卡方界值表,得 P>0.5,按α=0.05的水准,不拒绝H0,差异 无统计学意义,尚不能认为三种方法的总体 有效率不同。
行列表卡方检验的注意事项:
• 行列表卡方检验时要求理论频数不应小于1,并且 1≤T<5的格子数不能超过格子总数的1/5。
• 多个样本率或构成比的比较,结果为“拒绝H0,接受 H1”时,只能认为各总体率总的来说有差异,要进一步 进行两两比较判断哪两个总体之间有差异。 • 由于行列表卡方检验的计算公式与分类变量的顺序无 关,当行列变量中有一个变量是有序分类变量(即单 向有序行列表资料)时,不宜采用卡方检验,应改用 秩和检验或Ridit检验进行分析。
第五节 定量资料的假设检验
一、样本均数与总体均数的比较
• 1.单样本t检验 • 2.单样本u检验
单样本t检验
• 例6.5 . 已知正常成年男子血红蛋白含量的均数 为140g/L。某医生随机抽取了某皮鞋厂16名男 性工人,并测得其血红蛋白含量,均数为 130.83g/L,标准差为12.74g/L。假定该样本血 红蛋白含量服从正态分布,且检验水准为α= 0.05。问该皮鞋厂工人的血红蛋白是否与正常 成年男性的血红蛋白平均水平不同?
第四节 假设检验的原理和基本步骤
假设检验(hypothesis test)
• 假设检验:根据研究目的,预先对未知总体做 出一些假设,然后根据实测样本的信息去检验
假设的合理性,以决定对该假设的取舍,这种
关于总体的种种假设称为统计假设,处理假设
的统计方法称为假设检验。
• 又称为显著性检验(significance test)。
四、多个样本均数的比较
• 方差分析(Analysis of variance,ANOVA)
• 多个样本均数的比较不能直接用两两进行t检验 (会增加犯第一类错误的概率),而应该用方 差分析。
• 方差分析最早是由英国统计学家R.A.Fisher创 立的,又称为F检验。
单因素方差分析
• 例6.9 为研究一种降糖新药的疗效,某医师以 统一的纳入和排除标准选择了60名2型糖尿病 患者,按照完全随机设计方案将患者分为三组 即高剂量组、低剂量组与对照组,每组20人, 进行临床试验。对照组服用公认有效的降糖药 物,治疗1个月后测得其餐后2小时血糖下降值 (mmol/L),结果如下表。问治疗1个月后三 组患者的餐后2小时血糖下降值是否不同?
假设检验(hypothesis test)
• 如果总体分布类型已知,检验问题仅涉 及总体分布的未知参数,属于参数检验。 • 若总体分布类型未知,检验是针对总体 分布函数的类型或某些特征的,属于非 参数检验。
一、假设检验基本思想
• 小概率事件 • 反证法原理
二、假设检验的基本步骤
1. 建立检验假设,确立检验水准
卡方检验的用途
• 推断两个总体率或构成比之间有无差别 • 多个总体率或构成比之间有无差别 • 两个分类变量之间有无关联性
• 频数分布的拟合优度检验等
一、2检验概述
• 2分布是一种连续型分布,其形态依赖于自由度的
不同而不同。当自由度≤2时,曲线呈L型;随着自
由度的增加,2分布的曲线逐渐趋于对称;当自由
四、行列表资料的卡方检验
A n 1 nR nc
2 2
( r 1)(c 1)
• 例6.12 某临床医师为比较研究三种治疗方法对降低血压的 疗效,将病情相似的272例患者随机地分到三个组进行治 疗,结果以有效、无效来表示。数据如下表。试比较三个 组的有效率是否相同?
一、配对设计两样本的比较 ――――Wilcoxon符号秩和检验
• 例6.13 某医师为评价安眠药的疗效,随机选取 了10名失眠患者进行药物治疗,服药前后患者 的睡眠时间如下表,假设该资料不服从正态分
布,请评价该药物的疗效。
1.建立检验假设,确立检验水准
H0:治疗前后睡眠时间差值的总体中位数为0,Md = 0 H1:治疗前后睡眠时间差值的总体中位数不为0,Md ≠ 0 =0.05
(1)建立假设,确定检验水准
– H0:μ1=μ2 – H1:μ1≠μ2 – α =0.05
(2)选择检验方法,计算检验统计量t值
( n1 1) S12 ( n2 1) S 22 (15 1) 1.012 (12 1)1.14 2 S c2 1.14 n1 n2 2 15 12 2
二、配对设计两样本均数的比较
• 配对设计主要情况:
1. 两同质受试对象配成对子分别接受两种不
同的处理措施;
2. 同一受试对象分别接受两种不同的处理;
3. 同一受试对象接受处理前后。
• 例6.6 某研究人员为研究牛奶是否有增加身 高的作用,把16名儿童按照年龄相近、性 别相同、身高体重相近等原则配成8对,每 对儿童中一个给予正常饮食,另一个除了 正常饮食外,每天增喝500ml牛奶,6个月 后测得其身高增长情况如下表,问增喝与 不喝牛奶组的儿童身高增加情况是否有差 别?
2. 选择检验方法,计算检验统计量
3. 确定P值,下结论
三、假设检验中的两类错误
• 第一类错误:当H0为真时,由于样本的随机性,根 据样本观测值却做出了拒绝了H0的判断,称为第一 类错误,也称为“弃真”的错误。其概率大小为显 著性水准。
• 第二类错误:当H0不真时,根据样本观测值却做出 了不拒绝H0的判断,称为第二类错误,即“存伪” 的错误,大小为。 • 要同时减少两类错误,只有增加样本含量。
2
ad bc
2
n
(a b)(c d )(a c)(b d )
68 64 32 36
2
200
100 100 104 96
20.51
(3)确定P值,判断结果
– 根据自由度和卡方值,查卡方界值表,得 P<0.005,按α=0.05的水准,拒绝H0,接受 H1,差异有统计学意义,可认为两组的总体 吸烟率不同,肺癌组吸烟率高于对照组。
三、成组设计两样本均数的比较
• 成组t检验 • 成组u检验
成组t检验
• 例6.7 某呼吸内科医师分别测得15例健康人和12 例肺气肿患者痰中α1抗胰蛋白酶含量如下,问健 康人和肺气肿患者痰中α1抗胰蛋白酶含量是否不 同? – 健康人 2.7 2.2 4.1 4.3 2.6 1.9 1.7 0.6 1.9 1.3 1.5 1.7 1.3 1.3 1.9 – 患者 3.6 3.4 3.7 5.4 3.6 6.8 4.7 2.9 4.8 5.6 4.1 3.3
2.计算检验统计量
(1)求差值。 (2)按差值的绝对值由小到大进行编秩,冠以差值的正负号。
(3)分别求出正负秩和T+、T- ,取其中较小的作为统计量T。
本例,T+=51,T-=4,所以,统计量T=4。
3.确定P值,下结论
– 查T界值表,若检验统计量T在上下界值范围内,其P>α;若检验 统计量T在上下界值范围外,其P<α。
(1)建立检验假设,确立检验水准
– H0:μd=0 – H1:μd≠0 α=0.05
(2)选择检验方法,计算检验统计量t值
d 0 t 5.43, n 1 7 Sd / n
(3)确定P值,下结论 – t=5.43 > t 0.01/2,7=3.499 ,P<0.01,按照α=0.05的水 准,拒绝H0,接受H1,差异有统计学意义,可认为增 喝和不喝牛奶组的儿童身高增加有差别,喝牛奶组身 高增加的更多。
t X1 X 2 2.07 4.33 5.441, n1 n2 2 25 1 1 1 1 Sc2 ( ) 1.14 2 ( ) n1 n2 15 12
(3)确定P值,判断结果
– t=-5.441 > t0.001/2,25=3.725,P<0.001,按 照α=0.05的水准,拒绝H0,接受H1,差异 有统计学意义,可以认为健康人和肺气肿 患者痰中α1抗胰蛋白酶含量不同。