生物医学研究的统计方法-假设检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.
检验研究中的假设 将研究者想收集证据予以支持的假设作为备择 假设H1
一个研究者总是想证明自己的研究结论是正确的 一个销售商总是想证明供货商的说法是不正确的 备择假设的方向与想要证明其正确性的方向一致
与之对立的假设作为原假设H0 3. 先确立备择假设H1
2.
1.
检验某项声明的有效性
假设 原假设 备择假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : = 0 H0 : 0 H0 : 0 H1 : ≠0 H1 : < 0 H1 : > 0
确定适当的检验统计量
什么是检验统计量?(test statistic)
1. 根据样本观测结果计算得到的,并据以对原假 设和备择假设作出决策的某个样本统计量 2.对样本估计量的标准化依据
1.
第Ⅰ类错误(弃真错误)
原假设为真时拒绝原假设 第Ⅰ类错误的概率记为
被称为显著性水平
2.
第Ⅱ类错误(取伪错误)
原假设为假时未拒绝原假设 第Ⅱ类错误的概率记为(Beta)
如,某学生数学成绩在某次考试中远超之前,
老师不得不承认他的数学水平有了显著提高。 但这时教师犯了第一类错误,即拒绝了“该生 水平没有显著变化”这一正确假设。
/ 2
/ 2 拒绝
1/2 P 值
拒绝
1/2 P 值
临界值
计算出的样本统计量
H0值
临界值
计算出的样本统计量
Z
抽样分布
拒绝域
置信水平
1-
P值
临界值
H0 值
样本统计量
计算出的样本统计量
抽样分布
置信水平
拒绝域
1-
P值
H0 值
临界值 计算出的样本统计量
1.
单侧检验
若p-值 ,不拒绝 H0 若p-值 < , 拒绝 H0 若p /2 -值 /2, 不拒绝 H0 若p /2 -值 < /2, 拒绝 H0
假设检验就好像一场审判过程 统计检验过程
陪审团审判
H0 检验 实际情况 决策 H0为真 未拒绝H0 拒绝H0 H0为假 正确决策 第Ⅱ类错 误() (1 – ) 第Ⅰ类错 正确决策 误() (1-)
裁决
无罪 有罪
实际情况 无罪 正确 错误 有罪 错误 正确
和 的关系就像 翘翘板,小 就 大, 大 就小
区域大小由显著性水平决定
什么是临界值?(critical
value)
根据给定的显著性水平确定的拒绝域的边界值
常用的 值有0.01, 0.05, 0.10 查表得出相应的临界值z或z/2, t或t/2
抽样分布
拒绝域 /2
置信水平
拒绝域
1-
/2
接受域
H0 值 样本统计量
2.
双侧检验
1.
2.
假设检验的目的就在于试图找到拒绝原假设 的理由,而不在于证明什么是正确的 拒绝原假设时结论是清楚的
例如, H 0 : =3190 ,拒绝 H 0 时,我们可以说
3190
3.
当不拒绝原假设时
并非肯定原假设 含义是 “不否定原假设” 或 “保留原假设” 例如,当不拒绝 H 0: =3190 ,我们并未说它 就是 3190,但也未说它不是 3190。我们只能 说样本提供的证据还不足以推翻原假设
临界值
抽样分布
拒绝H0
置信水平
1- 接受域 H0值 样本统计量
临界值
观察到的样本统计量
抽样分布
拒绝H0
置信水平
1- 接受域 H0值 样本统计量
临界值 观察到的样本统计量
抽样分布
置信水平 拒绝H0 1- 接受域 H0值 样本统计量 临界值
观察到的样本统计量
抽样分布
置信水平
拒绝H0
将所作出的说明(声明)作为原假设 2. 对该说明的质疑作为备择假设 3. 先确立原假设H0
除非我们有证据表明“声明”无效, 否则就应认为该“声明”是有效的 当拒绝H0时,应考虑采取措施纠正该项说明
原假设与备择假设的确定
【例】由统计资料得知,2005年某地新生儿的平均 体重为3190克,现从2006年的新生儿中随机抽 取 100 个,测得其平均体重为 3210 克,问 2006 年的新生儿与2005年相比,体重有无显著差异。 试陈述用于检验的原假设与备择假设 解:研究者抽检的意图是倾向于证实 2006 年的新生儿平均体重有无差别。建 立的原假设和备择假设为 H0 : 3190 H1 : ≠ 500
双侧检验
与 单侧检验
双侧检验与单侧检验
1.
2.
备择假设没有特定的方向性,并含有符号“”的 假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“>”或 “<”的假设检验,称为单侧检验或单尾检验(onetailed test)
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
再如,还是这名学生,经过了长时间的努力后,
他的数学水平实际上已经显著提高了。但是考 试的时候没有发挥好,比以前没有多少提高, 老师就只能认为该生的数学水平没有显著的提 高。 这时教师犯的是第二类错误,即接受了“该生 成绩没有显著变化”这一错误的假设。
假设检验中的两类错误
(决策结果)
H0: 无罪
在一次试验中小概率事件一旦发生,我们就 有理由拒绝原假设
3.
小概率由研究者事先确定
抽样分布
这个值不像我们 应该得到的样本 均值 ... ... 如果这是总 体的真实均值 ... 因此我们拒绝 假设 = 30
20
= 30 H0
样本均值
二、假设检验的步骤
提出零假设H0与备择假设H1
1- 接受域
H0 值
临界值
样本统计量
观察到的样本统计量
决策规则
1.
给定显著性水平,查表得出相应的临界值z或 z/2, t或t/2
2.
3.
将检验统计量的值与 水平的临界值进行比较
作出决策
双侧检验:|统计量| > 临界值,拒绝H0
左侧检验: 统计量 < 临界值,拒绝H0 右侧检验: 统计量 > 临界值,拒绝H0
孙彬
统计方法
描述统计
推断统计
参数估计
假设检验
1.先对总体的参数(或分布形式)提出某种假设, 然后利用样本信息判断假设是否成立的过程。 2. 逻辑上运用反证法,统计上依据小概率原理。
由统计资料得知,2005年某地新 生儿的平均体重为3190克,现从2006 年的新生儿中随机抽取100个,测得其 平均体重为3210克,问2006年的新生 儿与2005年相比,体重有无显著差异。 产生差异的原因: ◆抽样的随机性造成的抽样误差; ◆ 总体平均数确实发生显著的变化。
【例】
反证法思想
为了检验一个假设是否成立,先假定这个 假设是正确的。然后根据样本信息和抽样理论, 观察由此假设而导致的结果是否合理,从而判断 是否接受该假设。
反证法是带有概率性质的反证法。
什么是小概率? 1. 在一次试验中,一个几乎不可能发生的事件 发生的概率
2.
你不能同时减 少两类错误!
大
样本容量n
否 是
小
是
是否已 知
否
是否已 知
z 检验
z 检验
z 检验
t 检验
z
x 0
Hale Waihona Puke Baidu
n
z
x 0 s n
z
x 0
n
t
x 0 s n
谢谢!
原假设H0为真
点估计量的抽样分布
确定适当的检验统计量
1. 选择统计量时,需考虑:
是大样本还是小样本 总体方差已知还是未知
2. 检验统计量的基本形式为
x 0 x 0 Z 或t n s n
μ0为被假设的参数值(即总体均值)
(三)规定显著性水平, 计算临界值、拒绝域
原假设和备择假设
什么是备择假设?(alternative hypothesis)
与原假设对立的假设,也称“研究假设” 研究者想收集证据予以支持的假设,总是有 不等号: , 或
1. 2.
3.
表示为 H1
H1: 某一数值 ,
<或 某一数值
例如, H1: ≠3190(克), <或 3190(克)
临界值
临界值
抽样分布
拒绝H0
置信水平
拒绝H0
1- 接受域 H0 值 样本统计量
/2
/2
临界值
临界值
观察到的样本统计量
抽样分布
拒绝H0
置信水平 拒绝H0 1- 接受域 H0 值 样本统计量
/2
/2
临界值 观察到的样本统计量
临界值
观察到的样本统计量
抽样分布
拒绝域
置信水平
1- 接受域 H0 值 样本统计量
利用P值进行决策
1. 2.
是一个概率值 如果原假设为真,P-值是抽样分布中大于或小于样 本统计量的概率
左侧检验时,P-值为曲线上方小于等于检验统计量部 分的面积 右侧检验时,P-值为曲线上方大于等于检验统计量部 分的面积 H0 能被拒绝的最小值
3.
被称为观察到的(或实测的)显著性水平
什么是显著性水平? 1.是一个概率值 2. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
3. 表示为 (alpha)
常用的 值有0.01, 0.05, 0.10
4. 由研究者事先确定
什么是拒绝域?(rejection
region)
能够拒绝原假设的检验统计量的所有可能取值范围
选择适当的检验统计量,并计算具体数值
规定显著性水平,计算临界值,指定拒 绝域。 将统计量的值与临界值比较,作出决策
统计量的值落在拒绝域,拒绝H0 ,否则不 拒绝H0
■ ■
可以直接利用P 值作出决策
什么是零假设?(null hypothesis) 1.待检验的假设,又称“虚无假设” 2.研究者想收集证据予以反对的假设 3.总是有等号 , 或 4.表示为 H0 H0: 某一数值 , 或 某一数值 例如, H0: 3190(克)