假设检验的原理和方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

x 0 126
x x = u= u= x
x
2 x
240 40 n 6
2
136-126 √40
= 1.581
P( u >1.581)=2×0.0571=0.1142
4、作出推断结论:是否接受假设
小 概 率 原 理
P>
可能正确
接受H0 否定HA 否定H0 接受HA
分 析 题 意
提 出 假 设
确 定 显 著 水 平
计 算 检 验 统 计 量
作 出 推 断
小结
第四章 统计推断 第一节 假设检验的原理与方法 • 一 概念 • 二、假设测验基本思想 • 三、假设检验的步骤(重点) • 四 、双尾检验与单尾检验 • 五、两类错误
作 业
• P81 习题4.5,4.6
SS = 18.83
Sx = 1.64 8 = 0.58
36.8、35.9、34.6,问
新引入品种的千粒重 是否显著高于当地良
t=
0.58
= 2.069
种?
df = 7 时
t 0.05= 1.895
|t | > t0.05,P < 0.05
否定 H0: 34 g,即新引进品种的千粒重显著比当地良种千粒重高。
=0.05/0.01
• 实例
例:某地区的当地小麦品种一般亩 产300kg,标准差75kg。现有新品 种通过25个小区的试验,获得其平 均产量为330kg/亩,新品种与当地 品种是否有显著差异?
提出假设 我认为小麦 平均产量是 300kg
作出决策
接受或拒绝 假设
抽取随机样本
均值x=330kg
• 思考: P81 习题4.1,4.2,4.3
P<
可能错误
例:上例中 P=0.1142>0.05
所以接受H0,从而得出结论:使用克矽
平治疗前后血红蛋白含量未发现有显著
差异,其差值10应归于误差所致。
已知: P( u >1.96) =0.05 P( u >2.58) =0.01
0.025 0.95 0.025

u >1.96
P( u ) <0.05
• 实例
例:某地区的当地 小麦品种一般亩产 300kg,标准差 75kg。现有新品种 通过25个小区的试 验,获得其平均产 量为330kg/亩,新 品种与当地品种是 否有显著差异?
提出假设 计算假设正 确的概率
=0.05
统计决策
• 实例
抽样分布
这个值是我们应该得 到的样本均值?
H0 1.96 x
x-0=136-126=10(mg/L)这一差数 是由于治疗造成的,还是抽样误差所致。 平均数的假设检验
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
H0:μ=μ0 =126(mg/L)
HA:μ ≠μ
0
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样, 二者来自同一总体,接受零假设则表示克矽平没有疗效。 而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数 和治疗前的平均数来自不同总体,即克矽平有疗效。
U=-2.33 。
例2:某春小麦良种的
单尾检验
H0: 34 ;对 HA: > 34 = 0.05(单尾) x =35.2 g
S= 18.83 8-1 = 1.64 35.2 - 34
千粒重0=34g,现自
外地引入一高产品种, 在8个小区种植,得千 粒重(g)35.6、37.6、 33.4、35.1、32.7、
第四章
统计推断
(statistical inference)
第四章 统计推断
由一个样 本或一糸 列样本所 得的结果 来推断总 体的特征
统 计 推 断
假设检验
参数估计
统计推断的过程

总体
总体均值、 方差


样本统计量 例如:样本均值、 方差
样本


任务
分析误差产生的原因 确定差异的性质 排除误差干扰 对总体特征做出正确判断
平均数的检验
参数检验
频率的检验
方差的检验
假 设 检 验
秩和检验
非参数检验
符号检验
二、假设测验基本思想
•采用逻辑上的反证法 •依据统计上的小概率原理
1-
抽样分布
拒绝区
拒绝区
/2
接受区
/2
临界值
H0
样本均数
临界值
小概率原理
概率很小的事件在一次抽样试验 中实际是几乎不可能发生的。
如果假设一些条件,并在假设的条件下能够准确地算 出事件A出现的概率α 为很小,则在假设条件下的n次独 立重复试验中,事件A将按预定的概率发生,而在一次试 验中则几乎不可能发生。
错误只在接受H0时发生
错误增加 错误减小 错误增加 错误减小
结论 2、 还依赖于 - 0 的距离
3、n , 2 可使两类错误的概率都减小.
单尾检验: 否定区只在一侧
0.95
0.05
0.05
0.95
接受区 1.64 否定区
-1.64 接受区 左尾检验
右尾检验
假设检验的步骤:
一般认为,两尾测验较为稳妥,对结果考虑的思路 较宽,故很常用。
P(-1.96x <x< +1.96x) =0.95
双尾检验
(two-sided test)
左尾
0.025
-1.96x 否定区
0.95 0 接受区
0.025
+1.96x 否定区
右尾
临界值: + ux
+ 1.96x
错误
= 0
Ⅰ和Ⅱ不重合
错 误
2

C2
C1


2
-u
0
u

从图可知,在a水平上,事件U<Ua,U 既位于H0分布之下,同时也位于HA的分布 之下。由于u属于H0 的分布的概率很大,为1-a,所以我们接受H0 ,但是,U 同 时也有大小为β的概率来自于HA 分布,这时我们却完全否认这种可能性,显然 是一种错误。这种在接受H0 时犯下的错误,称为“Ⅱ型错误”或“β错误”或 “纳伪错误”(即无效假设H0是不正确的,我们却接受了它)。这种统计错误的 性质是把真实差异错判为非真实差异。犯这种类型的错误概率不会超过β。
右尾检验


双尾 检验 分位数
u 0.05=1.96 u 0.01=2.58

否定区
接受区
否定区
接受区
否定区
单尾 检验 分位数
u 0.05=1.64 u 0.01=2.33
查表时,单尾概率等于双尾概率乘以2
同一显著水平下,双尾检验的临界值大于单 尾检验的临界值。如α=0.05时,双尾 |U|=1.96,而单尾为U=1.64或U=-1.64 ;α= 0.01时,双尾|U|=2.58,而单尾为U=2.33或
治疗前 0 =126 2 =240 治疗后 n =6 x =136
N ( 126,240 )
未知
那么 =0 ? 即克矽平对治疗矽肺是否有效?
1 、提出假设
无效假设 /零假设 /检验假设
H0 误差 效应
0 =
对 立
备择假设 /对应假设
0 HA
处理 效应
例:克矽平治疗矽肺病是否能提高血红蛋白含量?
…如果这是总 体的真实均值
μ= 300
330 ?
样本均值
我们拒绝还是接受假设μ=300 ?
三、假设检验的步骤 例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进 行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
差异达显著水平
u >2.58
P( u ) <0.01
差异达极显著水平
三 、双尾检验与单尾检验
• 无论什么样的情况,假设检验时,首先要作出无效假 设H0,且作出这个假设是要有依据的。
通常假设被比较的对象间没有差异,或现在的状
况与已知的或原来的状况相符合。 • 经测验,当H0被拒绝时,所接受的假设是与H0相对立 的备择假设HA。HA有如下三种情况可供选择: HA: 0 ; HA : 0 0 ;即 HA :
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作。 统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验 也常取=0.05和=0.01两个显著水平 。
=0.05 =0.01
P<
显著水平* 极显著水平**
3 、选定检验方法,计算检验统计量,确定概率值 根据研究设计的类型和统计推断的目的选 择使用不同的检验方法。 例:
第四章
第一节 第二节 第三节 第四节 第五节
假设检验的原理与方法 样本平均数的假设检验 样本频率的假设检验
参数的区间估计与点估计
方差的同质性检验
一 概念 :
假设检验(hypothesis test)又称显著 性检验(significance test),就是根据总体 的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设, 然后由样本的实际原理,经过一定的计算, 作出在一定概率意义上应该接受的那种假 设的推断。
“勉强可吃、可用的就是不能吃、不能用”。
抽样分布
拒绝区H0
0.05
H0 x
1.895
单尾检验 假设:
(one-sided test)
H0 : ≤0 HA : > 0
H0 : ≥0 HA : < 0
0.95
0.05
0.05
0.95
接受区 1.64
否定区
-1.64 接受区 左尾检验
P(-2.58x <x< +2.58x) =0.99
左尾
0.005 -2.58x 否定区
0.99 0 接受区
0.005 +2.58x 否定区
右尾
临界值: + 2.58x
双尾检验
(two-sided test)
(二)单尾测验
假设检验时所考虑的概率仅为分布曲线左边或右边一尾概率 之时,称单尾检验。 单尾检验一般用于安全检查,如生产安全、食品安全和卫生 防御等。
四、两类错误
Ⅰ Ⅱ
0

错 误
a虽然是一很小的概率值如0.01,但并不等于0, 只是很小(a)而已。我们却完全否认这种可能性, 认为它不可能发生,从而拒绝H0 。显然,这是一 种错误,这种在拒绝H0 时犯下的错误,称为“I型 错误”或“弃真错误” 或“a错误” 。
Ⅰ和Ⅱ重合时
0.95
0.025
(一)双尾测验
假设检验时所考虑的概率为分布曲线左右两边概率之和时, 称双尾检验。 双尾检验在生物学中运用较多,如:一个新的饲料配方与旧 配方相比,有可能好些,也可能差些;一种新的养殖技术或鱼 药与旧的相比也是如此。
抽样分布
拒Baidu Nhomakorabea区
1-
拒绝区
/2
接受区
/2
临界值
H0
样本均数 临界值
双尾检验
• 又如有人试验两种不同方法养殖鲢鱼: 一种是只施肥不投饵料,另一种是既施 肥又投饵料。问这两种不同养鲢鱼方法 的鲜鱼亩产量有否显著性差异?显然, 研究者只考察两种养鲢鱼法鲜鱼亩产量 的差异,不问谁好谁歹。因此,应进行 0 。 两尾测验,选择备择假设HA:
假设检验的两类错误
H0正确
否定H0 错误()
H0 错误
推断正确(1-)
接受H0
推断正确(1-)
错误()
第一类错误(type I error),又称弃真错误或 错误;
第二类错误( type II error ) ,又称纳伪错误或 错误
结论
1、 两类错误既有联系又有区别
错误只在否定H0时发生
相关文档
最新文档