假设检验的原理和方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
双尾
检验
2
分位数
否定区
u 0.05=1.96 u 0.01=2.58
>
接受区
单尾 检验
分位数
否定区
u 0.05=1.64 u 0.01=2.33
查表时,单尾概率等于双尾概率乘以2
同一显著水平下,双尾检验的临界值大于单 尾检验的临界值。如α=0.05时,双尾 |U|=1.96,而单尾为U=1.64或U=-1.64 ;α= 0.01时,双尾|U|=2.58,而单尾为U=2.33或 U=-2.33 。
否定区
右尾检验
左尾检验
假设检验的步骤:
分
提
确 定
析出 显
题假 著
意
设
水 平
计
算作 检出
验
统推 计断
量
小结
第四章 统计推断 第一节 假设检验的原理与方法 • 一 概念 • 二、假设测验基本思想 • 三、假设检验的步骤(重点) • 四 、双尾检验与单尾检验 • 五、两类错误
作业
• P81 习题4.5,4.6
平均数的检验
参数检验
频率的检验
假
设
方差的检验
检
验
秩和检验
非参数检验
符号检验
二、假设测验基本思想
•采用逻辑上的反证法 •依据统计上的小概率原理
抽样分布
拒绝区
1-
拒绝区
/2
/2
接受区
H0 临界值
临界值
样本均数
小概率原理
概率很小的事件在一次抽样试验 中实际是几乎不可能发生的。
如果假设一些条件,并在假设的条件下能够准确地算 出事件A出现的概率α 为很小,则在假设条件下的n次独 立重复试验中,事件A将按预定的概率发生,而在一次试 验中则几乎不可能发生。
第一节
第四章 假设检验的原理与方法
第二节 样本平均数的假设检验
第三节 样本频率的假设检验
第四节 参数的区间估计与点估计
第五节 方差的同质性检验
一 概念 :
假设检验(hypothesis test)又称显著 性检验(significance test),就是根据总体 的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设, 然后由样本的实际原理,经过一定的计算, 作出在一定概率意义上应该接受的那种假 设的推断。
根据研究设计的类型和统计推断的目的选 择使用不同的检验方法。
例:
x
126 0
2
2
240
40
x
n
6
uu==xx-x-x
=
136-126 √40
= 1.581
P( u >1.581)=2×0.0571=0.1142
4、作出推断结论:是否接受假设
小 概
P> 可能正确
率
原
理 P< 可能错误
接受H0 否定HA 否定H0 接受HA
• 思考: P81 习题4.1,4.2,4.3
μ= 300
330 样本均值 ?
我们拒绝还是接受假设μ=300?
三、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者
进行治疗,治疗后化验测得其平均血红蛋白含量x
=136(mg/L)。
治疗前 0 =126
例:某地区的当地 小麦品种一般亩产 300kg,标准差 75kg。现有新品种 通过25个小区的试 验,获得其平均产 量为330kg/亩,新 品种与当地品种是 否有显著差异?
提出假设 计算假设正 确的概率
=0.05
统计决策
• 实例
抽样分布
这个值是我们应该得 到的样本均值?
H0 1.96 x
…如果这是总 体的真实均值
=0.05/0.01
• 实例
例:某地区的当地小麦品种一般亩 产300kg,标准差75kg。现有新品 种通过25个小区的试验,获得其平 均产量为330kg/亩,新品种与当地 品种是否有显著差异?
提出假设
我认为小麦 平均产量是 300kg
作出决策
接受或拒绝 假设
抽取随机样本 均值x=330kg
• 实例
两尾测验,选择备择假设HA: 0。
一般认为,两尾测验较为稳妥,对结果考虑的思路 较宽,故很常用。
P(-1.96x <x< +1.96x) =0.95 双尾检验
(two-sided test)
左尾 0.025
否定区-1.96x
0.95
0.025 右尾
0 接受区
+1.9否6定x 区
临界值: + ux
三 、双尾检验与单尾检验
• 无论什么样的情况,假设检验时,首先要作出无效假 设H0,且作出这个假设是要有依据的。 通常假设被比较的对象间没有差异,或现在的状 况与已知的或原来的状况相符合。
• 经测验,当H0被拒绝时,所接受的假设是与H0相对立 的备择假设HA。HA有如下三种情况可供选择: HA: 0 ; HA : 0 ;即 HA : 0
18.83 = 1.64
8-1
35.2 - 34
t=
0.58
1.64 Sx =
8
= 2.069
= 0.58
高于当地良种?
df = 7 时 t 0.05= 1.895
|t | > t0.05,P < 0.05
否定 H0: 34 g,即新引进品种的千粒重显著比当地良种千粒重高。
四、两类错误
Ⅰ
Ⅱ
0
a虽然是一很小的概率值如0.01,但并不等于0,只
结论
1、 两类错误既有联系又有区别
错误只在否定H0时发生
错误只在接受H0时发生
错误增加 错误减小 错误增加 错误减小
结论
2、 还依赖于 - 0 的距离
3、n , 2 可使两类错误的概率都减小.
单尾检验: 否定区只在一侧
0.95 0.05 0.05 0.95
接受区 1.64
-1.64 接受区
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作。
统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验 也常取=0.05和=0.01两个显著水平 。
=0.05
P<
=0.01
显著水平* 极显著水平**
3 、选定检验方法,计算检验统计量,确定概率值
平均数的假设检验
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
H0:μ=μ0 =126(mg/L)
HA:μ≠μ0
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样, 二者来自同一总体,接受零假设则表示克矽平没有疗效。
而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数 和治疗前的平均数来自不同总体,即克矽平有疗效。
第四章
统计推断
(statistical inference)
第四章 统计推断
统
由一个样 本或一糸
计
列样本所
推
得的结果
断
来推断总
体的特征
假设检验 参数估计
统计推断的过程
Ⅳ
总体
总体均值、
方差
源自文库
Ⅲ
Ⅴ
样本
Ⅰ
样本统计量 例如:样本均值、
方差
Ⅱ
分析误差产生的原因
任务
确定差异的性质 排除误差干扰
对总体特征做出正确判断
2 =240
N ( 126,240 )
治疗后 n =6 x =136 未知 那么 =0 ? 即克矽平对治疗矽肺是否有效?
1 、提出假设
H0
无效假设
/零假设
对
/检验假设
0 =
立
备择假设
/对应假设
0
HA
误差 效应
处理 效应
例:克矽平治疗矽肺病是否能提高血红蛋白含量?
x-0=136-126=10(mg/L)这一差数 是由于治疗造成的,还是抽样误差所致。
的性质是把真实差异错判为非真实差异。犯这种类型的错误概率不会超过β。
假设检验的两类错误
否定H0 接受H0
H0正确 错误() 推断正确(1-)
H0 错误 推断正确(1-)
错误()
第一类错误(type I error),又称弃真错误或 错误; 第二类错误( type II error ) ,又称纳伪错误或 错误
例2:某春小麦良种的
单尾检验
千粒重0=34g,现自 H0: 34 ;对 HA: > 34
外地引入一高产品种,
= 0.05(单尾)
在8个小区种植,得千 粒重(g)35.6、37.6、
x =35.2 g
SS = 18.83
33.4、35.1、32.7、36.8、 S = 35.9、34.6,问新引入 品种的千粒重是否显著
(一)双尾测验
假设检验时所考虑的概率为分布曲线左右两边概率之和时, 称双尾检验。
双尾检验在生物学中运用较多,如:一个新的饲料配方与旧 配方相比,有可能好些,也可能差些;一种新的养殖技术或鱼 药与旧的相比也是如此。
抽样分布
拒绝区
1-
拒绝区
/2
/2
接受区
临界值 H0
临界值
样本均数
双尾检验
• 又如有人试验两种不同方法养殖鲢鱼: 一种是只施肥不投饵料,另一种是既施 肥又投饵料。问这两种不同养鲢鱼方法 的鲜鱼亩产量有否显著性差异?显然, 研究者只考察两种养鲢鱼法鲜鱼亩产量 的差异,不问谁好谁歹。因此,应进行
例:上例中
P=0.1142>0.05
所以接受H0,从而得出结论:使用克矽 平治疗前后血红蛋白含量未发现有显著 差异,其差值10应归于误差所致。
已知:
P( u >1.96) =0.05
P( u >2.58) =0.01
0.025 0.95
0.025
u >1.96 u >2.58
P( u ) <0.05 差异达显著水平 P( u ) <0.01 差异达极显著水平
“勉强可吃、可用的就是不能吃、不能用”。
抽样分布
拒绝区H0
0.05
H0
x
1.895
单尾检验
假设:
(one-sided test)
H0 : ≤0 HA : > 0
H0 : ≥0 HA : < 0
0.95 0.05 0.05 0.95
接受区 1.64
-1.64 接受区
否定区
右尾检验
左尾检验
2
否定区 接受区
错
是很小(a)而已。我们却完全否认这种可能性,
误
认为它不可能发生,从而拒绝H0 。显然,这是一
种错误,这种在拒绝H0 时犯下的错误,称为“I型
错误”或“弃真错误” 或“a错误” 。
Ⅰ和Ⅱ重合时
0.025
0.95 = 0
错误
Ⅰ和Ⅱ不重合
C1 Ⅰ
错
误
2
C2 Ⅱ
2
-u
0
u
从图可知,在a水平上,事件U<Ua,U 既位于H0分布之下,同时也位于HA的分 布之下。由于u属于H0 的分布的概率很大,为1-a,所以我们接受H0 ,但是,U 同时也有大小为β的概率来自于HA 分布,这时我们却完全否认这种可能性,显然 是一种错误。这种在接受H0 时犯下的错误,称为“Ⅱ型错误”或“β错误”或 “纳伪错误”(即无效假设H0是不正确的,我们却接受了它)。这种统计错误
+ 1.96x
P(-2.58x <x< +2.58x) =0.99
左尾 0.005
否定区-2.58x
0.99
0.005 右尾
0 接受区
+2.5否8定x 区
临界值: + 2.58x
双尾检验
(two-sided test)
(二)单尾测验
假设检验时所考虑的概率仅为分布曲线左边或右边一尾概率 之时,称单尾检验。 单尾检验一般用于安全检查,如生产安全、食品安全和卫生 防御等。