第四章 统计推断(1)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四节 参数的区间估计与点估计
3
指根据于某种实际需要,对未知的或不完全 知道的统计总体提出一些假设;然后由样本的
假设检验
统
计
(显著性检验) 实际结果,经过一定的计算,作出在概率意义
上应当接受哪种假设的测验。
推
断
参数估计
参数估计是指由样本结果对总体参数作出点估 计 (point estimate) 或 者 区 间 估 计 (interval estimate)。
35
二、s 未知时平均数的显著性检验――t 检验 (t -test)
在s 未知时,平均数的显著性检验有两种解决方法。
关于假设检验的几个注意点
1. 对于H0只能说拒绝与不拒绝,而对H1只能说接受。
2. P≤α,则拒绝H0,接受H1,差异有统计学意义,(有足够的证据) 可认为„„不同或不等。
3. P>α,则不拒绝H0,差异无统计学意义(“阴性”结果),尚不能
认为„„不同或不等(或拒绝H0的证据尚不足)
4. 做 统 计 检 验 结 论 时 只 能 说 有 无 统 计 学 意 义 ( statistical significance),而不能说明专业上的差异大小。P值越小只能说明: 作出拒绝H0,接受H1的统计学证据越充分,推论时犯错误的机会越小, 与专业上|μ-μ0|差异的大小无直接关系。
右 尾 测 验
_
μ0
y
20
双尾检验与单尾检验的选择:应根据专业知识在
试验设计时就确定。
一般若事先不知道所比较的两个处理效果谁好谁
坏,分析的目的在于推断两个处理之间有无显著
差异,则选用双尾检验;
若根据理知识或实践经验判断甲处理的效果不会
比乙处理的效果差,分析的目的在于推断甲处理
是否真的比乙处理好,这时应用单尾检验。
33
例4-2 已知豌豆籽粒重量( 克/100) 服从正态分布N (37.72,0.332)。在改善栽培条件后,随机抽取 9 粒, 其重量平均数 Y=37.92,若标准差仍为0.33,问改善条 栽培件是否显著提高了豌豆籽粒重量?
解 根据检验的基本程序: 1 已知豌豆的重量是服从正态分布的随机变量,s已知。 2 假设: H0:μ=μ0 =37.72 HA:μ>μ0 =37.72
(二)假设检验的基本思想
根据抽样分布的规律,判断样本发生的概率 例4-1中就是看在2.00
0.20公斤/只的鸭子总体
中抽取100只鸭子,鸭子平均重量小于1.88公斤/
只得概率,如果概率小于α ,说明是小概率事件, 鸭子明显偏轻。
8
(三)假设检验的过程:
1、提出原假设和备择假设 2、确定适当的检验统计量 3、规定显著性水平 4、计算检验统计量的值 5、作出统计决策
如果实验中难以控制的因素很多,试验精度不是很高,
则显著性水平α的值可稍大点;
如果实验的精度很高,真实差异不容易被误差所掩盖, 处理的作用容易被检验出来,这时显著性水平α可适当 取小些。
无论如何,显著性水平α的值必须在实验开始前就已经 确定下来。
14
(四) 计算检验统计量的值,建立拒绝域
u yμ 0 1.88 2.00 0.12 6 σ 0.2 0.02 100 n
30
2. 零假设
H0:m=m0。
备择假设可有以下三种情况:
(1)HA:μ>μ0 ,若已知μ不可能小于μ0 。 (2)HA:μ<μ0 ,若已知μ不可能大于μ0 。 (3)HA:μ≠μ0 ,包括μ>μ0 和μ<μ0
( 2)
(1)
u
u
(3)
u / 2
u / 2
31
3. 在=0.05水平上,拒绝H0称为“差异显著”。
24
假设检验结果 客观实际
H0正确 H0不正确 否定H0 接受H0
I型错误(α) 推断正确(1-β )
推断正确(1-α) II型错误(β )
25
两类错误的要点: 1、在样本容量n固定的条件下,提高显著水平α
的值,将增大
犯β 错误的概率。
2、在n和显著水平α
相同的条件下,真总体平均数μ 和假设平
0
显著水平:α =0.05
计算统计量: u x μ 0 1.88 2.00 0.12 6
σ n 0.2 100 0.02
建立拒绝域:u<-U0.05; -U0.05=-1.645 ;
结论:养鸭户送来的鸭子重量非常明显的小于2.00公斤/只, 16 不符合要求
三、变异性的显著性检验――2 检验(2- test)
29
一、在 s 已知的情况下,单个平均数的显著性 检验—— u 检验(u- test)
已知的总体平均数一般 为一些公认的理论数值 。如畜禽正常 的生理指标、怀孕期、 生产性能指标等,都可 以样本平均数 与之比较,检验差异显 著性。
检验的基本程序如下: 1. 假设从s已知的正态总体,或近似正态总体中, 随机抽取含量为的 n 样本。
在=0.01水平上,拒绝H0称为“差异极其显著”。
4. 检验的统计量:
u
x m0
s
n
32
5. 相应于2 中个备择假设的H0的拒绝域分别为:
(1)u>u (2)u<-u (3)│u│>u /2 ,或表示为│u│>u (双侧) 正态分布的分位数,可以从附表中查出。 6. 根据以上所做的分析,得出结论,并给予生物学解释。
5.应事先确定α 。选α =0.05只是一种习惯,而不是绝对的标准。
17
三、双尾检验与单尾检验
(一)假设的形式(以方差已知,单个样本的平均 数显著性检验为例)
拒绝区域是检验统计量取值的小概率区域,我们可以将这个小概率区 域安排在检验统计量分布的两端,也可以安排在分布的一侧,分别称 作双尾检验(two-tailed test)与单尾检验(one-tailed test)。
9
假设检验在统计方法中的地位
统计方法
描述统计 推断统计 假设检验 参数估计
10
二、假设检验的步骤
( 一 ) 对 试 验 样 本 所 在 的 总 体 提 出 原 假 设 ( null hypothesis)和备择假设(alternative hypothesis ):
H0:μ=2.00公斤/只, 即送来的鸭子符合要求。 H1 :μ≠μ0(或μ>2.00公斤/只或μ<2.00公斤/只)即送来的鸭子不符 合要求,偏轻
假设的形式 假设 H0 H1 研究的问题
双尾检验
m = m0 m ≠m0
左尾检验
m m0 m < m0
右尾检验
m m0 m > m0
18
两尾测验示意图
否定区域 0.025
否定区域
0.025
接受区域
0.95
19
左 尾 测 验
否定区 0.95
α=0.05
接受区
μ0
否定区
_
y
接受区
0.95
α=0.05
关于备择假设的说明:由于改善栽培条件,只会 使籽粒重量提高,不会使籽粒重量降低,因此备择假设HA 为μ>μ0 。
34
3 显著性水平:根据实验要求(籽粒重量是否有“显著” 提高)规定α=0.05。
4 统计量的值:由于s 已知可使用u 检验,
u=(x-μ0 )/(s/√n)代入数值,得:
21
单尾检验比双尾检验的辨别力强,灵敏度高
(同一显著性水平,双尾检验的分位数大于 单尾检验的分位数),但若无判断的依据, 不可随意将双尾检验改为单尾检验。
作单尾检验,查附表2或3时,需要将双尾概 率乘以2再进行查表
22
四、统计假设的两类错误
统计假设测验是根据一定的概率标准对总体特征作出
推断。否定了H0,并不等于已证明H0不真实;接受了H0, 也不等于已证明H0是真实的。
犯错误的概率,被称为抽样分布的拒绝域,1-α称为置信水平,表示接
受原假设的可信度或可靠程度,被称为抽样分布的接受域。
3、α值大小的确定:常用的α=0.01、0.05由研究者事先确定。当α取
0.05时,表明作出接受原假设的决定时,其正确的可能性(概率)为
95%。
13
注意:假设检验选用的显著性水平应根据实验的要求而 定。
均数μ
0
相差愈大,则犯第二类错误的概率β 愈小。
3、为了降低犯两类错误的概率,需要采用一个较低的显著水平,
如α =0.05;同时适当增加样本容量,或适当减小总体方差,或 两者兼有之。
4、如果显著水平α
已经确定,则改进试验技术和增加样本容量,
26
可以有效地降低犯第二类错误的概率。
错误和 错误的关系
型错误就会增大;反之II型错误减小,I型错误就会增大。比 如,将显著性水平α从0.05提高到0.01,就更容易接受H0, 因此犯I型错误的概率就减小,但相应地增加了犯II型错误的 28 概率。
第二节 单个样本的统计假设检验
一、σ已知时单个平均数的显著性检验—— u 检验 (u- test)
二、 s 未知时平均数的显著性检验――t 检验(t test)
-U0.05=-1.645 >-6
(五)判断分Fra Baidu bibliotek,作出统计决策即作出接受或拒
绝原假设的结论
说明原假设发生的概率小于0.05,属于小概率事件,按照 烤鸭店的要求,养鸭户送来的鸭子不符合要求,拒绝原 假设,接受备择假设
15
例4-1解
已知“全聚德”鸭子重量符合正态分布的随机变量: x μ0=2.00公斤/只;σ =0.2公斤/只,样本的平均值 =1.88 公斤/只,n=100 假设: H0:μ =μ 0, HA :μ <μ
和的关系就 像翘翘板, 小就大, 大 就小 你不能同时减 少两类错误!
27
如何降低两类错误的概率?
一般通过增加样本含量n,获得更多的关于总体的信息,
从而降低推断中可能出现的错误的概率。
两类错误之间的关系如何?
二者的区别是I型错误只有在否定H0的情况下发生,而II型 错误只有在接受H0时才会发生。 二者的联系是,在样本容量相同的情况下,I型错误减小,II
第四章 统计推断
1
学习要求:
掌握:样本平均数和频率的u检验及t检验的
方法和适用范围;区间估计的原理和方法。
熟悉:不同条件下使用的统计量,方差的同 质性检验方法。
了解:假设检验的原理和方法。
2
讲授内容
第一节 假设检验的原理和方法 第二节 单个样本的统计假设检验 第三节 两个样本差异显著性检验
u=1.82 5 建立H0的拒绝域:因HA:μ>μ0 ,故为单侧检验,当 u>u0.05时拒绝H0。α=0.05时u0.05=1.645。 6 结论:因为u>u0.05 ,所以结论是拒绝H0,接受HA。
上述样本很可能不是抽自N(37.72,0.332)的总体,抽 出样本的那个总体的平均数是大于37.72的某个值,即栽 培条件的改善显著地提高了豌豆籽粒重量。
2、特点:假设检验所采用的逻辑推理方法是反证法;
结论的合理性依据统计学上的小概率原理。
6
例4-1
“全聚德”是北京烤鸭的杰出代表,要求鸭子的 重量2.00
0.20公斤/只(µ σ)。养鸭户送来鸭
子100只,平均每只重1.88公斤。养鸭户送来的
鸭子样本是否比“全聚德”对鸭子总体要求偏轻?
7
如果H0是真的,我们通过测验却否定了它,就犯了
一个否定真实假设的错误。这叫第一类错误(first kind
error)或I型错误。由于规定了显著水平α值,就注定要
犯错误,故I型错误又称为α错误。
23
如果H0是错误的,我们通过测验没有发
现其不真实而接受了它,即犯了一个接受
不 真 实 的 H0 的 错 误 。 这 叫 第 二 类 错 误 (second kind error)或II型错误。由于犯 这类错误的概率通常用β表示,故又称其 为β错误。
4
第一节 假设检验的原理和方法
一、假设检验的概念
二、假设检验的步骤
三、两尾检验与单侧检验 四、统计假设的两类错误
5
一、假设检验的概念
(一)什么是假设检验?
1、概念:又称为显著性检验(test of significance),
事先对总体参数(平均值、方差等)或分布形式作出某
种假设,然后利用样本信息来判断原假设是否成立。
11
(二)确定适当的检验统计量
大样本还是小样本? 总体方差已知还是未知?
选择正确的检验统计量,计算结果
12
(三)规定显著性水平α
1、小概率事件原理
(1)小概率事件:统计学上指在一次试验中,一个几乎不可能发生的事 件发生的概率,称为小概率事件实际不可能原理。
(2)在一次试验中小概率事件一旦发生,原假设就是错误的。 2、小概率值α的概念及统计学意义: α表示原假设为真时,拒绝原假设