第五章+假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


)未知,但试验
2
的表面效应是可以计算的,借助数理统计
方法可以对试验误差作出估计。所以,可
从试验的表面效应与试验误差的权衡比较
中间接地推断处理效应是否存在,这就是
显著性检验的基本思想。
二、显著性检验的基本步骤
(一)首先对试验样本所在的总体作假设
这里假设 1 = 2 或 1 - 2=0,即假设老 品种和新品种的总体平均数相等,其意义是
例:设某地区的当地小麦品种一般产量为 300kg/mu,标准差为75kg(标准误为 15)。而现有某新品种通过25个小区的试 验,计得其样本平均数为330kg/mu,那 么新产品和老产品是否有差异? 1、计算概率: 假设 H0 :1 = 2 为正确的条件下。随机误 差小于30的概率为u=2,查表3得出P界于 0.04和0.05之间,即抽样误差的概率小于 5%。 2、计算接受区和否定区
因而否定原先所作的无效假设 H0 :
1 = 2,接受备择假设 H A :1



2

认为:试验的处理效应是存在的。当试验的
表面效应是试验误差的概率大于0.05时,
则说明 无效假设H0 :1 = 2 成立的可能性 大 ,不能被否定,因而也就不能接受备择
假设H A:1≠ 2。
三、双侧检验与单侧检验
这说明两个样本平均数之差( y1 - y2 )也包括了两部分:
一部分是两个总体平均数的差( - ),叫 做 试
验 的 处 理 效 应 (treatment effe1 ct)2 ;另一部分 是试验误差( - )。
1 2
也就是说样本平均数的差( y1 -y2 )包含 有试验误差,它只是试验的表面效应。因此,
H
。备择假设是在无效假
A
设被否定时准备接受的假设。
本例的备择假设是H
A
:1≠


2
1-
2≠0,
即假设老品种和新品种的总体平均数 与
1 不相2等或 与 1之差2 不等于零,亦即存在处 理效应,其意义是指试验的表面效应,除包
含试验误差外,还含有处理效应在内。
(二)在无效假设成立的前提下,构造合 适的统计量,并研究试验所得统计量的抽样 分布,计算无效假设正确的概率
自与H0 对应的抽样总体,但计算所得的统计量却落 入了否定域中,因而否定了H0,于是犯了Ⅰ型错误。
但犯这类错误的概率不会超过α 。
Ⅱ型错误发生的原因可以用图 4-16来说
明。图中左边曲线是 H0:1 2为真时,
( y1- y2)的分布密度曲线;
右边曲线是 H A:1 2为真时,(x1 - x2 )
值:y1 ,y2 ,,yn。于是样本平均数
y yi n ( i)/ n
说明样本平均数并非总体平均数,它还包含试验误 差的成分。
对于接受不同处理的两个样本来说,则有:
y1=
1+
1,
y2=

+
2

2
y1 y2 (1 2 ) (1 2 )
在上述显著性检验中,无效假设 H0:1 2
与备择假设 H A:1 2 。此时 ,备择假设中包
括了 1 2 或 1 2 两种可能。 这个
假设的目的在于判断有无差异, 而不考虑谁大谁 小。 如新品种和老品处两品种的产量,新品种可 能高于老品种, 也可能低于老品种。
此时,在α 水平上 否 定 域 为 ,U1 和U2 ,,对称地分配在 正态曲线的两侧尾
Ⅱ型错误概率 值的大小较难确切估计, 它
只有与特定的
H
结合起来才有意义。一般与
A
显著水平α、原总体的标准差σ、样本含量n,
以及相互比较的两样本所属总体平均数之差
- 等因素有关。在其它因素确定时,α值
越1小,2 值越大;反之,α值越大, 值越小;
样本含量及 - 越大、σ越小, 值 越小。


第二类错误是H0不成立,却接受了它,犯了 “纳伪”错误,也叫Ⅱ型错误。Ⅱ型错误,就是把
真实差异错判为非真实差异H A,:即1 2
为真,
却未能H0否:定1 2

我们是基于 “小概率事件实际不可能性原理”
来否定H0, 但在一次试验中 小概率事件 并不是绝
对不会发生的。如果我们抽得一个样本,它虽然来
论,其根本原因在于 试 验 误差(或抽
样误差)的不可避免性。
通过试验测定得到的每个观测值 yi ,既由 被测个体所属总体的特征决定,又受个体差 异和诸多无法控制的随机因素的影响。所以
观测值 xi由两部分组成,即
yi = + i
总体平均数 反映了总体特征,i 表示误
差。
若 样本含量 为n ,则 可 得 到 n 个 观 测
仅凭( - y)1 就y2 对总体平均数 、1 是否2 相同下结论是不可靠的。只有通过显著性检
验才能从( - y)1 中y2 提取结论。
对( y1- y2 )进行显著性检验就是要分析: 试验的表面效应( - )主要由处理效 应( - )引起的 ,还y1是y主2 要由试验误差 所造成1 。2
虽然处理效应(1 -
试验的表面效应:y1 - y2 =50mg/mu是试验 误差,处理无效,这种假设称为无效假设,
记作 H0 :1= 2或 1 2 0 。
无效假设是被检验的假设,通过检验可
能被接受,也可能被否定。提出H0 :1= 2或
1 - 2 =0的同时,相应地提出一对应假设,称
为备择假设,记作
双侧检验显著,单侧检验一定显著;但 单侧检验显著,双侧检验未必显著。
四、显著水平与两种类型的错误 在显著性检验中,否定或接受无效假设 的依据是“小概率事件实际不可能性原理”。 用来确定否定或接受无效假设的概率标准称 为 叫显著水平,记作α。在生物学研究中常 取α=0.05或α=0.01。
假设检验时选用的显著水平, 除α=0.05和 0.01 为常用外 ,也可选 α= 0.10 或 α=0.001 等等。到底选哪种显著水平, 应根据试验的要 求或试验结论的重要性而定。如果试验中难以控 制的因素较多 , 试验误差可能较大 ,则显著水 平可选低些 ,即α值取大些。反之 ,如试验耗 费较大 , 对精确度的要求较高, 不容许反复 , 或者试验结论的应用事关重大,则所选显著水平 应高些,即α值应该小些。显著水平α对假设检 验的结论是有直接影响的,所以它应在试验开始 前即确定下来。
部,每侧的概率为α/2,如图4-14所示。这 种利用两尾概率进行的检验叫 双侧检验 , 也叫双尾检验, U1、U2为双侧检验的临界 值。
但在有些情况下, 双侧检验不一定符
合实际情况。如采用某种新的配套技术措
施以期提高杀虫剂的杀虫效果,已知此种
配套技术的实施不会降低药效。此时,若
进行新技术与常规技术的比较试验,则无
对于一些试验条件不易控制, 试验误 差较大的试验,可将α值放宽到 0.1,甚至 放宽到0.25。
上一张 下一张 主 页 退 出
在提高显著水平,即减小α值时,为了减小犯 Ⅱ型错误的概率,可 适 当 增 大 样 本 含 量 。因
为 增 大 样 本 含 量 可 使 ( x1 x)2 分 布 的
第五章 统计假设测验
第一节 统计假设测验的基本原理 统计推断是根据样本和假定模型对总体作 出的以概率形式表述的推断,它主要包括假设 测验 ( test of hypothesis) 和参数估计 (parametric estimation)二个内容。
假 设 检 验 又叫 显著性 检验 (test of significance)。显著性检验的方法很多 ,
效假设应为H 0:1


,即假设新技术与
2
常规技术药效是相同的 ,备 择 假设应
为 H A:1 2 ,即新配套技术的实施使
药效有所提高。
检验的目的在于推断实施新技术是否提高了
药效,这时H0的否定域在正态曲线的右尾。
在α水平上否定域为 U2 ,, 右侧的概率为α,
如图4-15A所示。
研究在无效假设 一个区间。
:1 = 2 成立的前提下,划出
u=( y - μ )/ x
P
(μ-1.96


x
y<μ+1.96
)x =0.95
P (μ-2.58 x≤
y<μ+2.58
)=0.99
x
图5-1
(三)根据“小概率事件实际不可能性原 理”否定或接受无效假设
在统计学上 ,把小概率事件在一次试验 中看成是实际上不可能发生的事件,称为小概 率事件实际不可能原理。根据这一原理,当试 验的表面效应是试验误差的概率小于0.05时 , 可以认为在一次试验中试验表面效应是试验误 差实际上是不可能的,
因为显著性检验是根据 “小概率事件实 际不可能性原理”来否定或接受无效假设的, 所以不论是接受还是否定无效假设,都没有 100%的把握。也就是说,在检验无效假设 时可能犯两类错误。
第一类错误是真实情况为H0成立,却否定 了它,犯了“弃真”错误,也叫Ⅰ型错误。
Ⅰ型错误,就是把非真实差异错判为真实差
异,即 H0:1 2 为真 ,却接受 H A:1 2
对两个样本进行比较时 ,必须判断样本间差 异是抽样误差造成的,还是本质不同引起的。如 何区分两类性质的差异?怎样通过样本来推断总 体?这正是显著性检验要解决的问题。
两个总体间的差异如何比较?一种方法是研 究整个总体,即由总体中的所有个体数据计算出 总体参数进行比较。这种研究整个总体的方法是 很准确的,但常常是不可能进行的,因为总体往 往是无限总体 ,或者 是 包含个体很多的有限总 体。因此 ,不得不采用另一种方法 ,即研究
常用的有t 检验、F 检验和 2 检验等。尽管
这些检验方法的用途及使用条件不同,但其 检验的基本原理是相同的。其实质是在抽样 分布为已知的情况下,根据样本的信息来判 断总体是否具有某种指定的特征参数。
一、统计假设
某地区当地水稻良种的常年平均产量为 550kg/mu(总体),若一个新品种的多 点试验结果为600kg/mu,试问这一新品 种是否有应用价值?该品种的平均产量比当 地良种产量高600-550=50kg/mu。能否 仅凭这两个平均数的差值,立即得出结论呢? 统计学认为,这样得出的结论是不可靠的。 造成这种差异可能有两种原因,一是品种造 成的差异,另一可能是试验误差(或抽样误 差)。
样本,通过样本平均数研究其所代表的总体。
因此要以样本平均数 x 做为检验对象。
为什么以样本平均数作为检验对象呢? 这 是因为样本平均数具有下述特征:
1、离均差的平方和∑( yi - y)2最小。
说明样本平均数与样本各个观测值最接近,平 均数是资料的代表数。
2、样本平均数是总体平均数的无偏估计
值 ,即E( y )=μ。
的分布密度曲线( 1
>

),它们构成的抽
2
wk.baidu.com
样分布相叠加 。 有 时 我 们 从 1 2 0
抽样总体抽取一个( x1 - x2)恰恰在H 0 成立 时的接受域内(如图中横线阴影部分),这
样,实际是从 1 2 0 总体抽的样本,经
显著性检验却不能否定 H0 ,因而犯了Ⅱ型错
误。犯Ⅱ型错误的概率用 表示 。
若无效假设H0为1 2 , 备择假设 HA 为1 2,此时H0的否定域在正态曲线的左
尾。在α水平上,H0的否定域为,左侧的概率 为α。如图4-15B所示。
这种利用一尾概率进行的检验叫单侧检 验也叫单尾检验。此时α为单侧检验的临界值。 显然,单侧检验的α =双侧检验的2α 。
由上可以看出,若对同一资料进行双侧 检验也进行单侧检验 ,那么在 α水平上单侧 检验显著, 只相当于双侧检验在 2α水平上 显著。 所以,同一资料双侧检验与单侧检验 所得的结论不一定相同。
3、根据统计学中心极限定理,样本平均 数服从或逼近正态分布。
所以,以样本平均数作为检验对象, 由两个样本平均数差异的大小去推断样 本所属总体平均数是否相同是有其依据 的。
由上所述,一方面我们有依据由样
本平均数y1
和y 的差异来推断总体平均 2
数 1 、2 相同与否,另一方面又不能仅
据样本平均数表面上的差异直接作出结
1 2

由于 值的大小与α值的大小有关,所
以在选用检验的显著水平时应考虑到犯Ⅰ、 Ⅱ型错误所产生后果严重性的大小,还应 考虑到试验的难易及试验结果的重要程度。
若一个试验耗费大,可靠性要求高,不 允许反复,那么α值应取小些;
当一个试验结论的使用事关重大, 容 易产生严重后果,如药物的毒性试验,α值 亦应取小些。
相关文档
最新文档