第五章统计估计和假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章统计估计和假设检验
统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。

统计推断包括两大部分:一是统计估计,二是假设检验。

统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。

参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。

假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。

假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验;另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。

非参数检验将在第六章进行讨论,本章着重讨论参数检验。

第一节点估计
一、点估计的极大似然法

一个未知的常数。

我们根据抽样样本的观察值构
造一个统计量
x x
n
2
,,,
)来估计总体参数。

由于抽样的随机性,
这样做必然会有误差产生。

这种误差就称为抽样误差。

极大似然法是一种对参数点估计的重要方法之一。

我们先用一个例子说明其原理。

例5-1。

设有一批产品,质量上分为正品与次品。

产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。

现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?
记A =“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。

63
64
A 发生的概率为:
,则P(A)=()0914.×0.1=0.0229
,则P(A)=()0614.
×0.4=0.0003
现在事件A 既然在一次观察中就发生了,直观地我们可以认为事件A 发生的概率P(A)不会小,故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。

由于0.0229>0.0003,故应选择0.1作为产品的次品率比选择0.4更可靠些。

把上例推广到一般的情形,我们就可以得到极大似然法的一般原理。

设n
x x x ,,, 是取
的总体的一组样本。

其中:x A =“一次观察中,所得一组样
本的样本值为(n 21 )”。

现在在一次观察中A 发生了,即P(A)应尽可能地大,即应在θ所有可能取值的集合中选出一个使P(A)
65
的估计值。

由于n x x x ,,,21 相互独立,且都与X 具有相同的分布,由此可以得到,
件:X x X x X x n n 1122===,,, 同时发生的概率,也就是记为
L(θ)称为θ
的最大值问题,根据微分学的结果,L(θ)
θ)取得极大值的θ
f(1, θ)=θ,f(0,θ)=1-θ,于是得到似然函数:
()()θθθ⋅-=∏=141511,i i x f
66

()θθd dL =0,舍去θˆ=1,得θ的最大似然估计值15
1ˆ=θ=0.067。

实际上,151ˆ=θ正是在15次抽样中得到一次次品的频率,用频率估计概率,当n 充分大时无疑是合理的。

例5-2。

从一个正态总体中抽取容量为n 的样本,求总体参数μσ及2的极大似然估计。

()⎥⎦⎤⎢⎣⎡--⋅⎪⎪⎭⎫ ⎝⎛⋅=∑2221e xp 21μσσ
πi x ()∑--⋅--=2221ln 2ln 2ln μσσπi
x n n L
,ˆx =μ )
222ˆn i S x x n =-=∑σ
67 二、估计量好坏的评选标准
前面讨论了如何利用极大似然法来求参数的估计量。

但对于同一个参数可以用不同的方法来求其估计量,于是,在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。

那么,什么样的估计量是好的估计量呢。

这就有一个如何对估计进行评价的问题。

请看下面一个例子。

例5-3。

假如某一建设单位购进了一批建筑用的线材,就需要了解这批线材的平均抗拉强度是多少。

现在要通过抽样,选择样本的某个函数(统计量)来推断总体指标值。

由于随机原因,每次抽取样本的测量结果是不同的。

如果样本容量为3,抽取4组样本,测得结果如表5-1所示。

为了说明的方便起见,我们假定,实际上μ=1000公斤,当然这在事先是不知道的。

我们要求利用样本信息来推断总体指标,并使其误差最小。

第一组样本的中位数最接近总体指标,第二组样本是最小值最接近总体指标,第三组样本是最大值最接近总体指标,第四组样本是均值刚好等于总体指标。

于是就产生了一个问题,在大量的实验中,究竟采用哪一个指标来推断总体指标更合理呢?
评价点估计的结果通常有无偏性、有效性和一致性等标准。

1. 无偏性
无偏性的含义是个别样本由于随机原因可能偏大或偏小,然而一个好的估计量从平均上看应该等于所估计的那个指标,其直观意义是估计量的值应在参数的真值周围摆动而无系统地,无偏性的定义为:设θ为被估计参数,若有估计量
n x x x ,,,21 ),对一切n ,有()
θˆE =θ,则称θˆ为θ的无偏估计量。

若θˆE -θ=b ,则称b 为估计量θˆ的偏差。

若b ≠0,则称θˆ为θ的有偏估计量。

如果0=∞
→n b lin ,则称θ
ˆ为θ的渐近无偏估计量。

不论是重复抽样或不重复抽样,也不论样本容量大小,样本均值及样本比例都是总体均
值和总体比例的无偏估计,即()()
P P E X E ==ˆ,μ,但样本方差2n
S 并不是总体方差2σ的无偏估计量。

这是因为如果我们把2n S 定义为
68
2n S =()∑-21x x n
i ,则: ()()()()[
]{}∑∑---=⎥⎦⎤⎢⎣⎡-==212211μμx x E n x x n E S E i n i i n ()()()()⎭
⎬⎫⎩⎨⎧-+----∑∑n i i x n x x x E n 12221μμμμ ()()(){}
222222221121σσσσσμμμn n n n n n n x nE x nE x E n i -=-=⎭⎬⎫⎩⎨⎧⎪⎪⎭⎫ ⎝⎛-=-+---∑ 产生偏差的原因是总体方差的无偏估计应该是()n x i ∑-=2
2μσ,但抽样时由于μ是未
知的,因而用估计量x 来代替。

根据最小平方原理,变量X 距样本均值x 的离差平方和为最小,因此()2∑-x x i 就小于()2
∑-μi x ,从而用x 代替μ计算的方差就低估了σ2,为了得到σ2
的无偏估计,令
()S n x x i 2211=--∑
这时,由于()E S 22=σ,()S n x x i 2211=--∑就是σ2的无偏估计了。

2
n S
但当n 很大时σ2
0n →,所
以它是渐近无偏差估计。

当样本容量很大时,也可以直接用样本方差作为总体方差的估计值。

但如样本容量较小时偏差就比较大了。

图5-1 估计的无偏性和有效性
2. 有效性
即使是符合无偏性要求的估计统计量,在抽取个别样本时也会产生误差。

为了使误差尽量地小,要求估计量围绕其真值的变动愈小愈好,也就是说要求统计量的离散程度要小,或
有效性反映了估计量分布的集中程度,估计量的分布越是集中在参数
5-1
示各自的方差,若比例如,对正态总体,利用样本均值x及样本中位数M来估计总体的均值时,均为无偏估计,
那末哪一个更有效呢?
均值的抽样分布为x~,
N
n
μ
σ2




⎪,统计上可以证明中位数的分布为
69
70
M N n c ~,μπσ22⎛⎝ ⎫⎭⎪,
即用样本均值x 来估计总体的均值比用中位数来估计总体的均值效率高。

换句话说,用中位数来估计总体均值的平均误差要比用样本均值来估计总体均值时的更大。

如果用中位数作为估计量要达到与以样本均值作为估计量同样可靠的程度,就要增加样本。

设用均值估计的样本为n 1,中位数估计的样本为n 2,设其估计效率相等,即方差相等,则σπσ21222n n =,由此得到n 2=1.57n 1,即用中位数估计时要比用样本均值来估计时多抽57%的样本单位。

3. 一致性
这就是要使统计量随样本容量n
N (
n x x x ,,,21 )为

71
时才起作用。

另外,符合一致性的统计量也不止一个,因此,仅考虑一致性是不够的。

事实上,我们也可以证明,当总体为正态分布时,中位数这一统计量也符合一致性的要求。

而样本的最小值和最大值尽管在个别的抽样中可能取得好的效果,但从总体上来看并不是一个好的估计量。

第二节 区间估计
一、区间估计的概念和步骤 点估计用一个确定的值去估计未知的参数,具有较大的风险。

因为估计量来自于一个随机抽取的样本,结果也就带有随机性。

样本估计量刚好等于所估计的总体参数的可能性极小。

但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。

这种方法就是区间估计法。

在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧x σ±范围内的概率是0.683,落在总体均值±2σx
范围内的概率是0.955,落在总体均值3±σx
范围内的概率是0.997等等。

由此可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。

我们把这种对总体均值的估计称作区间估计。

从上述说明可以看到:
1. 如果所估计的区间越大,参数被包含在该区间内的概率就越大。

2.
一般地,
72
对于给定的
0<1-α,
为置信度是1-α 常用的置信度有 0.80,0.90,0.95 0.99等。

一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。

置信度反过来也表示可能犯错误的概率。

如置信度为95%,则犯错误的概率就为1-95%=5%。

这一概率也就是置信度水平α,也可理解为风险率或风险水平。

图5-2 根据不同样本所得到的置信度为
1-α
73
样的结果计算出来的,因此,
是一个随机区间。

即每一个样本都可产生一个
,因此,上述概率1-α可以理解为随机区间中包
95.5%的置信区间与总体均值的位置关系。

从所有样本得到的置信区间中有95.5%的区间将包括总体均值,因此可以说所得到的估计区间包括总体均值具有95.5%的置信度。

二、单个总体参数的区间估计
(一)正态总体,方差已知,总体均值的区间估计
根据第四章关于样本均值分布的结果,有
x n

σ~N(0,1)
1-
α时,我们有
我们可以根据这一原理用样本均值来推断总体均值的区间估计值。

若样本的均值为x ,同时若规定置信度为1-α,则总体均值的区间估计的公式是
5-3来表示。

上述估计公式仅适用于无限总体的情形,对于有限总体的不放回抽样来说,如果总体规模为N ,样本大小为n ,则区间估计的公式中还需要乘上一个修正系数1
--N n
N 。

因此,总体均值的区间估计的公式就变为
74
ασ
μσ
αα-=⎪⎪⎭


⎛--⋅+<<--⋅
-1112/2/N n N n
Z x N n N n Z x P
图5-3 置信度为1-α的置信区间
从上述说明中我们可以总结出对于正态总体,方差已知,总体均值的区间估计的步骤如下:
1. 计算出样本的统计量并确定该统计量的抽样分布。

例如,若总体是正态的,那么样本均值也必然服从正态分布。

2. 根据研究的目的确定置信度或置信度水平α大小。

按照要求的置信度或置信度水平α查出相应的系数2/αZ 。

3. 计算样本均方差,即抽样的标准误σ
σ
x
n
=。

4. 最后把上述数据代入公式,得到区间估计的结果。

其实,这些步骤也同样适用于其他类型的区间估计问题。

(二)非正态总体,方差未知,大样本,总体均值的区间估计
实际中所遇到的总体,往往不一定服从正态分布,而且总体方差也是未知的。

在这种情况下要推断总体均值,就要借助于中心极限定理,这需要抽取足够大的样本。

这样样本均值仍服从正态分布。

此时尽管总体方差未知,但当样本足够大时,一般当30>n 时,我们可用样本标准差来代替总体标准差,直接把S 代入上式中的σ就可以了。

(三)正态总体、方差未知,用小样本对总体均值的区间估计
30≤n 就必须采用其他的估计办法。

我们已
t 分布,其自由度为n-1。

因此我们就可以利用t 分布来进行估计。

此时
αμα-=⎪⎪⎭

⎝⎛⋅
≤-12/n s t x P 与前面同样地,上述估计公式仅适用于无限总体的情形,对于有限总体来说,如果总体
规模为N ,样本大小为n ,不放回抽样的情形,则区间估计公式中也还需要乘上一个修正系数
α
μαα-=⎪⎪⎭⎫ ⎝
⎛+≤≤-12/2/n s t x n s t x P
75
1
--N n
N 。

(四)总体比例的区间估计
根据第四章关于样本比例p 分布的结果,我们有
()⎪⎭


⎛n P P P N p -1,
~ 若样本的比例为p ,同时规定估计的置信度为1-α,则总体比例的区间估计的公式就是
()ααα-=⎪⎪⎭


⎛-⋅+<<-⋅
-11)1(2/2/n P P Z p P n P P Z p P 这里有一个问题,就是在确定总体比例的置信区间时要用到P 本身,而P 又恰恰是待估
值。

但由点估计理论我们知道,样本比例p 是总体比例P 的无偏估计,于是在估计样本比例的方差
()n
P P -1时,直接用样本比例p 代替总体比例P 。

只要样本容量n 足够大,并且满足np 和()n p 1-都大于5就可以保证结果是可靠的。

最后,得到总体比例的置信区间为:
()ααα-=⎪⎪⎭


⎛-⋅+<<-⋅
-11)
1(2/2/n p p Z p P n
p p Z p P 当然对于有限总体不放回抽样的情形,也同样需要乘上一个修正系数1
--N n
N 。

(五)正态总体方差的区间估计
在第四章关于χ2
分布的结果中我们介绍过,来自正态总体的一组样本的方差和总体方差之比服从于χ2
分布,即
()n S -12
2
σ
~()χ
2
1n -
于是对于给定的置信度1-α,我们可以利用χ2
分布的特性,查表得到()χα/22
1n -和
()χα1221--/n ,则有
()()()αχσχαα-=⎥⎦
⎤⎢
⎡-≤-≤--11112
2/2
222/1n S n n P
于是总体方差的区间估计为
()()()()n S n n S n ----⎡⎣⎢⎤

⎥-11112222122χχαα//,
76
三、两个总体参数的区间估计
(一)两总体均值之差的区间估计 1. 两个正态总体,方差已知,大样本
从两个总体中所抽取的样本都是大样本,并且两个总体的方差已知时,则两个样本均值之差也服从正态分布。

此时 ()2121μμ-=-x x E ,
σ
σσx x n n 12
21
21
2
22
-=
+
因此,()
⎪⎪⎭⎫ ⎝
⎛+⋅--22
2
1212121,~n n N x x σσμμ。

由此可以得到,在置信度水平为1-α的情况下,μμ12-的置信区间为
()()x x Z n n x x Z n n 122121222122121222--+-++
⎡⎣⎢⎢⎤

⎥⎥αασσσσ//, 2. 两正态总体,方差未知,但相等,大样本
两个样本都为大样本时,两样本均值之差也服从正态分布,由于假设两总体方差相等,
但未知,需要根据样本方差进行估计。

由于样本方差具有随机性,一般地S S 1222
≠,因此,合并推算总体方差
σ合
2=n s n s n n 11222
2
12
++,
所以,两个样本均值之差的抽样分布的方差为
σσ合

21
22
1211222
212122221
11n n n n n s n s n n s n s n +
=+⎛⎝ ⎫⎭⎪++⎛⎝ ⎫⎭⎪=
+, 于是,对两总体均值之差估计的置信区间为
()()
⎥⎥⎦

⎢⎢⎣⎡+⋅+-+⋅--2211222/212211222/21,n s n s Z X X n s n s Z X X αα。

3. 两正态总体,方差未知但相等,小样本
根据上一章的结果,总体方差未知时,我们用样本的方差代替总体的方差,由于小样本,
相应的统计量不再服从正态分布而服从t 分布。

由于σσ12
22=,则如大样本时一样,应将两个样本合并起来代替总体方差。

即 ()()S
n S n S n n 合
2
112222
12112
=
-+-+-
其自由度为n n 122+-,则两总体差的区间估计结果为
()()
⎥⎥⎦
⎤⎢⎢⎣⎡+
⋅+-+⋅--22122/2122122/21,n s n s t x x n s n s t x x 合
合合合αα。

77
()
()
⎥⎦
⎤⎢⎣
⎡+⋅+-+⋅--212/21212/2111,11n n s t x x n n s t x x 合合
αα (二)两总体比例之差的区间估计
根据两个样本比例之差的抽样分布,两个样本比例之差的均值为两个总体比例之差。

两个样本比例之差的方差为 σp p p q n p q n 122
11122
2
-=
+
当两个比例的样本容量为大样本时,两个比例之差也服从正态分布,所以当置信度为
1-α时,两总体比例之差21P P -的置信区间为: ()()⎥⎥⎦

⎢⎢⎣
⎡+⋅±-+⋅
±-2
2
21112/2122
21112/21,n q p n q p Z p p n q p n q p Z p p αα (三)两正态总体方差比的区间估计
F 分布表查得置信区间的临界值:
从而()()ααα
-=⎪⎭
⎫ ⎝⎛--<<---11,11,12122121n n F F n n F P
于是()()ασσαα-=⎥
⎥⎦
⎤⎢⎢⎣⎡--⋅<<--⋅
-11,111,112121222
122212122221n n F S S n n F S S P
78
()()⎥
⎥⎦
⎤⎢⎢⎣⎡--⋅--⋅
-1,11,1,112121222
12122221n n F S S n n F S S αα 第三节 样本容量的确定
在区间估计中我们发现,对于某一个总体的参数进行估计时,在样本数目一定的条件下,
要提高估计结果的可靠性,就需要扩大置信区间,这就要增加估计中的误差,减少了估计的实际意义。

如果要减少估计的误差,就要缩短置信区间,但这样就必须要降低估计的可靠性。

可见在样本数目一定的条件下,估计的精确性和估计的可靠性不能两全其美。

既要提高估计的精确性,减少误差,又要提高估计可靠性的办法就是增加样本容量。

但是增加样本就要同时增加抽样调查的成本,同时又可能延误时间。

因此就需要研究能够满足对估计的可靠性和精确性要求的最小样本数问题。

一、均值估计问题中,样本大小的决定
1.
要规定允许的估计误差的大小,即允许的估计值与实际值之间的最大偏离值是多少,
2.
规定置信度,即估计所要求达到的可靠性,也就是实际的抽样误差不超过所规定的误
3. 要明确总体的标准差,即要求了解总体的分布情况。

总体的标准差小,只要抽较少的样本就能满足对估计精确度和可靠性的要求,若总体标准差大,就必须抽取较多的样本才能达到对估计精确度和可靠性的要求。

设总体标准差为σ,样本均值的标准差为x σ。

估计的置信度为1-α,于是可以相应地
79
我们用Δ表示,于是根据
上式有 n
Z σ
α⋅
≤∆2/
则 2
2
2
2/∆
⋅≥σαZ n
Δ和总体的标准差σ,由置信度1-α查表得到相应的
代入公式,求得满足要求的最小整数就是满足估计误差不大于Δ和置信度为
上述公式适用于重复抽样或无限总体不放回抽样时的情形。

但对于有限总体不放回抽样的情形,公式变为如下的形式: 1
2/--⋅

≥∆N n
N
n
Z σ
α
α查表得到的置信系数。

二、比例估计问题中,样本大小的决定
关于总体比例的估计问题中,要决定样本大小首先也要明确关于均值的估计问题中同样
80
1.
允许误差的大小,即规定估计值与实际值的最大偏离值。

2. 3.
第四节 假设检验
一、假设检验的基本原理
假设总体的均值为某一个值,为了检验这一假设的正确性,我们收集样本的数据,计算出假设值与样本均值之间的差异,然后根据差异的大小来判断所作假设的正确性,这就是假设检验。

直观地,我们知道差异越小,对于总体均值的假设正确的可能性就愈大。

差异越大,对总体均值的假设正确的可能性就愈小。

然而在多数情况下,对总体参数的假设值与样本统计量之间的差异既不至于大到显而易见,应该拒绝假设,也不至于小到可以完全肯定,应该接受假设的程度。

于是就不能简单地决定接受或拒绝所作的假设,而需要判断所作的假设在多大的程度上是正确的。

于是就需要研究假设和判断假设是否正确的程度。

(一)假设检验中的假设
假设检验中通常把所要检验的假设称作原假设或零假设,记作H 0。

例如要检验总体均值μ=100这个假设是否正确,就表示为H 0:μ=100。

如果样本所提供的信息无法证明原假设成立,则我们就拒绝原假设。

此时,我们只能接受另外备选的假设了,称之为备择假设,我们以H 1表示备择假设。

备择假设可以有三种形式,例如,在原假设H 0:μ=100的条件下,备择假设可以是:
H 1:μ。

这表示备择假设是总体的均值不等于100。

或者是 H 1:μ100。

或者是 H 1:μ<100。

这表示备择假设是总体的均值小于100。

上述备择假设的选择与检验的要求是密切相关的。

我们根据假设检验的目的要求不同又把假设检验分为双侧检验和单侧检验。

如果样本均值高于或低于假设的总体均值很显著时都拒绝原假设,我们称作双侧检验。

在双侧检验时有左右两个拒绝区域。

当原假设是:H0:μ=100,备择假设是:H1:
μ
时就必须使用双侧检验。

单侧检验。

单侧检验只有一个拒绝区域。

若假设检验只有在样本均值高于假设的总体均值很显著时才拒绝原假设,这种假设检验称作右侧检验。

此时,原假设实际上变为H0:μ≤100,备择假设为H1:μ>100。

反之,如果只有在样本均值低于假设的总体均值很显著时才拒绝原假设,则称作左侧检验。

此时,原假设实际上变为H0:μ≥100,备择假设为H1:μ<100。

由此可见,原假设和备择假设总是排他性的。

(二)检验的显著性水平
假设检验需要确定一个是接受还是拒绝原假设的标准,这个标准就是显著性水平。

所谓检验的显著性水平α就表示,在假设正确的条件下落在某个界限以外的样本均值所占的百分比。

具体地说,“在5%的显著性水平下检验假设”就是说,假定对总体参数所作的假设正确,那么样本均值同假设的总体均值差异过大的,在每100个样本中不应超过5个。

如果样本均值与总体均值差异过大的超过这一数目就认为这个样本不可能抽自所假设的总体,所以拒绝零假设。

我们可以用图5-4
α=5%,我们95%,两边每
一个尾端的面积各为2.5%
假设的总体参数的差异是不显著的。

结果就接受原假设。

若样本统计量落在左右尾端的各为2.5%的区域内,则差异就是显著的。

我们就拒绝原假设。

接受备择假设。

图5-4 假设检验的接受区域和拒绝区域
不过应该强调指出,在假设检验中“接受原假设”的意思仅仅是意味着没有充分的统计证据拒绝原假设。

在假设检验中“接受原假设”的特定含义就是不拒绝原假设。

但实际上,
81
82
即使样本统计量落在95%
参数的真实值。

或范围。

则就称这一区域为
接受区域。

我们就称这一区域为拒绝区域。

对于显著性水平的选择没有一个唯一的或通用的标准。

实际上在任何显著性水平下检验某个假设都是可能的,但是必须注意不管选择什么样的显著性水平,都存在假设为真而被拒绝的可能性。

另一方面,在检验同一个假设时,使用的显著性水平愈高,原假设为真时而被拒绝的概率也就愈高。

这就需要研究假设检验中的错误,我们在以后将对此进行讨论。

二、假设检验的步骤
1. 提出原假设H 0和备择假设H 1。

原假设和备择假设必须由题意来决定。

在一般情况下
接受备择假设的错误
3. 确定样本的统计量和分布。

样本统计量又称检验统计量。

不同的统计量具有不同的分布,用于检验不同的假设,要根据所检验的假设来正确地选择检验统计量。

4. 计算检验统计量并由此作出决策。

根据样本数据计算出检验统计量的值,如果统计量的值落在拒绝区(包括临界点)内就说明原假设与样本所反映的情形有显著的差异,应该拒绝原假设。

如果统计量的值落在接受区域内,就说明原假设与样本所反映的情形的差异并不显著,应该接受原假设。

三、几种常用的假设检验
(一)平均数的假设检验
1. 双侧检验
让我们研究下面的例子。

例5-4。

某食品厂规定某种罐头每罐的标准重量是500克。

多年的经验表明这个厂每罐重
克。

今随机抽取了49个罐头,发现这些罐头的平均重量是506克。

问在
的显著性水平下能否认为这批罐头的重量符合标准的要求?
之间是否具有明显的差别。

因此可以列出要检验的假设为:
H

H
1
:μ。

⎪⎪




+

-
n
Z
n
Z
σ
μ
σ
μ
α
α2/
2/
,

2/
α
Z=1.96。

由此得到接受区域为[495.8,504.2]。

但现在样本的实际均值为506,落在拒绝区域内,因此拒绝原假设接受备择假设。

我们无法认为这批罐头的重量符合标准的要求,即这批罐头的重量不符合标准的要求。

当总体方差未知,样本数量又小于等于
30时,检验统计量样本均值服从t分布。

这就要用t 分布确定原假设的接受区域和拒绝区域了。

在得到接受区域后也就可以利用上面同样的方法,根据样本均值所处的位置作出判断。

2. 单侧检验
再看下面的例子。

例5-525个纸罐,
发现这些罐头的平均重量是498 ml,标准差S=10的显著性水平下能否认为这批纸罐的容重符合标准的要求?
根据问题的要求可以列出要检验的假设为:
H
:μ≥500
83
84 H 1:μ<500
由于总体方差未知,样本容量又小于30
t 分布,其自由度为n-1。

因此我们就必须利用t 间估计的结论可知原假设的接受区域为
()
1[--n t αμ ,查表得到
()711.112505.0=-t 。

所以计算得到接
受区域的临界点是496.6
498>496.6。

可见样本均值落在原假设
例5-6。

某特种建材生产厂规定某种规格新型墙体材料的重量不得大于500公斤。

今随机505公斤,标准差S=10。

问在
的显著性水平下能否认为这批新型墙体材料的重量符合标准的要求?
H 0:μ≤500
H 1:μ>500
这次也需要利用t 分布来进行检验。

这是一个右侧检验问题。

原假设的接受区域为
(
,(n t +-∞αμ,查表得到
()753.1116=-t 。

由此可以得到原假设的接受区域临界点是504.4>504.4。

可见样本均值落在原
85
假设的拒绝区域内。

我们拒绝原假设,接受备择假设,即认为这批新型墙体材料的重量不符合标准的要求。

(二)比例的假设检验
例5-7。

某酒厂规定某种酒中含有的糖度应为
100瓶这种酒,发现平均的糖度为11.3%。

的条件下,这批酒与
合格产品对糖度的要求有无明显的差别?
问题要检验的假设为:
H 0:μH 1:μ
.12
()⎪⎪⎭
⎫ ⎝⎛-⋅+-⋅-n P P Z P n P P Z P 1,)
1(2/2/αα ,则2/αZ =1.64。

计算得到原假设的接受区域是[0.114,0.126]。

由于样本比例0.113<0.114,落在原假设的拒绝区域内。

我们拒绝原假设,接受备择假设,即认为这批酒与合格产品对糖度的要求有明显的差别。

对于比例问题也同样可以进行单侧的假设检验。

方法也几乎与总体均值的单侧检验的情形相同。

此外,参照两个总体区间估计的情形,我们也可以对两个总体均值和比例差进行假设检
验,所用的方法几乎是完全同样的。

四、假设检验中的两类错误
,0.10,或0.50时,进行假设检验所得到的结果就可能是完全不同。

相关文档
最新文档