一般总体均值的假设检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§7.4 一般总体均值的假设检验
一、 一般总体均值的大样本假设检验
1. 一个总体均值的大样本假设检验
X ,记总体均值 E( X ) 设样本 ( X 1, X 2,
, X n ) 取自非正态总体 。
样本均值及
1
n
2
1
n
2
样本方差分别为 X
X i
( X i
X )
n
, S
n。
i 1
1 i 1
如果我们要做双侧检验:
H 0 : 0
H 1 :
0 ,在大样本情况(样本容量
n 30 )下可选 Z
X 0 为检验统计量,由中心极限定理知,它在
H 0 成立时近 S / n
似服从 N (0,1) 。
检验的 P 值近似为 2P(Z | z | 0) 2(1 (| z O |)) ,其中检验
O
统计量 Z 的观测值为
z O
x
0 。
s/
n
例 7.4.1 一种机床加工的零件尺寸绝对平均误差为 1.35mm 。
生产厂家现采用一种新的
机床进行加工以期降低误差。
为检验新机床加工的零件平均误差与旧机床相比是否
有显著降低,从某天生产的零件中随机抽取 50 个进行检验。
50 个零件尺寸的绝对
误差数据( mm )如下所示:
1.26 1.19 1.31 0.97 1.81 1.13 0.96 1.06 1.00 0.94 0.98 1.10 1.12 1.03 1.16 1.12 1.12 0.95 1.02 1.13 1.23 0.74 1.50 0.50 0.59 0.99 1.45 1.24 1.01
2.03 1.98 1.97 0.91 1.22 1.06 1.11 1.54 1.08 1.10 1.64 1.70 2.37 1.38 1.60 1.26 1.17 1.12 1.23 0.82 0.86
利用这些数据, 检验新机床加工的零件尺寸的平均误差是否显著降低?
(
0.01)
解:这里研究者所关心的是新机床加工的零件尺寸的平均误差与旧机床相比是否有
显著降低,也就是新机床加工的零件尺寸的误差的数学期望 E(X)是否小于
1.35,
因此属于单左侧检验。
提出的假设如下:
H 0 :
1.35 H 1 : 1.35
现在 n
50 ,检验统计量可选为
X 1.35 1.35
Z ~ N (0,1) ;
S / n
由 数 据 得 : x
1.215
, s 0.366,故检验统计量 Z 的观测值为
1.215 1.35
2.608 ,所以检验的 P 值近似为
z O
50
0.366 /
P(Z
2.608 1.35) ( 2.608) 0.0046 。
因为 P
0.01,应拒绝原假设, 可认为新机床加工的零件尺寸的平均误差与旧机床
相比有显著降低。
注:本例也可以直接根据原始数据计算检验的P 值,操作步骤如下:
第 1 步:进入Excel 表格界面,直接点击“f(x)(”粘贴函数)命令。
第 2 步:在函数分类中点击“统计”,并在函数名菜单下选择“ZTEST”,然后确定。
第 3 步:在所出现的对话Array 框中,输入原始数据所在区域;在X 后输入参数的某一假定值(这里为 1.35);在 Sigma 后输入已知的总体标准差(若总体标准差未知则
可忽略不填,系统将自动使用样本标准差代替),如下图所示。
图 7.2.2
此时给出的分布右侧面积为0.995421058,用 1 减去该值,即为左侧检验的P 值,即 P 1 0.9954 0.0046 。
2.两个总体均值的大样本假设检验
设两独立样本 X1,, X n和 Y1,,Y n分别取自非正态总体X 和 Y (总体均值记
12
1n1n2
为X1X
E(Y)2i Y Y j
n1i 1n2j1
S121n1
( X i X ) 2, S221
n2
(Y j Y )2
样本方差分别为
1 i 1 j 。
n11n2
1
如果我们要做双侧检验:H 0 :12H 1 :1 2 ,在大样本情况下可选X Y
H 0成立时近似服从Z为检验统计量,由中心极限定理知,它在
S12 / n1S22 / n2
N (0,1) 。
检验的P值近似为2P( Z| z O |1 2 )2(1(| z O |)) ,其中
x y
为检验统计量
Z 的观测值。
z O
s 22 s 12 n 1 n 2
例 7.4.2 一个随机样本由居民一区的
100 个家庭组成,另一随机样本由居民二区的
150
个家庭组成,这两个样本所给出的关于目前住房中居住了多长时间的信息如下:
x 41个月 ,
y 49 个月, s 12 900 , s 22
1050 。
这些数据是否提供了充分的证
据,说明一区家庭在目前住房中居住的时间平均来说比二区家庭短? (设
0.05
)
解:建立假设
H 0 :
1
2
H 1 :
1
2
本题的样本容量足够大,
n 1 100 , n 2
150 ,检验统计量为
Z
X Y
1
~ 2
S 12 / n 1
S 22 / n 2 N (0,1)
其样本观测值为
z O
41 49
2 。
此题属于左侧检验,检验的
P
900 100
1050 150
值近似为 P(Z 2 1 2 )
( 2)
0.02275 ,故拒绝 H 0 ,接受 H 1 ,即说明一区 家庭在目前住房的时间平均来说比二区家庭短。
二、 总体比率的假设检验
1. 单个总体比率的大样本假设检验
设样本 ( X 1 , X 2
, , X n ) 取自 0-1 分布总体 X ~ B(1, p) ,总体均值 E ( X )
p 。
样
本均值为 X
1
n
n
X i 。
i 1
如果我们要做双侧检验: H 0 : p
p 0
H 1 : p
p 0 ,在大样本情况( n 30 且
min( np 0 , n(1 p 0 )) 5 )下可选 Z
X p 0
或 Z * X p 0 为检
X (1 X ) / n
p 0 (1 p 0 ) / n 验统计量, 由中心极限定理知, 它们在 H 0 成立时都近似服从 N (0,1) 。
所以检验的 P 值
近似为
2P(Z | z O | H 0 ) 2(1
(| z O |))或 2P( Z * | z O *
| H 0)
2(1
(| z O * |)) ,
其中 z O
x p 0
和 z O * x p 0 分别为检验统计量 Z 和 Z *
的观测值。
x(1 x) / n
p 0 (1 p 0 ) / n
例 7.4.3
某企业的产品畅销于国内市场。
据以往调查,购买该产品的顾客有 50% 是 30
岁以上的男子。
该企业负责人关心这个比例是否发生了变化 (无论是增加还是减少
)?
于是委托一家咨询公司进行调查,这家咨询机构从众多的购买者中随机抽选了 400
名进行调查,结果有210 名为 30 岁以上的男子。
该厂负责人希望在显著性水平
0.05
下检验“ 50%的顾客是 30 岁以上的男子”这个假设。
解:提出假设 :
H 0 : p p050%H 1 : p p0
由于样本容量 n 400 30 ,且min( np0 , n(1p0 ))2005
,所以可以使用
正态分布进行检验。
检验统计量为Z X p0或 Z *X p0,它们
X (1 X ) / n p0 (1 p0 ) / n
在 H 0成立时都近似服从N (0,1) 。
现在 x210 / 4000.525 ,检验统计量 Z 和 Z *的样本观测值分别为
z O0.525 0.5 1.001和 z O*0.525 0.51。
0.525(1 0.525) / 4000.5(1 0.5) / 400
检验的 P 值近似为2P( Z 1.001H 0 )2(1(1.001))2(10.8416)0.3168或 2P(Z *1H0) 2(1(1)) 0.3174。
因为检验的 P 值都大于显著性水平0.05,故不拒绝H0,即没有充分理由认为比例
发生了变化。
2.两个总体比率的大样本假设检验
设两独立样本 X1, , X n和Y1,,Y n分别取自0-1分布总体X和Y (总体均值
12
1n1
X i,Y 1n 2
记为 E(X)p1和 E(Y )p2),样本均值分别为Y j。
X
n1i 1n2 j 1如果我们要做双侧检验:H 0 : p1p2H 1 : p1p2,在大样本情况下可选Z X Y?n1 X n2Y
n1)为检验统计量,由中心极限定
p?(1p?)(1/ n1 1 / n2 )n2
理知,它在H0成立时近似服从 N(0,1) 。
所以检验的P值近似为
2P( Z | z O | H 0 )2(1(| z O |)) ,其中 z O
x y
为检验统计??
p(1p)(1/ n1 1 / n2 )
量 Z 的观测值。
例 7.4.4 甲、乙2公司属于同一行业,有人问这 2 个公司的工人是愿意得到特定增加的福利费,还是愿意得到特定增加的基本工资。
在甲公司150 名工人的简单随机样本中,有 75 人愿意得到增加基本工资;在乙公司 200 名工人的随机样本中,120 人愿意得到增加的基本工资。
在每个公司,样本容量占全部工人数的比率不超过5%。
试问:可以判定这 2 个公司中愿意增加基本工资的工人所占比例不同吗?(=0.05 )
解:建立假设
H 0 : p 1 p 2 H 1 : p 1 p 2
现在是大样本情形,检验统计量为 Z
X Y ( 这 里
? 1/ n 2 )
p (n 1 X n 2Y ) /(n 1 n 2 )
H 0
p(1 p)(1 / n 1
),它在成立时近似服从 N (0,1)。
由样本观测值知,
x
75 /150 0.5 , y 120 / 200
0.6 ,
75 120
,
z O
0.5 0.6
1.864,
p
150
0.557 0.557(1 0.557)(1/150 1/ 200)
200
所以检验的 P 值近似为 2
P(Z
1.864 H 0 ) 2(1
(1.864)) 2(1 0.969) 0.062。
由于 P 0.05,所以不拒绝原假设 H 0 ,即没有充分理由认为这
2 个公司中愿意增
加基本工资的工人所占比例不同。
有时我们要检验两个总体比率之差是否为某一个不为
0 的常数 d 0 ,即要检验假设:
H 0 : p 1 p 2 d 0 H 1 : p 1 p 2 d 0 ,
在大样本情况下可选
X Y
d 0
为检验统计量, 由中心
Z
X (1 X ) / n 1 Y (1 Y ) / n 2
极限定理知,它在 H 0
成立时近似服从 N(0,1) 。
所以检验的 P
值近似为
2P( Z | z O | H 0 ) 2(1
(| z O |)) ,其中 z O
x y
d 0
为检验
x(1 x ) / n 1
y(1 y) / n 2
统计量 Z 的观测值。
例 7.4.5 某厂质量检验人员认为该厂一车间的产品一级品的比率比二车间产品一级品
的比率大 5%。
现从一车间和二车间分别抽出 2 个独立随机样本,得到如下数据:
n 1 150 ,其中一级品数为 113; n 2
160 ,其中一级品为 104。
试根据这些数据
检验质量研究人员的观点。
(设 0.05 )
解:建立假设
H 0 : p 1 p 2 0.05
H 1 : p 1 p 2
0.05
检验统计量为
Z
X Y
0.05
,
X (1 X ) / n 1
Y (1 Y ) / n 2
它在 p 1
p 2
0.05
成立时近似服从 N (0,1) 。
由观测值可知, x 113/ 150 0.753, y
104 / 160 0.65 ,于是检验统计量 Z
0.753 0.65 0.05
1.027 。
这是右侧检验, 所
的观测值为 z O
0.65) / 160
0.753(1 0.753) / 150 0.65(1
以检验的P 值近似为
P(Z 1.027 p1p20.05)1(1.027)10.8480.152 。
因为 P0.05,故不拒绝原假设,即现有数据不足以支持该厂质量检验人员的观点。
3.单个总体比率的精确检验
上面讨论的都是大样本情形下的近似检验。
事实上,在实际工作中,只要知道总体
的分布类型,我们就完全有能力利用计算机强大的计算功能或直接应用统计软件考虑精
确的检验方法,下面以单个总体比率的检验为例。
设样本 (X1 , X 2 , , X n ) 取自0-1分布总体X ~ B(1, p) ,对右单侧检验问题:
n
H 0 : p p0H 1 : p p0,检验统计量我们可以选为T X i,它在 p p0时
i 1
服从 B(n, p0 ) 。
所以检验的P 值为P(T t O p p0 ) 1 P(T t O 1 p p0 ) ,其n
中 t O x i
为检验统计量 T 的样本观测值。
这是单个总体比率的精确检验方法,大小
i 1
样本都适合!
例 7.4.6 某地区主管工业的负责人收到一份报告, 该报告中说他主管的工厂中执行环境保护条例的厂家不足 60%, 这位负责人认为应不低于 60%, 于是他在该地区众多的
工厂中随机抽查了60 个厂家 , 结果发现有 33家执行了环境条例, 那么由他本人的调查结果能否证明那份报告中的说法有问题(0.05)?
解:这位负责人想知道真正的比率p 是否少于60%,这是一个左侧检验问题:
H 0: p p060%H 1 : p p0
法一:由于 n60 30,而且 min( np0 , n(1p0 ))245,可以用正态分布进行检验。
检验统计量为 Z X p0或 Z *X p0,它们在 p p0
X (1 X ) / n p0 (1 p0 ) / n
时都近似服从 N ( 0,1) 。
现在 x33/ 600.55 ,检验统计量 Z 和 Z *的样本观测值分别为
z O0.550.60.778和 z O*0.550.60.791。
检验的P
0.55(10.55) / 600.6(10.6) / 60
值近似为 P(Z0.778 H 0 )0.218或 P(Z*0.791 H 0 )0.214 。
因为检验的 P 值都大于显著性水平0.05,故不拒绝H0,即没有充分理由认为遵守
法则的工厂的比率不足60%。
尽管观察的样本比率小于60%,但它并未显著地低于60%。
n
法二:采用单个总体比率的精确检验方法。
检验统计量为T X i nX ,它
i 1
在p p0时服从 B(60,0.6)。
现在 T 的样本观测值为t O 33 ,故检验的P值为P(T33 p p0 )0.254 。
因为检验的 P 值大于显著性水平 0.05,故不拒绝H0,结论与法一同。
例 7.4.7某厂生产的产品次品率为10%。
近期抽查 20 件,发现次品有 4 件之多。
试问:
在 0.05下能否认为次品率仍为10%?解:这
是关于次品率 p 的右侧检验问题:
H 0 : p p010%H 1 : p p0
n
由于是小样本,采用精确检验方法。
检验统计量为 T X i nX ,它在p p0
i 1
时服从 B(20,0.1)。
现在 T 的样本观测值为t O 4
,故检验的 P 值为
P(T 4 p p0 ) 1P(T 3 p p0 ) 1 0.8670.133。
因为 P0.05 ,故不拒绝H0,还没有充分理由认为次品率上升。
注:如果用一般教材上求拒绝域的办法,这个问题讨论起来将不是太方便!。