第3章-总体特征数的假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2
U
4
H0 接受域 假设检验示意图
H0 拒绝域
图 3-3
或表示为 x 的置信区间如下
0 – u1-/2

n

0.4
x
0 + u1-/2

n
0.3
x 的分布
0.2
Biblioteka Baidu
H0: =0 0.1
1
-4 -2
0
2
2
x
4
H0 拒绝域 图 3-4
H0 接受域 假设检验示意图
H0 拒绝域
3.1.2 假设检验的两类错误
表 3-1 检验结论 接受 H0: = 0 接受 H1: 0 假设检验的 4 种可能结果 真实情况 H0: =0 正确 检验结论正确 检验结论错误(弃真错误) H1: 0 正确 检验结论错误(取伪错误) 检验结论正确
弃真错误也称作第Ⅰ类错误,即原假设 H0 为真条件下,检验结论却是拒绝原 假设(接受备择假设)所犯的错误。犯弃真错误的概率常用表示。定义是 P(弃真) = P{拒绝 H0|H0 真实} = 取伪错误也称作第Ⅱ类错误,即原假设 H0 不为真条件下,检验结论却是接受 原假设(拒绝备择假设)所犯的错误。犯取伪错误的概率常用表示。定义是 P(取伪) = P{接受 H0|H0 不真实} =
0.8 0.6 0.4 0.2
p
0.5
1
1.36
1.5
临界值
2
2.5
3.1.4 检验功效 在假设检验文献中常常看到检验功效这个词。检验功效(test power)也称作 检验能力指的是当备择假设 H1 为真时,能够得出检验结果是接受 H1 的概率。 以图 3-5 为例,检验功效指的是确定条件下, )的概率。 (1-
H1: =2


H0:=1
x
2

1
图 3-5 两类错误示意图
p值 p 值即概率值。计算的是当统计量取值大于等于用样本计算的统计量的值 的概率。以统计量 U 做双侧检验为例,若样本计算的统计量的值用 U0 表示, 那么 p 值的定义是 P{U U0}=p 大多数计算机软件的输出结果报出的都是 p 值。 p 值和检验水平是什么关系呢?是人为设定的。p 值是用样本计算出来 的,相当于精确的显著性水平。当 p 时,统计量的值位于原假设的拒绝域, 所以检验结论是在水平上拒绝原假设;当 p 时,统计量的值位于原假设的 接受域,所以结论是在水平上接受原假设。 3.1.3
x 4 . 40 0 . 108 / 5
N(0, 1)
因为这是一个双侧假设检验问题。所以求出两个临界值 u 1 / 2 = u0.975 = 1.96。 若根据样本计算出的 U 统计量的值位于 [-1.96, 1.96] 之间,则为一合理现象,导 致接受 H0。若U1.96,则 U 统计量值的出现属于小概率事件。依据小概率原 理,这是一个不合理现象(即一次抽样中不应发生的随机事件) ,导致拒绝 H0。
/ n
4.364
x
= 4.40 - 1.96 0 . 108
/
5
= 4.305
5
/
n
= 4.40 + 1.96 0 . 108
/
= 4.495
与 H0 相对应的 x 的取值区间是[4.305,4.495]。因为用样本计算的 x = 4.364,位于用 x 表示的 H0 的接受域[4.305, 4.495]之间, 所以假设检验的结论是接受 H0: = 4.40。 (3)H0 接受域的中点是 H0 成立时的点。若以 U 为数轴进行检验,则中点是 U=0; 若以 x 为数轴进行检验,则中点是 x = 4.40。 (4)此检验常称作 U 检验,也有的文献称作 Z 检验。
图 3-2
假设检验过程示意图
这个判断过程需要二个前提, (1)选取适当统计量并知其概率分布。 (2)依据“小概率 原理”判断结果是否合理。 小概率原理指的是概率很小的随机事件,在一次试验中几乎不可能发生。 那么小到什么程度才算是小概率事件呢?通常取概率小于 0.05 或 0.01 的事件为小概率 事件,并用表示。在假设检验中, 称作检验水平,1- 称作置信水平或置信度。 假设分为两类。一类称作原假设或零假设,即含有等号的假设,用 H0 表示(如总体均 值 = 0) 。另一类称作备择假设,即与原假设相反的假设,常用 H1 表示(如总体均值 0) 。注意,H0 与 H1 应保证相互对立且完备。 假设检验一般分为两类: (1)双侧(双边、双端,双尾)假设检验;例如原假设和备择假设分别是 H0: = 0, H1: 0。 (2)单侧(单边、单端,单尾)假设检验。其中又分为左单侧检验和右单侧检验。 左单侧检验的原假设和备择假设分别是 H0: 0, H1: <0。 右单侧检验的原假设和备择假设分别是 H0: 0, H1: >0。 0 是原假设设定的值。原假设和备择假设的设定应根据实际检验所提出的要求决定之。
= -3.37
t = -3.37 位于 H0 接受域[-2.78,2.78]之外, 所以 t = -3.37 是一个小概率事件。依据 小概率原理,在一次试验中不应该发生,
t
所以检验结论是拒绝 H0,即认为该仪器
图 3-8 双端 t 检验示意图
测量温度存在偏差。检验过程见图 3-8。 总结 t 检验步骤如下: (1)建立原假设和备择假设 H0: = 0,H1: 0。 (2)选用统计量 t =
等。
3.2.1 情形 1: 总体服从正态分布,总体方差2 已知,样本大小无限制,检验 = 0。 例 3-1 设某炼铁厂铁水含碳量服从 N(, 0.1082) 分布。现测量 5 炉铁水,其含碳 量分别为 4.28, 4.40, 4.42, 4.35, 4.37 已知总体标准差无变化,在 = 0.05 水平下,能否认为 = 4.40? 解:根据本题要求,此检验属于双端检验。首先建立假设, H0: = 4.40, H1: 4.40。 用 xi 表示铁水含碳量随机变量。在原假设成立条件下,有 xi N(4.40, 0.1082)。根 据第 2 章结论(2-3) ,有 x N(4.40, 0.1082/5 )。把 x 标准化, U=
3.2.3 情形 3:总体服从正态分布,总体方差 2 未知,小样本(n <30) ,检验 = 0。 例 3-2 用某仪器间接测量温度 5 次,记录温度值(° C)如下: 1250, 1265, 1245, 1260, 1275 已知温度真值是 1277° C,假定该温度测量值 xi 服从正态分布,问:该仪器间接测量的温 度有无系统偏差, (取 = 0.05) 。 解:如果用样本值计算的温度平均值与真值 1277° 不存在显著性差异,则说明该仪器间 C 接测量的温度无系统偏差;如果样本温度平均值与真值 1277° 存在显著性差异,则说明 C 该仪器间接测量的温度存在系统偏差。 根据给定的条件, 该温度测量值 xi 服从正态分布, 总体方差 2 未知, 样本容量 n = 5, 属于小样本。应该选用 t 统计量进行假设检验。这种情形在实际统计推断中更常见。 首先计算样本平均值 x 和样本方差 s2, x = (1250+1265+1245+1260+1275)/5 = 1259° C s2 =[(1250-1259)2+(1265-1259) 2+(1245-1259) 2+(1260-1259) 2+(1275-1259) 2]/4=142.5 =(11.9)2 因为无论温度值大于或者小于 1277° C,都属于该仪器测量的温度存在系统偏差,所以根 据题意,这是一个双端检验问题。建立原假设和备择假设如下: H0: = 1277° C(该测温仪无系统偏差) 1: 1277° ,H C(该测温仪存在系统偏差) 选择统计量 t =
依据某种判别准则 看会得出什么结果。 先假定假 设成立 若是不合理结果 图 3-1
10 件中有 4 件次品 的概率是 0.0004。
若是合理结果
原假设成立
原假设不成立
假设检验原理示意图
设“次品率 设“次品率 为 4%” 正确 为 4%”
依据小概率原理概率是 0.0004 的事件在一次 实验中出现不合理。 原假设不成立
假设检验与上一章介绍的置信区间估计有着密切联系。 比如用根据样本计算的平均数 x 构造一个相应统计量 U 的 95%的置信区间如下: -u1-/2 U=
x 0
/
u1-/2
n
0.4
0.3
U 的分布
0.2
0.1 H0: =0
0 -u1-/2 H0 拒绝域
-4 -2
u1-/2
x s/ n
,H0 成立条件下,有 t =
x 0 s/ n
t(n – 1)。
(3)按给定的检验水平求临界值 t/2(n – 1)。 (4) 制定判别规则。 若样本计算的t t/2(n–1), 则接受 H0; 若样本计算的t t/2(n–1), 则拒绝 H0。 (5)用样本计算 t 统计量的值,并按判别规则判定之。
总体均值假设检验的 EViews 操作:打开数据窗口(样本观测值) ,点击 View 选 Tests for Descriptive Stats, Simple Hypothesis Tests 功能。在打开的对话窗中,以本例为例,在 Mean 选择窗键入 1277。 如果已知总体标准差, 可以在 Enter s.d. if known 选择窗填入总体标准差 的值, 这相当于做 U 检验 (EViews 称 Z 检验) 如果未知总体标准差, Enter s.d. if known 。 在 选择窗处保持空白, 这相当于做 t 检验 (EViews 也称 t 检验) 如图 3-9 所示。 , 点击 OK 键, 得 t 检验结果如图 3-10。因为-3.37 对应的 p 值等于 0.028,小于 0.05,结论是拒绝原假设。
例 3-1 利用样本计算
x = (4.28+4.40+4.42+4.35+4.37)/5= 4.364。
U=
4 . 364 4 . 40 0 . 108 / 5
= - 0.745
因为用样本计算的 U 值位于原假设的接受域[-1.96,1.96]之内,所以接受 H0,即 认为 = 4.40,xi N(4.40, 0.1082)。H0 的接受域与拒绝域见图 3-6。 把上面的检验过程总结如下: (1)建立原假设与备择假设 H0: = 0,H1: 0。 (2)根据已知条件,选用统计量 U=
第 3 章 总体特征数的假设检验
张晓峒
(2009-8) 南开大学数量经济研究所所长、博士生导师 nkeviews@yahoo.com.cn http://202.113.23.180:7050(南开大学经济学院数量经济研究所)
第 3 章 总体特征数的假设检验 3.1 假设检验的基本思想与方法 3.1.1 假设检验的原理与分类
x
N(0, 1)
/
,在 H0 成立条件下
n
有 U=
x 0
/
N(0,1)。
-0.745 图 3-6 双侧均值假设检验示意图
U
n
(3)根据给定的确定临界值 u1-。 (4)建立判别规则,若U u 1 / 2 , 则接受 H0;若U u 1 / 2 ,则拒绝 H0。
H1: =2


H0:=1
2
1
x
图 3-5 两类错误示意图
本章主要介绍总体均值、总体方差、总体比率和总体分布律的假设检验方法。 常用的统计量是 U =
x
/
,t =
x s/ n
, =
2
( n 1) s
2
n

2
,V =

i 1
k
( f i np i ) np
i
2
/ n
2
/n
)。根据 P{
x 0
/
u1-/2}= 1- ,用样本
n
,0+ u 1 / 2
/
n
]
x 的分布
若 x 位于上述区间之外,则拒绝 H0。 结合例 3-1, x 的两个临界值计算如下, 1 = 0 - u 1 / 2 2 = 0 + u 1 / 2
x s/ n
,在 H0 成立条件下, t =
x s/ n
=
x 1277 11 . 9 / 5
t (4)
查附表 4, t/2 (n –1) = t0.025 (4) = 2.78,则[-2.78, 2.78 ] 为 H0 接受域。
利用样本计算 t =
1259 1277 11 . 9 / 5
(5)利用样本计算 U 的值。按上述判别规则做出结论。
注意: (1)当用样本计算的 U 值位于临界值附近时,不要急于下结论,应再抽一次 样本,重新做一次检验。 (2)假设检验也可以在 x 轴上进行。建立 H0: = 0,H1: 0。 在原假设成立条件下,有 x N(0, 平均数 x 表示的 H0 的接受域是 [0- u 1 / 2
相关文档
最新文档