第五章 抽样调查假设检验部分
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临界值
H0
右侧检验
抽样分布
置信水平
Region of Rejection
拒绝H0
1-
Region of Nonrejection
2
H0
临界值
统计量决策规则
给定显著性水平,查表得出相应的临界值
将检验统计量的值与 水平的临界值进行比较
作出决策
双侧检验:|统计量|> 临界值,拒绝H0
左侧检验:统计量 < -临界值,拒绝H0
假设检验
什么是假设检验? (HYPOTHESIS TEST) 先对总体的参数(或分布形式)提出某种假设,然后
利用样本信息判断假设是否成立的统计方法
逻辑上运用反证法,统计上依据小概率原理
小概率事件与小概率原理
小概率事件:发生概率很小的随机事件 小概率原理:小概率事件在一次试验(观察 )中几乎不可能发生。 什么样的概率才算小概率?
(四)一个总体参数的假设检验
1、总体均值的检验 (大样本N30)
使用z检验统计量
2 已知:
x -μ 0 z= ~ N(0, 1) σ n
2 未知:
x -μ 0 z= ~ N(0, 1) s n
某种罐装饮料采用自动生产线生产,每罐的容量是 255ml ,标准差为 5ml 。为检验每罐容量是否符合 要求,质检人员在某天生产的饮料中随机抽取了40 罐进行检验,测得每罐平均容量为 255.8ml。取显 著性水平 =0.05 ,检验该天生产的饮料容量是否 符合标准要求? 双侧检验
50个零件尺寸的误差数据 (mm) 1.26 1.13 1.19 0.96 1.31 1.06 0.97 1.00 1.81 0.94
0.98
1.12 1.23 0.99
1.10
1.12 0.74 1.45
1.12
0.95 1.50 1.24
1.03
1.02 0.50 1.01
1.16
1.13 0.59 2.03
验统计量取值的概率P,并与显著性水平比较。
(一)原假设和备择假设 原假设
1.
2.
3.
又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示 最初0假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它 总是有符号 =, 或 H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值 例如, H0 : 10cm 原假设的提出应本着“保守”或“不轻易拒绝 ”的原则来进行选择
1.98 1.11
1.70 1.17
1.97 1.54
2.37 1.12
0.91 1.08
1.38 1.23
1.22 1.10
1.60 0.82
1.06 1.64
1.26 0.86
提出假设:H0 :
1.35H1 : <1.35 左侧检验 确定检验统计量:Z统计量 显著水平位 = 0.05,临界值 Z Z = 1.64 0.95 0.05 接受区间[-1.64, ) + 根据样本均值算出统计量:-2.6061
(二)两类错误与显著性水平
研究者总是希望能做出正确的决策,但由于决 策是建立在样本信息的基础之上,而样本又是随机 的,因而就有可能犯错误 原假设和备择假设不能同时成立,决策的结果 要么拒绝H0,要么不拒绝H0。决策时总是希望当 原假设正确时没有拒绝它,当原假设不正确时拒绝 它,但实际上很难保证不犯错误 第Ⅰ类错误(错误) 原假设为正确时拒绝原假设 第Ⅰ类错误的概率记为,被称为显著性水平 第Ⅱ类错误(错误) 原假设为错误时未拒绝原假设 第Ⅱ类错误的概率记为(Beta)
0
临界值
Z
计算出的样本统计量
P 值决策与统计量决策的比较
用P值进行检验比根据统计量检验提供更多的信息 统计量检验是我们事先给出的一个显著性水平,以 此为标准进行决策,无法知道实际的显著性水平究竟 是多少 比如,根据统计量进行检验时,只要统计量的值 落在拒绝域,我们拒绝原假设得出的结论都是一样的 ,即结果显著。但实际上,统计量落在拒绝域不同的 地方,实际的显著性是不同的。比如,统计量落在临 界值附近与落在远离临界值的地方,实际的显著性就 有较大差异。而 P 值给出的是实际算出的显著水平, 它告诉我们实际的显著性水平是多少
(ALTERNATIVE HYPOTHESIS)
1.
备择假设
2.
3.
也称“研究假设” , 研究者想收集证据予以支 持的假设,用H1或Ha表示 备择假设通常用于表达研究者自己倾向于支持 的看法,然后就是想办法收集证据拒绝原假设 ,以支持备择假设 总是有符号 , 或< H1 : 某一数值 H1 : 某一数值 H1 : <某一数值
拒绝原假设,新机床加工的零件尺寸的平均误差与旧机床相 比有显著降低
: = 255 H1 : 255 确定检验统计量:Z统计量 Z0.025 =1.96 显著性水平 = 0.05,临界值(c): Z0.975 Z0.025 1.96 接受区间为[-1.96,1.96] x -μ 255.8- 255 0= z = = 1.01 根据样本均值算出统计量 σ n 5 40 没有证据表明该天生产的饮料不符合标准要求
决策规则:若p值<, 拒绝 H0
P值是关于数据的概率 它反映的是在某个总体的许多样本中某一类数据出 现的经常程度,它是当原假设正确时,得到目前这 个样本数据的概率。 P 值越小,你拒绝原假设的理 由就越充分 比如,要检验全校学生的平均生活费支出是否等 于 500 元,检验的假设为 H0 : =500 ; H1 : 500 。假定抽出一个样本算出的样本均值 600 元,得到 的值为P=0.02,这个0.02是指如果平均生活费支出 真的是 500 元的话,那么,从该总体中抽出一个均 值为600的样本的概率仅为0.02。如果你认为这个概 率太小了,就可以拒绝原假设,因为如果原假设正 确的话,几乎不可能抓到这样的一个样本,既然抓 到了,就表明这样的样本不在少数,所以原假设是 不对的
右侧检验:统计量 > 临界值,拒绝H0
用P 值决策 (P-VALUE)
1.
如果原假设为真,所得到的样本结果会像实际观 测结果那么极端或更极端的概率
•
P值告诉我们:如果原假设是正确的话,我们 得到得到目前这个样本数据的可能性有多大, 如果这个可能性很小,就应该拒绝原假设
2.
3.
被称为观察到的(或实测的)显著性水平
原假设为真时,拒绝原假设的概率 抽样分布的拒绝域 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 由研究者事先确定
(三)决策依据和规则
依据什么做出决策? 根据统计量
根据P值
根据统计量进行决策
在利用样本对总体进行统计推断时,往往是利用
样本统计量来进行决策,如果样本统计量算出来的 值落在接受区间,则接受原假设,若样本统计量算 出来的值落在拒绝区间,则拒绝原假设,那么接受 区间是拒绝区间是怎么算出来的呢?其临界值就是 要根据统计量的抽样分布和显著水平计算得到。
双侧检验与单侧检验
1.
备择假设没有特定的方向性,并含有符号“” 的假设检验,称为双侧检验或双尾检验 (two-
tailed test)
2.
备择假设具有特定的方向性,并含有符号“ >”
或“ <” 的假设检验,称为单侧检验或单尾检验
(one-tailed test)
备择假设的方向为“<”,称为左侧检验
单侧检验中,P值通常为统计量分布曲线从检验 统计量从观察值到拒绝区域这一侧的面积。 左侧检验时,P值= P{ξ c } 右侧检验时,P值= P{ξ c } 双侧检验中,P值=单侧P值的2倍。即:
P值=2P{ξ ≥c },当 c 在右侧时;
或: P值=2P{ξ ≤c },当 c 在左侧时。
双侧检验的P 值:算出统计量临界值后 ,其统计量小于或大于临界值的概率
/2
拒绝H0
1/2 P 值
/2
拒绝H0
1/2 P 值
临界值
计算出的样本统计量
0
临界值
Z
计算出的样本统计量
左侧检验的P 值:算出统计量临界值后 ,其统计量小于临界值的概率
拒绝H0
P值
临界值
计算出的样本统计量
0
Z
右侧检验的P 值:算出统计量临界值后 ,其统计量大于临界值的概率
拒绝H0
P值
H0 : 10cm H1 : 10cm
某品牌洗涤剂在它的产品说明书中声称:平均净含 量不少于 500 克。从消费者的利益出发,有关研究 人员要通过抽检其中的一批产品来验证该产品制造 商的说明是否属实。试陈述用于检验的原假设与备 择假设
解:研究者抽检的意图是倾向于证实这种洗涤剂的 平均净含量并不符合说明书中的陈述 。建立的原 假设和备择假设为 H0 : 500 H1 : < 500
如:H0:药品没有毒
接受原假设 药品没有毒 决策正确 第二类错误 拒绝原假设 药品有毒 第一类错误 决策正确
wk.baidu.com
原假设为真 药品没有毒 原假设为假 药品有毒
如:H0:药品有毒
显著性水平 (SIGNIFICANT LEVEL)
事先确定的用于拒绝原假设H0时所必须的证据 能够容忍的犯第Ⅰ类错误的最大概率(上限值)
根据决策的风险或要求的把握程度来决定 ,没有统一的界定标准。
假设检验中把这个概率称为检验的 “显著 性水平”。
假设检验的步骤
(一)提出原假设和备择假设。 (二)确定检验统计量及其分布。 (三)判定样本是否是小概率事件,进行决策 统计量决策:规定显著性水平,并找到检验统计量 的临界值,构造接受域。 P值决策:规定显著性水平,根据样本数据计算检
确定假设:H0
拒绝 H0
0.005
拒绝 H0
0.005
-1.96
0
1.96
z
P值是当原假设为真时,出现样本观测结果或者更极 端结果的概率,
X 0 X 0 p( 》 1.01)=1-p( 1.01)=0.1562 / n / n P=2*0.1562=0.3124>0.05 因为出现样本观测值或更极端值的概率不是小概率事件,所以接受原假设。
备择假设的方向为“>”,称为右侧检验
双侧检验与单侧检验
以总体均值的检验为例
2008年8月
假设
原假设
双侧检验
H0 : =0
单侧检验
左侧检验
H0 : 0
右侧检验
H0 : 0
备择假设
H1 : ≠0
H1 : <0
H1 : >0
假设检验的基本思想 抽样分布
这个值不像我 们应该得到的 样本均值 ...
... 因此我们拒 绝假设 = 50
... 如果这是总 体的假设均值 20
= 50 H0
样本均值
提出假设 一种零件的生产标准是直径应为 10cm,为对生产过程 进行控制,质量监测人员定期对一台加工机床检查, 确定这台机床生产的零件是否符合标准要求。如果零 件的平均直径大于或小于10cm,则表明生产过程不正 常,必须进行调整。试陈述用来检验生产过程是否正 常的原假设和被择假设 解:根据不轻易拒绝原则,建立的原假设和备择 假设为
双侧检验
抽样分布
Region of Rejection
置信水平
Region of Rejection
拒绝H0
拒绝H0
/2
1-
Region of Nonrejection
/2
临界值
H0
临界值
左侧检验
抽样分布
Region of Rejection
置信水平
拒绝H0
1-
Region of Nonrejection
-
一种机床加工的零件尺 寸 绝 对 平 均 误 差 为 1.35mm。生产厂家现采 用一种新的机床进行加 工以期进一步降低误差 。为检验新机床加工的 零件平均误差与旧机床 相比是否有显著降低, 从某天生产的零件中随 机抽取 50 个进行检验。 利用这些样本数据,检 验新机床加工的零件尺 寸的平均误差与旧机床 相比是否有显著降低?
原假设为真 原假设为假
接受原假设 决策正确 第二类错误
拒绝原假设 第一类错误 决策正确
两类错误的控制 一般来说,对于一个给定的样本,如果犯第Ι类错 误的代价比犯第Ⅱ类错误的代价相对较高,则将犯第
Ⅰ类错误的概率定得低些较为合理;反之,如果犯第
Ι类错误的代价比犯第Ⅱ类错误的代价相对较低,则 将犯第Ⅰ类错误的概率定得高些。 所以,一般来说,发生哪一类错误的后果更为严重 ,就应该首要控制哪类错误发生的概率。 但由于两种错误是此消彼长的关系,一般在假设检 验中,人们往往先控制第Ι类错误的发生概率