概率与统计假设检验的基本思想与步骤
概率论与数理统计(8)假设检验
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计-假设检验
14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12,22 已知)
43
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
茆诗松《概率论与数理统计教程》第3版笔记和课后习题含考研真题详解-第7~8章【圣才出品】
,xn;
)
0
2.分类数据的χ2 拟合优度检验
定理:在实际观测数与期望观测数相差不大的假定下,在 H0 成立时,对统计量
2
r i 1
(ni
npi0 )2 npi0
有 2
L 2 (r 1) 。
根据定理,采取显著性水平为α 的显著性检验:检验统计量为:
2
r i 1
(ni
npi0 )2 npi0
,拒绝域为W
{ 2
2 1
(r
1)} 。
五、正态性检验 1.W 检验 W 统计量
3 / 117
圣才电子书 十万种考研考证电子书、题库视频学习平台
W
n
(ai
i 1
a
)( x ( i )
x
)
2
n
n
(ai a )2 (x(i) x )2
i 1
i 1
拒绝域{W≤Wa}。
2.比率 p 的检验(见表 7-1-2)
表 7-1-2 比率 p 的检验
2 / 117
圣才电子书 十万种考研考证电子书、题库视频学习平台
四、似然比检验与分布拟合检验
1.似然比检验的思想
假设的似然比
sup p(x1,K ,xn; )
( x1,K
,xn
)
sup
p( x1,K
+(n)}。
7.2 课后习题详解
习题 7.1
1.设 x1,…,xn 是来自 N(μ,1)的样本,考虑如下假设检验问题
4 / 117
圣才电子书 十万种考研考证电子书、题库视频学习平台
H0:μ=2 vs H1:μ=3
若检验由拒绝域为 W {x 2.6}确定。
假设检验的基本思想与步骤
假设检验的基本思想与步骤假设检验是统计学中重要的方法之一,用于验证关于总体特征的假设。
通过收集样本数据,利用统计分析方法对假设进行检验,从而对总体的真实特征进行推断。
本文将介绍假设检验的基本思想与步骤。
一、基本思想假设检验的基本思想是通过收集样本数据来判断总体的特征是否与我们所假设的一致。
在进行假设检验时,我们首先提出原假设(H0)和备择假设(H1)。
原假设通常表示我们对总体特征的假设,备择假设则是与原假设相对立的假设,用于检验原假设的推翻。
在收集样本数据后,通过对样本数据的统计分析,我们可以判断原假设是否应该被拒绝。
二、步骤假设检验的步骤可以分为六个主要的部分,下面将详细介绍每一步的具体内容。
1. 确定假设在进行假设检验前,我们首先需要确定原假设和备择假设。
原假设通常是我们所期望的总体特征,而备择假设则是与原假设相对立的假设。
例如,当我们想要检验某个产品的平均销售额是否达到预期水平时,原假设可以是销售额等于预期值,备择假设则可以是销售额不等于预期值。
2. 选择显著性水平显著性水平是决定是否拒绝原假设的标准。
在进行假设检验前,我们需要选择一个显著性水平(通常用α表示),该水平表示我们允许出现的错误类型I的概率。
常见的显著性水平选择包括0.05和0.01。
3. 计算检验统计量在进行假设检验时,我们需要计算一个检验统计量来对假设进行评估。
检验统计量的具体计算方法取决于所使用的统计分析方法和数据类型。
例如,在比较两个总体均值时,可以使用t检验,计算t值作为检验统计量。
4. 确定拒绝域拒绝域是根据显著性水平和检验统计量确定的。
拒绝域是指当检验统计量落在该区域内时,我们拒绝原假设。
拒绝域的确定需要根据所选用的检验方法和显著性水平进行计算。
5. 计算p值p值是根据样本数据计算得出的,在假设检验中用来判断原假设是否应该被拒绝。
p值表示当原假设为真时,观察到与样本数据一样极端情况的概率。
若p值小于显著性水平α,则拒绝原假设。
《概率论与数理统计》第八章1假设检验的基本概念
2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .
所
以,原假
设H
不正确
0
。
对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量
假设检验基本思想和步骤
H1 : u u0
* 检验假设是针对总体而非样本; * H0 和 H1 是相互联系、对立的假设,两者缺一不可 * H0 为无效假设,其假定通常是:某两个(或多个)总
体参数相等,或某两个总体参数之差等于0
* H1 的内容反映了检验的单双侧。若 H1 假设为
1=2
H1:该市高碘区与非高碘区儿童智力均数不等,即
12
=0.05
(2) 计算统计量
今 X1 =73.07, S1=10.75,n1=100 X2 =80.30,S2=11.83,n2=105
u X1 X 2 73.07 80.30 4.58
S12 S22
10.752 11.832
所有检验统计量都是在假设 H0 成立的条件下计 算出来的,它是用于决定是否拒绝 H0 的统计量,其统 计分布在统计推断中至关重要。
3、确定 P 值和作出推断结论
根据算出的检验统计量如 t、u 值,查相应的界
值表,即可得到概率 P。
P 是指从 H0 规定的总体作随机抽样,抽得等于 及大于现有样本获得的检验统计量值的概率。
1 称为检验效能(power of a test)。其意义是 当两总体确有差异,按规定检验水准 能发现该差 异的能力。如1 = 0.90,意味着若两总体确有差
别,则理论上在100次检验中,平均有90次能够得出 有统计学意义的结论。
拒绝H0,只可能犯 I 型错误,不可能犯 I I型错 误;不拒绝H0,只可能犯 II 型错误,不可能犯 I 型 错误。
n1 n2 2
n1 n2
30 28 2
30 28
=n1+n2–2=30+28–2=56
概率与统计中的假设检验和方差分析
概率与统计中的假设检验和方差分析统计学是研究数据收集、分析和解释的科学。
在统计学的研究中,假设检验和方差分析是两个重要的工具。
本文将对这两个概念进行详细介绍,并探讨它们在实际问题中的应用。
一、假设检验假设检验是指根据样本数据对总体参数提出的关于总体的假设进行检验的过程。
假设检验主要包括以下几个步骤:1. 提出原假设(H0)和备选假设(H1):原假设是对总体参数的某种陈述,备选假设是对原假设的否定。
例如,假设检验中常见的原假设是总体参数等于某个特定值,备选假设是总体参数不等于该特定值。
2. 选择检验统计量:检验统计量是根据样本数据计算的统计量,用于衡量观察到的样本结果与原假设之间的差异。
3. 确定显著性水平(α):显著性水平是在假设检验中指定的判断标准,通常取0.05或0.01。
当P值(观察到的统计量发生的概率)小于显著性水平时,拒绝原假设,否则接受原假设。
4. 进行假设检验:根据选择的检验统计量,计算其观察值,并与理论上的检验统计量分布进行比较,得出拒绝或接受原假设的结论。
假设检验在实际中的应用非常广泛,比如医学研究中对新药物疗效的检验、市场调研中对产品平均销量的检验等。
二、方差分析方差分析是一种用于比较多个总体均值差异是否显著的统计方法。
方差分析的基本思想是将总体的差异分解成不同成分,通过比较成分之间的差异来判断总体均值是否存在差异。
方差分析主要包括以下几个步骤:1. 提出假设:假设要比较的多个总体没有显著差异(H0),备选假设为多个总体之间存在显著差异(H1)。
2. 计算变异程度:将总体的差异分解成组间变异和组内变异两部分。
组间变异是指各个样本均值与总体均值之间的差异,组内变异是指同一样本内各个观测值与样本均值之间的差异。
3. 计算F值:根据组间变异和组内变异的比值计算F值。
F值越大,说明组间差异相对于组内差异的贡献越大。
4. 判断显著性:将计算得到的F值与理论上的F分布进行比较,得出拒绝或接受原假设的结论。
8.1 假设检验的基本思想与步骤
如在工件直径的假设检验问题中,设α1 < α2 < α3, 对不同的分位数
电子科技大学
假设检验基本思想
(x)
显著性水 平α3下拒
绝H0
- u1 - u2- u3
u3 u2 u1
显著性水平α2下接受H0
α1 < α2 < α3
电子科技大学
假设检验基本思想
注2 在确定H0的拒绝域时应遵循有利准则: 将检验统计量对H0有利的取值区域确定为接受 域,对H1成立有利的区域作为拒绝域. 如在工件直径假设检验问题中
1.提出原假设:根据实际问题提出原假设
H0和备选假设H1;
电子科技大学
假设检验基本思想
2. 建立检验统计量:寻找参数的一个良好 估计量,据此建立一个不带任何未知参数的统
计量U作为检验统计量,并在H0成立的条件下,
确定U的分布(或近似分布);
2
3.确定H0的否定域:根据实际问题选定显
著性水平α,依据检验统计量的分布与H0的内
给定α,H1的否定域为:
x
-
0
-
0
n
uα
例中
x
-
2
-0.022
-
0
n
u0.05
-0.0165
拒绝H0,即认为新工艺使工件直径偏小.
大样本假设检验例
电子科技大学
假设检验基本思想
四、两类错误 1)假设检验的主要依据是“小概率事件原 理”,而小概率事件并非绝对不发生. 2)假设检验方法是依据样本去推断总体,样 本只是总体的一个局部,不能完全反映整体 特性.
假设检验
假设检验一、基本思想与基本步骤(一)假设检验问题[例1.6-1]某厂生产某种化纤的纤度X服从正态分布N(μ,0.042),其中μ的设计值为1.40,每天都要对“μ=1.40”作例行检验,以观生产是否正常运行。
某天从生产线中随机抽取25根化纤,测得纤度值为:x1,x2,…,x25其纤度平均值=1.38,问当日生产是否正常。
几点评论:(1)这不是一个参数估计问题。
(2)这里要求对某个命题“μ=1.40”回答:是与否。
(3)这一类问题被称为(统计)假设检验问题。
(4)这类问题在质量管理中普遍存在。
(二)假设检验的基本步骤假设检验的基本思想是:根据所获样本,运用统计分析方法,对总体X的某种假设H0做出接受或拒绝的判断。
具体做法如下:1.建立假设H0:μ=1.40这是原假设,其意是:“与原设计一致”,“当日生产正常”等。
要使当日生产与1 40无差别是办不到的,若差异仅是由随机误差引起的,则可认为H0成立;若由其他特殊因素引起的,则认为差异显著,则应拒绝H0。
H1:μ≠1.40 这是备择假设,它是在原假设被拒绝时而应接受的假设。
在这里,备择假设还有两种设置形式,它们是:H12:μ<1.40,或H13:μ>1.40 备择假设的不同将会影响下面拒绝域的形式,今后称H0对H1的检验问题是双边假设检验问题H0对H12的检验问题是单边假设检验问题H0对H13的检验问题也是单边假设检验问题注:若假设是关于总体参数的某个命题,称为参数的假设检验问题,比如:H0:μ=μ0,H1:μ≠μ0,H0:σ2≤σ20,H1:σ2>σ20,H0:P≥P0,H1:P<P0,都是参数假设检验问题。
东莞德信诚精品培训课程(部分)(点击课程名称打开课程详细介绍)内审员系列培训课程查看详情TS16949五大工具与QC/QA/QE品质管理类查看详情 JIT东莞德信诚公开课培训计划>>> 培训报名表下载>>> /download/dgSignUp.doc2.选择检验统计量,给出拒绝的形式这个假设检验问题涉及正态均值μ。
概率论与数理统计第八章假设检验
对于(a)小概率P{X 0 u }
u是所选取合适的统计量 U 的分位点
1
单侧检验
P{ X 0 u } x 0 u为拒绝区域
其含义是依这样本x所推断的
小
概率
事
件H
发生
0
了
,
拒
绝H
0
u
拒绝
1
u 拒绝
对于(b)小概率P{X 0 u } (密度函数为对称时)
由 经 验 知 0.015公 斤 , 为 了 检 验 某 天 机器 工 作 是 否 正 常 , 抽 取其 所
包 装 的9袋 称 得 重 量 分 别 为0:.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.519; 问这天机器正常否?
现在另一天任然抽取9袋得样本均值x 0.511公斤,推断这天机器是否工作正常?
小 概 率 事 件 是: 样 本 均 值X与 所 假 设 的 期 望0相 差 X 0
不 能 太 大, 若 相 差 太 大 则 拒 绝H0
小概率事件P{ X 0 u }
u
是
2
所
选
取
合
适
的
统
计
量U
2
的
2
分
位
点
1
P{ X 0 u } x 0 u 为拒绝区域 2
较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用 表示.
6.1假设检验的基本思想和程序
例6.1.2 某研究所推出一种感冒特效新药,为证明其疗效,选择 200名患者为志愿者.将他们均分为两组,分别不服药或服药,观察 三日后痊愈的情况,得出下列数据.
是否痊愈 服药情况 未服药者 服药者
痊愈者 48 56 104
未痊愈者 52 44 96
合计 100 100 200
合 计
问新药是否确有明显疗效? 这个问题就不存在估计什么的问题.从数据来看,新药似乎有一定 疗效,但效果不明显,服药者在这次试验中的情况比未服药者好, 完全可能是随机因素造成的.对于新药上市这样关系到千万人健康 的事,一定要采取慎重的态度.这就需要用一种统计方法来检验药 效,假设检验就是在这种场合下的常用手段.具体来说,我们先不 轻易地相信新药的作用,因此可以提出假设“新药无效”,除非抽 样结果显著地说明这假设不合理,否则,将不能认为新药有明显的 疗效.这种提出假设,然后做出否定或不否定的判断通常称为显著 性检验.
0 0
0
0
2
1
0
U
0
n
200
25
N 0,1
取α=0.05 由 Pu u1 查表得 u1=1.65. 我们称 u1 为该处临界值(它相当于上面的k 值),将观察值代入(7.1) 中算得U 的观察值为 u =4.375 1.65= u1. 称作显著性假设检验. 像上面那样,只对H作接受或否定的检验, 0 称作显著性水平,简称水平,它是判断零假设 真伪的依据,按 上面的讨论,我们由水平确定出临界值 1后,实际上把检验统 计量U的可能取的观察值划分成两个部分:
C (u1 , ), C 0, u1
显然当 U的观察值 u落入C ,则拒绝 H 0,所以我们称 C为拒绝域或临 界域.
东华大学《概率论与数理统计》课件 第七章 假设检验
1. 2为已知, 关于的检验(U 检验 )
在上节中讨论过正态总体 N ( , 2 ) 当 2为已知时, 关于 = 0的检验问题 :
假设检验 H0 : = 0 , H1 : 0 ;
我们引入统计量U
=
− 0 0
,则U服从N(0,1)
n
对于给定的检验水平 (0 1)
由标准正态分布分位数定义知,
~
N (0,1),
由标准正态分布分位点的定义得 k = u1− / 2 ,
当 x − 0 / n
u1− / 2时, 拒绝H0 ,
x − 0 / n
u1− / 2时,
接受H0.
假设检验过程如下:
在实例中若取定 = 0.05, 则 k = u1− / 2 = u0.975 = 1.96, 又已知 n = 9, = 0.015, 由样本算得 x = 0.511, 即有 x − 0 = 2.2 1.96,
临界点为 − u1− / 2及u1− / 2.
3. 两类错误及记号
假设检验是根据样本的信息并依据小概率原
理,作出接受还是拒绝H0的判断。由于样本具有 随机性,因而假设检验所作出的结论有可能是错
误的. 这种错误有两类:
(1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称做第一类错误, 又叫弃
设 1,2, ,n 为来自总体 的样本,
因为 2 未知, 不能利用 − 0 来确定拒绝域. / n
因为 Sn*2 是 2 的无偏估计, 故用 Sn* 来取代 ,
即采用 T = − 0 来作为检验统计量.
Sn* / n
当H0为真时,
− 0 ~ t(n −1),
Sn* / n
由t分布分位数的定义知
第三章 4 假设检验的基本原理与步骤A版
假设检验的基本原理和步骤●某一样本均数是否来自于某已知均数的总体?●两个不同样本均数是否来自均数不相等的总体?要回答这类问题:----参数估计----假设检验(hypothesis test)假设检验过去称显著性检验。
它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。
然后在H0成立的条件下计算检验统计量,最后获得P值来判断。
例1某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。
问从事铅作业工人的血红蛋白是否不同于正常成年男性的均数140g/L?本例:μ=140g L,X=130.83g Lμ?①单纯抽样误差造成的(μ=μ0);造成X≠μ0的情况有二:②抽样误差和本质异造成的(μ≠μ0)。
假设检验的目的就是判断差别是由哪种情况造成的。
男性铅作业工人血红蛋白μ=140g/L一种假设H 0:μ=μ0男性铅作业工人血红蛋白μ≠140g/L另一种假设H 1:μ≠μ0 X=130.83 g L 抽样误差抽样误差总体不同1.建立检验假设,确定检验水准(选用单侧或双侧检验)(1)无效假设又称零假设,记为H0;(2)备择假设又称对立假设,记为H1。
对于检验假设,须注意:①检验假设是针对总体而言,而不是针对样本;②H0和H1是相互联系,对立的假设,后面的结论是根据H0和H1作出的,因此两者不是可有可无,而是缺一不可;③H1的内容直接反映了检验单双侧。
若H1中只是μ>μ0或μ<μ0,则此检验为单侧检验。
它不仅考虑有无差异,而且还考虑差异的方向。
例如表1 样本均数(代表未知总体均数μ)与已知总体均数μ比较的t 检验目的H0H1双侧检验单侧检验是否μ≠μ0是否μ>μ0是否μ<μ0μ=μ0μ=μ0μ=μ0μ≠μ0μ>μ0μ<μ0表2 两样本均数(分别代表未知总体均数μ1与μ2)比较的t 检验目的H0H1双侧检验单侧检验是否μ1≠μ2是否μ1>μ2是否μ1<μ2μ1=μ2μ1=μ2μ1=μ2μ1≠μ2μ1>μ2μ1<μ2④单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。
假设检验的5个步骤
假设检验的5个步骤假设检验是一种常用的统计分析方法,用于从样本数据得出关于总体参数的推断,借助统计学的方法进行识别。
它的基本思想是通过对样本数据的分析,判断总体参数是否具有某种特定的性质。
下面将介绍假设检验的五个基本步骤:1. 提出假设:假设检验的第一步是提出一个原假设(H0)和一个备择假设(H1)。
原假设通常是我们希望验证或者接受的假设,而备择假设则是对原假设的否定或者其他可能的假设。
这两个假设应该是互斥的,即它们不能同时成立。
2. 确定显著性水平:显著性水平(α)是我们在假设检验中设置的决策标准,用于判断样本数据对原假设的支持程度。
通常情况下,α的取值为0.05或0.01,这意味着我们愿意接受犯错的风险为5%或者1%。
3. 选择合适的检验统计量:根据研究目的和所要检验的参数,选择适当的检验统计量。
常用的统计量包括z检验和t检验等。
它们的选择基于总体分布的已知信息,例如总体均值的标准差是否已知、样本容量的大小等。
选择合适的检验统计量可以提高假设检验的效能。
4. 计算检验统计量的值:利用样本数据计算出检验统计量的具体值。
这个值反映了样本数据与原假设相符或者不符的程度。
与检验统计量配套的还有自由度,它用于确定理论上的分布和对应的临界值。
根据计算出的检验统计量的值和自由度,可以查找相应的临界值。
5. 做出决策:根据检验统计量的值和临界值比较,可以进行决策并给出相应的结论。
如果检验统计量的值落在拒绝域(即超过临界值),则拒绝原假设,接受备择假设;否则,接受原假设。
同时,还可以计算p值来辅助决策。
p值是指在原假设下,观察到的样本结果或者更极端结果发生的概率。
根据预先设定的显著性水平,如果p值小于显著性水平,则拒绝原假设,接受备择假设。
总之,假设检验是一种基于样本数据的统计方法,它包括假设的提出、显著性水平的确定、检验统计量的选择和计算、以及做出决策这五个基本步骤。
合理地应用这些步骤可以帮助我们从样本中得出关于总体参数的推断,并作出科学、准确的统计决策。
第8章 假设检验
关于建立假设的几点认识:
❖ 1.原假设和备择假设是一个完备事件组,且相互对 立,即必有一个成立,而且只有一个成立。
❖ 2.在假设检验中,通常将符号≤ ≥ =放在原假设上。 ❖ 3. 不同的研究者出于不同的研究目的或角度,可能
根据计算的检验统计 量与临界值进行比较, 得出拒绝或不拒绝原 假设的结论
检验统计量与拒绝域
拒绝原假设的检验统计量的所有可能取 值的集合,称为拒绝域。
若 绝对值Z临界值,拒绝原假设
拒绝域的大小与我们事先选定的显著性 水平有关。
根据选定的显著性水平确定的拒绝域的 边界值,称为临界值。
选定的显著性水平后,查阅书后的附表 就可以得到具体的临界值,将检验统计 量与之比较,就可以作出拒绝或接受原 假设的决策。
H0 H1
研究的问题 双侧检验 左侧检验 右侧检验
= 0
8.1.4 用P 值进行假设检验
❖ P 值是一个概率值(194页) 左侧检验时,P值为曲线左边小于等于检
验统计量部分的面积
右侧检验时,P值为曲线右边大于等于检
验统计量部分的面积
双侧检验时P值为曲线两边大于等于或小于 等于检验统计量部分的面积检验统计量部
什么是原假设?
1. 待检验的假设,又称“0假设”
为什么叫0 假设?
2. 研究者想收集证据予以反对的假设
3. 总是有等号 , 或
4. 表示为 H0 例如, H0: 3190(克)
什么是备择假设?
1. 与原假设对立的假设,也称“研究假设”
2. 研究者想收集证据予以支持的假设,总 是有不等号: , 或
假设检验的基本思想
例8.2 某预制品厂生产的混凝土制件,由于原料和生产过程的种种
随机因素,各制件的抗压强度一般是不完全相同的,为了研究混 凝土制件抗压强度的分布,随机抽样试验了200件混凝土制件的抗 压强度,以分组的形式给出如下数据:
问:能否认为这种混凝土制件的抗压强度服从正态分布? 与上例相似,先建立假设:假设混凝土制件的抗压强度服从正 态分布,然后通过抽取样本的信息来推断这种假设的正确性。这 种类型的假设检验一般称为非参数假设检验。
因为X ~ N ( μ , σ2),当 H0 : μ = μ0 = 355为真时,X ~ N ( μ , σ2),
于是
1 n
X = n i1 X i
N
(
0
,
2
n
)
Z X 0 X 0 N (0,1) , 2 n n
给定一个小概率 α ,存在一个分位数 z 2 ,
使得
P{| Z | z 2} .
例8.1 机器罐装的牛奶每瓶标明为355毫升,设 X 为实际容量,由过
去的经验知道,在正常生产情况下,X ~ N ( μ , σ2)。根据长期的经 验知其标准差 σ =2毫升。为检验罐装生产线的生产是否正常,某 日开工后抽查了12瓶,其容量为:
350,353,354,356,351,352, 354,355,357,353,354,355
若取 α =0. 05,则 P{| Z | 1.96} 0.05 ( 查附表2标准正态分布
表可得 z 0.025=1. 96 ) 将样本观测值代入 Z 得
Z X 0 353.67 355 =2.3>1.96 .
n
2 12
因为 α = 0.05 很小,根据实际推断原理,即“小概率事件在一 次试验中几乎是不可能发生 的”,当 H0 为真时,事件 P{|Z| >1.96} = 0.05 是小概率事件,实际上是不可能发生的。现在抽样的结果是: |Z| =2. 3 >1. 96,也就是说,小概率事件 P{|Z| >1.96} = 0.05居然在 一次抽样中发生了,这是一个几乎矛盾的结果,因而不能不使人 怀疑假设 H0 的正确性,所以在显著性水平 α = 0.05下,我们拒绝 H0 ,接受 H1 ,即认为这一天罐装生产线的生产是不正常的。
简述统计假设检验的基本步骤
统计假设检验的一般步骤(1)根据实际问题的要求,充分考虑和利用已知的背景知识,提出原假设H及备择假设1H;(2)给定显著性水平α以及样本容量n;(3)确定检验统计量U,并在原假设H成立的前提下导出U的概率分布,要求U的分布不依赖于任何未知参数;(4)确定拒绝域,即依据直观分析先确定拒绝域的形式,然后根据给定的显著性水平α和U的分布,由P{拒绝H|0H为真}=α确定拒绝域的临界值,从而确定拒绝域;(5)作一次具体的抽样,根据得到的样本观察值和所得的拒绝域,对假设H作出拒绝或接受的判断.扩展:假设检验的基本思想假设检验的基本思想实质上是带有某种概率性质的反证法. 为了检验一个假设H是否正确, 首先假定该假设0H正确, 然后根据样本对假设H作出接受或拒绝的决策. 如果样本观察值导致了不合理0的现象的发生, 就应拒绝假设H, 否则应接受假设0H.假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则, 即小概率事件在一次试验中是几乎不发生的. 但概率小到什么程度才能算作“小概率事件”, 显然, “小概率事件”的概率越小,否定原假设H就越有说服力. 常记这个概率值为)1α,称为检验的显著性水平. 对不同的问题, 检验的显著性0(<<α水平α不一定相同, 但一般应取为较小的值, 如0.1,0.05或0.01等.假设检验的两类错误当假设H正确时, 小概率事件也有可能发生, 此时我们会拒绝假设H, 因而犯了“弃真”的错误, 称此为第一类错误. 犯第一类错误0的概率恰好就是“小概率事件”发生的概率α, 即P{拒绝H|0H为真}=α.反之, 若假设H不正确, 但一次抽样检验结果, 未发生不合理结果,这时我们会接受H, 因而犯了“取伪”的错误,称此为第二类错误. 记β为犯第二类错误的概率, 即P {接受0H |0H 不真}=β.理论上, 自然希望犯这两类错误的概率都很小。
当样本容量n 固定时, α,β不能同时都小, 即α变小时, β就变大;而β变小时,α就变大.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 0
)
May-20
-
0
n
uα / 2
X 500
0
n
uα
/
2
有利于H0
)
(
m0=500
x
X 的值越接近于m0 =500,越有利于H0成立,
不利于H1成立,故对给定a,H0的拒绝域为:
电子科技大学
假设检验基本思想
May-20
x - m0
0
n
uα / 2或源自ux - m0 0 / n
uα / 2
2)若检验H0:m = m0=500,H1:m < m0;
U X - m0 X - m m - m0 ~ N ( m - m0 ,1)
0 n 0 n 0 n
0 n
电子科技大学
假设检验基本思想
检验 H0:μ=μ0,H1:μ≠μ0;
不否 定H0
May-20
来自正态 总体
N(m1,2)
的可能性 也很大.
m0
ua/2 m1
电子科技大学
假设检验基本思想
犯第一类错误的概率为
取检验统计量
X - 500 U
0 n
电子科技大学
假设检验基本思想
检验 H0:m =m0=500,H1: m <m0
May-20
(
x;
m0
,
2 0
)
-
σ
0
n
uα
X 或 500
有利H0
)
μ0=500
x
电子科技大学
假设检验基本思想
给定α,H1的否定域为:
x
-
m0
-
0
n
uα
大样本假设检验例
May-20
著性水平α,依据检验统计量的分布与H0的内
容,确定H0的否定域;
3
电子科技大学
假设检验基本思想
May-20
4. 对H0作判断:根据样本值算出检验统计 量的统计值u,判断u是否落在拒绝域,以确
定拒绝或接受H0 .
4
对原假设H0做出判断,称为对H0做显著性
检验, 1-a 称为置信水平.
注1 对不同的显著性水平a,有不同的否
根据问题的需要提出的一对对立的假设,
记H0为原假设或零假设; 与原假设H0相对立的假设称为备选假设,
记为H1.
相对于原假设, 可考虑不同的备选假设, 如
电子科技大学
假设检验基本思想
May-20
1) H0:μ=μ0, H1: μ≠μ0;
2) H0:μ=μ0, H1: μ=μ1; 3) H0:μ≤μ0, H1: μ>μ0; 4) H0:μ=μ0, H1: μ<μ0;…….
May-20
假设检验基本思想:提出统计假设, 根据小 概率事件原理对其进行检验.
二、基本概念
工件直径的假设检验
1. 参数与分布的假设检验
1)关于总体参数的假设检验, 如 H0:μ=μ0
电子科技大学
假设检验基本思想
May-20
2)关于总体分布的假设检验,如
H0: F(x)=Ψ(x;μ,σ2)
2. 原假设与备择假设
May-20
现随意从中抽出一个球, 发现是黑球, 怎样 解释这一事实?
可有两种解释:
1)他的猜测是正确的,恰抽得黑球是随机性 所致;
2)他的猜测错了. 应接受哪一种呢?
根据小概率事件原理, 事件A的发生不能不 使人们怀疑他的猜测,更倾向于认为箱中白球 个数不是95个.
电子科技大学
假设检验基本思想
引例 2
判断 真实情况 判断 正误
H0 真
拒绝H0
犯第一类错 误(弃真)
接受H0
判断正确
H1 真
判断正确
犯第二类错 误(纳伪)
电子科技大学
假设检验基本思想
检验假设 H0:μ=μ0, H1:μ≠μ0 , 当 H0 成立时,
May-20
U X - m0 ~ N(0,1) 0 n
若H1 成立时,(即μ≠μ0)
葡萄糖自动包装机工作检测
1.提出原假设:根据实际问题提出原假设 H0和备选假设H1;
电子科技大学
假设检验基本思想
May-20
2. 建立检验统计量:寻找参数的一个良好 估计量,据此建立一个不带任何未知参数的统
计量U作为检验统计量,并在H0成立的条件下,
确定U的分布(或近似分布);
2
3.确定H0的否定域:根据实际问题选定显
May-20
注2 在确定H0的拒绝域时应遵循有利准则: 将检验统计量对H0有利的取值区域确定为接受 域,对H1成立有利的区域作为拒绝域.
在例子:葡萄糖自动包装机中
1)若检验H0:m =m0=500,H1:m≠m0=500;
取检验统计量
X - 500 U
0 n
电子科技大学
假设检验基本思想
(
x;
m0
,
电子科技大学
假设检验基本思想
May-20
四、两类错误
1)假设检验的主要依据是“小概率事件原
理”,而小概率事件并非绝对不发生.
2)假设检验方法是依据样本去推断总体,样 本只是总体的一个局部,不能完全反映整体 特性.
无论接受或拒绝原假设H0 都可能做出错误的判断
电子科技大学
假设检验基本思想
两类错误
May-20
3. 检验统计量
用做检验统计推断的统计量.
4. 假设检验的接受域和拒绝域
根据假设检验目的, 由样本去推断是否接 受原假设H0 .
电子科技大学
假设检验基本思想
May-20
接受域 使H0得以接受的检验统计量取值的 区域A.
拒绝域(或否定域):使H0被否定的检验统计 量取值的区域R.
三.假设检验的基本步骤
假设检验基本思想
May-20
§8.1 假设检验的基本思想与步骤
一.假设检验的基本思想
引例1 已知一个暗箱中有100个白色与黑 色球,不知各有多少个.现有人猜测其中有95 个白色球,是否能相信他的猜测呢?
他相当于提出假设: p=P(A)=0.05,A={任取一球是黑球}.
电子科技大学
假设检验基本思想
电子科技大学
假设检验基本思想
May-20
例8.1.1 在一次社交聚会中, 一位女士宣称 她能区分在熬好的咖啡中,是先加奶还是先加 糖,并当场试验,结果 8 杯中判断正确 7 杯.但 因她未完全说正确,有人怀疑她的能力!该如 何证明她的能力呢?
在场的一位统计学家给出了如下的推理思路: 设该女士判断正确的概率为p
P{ U
ua 2
H0真} a
犯第二类错误的概率β(μ)
May-20
显著性水平
Pm {U
ua } 2
(m),
m m0
不可能使两类错误同时都尽可能小!
减小一类错误,必然使另一错误增大.
按照奈曼—皮尔逊(Neyman-Pearson)提出的原则:
先控制犯第一类错误的概率a,然后再使犯第二类错误 的概率尽可能地小(m) 。
定域,从而可能有不同的判断结论.
如在工件直径的假设检验问题中,设a1 < a2 < a3, 对不同的分位数
电子科技大学
假设检验基本思想
(x)
May-20
显著性水 平α3下拒
绝H0
-
ua1-
ua
-
2
ua
3
ua3ua2 ua1
显著性水平α2下接受H0
α1 < α2 < α3
电子科技大学
假设检验基本思想