假设检验的基本思想
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验的基本思想
统计推断的另一类重要问题是参数的假设检验.它是根据样本的信息来判断总体
分布是否具有指定的特征,在管理方面有时称之为古典决策.在质量管理中经常要用
到它,例如检验新产品质量是否有显著提高;又如利用各种控制图判断工序是否出现
异常现象等.
在数理统计中,我们把需要用样本去判断正确与否的命题称为一个假设.根据研
究目的提出的假设称为原假设,记为H0;而其对立面假设称为备择假设(或对立假设),记为H1.
提出了“假设”之后,就要用适当的统计方法来决定是否接受假设,这叫做假设
检验或称统计假设检验.
在许多实际问题中,总体分布的类型为已知,仅其中一个或几个参数为未知,只要将一个或几个未知参数作出假设,就可以确定总体的分布,这种仅涉及到总
体分布的未知参数的统计假设称为参数假设,相应的检验方法称为参数假设检验.如果不知道被研究总体分布的具体类型,只能对未知分布函数的类型或者它的某些特性提出某种假设,这种不同于参数假设的假设称为非参数假设,相应的检验
方法称为非参数统计检验.在本节中我们只讨论参数假设检验问题.
下面举例说明参数假设检验的基本思想.
例3.8.1某厂为了提高其产品电池的寿命进行了工艺改革.从生产的一大批产品
中随机抽取10只,测得其样本均值,已知旧工艺条件下的电池寿命服从
正态分布N(200, 52),试问新产品的寿命与旧产品的寿命是否一致.
解.一般说来,工艺条件的变化只影响均值而对方差影响不大.因此,可以认为新
产品寿命X服从正态分布N(μ, 52),μ是未知的, 而μ=200是否成立也是未知的.我们
已知μ的估计值,,能否说μ>200呢?不能.因为样本均值是
随机变量,若再抽10个产品,其平均寿命可能小于200,随机变量与常数之间不能比
大小.那么如何利用样本信息对假设μ=200或μ≠200做出推断呢?
如果原假设μ=200成立,那么X ~N(200, 52),从而由单个总体的抽样分布中的结论有
~N(200, 25/10)
统计量~N(0, 1),
对于给定的α=0.05,
令
或
为保证服从标准正态分布的统计量U落在[-Uα/2, Uα/2]区域内的概率为0.95%,因此查标准正态分布函数数值表有Uα/2 =1.96.
由于的观测值,因此统计量U的观测值u0满足
而由前可知:
是一个小概率.这就意味着,若原假设H0: μ=200成立,那么由抽出的样本观测值计算出的统计量U的观测值|u0|大于1.96的可能性只有5%,而现在它在一次抽样中,竟发生了这种情形,这是不合理的,产生这种不合理的根源在于假设H0: μ=200不合理,因此拒绝H0,而接受H1: μ≠200.
假设检验所依据的基本原理是小概率原理.“小概率事件在一次试验(或观测)中几乎是不可能出现的.”
至于什么算“概率很小”,在检验之前都事先指定,比如5%、1%等,即在检验给
定的一个假设中,所犯的第一类错误的概率,我们把它称为检验的显著性水平或检验水平,这个概率通常用α来表示,它是事先指定的小的正数.
对原假设H0的一个检验就是指定一个规则,它根据所选定的统计量的值来决定拒
绝H0或接受H0,这种检验规则常用拒绝域的形式给出,即按照统计量的值, 把样本空间分成拒绝H0的区域(称为拒绝域)和接受H0的区域(称为接受域),如例3.8.1图中的阴影
部分为拒绝域,其他部分为接受域.
作假设检验时,用来作为拒绝域和接受域的分界线的数值(如例3.8.1中的Uα/2
=1.96和-Uα/2 =-1.96)称为临界值, 即临界值的一边是拒绝域,一边是接受域,因此为了
求检验的拒绝域,就只需求出检验用的临界值.
强调指出,假设检验的结论与选取的显著性水平α有密切的关系.因此必须说明假
设检验的结论是在怎样的显著性水平下做出的.
假设检验有双侧假设检验和单侧假设检验之分.