参数估计与假设检验的区别和联系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
参数估计与假设检验的区别和联系
统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。
(一)参数估计就是用样本统计量去估计总体的参数,它的方法有点估计和区间估计两种。
点估计是用估计量的某个取值直接作为总体参数的估计值。
点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。
区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。
在区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。
统计学家在某种程度上确信这个区间会包含真正的总体参数。
在区间估计中置信度越高,置信区间越大。
置信水平为1-a, a为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01, 0.05, 0.1。
置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。
一个总体参数的区间估计需要考虑总体分布是否正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等。
(1)来自正态总体的样本均值,不论抽取的是大样本还是小样本,均服从正态分布。
(2)总体不是正态分布,大样本的样本均值服从正态分布,小样本的服从t 分布。
(3)不论已判断是正态分布还是t 分布,如果总体方差未知,都按t 分布来处理。
(4)t 分布要比标准正态分布平坦,那么要比标准正态分布离散,随着自由度的增大越接近。
(5)样本均数服从的正态分布为N(u , a^2/n)远远小于原变量离散程度N (u, a^2) 。
(二)假设检验是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参
数提出一个假设,然后利用样本信息判断这一假设是否成立。
假设检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立,如果成立的可能性是一个小概率的话,就拒绝该假设,因此称小概率的反证法。
最重要的是看能否通过得到的样本信息去推翻原定的假设,而不是证实它,我们期望接受的是备择假设。
统计学中假设检验的基本步骤:
(1)建立假设,确定检验水准α,假设含有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设。
H0和H1的关系是互相对立的,如果拒绝H0,就要接受H1,根据备择假设不同,假设检验有单侧、双侧检验两种。
检验水平用α表示,通常取0.05或0.10,检验水平就是该检验犯第一类错误(弃真)的概率。
(2)根据研究目的和设计类型选择适合的检验方法
这里的检验方法,是指参数检验方法,有u检验、t检验和方差分析三种,对应于不同的检验公式。
(3)确定P值并作出统计结论
u检验得到的是u统计量或称u值;t检验得到的是t统计量或称t值;方差分析得到的是F统计量或称F值。
将求得的统计量绝对值与界值相比,可以确定P值。
当α=0.05时,u值要和u界值1.96相比较,确定P值。
如果u<1.96,则P>0.05,反之,如u>1.96,则P<0.05。
t值要和对应自由度的t界值(也称分位数)相比较,确定P值。
如果t值<t界值,故P>0.05。
反之,如t>t界值,则P<0.05。
相同自由度的情况下,单侧检验的t界值要小于双侧检验的t界值,因此有可能出现算得的t值大于单侧t界值,而小于双侧t界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。
即单侧检验更容易出现阳性结论。
当P>0.05时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。
当P<0.05时,拒绝零假设,接受备择假设,认为差异有统计学意义,也可以理解为二者存在质的区别。
但即使检验结果是P<0.01甚至P<0.001,都不说明差异相差很大,只表示更有把握认为二者存在差异。
(三)参数估计与假设检验之间的联系与区别:
(1)主要联系:
a. 都是根据样本信息推断总体参数;
b. 都以抽样分布为理论依据,建立在概率基础上的推断,因此推断结果都有一定的可信程度或风险。
;
c. 对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换,形成对偶性。
区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。
(2)主要区别:
a. 参数估计是以样本数据估计总体参数的真值;假设检验是以样本数据为依据,检验对总体参数的先验假设是否成立;
b. 区间估计求得的是以样本估计值为中心的双侧置信区间;而假设检验以总体参数假设值为基准,不仅有双侧检验也有单侧检验。
c. 区间估计立足于大概率,通常以较大的把握程度(置信水平)1-α去保证总体参数的置信区间;假设检验立足于小概率,通常是给定很小的显著性水平α去检验对总体参数的先验假设是否成立。
假设检验分:参数假设检验、总体分布假设检验、相互关系假设检验(两个变量是否独立,两个分布是否相同)等,我们的教材中主要讨论参数假设检验。
参数假设检验:先对未知的总体参数的取值提出某种假设,然后抽取样本,利用样本信息来检验这个假设是否成立。
注:⒈原假设H0一定含有等号=;
⒉根据原假设是否含不等号≠,假设检验分为双侧(不含≠)
假设检验和单侧(含≠)假设检验;
3. 单侧假设检验分为左侧和右侧检验(拒绝域在哪一侧,则称为那
一侧检验)。
原假设提出规则:
一、单侧检验原假设的确立
Ⅰ对于检验某项研究是否达到了预期效果
一般是将研究的预期效果(希望、想要证明的假设)作为备择假设H1,将认为研究结果无效作为原假设H0。
先确立备择假设H1。
因为只有当检验结果与原假设有明显差别时才能拒绝原假设而接受备择假设,原假设不会轻易被拒绝,就使得希望得到的结论不会轻易被接受,从而减少结论错误。
Ⅱ对于检验某项声明的有效性(根据不同的背景来建立原假设,以商店向工厂进货为例)
一般可将所作的声明作为原假设。
将对该声明的质疑作为备择假设。
先确立原假设H0。
因为除非有证据表明“声明”无效,否则就应认为该“声明”是有效的。
例如:一商店经常从某工厂购进某种商品,该商品质量指标为X,X值愈大商品质量愈好。
商店提出的进货条件是按批验收,只有通过假设“X≥X0”检验的批次才能接受。
有两种可能情况:
⑴如果根据过去较长时间购货记录,商店相信该厂产品质量好,于是同意把原假设定为H0:“X≥X0”,而且选择较低的检验显著性水平。
这对工厂是有利的,使得达到质量标准的产品以很小的概率被拒收。
虽然这会使商店面临接受不合标准产品的风险,但历史记录显示出现这种情况的可能性很小,而且商店也可因此获得较好的货源。
⑵如果过去一段时期的记录表明,该厂产品质量并不理想,商店则会坚持以H0:“X≤X0”为原假设,并选定较小的检验显著性水平。
这对商店是有利的,不会轻易地拒绝原假设,有 1-α的可能把劣质产品拒之门外。
二、确定适当的检验统计量
假设检验根据检验内容和条件不同需要采用不同的检验统计量。
在单个正态总体的参数检验中:
Z 统计量(方差已知时)和t 统计量(方差未知时)常用于均值的检验; Z 统计量用于比例的检验;
χ2统计量用于方差的检验。
选择检验统计量需考虑的因素有被检验的参数类型、总体方差是否已知、用于检验的样本量大小等(在大样本条件下方差未知也可以用Z 统计量进行均值检验,这是由中心极限定理保证的)。
三、确定显著性水平α和临界值及拒绝域
显著性水平α是当原假设为正确时被拒绝的概率,是由研究者事先确定的。
显著性水平α的大小应根据研究需要的精确度和可靠性而定。
通常取α=0.05或α=0.01,即接受原假设的决定是正确的可能性(概率)为95%或99%。
根据给定的显著性水平,查表得出相应的临界值,同时指定拒绝域。
(四)根据样本数据计算检验统计量的值
例如,总体标准差σ已知时根据样本均值计算统计量Z 的公式为
(五)将检验统计量的值与临界值比较,作出拒绝或接受原假设的决策
如果检验统计量的值落入拒绝域,则拒绝原假设,接受备择假设;如果检验统计量的值落入接受域,则接受原假设,拒绝备择假设。
注:所谓的某侧检验,就是检验样本统计量的观测值是否落入某侧的拒绝域,
比如:左侧(即备择假设中取值方向,亦即拒绝域所在方向)检验就是看样本统计量的观测值是否落入左侧的拒绝域。
)1,0(~/-0N n X Z σμ=。