(抽样检验)第四章抽样理论和参数估计最全版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(抽样检验)第四章抽样理论和参数估计
第四章抽样理论和参数估计
知识引入
1970年美国首次进行征兵抽签,组织者将19-25岁的适龄青年按年龄分组,使用编号
001-366的等重量塑料球,001代表1月1日出生者,031代表1月31日…,366代表12月31日。

然后将所有塑料球放入滚筒中混合抽取号码,每组抽中号码对应生日的青年依次应征,直到人数足够为止。

之后,有记者指出此次抽签产生了严重的偏差,他们注意到,年末生的人似乎倾向于被抽到较前面的征兵顺序。

其结果就是壹堆12月份生的人去了越南战场。

后来,经过统计学家的分析,发现这种“偏差”确实存在;经过分析终于找到了原因,原来代表生日的号码塑料球是壹次按壹整个月份装入滚筒中混合的,加上又没有均匀混合;于是1月份的生日容易在滚筒底下,12月份的是最后才装进去,容易在上面。

在抽样术语中,经常能够听到“随机抽样”、“随机选择”这样的表述,“随机性”原则其实保证了总体中的每个个体被抽中的概率相等,因而被认为是保证各种抽签、选择过程公平、公正的壹个基本手段。

上述抽样就没有保证这种随机性。

在本章中,我们仍会见到,作为推断的基础,我们直接研究的样本是否“得当”对研究总体十分关键,能够通过壹定的抽样设计制定科学、合理、公正的抽样方法。

如上述随机性原则能够保证抽样能够使得样本和总体有相同的内部结构,也就是说有最大的可能使总体的某些特征在样本中得以再现。

本章在介绍必要的抽样概念和抽样方法基础上,重点介绍抽样分布理论,且对参数估计进行简要介绍。

第一节抽样和常用抽样方法
壹、简单随机抽样
抽样(sampling)或取样,在整个研究过程中位于数据收集之前,恰当的抽样设计是保证样本代表性的关键环节,是利用样本对总体进行假设检验或参数估计的基础。

抽样涉及到的壹些基本概念在绪论中均已介绍。

壹个合理可行的抽样设计,壹方面要求针对调查或实验研究的具体情况选择壹种适宜抽样方法;另壹方面应该根据调查研究所要求的精确度及经费状况确定样本容量。

壹般所说的随机抽样,就是指简单随机抽样,它是最基本的抽样方法,适用范围广,最能体现随机性原则且原理简单。

抽取时,总体中每个个体应独立地、等概率地被抽取。

常用的实施方法有抽签法和随机数表法。

1、抽签法:是把总体中的每壹个个体都编上号且做成签,充分混合后从中随机抽取壹部分,这部分签所对应的个体就组成壹个样本。

2、随机数表法:所谓随机数表或乱码表,是由壹些任意的数毫无规律地排列而的数表。

教材附表17即是壹万个数字的随机数表。

随机数表的用法
许多计算机软件都能够自动生成随机数字。

这里介绍教材附录17中乱码表的用法:首先对总体中所有个体依次编号,接着从表中任壹位置(任意行列交叉处)开始,依次往下找足你所需要的随机数(均为5位),以这些随机数为编号的个体即组成壹个样本。

在查找随机数时,有俩点要注意,壹是总体容量是几位数,就从表中随机数末尾截取相应位数(因而最多能够截取4位数,抽取9999个)。

如总体容量为500,则能够见表中数据的末尾三位数,且依次往下找;二是找到的数字若超过总体的容量范围,则跳过,比如总体容量为500,要
求抽取30个,则设定任意起始点往下找,找到壹个数字末尾三位为678,则跳过,见到壹个098,则表示编号098号被抽中,…,直到找满30个为止。

当然这俩种方法都是针对有限总体的,在实际当中的无限总体能够采用其他方法来抽样。

简单随机抽样从理论上说是最符合随机性原则,可是这种方法在实际应用时,存在着壹些不足:首先,对大总体进行编号是相当困难的;其次,由于完全采用随机性,实际抽取的那壹个样本可能不具备总体本应该有的壹些特性。

另外,对于大总体在制签或查表时都是相当困难的。

对于已有顺序编号的大总体,实际当中常常采用等距抽样简洁地实现。

等距抽样也称系统抽样。

顾名思义,它是按照抽样比例(样本容量和总体容量之比)确定抽样间距(抽样比例的倒数),然后从任意起点间隔抽样间距逐个获得样本中的个体。

如壹总体有5000个,要求抽取壹个500人组成样本,即抽样比例为10%,则从任意位置开始(假设总体中所有个体均已编号,且壹般地假设从10以内开始),连续抽取a、a+10、a+20、…、a+4990共500个编号个体作为样本。

二、分层抽样
分层抽样是事先按总体已有的某些特征,将总体分成几个不同的部分,每壹部分叫壹层,再分别在每壹层中随机抽样。

这种方法充分利用了总体的已有信息,因而是壹种非常实用的抽样方法。

对于壹个总体如何分层,分多少层,要视具体情况而定。

壹个总的原则是,各层内个体在该特征上的差异要少,而层和层之间的差异要越大越好。

比如说,对大学生能够按其学校是壹流大学、重点大学、壹般大学来分层。

对于复杂问题仍能够按几个分层标准来分层。

如韦克
斯勒幼儿智力量表在制定常模时,就按年龄、性别、种族、地区、家长职业和城市农村等六个因素来分层,使得样本中各种搭配下的人数比例都和总体尽量接近。

分层抽样在具体实施时,又根据是否知道各层内标准差分成俩种办法:
按各层人数比例分配。

这是在各层内标准差不知道时的分配方式,即让样本中各层人数的比例和总体中各层人数的比例相同。

最佳分配。

这是在已知各层内标准差时的分配方式,它是按标准差大小和总体中各层人数比例共同来确定最终样本中各层人数的比例。

任意壹层中要抽取的人数可表示为:
其中N表示总体容量,n表示样本容量,i表示第i层。

确定了各层内的抽取人数,每层内的抽取可采用简单随机抽样法进行。

三、俩阶段抽样
俩阶段抽样也称为分群抽样,首先是将总体分成若干群,从中随机选出壹些群,这是第壹阶段抽样;再从被选出的群中进行随机抽样,这是第二阶段抽样。

这里分群的原则正好和分层抽样中分层的原则相反,要求各群内个体之间的差异尽量地大,而各群之间就没多大的差异。

比如要进行壹个全国范围内生活消费方面的调查,能够按大城市进行分群,显然各大城市内的居民千差万别,而各个城市之间则相差无几,因此不必选取所有的大城市,能够只从中选择壹部分,然后再在这些城市进行抽样。

在壹个复杂的抽样设计中,往往可能将分层抽样抽样和分群抽样反复应用,最终才得到所要的样本。

如上面的例子中,要在壹个大城市里选取壹部分居民,也不是件容易的事,这时可再分群或分层,直到便于抽样时为止。

四、样本容量的确定
样本容量的大小对统计推断非常重要。

样本容量过小,会影响样本的代表性,使抽样误差增大而降低了统计推断的精确性;而样本容量过大,虽然减小了抽样误差,但可能增大过失误差,且增大经费开支。

另外,样本容量和抽样误差之间且不存在直线关系,随着样本容量的增大,抽样误差减小的速度越来越慢。

对于样本容量的确定受到很多因素的影响,也有很多相应的计算公式,这里不壹壹介绍。

教材中介绍了对样本均值进行推断时利用最大允许抽样误差计算样本容量的方法。

所谓“最大允许抽样误差”是指某壹总体参数和其点估计(抽样所得的统计量)之间的差异在实际中所能接受的最大范围。

比如,对于总体均值μ,它的点估计是,那么在实际中用来估计μ时,研究者所能接受的最大范围就称为最大允许抽样误差,壹般记为d。

确定样本容量的目的就是使抽样的误差在研究者所能接受的的范围以内,因此样本容量和d是有直接关系。

根据下面的抽样分布知识,能够得知:

第二节抽样分布理论
壹、为什么要了解抽样分布
推断统计的核心思想是从特殊到壹般,从部分到全体,即用样本统计量来推断总体参数。

然而,统计推断和直接推断的本质区别在于,后者往往不会关心样本和总体的差异,而直接根据统计量来下结论;这会产生很多偏差。

而统计推断则依据抽样分布理论进行推断,它用概率的形式描绘出样本统计量在无限次抽样(在无限总体中总能够得到无限多个容量有限的样本)中的分布规律,从而帮助我们判断壹次抽样结果的意义。

以壹个有限总体抽样的例子来说明抽样过程。

某班25名同学的某科成绩,它就是要研究的总体:
为了较快地估计该班该课程的平均成绩(总体参数),从中有放回地抽取5名学生(即抽取壹个学生的成绩登记后再放回去抽取下壹个,所以已抽取的可能在后面再次被抽取到),用他们的平均成绩(样本统计量)来反映总的平均情况(实际中,直接对25个数据求平均即可,这里以具体数据说明抽样过程,想象这里的总体为无限容量)。

下表列出了壹种可能的抽样情况:
这里只抽取了3个样本,但可见出每个样本的平均数都和总体均值81.5(实际情况中总体参数往往未知)有些差异,第壹个样本显然比总体均值大多了。

如何判断哪个样本统计量更具有代表性(总体参数未知时),这就需要了解样本平均数的分布规律,以便更好地对总体均值进行估计或推断。

从上面的例子能够见出抽样的实质就是对总体进行n次重复试验或n次重复观察,而每壹次试验或观察都是相互独立的(有放回抽样),即抽样问题就是研究n个“独立同分布”的随机变量的函数问题。

这里“独立”是指n次重复试验互不影响,即各样本独立;“同分布”是这n个随机变量都从同壹总体取值。

所以对于用随机变量X表示的总体,常常用(X1,X2,……,Xn)来表示它的壹个容量为n的样本。

注意,这里的每个Xi作为X的壹次观测值本身也是随机变量。

二、基本随机变量分布和抽样分布
壹般的随机变量概率分布可称为基本随机变量分布,但上述我们要研究的是样本统计量的概率分布。

注意到,根据上述n个独立同分布随机变量计算而来的样本统计量本身也是随机变量,则它们的概率分布就称为抽样分布,即样本统计量或基本随机变量函数的理论分布。

根据样本统计量的不同,可区分样本均值的抽样分布、样本方差的抽样分布、样本相关系数的
抽样分布、比例的抽样分布等。

另外,从分布形态上见,常见的抽样分布主要包括是正态分布、T分布、χ2分布、F分布等,将在后文陆续介绍。

三、抽样分布理论
抽样分布理论是整个推断统计的理论基础,对它们的证明不用理会,只需掌握这些结论及其应用条件。

假设某壹个用随机变量X表示的抽样母总体的均值为μ,方差为σ2,从总体中抽取容量为n 的样本,则有如下结论:
(1)壹切可能样本的平均数的均值(期望)等于母总体的均值,表示为:EX=μ
(2)壹切可能样本的平均数的方差等于母总体方差的n分之壹,表示为:DX=σ2/n
因此样本均值分布的标准差等于母总体标准差的分之壹,称其为标准误(SE),即SE=σ/。

(3)壹切可能样本的方差的均值(期望)等于母总体方差的n分之n-1,表示为:
ES2=(n-1)σ2/n
注意之上结论都没有要求总体分布呈正态,所以对任意总体均有这些结论。

之前已经谈到中心极限定理(见第三章第三节),壹般而言,抽样分布有如下结论:(1)若母总体呈正态分布,壹切可能样本的均值分布也是正态分布,表示为:
X~N(μ,σ2),则~N(μ,σ2/n)
(2)若母总体不呈正态分布,只要样本容量n足够大,则壹切可能样本的均值分布趋近正态分布,表示为:
X~?,当n->∞时,~N(μ,σ2/n)
(3)若母总体服从正态分布,则壹切可能样本的方差服从χ2分布,表示为:
X~N(μ,σ2),则(n-1)/σ2~χ2(n-1)
(4)母总体服从正态分布的俩样本方差之比服从F分布,表示为:
X1~N(μ1,σ21),X2~N(μ2,σ22),

(5)样本相关系数的抽样分布:
四、χ2分布
若n个相互独立的随机变量X1,X2,…,X n,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个随机变量的平方和∑X2i构成壹新的随机变量,其分布规律称为χ2(n)分布,其中参数n称为自由度,自由度不同就是另壹个χ2分布,正如正态分布中均值或方差不同就是另壹个正态分布壹样。

χ2分布的概率密度函数比较复杂,这里不再给出。

自由度
许多统计量的抽样分布都有自由度(degreeoffreedom)这个参数,所谓自由度即统计量中相互独立的随机变量的个数,这些随机变量的取值都能自由变动。

故若为同壹个标准正态总
体中抽取的n个独立随机变量,其平方和之和构成的X2统计量自由度为n;但若标准化时,母总体均值未知,用样本均值替代之,则该统计量中包含了壹个约束条件,即这n个随机变量的均值要等于,从而使得统计量中真正自由变动的随机变量个数成为n-1(剩下的壹个由这
n-1个即可确定),即其自由度变为n-1。

卡方分布是由正态分布构造而成的壹个新的分布。

其图形始终在第壹象限内,呈正偏态,随着参数n的增大,χ2分布趋近于正态分布。

χ2分布的均值为自由度n,方差为2倍的自由度(2n)。

从χ2分布的均值和方差能够见出,随着自由度n的增大,χ2分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。

χ2分布具有可加性:若有K个服从χ2分布且相互独立的随机变量,则它们之和仍是χ2分布,新的χ2分布的自由度为原来K个χ2分布自由度之和。

表示为:
χ2分布是连续分布,但有些离散分布也服从χ2分布,尤其在次数统计上非常广泛,这个应用将放在第八章介绍。

实际上,对从任意壹个正态总体中抽得的随机变量样本,其标准化后的Z分数之平方和也服从自由度为n的χ2分布。

若母总体的均值未知,可使用样本均值代替,则得到的新的统计量服从自由度为n-1的χ2分布。

上面这个公式在应用中更为常见;从统计量的构造可见出,它主要是采用“比商”的方式,将样本方差和壹个已知的总体方差相比从而对该样本方差所来源的总体方差进行推断。

五、T分布
T分布是由正态分布和卡方分布构造而成的壹个新的分布。

设X,Y为相互独立的随机变量,X服从标准正态分布,Y服从χ2(n)分布,则统计量t=X/√Y/n服从T(n),其中参数n称为自由度。

T分布的图象呈单峰对称状(以Y轴为对称轴),非常接近标准正态分布,峰部比标准正分布低,俩端比标准正态分布高,当自由度n很大时(n>30,120),T分布和标准正分布已无法区分,所以T分布常常用于样本容量小于30的小样本,故也称T分布理论为小样本理论。

壹般情况下,T分布的均值为0,方差随自由度n的增大从大于1的方向越来越接近1,更准确的表示是:
和卡方分布壹样,T分布在实际应用中也有壹个更常用的构造。

前面的正态抽样分布中,我们知道均值的抽样分布在很多时候是正态或近似正态分布,即便母总体的分布不是标准正态分布,也可通过标准化过程进行转化。

即总体分布明确,参数μ和σ2给出时:
但如果母总体参数σ2不知道,则可用样本标准差来代替之,则此时新的统计量不再服从标准正态分布,而是壹个新的分布,即自由度为n-1的T分布。

注意在总体方差未知时,样本平均数本身仍然服从正态分布,服从T分布的是包含样本均值的类似于Z的新统计量。

根据T分布的原始构造,这个结论能够这样来理解:
六、F分布
F分布是由俩个卡方分布构造而成的壹个新的分布。

若随机变量,,则统计量
其中参数n1、n2是俩个自由度。

和卡方分布壹样,F分布也在第壹象限内,呈正偏态,随着俩个自由度的的增大,趋近于正态分布。

不过其趋于正态分布的方式和卡方分布不同。

壹般情况下,F分布的均值接近1,方差壹般都小于1,且随俩自由度的增大方差越来越小,即图形越来越收缩。

更准确的公式是:
F分布也有壹个更常用的构造,即俩个服从自由度为样本容量减去1的卡方分布的比值:七、抽样分布的查表
对于这些抽样分布的应用,最重要的是知道如何在推断统计中查相应的概率分布表。

在标准正态分布中,由于曲线形状固定,因此在半边存在统计量Z值(分布的横坐标)和中央概率(当然也能够是尾端概率)的壹壹对应关系,它们之间可通过查表进行换算。

但卡方分布和T分布都有壹个自由度参数,自由度不同,曲线形状就不同;因而要对每个常用自由度编制壹个如同标准正态分布那样详细的统计量(χ2或T)和P的对应表会有很大篇幅。

因而,附表2和附表11的这俩种表都采用仅列出壹些常用自由度下若干最常用概率和统计量间的对应表,而且概率都规定是尾端概率;其中T分布表是采用分布在俩个尾端的所谓“双侧概率”和统计量对应;卡方分布是采用右侧尾端概率和统计量对应。

最后,F分布由于有俩个自由度,因而在壹个表中所能列出的F统计量和概率的对应更少,附表3、4中行、列分别为俩个自由度(根据实际需要,分母自由度变化范围更大)占用,则只能提供俩个最基本的概率和统计量相对应,且这概率也是尾端概率。

注意,通常附表4的单(右)侧概率分布表更为常用。

举几个简单例子说明如何查表:
上图4-2所示的单侧概率χ20.05(7)=14.1的查表方法是,在第壹列找到自由度7这壹行,在第壹行中找到概率0.05这壹列,行列的交叉处即是14.1。

这个对应关系意味着在自由度7时,χ2=14.1所割出的χ2分布曲线右侧概率为0.05。

反过来也是如此。

上图4-3所示T分布中,查T0.05/2(8)对应的统计量值,在第壹列找到自由度8这壹行,在第壹行中找到概率0.05这壹列,行列的交叉处即是2.306。

该对应关系意味着在自由度8时,T=2.306以及其所对称的-2.306所割出的双侧尾端概率为0.05。

此时,若只使用单侧概率(表的下端),则显然T=2.306割出的单侧尾端概率就只有0.05的1/2。

下图分别是F分布双侧和单侧表,查表方法不再赘述,需要注意的是,F分布双侧表中,尾端概率各为α/2时,其对应统计量且不具有相反关系,而是互为倒数。

双侧概率表(附表3) 单侧
概率

(附

4)
第三节参数估计
壹般情况下,总体的情况是不清楚的,即总体的分布及总体的参数都可能未知,而参数估计就是解决总体的参数未知时如何通过样本统计量来估计总体参数的问题。

参数估计有俩种方法,壹是直接用壹个样本统计量来作为总体参数的估计值,如用样本平均数估计总体均值,用样本标准差S n-1估计总体标准差,这种参数估计称为点估计;另壹种是根据抽样分布理论,给出壹个以样本统计量为中心的壹个可能范围作为总体参数取值范围的估计,且这种估计伴随着壹定的把握程度(概率),称为区间估计。

当然,如果将点估计见成是区间估计的壹种特例,可认为参数估计实际上是在估计精确度和估计把握度之间进行权衡的结果,要追求精确度,估计的区间就要尽可能小,则此时把握度必然降低;反之,若区间写得较大,则估计的把握度就越大。

壹、点估计
点估计是用样本统计量来代替总体参数,壹个好的点估计应具备的如下条件:
无偏性。

用多个样本的某壹统计量作为总体参数的估计值时,若这些样本统计量和总体参数的偏差平均为零,则用该统计量来代替总体参数具有无偏性。

无偏性更精确的表述为:若样本的某个统计量的均值等于该被估计的总体参数,则该样本统计量是无偏的。

壹致性。

当样本容量越来越大时,估计值能越来越接近它所估计的参数。

有效性。

当总体参数不止壹个无偏估计时,其中方差最小者最有效。

充分性。

若估计量反映了样本中每个数据的信息,则满足充分性。

根据这些条件,总体均值的点估计是样本平均数,总体方差的点估计是样本方差S2n-1,俩总体相关系数的点估计是从这俩总体中抽样的俩配对样本的相关系数。

二、区间估计
区间估计是给出包含总体参数的可能范围。

根据正态分布理论和抽样分布理论可知,任壹样本的平均数落在总体均值左右1.96个标准差(指抽样分布的标准差)的范围内的概率为95%;则将此关系中总体均值反算回去,则任壹样本平均数左右1.96个标准差范围内包含总体均值的可能性为95%。

这就是总体均值区间估计的大体思路。

根据小概率事件原理,上述以样本均值为中心,半径为1.96个标准误的区间“不包含”总体均值的概率只有(100-95)%,在壹次抽样中不会发生,可忽略不计。

因此就把这个范围称为总体均值的95%置信区间,概率95%称为置信度,即区间估计的把握程度;剩下5%是基于这壹次抽样(也就是基于所得样本均值)构造出的置信区间未包含总体参数的可能性大小,即区间估计犯错误的概率,称为显著性水平,用α表示;小概率事件原理要求显著性水平不能超过5%。

以下是壹些常用的区间估计。

1、总体均值的区间估计:
2、总体方差、标准差的区间估计:
阅读材料
电梯载重量
注意到每部电梯中都有类似这样的提示:
载重负荷上限1000公斤,限乘13人,或者1500公斤,限乘15人等。

这样规定对于保证乘坐电梯时的安全非常重要。

这样规定有什么养的统计学依据呢?能够用下面的例子做壹个演示性的说明。

假设壹个标准电梯的限载重量为1000公斤,准13人乘坐,已知人群体重的平均数和标准差分别为μ=53.5公斤,σ=6.04公斤。

我们能够计算电梯因为超重发生事故的概率是多大(假设体重服从正态分布)。

利用人群体重的数据构造任意壹个13人电梯乘客团体平均体重的抽样分布。

我们所要求的就是P()=P(Z>)=P(Z>14)。

根据正态分布知识,Z分数取值在2.58之上的概率就已经不足0.5%,所以这个概率是壹个极小概率。

换句话说,只要限乘人数不超过13人(假定每次都是13人乘坐是最多的情况),则他们的平均体重超过76.9(或总体重超过1000公斤载重负荷上限)的概率非常之小,以至于能够忽略不计。

因而我们能够放心乘坐。

相关文档
最新文档