(抽样检验)抽样与参数估计最全版

(抽样检验)抽样与参数估计最全版
(抽样检验)抽样与参数估计最全版

(抽样检验)抽样与参数估

抽样和参数估计

推断统计:利用样本统计量对总体某些性质或数量特征进行推断。

从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。这个调查例子是估计总体参数(某种意见的比例)的壹个过程。

估计(estimation)是统计推断的重要内容之壹。统计推断的另壹个主要内容是本章第二节要介绍的假设检验(hypothesistesting)。

因此本节内容就是由样本数据对总体参数进行估计,即:

学习目标:了解抽样和抽样分布的基本概念

理解抽样分布和总体分布的关系

了解点估计的概念和估计量的优良标准

掌握总体均值、总体比例和总体方差的区间估计

第一节抽样和抽样分布

回顾相关概念:总体、个体和样本

抽样推断:从所研究的总体全部元素(单位)中抽取壹部分元素(单位)进行调查,且根据样本数据所提供的信息来推断总体的数量特征。

总体(Population):调查研究的事物或现象的全体参数

个体(Itemunit):组成总体的每个元素

样本(Sample):从总体中所抽取的部分个体统计量

样本容量(Samplesize):样本中所含个体的数量

壹般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。

壹、抽样方法及抽样分布

1、抽样方法

(1)、概率抽样:根据已知的概率选取样本

①、简单随机抽样:完全随机地抽选样本,使得每壹个样本都有相同的机

会(概率)被抽中。

注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重

复抽样和不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。

②、分层抽样:总体分成不同的“层”(类),然后在每壹层内进行抽样

③、整群抽样:将壹组被调查者(群)作为壹个抽样单位

④、等距抽样:在样本框中每隔壹定距离抽选壹个被调查者

(2)非概率抽样:不是完全按随机原则选取样本

①、非随机抽样:由调查人员自由选取被调查者

②、判断抽样:通过某些条件过滤来选择被调查者

(3)、配额抽样:选择壹群特定数目、满足特定条件的被调查者

2、抽样分布

壹般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。

某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本时,由每壹个样本计算出的该统计量数值的相对频数分布或概率分布。

二、样本均值的抽样分布和中心极限定理

1、样本均值的抽样分布(壹个例子)

【例】设壹个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X 1=1、X 2=2、X 3=3、X 4=4。总体的均值、方差及分布如下

均值和方差

现从总体中抽取n =2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表

计算

出各样本的

均值,如下

表。且给出

样本均值的

抽样分布

所有

样本均值的

均值和方差:

式中:M 为样

本数

目 比较及结论:1.样本均值的均值(数学期望)等于总体均值

2.样本均值的方差等于总体方差的1/n

2、中心极限定理

=1n i i x μ==∑=1M x n i i x

当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值也服从正态分布,的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)

中心极限定理:设从均值为μ,方差为σ2的壹个任意总体中抽取容量为n的样本,当n充分大时(壹般,就能够用中心极限定理了),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。即有:

也即有,~

其实,样本均值抽样分布的数字特征壹方面和总体分布的均值和方差有关,另壹方面也和抽样的方法是重复抽样仍是不重复抽样有关。无论是重复抽样或不重复抽样,样本均值的数学期望始终等于总体的均值。但在不重复抽样条件下,样本均值的方差需要用修正系数去修正重复抽样时均值的方差。当很大,而时,其修正系数,可视不重复抽样和重复抽样壹致。

uesofthesampleproportion p.)

样本比例抽样分布的相关信息,即p的期望值、标准差、抽样分布形状等。

主要应用于分类变量:在经济和商务的许多场合,需要用样本比例p对总体比例P进行统计推断

根据中心极限定理有:当样本容量增大时(大样本:经验上,当下面俩个条件

(n·p>=5且n(1-p)>=5)满足时,和p相关的样本为大样本),样本比例抽样分布趋向于以样本期望值为中心、以样本方差为方差的正态分布

1、期望值(Expectedvalueof p):E(p)=P

2、标准差(Standarddeviationof p):

重复抽样:不重复抽样:

*四、样本方差的抽样分布

要用样本方差s2去推断总体的方差σ2,必须知道样本方差的分布。

设总体服从正态分布X~N(μ,σ2),X1,X2,…,X n为来自该正态总体的样本,统计证明比值的抽样分布为自由度是(n-1)的分布,即:

~

分布的性质:

(1)、分布的变量始终为正;

(2)、分布的期望为,方差为。

第二节参数估计的基本方法

壹、估计量和估计值

参数是总体的数值特征(A parameter isanumericalcharacteristicofapopulation。)参数估计:就是用样本统计量去估计总体的参数。

估计量()(estimator)用于估计总体某壹参数的样本统计量(随机变量)的名称。

样本均值,样本比例、样本方差等都能够是壹个估计量。

估计值(e s t i m a t e):用来估计总体参数时计算出来的估计量的具体数值。

例如:样本均值就是总体均值的壹个估计量

如果样本均值 =3,则3就是的估计值

二、点估计和判断估计量的优良性准则

(壹)、点估计

点估计(PointEstimate)就是用样本估计量的值直接作为总体参数的估计值。设是总体分布中壹个要估计的参数。例如,总体分布的均值、方差等。当下从总体中得到壹个随机样本,如何估计?

记估计的估计量(统计量)为,简记为

若得到壹组样本观察值,就能够得到的估计值:,也记为。

总体分布参数的点估计,就是求出的估计值。

点估计的方法壹般有矩估计发法、极大似然估计法等。

概念要点:

1.从总体中抽取壹个样本,根据该样本的统计量对总体的未知参数作出壹个数值点的估计。

例如:用样本均值作为总体未知均值的估计值就是壹个点估计

2.点估计没有给出估计值接近总体未知参数程度的信息

3.其理论基础是抽样分布

(二)、估计量的优良性准则

要估计总体的某壹指标,且非只能用壹个样本指标,而可能有多个指标可供选择,即对同壹总体参数,可能会有不同的估计量。作为壹个好的估计量,估计量必须具有如下性质:无偏性、有效性、壹致性。

1、无偏性(Unbiasedness):样本估计量的数学期望(均值)等于被估总体参数的真值;

如果,则称为的无偏估计量。

能够证明,总体方差的样本矩估计量是无偏估计量。

2、有效性(Efficiency):好的点估计量应具有较小的方差;

在用估计量来估计总体的某个参数时,如果对其它所有对的估计量总是有:

那么,这个估计量就是总体参数的有效估计量。

3、壹致性(C o n s i s t e n c y):随着样本容量的增大,估计量越来越接近被估计的总体

参数。

如果满足:,即:

则称为的壹致估计量。

能够证明:样本均值、样本比例、样本标准差的点估计是无偏、有效、壹致的。

三、抽样误差和区间估计

(壹)、抽样误差(SamplingError)

壹个样本能够得到总体参数的壹个点估计,该点估计值和总体参数真值之间的差异,即为抽样误差。

有三个相互联系的概念:

1、实际抽样误差:具体样本的估计值和总体参数的实际值之间的离差。

2、抽样平均误差:所有可能样本估计值和相应总体参数的平均差异程度。

3、抽样极限误差壹定概率下抽样误差的可能范围(也称允许误差):

注意:

①、统计学上往往用抽样极限误差来测度抽样误差的大小或者说测度点估计的精度。原因:总体参数值往往且不知道,因此,实际抽样误差和抽样平均误差也往往无法求出,但在抽样分布大体知道的情况下,抽样极限误差是能够估计出来的。

②、抽样平均误差是所有可能样本值和总体指标值之间的平均离差,它表明抽样估计的准确度;而抽样极限误差是样本指标值和总体指标值的离差绝对值是表明抽样估计的准确程度的范围。这也就决定了俩者存在壹定的联系。通常,把抽样极限误差和抽样平均误差相比,从而使单壹样本的抽样极限误差标准化,壹般称为概率度或相对误差范围,即置信度。

③抽样极限误差的估计总是要和壹定的概率保证程度联系在壹起的。原因:样本统计量往往是壹随机变量,它和总体参数真值之差也是壹个随机变量,因此就不能期望某次抽样的样本估计值落在壹定区间内是壹个必然事件,而只能给予壹定的概率保证。因此,在进行抽样估计时,既需要考虑抽样误差的可能范围,同时仍需考虑落到这壹范围的概率大小。前者是估计的准确度问题,后者是估计的可靠性问题,俩者紧密联系不可分开。这也正是区间估计所关心的主要问题。(二)、区间估计(IntervalEstimate)

在点估计的基础上,给出总体参数估计的壹个范围,称为参数的区间估计。

若总体分布含壹个未知参数,找出了俩个依赖于样本的估计量:

使得

其中,,显著性水平壹般取0.05或0.01,则称随机区间为的100(1-)%的置信

区间。百分数100(1-)%被称为置信度或置信水平。

1.根据壹个样本的观察值给出总体参数的估计范围

给出总体参数落在这壹区间的概率

例如:总体均值落在50~70之间,置信度为95%

2、置信水平

①.总体未知参数落在区间内的概率

②.表示为(1–a),a为显著性水平,是总体参数未在区间内的概率

③.常用的显著性水平值有99%,95%,90%,相应的a为,,

3、区间估计的要点

①.依据样本指标和抽样误差去推算总体指标时,只是确定了总体指标的估计范围,且没有确定其具体值。这个范围表现为壹个上限和壹个下限,从而构成壹个区间。

②.所得的估计区间表示的只是壹个可能范围,而不是绝对的范围。总体指标在这个范围内的可能性为置信概率()。

③.扩大抽样极限误差能够提高抽样推断的可靠程度,但准确程度会降低;反之,缩小抽样极限误差会降低抽样推断的可靠程度,但准确程度会提高。

第三节壹个总体参数的区间估计

4.3.1总体均值的区间估计

1、区间估计的基本原理

以总体均值的区间估计为例来说明区间估计的基本原理。

在重复抽样或无限总体抽样的情况下,我们知道有、,由此能够知道样本均值落到总体均值的俩侧各为壹个抽样标准差范围内的概率0.6873;落在俩个抽样标准差范围内的概率为0.9545。而实际上,是已知的,而是未知的,也正是我们要估计的。由于和的距离是对称的,因此如果有95%的样本均值落在的俩个标准误差的范围内,则也就是说,约有95%的样本均值所构成的俩个标准误差的区间会包括。即若有

则有

通俗地说,如果我们抽取100个样本来估计总体的均值,有100个样本均值所构成的100个区间中,约有95个区间包含总体均值。

2、正态总体且方差已知,或非正态总体、方差未知、大样本

当总体服从正态总体且方差已知,或非正态总体、方差未知但大样本时,样本均值的抽样分布为正态分布,有、。即

对显著性水平,有,即有:

由此得到总体均值在置信水平下的置信区间为:

(4.3.1)

如果总体方差未知,在大样本条件下,则能够用样本方差代替总体方差,这时总体均值在置信水平下的置信区间为:

(4.3.2)

如果采取不重复抽样,而且插秧比很大时,,这时总体均值在置信水平下的置信区间为:

(4.3.3)

相应的如果总体方差未知,总体均值在置信水平下的置信区间可写为:

(4.3.4)

【例】某种零件长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为21.4mm。已知总体标准差=0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。

解:已知X~N(,0.152),=2.14,n=9,1-a=0.95,Za/2=1.96

根据式(4.3.1),总体均值的置信区间为:

我们能够以95%的概率保证该种零件的平均长度在21.302~21.498mm之间。

3、正态总体、方差未知、大样本

如果总体服从正态分布,则无论样本容量如何,样本均值的抽样分布都服从正态分布。可是,如果总体方差未知,而且是小样本的情况下,则需要用样本方差来代替,这时样本均值经过标准化以后的随机变量服从自由度为的分布,即这时需要应用分布来建立总体均值的置信区间。

分布是类似正态分布的壹种对称分布,但它通常比后者平坦和分散。

根据分布建立的总体均值在置信水平(1-)下的置信区间为:

(4.3.5)

(4.3.5)式中是自由度为时,分布中右侧面积为时的值。

【例】从壹个正态总体中抽取壹个随机样本,n=25,其均值=50,标准差=8。建立总体均值的95%的置信区间。

解:已知X~N(,),=50,s=8,n=25,1-a=0.95,t a/2=2.0639。

由式(4.3.5),可得:

我们能够95%的概率保证总体均值在46.69~53.30之间

小结:表:4.3.1不同情况下总体均值的区间估计

4.3.2总体比例的区间估计

1、大样本重复抽样时的估计方法

当样本容量很大时,样本比例的抽样分布服从正态分布近似。即

如果且,

则,其中为总体的比例。

样本比例经过标准化后的随机变量服从标准正态分布,即

则总体比例在置信水平下的置信区间为:

用上式计算总体比例的置信区间时,的值应该是已知的,但实际上却不然,的值恰恰是我们要估计的,所以我们用样本的比例来代替,此时计算总体比例的置信区间可表示为:

(4.3.6)

式中为标准正态分布右侧面积为时的值,是估计总体比例时的边际误差。

总体比例的置信区间有俩部分组成:总体比例的点估计值和描述估计量精确度的值,这个值称为边际误差。

2、大样本不重复抽样时的估计方法

在不重复抽样条件下,样本比例的方差为:

此时总体比例在置信水平下的置信区间为:

(4.3.7)

【例】某企业在壹项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成壹个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。

解:已知n=200,=0.7,n*=140>5,n*(1-)=60>5,a=0.95,Za/2=1.96 根据式(4.3.6),得

所以我们能够以95%的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%~76.4%之间

4.3.3总体方差的区间估计

设来自正态总体的容量为的样本,参数未知。为了估计,可根据样本方差来确定其在置信水平下的置信区间。

从分布表中查得和(;),

使得下式成立:

即:

因此,总体参数在置信水平下的置信区间为:

(4.3.8)

【例】假定A品牌25公斤袋装大米的重量服从正态分布。现随机抽取13袋,测得它们的重量分别是:24.0、24.2、24.4、24.6、24.7、24.8、25.0、25.1、

25.1、25.2、25.3、25.4、25.6公斤,试以95%的置信水平估计该品牌袋装大米重量的标准差。

解:因为,=12,查分布表,得:

和=23.337

所以,置信水平为95%的总体方差的置信区间是:

由原始数据可计算得到=0.23,代入上式得:

所以

所求信区间是:(0.34,0.79)

第四节样本容量的确定

1、确定样本容量的理论依据

样本容量对估计精度有较大的影响,从理论上说,样本容量越大,对总体特征的估计误差越小;但从实践角度见,抽样数目过大,则会增大调查及相关的工作量。因此,样本容量的确定是至关重要的。

壹般说来,抽样数目以满足在壹定的概率保证下抽样误差不超过给定的允许范围的最小样本容量为界。因此,可根据抽样极限误差和抽样数目的关系来确定抽样数。

说明:确定样本容量时壹般要考虑抽样方法的影响,即重复抽样和不重复抽样。

2、总体均值参数估计中抽样数目的确定

为了简单,可直接考虑大样本的情况,这时样本均值服从正态分布即

于是在1-a的置信度下,存在临界值Z a/2,使得

或根据抽样极限误差的定义,若用样本均值估计总体均值的极限误差(边际误差)为,则:

故,在该置信度下,如果允许误差为时,能够其为极限误差解出必须的抽样数:由此可知,此抽样数目由总体方差、允许误差以及概率保证程度三者确定。【例】壹家广告X公司想估计某类商店去年所花的平均广告费用有多少。经验表明,总体方差约为1800000元。如置信度取95%,且要使估计处在总体平均值附近500元的范围内,这家广告X公司应抽多大的样本?

解:已知=1800000,a=0.05,Z a/2=1.96,=500应抽取的样本容量为:

3、总体比例参数估计中的抽样数目确定

在大样本下,样本比例的分布趋近于如下正态分布,于是:

设在1-a的置信度下,对应的临界值为Z a/2,则易知

于是,如果允许误差为,可得最小的抽样数目:

注:1、如果总体方差或总体比例未知,可用样本方差或样本比例代替。

2、为了保证抽样推断的把握程度,若有多个可供参考的方差数值,应选其中方差最大值来计算。对于比例的方差,比例应取接近50%的样本(Why?)。【例】壹家市场调研X公司想估计某地区有彩色电视机的家庭所占的比例。该X 公司希望对比例P的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)

解:已知=0.05,a=0.05,Z a/2=1.96,当p未知时用最大方差0.25代替.应抽取的样本容量为:

(抽样检验)抽样与参数估计最全版

(抽样检验)抽样与参数估 计

抽样和参数估计 推断统计:利用样本统计量对总体某些性质或数量特征进行推断。 从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。这个调查例子是估计总体参数(某种意见的比例)的壹个过程。 估计(estimation)是统计推断的重要内容之壹。统计推断的另壹个主要内容是本章第二节要介绍的假设检验(hypothesistesting)。 因此本节内容就是由样本数据对总体参数进行估计,即: 学习目标:了解抽样和抽样分布的基本概念 理解抽样分布和总体分布的关系 了解点估计的概念和估计量的优良标准 掌握总体均值、总体比例和总体方差的区间估计 第一节抽样和抽样分布 回顾相关概念:总体、个体和样本 抽样推断:从所研究的总体全部元素(单位)中抽取壹部分元素(单位)进行调查,且根据样本数据所提供的信息来推断总体的数量特征。 总体(Population):调查研究的事物或现象的全体参数 个体(Itemunit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体统计量 样本容量(Samplesize):样本中所含个体的数量 壹般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。 壹、抽样方法及抽样分布 1、抽样方法

(1)、概率抽样:根据已知的概率选取样本 ①、简单随机抽样:完全随机地抽选样本,使得每壹个样本都有相同的机 会(概率)被抽中。 注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重 复抽样和不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。 ②、分层抽样:总体分成不同的“层”(类),然后在每壹层内进行抽样 ③、整群抽样:将壹组被调查者(群)作为壹个抽样单位 ④、等距抽样:在样本框中每隔壹定距离抽选壹个被调查者 (2)非概率抽样:不是完全按随机原则选取样本 ①、非随机抽样:由调查人员自由选取被调查者 ②、判断抽样:通过某些条件过滤来选择被调查者 (3)、配额抽样:选择壹群特定数目、满足特定条件的被调查者 2、抽样分布 壹般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。 某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本时,由每壹个样本计算出的该统计量数值的相对频数分布或概率分布。 二、样本均值的抽样分布和中心极限定理 1、样本均值的抽样分布(壹个例子)

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

(抽样检验)抽样与检验最全版

(抽样检验)抽样与检验

抽样和检验 壹、抽样检验基本概念 1.在质量管理中,壹般有来料检验、过程检验、成品检验、出货检验四部分,每壹部分中都会有抽样计划、允许水准、具体的抽样方式、统计分析等工作。 2.基本概念 (1)批 各种产品,凡是具有相同的来源,且在相同的条件下生产所得到壹群相同规格的产品,可称为壹个批,这样的批也可给予壹个名字叫“制造批”。壹个制造批中的质量变异具有壹个分布,在抽样时应尽可能的使检验批的质量接近实际值,这样才可使抽验的结果正确,因此壹批可能根据需要能够区分为几个检验批,但必须注意避免将几个批合且为壹个检验批。 (2)检验批 在统计学中,能够称为母体或群体。 就是在各种批中,被选定用来做抽样检验的批,该批是根椐其整个批中量的大小,照抽样计划,抽出“小”批加以检验的壹个群体。通常检验批要根据允许水准来判定这个检验批是否允收。 (3)批量 是指每个检验批内产品的单位数据,在统计学中也可称为“母体数”,通常以“N”表示。 (4)样本 是指从检验批中所抽出的以壹个之上单位组成的产品,样本中的各个

样品均须随机,而且不考虑它的品质的好坏。样本中所含的产品单位的数目称为“样本数”或“样本大小”,通常以“n”表示,它壹定小于等批量数“N”。 (5)抽样检验 从双方约定的检验批中,根据批量大小,抽出不同数量的样本。将该样本以事先确定的检验方法加以检验,且将检验的结果和预先确定的要求或“品质标准”比较,以决定该批是否合格。在计数值中,是将样本中不良品的个数所抽样计划中允收不良品的个数比较,以判定该检验批是否允收。在计量值中,是将各样品检验结果加以统计分析,以平均值、离散度、综合指数的判定基准比较,以决定该检验批是否允收。 (6)合格判定数 判定壹批产品是否合格或不合格的基准不良个数称为合格判定数,通常以“C”(或AC)表示。 (7)缺陷 产品单位的品质特性不合乎双方所规定的规格、图样、说明或要求等称为缺陷,通常用“d”表示。如若是买卖的关系,缺点壹般可分为:(a)严重缺陷(Criticaldefect),凡有危及产品的使用或携带安全,或使产品的重要功能失效的缺陷;(b)主要缺陷(Majordefect),凡使产品使用性能不能达到所期望之目的,或显著减低其实用性能的缺陷;(c)次要缺陷(Minordefect),实际上不影响产品的使用功能或引起较大抱怨的缺陷。

统计学抽样与抽样分布练习题

第6章 抽样与抽样分布 练习题 6.1 从均值为200、标准差为50的总体中,抽取100=n 的简单随机样本,用样本均值x 估计总体均值。 (1) x 的数学期望是多少? (2) x 的标准差是多少? (3) x 的抽样分布是什么? (4) 样本方差2 s 的抽样分布是什么? 6.2 假定总体共有1000个单位,均值32=μ,标准差5=σ。从中抽取一个样本量为30的简单随机样本用于获得总体信息。 (1)x 的数学期望是多少? (2)x 的标准差是多少? 6.3 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。样本均值的抽样标准差x σ等于多少? 6.4 设总体均值17=μ,标准差10=σ。从该总体中抽取一个样本量为25的随机样本,其均值为25x ;同样,抽取一个样本量为100的随机样本,样本均值为100x 。 (1)描述25x 的抽样分布。 (2)描述100x 的抽样分布。 6.5 从10=σ的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差: (1)重复抽样。 (2)不重复抽样,总体单位数分别为50000、5000、500。 6.6 从4.0=π的总体中,抽取一个样本量为100的简单随机样本。 (1)p 的数学期望是多少? (2)p 的标准差是多少? (3)p 的分布是什么? 6.7 假定总体比例为55.0=π,从该总体中分别抽取样本量为100、200、500和1000的样本。

(1) 分别计算样本比例的标准差p σ。 (2) 当样本量增大时,样本比例的标准差有何变化? 6.8 假定顾客在超市一次性购物的平均消费是85元,标准差是9元。从中随机抽取40个顾 客,每个顾客消费金额大于87元的概率是多少? 6.9 在校大学生每月的平均支出是448元,标准差是21元。随机抽取49名学生,样本均值 在441~446之间的概率是多少? 6.10 假设一个总体共有8个数值:54,55,59,63,64,68,69,70。从该总体中按重复 抽样方式抽取2=n 的随机样本。 (1) 计算出总体的均值和标准差。 (2) 一共有多少个可能的样本? (3) 抽出所有可能的样本,并计算出每个样本的均值。 (4) 画出样本均值的抽样分布的直方图,说明样本均值分布的特征。 (5) 计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得 到的结论是什么? 6.11 从均值为5.4=μ,方差为25.82=σ的总体中,抽取50个由5=n 个观测值组成的 随机样本,结果见Book6.11。 (1) 计算每一个样本的均值。 (2) 构造50个样本均值的相对频数分布,以此代表样本均值x 的抽样分布。 (3) 计算50个样本均值的平均值和标准差x σ。 6.12 来自一个样本的50个观察值见Book6.12。 (1) 用组距为10构建频数分布表,并画出直方图。 (2) 这组数据大概是什么分布?

统计学习题第九章参数估计

第九章参数估计 第一节点估计 点估计的概念·总体参数合理估计的标准(无偏性、一致性、有效性) 第二节区间估计 抽样估计的精确性和可靠性·抽样平均误差与概率度·区间估计的步骤及大样本总体均值的区间估计 第三节其他类型的置信区间 σ未知,小样本总体均值的区间估计·总体成数的区间估计·总体方差的区间估计 第四节抽样平均误差 简单随机抽样的抽样平均误差·分层抽样的抽样平均误差·整群抽样的平均抽样误差·系统抽样的抽样平均误差 第五节样本容量的确定 影响样本容量的因素·抽样条件与样本容量的确定 一、填空 1.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和(区间估计)。 2.对总体均值求置信区间的方法是:从(点估计值X)起向两侧展开一定倍数 σ),并估计μ很可能就包含在这个区间之内。 (Z)的抽样平均误差( X 3.假设在某省抽样调查的1600名城镇待业人员中有1024名青年,则待业人员中青年占比重的置信区间为(〔%,% 〕)。 4.在其他条件不变得情况下,如果允许误差缩小为原来的1/2,则样本容量将增加为原来的( 4倍)。 二、单项选择 1.如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是( C )估计。 A 有效 B 一致 C 无偏 D 精确 2.虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个( B )的估计量。 A 有效 B 一致 C 无偏 D 精确 3.估计量的( A )指统计量的抽样分布集中在真实参数周围的程度。 A 有效性 B 一致性 C 无偏性 D 精确性 4.用简单随机重复抽样方法抽样,如果要使抽样误差降低50%,则样本容量需要扩大

统计学习题答案 第4章 抽样与抽样分布

统计学习题答案第4章抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、

应用统计学:参数估计习题及答案.(优选)

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

统计学 第六章 抽样与参数估计

《统计学》 第六章 抽样与参数估计 1、某市劳动和社会保障局想调查下岗职工中女性所占的比重,随机抽取300个下岗职工,发现其中195个为女性职工。试以95.45%的概率保证程度,估计该市下岗职工中女性比重的区间范围。 解: 已知n=300,概率保证程度95.45%,Z 0.0455/2 =2 P=300195=65% 区间范围P n )1(2 p p -Z ±α=0.65300 ) 65.01(65.02-±=0.65±0.055 该市下岗职工中女性比重的区间范围为59.5%~70.5之间 2、某灯管厂生产10万只日光灯管,现采用简单随机重复抽样方式抽取1‰灯管进行质量检验,测试结果如下表所示: 耐用时间(小时) 灯管数(只) 800以下 10 800-900 15 900-1000 35 1000-1100 25 1100以上 15 合计 100 根据上述资料: (1)试计算抽样总体灯管的平均耐用时间 (2)在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围。 (3)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计算抽样总体灯管的合格率,并按95%的概率保证程度下,估计10万只灯管的合格率区间范围。 (4)若上述条件不变,只是抽样极限误差可放宽到40小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验? 解: 耐用时间(小时) 灯管数(只)f 组中值x xf f x x 2)(- 800以下 10 750 7500 484000 800-900 15 850 12750 216000 900-1000 35 950 33250 14000 1000-1100 25 1050 26250 160000 1100以上 15 1150 17250 486000

统计学第九章抽样与抽样估计

第九章抽样与抽样估计 一、单项选择题 1、抽样极限误差是指抽样指标和总体指标之间(D)。 A.抽样误差的平均数B.抽样误差的标准差 C.抽样误差的可靠程度D.抽样误差的最大可能范围 2、样本平均数和总体平均数(B)。解析:样本平均数是以总体平均数为中心,在其范围内变动(P213) A.前者是一个确定值,B.前者是随机变量, 后者是随机变量后者是一个确定值 C.两者都是随机变量D.两者都是确定值 3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%, 95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。A.144B.105C.76D.109 4、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。 A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/3 5、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。 A.增加9倍B.增加8倍 C.为原来的2.25倍D.增加2.25倍 6、抽样误差是指(C)。解析:这题考的是抽样误差的定义(P213) A.在抽查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 7、在一定的抽样平均误差条件下(A)。

A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 8、抽样平均误差是(B)。解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差 C.抽样指标的标准差D.抽样误差的平均差 9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式(D)。 A.简单随机抽样B.类型抽样 C.等距抽样D.整群抽样 10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》 或抽签的方式来抽取样本的抽样组织形式,被称为(B)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差相 比,(A)。 A.前着小于后者B.前者大于后者 C.两者相等D.无法判断 13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其 他条件不变),必要的样本容量将会(C)。

抽样检验的基本概念与分类(doc 12页)(完美版)

抽样与检验 一、抽样检验基本概念 1.在质量管理中,一般有来料检验、过程检验、成品检验、出货检验四部分,每一部分中都会有抽样计划、允许水准、具体的抽样方式、统计分析等工作。 2.基本概念 (1)批 各种产品,凡是具有相同的来源,且在相同的条件下生产所得到一群相同规格的产品,可称为一个批,这样的批也可给予一个名字叫“制造批”。一个制造批中的质量变异具有一个分布,在抽样时应尽可能的使检验批的质量接近实际值,这样才可使抽验的结果正确,因此一批可能根据需要可以区分为几个检验批,但必须注意避免将几个批合并为一个检验批。 (2)检验批 在统计学中,可以称为母体或群体。 就是在各种批中,被选定用来做抽样检验的批,该批是根椐其整个批中量的大小,照抽样计划,抽出“小”批加以检验的一个群体。通常检验批要根据允许水准来判定这个检验批是否允收。 (3)批量 是指每个检验批内产品的单位数据,在统计学中也可称为“母体数”,通常以“N”表示。 (4)样本

是指从检验批中所抽出的以一个以上单位组成的产品,样本中的各个样品均须随机,而且不考虑它的品质的好坏。样本中所含的产品单位的数目称为“样本数”或“样本大小”,通常以“n”表示,它一定小于等批量数“N”。 (5)抽样检验 从双方约定的检验批中,根据批量大小,抽出不同数量的样本。将该样本以事先确定的检验方法加以检验,并将检验的结果与预先确定的要求或“品质标准”比较,以决定该批是否合格。在计数值中,是将样本中不良品的个数所抽样计划中允收不良品的个数比较,以判定该检验批是否允收。在计量值中,是将各样品检验结果加以统计分析,以平均值、离散度、综合指数的判定基准比较,以决定该检验批是否允收。 (6)合格判定数 判定一批产品是否合格或不合格的基准不良个数称为合格判定数,通常以“C”(或AC)表示。 (7)缺陷 产品单位的品质特性不合乎双方所规定的规格、图样、说明或要求等称为缺陷,通常用“d”表示。如若是买卖的关系,缺点一般可分为:(a)严重缺陷(Critical defect),凡有危及产品的使用或携带安全,或使产品的重要功能失效的缺陷; (b)主要缺陷(Major defect),凡使产品使用性能不能达到所期望之目的,或显著减低其实用性能的缺陷; (c)次要缺陷(Minor defect),实际上不影响产品的使用功能或

统计学答案 第八章 抽样与抽样分布

第八章抽样与抽样分布 一、名词解释 1、统计抽样:按照随机原则从被研究现象的总体中,抽取一部分单位进行观察,然后根据 观察的结果运用数理统计的原理,来估计总体综合指标或者对总体综合指标的某种假设进行 检验。 2、重复抽样:是从总体中每抽出一个样本单位后,把结果记录下来,随即将该单位放回到 总体中去,使它和其余的单位在下一次抽选中具有同等被抽中的机会,再抽取第二个单位,直至抽取n个单位为止。 3、不重复抽样:一个单位被抽中后不再放回总体,然后再从所剩下的单位中抽取第二个单位,直到抽出n个单位为止,这样的抽样方法不可能使一个总体单位被重复抽中,所以称为 不重复抽样。 4、简单随机抽样:在从总体中随机抽取n个单位作为样本时,要使得每一个总体的单位都 有相同的机会(概率)被抽中。 5、分层抽样:在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数 量的单位组成一个样本,这样的抽样方式称为分层抽样,也称为分类抽样。 6、系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点, 然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。这样的抽样方式称 为系统抽样,也称等距抽样或机械抽样。 7、整群抽样:调查时,先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群, 进而对抽中的各个群中所包含的所有个体单位进行调查或观察,这样的抽样方式称为整群抽样。 8、总体分布:总体是我们关心的若干个元素的集合,总体中每个元素的取值是不同的,这些 观察值所形成的相对频数分布就是总体分布。 9、样本分布:是指一个样本中各观察值所形成的相对频数分布。 10.抽样分布:某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n的样本时, 由该统计量的所有可能取值形成的相对频数分布。 11、比率:是指总体(或样本)中具有某种属性的单位与全部单位总数之比。 12、样本比率的抽样分布:在重复选取容量为n的样本时,由样本比率的所有可能取值形成 的相对频数分布称为样本比率的抽样分布。 二、判断题 1、× 2、√ 3、× 4、× 5、√ 6、× 7、√ 8、√ 9、× 10、√ 三、选择题 1、A 2、A 3、B 4、B 5、C 6、D 7、D 8、D 9、C 10、D 11、C 12、B 13、C 14、C 15、A 16、D 17、A 18、B 19、C 20、B 21、B 22、B 23、B 24、A 25、A 四、简答题 1、简述统计抽样的基本特点。

(抽样检验)第四章抽样理论和参数估计

第四章抽样理论和参数估计 知识引入 1970 年美国首次进行征兵抽签,组织者将19-25岁的适龄青年按年龄分组,使用编号001-366 的等重量塑料球,001代表1月1日出生者,031代表1月31日…,366代表12月31日。然后将所有塑料球放入滚筒中混合抽取号码,每组抽中号码对应生日的青年依次应征,直到人数足够为止。 之后,有记者指出此次抽签产生了严重的偏差,他们注意到,年末生的人似乎倾向于被抽到较前面的征兵顺序。其结果就是一堆12 月份生的人去了越南战场。后来,经过统计学家的分析,发现这种“偏差”确实存在;经过分析终于找到了原因,原来代表生日的号码塑料球是一次按一整个月份装入滚筒中混合的,加上又没有均匀混合;于是1 月份的生日容易在滚筒底下,12 月份的是最后才装进去,容易在上面。 在抽样术语中,经常能够听到“随机抽样”、“随机选择”这样的表述,“随机性”原则其实保证了总体中的每个个体被抽中的概率相等,因而被认为是保证各种抽签、选择过程公平、公正的一个基本手段。上述抽样就没有保证这种随机性。 在本章中,我们还会看到,作为推断的基础,我们直接研究的样本是否“得当”对研究总体十分关键,可以通过一定的抽样设计制定科学、合理、公正的抽样方法。如上述随机性原则可以保证抽样可以使得样本和总体有相同的内部结构,也就是说有最大的可能使总体的某些特征在样本中得以再现。本章在介绍必要的抽样概念和抽样方法基础上,重点介绍抽样分布理论,并对参数估计进行简要介绍。 第一节抽样和常用抽样方法 一、简单随机抽样 抽样(sampling)或取样,在整个研究过程中位于数据收集之前,恰当的抽样设计是保证样本代表性的关键环节,是利用样本对总体进行假设检验或参数估计的基础。抽样涉及到的一些基本概念在绪论中均已介绍。一个合理可行的抽样设计,一方面要求针对调查或实验研究的具体情况选择一种适宜抽样方法;另一方面应该根据调查研究所要求的精确度及经费状况确定样本容量。 一般所说的随机抽样,就是指简单随机抽样,它是最基本的抽样方法,适用范围广,最能体现随机性原则且原理简单。抽取时,总体中每个个体应独立地、等概率地被抽取。常用的实施方法有抽签法和随机数表法。 1、抽签法:是把总体中的每一个个体都编上号并做成签,充分混合后从中随机抽取一部分,这部分签所对应的个体就组成一个样本。 2、随机数表法:所谓随机数表或乱码表,是由一些任意的数毫无规律地排列而的数表。教材附表17即是一万个数字的随机数表。 随机数表的用法

(标准抽样检验)抽样检验的基础知识

(标准抽样检验)抽样检验的基础知识

第1章抽样检验的基础知识 第1节抽样检验的目的 从居家过日子到国家重大经济决策都离不开抽样检验。比如说,你到水果摊买桔子,你可能会问:“酸不酸呀”?摊主说“你尝一尝,先尝后买”,于是你从一大堆桔子中抽取一个尝一尝,你尝的目的是什么呢?你尝的目的是要通过这一个桔子的质量情况来推断这一大堆桔子的质量情况。显然抽样检验的目的是:通过样本推断总体。样本是样品的集合,一个样本可由一个样品组成,也可由多个样品组成。欲达到通过样本推断总体这样的目的,要通过三个步骤:A.抽样,B.检验,C.推断。其中抽样这个步骤含有两个内容a.怎么抽,b.抽多少。其中检验这个步骤与抽样检验的理论没有关系,不同的产品、不同的质量特性使用不同的检测设备,有不同的检验方法。C.推断,即用对样本的检测结果来对总体进行推断。抽多少与怎样推断就构成了抽样方案。 第2节抽样方案 抽样方案分为计数型抽样方案和计量型抽样方案两大类,首先讨论计数型抽样方案。 2.1计数型抽样方案 计数型抽样方案有两种形式: (1)(n;c);(2)(n;,) 从批中抽取n件产品构成样本,逐个检验各个样品,发现其中有d 件不合格品;若d≤c(d≤)则接收该批,若d>c(d≥)则拒收该批。其框图见图1-1: 图1-1

抽样方案的使用方法是非常简单的。可抽样方案是怎么确定的呢?这里必须指出:抽样方案不是人为规定的,抽样方案是根据对总体的质量要求,用数理统计理论设计出来的。 2.2计量型抽样方案 计量型抽样方案的形式是:(n;k);它用样本均值和样本标准差对批作出推断,与计数型抽样方案相比,在相同的判断精度下,计量型抽样方案比计数型抽样方案所需的样本量更小。其使用方法在后面的章节中做详细介绍。 第3节抽样检验的统计理论(基础) 当讨论抽样方案时,我们应注意以下基本理论问题: 3.1当存在随机误差时,样本质量指标不一定等于总体质量指标。(1)样本不合格品率不一定等于总体不合格品率。比如说,从一批产品中抽取一件产品;经检验,若这件产品是合格品,那么样本不合格品率等于零,此时,并不能肯定:总体(批)不合格品率等于零,总体(批)中没有不合格品;经检验,若这件产品是不合格品,那么样本不合格品率等于百分之一百,此时,并不能肯定:总体(批)不合格品率等于百分之一百,总体(批)中都是不合格品。如果抽取两件产品,样本不合格品率有三个值:两件都是不合格品,样本不合格品率等于百分之一百;两件中一件是合格品,一件是不合格品,样本不合格品率等于百分之五十;两件都是合格品,样本不合格品率等于零;在一次抽样后,经检验,可得上述三个值中的某一个值,无论出现哪一个值,我们都不能肯定地说:总体(批)不合格品率等于这个值。 (2)样本平均每百单位产品不合格数不一定等于总体(批)平均每百单位产品不合格数。

统计学第5-6章 正态分布、 统计量及其抽样分布

第5-6章 统计量及其抽样分布 正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量 如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。 记做 2 (,)X N μσ,读作:随机变量X 服从均值为μ,方差为2 σ的正态分布 其中, μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的 标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥,即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以x轴为其渐近线。 标准正态分布 当 0,1 μσ == 时,

2 2 1 () 2x f x e π- = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ ,则 (0,1) X Z N μ σ - = 变量 2 11 (,) X Nμσ与变量2 22 (,) Y Nμσ相互独立,则有 22 1212 +(+,+) X Y Nμμσσ 5.1.3 正态分布表:可以查的正态分布的概率值()1() x x Φ-=-Φ 例:设 (0,1) X N,求以下概率

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

统计学习题答案_第4章__抽样与抽样分布

第4章 抽样与抽样分布——练习题(全免) 1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 ⑴ 给出x 的抽样分布(重复抽样)的均值和标准差 ⑵ 描述x 的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态z 统计量对应于5.15=x 的值。 ⑷ 计算标准正态z 统计量对应于23=x 的值。 解: 已知 n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x 的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x <16; ⑵x >23; ⑶x >25; ⑷.x 落在16和22之间; ⑸x <14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。试求下列概率的近似值: 解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、 金融、保险以及与汽车相关的各项服务。1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。 ⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x 服从怎样

《统计学》名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。

概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。 11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。

(标准抽样检验)抽样与参数估计

(标准抽样检验)抽样与 参数估计

抽样与参数估计 推断统计:利用样本统计量对总体某些性质或数量特征进行推断。 从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。这个调查例子是估计总体参数(某种意见的比例)的一个过程。 估计(estimation)是统计推断的重要内容之一。统计推断的另一个主要内容是本章第二节要介绍的假设检验(hypothesistesting)。 因此本节内容就是由样本数据对总体参数进行估计,即: 学习目标:了解抽样和抽样分布的基本概念 理解抽样分布与总体分布的关系 了解点估计的概念和估计量的优良标准 掌握总体均值、总体比例和总体方差的区间估计 第一节抽样与抽样分布 回顾相关概念:总体、个体和样本 抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。 总体(Population):调查研究的事物或现象的全体参数 个体(Itemunit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体统计量 样本容量(Samplesize):样本中所含个体的数量 一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。 一、抽样方法及抽样分布

1、抽样方法 (1)、概率抽样:根据已知的概率选取样本 ①、简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机会(概率) 被抽中。 注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重 复抽样与不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。 ②、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样 ③、整群抽样:将一组被调查者(群)作为一个抽样单位 ④、等距抽样:在样本框中每隔一定距离抽选一个被调查者 (2)非概率抽样:不是完全按随机原则选取样本 ①、非随机抽样:由调查人员自由选取被调查者 ②、判断抽样:通过某些条件过滤来选择被调查者 (3)、配额抽样:选择一群特定数目、满足特定条件的被调查者 2、抽样分布 一般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。 某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本时,由每一个样本计算出的该统计量数值的相对频数分布或概率分布。 二、样本均值的抽样分布与中心极限定理 1、样本均值的抽样分布(一个例子)

统计学第5-6章 正态分布 统计量其抽样分布

第5-6章 统计量及其抽样分布 5.1正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量 如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。 记做 2 (,)X N μσ:,读作:随机变量X 服从均值为μ,方差为2 σ的正态分布 其中, μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的标准差 5.1.2正态密度函数f(x)的一些特点: ()0f x ≥,即整个概率密度曲线都在x 轴的上方。 曲线 ()f x 相对于x μ=对称,并在 x μ=处达到最大值,

1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以x轴为其渐近线。 标准正态分布 当 0,1 μσ == 时, 2 2 1 () 2 x f x e π - = , x -∞<<∞ 称 (0,1) N 为标准正态分布。

标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ : ,则 (0,1) X Z N μ σ - =: 变量 2 11 (,) X Nμσ :与变量2 22 (,) Y Nμσ :相互独立,则有 22 1212 +(+,+) X Y Nμμσσ : 5.1.3 正态分布表:可以查的正态分布的概率值()1() x x Φ-=-Φ 例:设 (0,1) X N :,求以下概率 (1) ( 1.5) P X< (2) (2) P X> (3) (13) P X -<≤

相关文档
最新文档