第六章 抽样推断

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

七、必要样本容量
1.既能满足抽样推断精确性和可靠性的要求,又不会造成浪费的样本数目。 2.影响必要样本容量的主要因素:(1)总体各单位之间的标志变异程度, 即总体方差和 P(1-P)的大小;(2)允许误差范围,即 值的大小;(3)要 求的概率保证程度;(4)抽样方法和抽样组织方式。 3.重复抽样计算公式:
概率度(t)
误差范围( )
0.50
0.50
1.00
1.00
1.50
1.50
1.96
1.96
2.00
2.00
3.00
3.00
概率 F(t) 0.3829 0.6827 0.8644 0.9500 0.9545 0.9973
六、抽样推断的优良标准
1.无偏性:样本指标的平均数等于被估计的总体指标。 2.一致性:当样本容量充分大时,样本指标充分地接近总体指标。 3.有效性:作为优良估计量的方差应小于其它估计量的方差。
2.样本指标:样本指标又叫样本统计量,它是根据样本总体中各单位标志或

标志征计算的综合指标。它随抽取样本不同而不同,因而是随机变量, 不是唯一确
定的。样本指标主要有:样本平均数,样本成数,样本方差,样本标准差。
(三)抽样误差:
1.抽样误差指样本指标和总体指标之间存在的差异。
ቤተ መጻሕፍቲ ባይዱ2.偶然性因素引起的登记性误差

使用寿命(小时)
产品数(件)
3000 以下
2
3000~4000
30
4000~5000
50
5000 以上
18
根据以上资料,以 9545%的概率保证程度,分重复抽样,不重复抽样;推
断总体平均数,推断总体成数;点估计,区间估计及以上分类中八种情况进行
计算。(4194.8<=X<=4486.2) 讲解时注意首先教给学生做此类题的思路:由参数估计三要素入手,找其
(1)估计总体平均数的必要样本容量
(2)估计总体成数的必要样本容量 4.不重复抽样计算公式:
第三节 参数的估计方法
一、参数估计的两种方法
1.参数估计指用得到的样本指标来推断总体指标。
2.参数估计的三个要素:估计值、估计的误差范围、相应的概率保证程度。

3.参数估计的两种方法:
(1)点估计:用抽样指标值直接作为总体指标的估计值,同时给出极限误
践中当 N 很大时,这是很难办到的;(2)不能充分利用总体有关信息,抽样误
差较大。
5.抽取样本单位的方法:(1)抽签法;(2)滚球法;(3)计算机模拟法;
(4)随机数表法(目前广泛应用)
6.抽样指标的计算方法:抽样平均数,抽样成数,抽样平均误差。

7.必要样本容量的确定及应注意的问题(与极限误差的 4 倍关系,对总体
教学 难点
及 突破 方法
难点:类型抽样时的参数估计方法
突破方法:示例讲解法、习题练习
相关 内容 素材
教师授课思路、设问及讲解要点 第一节 抽样推断的一般问题
一、抽样推断的概念
抽样推断指按照随机原则,从总体中抽取一部分单位进行实际调查,然后根据 调查所得的样本数据对总体的特征值做出具有一定可靠程度的推断,以反映总体的 数量特征和数关系。
二、抽样推断的特点:
1.建立在随机原则基础上; 2.运用概率论的原理,目的在于推断总体指标; 3.它的误差可以事先计算和控制。
三、抽样推断的应用
教 四、抽样推断的几个基本概念
(一)全及总体和样本总体

1.全及总体:研究对象的全体,即第一章中学过的总体。全及总体中所包括的 单位数一般用 N 表示。
2.样本总体:按随机原则从全及总体中抽取一部分单位组成的集合体,又叫抽
章节
第六章 抽样推断
课时
10

通过本章学习,要对抽样推断的特点、作用及一些基本概念有正确的理解。掌
学 握抽样推断的抽样平均误差、极限误差的计算方法。在此基础上,能运用抽样推断 的一般原理,对全及总体的指标值作出具有一定概率保证程度的推断,并能正确进
目 行相应的假设检验。

教学 重点
及 突出 方法
重点:纯随机抽样下的参数估计方法. 突出方法:示例讲解法。
以推算总体指标的抽样组织形式。
2.是最简单,最基本的抽样组织形式。适用于均匀总体。
3.优点:(1)从理论上最符合随机原则(总体中各单位被抽中的可能性完
全相等;总体中各可能样本被抽中的可能性完全相等);(2)是设计其它复杂抽
样形式的基础;(3)是衡量其它抽样形式抽样效果的比较标准。
4.实际应用中的局限性:(1)纯随机抽样要求对全部单位进行编码,在实
第二节 抽样推断的基本原理
一、抽样推断的理论依据
(一)抽样推断的理论依据是概率论中的大数法则与中心极限定理。
1.大数法则:关于大量随机现象具有稳定性质(规律性)的法则。
2.大数法则的含义:如果被研究总体是由大量相互独立的随机因素构成,
且每个因素对总体的影响都相对小,则对这些因素的影响综合平均的结果,各

1.抽样推断总是和一定的概率保证程度,即抽样误差落在允许范围内的可
能性,联系在一起的。
2.实际计算中一般不直接用概率保证程度,而是用一标准化变量 t,它是
测量估计可靠程度的一个重要参数,称作概率度。

3.抽样平均误差,抽样极限误差,概率度之间的关系:
t
x
x
p t p
4.几个常用的概率度、误差范围、概率(最好记住)
体中已抽取的样本中进行再抽样的抽样组织形式。再抽一次叫二重抽样或二次
抽样,再抽两次叫三重抽样或三次抽样。
3.多重抽样或多阶段抽样的区别:(1)目的不同。总体范围较大,不便于

直接抽取最终调查单位时采用多阶段抽样;为适应不同调查项目的不同要求, 达到节省人力物力财力的目的时采用多重抽样。(2)多阶段抽样的每个阶段,
4.整群抽样的抽样平均误差。
五、多阶段抽样和多重抽样
1.多阶段抽样。单阶段抽样是从全及总体中直接抽取最终样本单位;当全
及总体范围较小,调查单位比较集中时常采用这种形式。 多阶段抽样是把
抽取样本单位的过程分为两个或更多个阶段来进行的抽样组织形式。较大规模
的抽样调查一般多采用多阶段抽样。

2.多重抽样。也叫多次抽样。是根据对不同调查目标的不同要求,在从总
中缺少的条件,针对缺少的条件倒推,所有条件都满足后,把倒推的过程反过 来,即可。如:据以上资料在重复抽样条件下对总体平均数做区间估计,思路 为:估计三要素为估计值,概率保证程度,允许误差范围……
第四节 抽样组织形式
一、纯随机抽样
1.纯随机抽样也叫简单随机抽样,是按照随机原则直接从总体 N 个单位
中抽取 n 个单位作为样本,然后对样本单位进行观测,计算出样本指标,并据
3.影响抽样误差的主要因素:
(1)总体的变异程度;
(2)样本容量的大小;
(3)抽样方法和抽样组织形式。
(四)抽样方法和抽样组织形式
1.抽样方法:重复抽样和不重复抽样,考虑顺序的抽样和不考虑顺序的抽样。
2.抽样组织形式:简单随机抽样、类型随机抽样、等距随机抽样、整群随机抽
样、多阶段抽样和多重抽样。
(五)样本可能数目 1.样本可能数目指按一定的抽样方法和抽样组织形式,从全及总体 N 个单 位中随机抽取 n 个单位构成样本,一共可以抽出的不同样本的数量,一般用 M 表示。 2.样本可能数目与总体大小,样本容量,抽样方法,抽样组织形式有关。 3.简单随机抽样情况下: (1)顺序的不重复抽样: (2)考虑顺序的重复抽样: (3)不考虑顺序的不重复抽样: (4)不考虑顺序的重复抽样:
样总体。样本总体中所包括的单位数叫样本容量,一般用 n 表示。
(二)全及指标和样本指标

1.全及指标:根据全及总体中各单位标志值或标志属性计算的,反映总体某
种特征的指标叫全及指标,又叫总体指标。它是我们推断的指标,其值是唯一确
定的。全及指标主要包括:总体平均数、体成数、总体方差、与标准差、总体成数
的方差与标准差
按一定方法随机抽取容量为 n 的样本,所有可能样本的特征值及与其相对应的
概率分布情况。
(二)抽样分布定理
三、抽样平均误差
(一)抽样平均误差的概念: 1.抽样误差是样本指标和总体指标之间的实际误差,它无法直接计算出来, 因此实际中一般用抽样平均误差来说明样本指标和总体指标之间的平均差异程 度。 2.抽样平均误差是根据所有可能样本的样平均数或样本成数计算的标准 差,即每一次抽样的样本指标和总体指标之间的平均差异程度。 3.抽样平均误差的定义公式要求掌握所有可能样本的样本平均数,而在实 际中,N 一般相当大,从中抽取容量为的样本,其可能数目极大,无法将其全 部抽出来加以计算,为此,数理统计中证明了以下公式:
因素的个别影响将相互抵消,从而显示出它们共同作用的倾向,使总体具有稳

定的性质。(硬币)
3.对统计学的意义;
(1)通过对大量现象构成的总体进行研究,可以发现现象的规律性;(硬
币)

(2)现象的总体规律性通常以平均数的形式表现出来; (3)总体包含的单位数越多,平均数就越能正确反映现象的规律;
(4)各单位的共同倾向决定着平均数的水平,而各单位对平均数的离差则
层抽样或类型抽样。

2.特点:把统计分组和贯彻随机原则结合起来。先对总体按某一标志分类
(分层),然后从各层中按随机原则抽选一定数目单位构成样本。
3.意义:(1)可以提高样本的代表性(样本单位是从各类型组中抽取的,
包含了各种类型,各种水平的单位,因此样本的代表性要比纯随机抽样好);(2)

可以缩小抽样平均误差的总体方差。 4.抽取样本单位的方法:等比例分层抽样,不等比例分层抽样。
p
P(1 P) N n n N 1
四、抽样极限误差

1.在抽样推断中,抽样误差是客观存在的,它不能被消除和避免,而只能
控制在一定的允许误差范围内。抽样推断中根据研究目的所允许的误差范围叫
抽样极限误差。

2.实际中一般用以下公式: x x X
p pP
五、抽样推断的可靠程度
平均数和总体成数同时进行推断时,选较大值)。
二、分层抽样
学 1.分层抽样也叫类型抽样。设总体由 N 个单位构成,把总体按某一标志
划分为 K 层(类,组),使 N=N1+N2+……+Nk,然后从每类的 Ni 个单位中随
机抽取 ni 个单位,构成容量为 n 的样本,使 n=n1+n2+……+nk,这种方法叫分
教师授课思路、设问及讲解要点
(1)用样本平均数推算总体平均数的抽样平均误差:
重复抽样公式:
x
2 nn
不重复抽样公式:
x
2 Nn n N 1 n
N n N 1
(2)抽样成数的抽样平均误差
重复抽样公式:
p
P(1 P) n
P(1 P) n
不重复抽样公式:
差和相应的可靠程度。
(2)区间估计:根据抽样指标和极限误差确定出总体指标可能落入的区间

及相应的概率保证程度。
二、抽样推断的两种模式
1.给出推断可靠程度,计算极限误差,进行推断;

2.给出允许误差范围,推断可靠程度。
例:某产品使用寿命 3000 小时以上为合格品,现随机从 5000 件产品中抽取
100 件进行调查:
会由于足够多单位的综合绘总的结果而相互抵消,趋于消失。
(二)抽样推断的理论支持主要体现在它可以证明:如果随机现象存在有限的

平均数和方差,则对于充分大的抽样单位数,可以几乎趋近于 1 的概率,期望
样本平均数与总体平均数的绝对离差为最小,
二、样本的概率分布和抽样分布定理

(一)样本的概率分布:样本的概率分布指从 N 个单位构成的全及总体中
四、整群抽样
1.先将总体各单位划分为若干群,以群为单位从中随机抽取若干群,然后 对中选群全部单位进行全面调查,并据以推算总体指标的抽样组织形式。
2.抽样组织方便,节约调查费用;但由于调查单位集中,影响了调查单位 在总体中的均匀分布,抽样误差要大于其它抽样组织形式。
3.特点:(1)直接抽取的不是总体单位而是群,因此总体和样本在这里是 由群构成的;(2)影响抽样误差的是群间方差,群内方差不影响抽样误差;(3) 一般不采用重复抽样。
5.样本指标的计算方法。
三、等距抽样
1.又叫机械抽样或系统抽样,它是将总体各单位按某一标志排列,然后按 固定的顺序和间隔抽选调查单位的组织形式。(学号,成绩)
2.种类:按有关标志排队等距抽样,按无关标志排队等距抽样。(成绩, 产量,收入;学号,地理位置)
3.按抽取样本单位的方法不同,分为随机起点等距抽样(一般只适用于按 无关标志排队的等距抽样),中点等距抽样(按有关标志排队时,可以保证样本 有充分的代表性;但是一,抽样随机性受限制,不能保证每个单位都有同等被 抽取的机会,二,从总体中只能抽出一个样本,抽样框利用率太低),对称等距 抽样。
相关文档
最新文档