第八章 抽样推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
区间估计的基本步骤
1. 按照一定的抽样方式抽取适当的样本进行调查,计算 样本指标,以此作为总体参数的点估计; 2. 根据该种抽样方式的抽样平均误差公式计算出抽样误 差。
3. 根据所要求的置信水平,查正态分布表、t分布表或其
他分布表得对应的概率度,然后再计算出抽样极限误
差:
t
4.给出总体参数的置信区间:
5. 抽样推断的概率保证程度的大小。
1、从某大学的9000名学生中随机抽取1%,调查每周上网 次数,所得资料如下:
上网次数
学生数(人)
0—2
7
2—4
20
4—6
34
6—8
24
8次以上
5
试计算: 1、计算每周上网在4次以上的的学生比重、比重方差。 2、在重复抽样条件下,以95.45%的置信度来估计该校学 生每周上网的平均次数。 3、在重复抽样条件下,以同样的置信度估计该校每周上 网4次以上的学生比重。
方法:抽签法、随机数表法(计算机产生)。
2、分层抽样 分层抽样,即类型抽样,它先将总体各单位按某一
有关标志分成若干个类型组,然后按照一定比例再从各
类型组中随机抽取样本单位。采用这种方法可提高样本
的代表性,减少抽样误差。对于那些总体情况复杂、各
单位之间差异较大、单位数量较多的抽样调查问题,一 般都可以采用分层抽样的方法进行抽样调查。
1. 无偏性: E( x) ,E( p) P
2. 一致性:
lim P x 1 lim P p P 1
n n
ˆ ˆ 3. 有效性: 1 2
区间估计
总体参数的区间估计就是依照一定的概率保证程度,用
样本估计值估计总体参数的取值范围的方法。
例如从A、B、C、D、E五个字母中随机抽取两个作为 样本。N=5,n=2 考虑顺序时:样本个数 P n N! N (N - n)!
不考虑顺序时:样本个数 C n N
N! (N - n)!n!
5、抽样分布:
概念:由所以可能样本统计量的取值和与之相应的概率 (频率)组成的分配数列。(主要求出样本统计
Baidu Nhomakorabea
样方法有关。
4、抽样方法:重复抽样与不重复抽样
重复抽样又叫有放回抽样或重置抽样。它是每抽 出一个样本单位后,把结果记录下来,随即将其放回 到总体中去,使它和其余的单位在下一次抽选中具有 同等被抽中的机会。在重复抽样过程中,总体单位数 始终保持不变,并且同一个单位有多次被抽中的可能 性。
例如从A、B、C、D、E五个字母中随机抽取两个作为 样本。N=5,n=2
大样本的平均数近似服从正态分布。
重复抽样条件下的样本平均数和成数的分布
由概率论可知,如果总体是正态分布的,则样本 平均数的抽样分布服从如下正态分布:
E( X )
E ( P) p
2 2( X )
n
样本成数的抽样分布服从如下正态分布:
p 1 p p 1 p P n n n
抽样设计时,要充分考虑如何降低抽样的成本费用。
四、必要样本数目的确定及其影响因素
在组织抽样之前,必须确定必要抽样数目。
必要抽样数目受以下因素的影响:
1. 总体各单位标志变异程度。 2. 抽样极限误差的大小。 3. 抽样方法。在其他条件相同时,重复抽样比不重复抽 样要求样本容量大些。 4. 抽样方式。采用类型抽样的样本容量要小于简单随机 抽样的样本容量。
5、抽样误差与抽样平均误差
用样本指标来代表总体指标时会产生一定的误差,这种 误差是抽样推断方法本身所固有的,所以叫抽样误差, 属于代表性误差。 抽样误差主要包括样本平均数与总体平均数的差数,样 本成数与总体成数的差数。抽样误差愈小,表示样本的 代表性愈高;反之,代表性就愈低。 抽样误差的大小取决于以下几个因素:
1. 样本容量n的多少
2. 总体被研究标志的变异程度
3. 抽样方法的选择
抽样平均误差:
抽样误差也是一个随机变量,而且这一资料一般无 法取得,所以要准确地、概括地说明抽样误差的水平就 得使用抽样平均误差。
抽样平均误差是所有可能组成的样本的抽样误差的平均
数,反映抽样误差的平均水平,是衡量样本代表性大小
4、整群抽样 整群抽样是将总体所有单位划分为若干个群
(组),然后以群为单位从中随机抽取部分群,对抽中
的群内所有单位进行全面调查的抽样组织形式。整群抽
样与前面三种抽样组织方法相比,是抽样单位扩大了,
即抽取的基本单位不再是总体单位而是群。
不同抽样组织设计的比较
进行抽样设计时需要考虑的两个问题:
提高样本的代表性,增加抽样的效果。抽样要满足随 机性要求。
不重复抽样条件下样本平均数和成数的分布 由概率论可知,如果总体是正态分布的,则样本 平均数的抽样分布服从如下正态分布:
E( X )
(X ) X
2 N n
n N 1
样本成数的抽样分布服从如下正态分布:
E ( P) p
P
p 1 p N n n N 1
的尺度。 从概念出发的公式为:
2 (样本指标 全及指标)
样本个数
重复抽样条件下的抽样平均误差计算:
x p
n p (1 p ) n
不重复抽样条件下的抽样平均误差的计算:
N n n x ( ) (1 ) n N 1 n N
2 2
p(1 p) N n p(1 p) n p ( ) (1 ) n N 1 n N
总体参数 (样本指标 ,样本指标 )
区间估计的基本要素
包括: 样本点估计值 抽样极限误差:可允许的误差范围。
抽样估计的可靠程度(置信度、概率保证程度)及 概率度
置信区间
样本统计量 (点估计)
置信下限
置信上限
三、几种抽样组织方式
1、简单随机抽样
简单随机抽样又叫纯随机抽样,是最简单、最普遍的抽 样组织方法。它是按照随机性原则直接从总体的全部单 位中,抽取若干个单位作为样本单位,保证总体中每个 单位在抽选中都有同等被抽中的机会。
2、某地种植农作物6000亩,按照随机抽样,调查了300亩。 调查结果如下:平均亩产量为650公斤,标准差为15 公斤,概率为0.9545。 根据上述资料,试求:
(1)利用点估计,推算农作物的总产量
(2)全部农作物的平均亩产量
(3)利用区间估计,求这6000亩农作物的总产量的可能
范围。
本课程圆满结束 谢谢大家
当样本容量n 充分大时,可以用样本平均数估计总体平均数。
m lim p p 1 n n
当试验次数n充分大时,可以用频率代替概率。
大数法则从数量关系角度阐明了样本和总体之间的内在 联系,证明了随着抽样容量n的增加,能够以接近1的概 率期望抽样平均数与总体平均数的偏差为任意小。
大数法则的意义:个别现象受偶然因素影响,但是,对 总体进行大量观察后进行平均,就能使偶然因素的影响 相互抵消,从而使总体平均数稳定下来,反映出事物变 化的一般规律。
中心极限定理
正态分布的再生定理 :相互独立的两个正态随机变量
相加之和仍服从正态分布。
中心极限定理:
2 X ~ N , n
抽样推断的作用:
须采用抽样推断方法。
1. 某些现象不可能进行全面调查,为了解其全面资料就必
2. 某些理论上可以进行全面调查的现象,采用抽样推断可
以达到事半功倍的效果 。
3. 抽样推断可以对全面调查的结果进行评价和修正。
4. 抽样推断可用于工业生产过程中的质量检验和质量控制 。 来判断假设的真伪,为决策提供依据。
第二节 参数估计
一、概念:
参数估计就是根据样本统计量估计和推算总 体参数的过程。
样本 统计量
估计、推算
总体 参数
二、参数估计的方法
点估计 区间估计
点估计:
点估计:也称定值估计,就是以样本估计量直接代替总 体参数的一种推断方法。
点估计常用方法:矩估计法、极大似然估计法。
点估计量的优良标准
样本
参数
统计量 平均数 标准差、方差 成数
X
、2
p
S、 S2 P
( x x )2 s n 1
2
3、样本容量与样本个数
样本容量:一个样本中所包含的单位数,用n表示。 样本个数:又称样本可能数目,指从一个总体中所可能 抽取的样本的个数。对于有限总体,样本 个数可以计算出来。样本个数的多少与抽
5. 利用抽样推断的原理,可以对某些总体的假设进行检验,
二、抽样推断中的几个基本概念
1、总体和样本
总体:又称全及总体或母体,指所要研究对象的全体, 总体单位数用 N 表示。
由许多客观存在的具有某种共同性质的单位构成。 样本:来自总体,是从总体中按随机原则抽选出来的部 分,由抽选的单位构成。样本单位数用 n 表示。
根据n的多少把样本分为大样本和小样本。
注意:总体是唯一的、确定的,而样本是不确定的、可
变的、随机的。
2、全及指标和样本指标(参数与统计量)
全及指标:反映全及总体数量特征的指标。其数值是唯一的、确
定的。又称“参数”。 样本指标:根据样本分布计算的指标。是不唯一的,随机变量。
又称“统计量。 总体
考虑顺序时:样本个数=N2=52=25
( N n -1)! 不考虑顺序时:样本个数= C n N n -1 ( N -1)!n!
不重复抽样又叫无放回抽样或不重置抽样。它是每 抽出一个样本单位后,把结果记录下来,该单位就不再 放回到总体中去参加以后的抽选。在不重复抽样过程中, 总体单位数逐渐减少,并且每个单位至多只有一次被抽 中的可能性。
3、系统抽样 系统抽样又叫等距抽样或机械抽样。它是先把总体
所有单位按某一标志排队,并根据总体单位数与样本单
位数的比例计算出抽样距离和间隔,随机确定一个起始
点作为第一个样本单位,以后每隔相等的距离和间隔抽
取样本单位。 对总体单位排队时所采用的标志,可以是与调查项 目有关的,也可以是与调查项目无关的,前者称为有关 标志排队法;后者称为无关标志排队法。
量的期望与方差)。例教材P143表6.4,6.5。
包括以下内容:
重复抽样下的抽样分布
样本平均数的分布 样本成数的分布
不重复抽样下的抽样分布
样本平均数的分布 样本成数的分布
补充:大数法则和中心极限定理
Xi 1 i 1
n
1 lim p n n
总体中抽取一部分单位进行调查,并以其结果对总体某
一数量特征作出估计和推断的一种统计方法。
抽样推断的特点:
省力、快捷的特点,能以较小的代价及时获得总体的有
关信息。
抽样推断方法与其它统计调查方法相比,具有省时、
1.按照随机性原则从全部总体中抽取样本单位 2.根据样本资料对总体的数量特征作出具有一定可靠性的 估计和推断 3. 抽样推断必然会产生抽样误差,但误差可以事先计算, 并可以控制。
第八章 抽样推断
学习目标:通过本章的学习,使学生了解抽样调查 的组织形式,掌握抽样误差的计算和控制, 以及参数估计的方法,能进行简单的抽样调 查工作。 本章重点:抽样推断中的几个基本概念,抽样方 法,参数估计以及必要抽样数目的确定。
第一节 抽样推断中的基本概念
一、抽样推断的概念:
抽样推断是一种非全面调查,是按照随机原则,从
抽样分布总结
样本平均数的分布 样本成数的分布
E( X )
重复 抽样
E ( P) p
n
(X )
p 1 p P n
不重 复抽 样
E( X )
2 N n (X ) n N 1
E ( P) p
p 1 p N n P n N 1