第五章抽样分布与参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本章主要讨论随机抽样的原理和方法
三、抽样调查的特点
➢ 按照随机原则抽取样本,完全排除了主观因素的 影响,样本对总体具有代表性。
➢ 可节省人力、物力和财力,提高时效。 ➢ 可以通过分析样本的特性,估计和推断被调查总
体的数量特征。 ➢ 抽样误差可以事先计算并加以控制,抽样调查具
有一定的精确性和可靠性。
总体
样本均值
样本
样本方差
抽样分布
二、抽样调查的分类
❖ 随机抽样:按照随机原则,完全排除了人为的主观 因素,总体中每个单位都有一定的概率被选入样本。
❖ 非随机抽样:从方便出发或者根据研究者主观的判 断来抽取样本,不遵循随机原则。无法估计和控制 抽样误差,无法用样本的数量特征来推断总体。 (方便抽样、配额抽样、 不等概率PPS抽样等)
布。
在一定条件下,大量独立随机变量的平均数是以正态 分布为极限的。
六、抽样组织的方式
1.简单随机抽样
简单随机抽样是一种对总体的每个单位(个体)都不 加任何限制的抽样。在总体中不作任何分组、划类、排队 等,完全随机地抽取调查单位。
它是抽样调查中最简单组织形式,又叫单纯随机抽样。
具体抽样时,可直接抽样,按号码签抽样,按随机数字表抽等
对于某一研究对象,当研究目的确定时,全及总体是确定的, 样本总体是不确定的。
(二)总体指标与样本指标
1、总体指标:根据总体中各单位的标志值计算出来的用于反
映总体的数量特征的指标。又称为全及指标或母体参数。
①总体平均数(总体均值):
N
Xi
X i1 N
②总体成数:
P N1 N
N1 —总体中具有某种
另外还有二重抽样法、比估计法、回归估计等
七、抽样调查中的几个基本概念
(一)全及总体与样本总体
1.全及总体是指根据调查目的所确定的研究对象全体.简称 为总体.常用 N 表示总体单位数。 2.样本总体是指根据随机原则从总体中抽取一部分单位所组 成的整体.常用 n 表示样本单位数(样本容量)。
一般 n 30 时,称为大样本;n 30 时,称为小样本
③样本标准差: s
(x x)2
n 1
s p(1 p) n 1
对于某一研究对象,当研究目的确定时,总体指标是确定的,
样本指标是不确定的。
(三)抽样框和抽样单元
抽样框:指供抽样所用的总体清单,是抽样的实际 总体。包括具体的目录以及能够计数的全部抽样单 位,而又不用把它们一一列出来。
抽样单元:把总体划分为有限个互不交叉而又内 容完备的部分,每个部分称为一个抽样单元。
七.样本单位的抽选方法
在组织抽样调查时,根据样本单位是否重复抽取,分 别有重复抽样和不重复抽样两种方法。
1、重复抽样
重复抽样是指每次从总体中抽取一个单位进行观察后, 再把这个单位重新放回总体,使之继续参加下次抽选。这 种抽选法也称为放回抽样。
具体排队时又分
按无关标志排队 按有关标志排队
5.多阶段随机抽样
多阶段随机抽样是将一次抽样后得到的样本当作总 体再次进行随机抽样,得到第二次抽样样本,然后再如 此进行下去的抽样方式。
例如:我国农产量调查就采用五阶段抽样方式。省抽县、县 抽乡、乡抽村、村抽地块、地块抽样本点,对样本点进行实 割实测的调查方法。
特性个体数目
③总体标准差:
(X X )2
N
P(1 P)
针对数量标志
针对是否标志
2、样本指标:根据样本中各单位的标志值计算出来的用于反
பைடு நூலகம்
映样本数量特征的指标称为样本指标,也称样本参数。
①样本平均数(样本均值):
n
xi
x i1 n
②样本成数:
p n1 n
n1 —样本中具有某种 特性个体数目
各层抽样比例相同
标志变动度大的组多抽 标志变动度小的组少抽
3.整群随机抽样
整群随机抽样是先将总体按某一标志分成若干组 ,每 一组称为一个群,以群为单位进行简单随机抽样,然后对 抽到的群进行全面调查的抽样方式。
例如:了解某地区职工家庭生活状况时,按居委会分群, 然后对抽到的群(居委会)中,所辖每户职工家庭进行调 查登记。
四、抽样调查的应用
对一些社会现象不可能或不必要进行全面调查时, 一种是被调查总体包含有无穷多个单位,第二种是 对破坏性和消耗性产品的检验(如:家用电器检验、 食品卫生检验等)。
企业产品质量的管理。 对一些时效性较强但有来不及采取全面调查的。 可以对大规模的全面调查进行检验,以修正资料。
五、抽样推断中的理论依据
2.分层随机抽样
分层随机抽样又称为类型随机抽样或分类随机抽样。 它是按照某一标志先将总体分成若干组(类),其中每一 组称为一层,然后在每一层内按照简单随机抽样方式进行 抽样的抽样方式。
例如:将工业企业划分为冶金、电力、石油化工、煤炭、 机械、电子等部门,每个部门中进行抽样调查。
进一步细分
类型比例抽样 类型适宜抽样
1、大数定律(切贝雪夫大数定律)
设 X1, X2, , Xn 是一列两两相互独立的随机变量,服从
同一分布,且存在有限的数学期望 和方差 2 ,则对于
任意小的正数 0 ,有:
lim P( X ) 1
n
n
对于抽样推断:随着样本容量 n 的增加,样本平均
数将接近于总体平均数。
❖ 2、中心极限定理:设从均值为,方差为 2的一个任 意总体中抽取容量为n的样本,当n充分大时,样本均值 的抽样分布近似服从均值为μ、方差为σ2/n的正态分
对于分层抽样: 层内是抽样调查 , 层间是全面调查
对于整群抽样: 群内是全面调查 , 群间是抽样调查
4.系统随机抽样
系统随机抽样又称为机械随机抽样或等距随机抽样。 它是先将总体中各单位按一定的标志排队,然后每隔一定 的距离抽取一个总体单位(个体)的抽样方式。
例如:从100人中抽取10人构成样本,先将100人排队编号, 然后在1~10号之间随机抽取一个数字,比如抽到3,那么 编号为 3,13,23,33,43,53,63,73,83,93的10个 人组成样本。
第五章 抽样分布与参数估计
本章主要内容
❖ 一、抽样调查概述 ❖ 二、抽样推断的原理 ❖ 三、抽样分布与误差 ❖ 四、必要样本容量的确定
第一节 抽样调查概述
一、抽样调查的意义
按照一定的程序,从总体中抽取一部分单位 进行调查,根据样本资料的估计值,对总体待 估参数做出具有一定可靠程度的估计和推断, 以反映总体的数量特征或数量表现。
三、抽样调查的特点
➢ 按照随机原则抽取样本,完全排除了主观因素的 影响,样本对总体具有代表性。
➢ 可节省人力、物力和财力,提高时效。 ➢ 可以通过分析样本的特性,估计和推断被调查总
体的数量特征。 ➢ 抽样误差可以事先计算并加以控制,抽样调查具
有一定的精确性和可靠性。
总体
样本均值
样本
样本方差
抽样分布
二、抽样调查的分类
❖ 随机抽样:按照随机原则,完全排除了人为的主观 因素,总体中每个单位都有一定的概率被选入样本。
❖ 非随机抽样:从方便出发或者根据研究者主观的判 断来抽取样本,不遵循随机原则。无法估计和控制 抽样误差,无法用样本的数量特征来推断总体。 (方便抽样、配额抽样、 不等概率PPS抽样等)
布。
在一定条件下,大量独立随机变量的平均数是以正态 分布为极限的。
六、抽样组织的方式
1.简单随机抽样
简单随机抽样是一种对总体的每个单位(个体)都不 加任何限制的抽样。在总体中不作任何分组、划类、排队 等,完全随机地抽取调查单位。
它是抽样调查中最简单组织形式,又叫单纯随机抽样。
具体抽样时,可直接抽样,按号码签抽样,按随机数字表抽等
对于某一研究对象,当研究目的确定时,全及总体是确定的, 样本总体是不确定的。
(二)总体指标与样本指标
1、总体指标:根据总体中各单位的标志值计算出来的用于反
映总体的数量特征的指标。又称为全及指标或母体参数。
①总体平均数(总体均值):
N
Xi
X i1 N
②总体成数:
P N1 N
N1 —总体中具有某种
另外还有二重抽样法、比估计法、回归估计等
七、抽样调查中的几个基本概念
(一)全及总体与样本总体
1.全及总体是指根据调查目的所确定的研究对象全体.简称 为总体.常用 N 表示总体单位数。 2.样本总体是指根据随机原则从总体中抽取一部分单位所组 成的整体.常用 n 表示样本单位数(样本容量)。
一般 n 30 时,称为大样本;n 30 时,称为小样本
③样本标准差: s
(x x)2
n 1
s p(1 p) n 1
对于某一研究对象,当研究目的确定时,总体指标是确定的,
样本指标是不确定的。
(三)抽样框和抽样单元
抽样框:指供抽样所用的总体清单,是抽样的实际 总体。包括具体的目录以及能够计数的全部抽样单 位,而又不用把它们一一列出来。
抽样单元:把总体划分为有限个互不交叉而又内 容完备的部分,每个部分称为一个抽样单元。
七.样本单位的抽选方法
在组织抽样调查时,根据样本单位是否重复抽取,分 别有重复抽样和不重复抽样两种方法。
1、重复抽样
重复抽样是指每次从总体中抽取一个单位进行观察后, 再把这个单位重新放回总体,使之继续参加下次抽选。这 种抽选法也称为放回抽样。
具体排队时又分
按无关标志排队 按有关标志排队
5.多阶段随机抽样
多阶段随机抽样是将一次抽样后得到的样本当作总 体再次进行随机抽样,得到第二次抽样样本,然后再如 此进行下去的抽样方式。
例如:我国农产量调查就采用五阶段抽样方式。省抽县、县 抽乡、乡抽村、村抽地块、地块抽样本点,对样本点进行实 割实测的调查方法。
特性个体数目
③总体标准差:
(X X )2
N
P(1 P)
针对数量标志
针对是否标志
2、样本指标:根据样本中各单位的标志值计算出来的用于反
பைடு நூலகம்
映样本数量特征的指标称为样本指标,也称样本参数。
①样本平均数(样本均值):
n
xi
x i1 n
②样本成数:
p n1 n
n1 —样本中具有某种 特性个体数目
各层抽样比例相同
标志变动度大的组多抽 标志变动度小的组少抽
3.整群随机抽样
整群随机抽样是先将总体按某一标志分成若干组 ,每 一组称为一个群,以群为单位进行简单随机抽样,然后对 抽到的群进行全面调查的抽样方式。
例如:了解某地区职工家庭生活状况时,按居委会分群, 然后对抽到的群(居委会)中,所辖每户职工家庭进行调 查登记。
四、抽样调查的应用
对一些社会现象不可能或不必要进行全面调查时, 一种是被调查总体包含有无穷多个单位,第二种是 对破坏性和消耗性产品的检验(如:家用电器检验、 食品卫生检验等)。
企业产品质量的管理。 对一些时效性较强但有来不及采取全面调查的。 可以对大规模的全面调查进行检验,以修正资料。
五、抽样推断中的理论依据
2.分层随机抽样
分层随机抽样又称为类型随机抽样或分类随机抽样。 它是按照某一标志先将总体分成若干组(类),其中每一 组称为一层,然后在每一层内按照简单随机抽样方式进行 抽样的抽样方式。
例如:将工业企业划分为冶金、电力、石油化工、煤炭、 机械、电子等部门,每个部门中进行抽样调查。
进一步细分
类型比例抽样 类型适宜抽样
1、大数定律(切贝雪夫大数定律)
设 X1, X2, , Xn 是一列两两相互独立的随机变量,服从
同一分布,且存在有限的数学期望 和方差 2 ,则对于
任意小的正数 0 ,有:
lim P( X ) 1
n
n
对于抽样推断:随着样本容量 n 的增加,样本平均
数将接近于总体平均数。
❖ 2、中心极限定理:设从均值为,方差为 2的一个任 意总体中抽取容量为n的样本,当n充分大时,样本均值 的抽样分布近似服从均值为μ、方差为σ2/n的正态分
对于分层抽样: 层内是抽样调查 , 层间是全面调查
对于整群抽样: 群内是全面调查 , 群间是抽样调查
4.系统随机抽样
系统随机抽样又称为机械随机抽样或等距随机抽样。 它是先将总体中各单位按一定的标志排队,然后每隔一定 的距离抽取一个总体单位(个体)的抽样方式。
例如:从100人中抽取10人构成样本,先将100人排队编号, 然后在1~10号之间随机抽取一个数字,比如抽到3,那么 编号为 3,13,23,33,43,53,63,73,83,93的10个 人组成样本。
第五章 抽样分布与参数估计
本章主要内容
❖ 一、抽样调查概述 ❖ 二、抽样推断的原理 ❖ 三、抽样分布与误差 ❖ 四、必要样本容量的确定
第一节 抽样调查概述
一、抽样调查的意义
按照一定的程序,从总体中抽取一部分单位 进行调查,根据样本资料的估计值,对总体待 估参数做出具有一定可靠程度的估计和推断, 以反映总体的数量特征或数量表现。