抽样检验和抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2)随机数字法:用字母顺序或身份证号等任 何方便的方法对总体容量编者按号,利用随 机数表从1到总体容量N中随机抽取n(样本 容量数)个数,遇到那些不在编号里的数字 需跳过。
二、等距抽样:先将总体各单位按某一有关
标志(或无关标志)排队,然后相等距离或 相等间隔抽取样本单位K 。根据需要抽取的样 本单位数(n)和全及总体单位数(N),可 以计算出抽取各个样本单位之间的距离和间 隔,即:K=N/n,然后按此间隔依次抽取必 要的样本单位。
等距抽样的一个例子
某企业有职工5000名,现要随机抽取100人进行 家庭收入水平调查。
抽取方法:按与研究目的无直接关系的姓 名笔划对总体进行排列,把总体划分为 K=5000/100=50个相等的间隔,在第1至 第50人中随机抽取一名,如抽到第10名 ,后面间隔依次抽取第60,110,160, 210,…直到4960为止,总共抽取50同 名职工组成一个抽样总体。
等距抽样的优点:(1)能保证被抽取到的样
本单位在全及总体中均匀分布;(2)简化抽 样过程。
等距抽样应注意:要避免抽样间隔或样本距
离和现象本身的节奏性或循环周期相重合。
三、类型抽样
类型抽样:将全及总体中的所有单位按某一
主要标志分组,然后在各组中采用纯随机抽 样或等距抽样方式,抽取一定数目的调查单 位构成所需的样本。
4、重复抽样和不重复抽样
有放回抽样:总体中的每个个体单位可以不止 一次地被选中的抽样。
无放回抽样:总体中的每个个体被选中的次数 不多于一次。
5、样本统计量的总体参数符号
名称
样本
总体
定义 从总体中抽出的部分单位数 研究对象的全部单位总数
特征
统计量
参数
样本容量:n 符号 样本平均数:x
样本比例: p
3、样本容量和样本个数
❖ 样本容量:指一个样本所包含的单位数。通常将样 本单位数不少于30个的样本称为大样本,不及3 0个的称为小样本。社会经济统计的抽样调查多属 于大样本调查。样本个数又称样本可能数目。指从 一个总体中可能抽取的样本个数。一个总体有多少 样本,则样本统计量就有多少种取值,从而形成该 统计量的分布,此分布是抽样推断的基础。
样本标准差:s
样本方差
总体容量:N 总体平均数:μ 总体比例:p 总体标准差:σ
总体方差: 2
三、随机抽样和判断抽样
❖ 随机抽样:按照随机原则抽取样本,在总体 中所有单位被抽中的机会是均等的。
❖ 判断抽样:根据个人或集体的设想或经验, 从总体中有目的地抽取样本。
三、非抽样误差和抽样误差
❖ 1、非抽样误差:在调查登记过程中发生的误 差和由于主观因素破坏了随机原则而产生的 系统性偏差。
一、纯随机抽样:对总体的所有容量不做任何 的分类和排队,完全按随机原则逐个抽取样 本容量。
纯随机抽样的常用抽样方法
1)抽签法:将总体容量全部加以编号, 并编成相应的号签,然后将号签充分混合后 逐个抽取,直到抽到预定需要的样本容量为 止。
缺点:总体容量很多时,编制号签的工作 量很大,且很难掺和均匀。
K
ni
i1
(二)类型适宜抽样
在抽取样本单位数时,要考虑各类型组
包含的单位数不同和标志变动度( i )
的不同,变动程度( i )大的类型组要
多抽样本单位数,变动程度(
)小的
i
组要少多抽样本数,使得各类型组的变
动程度( i )在所有类型组变动程度之
❖ 抽样指标:由样本总体各单位标志值计算出 来反映样本特征,用来估计全及指标的综合 指标称为统计量(抽样指标)。统计量是样 本变量的函数,用来估计总体参数,因此与 总体参数相对应,统计量有样本平均数(或 抽样成数)、样本标准差(或样本方差 )。
❖ 注意: 对于一个问题全及总体是唯一确定的,所
以全及指标也是唯一确定的,全及指标也称为参数 ,它是待估计的数。而统计量则是随机变量,它的 取值随样本的不同而发生变化。
抽样检验和抽样分布
第一节 抽样及抽样中的几个基本概念
一、抽样的概念和特点 1、抽样:从所研究的对象中随机地取出其中一
部分来观察,由此而获得有关总体的信息。
2、抽样的3个特点: 1)遵守随机原则; 2)推断被调查现象的总体特Baidu Nhomakorabea; 3)计算推断的准确性和可靠性。
二、抽样的基本概念
1、全及总体和样本总体 全及总体是我们所要研究的对象,而样本总体则是 我们所要观察的对象,两者是有区别而又有联系的 不同范畴。 ❖ 全及总体又称母体:具有某种共同性质的许多单位 的集合体。 ❖ 样本总体:又称子样,简称样本,是从全及总体中 随机抽取出来,代表全及总体的那部分单位的集合 体。样本总体的单位数称为样本容量,通常用小写 英文字母n来表示。
占总体单位数N的比例,即:
n n n n 1 2 3 K n
N1 N2 N3
NN K
各类型组应抽取的样本单位数为:
N n i n n N i N i N
样本比率抽样样本容量:按前面指定的比例
(n/N)从每组的Ni单位中抽取ni个单位即构成 一个抽样总体,其样本容量为:
n= n1+ n2+ n3+…+ nk=
适用范围:主要适用于总体情况比较复杂,
各类型或层次之间的差异较大,而总体单位 又较多的情形,分层使层内各单位之间的差 异减小,层间差异扩大。
(一)类型比例抽样
按照总体单位数在各组之间的比例,分
配各组的抽样单位数。即:各类型中抽
取的样本单位数ni占该类型所有单位数Ni 的比例是相等的,等同于样本单位总数n
❖
样本代表性问题:随着样本容量的增大,样本 对总体的代表性越来越高,并且当样本单位 数足够多时,样本平均数愈接近总体平均数 。
2.全及指标和抽样指标
❖ 全及指标:根据全及总体各个单位的标志值 或标志属性计算的,反映总体某种属性或特 征的综合指示称为全及指标。常用的全及指 标有总体平均数(或总体成数)、总体标准 差(或总体方差 )。
2、抽样误差:是指由于随机抽样的偶然因素 使样本各单位的结构不足以代表总体各单位 的结构,而引起抽样指标和全及指标之间的 绝对离差。不包含登记性误差和不遵守随机 原则造成的偏差。
❖ 影响抽样误差的因素有:总体各单位标志值 的差异程度;样本的单位数;抽样的方法;抽 样调查的组织形式。
第二节 随机抽样设计