抽样与参数估计
抽样分布与参数估计
![抽样分布与参数估计](https://img.taocdn.com/s3/m/13f11a4330b765ce0508763231126edb6e1a764b.png)
▪ 某电视台欲在95%的置信度水平下,对电
视节目的收视率作为有效的估计,试考 虑样本量应当为多少?
▪ 问题:若确定估计绝对误差为5%,则样
本为385户,是否可行?
▪ 若考虑估计相对误差为10%,则样本量应
当为多少?
统计学原理
其他样本量估计的情况
▪ 估计样本比例时样本量的确定 ▪ 估计两个总体均值之差时样本量的确定 ▪ 估计两个总体比例之差时样本量的确定 ▪ 以上问题,均可通过参数估计的公式进行
o 比例估计时,方差为:p(1-p) o 可知,p(1-p)的最大值为0.25。
统计学原理
比例估计时的样本量推算
在校园内估计学生拥有手机的比例,希 望在95%的置信水平下,估计的绝对误 差不超过5个百分点(5%),求样本量
n
1.962
0.052
2
, 取
2
Max
0.25
则有n 385
统计学原理
助记方法
统计学原理
统计学原理
一个总体参数—总体均值
▪ 正态总体,方差已知;
o 或非正态总体,大样本,方差已知。
z x ~ N (0,1) X n
置信区间:
(
x
za
2
X
n
,
x
za
2
X
n
)
注意:Z取a/2的原因在于此时置信 区间是最小的。
统计学原理
一个总体参数—总体均值
▪ 正态总体,方差未知
统计学原理
计算结果
▪ 计算样本平均数:X=39.5 ▪ 计算样本标准差:s=7.7736 ▪ 令:总体标准差=样本标准差,计算抽样误差为
1.2956
统计学 第 6 章 抽样与参数估计
![统计学 第 6 章 抽样与参数估计](https://img.taocdn.com/s3/m/f560be62f11dc281e53a580216fc700abb6852bd.png)
第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
(抽样检验)抽样与参数估计最全版
![(抽样检验)抽样与参数估计最全版](https://img.taocdn.com/s3/m/02efc0574028915f814dc26e.png)
(抽样检验)抽样与参数估计抽样和参数估计推断统计:利用样本统计量对总体某些性质或数量特征进行推断。
从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。
这个调查例子是估计总体参数(某种意见的比例)的壹个过程。
估计(estimation)是统计推断的重要内容之壹。
统计推断的另壹个主要内容是本章第二节要介绍的假设检验(hypothesistesting)。
因此本节内容就是由样本数据对总体参数进行估计,即:学习目标:了解抽样和抽样分布的基本概念理解抽样分布和总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体比例和总体方差的区间估计第一节抽样和抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取壹部分元素(单位)进行调查,且根据样本数据所提供的信息来推断总体的数量特征。
总体(Population):调查研究的事物或现象的全体参数个体(Itemunit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容量(Samplesize):样本中所含个体的数量壹般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。
壹、抽样方法及抽样分布1、抽样方法(1)、概率抽样:根据已知的概率选取样本①、简单随机抽样:完全随机地抽选样本,使得每壹个样本都有相同的机会(概率)被抽中。
注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重复抽样和不重复抽样。
而且,根据抽样中是否排序,所能抽到的样本个数往往不同。
②、分层抽样:总体分成不同的“层”(类),然后在每壹层内进行抽样③、整群抽样:将壹组被调查者(群)作为壹个抽样单位④、等距抽样:在样本框中每隔壹定距离抽选壹个被调查者(2)非概率抽样:不是完全按随机原则选取样本①、非随机抽样:由调查人员自由选取被调查者②、判断抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择壹群特定数目、满足特定条件的被调查者2、抽样分布壹般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。
抽样与参数估计
![抽样与参数估计](https://img.taocdn.com/s3/m/bc2dee3033d4b14e84246882.png)
第四章抽样与参数估计推断统计:利用样本统计量对总体某些性质或数量特征进行推断。
从数据得到对现实世界的结论的过程就叫做统计推断(statistical inference)。
这个调查例子是估计总体参数(某种意见的比例)的一个过程。
估计(estimation) 是统计推断的重要内容之一。
统计推断的另一个主要内容是本章第二节要介绍的假设检验(hypothesis testing) 。
因此本节内容就是由样本数据对总体参数进行估计,即:学习目标:了解抽样和抽样分布的基本概念理解抽样分布与总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体比例和总体方差的区间估计第一节抽样与抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。
总体(Population):调查研究的事物或现象的全体参数个体(Item unit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容量(Sample size):样本中所含个体的数量一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。
一、抽样方法及抽样分布1、抽样方法(1)、概率抽样:根据已知的概率选取样本①、简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机会(概率)被抽中。
注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重复抽样与不重复抽样。
而且,根据抽样中是否排序,所能抽到的样本个数往往不同。
②、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样③、整群抽样:将一组被调查者(群)作为一个抽样单位④、等距抽样:在样本框中每隔一定距离抽选一个被调查者(2)非概率抽样:不是完全按随机原则选取样本①、非随机抽样:由调查人员自由选取被调查者②、判断抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择一群特定数目、满足特定条件的被调查者2、抽样分布一般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(sampling distribution)。
第六章抽样与参数估计
![第六章抽样与参数估计](https://img.taocdn.com/s3/m/bf5185550740be1e650e9aad.png)
(1)验证 E(x) X
(2)计算重复抽样及不重复抽样的抽样平均误差。 24
第2节 参数估计的基本方法
参数估计——以实际观察的样本数据所计算的统计量作为未 知总体参数的估计值。
一、点估计(Point estimate) 点估计也称定值估计,就是直接以样本统计量作为总体参数
29
大样本(n≥30)下总体均值的区间估计
区间估计就是根据样本求出总体未知参数的估计区间,并使其 可靠程度达到预定要求。
(1) 总体方差σ 2已知时
由于 α ,有
z
x
/
n
N(0,1) ,所以对于给定的置信度1-
P {z 2
x/nz2}1
即
Px z/2
7
抽样法的特点:随机原则 部分估计总体 存在误差并可以控制
抽样法的应用:对某些不可能进行全面调查 而又需要了解其 全面情况的社会经济现象, 必须应用抽样法。(破坏性试验、总体过大、 单位过于分散,实际调查不可能的)
8
第1节 抽样与抽样分布
一、有关抽样的基本概念
总体(母体)(Population) 样本(子样)(Sample) 总体指标(总体参数)(Population parameter) 样本指标(样本统计量)(Sample statistic)
2、某工厂共生产新型聚光灯2000只,随机抽选400只进行耐 用时间调查,结果平均寿命为4800小时,标准差为300小时。 求抽样误差。
3、从某校学生中随机抽选400名,发现戴眼镜的有80人。计 算求抽样误差。
统计学课件05第5章抽样与参数估计
![统计学课件05第5章抽样与参数估计](https://img.taocdn.com/s3/m/e52d649cc0c708a1284ac850ad02de80d4d806c7.png)
反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。
第六章抽样与参数估计
![第六章抽样与参数估计](https://img.taocdn.com/s3/m/ca680e6689eb172ded63b7e1.png)
第六章 抽样与参数估计学习目标知识目标:理解抽样与估计的基本原理;掌握抽样推断、抽样分布、统计量和参数估计的基本概念和计算方法。
能力目标:能够根据统计研究目的和统计对象的特点组织抽样调查,计算样本指标(样本均值和样本方差),并依据样本对总体的数量特征(总体均值和总体比例)作出估计。
参数估计是统计推断的一种重要形式之一,包括参数的点估计和区间估计两类。
在本章中我们介绍统计推断的基本原理,抽样和抽样分布的基本概念,参数的点估计与几种重要的区间估计方法,参数估计量的优良性标准也在本章作简要叙述。
第一节 抽样与抽样分布关键词:总体和样本;抽样及抽样推断;参数和统计量;抽样分布一、抽样推断的基本概念(一)总体和样本抽样推断是从统计总体中抽取部分单位组成样本进行调查的。
统计总体,简称为总体,它是指所要研究的客观现象的全体,组成总体的每一个元素称为个体。
例如我们要研究某市居民的家庭收入水平,那么该市所有居民的家庭收入便构成研究总体,而每一户居民的家庭收入就是个体。
一般来说,我们所研究的总体,即研究对象的某项数量指标X ,是一个随机变量,它的取值在客观上有一定的分布。
实际上,我们对总体的研究,就是对相应的随机变量X 的分布的研究。
因此,今后将不区分总体和相应的随机变量。
为了推断总体的某些数量特征,我们一般是从总体中抽取一部分个体进行观察,即随机抽样。
随机抽样就是按照机会均等的原则(即随机原则)从总体中抽取一部分个体的过程。
假如我们抽取了n 个个体,且这n 个个体的某一指标为),,,,(21n X X X 我们称这n 个个体的指标),,,(21n X X X 为一个子样或样本,并且一般称为简单随机样本(即子样的每个分量都机会均等的来自同一总体,各个分量之间是相互独立的),n 称作子样的容量。
在一次抽样之后,观察到子样),,,(21n X X X 的一组确定的值),,,(21n x x x ,称为容量为n 的子样的观察值(或数据)。
抽样与参数估计
![抽样与参数估计](https://img.taocdn.com/s3/m/e64d42e2856a561252d36f73.png)
常用的置信水平值有 99%, 95%, 90%
相应的 为 0.01,0.05,0.10 相应的 z/2 为 2.58, 1.96, 1.65
5 - 47
置信区间与置信水平
样本均值的抽样分布
/2
1-
/2
(1 - ) % 区间包含真值 的可能性占(1 - ) %
% 区间包含真值 的可能性占
估
计
区间估计
5 - 37
点 估 计
定义:用样本估计量 的值直接作为总体参 数 θ 的估计值,称为参数的点估计 例如:用样本均值直接作为总体均值的估计 用样本比例直接作为总体比例的估计
缺点:由于样本统计量是随机变量,点估计
无法知道估计值与总体参数真值的接
近程度
5 - 38
区间估计
定义:在点估计的基础上,给出总体参数估 计的一个范围,称为参数的区间估计 区间估计由样本统计量加减抽样误差得到 进行区间估计时,根据样本统计量的抽样 分布能够对样本统计量与总体参数的接近 程度给出一个概率度量
1. 每抽取一个样本进行计算时,算出来的样本 统计量是一个随机变量
2. 样本统计量(随机变量)的全部就会形成一 个概率分布,它就是抽样分布。由于人们不 会抽取样本的全部,所以它是一种理论分布 3. 概率分布来自容量n相同的所有可能样本
4. 样本统计量的概率分布提供了样本统计量长 期稳定的信息,是进行统计推断的理论基础 ,也是抽样推断的重要科学依据
第 5 章 抽样与参数估计
5-1
5.1 5.2 5.3 5.4 5.5
抽样与抽样分布 参数估计的基本原理 总体均值的区间估计 总体比例的区间估计 样本量的确定
5-2
学习目标
统计学第四章抽样与参数估计
![统计学第四章抽样与参数估计](https://img.taocdn.com/s3/m/88d302f1970590c69ec3d5bbfd0a79563d1ed41a.png)
疗效评价
通过参数估计和假设检验等方法,评价药物 的疗效和安全性。
案例三:工业生产过程质量控制
抽样检验计划制定
根据产品特性和质量要求,制定合适的抽样 检验计划。
不合格品控制
对不合格品进行统计分析和处理,找出原因 并采取措施加以改进。
过程能力分析
收集生产过程中的质量数据,进行过程能力 分析和参数估计。
抽样作用
通过样本信息推断总体特征,为决策提供依据。
抽样方法分类
随机抽样
按照随机原则从总体中抽取样本,每个个体 被抽中的概率相等。
系统抽样
按照某种规则从总体中抽取样本,如每隔一 定距离或时间抽取一个样本。
分层抽样
将总体分成若干层,然后从各层中随机抽取 样本。
整群抽样
将总体分成若干群,然后随机抽取若干群作 为样本。
05
案例分析:实际场景下抽样 与参数估计问题探讨
案例一:市场调查中消费者满意度测评
01
抽样方法选择
根据市场调查的目的和预算,选 择合适的抽样方法,如简单随机 抽样、分层抽样或整群抽样。
03
数据收集与处理
设计调查问卷,收集消费者满意 度数据,并进行数据清洗和整理
。
02
样本量确定
综合考虑调查的精度要求、总体 规模、抽样误差等因素,合理确
运用统计学方法进行假设检验和参数估计,验证研究假 设的可靠性。
THANKS
定样本量。
04
参数估计
运用统计学方法,对消费者满意 度进行参数估计,如计算满意度
均值、标准差等。
案例二:医学研究中药物疗效评价
试验设计
采用随机对照试验等方法,确保试验组和对 照组的可比性。
样本量计算
抽样分布与参数估计
![抽样分布与参数估计](https://img.taocdn.com/s3/m/c2eb4b2f7cd184254a353518.png)
2 x
(5.7)
(5.8)
x
n
(5.9)
【例 5-3】计算例 5-2 中 10 名推销员平均的任职年限 及其标准差, 并与例 5-2 求得的样本平均数的期望值与方差 作比较。 解: (1 2+3+4+5+6+7+8+9+10)/10=5.5
2
正态分布时,所需的样本容量 n 可以较小,反之则需 要较大的样本容量。通常将样本单位数不少于 30 的 称为大样本。
二、样本比例的抽样分布
(一)样本比例的期望值与方差
设随机变量 X 服从二点分布,其总体平均数为 , 又
称为总体比例,总体方差 2 ( ) ( 1 ) 。现对其进行 n 次独立重复观测,得到下列样本:(X1,X 2,…,X n),其中, 观测结果为“成功”的次数是 N1。 我们把样本中“成功”的次数所占比例定义作样本比例 P。
一、样本平均数的抽样分布
(一)样本平均数的期望值与方差
在放回抽样的情形下,设从总体中抽出的 样本为 x1 , x 2 , , x n ,其是相互独立的,并且 为 ,则可推导出样本平均数的期望值与方
2
与总体服从同一分布。设总体均值为 ,方差 差、标准差分别为:
X1 + X 2 + + X n E( X ) E( ) n 1 E ( X 1 ) E ( X 2 ) E ( X n ) n
0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10
抽样与参数估计统计学实验报告
![抽样与参数估计统计学实验报告](https://img.taocdn.com/s3/m/dca3004e9a6648d7c1c708a1284ac850ad0204cc.png)
抽样与参数估计统计学实验报告抽样与参数估计统计学实验报告概述本实验以抽样与参数估计统计学为主题,研究了参数估计、抽样方法、统计识别等内容。
实验目的1. 熟悉参数估计和统计分析的基本原理和方法;2. 掌握抽样的基本原理,熟悉抽样方法的运用;3. 掌握统计模型识别的方法,进行统计分析和决策;实验介绍1. 参数估计:参数估计是统计分析过程中重要的一步,它是识别某个实际系统的一个重要参数,以此据估计出实际系统的精确参数,估计准确的参数是统计模型的建立的前提。
2. 抽样方法:抽样方法就是从一个总体中取样,所取样的水平表现出一定的代表性,从而能推算出总体的概况,抽样方法有分层抽样、系统抽样、整群抽样等多种。
3. 统计模型识别:是用统计技术进行模型识别,它是利用概率模型来分析数据,建立有效的模型,从而进行有效的分析。
数据分析1. 针对参数估计,我们使用假设检验,通过比较估计值和真实值,进行检验,从而得出参数的准确度。
2. 针对抽样方法,我们使用分层抽样,将总体划分成不同的层,可以更好地表征总体,进行有效抽样。
3. 针对统计模型识别,我们使用多种模型进行比较,根据其检验概率和显著性水平,选择出最有效的模型进行识别。
结论1. 通过假设检验,得出了参数估计的准确度;2. 通过分层抽样得出了较好的抽样结果;3. 通过多种模型进行比较,选择出最有效的模型进行识别。
建议在下次实验中,为了提高参数估计的精度,应该进行更加精细的假设检验;为了增加抽样的可靠性,应该采用更为严谨的抽样方法;此外,要多尝试不同的统计模型,以期得到更好的结果。
抽样与总体参数的估计
![抽样与总体参数的估计](https://img.taocdn.com/s3/m/95b2ea94dd88d0d233d46a5c.png)
统计推断是统计学研究的重要内容。抽样是进行统计 统计推断的基础工作。参数估计是统计推断的重要内 容之一。 6.1 抽样与抽样分布 6.2 参数的估计方法 6.3 总体均值和总体比例的区间估计 6.4 两个总体均值及两个总体比例之差的估计 6.5 正态总体方差及两个正态总体方差比的区间估计
小概率事件
如果真观察到50个电池平均寿命低于52个月, 则有理由怀疑厂方说法的正确性。
例6.3 某电梯承受的最大拉力为1000千克,可乘坐13人。 已知人群的平均体重为60千克,标准差为14千克,且
服从正态分布。问电梯发生事故的概率是多少?
解: =60,=14,n=13 则
14 2 X ~ N (60, ) N (60,3.882 2 ), 13 X 60 ZX , 3.882 1000 X max 76 .923, 13 76 .923 60 Z X max 4.359 , 3.882 P ( X X max ) P ( Z X Z X max ) P ( Z X 4.359 ) 0.5 P (0 Z X 4.359 ) 0.5 0.499993 0.000007
Up为正态分布的p分位数。
6.1.5 两个方差比的分布
X 1 , X 2 ,..., X n1 来自正态总体 N (1 , 12 )的一个样本; 设
Y1 , Y2 ,..., Yn2
2 SX 2 1 2 SY 2 2 2 SX
2 来自正态总体 N ( 2 , 2 ) 的一个样本
且Xi(i=1,2,…,n1)与Yi(i=1,2,…,n2) 相互独立,则
2 1 2 2 2 SY
~ F ( n1 1, n2 1),
抽样调查与参数估计
![抽样调查与参数估计](https://img.taocdn.com/s3/m/81ca49216294dd88d0d26be1.png)
3.总体是唯一的、确定的,而样本是不确定的、可变的、随机的。
4-5
二、样本容量与样本个数
样本容量:一个样本中所包含的单位数,用n表示。必要样本量是能够满足估计 精度要求的最少样本量。
起点r
r+k
r+2k
r+3k
4-20
圆形系统抽样方法:当N不能被n整除时, 用圆形系统抽样法可以避免出现样本量可能不一 致的情况。把总体单元假想排列在一个圆上,取 k = N/n 最接近的整数,作为间隔,然后在1到N 之间,抽取随机起点 r,则被抽中的单元顺序号 为: r,r+k,r+2k,……r+(n-1)k。
4-15
七、抽样误差和非抽样误差
抽样误差是指由于抽选样本的随机性,用样本数据对 总体参数进行估计是所引起的误差。只有采取概率抽 样方式才能产生样误差,得到估计量的精度,因此我 们说抽样误差仅仅表现于概率抽样方式之中。与非概 率抽样方式相比,能够计算抽样误差是概率抽样最突 出的优点。
非抽样误差是指除抽样误差以外的,由于各种原因而 引起的误差,例如抽样框有缺陷,目标总体单位和抽 样单位没有能够一一对应;调查中一些被调查者拒绝 回答问题,调查人员没得到全部样本数据;由于各种 原因(测量、遗忘或有意隐瞒等),调查中获得的原始 数据不正确,以及在对调查数据进行编码、录入、汇 总过程中可能出现差错,都会产生非抽样误差。
可以把抽样框中所包含抽样单位信息的丰富程度
作为评价抽样框质量的一个标准。在好的抽样框中,抽
样单位的信息比较丰富,这就为采用复杂的抽样设计
(如分层抽样)和不同的估计方法(如比率估计)提供了条