抽样平均误差
抽样平均误差
抽样平均误差(Sampling average error)什么是抽样平均误差抽样平均误差是抽样平均数(或抽样成数)的标准差,它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。
由于从一个总体可能抽取之个样本,因此抽样指标(如平均数、抽样成数等),就有多个不同的数值,因而对全及指标(如总体平均数、总体成数等)的离差也就有大有小,这就必需用一个指标来衡量抽样误差的一般水平。
抽样平均数的平均数等于总体平均数,抽样成数的平均数等于总体总数,因而抽样平均数(或抽样成数)的标准差实际上反映了抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。
抽样平均误差的计算(一)样本平均数的平均误差以μx表示样本平均数的平均误差,表示总体的标准差。
根据定义:1、当抽样方式为重复抽样时,样本标志值是相互独立的,样本变量x与总体变量X同分布。
所以得:(1)它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。
例1:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。
则抽样平均误差为多少?解:根据题意可得:(件)总体标准差(件)抽样平均误差(件)2、当抽样方式为不重复抽样时,样本标志值不是相互独立的,根据数理统计知识可知:(2)当总体单位数N很大时,这个公式可近似表示为:(3)与重复抽样相比,不重复抽样平均误差是在重复抽样平均误差的基础上,再乘以,而总是小于1,所以不重复抽样的平均误差也总是小于重复抽样的平均误差。
如前例,若改用不重复抽样方法,则抽样平均误差为:(件) 在计算抽样平均误差时,通常得不到总体标准差的数值,一般可以用样本标准差来代替总体标准差。
(二)抽样成数的平均误差总体成数P可以表现为总体是非标志的平均数。
即E(X)=P,它的标准差。
根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。
抽样平均误差计算公式的证明
抽样平均误差计算公式的证明作者:张玲祝青芳来源:《考试周刊》2013年第102期(1重庆交通大学理学院,重庆 400074;2四川工商职业技术学院基础部,四川都江堰611830)摘要:目前,大多数统计学教材中都没有给出抽样平均误差的计算公式的理论证明.本文针对重复抽样,不重复抽样考虑抽样顺序,不重复抽样不考虑抽样顺序这三种情况下的抽样平均误差的计算公式给予证明.关键词:样本重复抽样不重复抽样抽样平均误差方差已知的情况下,我们可以很轻松地求出抽样平均误差,即便总体方差未知,我们仍可以利用样本方差替代总体方差给出抽样平均误差的估计.这两个公式在抽样推断理论体系中有举足轻重的作用,下面我们将推证出抽样平均误差的计算公式.μ■■=σ■■=■■[■-■]■=■■[(x■+x■+…+x■)-n■]■=■[■(x■+x■+…+x■)■-2n■■(x■+x■+…+x■)+n■N■■■]=■[■(x■+x■+…+x■)■-2n■nN■■Z■+n■N■■■]=■[■(x■+x■+…+x■)■-n■N■■■]=■=■(x■+x■+…+x■)■-Z■含有K个Z■的样本数有C■■(N-1)■,含有K个Z■的样本求和再平方,结果中Z■■共有K■个,所有含有K个Z■的样本求和再平方结果中Z■■共有K■C■■(N-1)■个.在■(x■+x■+…+x■)■中共有■k■C■■(N-1)■个Z■■,■k■C■■(N-1)■=■■(N-1)■=■■(N-1)■+■■(N-1)■=■■(N-1)■+■■(N-1)■=n(n-1)■■(N-1)■+n■■(N-1)■=n(n-1)■C■■(N-1)■+n■C■■(N-1)■=n(n-1)N■+nN■在■(x■+x■+…+x■)■的展开式中共有n■N■个Z■Z■,除去其中的平方项,还剩n(n-1)N■(N-1)个Z■Z■(i≠j),Z■Z■(i■■(x■+x■+…+x■)■-■■=■{[n(n-1)N■+nN■]■Z■■+2n(n-1)N■■Z■Z■}-■■=(■+■-■)■Z■■+(■-■)■Z■Z■=■[(■-■)■Z■■-(■)■Z■Z■]=■[■■Z■S-(■)■]=■.μ■=σ■=■.不重复抽样且考虑抽样顺序下样本均值标准差μ■■=σ■■=■■[■-■]■=■■[(x■+x■+…+x■)-n■]■=■[■(x■+x■+…+x■)■-2n■■(x■+x■+…+x■)+n■A■■■■]=■[■(x■+x■+…+xin)■-2n■nC■■(n-1)!■Z■+n■A■■■■]=■[■(x■+x■+…+x■)■-n■A■■■■]=■■(x■+x■+…+x■)■-■■每个样本中若含有一个Z■,那么样本求和平方的展开式中也只有一个Z■■,因此在■(x■+x■+…+x■)■中有C■■C■■(n-1)!个Z■■,一共有平方项C■■C■■(n-1)!N=nA■■个,还剩(n■-n)A■■个Z■Z■(i≠j),Z■Z■(i=(■)(■■Z■■-■■Z■Z■)=(■)[■■Z■■-■(■Z■■+2■Z■Z■)]=■ ■不重复抽样且不考虑抽样顺序下样本均值标准差μ■■=σ■■=■■[■-■]■=■■[(x■+x■+…+x■)-n■]■=■[■(x■+x■+…+x■)■-2n■■(x■+x■+…+x■)+n■C■■■■]=■[■(x■+x■+…+x■)■-2n■C■■■Z■+n■C■■■■]=■■(x■+x■+…+x■)■-■■每个样本中若含有一个Z■,那么样本求和平方的展开式中也只有一个Z■■,因此在■(x■+x■+…+x■)■中有C■■个Z■■,一共有平方项C■■N=nC■■个,还剩(n■-n)C■■个Z■Z■(i≠j),Z■Z■(i■■(x■+x■+…+x■)■-■■=■{C■■■Z■■+■■Z■Z■}-■■=(■-■)■Z■■+2(■-■)■Z■Z■=(■)(■■Z■■-■■Z■Z■)=(■)[■■Z■■-■(■Z■■+2■Z■Z■)]=■■.对于是非标志总体,方差σ■=p(1-p),所以μ■=σ■=■或■.因此,重复抽样的抽样平均误差:μ■=■,μ■=■.不重复抽样的平均误差:μ■=μ■=■=■.参考文献:[1]毛琪. 抽样推断的抽样平均误差[J]. 重庆工业管理学院学报,1998(2).[2]阮红伟. 统计学基础[M].北京:北京大学出版社,中国农业大学出版社,2009.。
平均数的误差分析与修正
平均数的误差分析与修正在统计学中,平均数(也称为算术平均值)是一种常用的度量统计数据集中趋势的方法。
然而,由于样本的随机性和抽样误差,计算得出的平均数并不一定能完全准确地代表总体的真实情况。
因此,对于平均数的误差分析与修正显得尤为重要。
一、误差来源计算平均数可能存在的误差可以从以下几个方面进行分析:1. 抽样误差:通过抽取样本来估计总体情况时,样本的选择可能是随机的,因此样本数据与总体数据之间会存在一定差异。
抽样误差是计算平均数的一个重要来源。
2. 数据异常值:在数据集中,可能存在一些不正常或极端值,这些异常值会对平均数的计算结果产生影响。
特别是在数据集较小的情况下,异常值会对平均数的准确性产生较大的影响。
3. 数据缺失:如果数据集中存在缺失数据,这也会对平均数的计算带来不确定性。
在计算平均数时,需要对缺失值进行合理处理,以减小误差。
二、误差分析对于计算平均数时所引入的误差,我们可以进行以下分析:1. 抽样误差分析:为了减小抽样误差带来的影响,可以采用增加样本量的方式来提高平均值的准确性。
同时,也可以通过更有针对性的抽样方法来提高样本的代表性,减小抽样误差。
2. 异常值分析:对于存在异常值的数据集,可以考虑采用异常值检测算法进行筛选。
通过识别并剔除异常值,可以降低其对平均数的影响,从而得到更准确的结果。
3. 缺失数据分析:对于数据缺失的情况,可以采用合适的方法进行填补,如均值填补、插值法等。
通过合理的处理缺失数据,可以减小平均数的估计误差。
三、误差修正为了减小计算平均数时所引入的误差,可以考虑以下修正方法:1. 置信区间修正:平均数的计算结果通常伴随着置信区间。
考虑到抽样误差的影响,可以通过增加置信区间的宽度来修正平均数的估计误差。
一般来说,置信区间越宽,平均数的估计误差越小。
2. Bootstrapping修正:Bootstrapping是一种重复抽样的方法,通过从样本中反复进行有放回抽样,可以生成多个样本,从而得到多个平均数。
关于抽样平均误差的概念与计算研究
关于抽样平均误差的概念与计算研究作者:周丽霞来源:《知识文库》2017年第23期1 引言一般来说抽样误差是指样本指标与总体指标之间的绝对误差。
抽样误差是衡量抽样检查准确程度的指标,抽样误差越大,表明样本对总体的代表性越小,抽样调查的结果越不可靠;反之,抽样误差越小,说明样本对总体的代表性越大,抽样调查的结果越准确可靠。
对抽样误差深入研究可以发现,抽样误差分为抽样实际误差和抽样平均误差。
抽样实际误差是指随机抽取的某一样本的样本指标与总体指标的差数。
例如,样本平均数与总体平均数之差,样本成数與总体成数之差。
由于总体指标的未知性,样本指标的随机性(不唯一性),即按照随机原则从同一总体中抽取样本容量相同的样本可以有多重不同的抽取方法,抽取样本的随机性,产生的样本指标也具有随机性,抽样实际误差也是随机的,是不可求的。
为了用样本指标去推算总体指标,就需要计算这些抽样实际误差的平均数,即抽样平均误差。
2 概念提出(一)抽样平均误差的概念抽样平均误差是反映抽样实际误差一般水平的指标,确切地说抽样平均误差是指样本平均数(或成数)的标准差,也可以理解为所有样本指标与总体指标的平均离差。
抽样平均误差一般用希腊字母表示,其中抽样平均数的平均误差用表示,抽样成数的平均误差用表示。
抽样平均误差的作用表现在它能够说明样本指标代表性的大小,抽样平均误差越大,说明样本指标对总体指标的代表性越低;抽样平均误差越小,说明样本指标对总体指标的代表性越高。
虽然某一次的抽样实际误差具有不确定性,但是抽样实际误差是客观存在的,是可以计算的。
(二)抽样平均误差的计算根据抽样平均误差的概念,抽样平均误差用公式可表示如下:抽样平均数的平均误差:抽样成数的平均误差:是所有可能抽取的样本个数。
在实际中,由于、是未知的,也不可能一一列举出所有的样本,计算出每个样本的指标、,因此无法按以上定义公式来计算抽样平均误差。
数理统计证明,抽样平均误差的计算公式如下。
抽样平均误差
什么是抽样平均误差抽样平均误差是抽样平均数(或抽样成数)的标准差,它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。
由于从一个总体可能抽取之个样本,因此抽样指标(如平均数、抽样成数等),就有多个不同的数值,因而对全及指标(如总体平均数、总体成数等)的离差也就有大有小,这就必需用一个指标来衡量抽样误差的一般水平。
抽样平均数的平均数等于总体平均数,抽样成数的平均数等于总体总数,因而抽样平均数(或抽样成数)的标准差实际上反映了抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。
抽样平均误差的计算(一)样本平均数的平均误差以μx表示样本平均数的平均误差,表示总体的标准差。
根据定义:1、当抽样方式为重复抽样时,样本标志值是相互独立的,样本变量x与总体变量X同分布。
所以得:(1)它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。
例1:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。
则抽样平均误差为多少?解:根据题意可得:(件)总体标准差(件)抽样平均误差(件)2、当抽样方式为不重复抽样时,样本标志值不是相互独立的,根据数理统计知识可知:(2)当总体单位数N很大时,这个公式可近似表示为:(3)与重复抽样相比,不重复抽样平均误差是在重复抽样平均误差的基础上,再乘以,而总是小于1,所以不重复抽样的平均误差也总是小于重复抽样的平均误差。
如前例,若改用不重复抽样方法,则抽样平均误差为:(件)在计算抽样平均误差时,通常得不到总体标准差的数值,一般可以用样本标准差来代替总体标准差。
(二)抽样成数的平均误差总体成数P可以表现为总体是非标志的平均数。
即E(X)=P,它的标准差。
根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。
1、在重复抽样下(4)2、在不重复抽样下(5)当总体单位数N很大时,可近似地写成:(6)当总体成数未知时,可以用样本成数来代替。
抽样平均误差
详解
抽样推断的一般概念
抽样推断的主要内容为:参数估计和假设检验。
抽样的基本概念
1、全及总体和样本总体
全及总体是我们所要研究的对象,而样本总体则是我们所要观察的对象,两者是有区别而又有联系的不同范 畴。全及总体又称母体,简称总体,它是指所要认识的,具有某种共同性质的许多单位的集合体。样本总体又称 子样,简称样本,是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。样本总体的单位数称为 样本容量,通常用小写英文字母n来表示。随着样本容量的增大,样本对总体的代表性越来越高,并且当样本单位 数足够多时,样本平均数愈接近总体平均数。
抽样平均误差
反映抽样误差一般水平的指标
01 详解
03
目录
02 抽样估计
抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反 映了抽样指标与总体指标的平均离差程度。抽样推断是在根据随机原则从总体中抽取部分实际数据的基础上,运 用数理统计方法,对总体某一现象的数量性作出具有一定可靠程度的估计判断。抽样推断具有这些特点:它是由 部分推算整体的一种认识方法;它是建立在随机取样的基础上。它是运用概率估计的方法;抽样推断的误差可以 事先计算并加以控制。
谢谢观看
如果说对于一次抽样调查,全及总体是唯一确定的,那么样本总体就不是这样,样本是不确定的,一个全及 总体可能抽出很多个样本总体,样本的个数和样本的容量有关,也和抽样的方法有关。
2、全及指标和抽样指标
根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指特点 抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征 作出具有一定可靠程度的估计和判断。 特点:它是由部分推断整体的一种认识方法;抽样推断建立在随机取样的基础上;抽样推断运用概率估计的 方法;抽样推断的误差可以事先计算并加以控制。 抽样推断的内容 参数估计:参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行 估计。 假设检验:假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计 分析方法。 有关抽样的基本概念 1、总体和样本
抽样平均误差
抽样误差抽样误差,是指按随机原则抽样时,在没有登记误差和系统性误差的条件下,单纯由于不同的随机样本的样本指标代表总体指标而产生的误差。
(一)抽样实际误差抽样实际误差:是指在一次抽样中由随机因素引起的样本指标与总体指标之间的离差,如x - X ,p - P(二)抽样平均误差抽样平均误差:指样本平均数(或样本成数)的标准差。
它反映了所有抽样结果所得的样本指标值与总体指标值的平均离差。
抽样平均误差的理论公式MX xMi ix ∑=-=12)(μ 或[]2)(x x E x -=μMP pMi ip ∑=-=12)(μ 或[]2)(p p E p -=μ样本的可能数目计算方法 (1)考虑顺序的不重复抽样数目(2)考虑顺序的重复抽样数目(3)不考虑顺序的不重复抽样的数目(4)不考虑顺序的重复抽样的数目nn N N B =!!)(n N N A nN -=!!!)(n N n N C n N-=!1!)!1(1)(--+==-+N n n N CD n nN n N2、抽样平均误差实际运用的公式 (1)样本平均数的抽样平均误差: ①在简单随机重复抽样条件下,X μ=n2σ②在简单随机不重复抽样条件下,X μ=⎪⎭⎫⎝⎛--12N n N n σ 当N 很大时,N -1≈N 人,以式改为:X μ=⎪⎭⎫ ⎝⎛-N n n 12σ(2)样本成数的抽样平均误差: ①在简单随机重复抽样条件下,P μ=nPQ②在简单随机不重复抽样条件下, 【例7—17】解法一:按抽样平均误差的理论公式计算。
表7—4 考虑顺序的重复抽样样本分布表总体平均数X =233211=++=∑=NXNi i抽样平均误差()57735.0300.3212==-=∑=nN i ix N Xxnμ 解法二:按抽样平均误差的实际公式计算(见表7—5) 表7—5 总体分布表总体方差()32122=-=∑=NXXNi iσ抽样平均误差57735.0322122=⨯==nσμ 【例7—18】解法一:按抽样平均误差的理论公式计算。
极限误差计算公式
极限误差计算公式
极限误差是指抽样推断中依一定概率保证下的误差的最大范围,也称为允许误差。
极限误差的计算公式为:
极限误差 = 抽样平均误差×概率度
其中,抽样平均误差是指样本观测值与总体均值之差的平均值,概率度是指抽样推断中期望误差的置信度。
具体而言,如果置信度为95%,则极限误差约为样本观测值与总体均值之差的平均值的 4.6 倍。
极限误差的计算是基于抽样推断原理,是基于样本数据对总体特征进行推断的一种方法。
极限误差的大小取决于样本容量、总体规模和抽样方法等因素,因此具体计算方式可能有所不同。
《统计学》第七章抽样推断第二节 抽样误差
经济、管理类 基础课程
统计学
二、抽样误差的影响因素
差异越大,抽 样误差越大
单位数越多, 抽样误差越小
1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。
重复抽样的抽 样误差比不重 复抽样的大 6-4 简单随机抽样 的抽样误差最 大
三、抽样平均误差
或
p p P
如果抽样极限误差用抽样平均误差来 衡量,则有: x t x 或 p t p
9
式中, N为总体单位数; n为样本容量;σP2 为总体成数方 差一般情况下是末知,可用样本成数方差替代σp2 。
8
四、抽样极限误差
抽样极限误差是指用绝对值形式表示的样本指 标与总体指标偏差可允许的最大范围。即:
x x X
即,抽样极限误差是 抽样平均误差的多少 式中, x样本平均指标 ;X 为总体平均指标 倍。我们把倍数 t称 p为样本成数;P 为总体成数 。 为抽样误差的概率度
2
n ( 1- ) 当N 很大时,可近似表示为: = n N
6
1. 重复抽样的条件下
平均数的抽样平均误差 : x
n
式中,n为样本容量; 为总体标准 。
成数的抽样平均误差 : p
p
n
式中,n为样本容量; 为总体成数标准差 P 一般情况下是末知,可用样本成数标准差替代 p。
P(1 P)
7
2. 不重复抽样的条件下
平均数的抽样平均误差 : x 当N很大时近似为 x
2 ( N n)
n( N 1)
;
2
抽样平均误差
灯泡平均使用寿命 x
xf f
灯泡合格率 p 1-q
70 020 100
700.2(小时)
1-1070 93%
样本标准差 sx
(x -x)2 f f
37 996 19.49(小时)
100
抽样平均误差
【例7.1】 解:
抽样平均误差
(三)影响抽样平均误差的因素 1、总体内部的差异程度 2、样本容量 3、抽样方法 4、抽样组织形式
样误差。 抽样误差是指在遵守了随机原则的条件下,由于 样本的构成与总体的构成不同从而产生的误差。
抽样平均误差
抽样误差
图7-1 统计误差分类
抽样平均误差
二、实际抽样误差
实际抽样误差就是指样本指标值与总体指标值之间的
绝对离差。如 x-X 、p -P 、 s2- 2 。
在抽样调查中,总体指标值是未知的,因而任何一次 抽样的实际抽样误差也是未知的。因为样本的统计量是随 机变量,因此实际的抽样误差也是随机变量。
统计学
计算公式为:
x
(x-x)2
M
式中, x ——样本平均数;
x ——样本平均数的平均数;
M ——样本的可能组成数目。
抽样平均误差
(二)抽样平均误差的计算
1、平均数的抽样平均误差的计算
(1)重复抽样时平均数的抽样平均误差
x
x
n
(2)不重复抽样时样本平均数的抽样平均误差
x
2 N n
n N 1
抽样平均误差
2、抽样成数的抽样平均误差的计算
(1)重复抽样的抽样成数的平均误差
p
P(1 P) n
(2)不重复抽样的抽样成数的平均误差
p
P(1 n
抽样平均误差
抽样平均误差抽样平均误差是指在某一个调查总体中所有的单位都处于相同的数量状态时,可以用样本统计量代表总体参数。
平均误差反映了抽样误差对于总体参数值的影响程度。
平均误差的大小,受调查研究区域和研究方法等多种因素的影响。
对于一次实验来讲,平均误差一般都很小,但不能说明实验结果一定没有误差,只能说明研究工作中有较少的误差因素。
对于许多随机抽样的研究结果而言,总体分布并不代表全部数据的真实分布,因此,还需要进行误差分析。
如果某个总体的分布与所估计的总体分布相差太远,则这个估计量是不准确的。
但它仍然具有一定的代表性。
对于同质总体而言,随机抽样的平均误差,与样本容量的平方根成正比,即,即在大样本情况下,平均误差总是比较大的,如果在大样本条件下,仍然按照所采取的概率抽样方式选择样本,将会给结论带来较大的偏差。
对于异质总体而言,随机抽样的平均误差,与样本容量的平方根成反比。
即,即当样本容量很大时,平均误差较小,当样本容量很小时,平均误差就较大。
根据统计学中的概念,样本平均数应该符合如下两个条件:(1)无论总体是否代表全体,样本平均数应等于总体平均数; (2)在无限总体中,总体中所有单位的平均数相等。
由此看来,在研究中,我们常用样本平均数作为基本参数来估计总体平均数。
1、抽样平均误差的表示方法从抽样推断来说,平均误差表示某项观察结果与总体的平均值之差。
因此,它是一个用来表示抽样结果离散程度的统计量。
如果两个总体的标志总量相等,那么,样本平均数与总体平均数之差就是总体方差的一个估计。
由于,样本平均数是样本统计量,因此,通常我们也把它称为“样本平均数的方差”。
这里,要说明两点:(1)样本平均数的方差和样本平均数的标准差是完全一致的,前者是后者的估计。
(2)样本平均数的方差与样本平均数的标准差是总体方差的两个估计,它们之间是相互独立的。
另外,在样本平均数的方差与样本平均数的标准差之间,还有一些中间变量。
这些中间变量主要包括:样本平均数的协方差、方差开平方。
抽样平均误差
抽样平均误差抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全局指标的绝对离差。
必须指出,抽样误差不同于登记误差,登记误差是在调查过程中由于观察、登记、测量、计算上的差错所引起的误差,是所有统计调查都可能发生的概念抽样误差就是指以样本统计数据值与被推测的总体参数发生的偏差。
主要包括:样本平均数与总体平均数之差,样本成数与总体成数之差。
统计数据误差的来源:一类:备案性误差;二类:代表性误差(a、系统性误差;b、偶然性误差),抽样误差特指偶然性误差。
表现形式样本实际误差就是所指在一次具体内容的抽样调查中,由于随机因素引发的样本指标与总体指标之间的Matches。
例如样本平均数与总体平均数之间的绝对Matches,样本成本与总体成本之间的Matches。
但是,在样本中,由于总体指标数值就是未明的,因此,样本实际误差就是无法排序的。
同时,样本实际误差仅仅就是一系列可能将发生的误差数值之一,因此,样本实际误差没归纳所有可能将产生的抽样误差。
抽样平均误差是指抽样平均数的标准差或抽样成数的标准差。
从一个总体中我们可能抽取很多个样本,因此样本指标如样本平均数或样本成本数将随着不同的样本而有不同的取值,它们对总体指标如总体平均数或总体成本数的离差有大有小,即抽样误差是个随机变量。
而抽样平均误差则是反映抽样误差的一般水平的一个指标,但由于所有可能样本平均数的平均数等于总体平均数,样本成本的平均数等于总体成数,因此,我们不能用简单算术平均的方法来求抽样平均误差,而应采取标准差的方法来计算抽样极限误差就是指样本指标与总体指标之间的误差范围。
产生影响抽样误差的因素:样本单位数的多少,总体中被研究标志的变动程度的大小。
抽样误差是抽样理论的一个重要概念,在说明抽样误差之前我们先介绍统计误差。
统计误差是指在统计调查中,调查资料与实际情况间的偏差。
即抽样估计值与被估计的未知总体参数之差。
统计学(抽样极限误差与平均误差的关系及抽样方案的设计)
抽样极限误差与抽样平均误差的关系抽样极限误差通常用抽样平均误差的倍数表示,即pp t μ=∆ 2p p Z αμ∆=t 称为概率度 x x t μ=∆ 2x xZ αμ∆=3、可信程度可信程度是表示估计的可靠程度如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。
而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t 决定的。
因而可靠程度与t 之间有一定正比关系。
概率度t 与概率保证程度(可靠程度)之间的关系见下表。
例:若概率为0.95,查表得t=1.96三、抽样推断(区间估计)抽样推断(区间估计)的步骤如下:⒈计算抽样平均误差⒉给定概率保证程度,查表得概率度t⒊计算抽样极限误差x x t μ=∆⒋估计总体指标区间x x x X x ∆+≤≤∆-接前面灯泡例题:灯泡样本平均使用时间 为1057小时,合格率为91.5%,重复抽样下,灯泡的使用时间抽样平均误差 小时,合格率的平均误差为 ,计算在不同概率保证下,平均数和成数的抽样极限误差?当t=1?当t=2?当t=3?第五节 抽样方案设计(P96)一、抽样方案设计的基本原则保证实现抽样随机性的原则(保证消除代表性误差中的偏差)保证实现最大的抽样效果原则注意:调查费用取决很多因素,其中最重要的是抽样单位数目,要确定适当的抽样单位数目,取决于抽样的精度和可靠性的要求;精度是指希望估计区间的长度越短越好,可靠性是指估计区间包含参数的概率越大越好;在样本容量确定的条件下二者是矛盾的,因此抽样设计的原则是在一定的误差和可靠性的要求下选择费用最少的样本设计。
二、简单随机抽样(既不分组也不排队)简单随机抽样又称纯随机抽样,是按照随机的原则直接从N 个总体单位中抽取n 个单位作为样本。
注意:简单随机抽样最符合随机原则直接抽选法抽签法随机数码表法三、类型抽样 (分层抽样)类型抽样又称分类抽样或分层抽样,是先对总体各单位按一定标志加以分类,然后再从各类中按随机原则抽取样本,由各类内的样本组成一个总样本。
抽样极限误差
抽样极限误差
“抽样平均误差”-样本数是有限的。
“抽样极限误差”-样本数是无
限的。
平均误差指各个样点值的误差平均值,反映了误差水平大小。
极限误
差指最大和最小样点值的误差,反映了样本的离散度,即离平均值多远。
抽样平均误差是误差的平均值也就是把误差全部相加除以个数。
抽样
极限误差是误差的两个极限之间的差距也就是最大值减去最小值。
两者之
间的关系是都在一组调查数据信息中。
抽样平均误差=标准差/样本单位数的平方根;抽样极限误差=样本
平均数减去总体平均数的绝对值;抽样极限误差是T倍的抽样平均误差。
主要方法
(1)抽签法。
一般地,抽签法就是把总体中的N个个体编号,把号
码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个
号签,连续抽取n次,就得到一个容量为n的样本。
抽签法简单易行,适用于总体中的个数不多时。
当总体中的个体数较
多时,将总体“搅拌均匀”就比较困难,用抽签法产生的样本代表性差的
可能性很大。
(2)随机数法。
随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。
等距抽样平均误差的计算方法
作者: 王晓军;晏艳阳
出版物刊名: 财经理论与实践
页码: 53-56页
主题词: 抽样平均误差;等距抽样;抽样误差;总体方差;排队;估计问题;误差公式;整群抽样;简单随机抽样;样本
摘要: <正> 如何科学估计等距抽样误差,是直到目前为止尚未很好解决的问题。
本文拟就此问题作一些探究。
一、现行估计方法的理论依据及其问题我们对按有关标志排队与按无关标志排队等距抽样误差估计问题分别进行讨论. 一般认为,按无关标志排队的等距抽样可以看作是一种无放回的简单随机抽样。
因此,无关标志排队等距抽样的平均误差就用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样平均误差(Sampling average error)
什么是抽样平均误差
抽样平均误差是抽样平均数(或抽样成数)的标准差,它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。
由于从一个总体可能抽取之个样本,因此抽样指标(如平均数、抽样成数等),就有多个不同的数值,因而对全及指标(如总体平均数、总体成数等)的离差也就有大有小,这就必需用一个指标来衡量抽样误差的一般水平。
抽样平均数的平均数等于总体平均数,抽样成数的平均数等于总体总数,因而抽样平均数(或抽样成数)的标准差实际上反映了抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。
抽样平均误差的计算
(一)样本平均数的平均误差
以μx表示样本平均数的平均误差,表示总体的标准差。
根据定义:
1、当抽样方式为重复抽样时,样本标志值是相互独立的,样本变量x与总体变量X同分布。
所以得:
(1)
它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。
例1:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。
则抽样平均误差为多少?
解:根据题意可得:(件)
总体标准差(件)
抽样平均误差(件)
2、当抽样方式为不重复抽样时,样本标志值不是相互独立的,根据数理统计知识可知:(2)
当总体单位数N很大时,这个公式可近似表示为:
(3)
与重复抽样相比,不重复抽样平均误差是在重复抽样平均误差的基础上,再乘以,而总是小于1,所以不重复抽样的平均误差也总是小于重复抽样的平均误差。
如前例,若改用不重复抽样方
法,则抽样平均误差为:(件) 在计算抽样平均误差时,通常得不到总体标准差的数值,一般可以用样本标准差来代替总体标准差。
(二)抽样成数的平均误差
总体成数P可以表现为总体是非标志的平均数。
即E(X)=P,它的标准差。
根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。
1、在重复抽样下(4)
2、在不重复抽样下
(5)
当总体单位数N很大时,可近似地写成:
(6)
当总体成数未知时,可以用样本成数来代替。
例2:某企业生产的产品,按正常生产经验,合格率为90%,现从5000件产品中抽取50件进行检验,求合格率的抽样平均误差。
解:根据题意,在重复抽样条件下,合格率的抽样平均误差为:
在不重复抽样条件下,合格率的抽样平均误差为:
抽样误差的计算
1、表现形式:平均数指标抽样误差;成数(比重)抽样误差。
2、平均数指标的抽样误差
1)重复抽样的条件下:
2)不重复抽样的条件下:
3、成数指标的抽样误差
1)重复抽样的条件下:
2)不重复抽样的条件下:
抽样误差的控制措施
抽样误差则是不可避免的,但可以减少,其措施有:
1、增加样本个案数。
2、适应选择抽样方式。
不重置抽样,样本平均值的标准差为修正系数。
A、无限总体,按照重置抽样计算
B、有限总体:
N比较大,n/N大于等于5%,修正系数简化为1-n/N N比较大,n/N小于5%,按重置抽样计算。