抽样误差的概率度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


n1 n

例如,某工厂生产某种电子元件,某批产品
共10000件,其中不合格品100件,则不合格品所占
的成数P 1 % 。若从中按随机的原则抽100件,其中
有3件不合格品,则样本的成数为 p 3 %。
指标名称 平均数
总体指标和样本指标的比照
参数
统计量
X X N
X

XF F
0.98 (1 0.98) 1.14% 150
若按不重复抽样方式:
p
p(1 p) (1 n )
n
N
0.98 (1 0.98) (1 150 ) 1.1374%
150
15000
三、影响抽样平均误差的因素:
1. 全及总体标志变异程度σ——正比关系 2. 抽样单位数目的多少n——反比关系 3. 抽样方式 4. 抽样调查的组织形式
查方法上的必然选择,和普查相比,它 具有准确度高、成本低、速度快、应用 面广等优点。
一般适用于以下范围: 1.实际工作不可能进行全面调查观察,而又需要了解
其全面资料的事物;
2.虽可进行全面调查观察,但比较困难或并不必要;
3.对普查或全面调查统计资料的质量进行检查和修正;
4.抽样方法适用于对大量现象的观察,即组成事物
二、抽样平均误差
1、抽样平均误差的概念
抽样平均误差是指抽样平均数(或成数)的 标准差。即它反映了抽样指标与总体参数的平均 离差程度。通常用μ表示(样本统计量与总体参 数间的标准差)。

( xi X )2
K
抽样误差与抽样平均误差的区别 : 抽样误差就是指样本指标和总体指标之间数 量上的差别,即 x X 、p P 。
差 (随意)
实际误差







登记性误差——也叫调查误差或工作误差,是指 在调查登记、汇总计算过程中发生的误差(应设法 避免)。
代表性误差——这是指用部分单位的统计数据去 推算总体数据时所产生的误差(即样本不足以代表 总体产生的误差)。
三、抽样调查的适用范围
抽样调查方法是市场经济国家在调
率1-α ,(0<α <1),为已知的。即P(x≤X≤x)=1一α
x x 是给定的。我们称区间( 1, 2 )为总体指标X的置 x 信区间,其估计置信度为1一α ,称α 为显著性水平, 1 x 是置信下限, 2是置信上限。
关于置信度
1. 置信区间包含总体参数真值的次数所占的比例称为置信 度(置信水平)( 1-a ) * 例如:为了估计总体的平均值,我们抽取了100个样本, 必然能得到100个区间,置信水平说的是在这100个 区间中,包含总体平均值的区间有(1-a)%,有a% 不包含总体平均值!
第七章 抽样推断
抽样估计在统计方法中的地位
统方法
描述统计
推断统计
概率理论 抽样理论
参数估计
假设检验 回归分析
第一节 抽样调查的意义及基本概念
一、抽样调查的意义
一般所讲的抽样调查,即指狭义的抽样调
查(随机抽样):按照随机原则从总体中抽取一 部分单位进行观察,并运用数理统计的原理, 以被抽取的那部分单位的数量特征为代表,对 总体作出数量上的推断分析。
• 估计量:用于估计总体参数的随机变量 – 如样本均值,样本比例、样本方差等 – 例如: 样本均值就是总体均值的一个估计量
• 参数用 表示,估计量用 表示
• 估计值:估计参数时计算出来的统计量的具体值
– 如果样本均值 x =80,则80就是的估计值
估计量的优良性准则(无偏性)
• 无偏性:估计量的数学期望等于被估计的总体参 数。
将上式再作变换,可得:
x x X x x
p p P p p
二、抽样误差的概率度t与置信度F(t)
基于理论上的要求,抽样极限误差需要用抽样平均误
差µx 或µp为标准单位来衡量。即把极限误差x 或Δp
相应除以 µx 或 µp ,得出相对的误差程度t 倍,t被称之 为抽样误差的概率度。
四、抽样误差范围及其可靠程度
(一)抽样极限误差
抽样极限误差是指用绝对数形式表示的样本
指标与总体指标偏差的可允许的最大范围。
样极设限误x 差x ,与则有:p 分别表示抽样平均数与抽样成数的抽
x ≧∣ x - X ∣
p ≧∣p-P∣
将上式变换,可得:
X - x x X x
P p p P p
总体的单位数量较多的情况;
5.利用抽样推断的方法,可以对于某种总体的假设
进行检验,判断这种假设的真伪,以决定取舍。
第二节 抽样推断的基本概念及理论依据
一、全及总体和样本总体(总体和样本)
全及总体:它是指所要研究对象的全体 。 总体单位数用N表示。
样本总体:是从全及总体中随机抽选出来、 代表全及总体接受调查的那部分 单位的集合体。

X
估计量的优良性准则 (一致性)
• 一致性:随着样本容量的增大,估计量越来越接近 被估计的总体参数
• 如果一估计量是一致的,则采用大样本更可靠,否 则会不必要的浪费。
较大的样本容量
P(X )
B
较小的样本容量
A

X
参数估计的方法
一、总体参数的点估计 二、总体参数的区间估计
总体参数的点估计
点估计(概念要点)
t x


x
于是,有
t p
p
x t
x
t
p
p
抽样误差的概率度(t)是计量估计可靠程度 的一个参数;抽样估计的置信度F(t)是表明样本 统计量和总体参数的误差不超过一定范围的概 率保证程度。二者的关系是:
概率度越大,表明抽样误差范围越大,则
概率保证程度(置信度)越大;反之,概率度
抽样平均误差是所有可能出现的样本指标的标准 差。它是由于抽样的随机性而产生的样本指标与 总体指标之间的平均离差。
抽样实际误差是无法知道的,而抽样平均误差 是可以计算的。在讨论抽样误差时,一般指的是 抽样平均误差。
2、抽样平均误差的实际计算(中心极限定理的启发)
推断指标
重复抽样
不重复抽样
平均数

x
n

2 (1 n )
x
n
N
成数
P(1P)
p
n
p

P(1 P) n
(1
n N
)
取得σ的途径有:
1. 用过去全面调查或抽样调查的资料,若同时有n个
σ的资料,应选用数值较大的那个;
2. 用样本标准差S代替全及标准差σ;
3. 在大规模调查前,先搞个小规模的试验性的调查来
确定S,代替σ;
若总体单位的某种标志只有两种表现,总体成数是指具 有某种特征和属性的单位在全部总体单位重所占比重。记为p。
以 N1代表个总体单位中具有某种特征的单位数,N 0 代表 总体单位中不具有某种特征的单位数,N=N1+N0。有
P N1 N
从总体中随机抽出容量为n的样本,具有某
种特征的单位数为
n1,则样本的成数:p
(2)中心极限定律
中心极限定理是研究随机变量和的分布序列
的极限定理,论证:如果总体变量存在有限的 平均数和方差,那么,不论这个总体变量的分 布如何,随着抽样单位数(样本容量n)的增加, 抽样平均数的分布便趋近于正态分布。这个结 论对于抽样推断是十分重要的,因为在经济现 象中变量和的分布是普遍存在的。
总体参数的区间估计
总体参数的区间估计(概念)
• 总体参数区间的基本特点:是根据给定的概率保证程度的 要求,利用实际抽样资料,指出总体被估计值的上限和下 限,即指出总体参数可能存在的区间范围。
• 换句话说,对于总体的被估计指标X,找出样本的两个估
计量x1和x2,使被估计指标X落在区间(x1,x2)内的概
越小,表明抽样误差范围越小,则概率保证程
度(置信度)越小。
在大样本(n≧30)条件下,样本平均数的分 布接近于正态分布,这时可根据概率度t和置信 度F(t)的对应函数关系通过《正态分布概率表》 互相查找。
第四节 参数估计
参数估计就是用样本统计量去推断总 体的参数。
估计量与估计值 (estimator & estimated value)
1.从总体中抽取一个样本,根据该样本的统计量对总体的 未知参数作出一个数值点的估计
例如: 用样本均值作为总体未知均值的估计值就是 一个点估计
2.点估计没有给出估计值接近总体未知参数程度的信息 3.点估计的方法有矩估计法、顺序统计量法、最大似然法、 最小二乘法等
在 全 部 产 品 中 , 抽 取100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x 1002克 , 合 格 率 p 98%, 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98%。
例1
某灯泡厂从一天所生产的产品10,000个中抽取 100个检查其寿命,得平均寿命为2000小时(设 为重复抽样),根据以往资料:σ =20小时,
20 2 2(小 时 ) x 100
根据以往资料,产品质量不太稳定,若σ =200小时,
则 : x
2002 = 2 0(小 时 )
样本总体的单位数用n表示。 n ≥ 30 大样本 n < 30 小样本
二、总体指标和样本指标
总体指标:反映总体数量特征的综合指标,又称总体
参数。(唯一)
样本指标:反映样本数量特征的综合指标,又称样本
统计量。(随机)
抽样推断:就是用已知的样本指标,对总体指 标及其变化范围进行科学的估计和推算。
成数的概念
(N n 1)! DnN=CnN+n-1 = n!(N 1)!
3、抽样推断的理论依据
(1)大数定律
lim p(∣xi X ∣﹤ ) 1 nN
大数法则论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要的依据。但 是,抽样平均数和总体平均数的离差究竟有多大? 离差不超过一定范围的概率究竟有多少?这个离 差的分布怎样?这个问题要利用另一重要定理— —即中心极限定理来研究。 。
*所以并不是所有的置信区间都包括待估计的总体参数! *所以置信区间是一个随机区间
2. 常用的置信度有 99%, 95%, 90% 相应的显著性水平 为0.01,0.05,0.10
100
例2
某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽 样方式从中抽取150只进行质量检验,结果有147只合格,其 余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽 样平均误差。
N 15000 n 150
p 147 98% 150
p
p(1 p) n
x
x n
x

xf f
成数
P= N1/N Q = 1-P
方 平均数方差 差
成数方差
2

(-)2 F
F
σ2 = P(1- P)
p =n1/n q = 1-p
2
s2

(x x) f
f 1
s2 = p(1-p)
三、抽样方式及其可能的样本数目
1、抽样方式 考虑顺序
重复抽样
不考虑顺序
• 用数学式表示为:E ˆ • 问题:x 是总体平均值的无偏估计量吗?
P( X )
无偏
有偏
A
C

X
估计量的优良性准则(有效性)
有效性:一个方差较小的无偏估计量称为一个更有效的估计量 。如下图:与其他估计量相比,样本均值是一个度量总体均值的 更有效的估计量
P(X )
均值的抽样分布
B
A
中位数的抽样分布
X n i1 i n
~
N (0,1)

1 n
X n
i1 i
~ N (0,1)
n
/ n
第三节 抽样误差
一、抽样误差的概念及其影响程度
抽样误差——是指样本统计量和总体参数之间数量上
的差别。以数学符号表示,即为:∣xi -X∣、∣p-P∣。
注意不是样本个体与总体之间的差别。 抽样误差的理解: ①抽样误差是指由于抽样的随机性而产生的那一部分代表 性误差; ②随机误差有两种:实际误差和抽样平均误差。
二、抽样调查的特点
1、只抽取总体中的一部分单位作样本进行调查; 2、它是由样本的指标数值去推断总体的指标数值; 3、抽选样本单位时要遵循随机原则; 4、抽样推断会产生抽样误差,抽样误差可以计
算、并且可以事先加以控制。
登记误差














统 机
性 误
误 差
点区间估计与区间估计的关系在点估计的基础上给出总体参数估计的一个区间范围该区间由样本统计量加减抽样误差极限误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如某班级平均分数在7585之间置信水平是95置信下限样本统计量点估计置信区间置信上限三总体参数全及指标的推断方法区间估计的一般步骤
不重复抽样
2、样本的可能数目
(1)考虑顺序的不重复抽样样本数目 AnN=N(N-1)(N-2)…(N-n+1)=N!/(N-n)!
(2)考虑顺序的重复抽样样本数目(★) BnN=Nn
(3)不考虑顺序的不重复抽样样本数目(★) N!
CnN=N(N-1)(N-2)…(N-n+1)/n! = n!(N n)! (4)不考虑顺序的重复抽样样本数目
相关文档
最新文档