统计学 第七章 抽样推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节
第三节
抽样推断中的几个基本概念
抽样分布和抽样误差
第四节
第五节
抽样估计
抽样推断误差的控制
第一节
抽样推断的基本问题
一、抽样推断的概念: 抽样包括抽样调查和抽样推断两部分。 抽样推断包括两个有联系但又具有一定差别的方面, 即估计和检验 二、特点: 1、样本单位是按随机原则抽取的 2、抽样推断是一种从数量上由部分推断总体的研究方法 3、抽样推断是采用概率估计的方法 4、抽样推断的误差可以事先计算并加以控制 三、抽样推断的应用 (一)调查具有破坏性的场合 (二)对无限总体或总体规模非常大的场合进行调查
1、在总体为正态分布,且总体方差已知
抽样平均数的允许误差为 抽样成数的允许误差
x z
1
2
x
p z
1
2
p
2 、在任意一个总体中抽样,总体方差已知,如果样本容量 n≥30时:
平均数的极限误差
x z
1
2
x
成数的极限误差
p z
1
2
p
3 、在正态分布总体中抽样,样本容量 n≺30,且总体方差未知的
情况下: 平均数的极限误差
x t
1
2
ˆx
ˆp
成数的极限误差
p t
1
2
第四节
一、点估计方法
抽样估计
总体参数的估计方法有两种:即点估计和区间估计。 点估计,就是将样本指标直接作为未知的总体指标的估计值。 一个优良的估计量要求满足: (一)无偏性
(二)一致性
(三)有效性 点估计给出的只是总体指标的一个估计数值,既没有给出准确 度,也没有给出可靠程度。因此,在实际工作中不单独使用。
Nn
n CN
五、抽样调查的理论基础
(一)大数定律 大数定理是关于大量的随机先行的均值具有稳定性的定理。 1、贝奴里大数定理 2、契比雪夫大数定理 (二)中心极限定理
证明某一分布的极限分布为正态分布的定理为中心极限定理。
正态分布?
第三节:抽样分布和抽样误差
一、抽样分布
(一)样本平均数的抽样分布
1、在简单随机重复抽样时; 样本平均数的抽样分布.doc
已知: 2 0.09, 或 0.3,n 4, 1 0.95, 0.05 所以,Z x Z 而x
1
2
Z 0.975 1.96 0.09 0.294 4
1
x 1.96
2
15.7 16.3 15.9 16.1 16 4 16 0.296 16 0.296 即( 15.706 , 16.294 )为总体平均数的置信 区间,置信度为 95%
第七章
抽样推断
教学目的:通过本章的学习使学生掌握 抽样推断的基本原理和方法,理解抽样 分布的理论和样本容量的确定方法。
教学重点:重点介绍抽样误差的概念、 抽样平均误差的计算、参数估计的基本 方法和必要样本容量的确定方法。
教学学时:本章将用9个学时介绍。
第七章
第一节
抽样推断
抽样推断的基本问题
1
2
ˆx
p p P p p或p z
1
2
p P pz
1
2
p
从一批产品中随机抽取100件,测得一级品为95件,试以95%的 置信度推断该批产品的一级品率。
依资料:n 100 ,样本一级品率 p s2 5 95%, 0.025, Z 1.96, 1 100 2 2
p
i 1
r
i
r
例分类抽样的区间估计.doc
二、样本容量的确定
(一)概念 必要样本容量又称必要样本单位数
(二)样本容量n的确定 在简单随机重复抽样下:
根据 x z
1
2
x zBaidu Nhomakorabea
2
2
Z 2 2 , 可得n
1
1
n
2 2 x
根据 p z
1
2
p z
1
n (1 ) n N
2
PQ N n ( ) n N 1
PQ n (1 ) n N
其中:
2
N i
i 1
k
2 i
N
k i 1 i i
2 n i i i 1
k
n
k
PQ
N PQ n PQ
i
N
i 1
i i
i
n
4、分层抽样下的区间估计 分类抽样的区间估计.doc 5、分层抽样的优点 分类的原则:扩大组间差异,缩小组内差异。
5、等距抽样的估计区间 分类抽样的区间估计.doc 6、等距抽样的优点 (五)整群抽样 1、概念 “群”的划分原则:群内差异性,群间同质性 2、抽样平均误差 样本平均数的抽样误差
x
2 Rr
r (
R 1 其中, 2为总体的群间方差,总 体的群间方差可用样本 的群间 方差代替, 2
总体时
x x x x 或x z
1
2
x x z
1
2
x
例如:已知某一正态总体的平均数未知,总体方差为 0.09 ,现 简单随机抽取 4 个单位,其样本单位的标志值为 15.7 、 16.3 、 15.9、16.1,要求以95%的概率保证程度,确定总体平均数的置 信区间。
2、在简单随机不重复抽样时: 样本平均数的抽样分布.doc (二)样本成数的抽样分布 1、 在重复抽样时,
p E ( p) P
2 p
P(1 P) 或 p n
P(1 P) n
2、在简单随机不重复抽样时
p E ( p) P
2 p
P(1 P) N n 或 p n N 1
(三)分层抽样 1、概念 2、分层抽样的具体形式: (1)等数分配 (2)等比例分配 (3)最优分配 3、分层抽样下的抽样平均误差 如果是等比例抽样,抽样平均误差可用下式计算: 在重复抽样时
x
x p
2
n
2
或 p
PQ n
在不重复抽样时
N n ( ) n N 1
P(1 P) N n n N 1
二、抽样分布定理
(一)样本平均数的抽样分布定理 1、正态分布的再生定理 (一)正态分布的再生定理.doc 2、中心极限定 (一)正态分布的再生定理.doc 3、小样本条件下的t分布定理
(二)样本成数的抽样分布定理
三、抽样误差与抽样平均误差
(一)抽样误差
由抽样随机性所产生的样本指标与总体指标之间的离差叫做抽
样误差。如
x 或p P
(二)抽样平均误差
抽样平均误差可以表示为:
2 ( x ) 2 ( x x )
x
p
样本的可能数目
2 ( p P )
样本的可能数目
2 ( p p )
x x x x p p P p p
第五节 抽样推断误差的控制
一、抽样组织形式的选择
( 一)抽样设计
(二)简单随机抽样
1、概念 简单随机抽取样本单位的做法有抽签法和随机数表法。
2、简单随机抽样的抽样平均误差 计算抽样平均误差时,同样也需要用到总体方差 当它们未知时,其处理方法为: (1)利用以往的历史资料来估计; (2)通过小规模试验资料来估计; (3)通过样本方差去估计。 3、简单随机抽样条件下的区间估计 简单随机抽样例题.doc
n 100 0.048 ˆp pq 0.95 0.05 0.048 , 0.022 n 1 99 100 95% 1.96 2.2% P 95% 1.96 2.2%即90.4% P 99.3%
抽样估计的主要步骤:
第一步,抽取样本,计算出样本平均数或样本成数 第二步,计算出抽样平均误差 第三节,根据给定的置信度要求,查正态分布表找出相 应的临界值 第四步,计算出抽样限误差 第五步,求出置信区间
K
i
F
i 1
K
(X
i 1
K
i
) 2 Fi
i
F
i 1
K
对于属性总体,其平均数和方差或标准差为:
P
2 PQ
PQ
二、样本 (一)样本的概念
样本容量n≥30为大样本,n≺30为小样本 (二)反映样本特征的主要指标 对于样本变量总体:
x
x
i 1
n
i
n
或x
2
PQ , 可得n n
Z 2 PQ
二、区间估计
区间估计是在一定的可靠度要求下,根据样本观测值将总体 指标真值估计在某个可能的范围内。
根据前面极限误差的讨论:
x x p P p
容易导出:
x x x x p p P p p
(一)总体平均数的置信区间
1总体方差已知,如果样本容量n≥30,或n≺30,且来自正态
i
2 ( x x ) i i 1 R
)
x 而x r
r 1
样本成数的抽样平均误差为:
p
2 Rr
r (
R 1 其中: 2为总体成数的方差,但 总体成数的方差未知, 可用 2 样本成数的方差代替 i 1
r
)
( pi p) r 1
2
,而样本成数为 p
x f
i 1 k
k
i i
f
i 1
s2
(x x)
i 1 i
n
2
n 1
或s 2
(x x)
i 1 i
k
2
fi
i
f
i 1
k
i
1
s
(x
i 1
n
i
x)
2
n 1
或s
(x
i 1 k i 1
k
i
x )2 fi
i
f
1
对于属性样本总体
xp
n s pq n 1
2
s
n pq n 1
需指出:n-1称为变量的自由度,也就是变量自由取值的个数 。
三、抽样方式
讲顺序 重复抽样 不讲顺序 抽样方式 讲顺序 不重复抽样 不讲顺序
四、样本的可能数目 在讲顺序的重复抽样的条件下,样本的可能数目为 在不讲顺序的不重复抽样下,样本的可能数目为:
2、总体方差未知时,样本容量n≥30时,用样本方差代替总体 方差,用上述方法确定总体平均数的置信区间。 若n≺30,且总体服从正态分布,需用t分布理论确定总体平均 数的置信区间。
x x x x 或x t
(二)总体成数的区间估计
1
2
ˆx x t
(四)系统抽样
1、概念 系统抽样的关键是在第一个抽样距离内抽取第一个调查单位,第 一个单位抽到后,其他单位就好确定了。 抽样距离k=N/n。 2、等距抽样的形式 (1)随机起点的等距抽样 (2)半距起点的等距抽样 (3)对称起点的等距抽样 3、等距抽样排队的标志 (1)有关标志排队 (2)无关标志排队 4、等距抽样的抽样平均误差 如果是按无关标志排队的等距抽样,其抽样平均误差可按简单随 机不重复抽样的公式近似计算;如果是按有关标志排序的等距抽 样,抽样平均误差就可以按类型抽样的公式近似计算。
(三)不必要进行全面调查但又需要知道总体的全面情况时
(四)对全面调查的结果进行核查和修正
(五)对资料时效性要求很强的场合
第二节
一、总体
(一)总体的概念 (二)分类
抽样推断中的几个基本概念
1、按照全及总体所包含总体单位个数的多少,可以分为有限总 体和无限总体 2、按照全及总体中各单位标志的性质不同,可以分为属性总体 和变量总体 3、按照样本单位的来源不同,可将总体分为目标总体和被抽样 总体
样本的可能数目
样本的可能数目
由此可见,抽样平均误差就是样本平均数或样本成数的标准差。 在实际中,重复抽样的抽样平均误差为:
x
2
n
或 p
PQ n
不重复抽样的情况下,样本平均数或样本成数的标准差为:
x p
2
N n ( ) n N 1
2
n
(1
n ) N
PQ N n ( ) n N 1
PQ n (1 ) n N
可见,影响抽样误差大小的因素有:
1、总体各单位的差异程度
2、样本容量的大小 3、抽样方法
4、抽样的组织形式
(三)抽样极限误差
抽样极限误差就是指样本指标与全及总体指标之间误差的最大
可能范围,通常用“△”表示: 平均数的极限误差 成数的极限误差
x x
p P p
(三)反映总体特征的主要指标 对于变量总体,反映总体集中分布趋势的算术平均数
X
i 1
N
i
N
X
i 1 K i 1
K
i
Fi
i
F
反映总体离中分布趋势的方差或标准差
2
(X
i 1
N
i
)
2
N
) Fi
2 i
(X
i 1
N
i
)2
N
2
(X
i 1