统计学第八章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、抽样调查的组织方式
(一)简单随机抽样
简单随机抽样也叫纯随机抽样,它对总 体单位不作任何分类排队,而是直接从总体 中随机抽取一部分单位来组成样本的抽样组 织方式。 (1)抽签法。
(2)随机数字法。
(二)类型抽样 类型抽样又称分类抽样或分层抽样, 它是先将总体按某个主要标志进行分组
(或分类),再按随机原则从各组中抽取
态分布。从正态分布图中,可以总结两个特点:
一是样本指标高于或低于总体指标的概率分布完
全是对称的;二是样本指标接近于总体指标的概 率越大(小),出现的可能性也越大(小)。
图8—3
样本指标置信度图
误差范围 ˆ 与概率度(t)和抽样平均误差 ˆ
三者之间的关系为:
ˆ tˆ
x t x p t p
2.成数的抽样平均误差 (1)重复抽样条件下:
p
P 1 P n
[公式8—11]
(2)不重复抽样条件下:
p
P 1 P n N N 1 n
[公式8—12] [公式8—13]
当N很大时,
p
P 1 P n 1 n N
二、区间估计
区间估计就是以一定的概率保证估计
包含总体参数的一个值域,即根据样本指 标和抽样平均误差推断总体指标的可能范 围。
图8—2 正态分布曲线图
根据数理统计证明,总体单位的标志值如果是
正态分布,其全部可能样本也一定是正态分布的;
如果总体单位的标志值不是正态分布的,只要是
大样本(即n≥30),全部可能样本指标也会接近正
x
i
x
j 1
Mi
ij
Mi
r
(i 1,2,3, , r )
[公式8—4]
i
x
x M
i 1 r
i
M
i 1
(i 1,2,3, , r )
i
[公式8—5]
第二节 抽样误差
一、抽样误差的概念
即使遵守了随机原则,也会由于被抽取 的样本各种各样,导致样本内部各单位的分 布比例结构与总体实际分布状况有偶然性的 差异,从而使不同的随机样本得出不同的估 计量,造成样本指标数值与总体指标数值之 间产生差距,如抽样平均数与总体平均数的 离差,抽样成数与总体成数的离差等。这类 误差通常称为抽样误差或随机误差。
r r 1 R
[公式8—21]
其中:
2 Xi X
R
x2
[公式8—22]
p
Pi P 2
R
[公式8—23]
[例8—5]
首先,分别计算样本平均数和样本成数:
x
p
r r
xi
248 246 253 4400(克) 3 85% 80% 253 84% 83% 3
样本单位的一种抽样方式。
(1)等数分配类型抽样法。 (2)等比例类型抽样法。
nN
i (i 1,2, , k ) n i N
[公式8—1]
(3)不等比例类型抽样法。
n
i n
ii
i
ii
i
[公式8—2]
(三)等距抽样
等距抽样也称机械抽样或系统抽样,
它是将总体各单位按某一标志顺序排列,
(三)抽样平均误差的计算方法
1.平均数的抽样平均误差 (1)重复抽样条件下:
x 2
n
n
n
n
[公式8—8]
(2)不重复抽样条件下:
x 2 n N
nN 1
[公式8—9] [公式8—10]
当N很大时,
x 2
n 1 n N
标的实际值(
(
x , p) 直 接 作 为 总 体 未 知 参 数
X
,P)的估计值的一种推断方法。
ˆ 为未知参数θ 的估计量, 1.一致性。设
当n→∞时,要求
ˆ 1 lim P
n
按概率收敛于 θ ˆ
[公式8—26]
2.无偏性。若要求估计量
ˆ
的数学期
望等于未知参数的真值θ
第八章
抽样调查
内容提要
本章主要阐述了抽样调查的概念、 特点、作用和几个基本概念;影响抽样 误差的主要因素;抽样调查几种主要组 织方式的抽样平均误差的计算;抽样估 计推断;点估计和区间估计;必要抽样
第一节 抽样调查的一般问题
一、抽样调查的概念与作用 (一)抽样调查的概念与特点
抽样调查又称抽样推断或抽样估计,
然后按固定顺序和相等距离或间隔抽取 样本单位的抽样组织方式。
抽样距离计算公式为:
k
N n
[公式8—3]
图8—1 等距抽样示意图
(四)整群抽样
整群抽样也称集团抽样、区域抽样
或分群随机抽样,它是将总体各单位按
时间或空间形式划分成许多群,然后按
纯随机抽样或机械抽样方式从中抽取部
分群,对中选群的所有单位进行全面调 查的抽样组织方式。
8.67 3
3 1 1.69(克) 300
p
2p
r
r 1 R
14 3
3 1 300 2.51%
第三节 总体指标的推断
一、点估计
点估计也称定值估计,它是以抽样得到的
样本指标作为总体指标的估计量,并以样本指
i 2 Ni
N
[公式8—18]
P 1 P
P i 1 PiFra Baidu bibliotek N
[公式8—19]
[例8—4]
x
s2
n
xi ni
6000 24 2400 16 3600 8 4400(千克 / 公顷) 48 60 2 24 120 2 16 95 2 8 8014.17 48
x p
n 1 N
P 1 P n 1 n N
1.79%
法
(四)其他抽样组织方式抽样平均误差的计算方
1.类型比例抽样平均误差的计算。 (1)平均数的抽样平均误差
重复抽样条件下:
x 2
n
[公式8—14]
[例8—2] 某仪表厂生产某种型号的精密仪表,按正常 生产经验,产品合格率为85%。今按简单随机抽样方式从800 只仪表中抽取10%进行检验,求合格品比率的抽样平均误差。
P 85%,
2 P1 P 85% (1 85%) 12.75%,
n 800 10% 80
不重复抽样条件下:
x 2
n n 1 N
[公式8—15]
(2)成数的抽样平均误差
P 1 P n
p
[公式8—16]
不重复抽样条件下:
P 1 P n 1 n N
p
[公式8—17]
其中:
2
计算的,反映总体某种属性的综合指标。由于
全及总体是唯一确定的,根据全及总体计算的
全及指标也是唯一确定的。
2.样本指标。
样本指标也称样本统计量或抽样指标,它
是根据抽样总体各单位的标志值或标志特征计 算的综合指标。由于可以从一个全及总体中抽 取许多个不同的样本,不同的样本其分布结构 也会有差异,抽样指标的数值也就不同,所以
在重复条件下,采用[公式8—11]:
p
P 1 P n 12.75% 3.99% 80
8—13]:
p
P 1 P n 1 n N 12.75% 80 1 3.79% 80 800
[例8—3]某大学有4500名学生,采用不重复简单 随机抽样方式从中抽取10%的学生,调查其每月生 活费用支出情况。抽样结果显示,学生平均每人每 月生活费支出350元,标准差80元,生活费用支出 在500元以上的学生占全部学生的20%。试求抽样平
pi
然后,分别求出样本平均数群间方差和成数群间 方差:
x2
xi x 2
R
26 8.67 3
p
pi p 2
R
14 4.67 3
最后,根据[公式8—20]和[公式8—21]求出 μ x和μ p为:
2x
r
x
r 1 R
二、影响抽样误差的主要因素
(一)样本单位数(样本容量n)的多少
( 二 ) 总体被研究标志变异程度 ( 总体 方差σ 2)的大小
(三)抽样组织方式
(四)
三、抽样平均误差
(一)抽样平均误差的概念
标为变量,以总体指标为平均数计算得到
ˆ 的标准差,以符号 表示,通常以 x
代
表平均数的抽样平均误差,以 p
400, F(t ) 95%,
查表得 : t 1.96, 则 : x
ˆ E
[公式8—27]
3.有效性。无偏性只考虑估计量的平均结果是 否等于待估计参数的真值,有效性则要求每个估计值 与待估参数真值之间的偏差尽可能地小。
ˆ , ˆ 为θ 的两个无偏估计量,若 ˆ 的方差小 设 1 2
于 ˆ
1
2
ˆ D ˆ D 1 1
[公式8—28]
抽样指标的数值不是唯一确定的。
样本统计量与总体参数
名称 定义 特征 样本 从总体中抽出的部分单位 统计量 样本容量 样本平均数 样本比率 样本方差 样本标准差
n x ~ p s2 s
总体 研究对象的全部单位 参数 总体容量 N 总体平均数 X或 总体比率 P 总体方差 2 总体标准差
符号
[公式8—29]
由此得到平均数和成数的误差范围公式:
8—30] [公式8—31]
进而得到总体平均指标和总体成数指标的区间 估计公式为:
x x X x x
8—32]
p p P p p[公式8—33]
[例8—6]
n 10000 1% 100, x 5000,
代表成数
的抽样平均误差,以K代表可能组成的样本 总数。
(二)计算抽样平均误差的理论公式
ˆ
样本指标 总体指标2
可能组成的样本总数
即: x
2 x X
K
[公式8—6] [公式8—7]
p P 2
K
p
[例8—1]为叙述简便起见,假设有10,20,30和 40四个数字组成一个总体,从中随机抽取两个数字 作为样本,求抽样平均误差。
si 2 ni
n s2 n
x
8014.17 12.99(千克 / 公顷) 48
2.等距抽样平均误差的计算。 3.整群抽样平均误差的计算。 (1)平均数的抽样平均误差
x 2x
r r 1 R
[公式8—20]
(2)成数的抽样平均误差
p 2p
它是从总体中按随机原则抽取一部分单位
进行观测,并根据这部分单位的资料推断
总体数量特征的一种方法。
抽样调查具有下列三个主要特点: (1)按随机原则抽取调查单位。 (2)由部分推断全体。 (3)抽样误差可以事先计算并加以控
制。
(二)抽样调查的作用
(1)用于不可能进行全面调查的无限总体。 (2)用于不可能进行全面调查而又需要了解全 面情况的现象。 (3)用于不必要进行全面调查的现象。 (4)用于对全面调查的资料进行评价与修正。 (5)用于工业生产过程的质量控制。
二、抽样调查中的几个基本概念 (一)全及总体和抽样总体 1.全及总体。全及总体简称总体或母体,
它是指所要调查研究对象的全体。
2.抽样总体。抽样总体简称样本或子样, 它是指在全及总体中按随机原则抽取的那部分. 单位所构成的集合体。
(二)总体指标和样本指标 1.总体指标。 总体指标也称为母体参数或全及指标, 它是根据全及总体各单位的标志值或标志特征
100 25 N 4 采取重复抽样 X 400 X 100 25 25 K 16 N 4 全部可能组成样本的标准差为 : x
i
X
x
x
K 采取不重复抽样
x x
X
2
1000 7.91 16 250 6.46 16
x
X
2
n CN
N 4500, n 800 10% 450 x 350, s 80, p 20%
s2 n 80 2 450 1 3.58(元) 450 4500 20% (1 20%) 450 1 450 4500