统计学 第八章 抽样调查
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X
n
修正因子
(
N 1
)
n
(1
N
)
30
二、不重复(置)抽样分布
(二)抽样成数的分布
E ( p) P
XP P
P(1 P) N n ( ) P ( ) E pp n N 1 P(1 P) n (1 ) n N
31
例8-7:要估计某地区10000名适龄儿童的入学率,
用不重复抽样的方法抽取400名儿童,检查结果有
320名入学,计算样本入学率的抽样平均误差。 由上可知,P=320/400=80% 1、在重复抽样下,入学率的抽样平均误差:
P(1 P) 0.8 0.2 p 2% n 400
2、在不重复抽样下,入学率的抽样平均误差:
p
P(1 P) n 0.8 0.2 400 (1 ) (1 ) 1.96% n N 400 10000
4
二、抽样调查的特点
• 调查单位的确定是按随机原则从全部总体单位 中抽取的。 • 用部分单位的指标数值去推断和估计总体指标 数值。 • 抽样调查中的抽样误差是不可避免的,但在事 先是可以计算并加以控制的。 • 抽样推断是运用概率估计的方法。
5
三、抽样调查的作用
有些现象是无法进行全面调查的,为了测算全面资料,必须采 用抽样调查的方法。
就是(0,1)变量的样本平均数的分布:
E ( p) P
p
2 ( P)
n
P(1 P) n
28
一、重复(置)抽样分布
例8-6:已知某批零件的优等品率为80%,现用
重复抽样方法从中抽取100件,求样本优等品率
的抽样平均误差。
P(1 P) 0.8 0.2 p 4% n 100
随机抽取
计 算
计 算
总体参数
X P σ
统计推断
样本统计量
x p s
总体参数一般是未知的
样本统计量的值是可知的 9
四、基本概念(举例)
【 例 8-1】 对 一批某种型号 的 电 子 元 件 10000 只进行耐 用时间检查, 随机抽取100只, 测试的平均耐 用 时 间 为 1055 小时,合格率 为91%。
根据上
表数据 ,可以 整理出 样本平
34 36 38 40 42 44
均数的
分布如
右表:
46 48 50 合计
3 2 1 25
3/25 2/25 1/25 1
21
一、重复(置)抽样分布
5/25 4/25 3/25 2/25 1/25 34 36 38 40 42 44 46 48 50
样本日平均工资分布图
0-1变量 概率
0 1-P
1 P
X P E( X P ) 0 (1 P) 1 P P
2 ( P) (1 P)2 p (0 P)2 (1 P) P(1 P)
27
一、重复(置)抽样分布
现在从总体中用重复抽样方法抽取n个单位组成
样本,计算样本成数p,样本成数的分布实质上
25个样本的日工资平均数计算表 样本变量 34 38 42 46 50 34 34 36 38 40 42 38 36 38 40 42 44 42 38 40 42 44 46 46 40 42 44 46 48 50 42 44 46 50 50
20
一、重复(置)抽样分布
样本日平均工资 频数 1 2 3 4 5 4 频率 1/25 2/25 3/25 4/25 5/25 4/25
1 n
。例如,一个县
的粮食亩产高低相差很大,亩产标准差为80公斤,如果 随机抽取100亩计算其平均亩产,其平均误差就显著缩
小,只有总体标准差的1/10。(2)抽样平均误差与总
体标准差成正比,而和样本单位数的方根成反比。
26
一、重复(置)抽样分布
(二)抽样成数的分布
可以把是非标志作为(0,1)变量,其总体平均数就是 总体成数,总体方差也由成数确定。
17
第二节
抽样分布
一、重复(置)抽样分布 (一)样本平均数的分布 (二)抽样成数的分布 二、不重复(置)抽样分布 (一)样本平均数的分布
(二)抽样成数的分布
三、抽样误差的种类
四、关于正态分布的定理
18
一、重复(置)抽样分布
(一)样本平均数的分布
样本平均数的分布由所有可能样本的平均数取值和相应 的概率组成。 例8-5:某施工班组5个工人的日工资分别为:34、38、 42、46、50元。则总体工人日工资平均数和方差分别为 : X
样本成数:
p n1 n
x f
i 1 k
f
i 1
i
xf f
样本标准差:在样本资料未分组的情况下: S
在样本资料分组的情况下:
(x
i 1
n
i
x)2
n 1
S
(x
i 1 k i 1
k
i
x)2 fi
i
f
1
11
六、抽样方法与样本可能数目
抽样方法:
–重复(置)抽样:是指从全及总体中抽取样本时,随机抽 取一个样本单位,记录该单位有关标志表现以后,把它放 回到总体中去,再从总体中随机抽取第二个单位,记录它 有关标志表现以后,也把它放回全及总体中去,照此下去 直到抽选n个样本单位。 –不重复(置)抽样:不重复抽样是从总体抽取第一个样本 单位,记录该单位有关标志表现后,这个样本单位不再放 回总体中参加下一次抽选。然后,从总体N-1个单位中随机 抽选第二个样本单位,记录了该单位有关标志表现以后, 该单位也不再放回全及总体中去,照此下去直到抽选出n个 样本单位。 12
第八章
学习目的 第一节
抽样调查
抽样调查的一般问题
第二节
抽样分布
第三节
第四节
抽样估计
抽样组织形式
1
学 习 目 的
了解抽样调查和抽样分布的基本
概念 掌握抽样误差的计算方法 掌握抽样估计的基本原理和方法 了解抽样调查的基本组织形式 掌握必要样本容量的计算
2
第一节 抽样调查的一般 问题
n N n 6
13
六、抽样方法与样本可能数目
不重复抽样时的样本可能数目可分为考虑顺序和不考虑 顺序两种情况。考虑顺序时的样本可能数目是不重复的 排列数:
n P N N ( N 1)( N 2)...( N n 1) N !/( N n)!
例8-3:从班级10位学生中抽选三人担任不同的职务,
n N n N
例8-4:从小组10位学生中不重复随机抽选3个组成 样本,考查其平均成绩,可能的样本数目为:
C
3 10
10 9 8 720 120种 3 2 1 6
15
第二节
抽样分布
16
第二节
抽样分布
• 抽样分布:样本统计量的概率分布。 • 样本统计量是随机变量。 • 统计量的取值不但和样本容量有关,还和抽 样方法有关。下面我们讨论简单随机样本的 抽样分布。
32
抽样平均误差公式汇编
重复抽样 不重复抽样
n
样本平均 数的抽样 ( X ) 误差 样本成数 的抽样误 差
2
n
X
2
n (1 ) n N
p
P(1 P) n
P(1 P) n p (1 ) n N
33
三、抽样误差的种类
2
N
34 38 42 46 50 42元 5
2 2 2
2
X X 34 42 38 42 46 42 50 42 N 5
2
32元2
19
一、重复(置)抽样分布
现用重复抽样方法从5人中随机抽取2人组成样本 ,样本可能数目为52 = 25个。各样本的日平均工 资计算结果如下:
29Fra Baidu bibliotek
二、不重复(置)抽样分布
(一)样本平均数的分布 1.不重复抽样的样本平均数的数学期望等于总体平 均数,即:
E( X )
2.不重复抽样的抽样平均误差等于重复抽样的抽 样平均误差乘以修正因子,即: N n
N 1
32 5 2 x2 ( ) 2 12 3.464元 N 2n 5 1 n
样本容量(Sample size):是样本中所含个体的数量,又称样
本单位数。
7
四、基本概念(常用的符号
标记)
总体参数
总体均值: X
–总体成数:P –总体标准差:σ
• 样本统计量
样本均值:x 样本成数:p 样本标准差:S
8
四、基本概念(概念之间的
关系)
总体中有N个个体 总体 样 本 样本容量为:n
六、抽样方法与样本可能数 目
• 样本可能数目:是指从总体中可能抽取的样本的最
多数目,抽样数目大小与抽样方法有关。
重复抽样时的样本可能数目是一个可重复的排列数:
A N
n N
n
例8-2:从0-9的10个数中随机重复抽选6个数字组成电话 号码,共能组成多少个电话号码?
A N 10 100万
5/25 4/25 3/25
10
2/25 1/25
0 34 38 42
46
50
X
34 36 38 40 42 44 46 48 50
42元 2 32元2
原来如此
E ( X ) 42元
(X )
2
32 16元2 n 2
2
25
一、重复(置)抽样分布
从以上结论可知,(1)抽样平均误差比总体标准差 小得多,仅为总体标准差的
6
四、基本概念(概念要点)
全及总体(Population):所要研究的事物的全体构成的总体 样本(Sample):从全及总体中所抽取的部分单位组成的总体,
又称抽样总体;
总体参数(Population parameter):是在理论上可以从整个 总体中计算出来的总体指标。 样本统计量(Sample statistic):是根据样本观察值计算出 来的样本指标。
总体容量N=10000 样本单位数n=100 样本均值(平均耐用时间) x=1055小
时,样本成数(合格率) p=91%
依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
10
五、样本统计量的计算 公式
•样本均值 :
在样本资料未分组的情况下:
x
x
i 1
n
i
n
k i i
x
n
在样本资料分组的情况下: x
f
2 1 ( x ) ( 42) x) 2 (50 4元 2 [(34 42) 1 (36 2 16 ... 42) 2 1] 16元2 25
23
一、重复(置)抽样分布
1.重复抽样的样本平均数的数学期望等于总体平均 数,即:
E( X ) 42元
问共有几种抽法?
n P N ( N 1)( N 2)...( N n 1) 10 9 8 720种 N
14
六、抽样方法与样本可能数目
不考虑顺序时的样本可能数目是不重复的组合数:
N ( N 1)( N 2)...( N n 1) C P / n! n!
2.抽样平均数的标准差又称为抽样平均误差或抽 样标准误差,重复抽样的抽样平均误差等于总体标 准差除以样本单位数的平方根。即:
(X )
2 ( X X )
M
2 ( X )
M
n
2
n
32 4元 2
24
样本平均数的分布与总体分布的比较
总体分布
% 20
样本平均数的分布
22
一、重复(置)抽样分布
根据样本日工资平均数分布表,可以计算日工资
平均数的数学期望和方差:
Xf 1 E( X ) X (34 1 36 2 38 3 ... 50 1) 42元 f 25
2( X )
2 [ X E ( X )] f
3
一、什么是抽样调查
抽样调查:按随机原则从总体中抽取一部分 单位进行调查,根据样本资料计算样本的特征 值,然后以样本的特征值,对总体的特征值做 出具有一定可靠性的估计和判断,以反映总体 的数量特征的一种统计方法。
随机原则:即是在抽取样本时,排除人们 主观意图的作用,使得总体中的每个单位或 每个样本有相等的入选机会。随机原则又称 为等可能性原则。
从理论上讲,有些现象虽然可以进行全面调查,但实际上没有 例如: 必要或很难办到,也要采用抽样调查。 对无限总体不能采用全面调查。 抽样调查的结果可以对全面调查的结果进行检查和修正 另外,有些产品的质量检查具有破坏性,不可能进行 抽样调查可以用于工业生产过程的质量控制。 全面调查,只能采用抽样调查。 利用抽样调查原理,可以对某些总体的假设进行检验,来判别 这种假设的真伪,以决定行动的取舍。