统计学课件第六章 抽样调查
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
或
å
s =
i= 1
( xi - x )
2
fi
å
fi
10
属性总体的抽样指标
抽样成数
p
n1 n
n0 n n n1 n
的单位数目。 性的单位数目。
抽样平均数
q
1
p
n1:总体中具有某种属性
其中:
n 0:总体中不具有某种属 n 0 n1 n
抽样标准差
s =
p (1 - p ) =
返回本章首页
2
第二节
抽样调查的基本概念
一、全及总体和抽样总体 二、全及指标和抽样指标 三、样本容量和样本可能数目 四、抽样方法 五、抽样的组织形式
返回本章首页
3
一、全及总体和抽样总体
(一)全及总体 ⒈概念:总体,指所要认识的对象的全体。 ⒉全及总体的分类
属性总体(是非总体)
变量总体
⒊总体单位数:N
å (x
i
- X
)
2
样本可能数目
返回本节首页
18
二、抽样平均误差的计算
(一)抽样平均数的抽样平均误差
1、重复抽样: 2、不重复抽样:
x
N n n N 1
2
x
n
2
n 1 n N
:总体标准差。
n :样本单位数。 N :总体单位数。 注:(大样本时, 可以用样本标准差来代替)
p
0 . 915 0 . 085 200
1 . 972 %
n
在不重复抽样下:
x
p 1 n
p N n N 1 1 . 952 %
0 . 915
0 . 085 10000 200 200 10000 1
返回本节首页
返回本章首页
14
指出下列抽样调查属于哪种抽样方式。 1.从某大学2001级全部学生2000人中抽取50人进 行大学生消费水平的调查,先给每个学生编号,然 后每隔40人抽一个,直到抽够确定的数为止。
2.上海市居民购买地点的选择倾向调查中,考虑到 市区居民以居委会为基本单位,将所有的居委会逐 一编码,然后根据随机数码表抽取若干居委会,对 抽中的居委会的所有居民户进行调查。
Fra Baidu bibliotek第六章 抽样调查
本章内容
第一节 第二节 第三节 第四节 第六节 抽样调查的含义 抽样调查的基本概念 抽样平均误差 总体指标的推断 必要抽样单位数的确定
1
第一节
1、概念:
抽样调查的含义
按照随机原则从总体中抽取一部分单位进行 调查,并用调查所得的指标数值来推断总体的指 标数值。
2、特点:
①只抽取总体中一部分单位进行调查 ②抽取部分单位要遵循随机原则 ③用一部分单位的指标值去推断总体的指标值 ④抽样误差可以计算,并且可以控制
19
二、抽样平均误差的计算
(二)抽样成数的抽样平均误差
1、重复抽样:
p
P (1 n P)
2、不重复抽样:
p
P (1
n
P)
(
N N
n 1
)
P:总体成数。 n :样本单位数。 N :总体单位数。 注:(大样本时,P 可以用样本成数p来代替)
返回本节首页
20
三、影响抽样平均误差的因素
2
å
Fi
7
属性总体的全及指标
总体成数
P
N1 N
N1 N
的单位数目。 性的单位数目。
总体平均数
Q
N0 N
N
1 P
其中:
N 1:总体中具有某种属性 N 0:总体中不具有某种属 N 0 N1 N
总体标准差
s =
P (1 - P ) =
PQ
8
(二)抽样指标: 1、概念:根据样本各单位标志值计算 的、反映样本特征的指标。 2、种类:
28
3.在简单随机抽样条件下,要使抽样平均误差减少 一半,则样本单位数必须( )。 A.增加2倍 C.增加到原来的2倍 B.增加4倍 D.增加到原来的4倍
29
第四节 总体指标的推断
一、抽样极限误差 二、抽样极限误差的计算
三、置信区间的确定
返回本章首页
30
一、抽样极限误差
思考:抽样调查中 抽样误差 解决思路:
样本成数 p = 190/200=95%
p P
p p
P
p
p p
95% - 2% # P
95% + 2%
返回本节首页
34
93% # P
97%
二、抽样极限误差的计算
(一)引论:
思考:在置信度β(概率保证程度)下,有:
x X x 或
p P
p
问:
x
?
或
p
x
推断
x
X 或p
推断
P
X
?
或
b
p P
?
概率保证程度
在 95% 的把握下,将最大抽样误差限定在: x 或 D
即 : M a x xi - X = D
x
p
Max pi - P = D
p
那么,对于任一次抽样结果,
x- X p- P
x
x
和 p 称为:
抽样极限误差
31
p
一、抽样极限误差
?
35
(二) D 、 x
p
与 x 、m p 的关系:
对大学生进行抽样调查得出:样本平均体重 58千克( x ),抽样平均误差是1千克(mx )。 允许的抽样极限误差与抽样平均误差相同时, 57~59 推断大学生的平均体重是 千克 ( x ± 1 mx),判断的可靠程度为 0.6827。 允许的抽样极限误差是抽样平均误差的2倍 时,推断大学生的平均体重是56~60千克 ( x ± 2 mx ),判断的可靠程度为 0.9545 。 允许的抽样极限误差是抽样平均误差的3倍 时,推断大学生的平均体重是55~61千克 ( x ± 3 mx ),判断的可靠程度为0.9973。
可以证明: F (t ) 是标准正态分布函数。
38
例 2:已知 x 和 p , x ①在 β= 0.8064 时, ? x ②在 β= 0.9371 时, p ?
③在
95.45% 的概率保证程度下, 的变 X 化范围? x 1 .3 x
p
1 . 86
15
3. 上海市居民购买地点的选择倾向调查中,将上 海近20个区县逐一编码,利用随机数码表抽取若 干区县;对抽中区县的全部街道列出并加以编码, 利用随机数码表抽取若干街道;将抽中的街道的 全部居委会逐一列出并编码,再根据随机数码表 抽取若干居委会;对抽中的居委会调查所有的居 民户。
4.对上海年轻人的消费倾向调研,抽选出100人, 要求必须有25%的女性、20%的本科毕业生、 25%的年收入在3万元~10万元,对符合上述特征 的人进行调查。
x x X x x
2、抽样成数的范围
p p P p p
这便是总体的估计区间,又称:置信区间。
33
例1:要估计一批产品的合格率,从 1000 件 产品中抽取 200 件,其中有 10 件不合格品, 如果在95%的把握度下确定抽样极限误差为 2%,试估计产品合格率的范围。
pq
返回本节首页
11
三、样本容量和样本可能数目
1、样本容量:指一个样本所包含的单位 数,记作: n 。 :大样本。 n 30 :小样本。 n 30 2、样本可能数目:又称样本个数,是指从 一个总体中可能抽取多少个样本。
返回本节首页
12
BN N
n
n
四、抽样方法(考虑抽取先后顺序)
1、不重复抽样: 从 N 个单位中每次抽取 1个,抽取后 不放回,一直到抽够 n 个单位。
4
一、全及总体和抽样总体
(二)抽样总体 简称样本,是从全及总体中随机抽取出 来,作为代表这一总体的那部分单位组成的 集合体。 样本单位数:n
返回
5
二、全及指标和抽样指标
(一)全及指标: 1、概念:根据全及总体各单位标志值 计算的、反映总体某种特征的指标。 2、种类:
①变量总体的全及指标 ②属性总体的全及指标
x:
在不重复抽样下:
x
N n n N 1
2
2
53 . 63 200
10000 200 10000 1
3 . 754 小时
24
(2)计算灯泡的合格率和合格率的抽样平均误差。 求灯泡合格率的抽样平均误差 p :
在重复抽样下: p 1 p
(一)概念: 置信度
在给定的概率保证程度 下,总体指标和 抽样指标之间误差的最大范围。具体的:
抽样平均数的抽样极限误差 x
x X x
抽样成数的抽样极限误差 p
pP p
32
一、抽样极限误差
(二)总体的估计区间
若在置信度β下,抽样极限误差为Δ ,则: 1、抽样平均数的范围
16
第三节
抽样平均误差
一、抽样平均误差的概念
二、抽样平均误差的计算 三、影响抽样平均误差的因素
返回本章首页
17
一、抽样平均误差的概念
抽样误差:样本指标与总体指标之间的离差。 例如: x i - X 、 p i - P 抽样平均误差:样本指标和总体指标的平均 离差。表示为: x 和 p
m
=
x
样本数目
A N = N ( N - 1)( N - 2 ) ( N - n + 1) =
n
N!
( N - n )!
2、重复抽样: 从 N 个单位中每次抽取1个,抽取后将 其登记下来,再放回,一直到抽够n个单位。
样本数目
BN = N
n
n
返回本节首页
13
第五节
抽样组织形式
1、简单随机抽样:对总体不作任何处理,不进行任 何分类,从总体的全部单位中随机抽取样本单位。 2、类型抽样:先对总体各单位按照一定的标志分类, 然后从每类中随机抽取。 3、机械抽样:对研究的总体按一定的顺序排列,每 隔一定的间隔抽取的一种方法。 4、整群抽样:将总体划分为若干群,然后从总体中 随机选取若干群,对中选的群的所有单位进行一一 调查。 5、多阶段抽样:抽样过程分成几个阶段
900以下
900—950 950—1000 1000—1050
2
4 11 71
1050—1100
1100—1150 1150—1200 1200以上
84
18 7 3
合计
200
按照质量规定,灯泡使用寿命在1000小时以上为合格 品。要求(1)计算样本灯泡的平均使用时间、标准差 和平均使用时间的抽样平均误差;(2)计算样本灯泡 的合格率和合格率的抽样平均误差。(包括重复抽样 与不重复抽两种情形)
6
变量总体的全及指标
总体平均数
X
N
N
Xi
i 1
或
X
M
X i Fi Fi
2
i 1
N
M
å
i= 1
总体方差
å
s =
2 i= 1
(Xi - X ) N
2
或
( X i - X ) Fi
s =
2
å
M
Fi
N
总体标准差
s =
å
i= 1
(Xi - X ) N
2
或
å
s =
i= 1
( X i - X ) Fi
25
判断题
1.人们可以有意识地控制抽样误差的大小, 因为可以改变总体的标准差。 ( ) 2.随着抽样单位数的增大,抽样误差将越来 越小。 ( )
26
选择题
1.抽样误差是指( )。 A.调查中所产生的登记性误差 B.随机性的代表性误差 C.计算过程中产生的误差
27
2.抽样平均误差反映了样本指标与总体指标之间 的( )。 A.最大误差范围 C.实际误差 B.平均误差程度 D.实际误差的绝对值
36
(二) 、 与 p x
p
、 x 的关系:
在统计学当中,常作如下处理:
x
p
t x
t p
即:抽样极限误差常表示成抽样平均误差的倍数 t 称为 误差系数, 或 概率度。
37
(三)t = ? ( t 与 β 的关系)
①
t 越大, β 越大
F (t )
②
查表: P270页 P327页
①变量总体的抽样指标 ②属性总体的抽样指标
9
变量总体的抽样指标
抽样平均数
x
n
n
xi
i 1
或
x
m
xi f i fi
2
i 1
n
m
抽样方差
å
s =
2 i= 1
( xi - x ) n
2
或
å
s =
2 i= 1
( xi - x ) f i
å
m
fi
n
抽样标准差
s =
å
i= 1
( xi - x ) n
1、样本单位数的多少。
抽样单位数越多,抽样平均误差越小。
2、总体各单位标志的变异程度。
总体标志变异程度越大,抽样平均误差越大。
3、抽样调查组织方式和抽样方法。
返回本节首页
21
例1 :某灯泡厂对10000个产品进行使用寿命检验,随 机抽取2%的样本进行测试,所得的资料如下:
使用时间(小时) 抽样灯泡数(个) 使用时间(小时) 抽样灯泡数(个)
22
(1)求灯泡平均使用时间、标准差和 灯泡合格率(样本)
x
xf f
i i
i
1057 小 时
xi x f
i
2
fi
5 3 .6 3 小 时
p
183 200
91 . 5 %
23
(2)求灯泡使用时间抽样平均误差
在重复抽样下:
x
n 53 . 63 200 3 . 792 小时