《统计学》抽样调查省公开课金奖全国赛课一等奖微课获奖PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

N代表总体单位数;
N1代表含有某一个表现总体单位数;
No代表含有另一个表现总体单位数;
P、Q代表成数。
11
11/114
N1 N0 N P Q N1 N0 1
N 则Q 1 P
12
12/114
〔例1〕 某企业生产10000件产品中,有500件 为不合格品。则
产品不合格率
P= N1 /N=500/10000=5.0%
上式表明了抽样平均误差含义,并不能作为计算公 式。因为:1.在现实抽样中,我们只能取得一个样 本,不可能也没必要取得全部全部可能样本,所以抽 样平均误差也不可能经过全部样原来直接计算。 2.统计量分布律中我们已经知道:统计量是以总体对应指标 为期望值,抽样平均误差实质上就是该统计量在其概率分布 中标准差。
p
p (1 p) n
0.05 0.95 0.69%
1000
37
37/114
按不重复抽样计算:Fra bibliotekp p (1 p) (1 n )
n
N
0.05 0.95 (1 1000 )
1000
10000
0.65%
38
38/114
(三)极限误差 极限误差是指抽样推断中依一定概率确保下误 差最大范围。 1.抽样平均数极限误差:
抽样指标代表性,只能增大样本单位数n,因为总体标准差是
不能改变。
29
29/114
(2)在不重复抽样条件下,抽样平均数平 均误差计算公式为:
x
2 N n
(
)
n N 1
当总体单位数N很大时,公式中N—1能够用N代替。
30
30/114
在实际计算时,不重复抽样抽样平均数平均误 差可用下式计算:
x
2
n
15
15/114
(1)抽样平均数。 代表样本单位数量标志普通水平指标称抽样平 均数或样本平均数。
n
x
x1 x2 x3 ... xn
xi
i 1
n
n
16
16/114
(2)抽样成数。 在抽样总体中,一个现象有两种表现时,其中含有 某一个表现单位数占抽样总体单位数比重,叫 做抽样成数,亦称样本成数。用p或q表示。其计算 公式为:
t
x
x ;
t
p
p
42
42/114
抽样极限误差也能够表示为抽样平均误差若干倍,其倍 数即概率度t:
x x X t x
2
t
t
n
n
43
43/114
同理:
p pP tp
t P(1 P) n
44
44/114
〔例5.5〕某农场种植小麦5000亩,收获前夕随机抽取
25亩进行实割实测,测得平均亩产500千克,标准差为
5
5/114
四、抽样推断包括基本概念 (一)总体和样本 1.全及总体(总体、母体)
它是指调查对象全部单位,是由含有某种共同性 质许多单位组成。组成总体单位称为总体单 位,总体单位数通惯用N表示。
6
6/114
2.抽样总体(样本、子样) 是指在总体中按随机标准抽取那一部分
单位所组成集合体。 组成样本单位称为样本单位,样本单位数亦称样本
容量,通惯用n表示。样本单位数总是大于1而小于总体单 位数N,即1<n<N。
7
7/114
样本单位数n相对于总体单位数N要小得多。 统计把n/N称为抽样百分比。样本单位数到达或超出 30个(n≥30)称为大样本,而在30个以下(n<30)称为 小样本。社会经济现象抽样调查多取大样本,而自然试验 观察则多取小样本。以很小样原来推断很大总体,这是抽 样推断法主要特点。
x x X
X x x X x
39
39/114
2.抽样成数极限误差:
p pP Pp p Pp
40
40/114
X x x X x
x x X x x 同理: pp P pp
41
41/114
(四)抽样预计可靠程度 抽样极限误差通常是以抽样平均误差为标准单位来衡量, 即:
(1 )
n
N
31
31/114
2.成数平均误差 统计成数(比重)是一个结构相对数,它实际属于是非
标志平均数特例。统计上习惯以1表示“是”,以0表 示“非”。p为1概率,q=1—p为0概率。成数方差是P(1-P)
其特点为,最大值为0.25(0.5×0.5),即当两种表现总体单
位各占二分之一时,它变异程度最大。
19
19/114
(3)抽样总体标准差和抽样总体方差。
说明抽样总体之间标志值变异程度指标,叫做抽样
总体标准差。抽样总体标准差平方称为抽样总体方
差(简称样本方差)。其计算公式为:
s
2
xx n
2
s2 x x n
20
20/114
一个总体能够抽取许多个样本,而样本不一样, 抽样指标数值也各不相同。可见,抽样指标数 值不是惟一确定。因为抽样指标是样本变量函数,是随 机可变变量。也就是说,由 样本观察值所决定统计量是 随机变量。
2
2/114
(二)抽样推断特点 1.抽样推断是非全方面调查 2.抽样推断是按随机标准抽选调查单位。 3.抽样推断是用样本指标数值去推算总体指标数值。 4.抽样推断中产生抽样误差,能够事先计算并加以控制。
3
3/114
二、抽样调查主要内容 (一)随机抽样:按照随机标准从总体中抽取部分单 位组成样本过程。
50千克,试求全部5000亩小麦平均亩产在480千克至
520千克之间概率。
解: = x
s= n
50 =10 25
t= x = 480-500 =2 10 x
p(500 20 X 500 20)
45
=F (2)=0.9545
45/114
三、影响抽样误差原因 (一)抽样单位数目标多少 (二)总体被研究标志变异程度 (三)抽样方法 (四)组织形式不一样
p n1 n
q n0 n
17
17/114
同总体成数
n1 n0 n p q (n1 n0) 1
n 则q=1-p
18
18/114
[例5.2) 从某企业生产产品中,抽样检验了
100件产品,其中有5件不合格,则:
样本产品不合格率 :
p n1 5 5%
n
100
样本产品合格率
q 1 p 1 5% 95%
4.抽样误差是不能消除,但能够把它控制出所允许范围以 内。
25
25/114
二、抽样平均误差 (一)抽样平均误差含义 抽样平均误差是指一个抽样方案全部可能样本 某统计量与总体对应指标离差平均值。纯随机抽样平均 误差定义关系式以下:
抽样平均误差= (各种样本统计量-期望值)2 所有可能的样本个数
26
26/114
2.依据给定可信度F(t),求出对应抽样极限误差范围
X
48
48/114
例1,已知:x=80,2=40,n=10,P(t)=0.95,在重复条件下对总体平 均数进行预计。 解:u=2
t=1.96 =tu=3.92 x-<X<x+, 80-3.92<X<80+3.92 点预计:总体平均数为80 区间预计:以95%概率确保总体平均数在76.08-83.92之间 例2,已知:x=80,2=40,n=10, =4,在重复条件下对总体平均数进 行预计。 解:u=2 ,t= /u=2 点预计:总体平均数为80 区间预计:以95.45%概率确保总体平均数在76-84之间 49
21
21/114
(三)重复抽样和不重复抽样 1.重复抽样(重置抽样) 采取这种方法抽取样本单位特点是:同一单位 有屡次重复被抽中机会,而且总体单位数目始 终不变,每个单位抽中或抽不中机会在各次都 是相同。
22
22/114
2.不重复抽样(不重置抽样) 采取这种方法抽取样本单位特点是:同一单位 只有一次被抽中机会,而且总体单位数目伴随 样本单位数目抽取次数增多而愈变愈少。每 个单位抽中或抽不中机会在各次是不一样。
x
s2
n
602 ( 6 小时) 100
35
35/114
按不重复抽样计算:
x
s2
n
(1
)
n
N
60 2
100
(1
)
100
1000
5.69(小时)
36
36/114
〔例5.4〕 某企业有员工10000人,从中随机抽选1000 人调查电脑拥有率,发觉50家有,问这一调查抽样误差 为多少?
解:p=50/1000=0.05 按重复抽样计算:
产品合格率 Q=1—P=1-5.0%=95%
13
13/114
(3)总体标准差和总体方差。 表示单位之间标志值变异程度指标,叫做总
体标准差,又称总体均方差(标准差)。总体标准差平 方称为总体方差。其计算公式为:
2
X X
N
2
2 X X
N
14
14/114
2.抽样指标 抽样指标是指依据抽样总体各单位标志值计算综合指标, 又称样本指标。惯用抽样指标有:抽样平均数、抽样成 数、抽样总体标准差和抽样总体方差。
n
X
X1 X
X
... X n
Xi
i 1
N
N
其中:
X1,X2,…Xn为总体中每一 个调查单位取值
N是总体单位数
∑是总和符号
10
10/114
(2)总体成数 当总体一个现象有两种表现时,其中含有某
一个表现单位数占总体单位数目标比重,叫
总体成数,用P或Q表示。其计算公式为:
p N1 N
Q N0 N
(二)统计预计:依据随机抽取部分单位特征来对 总体分布函数、分布参数或数字特征等进行推测估算过程。 (三)假设检验:依据经验或认识,提出某一假设,并判断该假 设正确性过程。
4
4/114
三、抽样推断作用 (一)处理了无法进行全方面调查或极难进行 全方面调查问题 (二)能够补充或修正全方面调查数据
(三)能够节约调查费用和调查时间
32
32/114
在重复抽样条件下,其计算公式为:
p
p (1 p) n
在不重复抽样条件下,其计算公式为:
p
p (1 p) ( N n )
n
N 1
33
33/114
当N很大时,以N代替N—1,则可简化为:
p
p (1 p) (1 n )
n
N
34
34/114
[例3〕某企业生产一批灯泡,共1000只,从中随机抽取 100只,测其寿命平均为1000小时,样本标准差为60小时, 计算其抽样误差。 按重复抽样计算:
46
46/114
四、抽样预计 (一)点预计和区间预计。 点预计也叫定值预计,它是以抽样得到样本指
标作为总体指标预计值。 区间预计是依据一定准确度和可靠程度要求,
用样本指标和抽样误差去推断总体指标可能范围 一个预计方法。
47
47/114
(二)区间预计两种模式:
1.依据给定抽样极限误差范围 ,X 求出对应可信度F(t)
第七章 抽样调查
第一节 抽样调查概述 第二节 抽样预计 第三节 抽样组织形式
1
1/114
第一节 抽样调查概述 一、抽样调查含义
(一)抽样推断含义 抽样调查是按随机标准,从全部研究对象中抽取一
部分单位进行观察,并依据样本实际数据,对总体数量 特征做出含有一定可靠程度预计和判断,从而到达对全 部研究对象认识一个统计方法。其中心问题是怎样依据 已知部分资料来推断未知总体情况。
27
27/114
(二)抽样平均误差计算 1.抽样平均数平均误差
(1)在重复抽样条件下总体方差已知,样本平均 数服从正态分布,其抽样平均数平均误差计算公式为:
x
2
n
n
28
28/114
由上式能够看出,抽样平均数平均误差就是抽样平
均数 标准差。抽样平均误差和总体标准差是成正比,与样本
单位数平方根成反比。所以,要想降低抽样平均误差以提升
49/114
例3,某单位从全部职员中随机抽取196名进行调查,得知 整年平均收入为8600元,标准差为840元。其中,有存款职员为 147人。要求在95.45%概率确保程度下,分别对全部职员每人年 平均收入和存款职员比重进行区间预计。
解:因为没有全及总体(N)资料,只能用重复抽样计算 (1)ux=840/(196)1/2=60
8
8/114
(二)总体指标和抽样指标 1.总体指标 总体指标是指依据总体各单位标志值计算出来
,反应总体某种属性或特征综合指标,亦称
为总体参数。因为总体是惟一确定,所以,根
据总体计算总体指标也是惟一确定。
惯用总体指标有:总体平均数、总体成数、总体标 准差和总体方差。
9
9/114
(1)总体平均数
代表总体单位数量标志普通水平指标,它表明变量 变动集中趋势,通惯用 表X 示。
23
23/114
第二节 抽样预计 一、抽样误差概念
1.由样本得到预计值与被预计总体未知真实特征值
之差,就是误差。或样本指标数值与总体指标数值之间差
数。
2.抽样误差就是指按随机标准抽样时,单纯由不一样随机
样本得出不一样预计量而产生误差。
24
24/114
3. 抽样误差是随机变量。抽样误差愈小,表示样本代表性 愈高;反之,样本代表性就愈低。
x=2*60=120 8480~8720
(2) up=3.1% p=6.2% 68.8%~81.2%
50
50/114
例4,某外贸企业出口一个茶叶,要求每包规格不低于150克。 现在用不重复抽样方法抽取其中1%进行检验,其结果以下:
相关文档
最新文档