统计学(抽样估计)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
第四章第一节
二、抽样调查的特点
➢按随机原则抽取调查单位; ➢要抽取足够多的调查单位;
基本原则
➢可从数量上推断总体
基本目的及任务
➢要运用概率估计的方法
➢抽样调查中所产生的抽样误差可以事先计算
并加以控制。
科学性体现
3
第四章第一节
三、抽样调查的使用范围 ➢ 有些事情在测量或实验时有破坏性,不可能进行
1、用样本标准差替代总体标准差。大样本情况下,可 以直接用样本标准差S代表代表总体标准差;在小样
本的情况下,则采用样本修正标准差 S *来代替。
S* (xi x)2 n 1 S n n 1
2、用以前(近期)的总体标准差或同类地区的总体标 准差来代表所研究的标准差。若同时有多个可供参 考的数值时,应选择其中最大者。对于成数P,应选 最接近0.5的比率。
up
P(1 P)(重复) n
up
P(1 n
p)
(
N N
n 1
)或up
ux
σ 2 (N n)或 n N1
ux
σ 2 (1 n )(不重复) nN
P(1 P) (1 n )(不重复)
n
N
26
第四章第三节
注意:在上述公式中, 或 P(1 P)总体标准差,但
是实际中这两个数据却是未知的。计算抽样平均误 差时通常采用以下替代方法。
进行检验,来判断这种假设的真伪,以决定取舍
4
第四章第一节 四、抽样估计的一般步骤 1、设计抽样方案 2、抽取样本单位 3、搜集样本资料 4、整理样本资料 5、推断总体指标
5
第四章第二节 第二节 调样调查的基本概念及理论依据 一、全及总体和抽样总体(教材没有) ➢ 全及总体-简称总体(N):研究对象的全 体 (唯一确定) ✓ 变量总体 :各单位可用数量标志计量 A 有限总体:变量值有限 B 无限总体:变量值无限,分为可列或连续 ✓ 属性总体 :各单位用品质标志描述
12
第四章第二节
➢ 抽样指标 ——样本统计量
✓ 定义:由抽样总体各个标志值或标志特征计算的综 合指标称为抽样指标
✓ 抽样指标的运用及计算
• 变量总体 : • 属性总体:
x
x n
或x
xf
f
设样本中有n个单位,有n1个单位具有某种属性,n0 个单位不具有某种属性,n1+n0=n,p为总体中具 有某种属性的单位数所占的比重,q为不具有某种
统计学原理 第四章
抽样推断
(融合教材第三、第四章)
1
第四章第一节
第一节 抽样调查的意义 一、抽样调查的概念 ➢ 广义抽样调查:凡是抽取一部分单位进行观察,并
根据观察结果来推断全体的都是抽样调查,可分为 随机抽样和非随机抽样两种。 ➢ 狭义的抽样调查:仅指根据大数定律和概率论的要 求,随机抽样,保证总体中各个单位都有同样的机 会被抽中。 ➢ 概念:按照随机抽样的原则从总体中抽取一部分单 位进行观察,并运用数理统计的原理,以被抽取的 那部分单位的数量特征为代表,对总体作出数量上 的推断分析。
根据样本的平均数、成数(也称比率)来推断总体的平 均数,成数或所在的范围,只要总体的平均数或成数 掌握了,那么总体的标志总量也就可以推断出来。
17
第四章第二节 三、抽样方法和样本的可能数目
样本的容量(n) 样本的可能数目
抽样的方法 取样方式:重复、不重复 抽样的方法 对样本的要求:考虑顺序、不考
虑顺序
18
第四章第二节
➢考虑顺序的不重复抽样数目
ANn
N(N
1)(N
2)...(N
n 1)
N! (N n)!
➢考虑顺序的重复抽样数目
BNn N n ➢不考虑顺序的不重复抽样数目
CNn
N(N
1)( N
2)...(N n!
n 1)
N! n!(N n)!
➢不考虑顺序的重复抽样数目
DNn CNn n1
全面调查 ➢ 有些总体从理论上讲可以进行全面调查,但是实
际上办不到 ➢ 和全面调查相比较,抽样调查能节省人力、费用
和时间,而且比较灵活 ➢ 在有些情况下,抽样调查的结果比全面调查要准
确 ➢ 用抽样调查的资料修正和补充全面调查资料 ➢ 抽样调查方法可以用于工业生产过程中的质量控
制 ➢ 利用抽样推断的方法,可以对于某种总体的假设
第四章第四节
第四节参数估计(全及指标的推断P123)
一、估计量与估计值
➢ 参数估计:用样本统计量去估计总体参数,即用 样本均值去估计总体均值,用样本方差x 去估计总 体方差,用样本比率去估计总体比率。
➢ 用 概括表示所有总体参数,参数估计就是考虑如 何用样本统计量估计总体参数 。
➢ 在参数估计中,用来估计总体参数的统计量,称
抽样检查电灯 泡数(个)
2 4 11 71
使用时间(小 抽样检查电灯泡数
时)
(个)
1050~1100 84
1100~1150 18
1150~1200 7 1200以上 3
合计
200
按照质量规定,电灯泡使用寿命在1000小时以上的为合 格品,计算灯泡使用时间抽样平均误差和灯泡合格率的 抽样平均误差?
30
P N1 N
Q N0 N N1 1 P
N
N
9
第四章 第二节
• 属性总体的平均数——成数
具有某一属性 不具有某一属性 合计
变量值X 1 0 ——
频数F
N1 N0 N
频率F/∑F
P=N1/N 1-P= N0 /N 1
• 属性总体的平均数
X
X
F
F
1
P
0
(1
P)
P
10
第四章第二节
• 变量总体标准差和总体方差,它们都是测量 总体标志值分散程度的指标
属性的单位数所占的比重,则抽样成数为 :
p n1 n
q n0 n n1 1 p
nn
13
第四章 第二节 • 属性样本的平均数——成数
具有某一属性 不具有某一属性 合计
变量值x 1 0 ——
频数f
n1 n0 n
频率f/∑f
p=n1/n 1-p= n0 /n 1
• 属性样本的平均数
x
x
f
f
1
成数的可能范围可以用下式估计: (1)抽样平均数的范围
xx X x x
(2)抽样成数的极限误差
pp P pp
35
第四章第四节 例:要估计一批产品的合格率,从1000件产
品中抽取200件,其中有10件不合格品, 如果确定抽样极限误差的范围为2%,试 估计产品合格率的范围。 样本成数p=190/200=95% 总体成数下限=95%-2%=93% 总体成数上限=95+2%=97% 即该产品合格率在93%~97%之间。
对于全及指标代表性程度的一个尺度;也是计算抽 样指标与全及指标之间变异范围的一个根据。
25
第四章第三节
三、抽样平均误差的计算( p103)
1、原理公式: u
x
M
( xi X )2
i 1
M
up
M
( pi P)2
i 1
M
2、运用公式 A平均数的抽样平均误差
ux
σ (重复) n
B成数的抽样平均误差
4、抽样方法(重复或者不重复) 3、抽样的组织方式
28
第四章第三节
例题:①某冷库冻鸡平均每只重1200克,标准差70克, 如果重复随机抽取100只和200只,分别计算抽样平 均误差。
ux
σx n
70 7(克) 100
ux
70 4 95(克) 200
②该冷库冻鸡合格率为97%,如果重复随机抽取100只 和200只,分别计算抽样平均误差。
up
P(1 P) n
97%(1 97%) 1 7% 100
up
97%(1 97%) 1 2% 200
29
例机题抽:取某第2灯%泡五样厂章本对第进1三0行0节测00试个,产所品得进资行料使如用下寿表命:检验,随
使用时间(小 时)
900以下 900~950 950~1000 1000~1050
指标,在考虑抽样误差的前提下,使得总体 指标落到某一范围之内,即根据抽样指标定 出置信区间和置信度。
33
第四章第四节
2、抽样极限误差
➢ 概念:抽样极限误差是指总体指标和抽样指标 之间误差的可能范围。
(1)抽样平均数的抽样极限误差
xX x
(2)抽样成数的抽样极限误差
p p P
34
第四章第四节 ➢总体范围的估计 若有了抽样极限误差,则总体平均数和总体
24
第四章第三节
二、抽样平均误差的意义 ➢ 抽样误差是一个随机变量; ➢ 抽样误差是反映抽样指标对全及指标代表性程度; ➢ 不能用一次抽样得到的抽样误差来衡量抽样指标对
于全及指标的代表性大小; ➢ 抽样平均误差概括地反映了所有可能抽样指标与全
及指标之间的误差的一般水平。 因此:抽样平均误差是实际可以运用于衡量抽样指标
的概率分布。
➢ x 抽样分布的形式
➢样本比率的抽样分布 ➢样本方差的抽样分布
21
样本均值 x
样本统计量 样本比率p
正态总体或非 正态总体大 样本
非正态总体 (小样本)
大样本
正态分布
t分布
正态分布
样本方差s2
2分布
22
第四章第三节
第三节 抽样平均误差(样本平均数的方差与标准差) 一、抽样误差的概念 是指样本指标和总体指标之间数量上的差别。
19
第四章第二节 四、抽样调查的理论依据 ➢大数法则:随着抽样单位数n的增加,抽样
平均数有接近总体平均数的趋势,几乎具有 实际的必然性。 ➢中心极限定理:如果总体变量存在有限的平 均数和方差,则不论这个总体变量的分布如 何,随着抽样单位数n的增加,抽样平均数 的分布便趋于正态分布。
20
五、抽样分布(教材98页) ➢概念——由样本n个观察值计算的统计量
27
第四章第三节
四、影响抽样平均误差的因素 1、全及总体标志的变动程度
➢ 全及总体标志变动程度越大,抽样平均误差就越大; 反之,全及总体标志变动程度越小,则抽样平均误差 越小。两者成正比关系的变化。
2、抽样单位数的多少
➢ 在其他条件不变的情况下,抽取的单位数越多,抽样 平均误差越小;样本单位数越少,抽样平均误差越大。 抽样平均误差的大小和样本单位数成相反关系的变化。
6
第四章第二节 ➢抽样总体,简称样本(n) :将从总体中抽
取的部分单位称为样本 ✓大样本:样本数达到或超过30 ✓小样本:样本数在30以下 注意:对于全及总体单位数N来说,样本n是
一个很小的数,它可以是N的几十分之一, 几百分之一、几千分之一、几万分之一。
7
第四章第二节 二、全及指标和抽样指标 ➢全及指标(总体指标) ✓定义:根据全及总体各个单位的标志值或标
登记性误差



系统误差(偏差)


代表性误差

随机性误差
23
第四章第三节
随机误差
实际误差
x1 X x2 X
p1 P p2 P
(指一个样本指标与总体指标之间的差别)
平均误差
u x
M
(xi X )2
i 1
M
up
n
( pi P)2
i 1
M
(指所有可能出现的样本指标的标准差,即所有实际误差的平均值)
志特征计算的,反映总体某种属性的综合指 标,称为全及指标(总体指标)。
8
第四章第二节
✓全及指标的运用及计算
• 变量总体的平均数: X
X N
或X
XF
F
• 属性总体:计算结构相对指标,即总体成数,用P
表示,表明总体中具有某一属性的单位数占总体单
位数的比重。
设总体中有N个单位,有N1个单位具有某种属性, N0个单位不具有某种属性,N1+N0=N,P为总体 中具有某种属性的单位数所占的比重,Q为不具有 某种属性的单位数所占的比重,则总体成数为:
(X X )2
(X X )2 F
2
或 2
N
F
(X X )2
(X X )2 f

N
f
注意:总体的统计量是一个确定的值
11
第四章第二节
• 属性总体的方差和标准差
(X X )2 F
2
F
(X
X
)
F
F
(1 P)2 P (0 P)2 (1 P)
P(1 P)
P(1 P)
注意:总体的统计量是一个确定的值(X X )2 fS2 Nhomakorabeaf
(X
X
)
f
f
(1 p)2 p (0 p)2 (1 p)
p(1 p)
S p(1 p)
• 注意:样本统计量不含未知参数,它是随样 本不同而不同的随机变量
16
第四章第二节 ➢统计抽样过程
总体N
样本n

(抽取方式方法)
计 算









(抽样估计)
X ,P (计算抽样误差) x, p
为估计量用
来表示,估计量的具体数值称为估
价值。
31
第四章第四节 二、评价估计量的标准(教材126页) 1、无偏性 2、一致性 3、有效性
32
第四章第四节
三、参数估计的方法(P123) (一)点估计
也叫定值估计(或直接估计),就是把样本平 均数或样本成数直接作为总体平均数或总体 成数的估计值。
(二)区间估计 1、区间估计的意义 在一定概率的保证下,用样本指标去推断总体
p 0 (1
p)
p
14
第四章第二节
• 样本标准差 S 和样本方差S 2,它们都是测量
样本标志值分散程度的指标
(x x)2
(x x)2 f
S2
或S 2
n 1
f 1
(x x)2 f
S
f
• 注意:样本统计量不含未知参数,它是随样 本不同而不同的随机变量(见教材34页)
15
第四章第二节
• 属性样本的方差和标准差
相关文档
最新文档