第7章-抽样推断

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
支持该候选人的选民 占全部选民的比例: 160/400=40%
★ 第一节 抽样推断的基础理论
第二节 抽样误差 第三节 抽样估计 第四节 样本容量的确定
第七章 抽样推断
第一节
抽样估计的意义
★ 一、抽样估计的定义
二、抽样估计的特点 三、抽样估计的运用 四、抽样估计的一般步骤
抽样估计
按照随机原则 从调查对象中抽取一部 分单位进行调查,并以调查结果对总体 数量特征作出具有一定可靠程度的估计 与推断,从而认识总体的一种统计方法
按随机原则从全及总体中抽取一 部分单位组成的集合体,又叫抽样 总体。
抽样总体
样本总体中所包括的单位数叫样本容 量,一般用n表示 1、大样本(n≥30 2、小样本(n≤30)
全及指标
指被估计的总体指标,又被 称为总体参数
设总体中 N 个总体单位某项标志的标志值分别 为 X1 , X 2 , X N ,其中具有某种属性的有 N1个 单位,不具有某种属性的有 N 0个单位,则 ⒈ 总体平均数(又叫总体均值):
为 P 的 ⒌ 样本单位是非标志的标准差: 无偏估计
n n sp p1 p pq n 1 n 1
⒍ 样本单位是非标志的方差: n n 2 sp p 1 p pq n 1 n 1
为 的 无偏估计
2 P
当样本容量很大时,1/n,与1/(n-1)相差不 大,样本方差的分式,可以直接除以n, 与总本的方差计算分式保持一致。
2
n


1
为 的无偏估计
f
i 1
m
i
1
x
m i 1
i
x fi

2
⒊ 样本单位标志值的方差:
2 1 2 s x i x 或s n 1 i 1 2 n


1
为 的无偏估计
2
f
i 1
m
i
1
x
m i 1
i
x fi

2
⒋ 样本成数:
n0 n1 p ,q 1 p n n
总体平均数
X 40 50 70 80 X 60 N 4
2 ( X X )
标 准 差

N (40 60) 2 (50 60) 2 (70 60) 2 (80 60) 2 4
1000 4 15.81
现用重复抽样的方法从4人中抽取2人构成样本,求样本的平均数,用以代表 4人总体的平均水平,所有可能的样本及样本的平均工资列表如下:
325009260 / 29 3347 .72
p 19 / 30 0.63
抽样方法 重复抽样
抽出 个体 又被称作重置抽样、有放回抽样 登记 特征 放回 总体 继续 抽取
特点
同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
抽样方法 不重复抽样
抽出 个体 又被称作不重置抽样、不放 回抽样 登记 特征 继续 抽取
x1 X
p1 P
x2 X
p2 P
说 明
对于任何一个样本,其抽样 误差都不可能测量出来 抽样误差的大小可以依据概 率分布理论加以说明
更大样本 容量的抽 样分布
某个样本 容量的抽 样分布
X
x n
根据所有可能样本的样平均数或 样本成数计算的标准差,即每一 抽样平均 次抽样的样本指标和总体指标之 间的平均差异程度。即样本估计 误差 量的标准差
0
100 225 0 25 225 400 2000
• 样本平均数的平均数:
960 E( ) 60 可能的 样本数目 16
• 抽样平均误差
ux
2 [ E ( ) ]

K

2000 11 .18 16
ux
n

15.81 2
11.18
抽样平均误差的计算公式
X
X
i 1
N
i
N
或X
X
i 1 m
m
i
fi

i 1
fi
⒉ 总体标准差:

2 1 N X i X 或 N i 1


1
fi
i 1
m
X
m i 1
i
X
f
2
i
⒊ 总体方差:
1 2 N
X
N i 1
i
X 或
2

2
1
fi
i 1
m
抽样估计的现实应用
例1 一汽车轮胎制造商生产一种被认为寿命更 长的新型轮胎。
120个 样本
测试
平均里程: 36,500公里
推断
新轮胎 平均寿命: 36,500公里
例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民众 占全部登记投票人总数的比例。由于时间及财力的限制: 400个 样本 支持人数: 160 推断
假如根据该样本求得的年薪样本平均数、标 准差及参加过培训计划人数的比例分别为:
假如随机抽取了一个容量为30的样本: 工资 是否参加培训 49094.3 Yes 53263.9 Yes 49643.5 Yes … …
x xi / n 1554420 / 30 51814 .00
s
2 ( x x ) /(n 1) i
2、同时,有1500人参加了公司培训,则 参加公司培训计划的比例为: P =1500/2500=0.60 上述总体均值、总体标准差、比例均称为总 体的参数
参数是总体的数值特征
如:例3中的中层干部平均年薪,年薪标准差及受培训 人数所占比例均为该公司中层干部这一总体的参数。
●抽样估计就是要通过样本而非总体来估计总体参数。
⒈ 样本平均数的抽样平均误差
重复抽样时:
x

2
n 当 N≥500时,有n
N n N n n 1 N 1 N N


不重复抽样时:
x
N n
2
n N 1

2
n 1 n N
抽样平均误差的计算公式 ⒉ 样本成数的抽样平均误差 重复抽样时:
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都 有均等的被抽中机会
抽样估计
全及总体指标:
参数(未知量)
统计推断
样本总体指标:统
计量(已知量)
随机样本 与总体分布 特征相同
与总体分布 特征不同 总体
非随机样本
并非所有的抽样估计都按随机原 则抽取样本,也有非随机抽样
抽样估计的特点
s
2 1 N X i X 或 n i 1


1
fi
i 1
m
X
m i 1
i
X fi

2
N 2 1 2 s X i X 或 2 n i 1


1
fi
i 1
m
X
m i 1
i
X fi

2
sp
n p1 p pq n
sp
AA BA CA DA
AB BB CB DB
AC BC CC DC
AD BD CD DD
第八章 抽样推断
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第三节 抽样平均误差
一、抽样误差的概念 二、抽样平均误差 三、抽样极限误差
指样本估计量与总体参数之间数量 抽样误差 上的差异,仅指由于按照随机原则 抽取样本而产生的代表性误差,不 包括登记性误差和系统偏差
2
n p1 p pq n
例3:某大公司人事部经理整理其2500个中层干部 的档案。其中一项内容是考察这些中层干部的 平均年薪及参加过公司培训计划的比例。 总体:2500名中层干部 如果:上述情况可由每个人的个人档案中得知, 可容易地测出这2500名中层干部的平均年薪及 标准差。 假如:1:已经得到了如下的结果: 总体均值: =51800 总体标准差: =4000
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的适用范围

不可能进行全面调查时


不必要进行全面调查时
来不及进行全面调查时

对全面调查资料进行补充修正时
抽样估计的一般步骤
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
p
P 1 P n 时,有 当N≥500
N n N n n 1 N 1 N N
不重复抽样时:
p
P1 P N n n N 1
P1 P n 1 n N
抽样平均误差的计算公式
关于总体方差的估计方法
特点
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都 不是独立进行
是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样。
考虑顺序的抽样 对样本的 要求不同
AB≠BA
不考虑顺序的抽样 AB=BA 考虑顺序的重复抽样 Bn N = N n
两种分 类交叉
考虑顺序的不重复抽样
X
m i 1
i
X
f
2
i
⒋ 总体成数:
N0 N1 P ,Q 1 P N N
⒌ 总体是非标志的标准差:
P P1 P PQ
当P Q 0.5时, P有最大值
⒍ 总体是非标志的方差:
P P1 P PQ
2
指根据样本单位的标志值计算的用 样本指标 以估计和推断相应总体指标的综合 指标,又被称为估计量或统计量
序号 1 2 3 4 5 样本变量 ( 1) 40 40 40 40 50 ( 2) 40 50 70 80 40 40 45 55 60 45 样本平均数 平均数离差 -20 -15 -5 0 -15

Baidu Nhomakorabea
E

离差平方
[ E ]2

400 225 25 0 225
6
7 8 9
50
用过去同类问题全面调查或抽样调查的经 验数据代替; 用样本标准差 s代替总体标准差 ,用 s p 代替 P 。
x x 或 x x f n 1 f 1
2 2
n p1 p n 1
影响抽样误差的因素
总体各单位的差异程度(即标准差 越大,抽样误差越大; 的大小): n越大,抽样误 样本单位数的多少: 差越小; 抽样方法:不重复抽样的抽样误差 比重复抽样的抽样误差小; 抽样组织方式:简单随机抽样的误 差最大。
x
1 M
x
M i 1
i
X

2
x 为样本平均数的抽样平均误差; 式中: M为 2 注意:不要混淆抽样 ( x x ) i 可能的样本数目; 为第 个可能样本的平均 x 平均误差与样本标准差! i S 数;X 为总体平均数 n 1

例:有4个工人,月产量分别为40,50,70, 80,这一总体平均数和标准差为:
An N N(N 1)(N n 1)
不考虑顺序的重复抽样 不考虑顺序的不重复抽样
Cn N
(N n 1 )(N n 2) N D N C N n 1 n!
n n
A n N N(N 1)(N n 1) n! n!
例:从A、B、C、D四个工人中随机抽取 二人组成一样本,可能的样本是:
考虑顺序的重复抽样 考虑顺序的不重复抽样
AA BA CA DA
AB AC AD BB BC BD CB CC CD DB DC DD
AA BA CA DA
AB BB CB DB
AC BC CC DC
AD BD CD DD
不考虑顺序的重复抽样
不考虑顺序的不重复抽样
AA BA CA DA
AB AC AD BB BC BD CB CC CD DB DC DD
设样本中 n 个样本单位某项标志的标志值 分别为 x1 , x2 , xn ,其中具有和不具有某 种属性的样本单位数目分别为 n1和 n0 个,则
⒈ 样本平均数(又叫样本均值):
x
x
i 1
n
i
n
或x
x
i 1 m i 1
m
i
fi
i
f
为自由度 ⒉ 样本单位标志值的标准差:
1 s x i x 或s n 1 i 1
50 50 70
50
70 80 40
50
60 65 55
-10
0 5 -5
100
0 25 25
10
11 12 13 14 15 16 合计
70
70 70 80 80 80 80 -----
50
70 80 40 50 70 80
60
70 75 60 65 75 80 960
0
10 15 0 5 15 20 ---
计 算 样 本 统 计 量
推 断 总 体 参 数
第二节 抽样调查的基本概念及 理论依据
• ★ 一、全及总体和抽样总体 • 二、全及指标和抽样指标 • 三、抽样方法和样本的可能数目 • 四、 抽样调查的理论依据
全及总体
•研究对象的全体,即第一章中 学过的总体。
全及总体中所包括的单位数一般用N表示。 1、 有限总体 2、无限总体
相关文档
最新文档