第五章抽样设计部分

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
某企业对一批总数为5000件的产品进 行质量检查,过去几次同类调查所得的 产品合格率为93﹪、95﹪、96﹪,为 了使合格率的允许误差不超过3﹪,在 99.73﹪的概率保证程度下,应抽查多 少件产品?
己知N 5000, p 3﹪, t 3, P 1 P 0.0651,
总体 N
N2
Nk
n2
nk
按各类标志变异程度的大小来对样本的分配
· · ·
· · ·
样本在各组间的分配方法:
等额分配法:每组抽取的单位数一样。
等比例分配法:按各组单位的比例分配样 本单位。 最优分配法:按各组的方差大小分配样本 单位。方差大的组分配较多的样本单位。
实际工作中比较常用的是等比例分 配法。
Rr ( ) r R 1
2 p
组间方差:
2 ( P P ) i i 1 R 2 ( p p ) i i 1 R
2p =
R r Pi:总体中第i个类的成数,P:总体成数 pi :样本中第i个类成数,p:样本成均数 R:总体分为了R个群,r:样本有r个群

从某县256个村庄抽中了51个村庄,并对抽中的全部 农户进行调查,农户年人均消费支出为985元,群间方 差为8464,人均消费支出低于300元的农户占比5%,群 间方差为0.014,算在95%的可靠性下农户人均消费支 出的抽样误差和成数抽样误差,以及二者的置信区间。
【例A】某食品厂要检验本月生产 的10000袋某产品的重量,根据上 月资料,这种产品每袋重量的标准 差为25克。要求在95.45﹪的概率 保证程度下,平均每袋重量的误差 范围不超过5克,应抽查多少袋产 品?
解:
己知N 10000, 25克, x 5克, t 2, 则在重复抽样条件下: t 2 25 n 100 袋 2 2 x 5
类型抽样的优点: 能提高样本的代表性; 能降低抽样误差; 组织起来较为方便;
类型抽样分组的基本原则:
尽量缩小各组内标志值之间的差异,增 大组间各标志值之间的差异。
类型抽样的抽样平均误差 对各个类别而言是全面调查,无抽样误差,但对各组 内的各个个体而言是非全面调查,存在抽样误差,所 以类型抽样的抽样误差取决于组内方差,与组间方差 无关。 抽样误差的计算公式来看 关键要算总体方 差总体方差未知 时也可以以样本 方差代替
样本n=100×10=1000(户)
对各个类别而言是非全面调查,有抽样误差,
对抽中的类来说,其中各组内的各个个体而言 也是非全面调查,也有抽样误差,所以多阶段 抽样的抽样误差既取决于组间方差,又取决于 组内方差。所以是整群抽样的抽样误差与分层 抽样抽样误差的综合
2 R 256,r 51, x 985, 2 8464, 0.05, p 0.014, t 1.96 x
p x
2
Rr ( )=11.55 r R 1
x

2 p Rr
r R 1 均值置信区间[985-1.96*11.55,985+1.96*11.55] 成数置信区间[5% 1.96*1.5%,5% 1.96*1.5%]
1、样本均值的抽样误差
x
组间方差:
2

Rr ( ) r R 1
x

整群抽样都 是采用不重 复抽样

( X i - X )N i
2

N
2

2 ( X X ) Ni i
N
2
i
2 ( X 1 - X )N1 ( X 2 - X )N 2 ...... (X N - X ) NN Ni
(
)=1.5%
多阶段抽样
先通过抽取若干级中间组全单位,最后再来 抽取基本调查单位的抽样组织形式。 例:在某省100多万农户抽取1000户调 查农户生产性投资情况。
第一阶段:从该省所有县中抽取5个县 第二阶段:从被抽中的5个县中各抽4个乡 第三阶段:从被抽中的20个乡中各抽5个村 第四阶段:从被抽中的100个村中各抽10户
N P (1 P )
i i i i
N ni pi (1 pi )
i
n
重复抽样情况下 p 不重复抽样情况下 p
P(1 P) n P (1 P ) n (1 ) n N
某乡行政区域有三个片区,平地、丘陵和山地,各片 区农户数分别为500,425和374,从中按5%抽取样本, 分别为25户,21户和19户,经过调查得知人均纯收入 分别为1054元,823元和367元,人均纯收入的标准差 分别为108元,84元和98元,计算该乡人均纯收入的抽 样误差(不重复抽样)
2 p

则在重复抽样条件下: t 2 P 1 P 32 0.0651 n 651 件 2 2 p 0.03 在不重复抽样条件下:
2 Nt 2 P 1 P 5000 3 0.0651 n 2 2 2 N p t P 1 P 5000 0.03 32 0.0651
总离差平方和 N
(x
i j
ij
N (x
i j ij
- x) (数据来自总体)
2

2
样本方差S2 =
总离差平方和 n
n
- x) (数据来自样本)
各组内部方差: i 2 =
组内离差平方和 Ni
(x
j
ij
- xi ) . Si 2 =

2
(x
j
ij
- xi )

Ni
ni
i i
总离差平方和 总体方差(组内方差) = N
2
-
2 i Ni i
总离差平方和 样本方差(组内方差) S = n
重复抽样情况下 x
2
N 2 S i ni
i
n
2
n
或用S
2
n (1 ) n N
2
代替
不重复抽样情况下 x
二、样本成数
P (1 P )= p (1 p )=
统 计 学
Statistics
任课老师:何艳秋 管理学院 办公室:4C-405
必要样本容量的确定:
必要样本容量是说在一定的抽样误差和置信度下必 须抽取的最小的样本容量.
1、推断一个总体平均数所需的样本容量
⑴ 重复抽样条件下:
通常的做法是先确 定置信度,然后确 定抽样边际误差 (极限误差)=临 界值*抽样平均误差。
整群抽样
将总体全部单位分为若干“群”,然后以群 作为抽样单位,从总体中抽取若干群作为样 本,并对中选群的所有单位进行全面调查。 例:总体群数R=16 样本群数r=4
A CM N B L P D J F KO E H I G
I
H
P D
样本容量
n nd n p nl nh
简单、方便,能节省人力、物力、财 力和时间,但其样本代表性可能较差
未知时用样本标准差 S代替
x t x t
计算结果通 常向上进位

n
2
,
2
t n 2 x
⑵ 不重复抽样条件下:
x t x t
2

2
2 2
n 1 n N
,
t N n 2 2 2 N x t
由置信水平确定临界值,再确定边际误差,根据 边际误差(抽样极限误差)的公式解出样本容量
x
2
n
样本均值抽样误差
P(1 P) p 样本成数的抽样误差 n
一、样本均值
总离差平方和=各组组内离差平方和之和+组间离差平方和
2 ( x x ) ( x x ) n ( x x ) , i i ij ij i i j i j i 2 2
总体方差 2 =
组内离差平方和:(2-2.5)2+(3-2.5)2;(4-4.5)2+(54.5)2 组内方差: [(2-2.5)2+(3-2.5)2]/2; [(4-4.5)2+(5-4.5) 2]/2 组间离差平方和:2*(2.5-3.5) 2+2*(4.5-3.5)2
类型抽样下总离差平方和主要取决于组内离差平方和 总离差平方和=组内离差平方和之和= i 2 Ni 或 Si 2 ni ,

2 =
x

(X i X )
i 1
R


2
R

2 ( x x ) i i 1
R


r

X i :总体中第i个类的组平均数, X :总体总平均数 x i :样本中第i个类的组平均数,:样本总平均数 x R:总体分为了R个群,r:样本有r个群


2、样本成数的抽样误差
p

2 2 2 2
在不重复抽样下: 2 2 2 2 2 t N 10000 2 25 n 2 2 2 2 2 2 N x t 10000 5 2 25
99.01 袋
2、推断一个总体成数所需的样本容量
⑴ 重复抽样条件下:
通常的做法是先确定置信 度,然后限定边际误差 (抽样极限误差)。 总体成数P未知时以样本 成数p来代替
p t p t
2
P 1 P , n
t P 1 P n 2 P
计算结果通常向上进位
⑵ 不重复抽样条件下:
P 1 P n p t p t 1 , n N
Nt P 1 P n 2 2 N p t P 1 P
总体单位的排列顺序和所研究的标志 数值大小是无关的。如调查居民生活 水平时,按姓氏笔划排队。 总体单位的排列顺序和所研究的标志 数值大小有密切关系。如居民收入调 查,按银行存款高低排序。
等距抽样的抽样平均误差
等距抽样的抽样平均误差估计比较复杂。 一般按以下方法近似计算。 按无关标志排队的等距抽样,可按不重复抽样 下的简单随机抽样来计算; 按有关标志排队的等距抽样,可按类型抽样来 计算。
x

n (1 ) n N
500*1082 +425*842 +374*982 = =9563.28 500+425+374
2
2=
2 i Ni i
N x =11.82
等距抽样
首先将总体各单位按某一标志排队,然后按 固定的顺序和间隔抽取样本单位。又称机械 抽样或系统抽样。 等距抽样是不重复抽样,适合于对单位数不 多且能进行排序的总体抽样。 按无关标 志排队 按有关标 志排队
下,选费用最少的方案
费用最少
并恰当选择概率抽样方法 ——在其他条件相同的情况
简单随机抽样
对总体未作任何处理的情况下,然后按随机 原则直接从抽样框中抽出若干单位构成样本 抽取样本的具体方法:
抽签法
是将总体中每个单位的编号写在外形完全 一致的签上,将其搅拌均匀,从中任意抽 选,签上的号码所对应的单位就是样本单 位。 将总体中每个单位编上号码,然后使 用随机数表,查出所要抽取的调查单 位。
整群抽样的抽样平均误差
对各个类别而言是非全面调查,有抽样误差,但对抽 中的类来说,其中各组内的各个个体而言是全面调查, 无抽样误差,所以整群抽样的抽样误差取决于组间方 差,与组内方差无关。 抽样误差的计算公式来看
x
2 N n
n N 1
样本均值抽样误差
Baidu Nhomakorabea
P(1 P) N n p 样本成数的抽样误差 n N 1
576.004 件 577 件
六、抽样设计
概率抽样方案设计的基本原则
——抽取样本单位时,应确保每个总 随机原则 体单位都有被抽取的可能;在对样本 单位的资料进行搜集和整理时,不能 随意遗漏或更换样本单位
最大抽样效果原则
抽样误差最小
——为保证最大的抽样效果, 在其他条件相同的情况下, 选抽样误差最小的方案 要合理确定样本容量,
于是我们可以得到:组内离差平方和= i 2 N i 或Si 2 ni
两组数据:2,3和4,5 总平均:(2+3+4+5)/4=3.5 组平均:2.5和4.5
总离差平方和:(2-3.5)2+( 3-3.5 )2+( 4-3.5 )2+( 53.35)2 总方差: [(2-3.3)2+( 3-3.3 )2+( 4-3.3 )2+( 5-3.3 ) 2]/4
随机数表法
应用
仅适用于规模不大、内部各单位 标志值差异较小的总体
类型抽样
先将总体全部单位按某一标志分类,然后从 各类型中按随机原则抽取样本单位组成样本。
实质上是分组法与随机原则的结合。
例如,在居民生活水平调查中,先按职业分类, 然后每种职业分别随机抽取部分居民进行调查。
N1
n1
等额抽取 样本 n 等比例抽取 最优抽取
相关文档
最新文档