初级1 -第三章简单随机抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样误差(标准差)
V ( y ) 1000 16 7.9
抽样误差计算公式
2 V ( y) 125 7.9 n 2
误差也可用方差形式表现
V ( y)
2
n
第三章 简单随机抽样
若采用不放回抽样
V ( y ) 500 12 6.45
计算公式
V ( y)

N n 125 4 2 ( ) ( ) 6.45 n N 1 2 4 1
第三章 简单随机抽样
二、 总量估计
Y NY Yi
i 1 N
N ˆ Ny Y n
ˆ Y EY

y
n
i
2 ˆ V (Y ) V ( Ny ) N V ( y )
2 N (1 f ) 2 2 V Y N V y S n

N (1 f ) 2 2 v Y N v y s n
(3)例:从批量N =50的产品中抽n = 4的样本采用掷骰子 采用掷骰子法确定选随机数表“I”;用瞎子点点法确定起点为11 行 第1 列,随机号码为18、18、07、92、45、44…取18、7、42、45
• 随机数表
75 18 26 53 86 90 85 89 64 97 96 18 48 81 06 91 63 57 95 12 随机数字表 16 01 56 82 26 54 33 17 24 32 66 16 31 29 42 15 66 40 38 51 08 33 07 41 61 48 98 89 52 71
将分子,分母同除以 N2
Nt S n0 2 N
n0 N 2 t 2 S 2 1 2 N N
n0 故 n n0 1 N
Sample Size
n0 n n0为重复抽样条件下的样本量 n0 1 N ts 2 tc 2 t 2S 2 n0 ( ) ( ) n0 2 rY r
1 f 2 1 0.1 ˆ vY s 19.1111 1.72 n 10
ˆ vY ˆ 1.3115 sY
由置信度95%对应的 t 1.96 ,因此,可以以95%的把

ˆ Y y 5

握说总体平均水平大约在 5 1.96 1.3115 之间,即2.4295和7.5705之间。
放回抽样下,抽取过程中的每次抽取都是独立的,但可能使得单元
被重复抽到。同一单元被重复抽到,并不能提供更多的信息,所以 在实际调查中,更多的采用不放回抽样。
简单随机抽样下,每个样本被抽中的概率相等。
样本是从总体中随机产生的,总体单元的不同组合,
便产生了不同的样本。 对于放回简单随机抽样,所有可能的样本有 N 种 (考虑样本中单元的顺序),每个样本被抽中的概 率相等,都为 1/ N n 。 n 对于不放回简单随机抽样,所有可能的样本有 CN 种, n 每个样本被抽中的概率相等,都为 。 1/ CN
y
100 110 105 115 110 120 115 125
( y Y )2
225 25 100 0 25 25 0 100
样本 A,B A,D B,B B,D C,B C,D D,B D,D
2
y
105 115 110 120 115 125 120 130
(y Y ) 100 0 25 25 0 100 25 225
ˆ sY 131.1488 t 1.96 0.5141 51.41% ˆ 500 Y



第三章 简单随机抽样
三、比例估计 1,具有某种特征 令
总体比例 P 1
n 1 ˆ y P i n
yi 0,不具有某种特征
Y N
N i
n 1 样本比例 p yi n
p(1 p) ˆ v( P) (1 f ) n 1
例: N 500000, n 500 ,有425户家庭拥有彩 电,全市居民家庭彩电拥有率?
第三章 简单随机抽样
n 1 425 ˆ P yi 0.85 n 500
取 0.05
ˆ (1 p ˆ) p 500 0.85(0.15) ˆ v( P) (1 f ) (1 ) n 1 500000 500 1 0.000255
第三章 简单随机抽样

三、符号说明 总体 单位数 N 总和 Y 均值 Y 比例 P 方差 2 及 S 2
N
样本
ˆ Ny Y
p
n
y
2
s
N 1

2
(Y Y )
i
N
2
S2
2 ( Y Y ) i
N
s2
2 ( y y ) i
n
n 1
第三章 简单随机抽样
第二节 简单随机抽样的误差计算
n
简单随机抽样下,总体各单元的入样概率 相等。
入样概率指的是总体某单元入选样本(即被抽中)的
概率。 对于放回简单随机抽样,根据概率的乘法法则,总体 各单元未被抽中的概率都为 ( NN 1) ,所以总体各单元 的入样概率相等,都为 1 ( NN1) 。 n 对于不放回简单随机抽样,可能的样本有CN 种,包 C 种,所以总体各单元的入样概 含某单元的样本有 C n 率都为 C ,即 N 。另一种计算方法是:相继依次 1 抽取了n次,总体某单元第1次被抽出的概率为 N , 1 第2次被抽出的概率也为 NN1 N11 N ,直到第n次被抽出 N 1 N 2 1 1 的概率也为 N N 1 N (n 1) N ,根据概率的加法法则,该 n 单元最终被抽中的概率为 N 。
2
第三章 基本概念
N n N 1
N n N
为 修正系数
2
为 S 修正系数
n f ,称抽样比, N
2

N n 1 f 有限总体调整系数 故, N 2
S V ( y ) (1 f ) n
第三章 简单随机抽样
第三节 简单随机抽样中的估计
n 1 ˆ Y y yi n
ˆ t v( p ˆ ) 0.85 1.96 0.000255 0.85 1.96(0.016) p
置信区间 (81.9% 88.1%)
第三章 简单随机抽样
第四节 样本量的确定
影响样本量的因素
• 调查经费 • 总体方差 • 允许误差范围
• 置信度
第三章 简单随机抽样
一、样本量计算基本公式

随机数表法
(1)定义:用随机数表查出样本号码的方法 (2)步骤: ● 随机决定所用数表页码(瞎子点点法或掷骰子法) ● 决定起点(瞎子点点法) ● 查样本号数:
﹡N≤10,查一位数字即可,取到n个样品为止,重复的数字取消 ﹡11≤n≤100,查两位数字,大于n的以n除之取余数,重复数字去掉 ﹡n>100,向下取三位,大于n的以n除之取余数,重复数字去掉
N=50n=10,编号:01—50
• 计算机抽取
计算器、计算机中的统计软件都有现成的产生随机
数的程序,虽然从本质上说这种随机数都是伪随机 数(遵循特定的计算法则),但基本可以保证数的 随机性。
如何利用SPSS产生伪随机数?
在SPSS中,产生一系列随机数方法是调用Transform
菜单下的Compute次级菜单 。菜单Compute 根据不 同的分布要求,可以选择以RV开头的函数进行计算 ,产生随机数字,注意待存放数据的数据格Cell必 须是已被激活或者说已填入空值的格子! me=RND(RV.UNIFORM(1,300)) me=RND(RV.NORM(1,300))
n0 当N很大时, N
0, n n0,wr与wor几乎没有区别。
总体参数为P的情形
PQ N n V p n N 1
N n PQ d t V ( p) t N 1 n
t PQ d n 2 1 t PQ 1 2 1 N d
2
合计
( y Y )
1000
第三章 简单随机抽样
样本分布
y
频数
100 1
105 2
110 3
115 4
1wenku.baidu.com0 3
125 2
130 1
0.0625
频率 0.0625 并且:
0.125 0.1875 0.25 0.1875 0.125
说明样本分布近似正态分布
E( y) Y
第三章 简单随机抽样
例题:A、B 、C 、D 4人,体重分别为 100,110,120,130斤 可知: Y 115
2 2 ( 100 115 ) ( 130 115 ) 2 4 125
现采用抽样方法估计 Y , n 2 ,放回抽样
第三章 简单随机抽样
样本 A,A A,C B,A B,C C,A C,C D,A D,C

2
【例2.3】续例2.2。估计总体总量,并给出在置 信度95%的条件下,估计的极限相对误差。
ˆ 100 5 500 Y
1 0.1 2 ˆ v Y 100 19.1111 17200 10
ˆ的极限相对误差为: 在置信度95%下,Y

ˆ vY ˆ 131 .1488 sY
1. 调查费用确定样本量 先确定费用函数,如
费用

C c0 nc1
总费用 固定费用
设计费 分析费 办公费 管理费 场租费 等
可变费用 访问员费 交通费 礼品费 电话费 等
C 一定时,可得到样本量上限
C c0 n c1
STEPS
所需要的精度
找出样本量与精度之间的关系
估计所需的数值,求解 n 如超出预算,调整精度值重新计算
2
一、均值估计
不放回抽样是常用方法
S V ( y ) (1 f ) n
2
v( y )是 V ( y ) 的估计
s v( y ) (1 f ) n
第三章 简单随机抽样
置信区间
y t V ( y) Y y t V ( y)
当 0.05时, t 1.96 t V ( y ) 称为允许抽样误差
精度margin of error
对精度的要求通常以允许最大绝对误差
差限)或允许最大相对误差 (相对误差限)来表 示。
r
d(绝对误
d 1 P
P r 1


样本量足够大时,可用正态分布近似
ˆ tS ˆ d t V
t :概率度
【例2.2】
我们从某个=100的总体中抽出一个大小为=10的简
单随机样本,要估计总体平均水平并给出置信度为 95%的区间估计。
序号
i
1 4
2 5
3 2
4 0
5 4
6 6
7 6
8 15
9 0
10 8
yi
1 n 172 2 2 1 n 50 y yi 5 s n 1 ( yi y ) 9 19.1111 i 1 n i 1 10
r t ˆ V


变异系数

t S ˆ tCvˆ

第三章 简单随机抽样
2. 放回抽样

S t n0
2

t S n0 2
2
2
第三章 简单随机抽样
3. 不放回抽样 由
S N n t ( ) n N
2
2 2

Nt 2 S 2 n 2 2 2 N t S
第三章 简单随机抽样

第一节
基本问题
一、什么是简单随机抽样
从 N个单元的总体中抽取 n个单元组成的样本。总体单元数为 N,
样本量为 n。 若抽样是放回的,每次都是从 个总体单元中随机抽取1个单元,独 立重复抽取n次,得到 个单元组成的样本,叫做放回简单随机抽样。 若抽样是不放回的,每次都是从剩下的总体单元中随机抽取1个单 元,相继依次抽取n次,得到n个单元组成的样本,叫做不放回简单 随机抽样。
n
n
n 1 N 1 n N
n 1 N 1
二、实施方法 • 抽签 制作N个同质的签,充分混合。从中一次抽出n个签, 或者先抽出一个签但不放回,再抽下一个签直到抽 满n个签为止。抽出的这n个签对应的单元入选样本, 这是不放回简单随机抽样;若从充分混合的N个签 中抽取一个,记录后放回,再抽取下一个,如此进 行,直到抽满n个为止,则是放回简单随机抽样。 抽签法的实施起来比较麻烦,尤其是当总体单元数 N较大时,所以该方法的使用场合为当总体单元数 N比较小,签的制作比较方便时。
相关文档
最新文档