第十五章总体特征抽样调查的设计与分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
系统抽样
• 系统抽样需要事先为总体中的个体编号。 • 如果欲调查的变量值或特定的属性与编号
之间没有确定的上升、下降或周期性关系, 这时可以按单纯随机抽样的办法来估计参 数和估算样本量。 • 如果个体的编号不具有随机性,就应考虑 采用其它的抽样设计和相应的统计方法。
第二节 分层随机抽样
例15-2 欲抽样调查某医院病人的药费开支和自费病 人所占频率。决定将病人分为内科、外科、妇科、 儿科和其他5个“层”;将每一层视为一个小总体, 在每一层内作随机抽样 。
单纯随机抽样
• 样本量的估算 • 样本量估算的依据 样本量的信息: 1.总体中个体的变异程度 如果个体间变异程度小,
则所需样本量也较少;通常用变异系数V来反映 个体间变异。 2.精度 通常用最大的相对误差反映精度的要求, 是最终估计范围的半宽度与真值之比。精度要求 越高,样本含量就越大。 3.置信程度 即置信水平反映置信程度。置信程 度越高要求的样本含量也越大。
自行规定
概率的变异系数的计算公式为
p(1 p) V
P
最小样本量的公式为
n
Z
2
/
2
(1ห้องสมุดไป่ตู้
2P
P)
n
(1.96)2 (1 40 / 90) (0.2)2 (40 / 90)
120.05
121
关于社区医生中大学毕业者所占百分比的估计,欲
使相对误差不超过20%,而保持置信水平95%,至
少需要调查121名社区医生。
• 例15-1: p y 40
n 90
SE( p) 1 n p(1 p) 1 90 (40 / 90)(1 40 / 90) 0.042
N n 1
250
90 1
40 1.96(0.042) (0.362 , 0.527) 90
当地全体社区医生一个月内家访的总次数约介于 1077.5和 1367.5之间,平均每位社区医生家访的 平均次数约介于4.31和5.47之间;而社区医生中, 大学毕业者所占的百分比则约介于36.2%和 52.6%之间。
校正因子
SE(x) 1 n sx Nn
可信区间:
抽样频率
X t / 2,n1 SE( X )
X Z /2 SE( X )
单纯随机抽样
例15-1 :
SE(x) 1 90 3.48 0.2935 250 90
总体均数u的95%置信区间:
4.89 1.96(0.2935) (4.31, 5.47)
无限总体(infinite population)
从正态分布总体 N(, 2 ) ,则样本均数的标 准误为
SE(x) sx n
总体均数 u 的可信区间
X t / 2,n1 SE( X )
X Z /2 SE( X )
单纯随机抽样
• 有限总体(finite population) 有限总体
样本均数的标准误:
单纯随机抽样
总体中所有X值之和的置信区间可以用u的置 信区间乘以N倍来估计,即
N[ X t / 2 , n1 SE( X )]
全体社区医生一个月内家访总次数的95%置 信区间 :
250[(4.31, 5.47)] (1077.5, 1367.5)
单纯随机抽样
• 0-1变量总体概率的估计
二项分布无限总体:
单纯随机抽样
• 单纯随机抽样(simple random sampling)。 • 一个月内平均每位社区医生家访的平均次
数约为4.89 • 全体社区医生家访的总次数约为
4.89×250=1222.5 • 社区医生中大学毕业者所占的百分比约为
(40/90)×100%=44.4%
单纯随机抽样
• 连续型变量总体均数的估计
已知一天内5个层的门诊人次数分 别:N1=2800,N2=900,N3=700,N4=400,N5=200, 总的人次数n=5000,总的样本数n=1000,抽样 的比例为n/N=0.2。于是,5个“层”中抽出的样 本量分别:n1=560,n2=180,n3=140,n4=80,n5=40。
第十五章
总体特征抽样调查的 设计与分析
主要内容
• 单纯随机抽样 • 系统抽样 • 分层随机抽样
第一节 单纯随机抽样
例15-1 某地区共有250名社区医生,一个研 究组从名单中随机抽取90名进行调查,发 现他们一个月内家访平均次数为4.89,标准 差为3.48;其中有40位是医科大学毕业。 试估计当地一个月内平均每位社区医生的 家访平均次数、全体社区医生的家访总次 数以及社区医生中大学毕业者所占的百分 比。
需要说明的是,如果算出的最小样本量n超过 了总体内个体数N,则最小样本量就应该是 N,即需要作全数调查。
单纯随机抽样
• 0-1变量总体概率估计的样本量 事先需知 (1)总体概率的猜测值P 可以通过预调查
的资料来粗略估计。 (2)相对误差 由研究者根据问题的背景自
行规定。 (3)置信水平 也由研究者根据问题的背景
单纯随机抽样
• 最小样本量的公式为
2
n
Z / 2V
• 续例15-1,将已获得的90名社区医生的资 料视为预调查
V 3.48 0.712 4.89
n [1.96(0.712)]2 49 0.2
单纯随机抽样
关于社区医生家访次数的估计,欲使相对误 差不超过20%,而保持置信水平为95%, 至少需要调查49名社区医生。比由此,为 了估计平均家访次数,预调查90名社区医 生的资料已经足够了。还少?
单纯随机抽样
• 连续型变量总体均数估计的样本量 需准备如下信息:
1.变异系数V 即总体标准差与总体均数之比
V
2.相对误差 由研究者根据问题的背景自行规定。 3.置信水平 也由研究者根据问题的背景自行规定。
通常取90%,95%,99%。如果取99.7%,理论 上认为这时的置信区间基本上覆盖真值,所以称 之为“实质上肯定”(virtual certainty)的水平,此 时标准正态分布的临界值 Z0.003/ 2 3
已知在含有n个个体的独立随机样本中,
有y个个体具有某种特定属性,则该属性的
样本频率
p y
n
样本频率变异性的标准误 :
SE( p) p(1 p) p(1 p)
n 1
n
单纯随机抽样
有限总体 :
SE( p) 1 n N
p(1 p) n 1
总体概率的置信区间 :
p Z / 2 SE( p)
单纯随机抽样