统计学抽样方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2006年海宁市公众科学素养调查抽样方案
一、调查目的、范围及对象
海宁地处中国长江三角洲南翼、浙江省北部,东距上海100公里,西离杭州60公里,南濒钱塘江,内陆面积近700平方公里,地势平坦,河流众多,水源丰富,是典型的江南水乡。海宁现辖8个镇,4个街道,总人口64万。海宁经济发达,市场繁荣,是我国首批沿海对外开放县(市)之一,连续三届跻身“全国综合实力百强县(市)”行列,县域社会经济发展综合评价全国第19位,是浙江省首批“小康县(市)”之一。海宁的目标是实现由小康向现代化的历史性跨越,到2010年建成经济文化强市。
提高公众科学文化素质,是实施科教兴国战略和可持续发展战略,是建设经济文化强市的重要内容之一。为深入地了解海宁市公众科学素养的状况,为政府和相关机构以及科普研究提供详尽的数据,海宁市科协决定于2006年6月至11月开展海宁市公众科学素养抽样调查。
●本次调查的范围是海宁市包括:斜桥镇、许村镇、长安镇、周王庙镇、盐官镇、丁桥
镇、袁花镇、黄湾镇、硖石街道、海洲街道、海昌街道、马桥街道。
●本次调查对象是在海宁市境内居住半年以上,年龄在18~69岁的成年人(智力障碍者
除外)。
●本次调查的内容主要是了解海宁市公众的科学素养水平、获得科技知识的渠道、对科
技发展的态度等方面的基本情况。
二、调查方案的设计
从数据上看,海宁市各地区的经济、文化等各方面差异不是很大。但非农业与农村的
差异还是明显的。本次调查采用分层抽样三阶段的方法,各阶段的抽样单位如下: 第一阶段:海宁市所有镇及街道均入选为抽样单位; 第二阶段:以社区或村委会为二级抽样单位;
第三阶段:以家庭住户并在每户中确定1人为最终单位;
(一) 调查样本量的确定
● 样本量的定量分析:
纯净样本量是指去掉不合格或未回答的调查对象以后的剩余量,由于调查的结果主要是估计各种比例数据以及比例数据的之间的比较,所以在决定调查样本量时采用估计简单
随机抽样的总体比例时的样本量为基础,一般用公式2
2
)
1(d
p p u N -=α来计算,其中N 为纯净样本量,αu
为一定置信度下所对应的临界值,p 为样本比例,2d 为误差率。类似调查中,
大多数取95%的置信度(即仍有5%的不确定性或5%的误差),本调查也采用95%的置信度,此时αu =1.96,由于p 值较难估计,可采用保守策略,取5.0=p ,上述公式转化为
2
25.05.096.1d N ⨯⨯= 。一般误差率(最大允许绝对误差) d 取值为3%或更小。
● 样本量的确定:
在95%的置信度下按抽样绝对误差不超过3%的要求进行计算,由于我们可能要计算各种比较的大小,所以没办法精确地估计p 的大小,采用保守策略,取5.0=p 计,即所应抽取样本量为:
22022
(1) 1.960.50.510670.03u p p n d α-⨯⨯==≈
根据经验,一般分层抽样的设计效应为1.8,故抽取总样本数为1920.6个(人),为了便于计算和分组,设定本次的样本量为1920个(人)。
(二)抽样方法
考虑本项目所调查的地点仅为海宁市,所调查区域相对集中,并且海宁市所属的镇和街道只有12个分别为斜桥镇、许村镇、长安镇、周王庙镇、盐官镇、丁桥镇、袁花镇、黄湾镇、硖石街道、海洲街道、海昌街道、马桥街道。抽样方法采取分层的三阶段与人口成比例的PPS概率抽样,即分层、多阶段概率与规模成比例系统抽样法。首先将海宁市按非农村人口和农村人口分为两个层,分层标准主要为居民性质(按海宁市科协所提供资料)。分层后,分别采用三级子抽样,即小层→社区或村→家庭户→人。
(三)分层
全市的镇和街道为一级抽样单元,共有12个基本单位。对第一阶段的抽样,全市各地区农村居民与非农村居民的科学水平差异较大,并且考虑到海宁市的具体情况,所以,将海宁市按非农村和农村分为两个层进行抽样。
农业与非农业人口的比例的确定
海宁市的非农业人口(即由海宁市科协提供的农村社区人口和城镇社区社区人口之和)与农业人口(即海宁市科协提供的农村人口)的比例为23.39:76.61。依据按比例抽样的原则,同时也兼顾可操作性,确定抽样时农业人口与非农业人口的样本数分别为:1464个(人)和456个(人)。现根据海宁市各镇或街道农业与非农业人口比例,确定非农业与农业的样本量比例如下:
表1:各地区非农业与农业的样本量
(四)多阶抽样步骤:
1.初级抽样单位的抽选
全市的12个镇、街道均为初级抽样单位。
2.二级抽样单位的抽选
在各的街道、镇抽取若干个社区或村委会,由已经取得的社区和村的人口资料编号排序(随机进行,没有规定的先后次序)。然后用产生随机数的方法抽取社区或村。(可见表2,表3)。
4.三级抽样单位的抽选
将以上抽中的社区或村委会中所含居民户数编号排序。仍随机抽样法,从每个社区或村委会中抽取24或12户居民(具体样本的分配见下表3),将从社区中抽取的样本为非农业人口的代表,从村中抽到的样本为农业人口的代表。再用二维随机数表决定具体18-69岁(智力障碍者除外)的居民。
三、第二阶段抽样——街道和镇对社区和村的抽样
根据上述的抽样原则,确定抽取社区和村的个数如下:
表2:各地区抽取的社区或村个数
利用海宁市科协提供的资料,按人口总数的PPS抽样,经发生随机数产生下面的样本社区和村。
表3:各地区抽中的社区和村
注1:在备注中社区或村只抽取12人,其余的均选取24人。
四、第三阶段抽样——社区或村对家庭户的抽样
社区或村对家庭户的抽样是利用计算器产生随机数后进行简单随机抽样。例如:在抽