(六)规模以下工业抽样调查设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(六)规模以下工业抽样调查设计
1.调查总体划分
(1)规模以下工业总体划分为两个子总体,即年主营业务收入500万元以下的工业企业(以下简称企业子总体)和全部个体经营工业单位(以下简称个体工业子总体)。
(2)以全市为总体,按照国民经济行业分类将企业子总体划分成39个行业大类子总体。
2.基本抽样方法
企业子总体中有企业名录的部分采用目录抽样,没有企业名录的企业和个体工业子总体采用整群抽样方法。
(1)一阶段目录抽样。用于目录企业部分。根据全市企业名录库直接抽取样本企业。
(2)一阶段整群抽样。用于个体经营工业单位和未包括在企业名录库中的非目录企业部分。由北京调查总队直接抽取整群单位——村(居委会)作为样本,对整群样本内部的个体工业单位和非目录企业进行调查。
3.调查目标
(1)估计全市规模以下工业总体、企业子总体和个体工业子总体的指标总量;
(2)估计全市规模以下工业分区县的指标总量。
以下说明共分五个部分,第一部分为目录企业抽样设计;第二部分为个体工业一阶段整群抽样设计;第三部分为非目录企业抽样设计;第四部分为总体总量和方差估计;第五部分为地方样本的抽样方法。
4.目录企业抽样设计
本部分的应用范围是有名录的年主营业务收入500万元以下工业企业,即企业子总体中的目录企业部分。
(1)整理抽样框
目录企业抽样框的范围包括全部有名录的年主营业务收入500万元以下的工业企业,企业的年主营业务收入以上年数据为准。抽样框内容应包括企业的基本属性指标和基本价值量指标。具体包括:企业名称、组织机构代码、地址、行业分类、企业登记注册类型等基本属性指标,以及工业总产值或主营业务收入等基本价值量指标。
(2)确定样本量
为了同时满足企业子总体以全市为总体抽样精度的要求和以全市为总体分区县抽样精度的要求,以国家统计局工交司确定的全市目录企业部分最小样本量和样本的行业分布结构为依据,由北京调查总队确定全市及分区县目录企业样本量。
(3)分层及样本量在各层之间的分配
第一,按行业大类分层。先将目录企业抽样框按照行业大类分成39个行业层,然后将6个特别小的行业层合并成两个行业层,即将“化学纤维制造业”和“废弃资源和废旧材料回收加工业”合并成“其他制造业”,将“石油和天然气开采业”、“其他采矿业”、“烟草制品业”和“燃气生产和供应业”合并成“其他行业”,最终划分成35个行业层。将已确定的样本量分配到各行业层中,若出现某些小行业层没有分配到样本,就将其合并到“其他行业层”中,如果“其他行业层”中没有样本,则在该层增加2到4个样本。
第二,在行业层内部进一步分层。在完成按行业大类分层之后,如果分配给某行业层的样本量较大时,则需要在行业层内部进一步分层,以提高估计量的精度。进一步分层的限制条件是,每个最终层内至少包含4个以上样本。
①按照企业规模不等概率分层。将行业层内的全部企业按企业规模——工业总产值(主营业务收入)分层,一般分2到3层。
② 按照规模或者其他信息进行等概率分层。在完成按行业、按规模不等概率分层后,分配给某些“行业×规模”层的样本量仍然较大,满足进一步分层条件时,可再按企业规模或者企业其他信息(如地区、企业登记注册类型等)进一步分层。此时,要求样本在这些层中等比例分配。
(4)抽取样本
采用“永久随机数”方法抽取样本。首先对抽样框中的每个单位赋予一个“永久随机数”,然后在每一个最终层中将企业按照“永久随机数”从小到大排队,抽取h n 个最小永久随机数的企业作为第h 层的样本。
(5)确定权数
① 基础权数。目录企业样本的基础权数是该样本企业被选概率的倒数。
② 最终权数。根据检查是否存在重复企业、是否存在无回答有效样本企业、是否存在合并企业和分开企业等情况对相应的样本企业的基础权数进行调整,得到每个样本企业的最终权数。
(6)总量和方差估计
① 总量估计量:LE
Y ˆ=∑i i y w 式中:i w 为样本企业i 的最终权数;i y 是样本企业i 的指标y 的值。
② 子域总量估计量:LEd
Y ˆ,=∑d i i y w 式中,d 为要研究的子域(如行业等),i w 为样本企业i 的最终权数;i y 是样本企业i 的指标y 的值。 估计方差,采用STA TA 软件。
5.个体工业一阶段整群抽样设计
本部分的应用范围是全部个体经营工业单位,即个体工业子总体。
(1)整理抽样框
个体工业一阶段整群抽样框,包括全市范围内所有的村委会(居委会)(以下简称村),既包括有个体工业单位的村,也包括没有个体工业单位的村。抽样框的内容包括:村名称、地址代码、村内个体工业单位数和营业收入等信息,对于没有个体工业单位的村来说,个体工业单位数和营业收入为“0”。
(2)划分虚拟村
为了减少调查工作量,可将具有较多个体工业单位的村,分成若干个“虚拟村”,分成多少个“虚拟村”,由现场调查时所能承担的工作量决定。划分“虚拟村”的个体工业单位数量界限,由实际情况确定。在完成“虚拟村”划分操作之后,抽样框的组成单位就不是实际意义上的村了,为了便于区别,以下称之为初级抽样单位(简称PSU )。
如果抽中了某个“虚拟村”作为样本,在实际调查时,先将该“虚拟村”所在的行政村中所有的个体工业单位列出名单,按照随机原则从名单中抽出相应数量的个体工业单位作为“虚拟村”的组成单位,并对这些被选中的个体工业单位进行调查,收集调查资料。
(3)确定样本量
国家样本由国家统计局工交司分配的企业样本量和总体总量指标精度要求,计算确定样本量;地方样本按照国家的方法,根据各区县规模以下工业的具体特点,由北京调查总队确定样本量。
(4)分层及样本在各层之间的分配
抽样框中含有规模信息的区县将全部PSU 按照规模——个体营业收入分层。分层数量灵活掌握,分层界限采用累计平方根法确定,还可按区域进行分层,按照规模较大层的抽样比较大的原则进行样本分配。
(5)抽取样本
采用“永久随机数”方法抽取样本。首先对抽样框中每个单位赋予一个随机数,然后在每一个最终层中将