第三期中国妇女社会地位调查抽样设计方案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
初级单元抽样框的划分
p 北京、天津、上海街道、乡镇总计773个初级抽样单元 p 其他28个省(自治区、直辖市)共有县级行政单位(区、
县级市、县)2803个初级抽样单元 p 甘肃省的酒泉市、广东省的中山市和东莞市、海南省的三
亚市都为不设县级行政单位的地级市,这4个地级市与以 上2803个县级行政单位等同视为一级抽样单元 p 据此,全国共有初级抽样单元3580个
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
抽样设计的原则(一)
p 全国性大规模抽样调查,抽样方案设计必须是严格的 概率抽样。
p 抽取样本用以满足全国目标量估计的需求;对需要进 行单独分析的省(自治区、直辖市),在全国样本的 基础上进行样本追加用以满足省级目标量的估计。
PPT文档演模板
抽样框一的样本抽取
•直辖市抽样框一的样本初级单元分配
域 大 类 小 层 人口规模 初级单元数 样本单元数
北 京 9527314
135
27
街 道 天 津 5897405
107
21
直
上 海 12165550
101
27
辖
市
北 京 2795486
182
10
乡 镇 天 津 3845337
136
8
上 海 1744877
第三期中国妇女社会地位调查抽样设 计方案
抽样设计的原则(二)
p 抽样设计既有利于提高抽样效率,也为开展妇女社会 地位与层间经济社会综合发展水平差异的相关性研究 奠定基础;同时,还保证本期调查结果能够满足多领 域分析的需求,如从城乡差异、不同地区经济发展水 平差异等多角度进行对比分析。
PPT文档演模板
东部域抽样框二的分层
域
人口密 度
大类
人
大于等 口
于600 密
人/平方 度
千米 一
东
类
部
域
人
小于 口
600人/ 密
平方千 度
米二
类
PPT文档演模板
合计
—
初级单元数 量
398
438 836
城市化水 平
小层
初级单元数 量
95%及以上 一类区县
126
65%~95% 二类区县
65
35%~65% 三类区县
66
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
抽样框一的样本量
p 对于北京、天津、上海三个直辖市的街道、乡镇初级抽样 单元总计773个。为了使抽取的样本初级单元相对分散, 提高该层的抽样效率,按照每个样本初级单元抽2个居委 会(村委会)、每个样本居委会(村委会)抽15个家庭 户的原则,计算出抽样框一需抽取100个初级抽样单元 (街道、乡镇)。
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
抽样框的分层依据
p 同一抽样框内初级抽样单元之间由于所属行政地区的 经济发展水平、城乡差距等原因仍然具有较大的差异。 为了提高估计效率,需要在各域内进行再分层。
p 一方面,人口的聚集程度与社会发展水平紧密联系 p 另一方面,城市化水平(非农业人口占总人口比重)
112
7
合 计 —— 35975969
773
100
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
抽样框一的样本抽取
p 在各小层层内分别采用与各个街道(乡镇)人口规模成比 例的系统PPS抽样抽取街道(乡镇)
p 在入选的街道内采用与居委会人口规模成比例的系统 PPS抽样抽取2个的居委会;在入选的乡镇内采用与村委 会人口成比例的系统PPS抽样抽取2个村委会
大于等 于200人 /平方千
米
人口 密度 一类
中 部 域
小于200 人口 人/平方 密度
千米 二类
PPT文档演模板
—— 合计
西藏
392
612 73 1077
75%及以上 一类区县
60
45%~75% 二类区县
53
25%~45% 三类区县
62
15%~25% 四类区县
75
10%~15% 五类区县
90
10%及以下 六类区县
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
各个抽样框样本量的分配
地区
初级单 初级单元 元样本 抽样框 个数
二级单 元样本 个数
主问卷
样本家 回答人 庭户数 数
北京、天津、上海
抽样框一 100
辽宁、河北、山东、江苏 浙江、福建、广东、海南
抽样框二
126
黑龙江、吉林 山西、河南、安徽 湖北、湖南、江西
第三期中国妇女社会地 位调查抽样设计方案
PPT文档演模板
2020/12/6
第三期中国妇女社会地位调查抽样设 计方案
p 中国人民大学统计学院
中国人民大学统计学科始建于1950年,目前拥有统计学 全国重点学科,教育部人文社会科学重点研究基地“应用 统计科学研究中心”。统计学和风险管理与精算学两个博 士点,统计学、概率论与数理统计、风险管理与精算学、 流行病与卫生统计学四个硕士点,应用经济学下设统计学 博士后流动站
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
样本量及其分配
p 本期调查全国基本方案个人主问卷调查人数是 30000人,进行样本量分配时以个人主问卷数作为 各层样本量的分配依据,再根据制定的第二、三阶段 抽取的样本单元数标准,折算出需抽取的初级单元样 本量。
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
第三期中国妇女社会地位调查抽样设 计方案
抽样设计的原则(三)
p 本期调查仍然采用分层多阶段不等概率抽样,在各层 内,采用与人口规模成比例的不等概率抽样。对于北 京、天津、上海三个直辖市,选择街道、乡镇作为初 级抽样单元;对于其他省(自治区、直辖市),选择 区、县级市、县作为初级抽样单元。
PPT文档演模板
抽样框三 126
内蒙古、广西、重庆、四川
贵州、云南、西藏、陕西 抽样框四 108
甘肃、青海、宁夏、新疆
合计
——
460
200 3000 3000 630 9450 9450 630 9450 9450
540 8100 8100 2000 30000 30000
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
p 第二阶段抽样单元:居委会、村委会;
p 第三阶段抽样单元:家庭户。
p 家庭户中15岁及以上的家庭成员,随机抽出一人填
答个人主问卷;如果被抽中的是60岁及以上的老年
人,还需要填答老年人附卷;针对入选家庭户中年龄
在9~14岁的儿童,随机抽出一人填答儿童附卷。
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
p 在每个入选居委会或村委会内采用随机起点的等概率 系统抽样抽取15户
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
抽样框二的样本抽取
•抽样框二的样本初级单元分配
第三期中国妇女社会地位调查抽样设 计方案
初级单元抽样框的划分
p 根据国家统计局现行的统计上有关我国区域的划分标 准,全国31个省、直辖市、自治区(港、澳、台地 区除外)按照东中西的地域概念划分为三类地区(东、 中、西部地区)。
p 将北京、天津、上海单独作为直辖市域处理 p 重庆位于我国西部地区,直辖市区划设立较晚,作为
10%及以下 六类区县
33
75%及以上 一类区县
39
45%~75% 二类区县
38
25%~45% 三类区县
111
15%~25% 四类区县
184
10%~15% 五类区县
92
10%及以下 六类区县
15
—— 第三期中—国—妇女社会地位调查8抽9样4设
计方案
西部域抽样框四的分层
域 人口密度 大类 初级单元数量 城市化水平 小 层 初级单元数量
52
70%及以上 一类区县
24
40%~70% 二类区县
来自百度文库60
25%~40% 三类区县
97
15%~25% 四类区县
162
10%~15% 五类区县
156
10%及以下 六类区县
113
————
73
73
第三期中国妇女社会地位调查抽样设
计方案 1077
各级抽样单元的确定
p 第一阶段抽样单元:区、县级市、县(抽样框一为街 道、乡镇)。
人口 密度 一类
中
部
域 人口密
度小于 人口
400人/ 密度
平方千 二类
米
PPT文档演模板
合 计 ——
初级单元数量
415
479 894
城市化水平 小 层 初级单元数量
80%及以上 一类区县
99
50%~80% 二类区县
82
30%~50% 三类区县
26
15%~30% 四类区县
88
10%~15% 五类区县
87
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
p 金勇进教授
p 本次抽样设计团队
p 近年来承担全国性重大抽样设计项目
(1)中国公众科学素养调查设计与数据分析,中国科协, 2001-2010年共计五次。 (2)中国儿童青少年心理发育特征调查抽样设计及数据分析, 北京师范大学,2008年 (3)2009学生国际能力测评中国试测研究抽样设计与数据 分析,教育部考试中心,2009年
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
其他三个抽样框样本量
p 除去直辖市域的样本量3000人,剩余的27000人则作 为其他三个域抽样框的样本量。根据各域的人口规模按比 例进行分配。
p 在每个中选样本初级抽样单元抽取5个居委会或村委会, 每个样本居委会或村委会抽取15户,每户抽1人的原则; 折算出东部域抽样框二需抽取9450人、126个初级单元, 中部域抽样框三需抽取9450人、126个初级单元,西部 域抽样框四需抽取8100人、108个初级样本单元。
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
初级单元抽样框
p 直辖市域初级单元组成抽样框一,含773个初级抽样单元 p 东部域初级单元组成抽样框二,含836个初级抽样单元 p 中部域初级单元组成抽样框三,含894个初级抽样单元; p 西部域初级单元组成抽样框四,含1077个初级抽样单元
省对待
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
初级单元抽样框的分层
p 直辖市域:北京、天津、上海; p 东部域:辽宁、河北、山东、江苏、浙江、福建、
广东、海南; p 中部域:黑龙江、吉林、山西、河南、安徽、湖北、
湖南、江西; p 西部域:内蒙古、广西、重庆、四川、贵州、云南、
西藏、陕西、甘肃、青海、宁夏、新疆。
20%~35% 四类区县
81
20%及以下 五类区县
60
80%及以上 一类区县
25
50%~80% 二类区县
23
30%~50% 三类区县
108
20%~30% 四类区县
116
20%及以下 五类区县
166
836 —— 第三期中—国—妇女计社方会案地位调查抽样设
中部域抽样框三的分层
域 人口密度 大类
大于等 于400 人/平方 千米
这一指标能够反映我国各地区的经济发展差异
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
直辖市域抽样框一的分层
p 对于以街道、乡镇为初级抽样单元的抽样框一。 p 官方公开资料中并没有详细的街道、乡镇一级行政区
划的两项指标。 p 直辖市域的初级单元分层首先采用街道和乡镇的行政
区划,直接分为街道层和乡镇层两个大类;在每一大 类内再按所属直辖市依次分为北京、天津、上海三个 小层。抽样框一共被分为6个小层
各级抽样单元的抽取方法
p 第一阶段抽样中,采用与初级抽样单元人口规模成比例的 系统PPS抽样,在四个抽样框抽取初级抽样单元;
p 第二阶段抽样采用与入选区、县级市、县(北京、天津、 上海为街道、乡镇)内居委会或村委会人口规模成比例的 系统PPS抽样,在入选初级单元内抽取居委会或村委会;
p 第三阶段抽样在入选的居委会或村委会内采用简单系统抽 样抽取相同数量的家庭户。
东中西部域抽样框的分层
p 对于以区县(区、县级市和县)为初级抽样单元的其 他三个抽样框,先将各抽样框内的初级抽样单元根据 各自人口密度划分。人口密度较高的为一类层,较低 的为二类层。
p 在此基础上,根据上述两个大类内初级单元的城市化 水平,将区县进一步细分为若干小层
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
抽样框一的样本量
p 首先单独确定直辖市域抽样框的样本量,其他三个域再按 与人口规模成比例分配剩余样本量。
p 我们以估计简单随机抽样比例P时的样本量为基础,在 95%的置信度下按抽样绝对误差不超过4%的要求进行 计,设计效应取为2.5,所需样本量为1500人。如果进 行分性别或分城乡对比分析,直辖市层抽样框主问卷的最 终样本量确定为1500*2=3000人
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案
直辖市域抽样框一的分层
域 大类
直辖 市
街道 乡镇
合计
初级单元数量 343
430 773
小层 北京 天津 上海 北京 天津 上海 ————
初级单元数量 135 107 101 182 136 112 773
PPT文档演模板
第三期中国妇女社会地位调查抽样设 计方案