中国家庭金融调查收入分配报告20131120
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
农村家庭收入分布比较:人均可支配收入
国家统计局
CHFS
全国
最低20% 20%—40%
5,919
1,870 3,621
9,760
1,044 2,935
40%—60%
60%—80% 最高20%
5,222
收入分布不均报告内部交流
中国家庭金融调查与研究中心 2013年11月20
1
内容介绍
建立中国基础数据库重要性 CHFS数据代表性 部分研究成果简介
2
建设基础数据的重要性
http://www.chfsdata.org
数据库建设的意义
数据库建设的初衷是为学术界提供一个基础数据库
后来的发展让我们认识到数据库建设的意义不仅仅如此 中国缺乏对国情的了解 已有的数据缺乏验证 数据库对老百姓也有用
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
22
录音核查
对每个访员的第一份回传录音都进行录音核查, 以便发现访问中的问题。 访问前期对回传录音,随机抽取5%-10%进行录音 核查。 访问后期,对传回的每份录音均进行核查。
http://chfs.swufe.edu.cn/
人口年龄结构比较
1.6 4.3 7.5 12 17.3 16.2 17.1 13.1 11
8070-79 60-69 50-59 40-49 30-39 20-29 10-19 0-9
2.3 5.4 10.3 14 17.2 15.2 15.9 10.4 9.3
18
16
14
12
10
8
6
各年龄组人口占比(%)
全国 最低20% 20%—40%
40%—60% 60%—80% 80%—90% 最高10%
统计局 19,109
CHFS
25,730 2,218 7,515
11,942 19,316 34,139 136,437
7,617 12,702
17,224 23,189 31,044 51,432
城镇家庭人均可支配收入高于国家统计局34.6%
60
http://www.chfsdata.org
中国家庭金融调查数据库
基础数据库
人口特征与就业 资产与负债 非金融资产 生产经营项目 土地与房产 汽车 其他非金融资产 金融资产 社会与商业保险 支出与非劳动收入
http://www.chfsdata.org
国家统计局 (2013年1月19日)
全国: 0.481
农村家庭:
、
0.61
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
数据与老百姓息息相关
全国住房空置率:15.5% 向市场提供及时精准信息:形成正常的房价预期 增大这方面的调查力度,及时完整地公布所得信息 鼓励支持民间调查机构相互印证和补充
http://www.chfsdata.org
23
数据核查
对下列情况进行识别,并核实是否为访问异常 访问时间少于30分钟 有效题量小于200 不知道比例大于5% 有效记录过少
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
24
是否有代表性?与统计局数据比较
2010年世界基尼系数平均值:0.44
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
为什么比统计局高?
收入分布比较
主要高收入阶层收入差别导致
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
城镇家庭收入分布比较:人均可支配收入
公务员
党员数
689.4万(2010年)
8260万
709万
8200万
0.97
1.01
http://www.chfsdata.org
27
中国家庭收入差距
中国基尼系数偏高
2012年12月9日 全国:0.61 城镇家庭: 0.58 国家统计局 (2013年1月19日) 全国: 0.481
农村家庭: 0.61
http://www.chfsdata.org
样本量是否足够大?
• 如果用8438户来推断总体均值,抽样误 差约是总体标准差的1%。
– CHFS(2011) 家庭平均收入59174.05 ,标准差 206481 – 1000户,抽样误差:6529元(11%) – 8438户,抽样误差:2247(3.8%) – 28000户,抽样误差:1233(2.1%)
是否高估富有家庭收入? 城镇最富有的10%家庭: 国家统计局(估计):家庭年收入超过55,000元 CHFS:家庭年收入超过146,519元
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
为什么比统计局高?
统计口径差别 主要高收入阶层差别导致
人口统计学信息比较
指标 城市人口比例 家庭规模 平均年龄 男性比例 城市 农村 国家统计局 0.513 0.342 2.89 3.98 36.87 0.514 CHFS 0.497(按常住地) 0.360(按户口) 3.04 3.78 38.96 0.505
http://www.chfsdata.org
http://www.chfsdata.org
季度电话回访
获得受访户的电话号码作为季度电话回访(CATI)之用 CATI问卷包括: 对银行存款利率、物价指数、房屋市值、股票指数等方 面的预期 就业状况 金融市场的参与和盈亏状况 资产:房屋市值、借贷、车辆、债务 收入与消费 农村金融发展方面的指标
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
质量控制流程图
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
20
多次问卷测试
Focus Group:邀请不同年龄、学历、专业背景、行业的 人作为受访者,与经过专业培训的访员进行面对面的访 问和沟通。访问结束后,以座谈会的形式收集大家对问 卷的意见和建议。
7,441 14,050
5,225
8,237 27,790
农村家庭人均可支配收入高于国家统计局64.9%。
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
CHFS家庭收入分布
分位数 城镇 农村 全国 25% 19,729 8,647 12,620 50% 39,560 20,188 29,800 90% 146,519 69,510 109,500 95% 232,200 93,300 180,396 99% 686,000 29,7645 559,200
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
季度电话回访
2012年4月、7月成功实施了两轮季度电话回访(CATI)。
CATI系统优势:
对中国家庭经济状况的及时反映。
迅速建立起追踪数据库。
http://chfs.swufe.edu.cn/
4,860,000
2,360,000
平均资产247万
77%家庭炒股不赚钱 小学学历股市参与率
34,700,000
9,590,000 2,290,000
23,700,000
517,000 1,280,000
城市户口,中位数只有40.5万
已有的关键数据也缺乏验证
基尼系数
2012年12月9日
全国:0.61 城镇家庭: 0.58
6
8
10
12
14
16
18
人口普查2010
CHFS2011
http://www.chfsdata.org
其他信息比较
官方数据 企业与个体工商户 总数 企业数 政府机关雇佣人数 5010万 1253万 1181万(2009年) CHFS (2011年) 官方数据/ CHFS 5841万 786万 1236万 0.858 1.59 0.96
http://www.chfsdata.org
4
中国社会缺乏对国情的基本了解
2012年5月20日(5月13日数据发布一周后)关键词搜索量
关键词 中国家庭金融调查报告 自有住房拥有率/自有住房拥有率9成 第一套房产收益300% 百度 1,570,000 谷歌 4,420,000
4,860,000
1,690,000
预调查:在前期绘过图的社区随机抽部分受访者,进行 实地访问,访问结束后收集受访者对问卷的意见和建议。 访员和绘图员培训期间,鼓励学生发现问卷的问题并进 一步完善问卷。
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
21
严格控制样本更换
下列情况才允许更换样本 在不同日期不同时间段拒访3次后(至少一次晚上 拒访) 6次无人应答(其中至少一次有社区联络人陪同) 经核实后地址错误的 经核实后为空户的 受访者身体原因无法访问的
http://www.chfsdata.org
质量控制与数据代表性
数据代表性关键
• • •
随机误差——抽样是否随机 测量误差——质控 从这两方面来看,CHFS数据样本量足够,抽样随机,质控严格,有很好的代表性
http://www.chfsdata.org
样本量是否足够大?
统计分析的结果是否能反映总体的真实情况取决于样本是否随机、模型是 否正确、计算有没有错误以及对模型的分析是否用了恰当的方法。 限于经费和时间的限制,样本是从总体中抽取的很小部分,样本的随机性 才是关键。100万的样本相对于13亿人,也仅仅是千分之一。 样本量的大小,既不是“能很好反映总体情况”的必要条件,也不是充分条 件。 样本量大小的真正作用是决定统计分析结果的误差。至于样本量需要多大, 这与需要反映的总体标准差有关。 如果用8438户来推断总体均值,抽样误差约是总体标准差的1%。
http://www.chfsdata.org
低拒访率
调查项目 时间 拒访率 总体:11.6% CHFS 2011 城市:16.5%
农村:3.2%
美国消费者金融调 查 (SCF) 普通样本:30% 2010 富裕样本:67%
http://www.chfsdata.org
20Fra Baidu bibliotek3年调查拒访率统计
总样本:10.86% 城市:15.39% 农村:0.87% 2013年新样本:12.59% 城市:17.44% 农村:0.94% 2011年成功接触的老样本:5.44% 城市:8.19% 农村:0.71% 2013年追访率(接触):82.13% 2013年追访成功率:77.66%
剔除收入最低0.5%样本 剔除收入最低5%样本 剔除收入最高0.5%样本
全国 0.603 0.586 0.564
城镇 0.574 0.560 0.541
农村 0.603 0.581 0.541
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
如何解读高基尼系数
金融资产 支票 活期存款 股票 债券 基金 金融衍生品 金融理财产品 非人民币资产 黄金 现金 借出款
http://www.chfsdata.org
抽样与实施
CHFS2011:将全国2,585县/区按人均GDP分成10组,每组随机抽 取8个县/区。每个县/区随机抽取4个社区(居委会、村委会)。 到社区以后就没有任何信息。成功获得8,438户及29,450个人信 息。 CHFS2013:2011年老样本回访基础上增加新样本。在各省采取 对称抽样的方式,抽取新的区县,以获得省一级代表性。 • 29个省,226个区县,28228户。 • 全国除新疆、西藏、港澳台之外,每个省都具有代表性。 • 成都、武汉具有代表性
高基尼系数是市场资源有效配置的自然结果
• 市场经济发达的东部地区基尼系数最高,相反西部最低。
东部地区:
0.60
中部地区:
西部地区:
0.56
0.54
http://chfs.swufe.edu.cn/
http://www.chfsdata.org
垄断行业不是造成高基尼系数的主要原因
总体 所有家庭 不包括公务员家庭 不包括垄断行业家庭 不包括公务员和垄断行业家庭 0.61 0.58 0.57 0.58 城镇 0.58 0.56 0.55 0.55 农村 0.61 0.58 0.57 0.57