第二章数据的收集与整理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

将总体各单位按某个标志分成若干组, 列出各组的总体单位数或各组在总体中 所占的比重而形成的数列
构成要素
分组标志的具体表现 各组的次数或频率
分 品质数列 类 变量数列
单项数列 组距数列
等距数列 异距数列
2-42
变量数列的编制
指每个组值只用一个具体的变量值 单项数列 表现的数列
编制条件:
变量是离散变量 变量的不同取值个数较少
容易控②制影,响他人健③康浪费钱财 关系紧张不易控制,
但不易③全浪面费钱财 ④容易引起火灾
但内容丰富
④容易引起火⑤灾破坏家庭团结
⑤破坏家庭团结
⑥其他

2-15 问卷设计的基本要求:
主题明确 提问科学 逻辑性强 容量适度
问题的提出要紧扣主题
问句和标准答案要易于理解 和回答 先易后难、先封闭后开放、 先基本问题后派生问题
工人数(人) f
3 5 6 4 3 2 1
24
2-44
变量数列的编制
组距数列
指每个组的变量值用一个区 间来表现的变量数列
编制条件:
变量是连续变量;
或:总体单位数较多,变量不同取值个数
也较多的离散变量。
等距数列 变量值变动区间的长度相等 异距数列 变量值变动区间的长度不完全相等
2-45
相关概念
指每组两端表示各组界限的变量值,各组 组限 的最小值为下限,最大值为上限
2-7
返回
2-8
统计调查方案的设计
统计调查方案:用来指导整个调查工作的纲领性 文件,是统计设计在统计调查阶段的具体化
组织调查之前统计调查方案的设计内容:
1、明确调查目的(为什么调查?)
2、确定调查对象和调查单位(调查谁?)
3、确定调查项目(调查什么?)
4、调查表与问卷设计
5、确定调查时间和调查期限
2-33
2 数据的整理
数据整理的内容
数据的审定;数据的分组;统计资料汇总; 编制统计表;统计图
审核原始资料
分组, 分布数列
汇总
统计表
统计图
2-34
数据的审定
数据审定的目的:
保证资料的准确性,尽可能地缩小调查误差
登记误差&代表性误差
登记误差:由于调查过程中各有关环节失误 造成的 代表性误差:由于非全面调查的部分单位不 能反映总体的性质造成的
调查问卷的基本格式:
说明词:解释调查意
表头
义、表达感激之情等
主题问句:被调查者
表体
基本情况、调查项目
表脚
作业记录:时间、操
作者等
2-14 调查问卷的问题类型:
封闭式问您题认为吸烟有开哪放式问题
些害处? 您哪认些为害吸处烟 ?①有危害自身健您 哪康认 些为 害吸 处烟?有
①危害自身健②康影响他人健康容易造成人际
方式:一次性调查;专门设计和备配人员现场调查。 经常性调查;同报表制度结合,用统计报表 调查。
特点: 能以较少的投入和较快的速度取得总体基 本情况及变动趋势的资料;只适用于客观 存在重点单位的情况
2-23
典型调查(model survey)
概念:在全面分析的基础上,有意识地选择代表性的 典型单位进行现场调查。
例:上海市按GDP计算的三次产业结构(%)
1980年 1990年 1996年 1997年
GDP
100
100
100
100
ຫໍສະໝຸດ Baidu第一产业 3.2
4.3
2.5
2.3
第二产业 75.7 63.8
54.5 52.2
第三产业 21.1 31.9
43.0 45.5
2005年 100 0.9 48.6 50.5
2-38
同时 具备
【例】己知某车间有24名工人,他们的日产量(件)分别是: 20,23,20,24,23,21,22,25,26,20,21,21,22, 22,23,22,22,24,25,21,22,21,24,23.要求根据以 上资料编制变量数列。
2-43
编制结果如下:
日产量(件)X
20 21 22 23 24 25 26 合计
2-26
统计调查的组织方式
总体单位 调查单位
2-27
统计调查的组织方式
报表制度
总体单位
调查单位
可以全面调查,但 通常是调查限定规 模以上的总体单位
2-28
统计调查的组织方式
普查
总体单位 调查单位
对全部单位 进行调查
2-29
统计调查的组织方式
重点调查
总体单位
调查单位
只调查重点单位(单位 数不多但其标志量占标 志总量比重较大的单位)
任务:为研究某种特殊的社会经济问题,搜集详细 的第一手资料,借以认识事物的本质特征、 因果关系、变化趋势。为理论和政策性问题 研究提供依据。
作用:适宜于研究处于萌芽状态事物和倾向性问题; 一定条件下能估计总体指标数值;可以补充 全面调查的不足;
方法:解剖麻雀; 划类选典
2-24
抽样调查(sampling survey)
原则: 规定统一的标准时点。
规定统一的普查期限。 规定调查的项目和指标。
2-22
重点调查(key point survey)
概念: 在总体中选择个别或部分重点单位进行调查。
重点单位指在总体中有举足轻重地位的单位, 其标志值在总体标志总量中占有绝大比重。
任务:及时了解总体基本情况,为主管部门指导工 作服务。
按收入分组(元) <200 <300 <400 <500 <600 <800 <1000 恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6
2-39
统计分组的程序与原则
选择分组 标志
确定分组 体系
总体单位 归类
科学性:组 间差异大, 组内差异小。
完备性和互斥性: 每个单位均能且只 能归到某个组中。
统计分组的作用
作用3:分析现象之间的依存关系 社会经济现象之间存在着广泛的相互联系和制约 关系。其中比较广泛和紧密的一种联系就是现象之 间的依存关系。 研究现象之间依存关系的方法很多,如相关与回 归分析法、指数因素分析法、分组分析法等,其中 统计分组分析法是最基本的方法,是其他分析方法 的基础。
例:中国农民家庭按收入分组的恩格尔系数(1984年)
经常性调查 一次性调查
普查 重点调查 典型调查 抽样调查
2-19
统计调查的组织形式
全 面 调
统计报表 制度化的

查 经常性调查

重点调查
非 全 面 调
典型调查
专门组织的 一次性调查
抽样调查

2-20
统计报表制度(statistical report forms)
概念: 由政府部门组织,采用统一的表格,自 上而下布置,自下而上报告。
重要性:
统计调查是整个统计认识活动的基础,
决定着统计认识过程及其结果的成败
主要包含如下三方面的内容: 统计调查方案的设计 统计调查方法 统计调查的组织形式
2-5
次级资料的主要收集渠道:
⒈查阅公开出版物; ⒉向政府统计机构咨询; ⒊向其他机构咨询; ⒋网上查询。
2-6
常用的统计数据来源
美国经济分析局www.bea.doc.gov 美国人口普查局www.census.gov 美联储经济数据库www.stls.frb.org/fred 中国国家统计局www.stats.gov.cn 上海市统计局www.stats-sh.gov.cn 世界银行www.worldbank.org 国际货币基金组织www.imf.org OECD www.oecd.org
• 问题设计(Formulating Questions)
– 语言简明易懂,避免含糊其词 – 考虑完备而避免重复
2-17
调查单位中吸 ⒈您是否吸烟(如果选②,则跳烟过人2所、占3比题例)
①吸烟 ②不吸
吸烟人群日吸
⒉您每天大约吸多少支烟
烟数量情况
①5支以下 ②5-10支 ③10-吸15烟支人群吸烟
④15-20
2-36
统计分组的作用
作用1:划分现象的类型 社会经济现象中存在复杂多样的类型,不同 类型的现象具有不同的特点和发展规律。
25%
33%
分组前
分组后
42%
2-37
统计分组的作用
作用2:揭示现象内部结构 对现象分组后的数据可以反映现象内部结构的特点; 结合时间的推移进行分析,可以认识现象发展变化的规律性
2-35
数据分组
统计分组
将统计总体中所有单位按一定的标 志分为性质不同但又有联系的若干
部分的过程
统计分组的作用:
划分社会经济现象的类型 反映社会经济现象的内部结构和比例关系 揭示社会经济现象之间的相互依存关系
总体经过分组,能够突出组与组之间的差异 而抽象掉组内各单位之间的差异,使数据变 得条理化,便于进一步分析研究。
任务: 搜集国民经济和社会发展基本情况的资 料,为制订国民经济和社会发展计划和 检查计划执行情况服务。
优点: 能保证统计资料的全面性和统一性 能保证统计资料的连续性和及时性 能满足各级部门对统计资料的需要
缺点: 统计报表过多会增加基层负担 有可能由于虚报瞒报而影响统计资料质量
2-21
普查(census)
以不超过20分钟为宜
2-16
问卷设计
Questionnaire Design
• 问卷的长度(Questionnaire Length)
– 尽可能简短,只保留调查所必须的关键问题
• 调查方式(Mode of Response)
– 面谈 – 电话访问 – 信函调查
回答率较高,费用较高 居中
回答率较低,费用较低
特点: 1 (随机抽样)按照随机原则从总体种选择样本; 2 以样本指标(统计量)为依据,推断总体参数 或进行假设检验; 3 抽样误差可以事先计算并加以控制。 作用: 在自然科学和社会科学中具有广泛应用 不可能全面调查的(无限总体;破坏性实验) 不必要全面调查的(经济性)
2-25
抽样调查的组织方式
1 简单随机抽样; 2 分层抽样; 3 系统抽样; 4 整群抽样;
2-30
统计调查的组织方式
典型调查
总体单位
调查单位
对典型单位进行调 查,典型单位的选 择并不一定按规模
2-31
统计调查的组织方式
抽样调查
总体单位
调查单位
按随机原则选择调 查单位,各单位被 选中的机会相同。
2-32
我国统计调查方法体系改革的目标模式是:
建立以周期性普查为基础,以经 常性的抽样调查为主体,以必要 的统计报表、重点调查和科学的 推断为辅助手段的调查方法体系 模式
每组变量值变动区间的长度,为上下限 组距 之差
组中值
每组变量取值范围的中点数值
上限下限
组中值=
2
2-46
某地区100个百货商店 月销售额与流通费用情况
上组限U(销万售元额) (商数个店)=10如每 销 付0-:百 售 的 (50组元 额 流 元=距5商中通)0d(品支费=万U-元L )
浓缩简化
统计分析
描述性分析 推断分析、 决策分析。 要求:定性 定量结合
2-3
试验
数据来源
Data Sources
数据 来源
直接来源
间接来源
问卷调查
观察
出版物 (或者网上)
2-4
1 数据的收集
1.1 数据的来源
原始数据和次级数据
1.2 统计调查
统计调查是统计资料收集的主要形式,是统计工作过程的
第一阶段。
⑤20-25支 ⑥2历5支史以情上况
⒊您的吸烟历史大约有多长 调查对象对吸 ①1年以下 ②1-5年 ③5-10年 烟④的1看0年法以上
⒋您是否认为吸烟有害健康(请写出理由)
返回
2-18
统计调查的种类
按调查单位的范围大小分为
按调查时间是否连续分为 按调查的组织方式不同分为
统计报表 专门调查
非全面调查 全面调查
2S-1t a t i s t i c s
第二章 数据的收集和整理
2
通过本章的学习,我们应该知道: 1. 数据来源 2. 数据是如何收集的 3. 数据是如何整理的 4. 如何做次数分布表
2-2
统计工作的三个中心阶段
统计调查
统计整理
有组织、 有计划地 搜集资料。 要求:准确、 完整、及时
对调查资料 去伪存真、 去粗取精、 科学分类、
概念: 指国家为详尽了解某项重要的国情国力 而专门组织的一次性全面调查 建立专门机构,配备专门人员调查。
任务:搜集重要的国情国力和资源状况的全面资 料,为政府制定规划、方针政策提供依据。 利用基层单位原始记录和核算资料发表调查。
特点:工作量大,时间性强,需要大量人力和财力。 特别领域,专门组织;一次性;全面性
2-40
统计分组的种类
根据分组标志的个数分类: 简单分组:仅按照一个标志进行分组 复合分组:按照两个或两个以上的标志进行层叠分组 分组体系:一系列相互联系相互补充的标志进行多种分组
根据分组标志的性质分类: 品质标志分组:如上市公司的行业分类;学生的成绩评定 数量标志分组:
2-41
3 次数分布
分布数列
返回
6、制定调查的组织实施计划
2-9
统计调查方法
现场观察法
报告法 问卷法 访谈法 实验采集法
被调查者受调 查者的强制与
约束
调查者与被调 查者平等合作
2-10
现场观察法
2-11
报告法
调查者 强制、约束
2-12
访问调查
调查者
平等合作
被调查者
返回
2-13
问卷调查
主要指非政府性统计机构或个人所 从事的对人的主观意见的调查工作, 也称作民意调查或民意测验
相关文档
最新文档