统计学第二章数据搜集整理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
1、不可能或不必要进行全面调查的社会现象,采用 抽样调查; 2、对普查资料进行必要的修正。
11
• 3.重点调查
• 重点调查:在调查对象中,只选择一部分重点单位进 行的非全面调查。 • 重点单位:它们在所研究现象的标志总量中占有绝大 的比重,在总体中具有举足轻重的作用。对这些单位 进行调查,能够从数量上反映整个总体在该标志总量 方面的基本情况。 • 调查方式:重点调查资料的搜集主要是通过组织专门 力量 , 对重单位进行调查 , 有时也可以颁发统计报表由 重点单位填报。 • 重点调查的特点:调查单位较少,但可调查较多的项目 和指标,可以了解较详细的情况,节省人力、物力和 时间,但无法对现象总体的数量特征作出准确的推算, 也无法测算调查误差。 • 适用场合:当调查任务只要求掌握基本情况,而部分 单位又能比较集中地反映研究的项目。 • 例如:石油年产量,中石油,中石化
12
4.统计报表制度
• 统计报表制度:依照国家有关法规,自上而下地统一 布置,以一定的原始记录为依据, • 按照统一的表式,统一的指标项目,统一的报送时间 和报送程序,自下而上地逐级地定期提供统计资料的 一种调查方式。 • 统计报表的主要特点: • 1、报表资料的来源是建立在各个基层单位的原始记 录的基础上; • 2、由于统计报表是逐级上报和汇总的,各级领导部门能获得
统计学导论
第二章 统计数据的搜集、 整理与显示
• 第一节 统计数据的搜集 • 第二节 统计数据的整理 • 第三节 统计数据的显示
2
第一节 统计数据的搜集
一、统计数据的搜集方法 1.统计数据搜集的概念
根据统计研究预定的目的和任务,运用科学 的方法与手段,有计划、有组织地向客观实 际采集数据的过程.
国研网
中国经济信息网 中国经济时报网
www.drcnet
17
第二节 统计数据的整理
一 二
数据整理概述
统计分组基本理论 统计分组的原则和方法 频数分布
累计频数与累计频率
18
三
四 五
一、数据整理概述
1.数据整理的含义
– 对统计调查所搜集到的各种数据进行分类和汇总, 又称为汇总性整理。 2.统计数据整理的内容 (1)如何对所要研究的总体进行统计分组; (2)确定汇总哪些统计指标。 3. 数据整理的程序 • 统计资料的审核(数据完整性和准确性) • 资料的分组和汇总(分组归类,综合汇总) • 编制统计表或绘制统计图 • 统计数据资料的积累、保管和公布
4
直接观察法 由调查人员到现场直接对调查对象进行观察点数和计量 报告法(通讯法) 由统计工作机构将调查表格分发或电传给被调查者,被 调查者根据填报的要求将填好的调查表格寄回。 采访法
根据被调查者的答复来收集统计资料,分为口头询问法 和被调查者自填法。口头询问法由调查人员对被调查者 逐一采访当面填写。被调查者自填法,调查人员把调查 表交给被调查者,由被调查者按照实际情况填写,然后 交给调查人员审核收回。 登记法 由有关的机构发出通告,规定当事人在某事发生后到该 机构进行登记,填写所需登记的资料。如人口的出生、 死亡、流动人口
20
简单分组 • 大学 • 中学 • 小学
21
复合分组
• 大学 • • 中学 • • 小学 • 男生 女生 男生 女生 男生 女生
22
平行分组 • 大学 • 中学 • 小学
23
男生 女生
三、统计分组的原则和方法
1.统计分组的原则 – 穷尽原则 : 使总体中的每一个单位都应有组可归, 或者说各分组的空间足以容纳总体所有的单位。
• 1- 6 • 7-12 • 13-18
28
(2)组数 (3)
当连续型变量按离散型变量表示时,组距数列的编制采 用相邻组限不重叠的形式。例如年龄,17~19,20~22 19岁以上不到20岁属于第一组,组距为3,组中值分别为 18.5和21.5
(4)开口组的组距与组中值 • 2000以下 1500 • 2000 -3000 2500 • 3000 -4000 3500 • 4000 以上 4500
5
二、统计调查方式
按照统计范围可分为: 全面调查和非全面调查 按照时间标志可分为: 连续调查和不连续调查
6
常用的统计调查 方式 1.普查 2.抽样调查 3.重点调查 4.统计报表制度
7
1.普查
• 普查:是专门组织的一种全面调查,它主要是用以 搜集某些不能或不宜用定期报表搜集的统计资料。 对国情国力的调查一般采用普查。
分布数列分为: • 按品质标志分组所形成的数列叫做品质(分布)数列; • 按数量标志分组所形成的数列叫做变量(分布)数列。
31
(2)分布数列的两个要素 a)总体按某标志所分的组,若总体按数量标志分组, 分组标志在各组有不同的数量表现,形成标志值数 列,亦称变量,一般用x 表示; b)各组所出现的单位数,即频数,亦称次数,用f 表示。 3.相关的概念 (1)频率
调查时间是指调查资料所属的时间,在统计调查中, 如果所调查的是时期现象,就要明确规定调查资料所 反映的起止日期。如果所要调查的是时点现象,调查 时间就是规定的统一标准时点。调查期限是进行调查 工作的时限,包括搜集资料和报送资料的工作所需的 时间。 时期数据(流量指标,第一季度销售额),时点数据 (存量指标)
• 普查的特点:非经常性、全面调查、比任何一种调 查形式更能掌握大量、详细、全面的统计资料。 • 普查的组织方式:
• 1、组织专门普查机构 ,自上而下地配备一定数量的普查人员 , 对调查单位直接进行登记。 • 2、利用调查单位原始记录和核算资料 , 通过向调查单位发放 调查表格,由调查单位填报进行调查。 8
19
二、统计分组基本理论
1.统计分组的概念 根据统计研究的目的和客观现象的内在特点,按 某个或几个品质标志或数量标志把被研究的总体划分 为若干个不同性质的组,称为统计分组。 2.分组的性质 – 兼有分和合双重含义 , 对于现象总体,是“分”, 对于单位,是“合”。 – 如英语课和数学课分快慢班 3.统计分组的种类 – (1 )按分组标志的多少,分为简单分组和复合分 组,平行分组体系. – ( 2 )按分组的标志的性质不同,分为品质分组 (或称属性分组)和数量分组(或称变量分组)。 关键:服从研究任务需要,反映总体本质特征
34
第三节 统计数据的显示 一 统计表
管辖范围内的报表资料; • 3、是一种经常性的(连续性)调查,调查项目相对稳定,有 利于积累资料,并进行动态对比分析。
13
三、统计调查体系
• 统计调查体系:一个国家开展统计调查方法 和制度的总称。 • 我国的统计调查体系:
建立以必要的周期性的普查为基础,经常性的抽样 调查为主体,同时辅之以重点调查、科学推算和部 分全面报表综合运用的统计调查方法体系。
14
四、统计调查方案的设计
〈一〉明确调查目的 〈二〉确定调查对象和调查单位
调查对象,是指需要调查的现象总体。
调查单位,是指所要调查的具体单位,标志承担着。
报告单位,亦称填报单位,它是负责向上报告调查 内容、提交统计资料的单位。报告单位一般是在 行政上、经济上具有一定独立性的单位。
15
〈三〉设计调查项目(计算口径,工资,亿美元) 〈四〉设计调查表格和问卷 〈五〉确定调查时间
2.统计数据搜集的方式
一种是直接向调查对象搜集反映调查单位 的统计数据(或称原始资料);另一种是搜 集已经加工、整理过的、说明总体现象的数 据(一般称为二手资料)。
3
3.统计数据的分类
– 按其性质不同分为调查数据和试验数据
4.统计数据的搜集方法
– 常用的方法有直接观察法、报告法(通讯 法)、采访法、登记法等。
9
2.抽样调查
• 抽样调查是一种非全面调查,抽样调查可以分为概率抽样 和非概率抽样。 • 非概率抽样:调查者根据自己的方便或主观判断抽取样本 的方法。它不是严格按随机抽样原则来抽取样本,所以失 去了大数定律的存在基础,也就无法确定抽样误差,无法 正确地说明样本的统计值在多大程度上适合于总体。虽然 根据样本调查的结果也可在一定程度上说明总体的性质, 特征,但不能从数量上推断总体。非概率抽样主要有偶遇 抽样(街头调查),主观抽样,定额抽样,滚雪球抽样等 类型。 • 概率抽样:按随机原则从调查对象中抽取一部分单位作为 样本进行观察,然后根据样本数据去推算调查对象的总体 特征。
– 互斥原则 : 就是在特定的分组标志下,总体中的 任何一个单位的只能归属于某一组,而不能同时 或可能归属于几个组。
24
统计分组的原则
• 3,5,6,7,8,8,9,10
• 2–4 • 5–7 • 8 – 10
正确
4–6 7–9
未穷尽
2–6 5–8 7 – 10
未互斥
25Leabharlann 2.统计分组的方法 (1)品质分组: 按品质标志分组 (2)数量分组: 按数量标志分组 (A)单项式分组(离散标志)与组距式分组 (B)间断组距式分组和连续组距式分组 “上限在不内”原则,凡是总体某一个单位的变 量值是相邻两组的界限值,这一个单位归入作 为下限值的那一组内。 (C)等距分组与异距分组 26
33
fi
1 fi
五、累计频数与累计频率
• 1.向上累计频数(或频率) a) 列出各组上限,由标志值低的组向标志值高的组一次累 计。 b) 表示某组上限以下的各组单位数之和是多少。 c) 向上累计频率表示某组上限以下的各组单位数之和占总 体单位数的比重。 • 2.向下累计频数(或频率) a) 列出各组下限,由标志值高的组向标志值低的组一次累 计。 b) 表示某组下限以上的各组单位数之和是多少。 c) 向下累计频率表示某组下限以上的各组单位数之和占总 体单位数的比重。
〈六〉组织实施调查计划 〈七〉调查报告的撰写
16
五、二手资料的主要来源渠道
1.统计年鉴 《中国统计年鉴》、《国际统计年鉴》、地方和专业 统计年鉴、《中国统计摘要》 2.有关期刊 《中国经济景气预报》、《中国经济数据分析》、 《经济预测分析》 3.有关网站 中国统计信息网
单项式分组与组距式分组
• 获得奖学金次数 • 单项式分组 间断组距式分组 • 0 • 1 0–2 1–2 • 2 • 3 3–4 3–4 • 4 连续组距式分组 • 1000 -2000 • 2000 -3000 • 3000 -4000 • 4000 -5000
27
3.组距式分组的相关概念
(1)组距 连续组距分组的组距=本组上限–本组下限 间断式组距且等距分组的条件下: 组距=本组上限–前组上限 =本组下限–前组下限 =本组上限–本组下限+1