第二章 数据的收集
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我国于1953、1964、1982、1990、2000年进行过五次 人口普查。前四次都是以7月1日零时为标准时间。第一次 是为制定第一个五年计划,;第二次是在克服了严重困难 后,为制定第三个五年计划;第三次是在结束十年动乱, 为国家提供准确、详细人口数据;第四次是为制定“八五” 计划,;第五次是为制定人口政策,实现人口与资源环境 的协调发展,以2000年11月1日零时为标准时间进行了第 五次人口普查。 国务院决定于2010年11月1日零时为标准时间开展第六次 人口普查。其主要目的是查清我国人口在数量、结构、地 区分布、受教育程度、迁移流动和居住环境等方面的变化 情况,为编制“十二五”规划提供科学准确的统计信息
分组标志的选择
选择分组标志遵循以下原则; 1、穷尽原则 2、互斥原则 3、科学性
统计分组的方法
按品质标志分组或按数量标志分组 按品质标志分组:是指选择反映事物属性差 异的品质标志作为分组标志,并在品质标 志的差异范围内划分各组界限,将总体划 分为性质不同的组成部分。 如职工按性别、文化程度、工种分组;企业 按经济类型、地区分组;学生按生源、性 别分组等都是按品质标志分组。
按性别分组 职工人数(人) 比重(%)
男
女 合计 各组名称
650
350 1000 次数
65
35 100 频率
变量分布数列
某班学生统计学成绩分布表
按数量标志分组所形 成的次数分布数列叫 变量分布数列,简称 变量数列。 变量数列由各组变量 值和各组次数构成。
按成绩分 组 60以下 60-70 70-80 80-90 90以上 合计 各组名称
某班学生统计学成绩分布表
按成绩分 组 60以下 60-70 70-80 80-90
人数(人) 比重(%) 4 6 16 10 10 15 40 25
90以上 合计
4 40
10 100
组距变量数列
在组距数列中,表示各组界限的变量值叫 组限,其中较小的变量值称为下限,较大 的变量值称上限。 各组上限与下限之间的距离叫组距,上限 与下限之间的中点值叫组中值。 组距=上限-下限 组中值=(上限+下限)/ 2
(3)人机同审
2a、资料审核后的订正 通过上述审核,如发现有缺报、缺份和缺项等情况, 应及时催报、补报;如有不正确之处,则应分别不 同情况作如下处理: (1)对于可以肯定的一般错误,应及时代为更正,并通 知原报单位。 (2)对于可疑之数或无法代为更正的错误,应要求原单 位复查更正。 (3)如果所发现的差错在其他单位也可能发生时,应将 错误情况通报所有单位,以免发生类似错误。 (4)对于严重的错误,应发还重新填报,并查明发生错 误的原因,若属于违法行为,则应依法严肃处理。
审核资料的正确性,是检查所填报的资料 是否准确可靠。常用的审核方法有三种:
(1)逻辑检查 首先,从理论上或常识上检查资料是否有悖常理、 有无不切实际或不符合逻辑的地方。 其次,是检查各项目之间有无相互矛盾的地方。
(2)计算检查
即检查各项指标的计算口径、计量单位是否符合 规定,并通过各种计算方法来检查各指标间的数字 是否相互衔接。
统计分组的方法
按品质标志分组或按数量标志分组 按数量标志分组:是指选择反映事物数量差 异的数量标志作为分组标志,并在数量标 志的变异范围内划分各组界限,将总体划 分为若干性质不同的组成部分。 如人口按年龄、身高、体重分组;企业按总 产值、职工人数、资金利润率分组等。
统计分组的方法
简单分组和复合分组 简单分组:就是按一个标志对总体进行分 组。 如学生按学习成绩分组,企业按生产规模 分组。
平均日产量
工人数 绝对数 比重(%) (人)
ቤተ መጻሕፍቲ ባይዱ
7 8 9 10 合计
8 18 19 5 50
16 36 38 10 100
变量分布数列
组距变量数列 1、组距变量数列是按 照数量标志分组后, 用变量值变动的一定 范围代表一个组所形 成的数列。 2、组距变量数列适用 于变量值个数较多, 变动范围较大的离散 型变量以及所有的连 续型变量
3.拟定调查提纲和调查表
调查提纲(调查项目):调查中所要登记的调查单位的特 征,即调查单位所承担的基本标志,它由一系列品质标志 (或称质量标志、属性标志)和数量标志所构成。
调查表:将各个调查项目按照一定的顺序排列在一定的表 格上,就构成了调查表。
4.确定调查的时间和方法
统计调查时间包括二种涵义,即调查时间和调查期限。
次数分布的种类
根据分组标志特征的不同,次数分布可以 分为品质分布数列和变量分布数列。 变量数列按变量的表示方法不同,可分为 单项变量数列和组距变量数列两种。
品质分布数列
按品质标志分组所形成的分布数列,称为品质 分布数列,简称品质数列。 品质数列由各组名称和次数构成。
某企业工人性别构成情况表
10
24
35
21
10
100
统计整理的概念和意义
统计整理的意义:经过统计整理,实现了从个
别单位的数量特征到总体数量特征的第一次综合, 得到了描述现象总体数量特征的最初始的综合指 标。
统计整理的步骤
统计整理的步骤包括: 1.、制定统计整理方案 2、审核、纠正统计数据资料 3、进行科学的统计数据分组与汇总 4、编制统计表和绘制统计图
统计数据收集的组织形式
统计数据收集的组织形式:统计报表、专 门调查。 统计报表:报送目录、报表表式、填表说 明。 专门调查:普查、抽样调查、重点调查、 典型调查。
数据的整理
统计整理的概念和意义 统计整理的步骤 统计分组 次数分布 变量数列的编制 次数分布的表现形式 统计资料的汇总 统计表和统计图
统计分组的方法
简单分组和复合分组 复合分组:是指对总体按两个或两个以上的标志 层叠起来进行的分组,即将总体先按一个分组标 志进行分组,在此基础上按另一个分组标志把已 分成的各个组成部分再分成若干小组。 例如,学生先按性别分组,在此基础上,再按年 龄分组就是复合分组。 进行复合分组时,应根据统计分析的要求确定分 组标志的主次顺序。
调查时间:是指调查资料所属的时间。 调查期限:是进行调查工作的时限,包括搜集资料和 报送资料的工作所需的时间。
人口普查(每10年进行一次,在逢0的年份实施) 经济普查(每10年两次,分别在逢3,8的年份实施) 农业普查(每10年进行一次,在逢6的年份实施)
统计调查问卷
问卷的类型与结构 问卷设计应注意的问题
2、确定调查对象和调查单位
调查对象:是指需要调查的现象总体,该总体 是由许多性质相同的调查单位组成的。
调查单位:是指所要调查的具体单位,它是进 行调查登记的标志的承担者。 报告单位:报告单位亦称填报单位,它是负责 向上报告调查内容、提交统计资料的单位。调 查单位与报告单位,有时是一致,有时不一致
组距变量数列
在编制组距数列时,常常使用“某某以上” 或“某某以下”,这样不确定组限的组, 称为开口组。 开口组的组中值按下列公式计算: 缺下限的最小组的组中值=上限-相邻的组距 /2 缺上限的最大组的组中值=下限+相邻的组距 /2
某地区100个百货商店 月销售额与流通费用情况
每百元商品销 销售额 商店数 如:组距d=U-L 售额中支付的 (万元) (个) 流通费(元) 上组限U =100-50=50 (万元) 10 14.2 50以下 20 11.4 50~100 30 10.1 100~200 25 如:组中值 9.2 x=(U+L)/2 200~300 下组限L 300以上 15 8.5 =(100+200)/2
=150(万元)
某连续变量分组数列,其末组为开口组,下 限为500,又知其相邻组的组中值为480, 则末组的组中值为( )
答案:520
组距变量数列
组距数列根据各组的组距是否相等可以分 为等距数列和异距数列。如果各组的组距 相等,称为等距数列;如果各组的组距不 相等,称为异距数列。 一般在社会经济现象性质差异变动比较均 衡的条件下使用等距数列。如,学生的学 习成绩分组,工人的工资。 异距数列则能比较准确反映总体内部各部 分之间的性质差异。
变量数列的编制
编制变量数列,要注意以下问题: 1、确定形式 2、确定组距和组数 3、确定组限
次数分布的表现方法
次数分布有向上累计和向下累计两种计算方法 。
频率
各组单位数占总体单位总数的比重
从变量值低的组开始,将各组次数 (频率)逐次向变量值高的组累计, 说明某一组上限以下各组的累计次数 (频率)。 从变量值高的组开始,将各组次数 (频率)逐次向变量值低的组累计, 说明某一组下限以上各组的累计次数 (频率)。
人数(人) 比重(%) 4 6 16 10 4 40 次数 10 15 40 25 10 100 频率
变量分布数列
某车间第一季度工人平均日产量
单项变量数列 1、单项变量数列是按 数量标志分组后,用 一个变量值代表一个 组所形成的数列,简 称单项数列。 2、单项数列适用于变 量值个数较少,变量 值变动范围较小的离 散型变量。
第二章 数据的收集与整理
数据的收集
统计数据来源 统计数据收集的原则和方法 统计调查方案 统计调查问卷 统计数据收集的组织形式
2.1.1 数据来源
从使用者的角度看,统计数据主要来源于两种 渠道: 1、源于直接的调查和科学实验,对使用者来说, 这是统计数据的直接来源,我们称之为第一手或 直接的统计数据; 2、源于别人调查或实验的数据,对使用者来说, 这是统计数据的间接来源,我们称之为第二手或 间接的统计数据。 在经济活动的分析中,我们通常大量使用二手 数据
次数分布
次数分布的概念 次数分布的种类
次数分布的概念
在统计分组的基础上,将总体的所有单位 按组归类整理,所形成的总体单位数在各 组之间的分布,称为次数分布。 分布在各组的总体单位数叫次数或频数。 各组次数与总体总次数之比称为比重或频 率。 次数分布有两个构成要素:一是总体分成 的各个组,二是各组的单位数。
统计整理的概念和意义
统计整理:是根据统计研究的任务与要 求,对统计调查所搜集到的原始资料进 行科学的综合与加工,使之系统化、条 理化的工作过程。
表2-1 2005年12月某市工业企业总产值分布表 总产值 (万元) 企业数 (个) 0-50 50-100 100-150 150-200 200-250 合计
统计分组
统计分组的概念与作用 分组标志的选择 统计分组的方法
统计分组的概念与作用
统计分组:就是根据统计研究的目的和现 象总体的内在特征,按照一定的标志将统 计总体划分为若干个性质不同而又有联系 的几个部分的一种统计方法。
统计分组的概念与作用
统计分组的作用: 1、统计分组可以划分社会经济现象的类型。 2、统计分组可以研究现象的内部结构。 3、统计分组可以分析现象之间的相互依存关 系。
问卷的类型与结构
问卷的类型 按问卷填写方式划分,可将调查问卷分为自 填式问卷和访问式问卷 调查问卷的基本结构 一份完整的调查问卷,通常由题目、说明信、 被调查者基本情况、调查事项的问题和答 案、填写说明与解释等5个主要部分构成。
问卷设计应注意的问题
问卷上所列问题应该都是必要的。 所问问题应是被调查者熟悉且易于回答的。 注意询问语句的措辞和语气。 私人生活问题,最好采用间接提问的方法。 所拟答案要有穷尽性,避免重复或相互交叉。 问卷纸张质地要良好,不宜破损,字迹印刷清晰。
2.1.2 统计数据收集的原则和方法
统计数据收集的原则:
1、准确性原则 2、及时性原则 3、系统性原则 4、完整性原则
统计数据收集的方法:观察法、报告法、 询问法。
统计调查方案
4
确定调查的时间和方法
3 2 1
拟定调查提 纲和调查表 确定调查对象 和调查单位 确定调查目的和任务
1、确定调查目的
现有统计资料(二手资料)的主要来源:
两个途径: 一是从相关的年鉴、期刊和有关出版物上获取; 二是从有关网站搜寻。 (一)统计年鉴 1、《中国统计年鉴》 (二)有关期刊 2、《国际统计年鉴》 1、《中国经济数据分析》 3、《地方统计年鉴》 2、《经济预测分析》 4、《中国县(市)社会经济统计年鉴》 (三)相关网站 如: 1、国家统计局网 5、《中国金融年鉴》 2、国研网 6、《中国人口统计年鉴》 3、中国经济信息网 7、《中国统计摘要》 4、中国经济时报网
分组标志的选择
选择分组标志遵循以下原则; 1、穷尽原则 2、互斥原则 3、科学性
统计分组的方法
按品质标志分组或按数量标志分组 按品质标志分组:是指选择反映事物属性差 异的品质标志作为分组标志,并在品质标 志的差异范围内划分各组界限,将总体划 分为性质不同的组成部分。 如职工按性别、文化程度、工种分组;企业 按经济类型、地区分组;学生按生源、性 别分组等都是按品质标志分组。
按性别分组 职工人数(人) 比重(%)
男
女 合计 各组名称
650
350 1000 次数
65
35 100 频率
变量分布数列
某班学生统计学成绩分布表
按数量标志分组所形 成的次数分布数列叫 变量分布数列,简称 变量数列。 变量数列由各组变量 值和各组次数构成。
按成绩分 组 60以下 60-70 70-80 80-90 90以上 合计 各组名称
某班学生统计学成绩分布表
按成绩分 组 60以下 60-70 70-80 80-90
人数(人) 比重(%) 4 6 16 10 10 15 40 25
90以上 合计
4 40
10 100
组距变量数列
在组距数列中,表示各组界限的变量值叫 组限,其中较小的变量值称为下限,较大 的变量值称上限。 各组上限与下限之间的距离叫组距,上限 与下限之间的中点值叫组中值。 组距=上限-下限 组中值=(上限+下限)/ 2
(3)人机同审
2a、资料审核后的订正 通过上述审核,如发现有缺报、缺份和缺项等情况, 应及时催报、补报;如有不正确之处,则应分别不 同情况作如下处理: (1)对于可以肯定的一般错误,应及时代为更正,并通 知原报单位。 (2)对于可疑之数或无法代为更正的错误,应要求原单 位复查更正。 (3)如果所发现的差错在其他单位也可能发生时,应将 错误情况通报所有单位,以免发生类似错误。 (4)对于严重的错误,应发还重新填报,并查明发生错 误的原因,若属于违法行为,则应依法严肃处理。
审核资料的正确性,是检查所填报的资料 是否准确可靠。常用的审核方法有三种:
(1)逻辑检查 首先,从理论上或常识上检查资料是否有悖常理、 有无不切实际或不符合逻辑的地方。 其次,是检查各项目之间有无相互矛盾的地方。
(2)计算检查
即检查各项指标的计算口径、计量单位是否符合 规定,并通过各种计算方法来检查各指标间的数字 是否相互衔接。
统计分组的方法
按品质标志分组或按数量标志分组 按数量标志分组:是指选择反映事物数量差 异的数量标志作为分组标志,并在数量标 志的变异范围内划分各组界限,将总体划 分为若干性质不同的组成部分。 如人口按年龄、身高、体重分组;企业按总 产值、职工人数、资金利润率分组等。
统计分组的方法
简单分组和复合分组 简单分组:就是按一个标志对总体进行分 组。 如学生按学习成绩分组,企业按生产规模 分组。
平均日产量
工人数 绝对数 比重(%) (人)
ቤተ መጻሕፍቲ ባይዱ
7 8 9 10 合计
8 18 19 5 50
16 36 38 10 100
变量分布数列
组距变量数列 1、组距变量数列是按 照数量标志分组后, 用变量值变动的一定 范围代表一个组所形 成的数列。 2、组距变量数列适用 于变量值个数较多, 变动范围较大的离散 型变量以及所有的连 续型变量
3.拟定调查提纲和调查表
调查提纲(调查项目):调查中所要登记的调查单位的特 征,即调查单位所承担的基本标志,它由一系列品质标志 (或称质量标志、属性标志)和数量标志所构成。
调查表:将各个调查项目按照一定的顺序排列在一定的表 格上,就构成了调查表。
4.确定调查的时间和方法
统计调查时间包括二种涵义,即调查时间和调查期限。
次数分布的种类
根据分组标志特征的不同,次数分布可以 分为品质分布数列和变量分布数列。 变量数列按变量的表示方法不同,可分为 单项变量数列和组距变量数列两种。
品质分布数列
按品质标志分组所形成的分布数列,称为品质 分布数列,简称品质数列。 品质数列由各组名称和次数构成。
某企业工人性别构成情况表
10
24
35
21
10
100
统计整理的概念和意义
统计整理的意义:经过统计整理,实现了从个
别单位的数量特征到总体数量特征的第一次综合, 得到了描述现象总体数量特征的最初始的综合指 标。
统计整理的步骤
统计整理的步骤包括: 1.、制定统计整理方案 2、审核、纠正统计数据资料 3、进行科学的统计数据分组与汇总 4、编制统计表和绘制统计图
统计数据收集的组织形式
统计数据收集的组织形式:统计报表、专 门调查。 统计报表:报送目录、报表表式、填表说 明。 专门调查:普查、抽样调查、重点调查、 典型调查。
数据的整理
统计整理的概念和意义 统计整理的步骤 统计分组 次数分布 变量数列的编制 次数分布的表现形式 统计资料的汇总 统计表和统计图
统计分组的方法
简单分组和复合分组 复合分组:是指对总体按两个或两个以上的标志 层叠起来进行的分组,即将总体先按一个分组标 志进行分组,在此基础上按另一个分组标志把已 分成的各个组成部分再分成若干小组。 例如,学生先按性别分组,在此基础上,再按年 龄分组就是复合分组。 进行复合分组时,应根据统计分析的要求确定分 组标志的主次顺序。
调查时间:是指调查资料所属的时间。 调查期限:是进行调查工作的时限,包括搜集资料和 报送资料的工作所需的时间。
人口普查(每10年进行一次,在逢0的年份实施) 经济普查(每10年两次,分别在逢3,8的年份实施) 农业普查(每10年进行一次,在逢6的年份实施)
统计调查问卷
问卷的类型与结构 问卷设计应注意的问题
2、确定调查对象和调查单位
调查对象:是指需要调查的现象总体,该总体 是由许多性质相同的调查单位组成的。
调查单位:是指所要调查的具体单位,它是进 行调查登记的标志的承担者。 报告单位:报告单位亦称填报单位,它是负责 向上报告调查内容、提交统计资料的单位。调 查单位与报告单位,有时是一致,有时不一致
组距变量数列
在编制组距数列时,常常使用“某某以上” 或“某某以下”,这样不确定组限的组, 称为开口组。 开口组的组中值按下列公式计算: 缺下限的最小组的组中值=上限-相邻的组距 /2 缺上限的最大组的组中值=下限+相邻的组距 /2
某地区100个百货商店 月销售额与流通费用情况
每百元商品销 销售额 商店数 如:组距d=U-L 售额中支付的 (万元) (个) 流通费(元) 上组限U =100-50=50 (万元) 10 14.2 50以下 20 11.4 50~100 30 10.1 100~200 25 如:组中值 9.2 x=(U+L)/2 200~300 下组限L 300以上 15 8.5 =(100+200)/2
=150(万元)
某连续变量分组数列,其末组为开口组,下 限为500,又知其相邻组的组中值为480, 则末组的组中值为( )
答案:520
组距变量数列
组距数列根据各组的组距是否相等可以分 为等距数列和异距数列。如果各组的组距 相等,称为等距数列;如果各组的组距不 相等,称为异距数列。 一般在社会经济现象性质差异变动比较均 衡的条件下使用等距数列。如,学生的学 习成绩分组,工人的工资。 异距数列则能比较准确反映总体内部各部 分之间的性质差异。
变量数列的编制
编制变量数列,要注意以下问题: 1、确定形式 2、确定组距和组数 3、确定组限
次数分布的表现方法
次数分布有向上累计和向下累计两种计算方法 。
频率
各组单位数占总体单位总数的比重
从变量值低的组开始,将各组次数 (频率)逐次向变量值高的组累计, 说明某一组上限以下各组的累计次数 (频率)。 从变量值高的组开始,将各组次数 (频率)逐次向变量值低的组累计, 说明某一组下限以上各组的累计次数 (频率)。
人数(人) 比重(%) 4 6 16 10 4 40 次数 10 15 40 25 10 100 频率
变量分布数列
某车间第一季度工人平均日产量
单项变量数列 1、单项变量数列是按 数量标志分组后,用 一个变量值代表一个 组所形成的数列,简 称单项数列。 2、单项数列适用于变 量值个数较少,变量 值变动范围较小的离 散型变量。
第二章 数据的收集与整理
数据的收集
统计数据来源 统计数据收集的原则和方法 统计调查方案 统计调查问卷 统计数据收集的组织形式
2.1.1 数据来源
从使用者的角度看,统计数据主要来源于两种 渠道: 1、源于直接的调查和科学实验,对使用者来说, 这是统计数据的直接来源,我们称之为第一手或 直接的统计数据; 2、源于别人调查或实验的数据,对使用者来说, 这是统计数据的间接来源,我们称之为第二手或 间接的统计数据。 在经济活动的分析中,我们通常大量使用二手 数据
次数分布
次数分布的概念 次数分布的种类
次数分布的概念
在统计分组的基础上,将总体的所有单位 按组归类整理,所形成的总体单位数在各 组之间的分布,称为次数分布。 分布在各组的总体单位数叫次数或频数。 各组次数与总体总次数之比称为比重或频 率。 次数分布有两个构成要素:一是总体分成 的各个组,二是各组的单位数。
统计整理的概念和意义
统计整理:是根据统计研究的任务与要 求,对统计调查所搜集到的原始资料进 行科学的综合与加工,使之系统化、条 理化的工作过程。
表2-1 2005年12月某市工业企业总产值分布表 总产值 (万元) 企业数 (个) 0-50 50-100 100-150 150-200 200-250 合计
统计分组
统计分组的概念与作用 分组标志的选择 统计分组的方法
统计分组的概念与作用
统计分组:就是根据统计研究的目的和现 象总体的内在特征,按照一定的标志将统 计总体划分为若干个性质不同而又有联系 的几个部分的一种统计方法。
统计分组的概念与作用
统计分组的作用: 1、统计分组可以划分社会经济现象的类型。 2、统计分组可以研究现象的内部结构。 3、统计分组可以分析现象之间的相互依存关 系。
问卷的类型与结构
问卷的类型 按问卷填写方式划分,可将调查问卷分为自 填式问卷和访问式问卷 调查问卷的基本结构 一份完整的调查问卷,通常由题目、说明信、 被调查者基本情况、调查事项的问题和答 案、填写说明与解释等5个主要部分构成。
问卷设计应注意的问题
问卷上所列问题应该都是必要的。 所问问题应是被调查者熟悉且易于回答的。 注意询问语句的措辞和语气。 私人生活问题,最好采用间接提问的方法。 所拟答案要有穷尽性,避免重复或相互交叉。 问卷纸张质地要良好,不宜破损,字迹印刷清晰。
2.1.2 统计数据收集的原则和方法
统计数据收集的原则:
1、准确性原则 2、及时性原则 3、系统性原则 4、完整性原则
统计数据收集的方法:观察法、报告法、 询问法。
统计调查方案
4
确定调查的时间和方法
3 2 1
拟定调查提 纲和调查表 确定调查对象 和调查单位 确定调查目的和任务
1、确定调查目的
现有统计资料(二手资料)的主要来源:
两个途径: 一是从相关的年鉴、期刊和有关出版物上获取; 二是从有关网站搜寻。 (一)统计年鉴 1、《中国统计年鉴》 (二)有关期刊 2、《国际统计年鉴》 1、《中国经济数据分析》 3、《地方统计年鉴》 2、《经济预测分析》 4、《中国县(市)社会经济统计年鉴》 (三)相关网站 如: 1、国家统计局网 5、《中国金融年鉴》 2、国研网 6、《中国人口统计年鉴》 3、中国经济信息网 7、《中国统计摘要》 4、中国经济时报网