第二章数据的搜集和整理方案
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
成本费用利润率 4.8% 3.71%
流动资产周转率 1.8次 1.52次
产品销售率
97% 90%
环保等级
优秀 良好
二、数据的类型
(一)数据的类型
按照计量尺度计量的结果,统计数据可分为以下四 种类型:
1. 定类数据
由定类尺度计量形成的,结果表现为类别,但不能 区分顺序。
2. 定序数据
由定序尺度计量形成的,结果表现为类别,但能区 分顺序。
⒋调查时间、空间和方法; (何时调查)
⒌制定调查工作的组织实施计划。
调查对象 调查单位
指是某项调查中被研究的总体, 它是由性质相同的许多调查单 位组成的。
指构成调查对象的每一个总
体单位。
负责报告调查
内容的单位
注意调查单位与填报单位 的区别: 例:
当调查单位自己负责向上报告时,它同时也是填报单 位;当调查单位的资料由它的上级组织收集、整理, 并向上报告时,填报单位与报告单位则不一致。
第二章 数据的搜集与整理
第一节 数据概述 第二节 统计调查 第三节 问卷设计 第四节 统计分组 第五节 频数分布 第六节 统计数据的显示
统计调查
统计整理
统计分析
有组织、 有计划地 搜集资料。 要求:准确、 完整、及时
对调查资料 去伪存真、 去粗取精、 科学分类、 浓缩简化
描述性分析 推断分析、 决策分析。 要求:定性 定量结合
统计调查所搜集的数字资料主要是原始资料, 同时也包括对次级资料的搜集
原始资料是指说明总体单位特征的资料; 次级资料是指已经经过加工整理,由个体过渡 到总体,能够在一定程度上说明所研究总体的 统计资料。
统计调查的基本要求
准确
统计调查所搜集的资料必须实 事求是,如实反映客观事物。
及时
指统计调查资料的时效性,反 映客观事物的灵敏性。
5. 可衔接性
指不同统计项目之间统计数据的衔接。
6. 经济性
指在满足以上标准的前提下一最经济的方式取得数据, 最大限度地降低取得数据的成本。
第二节 统计调查
一、统计调查的概念和种类
(一)统计调查的概念
即统计数据的搜集,是按照预定的统计 统计调查 研究任务,运用科学的调查方法,有组
织地向社会实际搜集统计资料的过程。
温度
天气预报:长沙:最高温度12℃,最低7℃ 大连:最高温度6℃,最低-2℃
两地最高温度相差6℃ 长沙最低温度较大连最低温度低9℃ 长沙最高温度是大连最高温度的2倍
纪年
公元元年
? 时间起点
黄帝元年
公元2001年
黄帝4492年
黄帝4712年
黄帝4699年
公元 2003 年
甲
1971年出生 30岁
专门调查 专门调查是为了研究某些专门问题
或为某一目的而对某些社会经济现 象专门组织的登记和调查。
专门调查又多为一次性调查
4. 按搜集资料的方法不同可分为
直接观察法 采访法 报告法
问卷调查法 卫星遥感法
直接观察 法 报告法 采访法
调查者直接 亲临现场取
得数据
被调查者受 调查者的强
制与约束
调查者与被 调查者平等
尺
度
定比变量或指标有绝对意义 上的零点,既可以加减运算,
也可以乘除运算。
四种测量尺度的对比
测定层次
特征
运算功能 举例
1、定类测定 分类
计数
产业分类
2、定序测定 分类;排序 计数;排序 企业等级
3、定距测定 分类;排序; 计数;排序;产品质量
有基本测量单位 加减
差异
4、定比测定 分类;排序; 计数;排序;商品销售
类
以文字表述的,可以用数值
尺
标识,但仅起标签作用。
度
定类变量或指标的各类别间 是平等的,没有高低、大小、
优劣之分。
例如: 性别、种族、运动项目等等
性别 种族 运动项目
按现象顺序差异进行的辨别
与区分。测量结果形成定序
2.
变量或定序指标。
定
定序变量或指标确切的值是
序
以文字表述的,也可以用数
尺
值标识,但仅起标签作用。
统计计量:运用某种方法使自然或
社会经济现象量化。
分类、 标识
测量结果:形成变量或指标
统计计量尺度的种类
定类尺度(测量、指标) 定序尺度(测量、指标) 定距尺度(测量、指标) 定比尺度(测量、指标)
各种测量尺度的比较
按现象性质差异进行的辨别
与区分。测量结果形成定类
1.
变量或定类指标。
定
定类变量或指标确切的值是
度
定序变量或指标各类别间有
高低优劣之分,不能随意排
列。
>
>
大学生
中学生
小学生
-
≠
-
≠
≠
按现象绝对数量差异进行的
辨别与区分。测量结果形成
3.
定距变量或定距指标。
定
距
定距变量或指标的值以数字 表述,有计量单位,可以进
尺
行加减运算。
度
定距变量或指标各类别间自
然有大小之分,但没有绝对
的零点,不能进行乘除计算。
2. 定序变量
由定序数据记录的变量为定序变量。如产品质量等 级,其变量值为一等品、二等品、三等品;又如学生 综合成绩,其变量值为优、良、中、及格、不及格。
3. 数字变量
由数量数据记录的变量称为数字变量。如产量、工资 总额、年龄、学生人数,其变量值为不同的数值。根据 其取值的不同,可分为离散型变量和连续型变量。
非全面调查
对调查对象中的一部分单位进行 调查,通过这些部分单位的调查
来了解全面 或一定范围(如某种
类型)的情况 。
调查单位少,可以节省人力、物力和财力。
2. 按调查时间是否连续分为
经常性调查 一次性调查
指随着被研究现象的变化,连续不
经常性调查 断地进行登记。以反映现象在一段
时间内的全部发展过程。如工业产 品产量、商品销售量等。
时点现象 应明确规定统一的标准调查时点
三、统计调查的组织方式
(一)普查
1.普查的概念 专门组织的一次性全面调查。
目的
掌握某些关系国情国力的重大事项的 准确而全面的数据
可以为抽样调查提供抽样框
作用
可以搜集统计报表所不能提供的反 映重大国情国力的基本统计信息
由于需要大量的人力、物力和财 局限 力,不宜经常进行
度
注意:
在自然或社会经济领域里, 单纯的定距变量是很少的,
绝大多数定距变量同时也
是定比变量。
定距测量与定比测量的区别 只在理论上有意义,在实际 工作中常将二者归为一类。
四种测量尺量的正确运用
对于不同的现象,注意准确性
宗教、种族、民族、性别、党派、 国别、职业等等品质方面的差异
定 类 测
× 定 定 定
合作
直接观察
报告式
调查者 强制、约束
被调查者
访问调查
调查者
平等合作
被调查者
二、统计调查方案
统计调查方案
用来指导整个调查工作的纲 领性文件,是统计设计在统 计调查阶段的具体化
基本内容:
⒈确定调查目的和任务; (为什么调查)
⒉确定调查对象与调查单位; (向谁调查)
⒊确定调查项目,设计调查表式;(调查什么)
(1)通过专门组织的普查机构
2.普查的组织方式
(2)由调查单位进行填报
普查涉及面广、指标多、工作量
3.普查的组织原则 大、时效性强,为了快速取得准
确的资料,必须遵循以下原则:
(1)确定统一的调查时点 (2)调查时间尽可能短 (3)普查项目必须统一 (4)重大国情普查应按一致周期进行
普查
总体单位 调查单位
系统 完整
指搜集的统计数据有条理、合 乎逻辑,便于整理。
包括调查单位的完整(全部应 调查单位)和统计资料的完整 (全部应登记的标志)。
(二) 统计调查的种类 1.按调查单位的范围大小分为
全面调查 非全面调查
全面调查 全面调查是对调查对象的全部单
位一一加以调查。如普查和全面 统计报表。
全面调查涉及面广,调查单位多;要耗费较 多的人力、物力、财力,调查的时 间也较长。
高中、大专、
顺序性差异、 绝对差异距离
大学本科、硕 士研究生、博
士研究生
(定序测量)
顺序性差异
文盲半文盲
对受教育程度的度 量方法
四种测量尺量的正确运用
对数量差异的度量,注意层次
定比测量 定距测量
博士研究生
顺序性差异、
绝对差异距离、 0年、6年、9
相对差异
年、12年、16
年、19年、22
顺序性差异、
(C)11月4日到3号家。11月2日新婚夫妇到户籍登记处 登记自己的婚姻,统计员将调查表有关项目填为未婚。
该调查员的处理登记处理方法正确吗?
?
(二)统计报表
统计报表
是依照国家有关法规的规定,
自上而下的统一布置,以一定的 原始记录和核算资料为依据,按 照国家统一规定的表格形式搜集 统计资料的一种调查方式。
调查时间 调查期限
调查时间是指调查资料所属的时间, 包括调查期限及调查资料所属的时期 或时点。
调查期限是指进行统计调查工作的起 止时间,包括搜集和报送资料的整个 工作所需要的时间。为保证统计资料
的及时性,应尽量缩短调查期限。
调查时间应根据不同调查项目的要求确定
时期现象 应规定资料所反映的是从何时起至何 时止的资料
序距比 测测测
量
量量量
四种测量尺量的正确运用
对于人的
对于不同的现象,注意准确性 主观态度,
定序尺度
可能是最 好的方法
你对圣亚海洋世界的评价
定距以 上的尺 度不一 定合适
四种测量尺量的正确运用
对数量差异的度量,注意层次
定比测量 定距测量 定序测量
博士研究生
顺序性差异、 绝对差异距离、 相对差异
文盲半文盲、 小学、初中、
一次性调查 对时点现象进行定期或不定期的
调查登记,以反映现象在某一时 点上的发展水平或规模。
3. 按调查的组织方式不同分为
统计报表 专门调查
普查 重点调查 典型调查
抽样调查
统计报表
指基层单位和企业,根据一定的原 始记录或统计台帐,按照一定的统 计表式、统一的指标、统一的报送 时间和程序,自下而上定期向上级 统计机关报告基本统计资料的一种 统计调查方式方法。
对全部单位 进行调查
案例分析
第五次全国人口普查的标准时间是11月1日零时,普查 现场登记工作从11月1日开始到11月10日以前结束。调查 员到过的几家遇到情况并作处理:
(A)11月2日在1号家,这一家11月1日中午生个小孩, 调查员把小孩的材料填入普查表;
(B)11月3日在2号家。这一家11月2日一成员死亡,调查 员把关于死亡的材料填入调查表;
<
长
=、≠、> 、 < 、+ 、-
甲、乙有生命
甲生命时间较乙 长 甲比乙大45岁
=、≠、> 、 < 、+ 、-、
×、÷
甲、乙有生命 甲生命时间较乙长 甲比乙大45岁 甲 年龄为乙的4倍
对测量尺度层次的判断
较低 层次 的测 量尺
度
低 测量精度 高 少 计算方法 多 小 信息数量 大
较高 层次 的测 量尺
3. 定距数据
由定距尺度计量形成的,结果表现为数值,可进行 加、减数学运算。
4. 定比数据
由定比尺度计量形成的,结果表现为数值,可进行 加、减、乘、除数学运算。
(二)变量的类型
变量是指一个可以取两个或更多个可能值的特征、 特质或属性。
1. 定类变量
由定类数据记录的变量称为定类变量。如性别,其变 量值为男或女;如民族,其变量值为汉族或非汉族。
年
绝对差异距离 (定距测量)
定序测量 顺序性差异
文盲半文盲
对受教育程度的度 量方法
四种测量尺量的正确运用
对于指标体系,注意统一性
一个指 标体系中的 指标应属于 相同的测量 尺度。
实际值 标准值
总资产贡献率 15% 10.7%源自文库
资本保值增值率 130% 120%
资产负债率
60% 60%
全员劳动生产率 20000元 16500元
有基本测量单位;加减
额
有绝对零点 乘除
某甲某 乙的生 命现象
定类测量
甲、乙有生命
定序测量
甲为中年人,乙 为少年人。
定距测量
甲生于1940年、 乙生于1985年。
定比测量
甲60岁、乙15岁
测量 精度
很低 较低 较高 较高
计算 方法
信ST息AT 数量
不能计算, 只能判断
=、≠
甲、乙有生命
=、≠、>、
甲、乙有生命 甲生命时间较乙
统计工作的三个中心阶段
第一节 数据概述
一、数据及其计算尺度
(一)数据的概念
数据是统计数据的简称,是对客观现象进行计量的 结果。
(二)数据的计量尺度
按照对客观现象计量的精确程度,可将被采用的计 量尺度由低级到高级、有粗略到精确分为四个层次。
测(计)量:用仪器确定空间、时
间、温 度、速度、功能等的有关数 值。
乙
1986年出生 15岁
二人年龄 之差:1986-1971=15岁
或 30-15=15岁 二人年龄之比:30÷15=2(倍)
1986÷1971=1.0076(倍)
按现象绝对差异与相对差异
进行的辨别与区分。测量结
果形成定比变量或定比指标
4.
定
定比变量或指标确切的值也
比
以数字表述,有计量单位 , 可以进行加减运算。
三、数据的质量要求
统计数据质量的好坏直接影响着统计分析结论的客 观性与真实性。数据质量的评价标准为以下六个方面。
1. 适用性
指搜集的统计数据是否有用,是否符合需要。
2. 准确性
指搜集的统计数据具有最小的统计抽样误差和非抽样 误差。
3. 及时性
指在最短的时间里取得并公布统计数据。
4. 可比性
指同一项目的统计数据在时间上和空间上的可比性。