经济应用统计学第四章统计整理.pptx
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
河北大学统计学系
三、统计整理的程序
1、设计和编制统计资料的汇总方案 2、对原始资料进行审核 3、对调查数据进行编码及录入 4、分组汇总原始资料 5、编制统计表和绘制统计图
河北大学统计学系
第二节 统计汇总技术
河北大学统计学系
第二节 统计汇总技术
利用计算机进行统计汇总主要包括: 审核、编码、录入、数据净化、 逻辑检查运算以及编制和打印汇总 表、统计图等。
问题序号 项目名称 编码位置
编码意义
1
职务
1
1.正高
2.副高
3.中级
4.其他
2
年龄
2-3
答卷人回答年龄
3
从事专业
4-6
专业编码见附表
4
工作评价
7
1.已充分发挥积极性
2.基本发挥了积极性
3.积极性有所发挥
4.完全没有发挥积极性
5
是否打算离
8
1.是
开学校
2.否
6
按投入精力
9-11
1.校内工作
排列
2.校外兼职
名称码 01-30 31-50 51-65 66-80 81-99
河北大学统计学系
(一)编码的常用方法
4、表义式文字编码法
又称助忆编码法,它用数字符号等表明编码 对象的属性,并依此方式对调查数据进行编 码的方法.
例如:用180BXJ表示容量为180升的进口电冰箱.其中180为冰箱的 容量, BX表示冰箱. J表示进口.
(1)已充分发挥积极性 (2)基本发挥了积极性 (3)积极性有所发挥 (4)完全没有发挥积极性 5.目前,您是否有离开学校的想法?(1)是 (2)否 6.请您按投入精力的多少,将下列三项活动排序? (1)校内工作 (2)校外兼职 (3)生活琐事 第一位____ 第二位____第三位_____
河北大学统计学系
回答信息为22310
河北大学统计学系
(一)编码的常用方法
3、信息组码编码法 把调查数据分成不同的组,给以一定的组码(数 字区间)来进行编码的方法.
例如:对某地市场上99种商品的价格变动进行调查,在运用信息组码编码法 对调查的信息进行编码时,首先对99种商品分组,再给每个组分配一个组码:
组别 百货组 食品组 家电组 服装组 其他组
第一节 统计整理的一般问题 一、统计整理的概念 二、统计整理的内容 三、统计整理的程序
河北大学统计学系
一、统计整理的概念
统计整理
将统计调查得到的原始资料进行科学的分 组和汇总,使其系统化、条理化,成为能 够反映总体特征及其发展变化情况的综合 统计资料的工作过程
统计整理是统计调查的继续,统计分析的前提和基础
第四章 统计整理
河北大学统计学系
学习目标
明确统计资料整理的涵义和作用 了解统计整理的内容和程序 掌握分布数列的编制方法
河北大学统计学系
本章主要内容
第一节 第二节 第三节 第四节
统计整理的一般问题 统计汇总技术 统计汇总的质量控制 分布数列的编制
河北大学统计学系
第一节 统计整理的一般问题
河北大学统计学系
河北大学统计学系
二、统计整理的内容
缺点:
费时费力;
易出错
统
统计分组
计
逐级汇总
整
理
统计汇总
集中汇总
就是在统计分组设计的基础上,根据各单 位的标志归属,把总体各单位归纳到各组 中,计算出各组和总体的单位数和标志值。
优点:满足各 层次的需要; 便于审核更正
优点:速度快 层次少
缺点: 有错不易查 找; 不能及 时满足中间 层次需要
3.生活琐事
若某份问卷的 回答信息在答 录卡上的前11 为数字为: 23300112132 则表示 为??????
河北大学统计学系
二、录入
数据录入就是将问卷或编码表中的每一个项目对应的 代码读到磁盘中,或通过键盘直接敲入计算机中的工作 过程。
方式:
程序录入 光电扫描录入
河北大学统计学系
三、数据净化
小于500元 500元—1000元 1000元—1500元 1500元以上
操作简便,但不便于进行分组处理
河北大学统计学系
(一)编码的常用方法
2、分组编码法 又称区间编码法,是根据调查数据的属性特点和处理要 求,将具有一定位数的代码单元分成若干个组,每个组的 数字均代表一定的意义。
例如:在某项关于社会公众保险意识调查中,对被调查者个人的基本情况进 行了调查,运用分组编码法对有关信息编码如下:
河北大学统计学系
(二)编码手册的编制
也称编码表,是用来进行数据编码的工作手册,包括 四个项目:问题顺序号,每个调查项目的预置代码位置, 项目名称,内容说明.
河北大学统计学系
案例:对某高等学校教师的工作,生活状况的调查,一共有32个 问题,我们摘录6个问题,来说明编码手册的编制.
1.您的职务? (1)正高级 (2)副高级 (3)中级 (4)其他 2.您的年龄_____________________ 3.您从事的专业__________________________ 4.您对自己工作情况的评价?
性别
居住地
家庭人口数
月收入水平
回答 编码
回答 编码
回答
编码
回答
编码
男
1
大城市
1
单身
1
女
2
ቤተ መጻሕፍቲ ባይዱ中小城市 2
两人
2
县乡镇
3
三口之家 3
农村
4
四人以上 4
200以下
01
200-300
02
300-400
03
……
…
1000-1100
10
若某个被调查者为女性,居住于中等城市,家中有三口人,月收入为1000-1100则其
河北大学统计学系
一、编 码
编码 将调查表或调查问卷中的各个项目转化为数字符号的过程。
事前编码 事后编码
适用封闭性问题 适用开放性问题
河北大学统计学系
(一)编码的常用方法
1、顺序编码法
又称系列编码法。只用一个标准对数据进行分类,并按 照一定的顺序用连续数字或字母进行编码的方式。
例如:根据某项对家 庭月度消费支出的调 查,对家庭月度消费 支出分为四个档次:
河北大学统计学系
二、编码和录入的质量控制
编码工作的质量控制 录入工作的质量控制
河北大学统计学系
三、统计预处理
缺省数据的处理 加权处理 原始数据或变量的转换
河北大学统计学系
统计预处理
1、缺省数据的处理
以样本统计量代替缺省值
一般为平均值
以统计模型计算的估计值代替缺省值 回归模型等
数据净化指通过计算机处理错误的或不合理的数据以 及进行一致性检验。
方式:
统计软件:SPSS、SAS
河北大学统计学系
第三节 统计汇总的质量控制
河北大学统计学系
一、资料审核
汇总前对统计资料进行审核是统计汇总质量控制的关键。
全面性审核 审核调查单位的全面性、审核调查项目的全面性 准确性审核 逻辑审核、计算技术审核
三、统计整理的程序
1、设计和编制统计资料的汇总方案 2、对原始资料进行审核 3、对调查数据进行编码及录入 4、分组汇总原始资料 5、编制统计表和绘制统计图
河北大学统计学系
第二节 统计汇总技术
河北大学统计学系
第二节 统计汇总技术
利用计算机进行统计汇总主要包括: 审核、编码、录入、数据净化、 逻辑检查运算以及编制和打印汇总 表、统计图等。
问题序号 项目名称 编码位置
编码意义
1
职务
1
1.正高
2.副高
3.中级
4.其他
2
年龄
2-3
答卷人回答年龄
3
从事专业
4-6
专业编码见附表
4
工作评价
7
1.已充分发挥积极性
2.基本发挥了积极性
3.积极性有所发挥
4.完全没有发挥积极性
5
是否打算离
8
1.是
开学校
2.否
6
按投入精力
9-11
1.校内工作
排列
2.校外兼职
名称码 01-30 31-50 51-65 66-80 81-99
河北大学统计学系
(一)编码的常用方法
4、表义式文字编码法
又称助忆编码法,它用数字符号等表明编码 对象的属性,并依此方式对调查数据进行编 码的方法.
例如:用180BXJ表示容量为180升的进口电冰箱.其中180为冰箱的 容量, BX表示冰箱. J表示进口.
(1)已充分发挥积极性 (2)基本发挥了积极性 (3)积极性有所发挥 (4)完全没有发挥积极性 5.目前,您是否有离开学校的想法?(1)是 (2)否 6.请您按投入精力的多少,将下列三项活动排序? (1)校内工作 (2)校外兼职 (3)生活琐事 第一位____ 第二位____第三位_____
河北大学统计学系
回答信息为22310
河北大学统计学系
(一)编码的常用方法
3、信息组码编码法 把调查数据分成不同的组,给以一定的组码(数 字区间)来进行编码的方法.
例如:对某地市场上99种商品的价格变动进行调查,在运用信息组码编码法 对调查的信息进行编码时,首先对99种商品分组,再给每个组分配一个组码:
组别 百货组 食品组 家电组 服装组 其他组
第一节 统计整理的一般问题 一、统计整理的概念 二、统计整理的内容 三、统计整理的程序
河北大学统计学系
一、统计整理的概念
统计整理
将统计调查得到的原始资料进行科学的分 组和汇总,使其系统化、条理化,成为能 够反映总体特征及其发展变化情况的综合 统计资料的工作过程
统计整理是统计调查的继续,统计分析的前提和基础
第四章 统计整理
河北大学统计学系
学习目标
明确统计资料整理的涵义和作用 了解统计整理的内容和程序 掌握分布数列的编制方法
河北大学统计学系
本章主要内容
第一节 第二节 第三节 第四节
统计整理的一般问题 统计汇总技术 统计汇总的质量控制 分布数列的编制
河北大学统计学系
第一节 统计整理的一般问题
河北大学统计学系
河北大学统计学系
二、统计整理的内容
缺点:
费时费力;
易出错
统
统计分组
计
逐级汇总
整
理
统计汇总
集中汇总
就是在统计分组设计的基础上,根据各单 位的标志归属,把总体各单位归纳到各组 中,计算出各组和总体的单位数和标志值。
优点:满足各 层次的需要; 便于审核更正
优点:速度快 层次少
缺点: 有错不易查 找; 不能及 时满足中间 层次需要
3.生活琐事
若某份问卷的 回答信息在答 录卡上的前11 为数字为: 23300112132 则表示 为??????
河北大学统计学系
二、录入
数据录入就是将问卷或编码表中的每一个项目对应的 代码读到磁盘中,或通过键盘直接敲入计算机中的工作 过程。
方式:
程序录入 光电扫描录入
河北大学统计学系
三、数据净化
小于500元 500元—1000元 1000元—1500元 1500元以上
操作简便,但不便于进行分组处理
河北大学统计学系
(一)编码的常用方法
2、分组编码法 又称区间编码法,是根据调查数据的属性特点和处理要 求,将具有一定位数的代码单元分成若干个组,每个组的 数字均代表一定的意义。
例如:在某项关于社会公众保险意识调查中,对被调查者个人的基本情况进 行了调查,运用分组编码法对有关信息编码如下:
河北大学统计学系
(二)编码手册的编制
也称编码表,是用来进行数据编码的工作手册,包括 四个项目:问题顺序号,每个调查项目的预置代码位置, 项目名称,内容说明.
河北大学统计学系
案例:对某高等学校教师的工作,生活状况的调查,一共有32个 问题,我们摘录6个问题,来说明编码手册的编制.
1.您的职务? (1)正高级 (2)副高级 (3)中级 (4)其他 2.您的年龄_____________________ 3.您从事的专业__________________________ 4.您对自己工作情况的评价?
性别
居住地
家庭人口数
月收入水平
回答 编码
回答 编码
回答
编码
回答
编码
男
1
大城市
1
单身
1
女
2
ቤተ መጻሕፍቲ ባይዱ中小城市 2
两人
2
县乡镇
3
三口之家 3
农村
4
四人以上 4
200以下
01
200-300
02
300-400
03
……
…
1000-1100
10
若某个被调查者为女性,居住于中等城市,家中有三口人,月收入为1000-1100则其
河北大学统计学系
一、编 码
编码 将调查表或调查问卷中的各个项目转化为数字符号的过程。
事前编码 事后编码
适用封闭性问题 适用开放性问题
河北大学统计学系
(一)编码的常用方法
1、顺序编码法
又称系列编码法。只用一个标准对数据进行分类,并按 照一定的顺序用连续数字或字母进行编码的方式。
例如:根据某项对家 庭月度消费支出的调 查,对家庭月度消费 支出分为四个档次:
河北大学统计学系
二、编码和录入的质量控制
编码工作的质量控制 录入工作的质量控制
河北大学统计学系
三、统计预处理
缺省数据的处理 加权处理 原始数据或变量的转换
河北大学统计学系
统计预处理
1、缺省数据的处理
以样本统计量代替缺省值
一般为平均值
以统计模型计算的估计值代替缺省值 回归模型等
数据净化指通过计算机处理错误的或不合理的数据以 及进行一致性检验。
方式:
统计软件:SPSS、SAS
河北大学统计学系
第三节 统计汇总的质量控制
河北大学统计学系
一、资料审核
汇总前对统计资料进行审核是统计汇总质量控制的关键。
全面性审核 审核调查单位的全面性、审核调查项目的全面性 准确性审核 逻辑审核、计算技术审核