统计学原理三统计整理PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计预处理
原始数据或变量的转换
• 变量类型的转化 • 数学意义上的变量转化
第四节 分布数列的编制
保定科技职业学院经济管理系
次数分布 次数分布:在统计分组的基础上,将总体的所有单位按组归
类整理,并按一定顺序排列,形成总体中各单位在各组间 的分布,就叫做次数分布。
频数(次数):各组单位数。
频率:各组单位数占与总体单位数的比率。
单身
1
女
2
中小城市 2
两人
2
县乡镇
3
三口之家 3
农村
4
四人以上 4
200以下
01
200-300
02
300-400
03
……
…
1000-1100
10
例如:在某项关于社会公众保险意识调查中,对被调查者个人的基本情况进 行了调查,运用分组编码法对有关信息编码如下:
编码的常用方法 信息组码编码法
把调查数据分成不同的组,给以一定的组码(数
又称助忆编码法,它用数字符号等表明编码 对象的属性,并依次方式对调查数据进行编 码的方法.
例如:用180BXJ表示容量为180升的进口电冰箱.其中180为冰箱的 容量, BX表示冰箱. J表示进口.
编码手册的编制
也称编码表,是用来进行数据编码的工作手册,包括 四个项目:问题顺序号,每个调查项目的预置代码位置, 项目名称,内容说明.
编码
编码
将调查表或调查问卷中的各个项目转化为数字符号的过程。
事前编码 事后编码
适用封闭性问题 适用开放性问题
顺序编码编法码的常用方法 又称系列编码法。只用一个标准对数据进行分类,并按 照一定的顺序用连续数字或字母进行编码的方式。
例如:根据某项对家 庭月度消费支出的调 查,对家庭月度消费 支出分为四个档次:
统计整理是统计调查的继续,统计分析的前提和基础
统计整理的内容
缺点:
费时费
统
统计分组
力
计
整
理
统计汇总
逐级汇总
集中汇总
就是在统计分组设计的基础上,根据各单位的标志归 属,把总体各单位归纳到各组中,计算出各组和总体 的单位数和标志值。
优点:满足 各层次的需
要
优点:速度 快
层次少
缺点: 有错不 易查找
统计整理的程序
小于500元 500元—1000元 1000元—1500元 1500元以上
编码的常用方法
分组编码法
又称区间编码法,是根据调查数据的属性特点和处理要 求,将具有一定位数的代码单元分成若干个组,每个组的
数字均代表一定的意义。
性别
居住地
家庭人口数
月收入水平
回答 编码
回答 编码
回答
编码
回答
编码
男
1
大城市
1
字区间)来进行编码的方法.
例如:对某地市场上99种商品的价格变动进行调查,在运用信息组吗编码法 对调查的信息进行编码时,首先对99种商品分组,再给每个组分配一个组码:
组别 百货组 食品组 家电组 服装组 其他组
名称码 01-30 31-50 51-65 66-80 81-99
表义式文编字编码码的法 常用方法
表示各组标志值对 总体标志值所起 作用的强度
次数分布的作用
• 反映统计总体内所有总体单位在各组间的分布。 同类总体不同的分布状况差异反映了它们的性 质差异。如各班成绩分布。
• 对某随机现象的重复观察,频率分布可以渐近 反映其统计规律。
分布数列
分布数列:将各组组别的名称与相应的频数和 频率,依次排列起来形成的数列称为次数分布 数列。简称分布数列。又称分配数列,次数分 配数列。
1. 设计和编制统计资料的汇总方案 2. 对原始资料进行审核 3. 对调查数据进行编码及录入 4. 分组汇总原始资料 5. 编制统计表和绘制统计图
第二节 统计汇总技术
保定科技职业学院经济管理系
统计汇总的内容
利用计算机进行统计汇总主要包括:审 核、编码、录入、数据净化、逻辑检查运算以 及编制和打印汇总表、统计图等。
资料审核
• 全面审核
审核调查单位的全面性、审核调查项目的全面性
• 准确性审核
逻辑审核、计算技术审核
编码和录入的质量控制
• 编码工作的质量控制
• 录入工作的质量控制
缺省数据处理统计预处理
以样本统计量代替缺省值 以统计模型计算的估计值代替缺省值 缺省值样本删除 缺省值样本保留
加权处理
统计预处理
通过对调查数据进行加权,使样本更具代 表性。
第三章 统计整理
保定科技职业学院经济管理系
学习目标
• 明确统计资料整理的涵义和作用 • 了解统计整理的内容和程序 • 掌握分布数列的编制方法
第一节 统计整理的一般 问题
保定科技职业学院经济管理系
统计整理的概念
统计整理
将统计调查得到的原始资料进行科学的分 组和汇总,使其系统化、条理化,成为能 够反映总体特征及其发展变化情况的综合 统计资料的工作过程
(1)已充分发挥积极性 (2)基本发挥了积极性 (3)积极性有所发挥 (4)完全没有发挥积极性
5.目前,您是否有离开学校的想法?(1)是 (2)否 6.请您按投入精力的多少,将下列三项活动排序?
(1)校内工作 (2)校外兼职 (3)生活琐事
第一位____ 第二位____第三位_____
问题序 号 1
2 3 4
5 6
项目名称 职务
年龄 从事专业 工作评价
是否打算 离开学校 按投入精 力排列
编码ቤተ መጻሕፍቲ ባይዱ置
编码意义
1
1.正高
2.副高
3.中级
4.其他
2-3 答卷人回答年龄
4-6 专业编码见附表
7
1.已充分发挥积极性
2.基本发挥了积极性
3.积极性有所发挥
4.完全没有发挥积极 性
8
1.是
2.否
9-11 1.校内工作 2.校外兼职 3.生活琐事
案例:对某高等学校教师的工作,生活状况的调查,一共有32个 问题,我们摘录6个问题,来说明编码手册的编制.
1.您的职务? (1)正高级 (2)副高级 (3)中级 (4)其他 2.您的年龄_____________________ 3.您从事的专业__________________________ 4.您对自己工作情况的评价?
录入
数据录入就是将问卷或编码表中的每一个项 目对应的代码读到磁盘中,或通过键盘直接敲 入计算机中的工作过程。
方式:
程序录入 光电扫描录入
数据净化
数据净化指通过计算机处理错误的或不合理 的数据以及进行一致性检验。
方式:
统计软件:SPSS、SAS
第三节 统计汇总的质量 控制
保定科技职业学院经济管理系
作用:反映总体中所有单位在各组的分布状态 和分布特征。
分布数列的构成要素
各组名称(常用x 表示)
两个构成要素
各组次数