第三章应用统计学图表法优秀课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
审核数据准确性的方法
计算检查——主要用于对数量数据的审核
A省 B省 … 国内漫游出访通话量 8 12 … 国内漫游来访通话量 10 7 …
合计 324 289
Something Wrong !!!
检查调查表中的各项数据在计算结果和计算方 法上有无错误
审核数据准确性的方法
逻辑检查——主要用于对品质数据的审核
用 户 数
频
向上累积
率 用户数 频率
(个) (%) (个)
(%)
向下累积
用户数 频率 (个) (%)
100元以内 161 48.8
161 48.8
330 100.0
101-200元 114 34.6
275 83.3
169
51.2
201-300元 29 8.8 304 92.1
55
16.6
301-500元 14 4.3 318 96.4
12%
1Baidu Nhomakorabea99
2002
3 to 5 years
数据类型与图示
数据类型与图示
品质数据
数量数据
分组数据 分组数据 原始数据 时序数据 多元数据
条柱圆 直 折 茎 箱
线
雷
形形形 方 线 叶 线
达
图图图 图 图 图 图
图
图
品质数据的图示─条形图(Bar Graph)
1. 在表示品质数据的分布时,条形信图息查询
三、数据的排序——发现数据的基本特征
1. 按一定顺序将数据排列,以 发现一些明显的特征或趋势, 找到解决问题的线索
2. 排序有助于对数据检查纠错, 以及为重新归类或分组等提 供依据
3. 在某些场合,排序本身就是 分析的目的之一
4. 排序可借助于计算机完成
一、数据的整理
1. 要弄清所面对的数据类型,因为不 同类型的数据,所采取的处理方式 和方法是不同的
品质数据:分类 数量数据:分组 用图表展示数据
本章内容
第一节 数据的预处理 第二节 用图表法描述品质数据 第三节 用图表法描述数量数据
第一节 数据的预处理
一、数据的审核 二、数据的筛选 三、数据的排序
一、数据的审核
原始数据
完整性审核
➢ 检查应调查的单位或个体是否有遗漏 ➢ 所有的调查项目或指标是否填写齐全
准确性审核
➢ 检查数据是否真实地反映了客观实际
情况,内容是否符合实际 ➢ 检查数据是否有错误,计算是否正确等
一、数据的审核
第二手数据
适用性审核 时效性审核
➢ 应弄清楚数据的来源、数据的口径以及 有关的背景材料 ➢ 确定这些数据是否符合自己分析研究的 需要
➢ 应尽可能使用最新的统计数据
确认是否有必要做进一步的加工整理
行业类型
客户数(户) 频率(%)
金融(银行证券保险) 政府,工商、税务 制造业 教育科研 交通运输 批发零售 公用事业 旅游酒店
12 13.3
5
5.6
32 35.6
11 12.2
9 10.0
9 10.0
2
2.2
10 11.1
合计
90 100
实例2:定序数据的频数分布表
【 例 3.2】 在 一 项 关 于用户移动业务支出
是用条形图的高度或长短来表示收发各E-Mail
阅读网络新闻
类别数据的频数或频率
在线学习
12.3% 6.7%
采购与订货 5.5%
姓名 余小姐 罗先生 吴女士
性别 女 男 女
地址 香洲区 香洲 香州
不,他们住在 三个区!
他们住在同一 区
STATISTICA
从定性角度,审核数据是否符合逻辑,内容是 否合理,各项目或数字之间有无相互矛盾的现象
二、数据的筛选——处理数据中的错误
数据错误
能能 能否纠正 不能
纠正错误 筛选数据
• 剔除不符合要求或有明显错误的数据 • 将符合某种特定条件的数据筛选出来,而不符合特定条 件的数据予以剔出
26
7.8
501-600元
6 1.8 324 98.2
12
3.6
601-1200元 4 1.2 328 99.4
6
1.8
1501元以上 2 0.6 330 100.0
2
0.6
合计
330 100 —
—
—
—
19% 32%
二、数据的展示
10% 15%
24%
15% 12%
44% 18%
40%
29% 30%
情况的调查中,研究
人员在某城市抽样调 查 了 330 名 移 动 用 户 ,对其中的一个问题
:“手机话费一个月
多少钱?”设了七个 选项:
1、100元以内 2、 101-200元 3、201-300元 4、301-500元 5、501-600元 6、601-1200元 7、1501元以上
某城市330名用户每月手机话费支出的频数分布
第三章应用统计学 图表法
第三章 用表格法和图形法
描述统计数据
第一节 数据的预处理 第二节 品质数据的整理和描述 第三节 数值型数据的整理和描述 第四节 统计表
学习目标
1. 了解数据预处理的内容和目的 2. 掌握品质数据整理和描述的方法 3. 掌握数量数据整理和描述的方法 4. 用Excel作频数分布表和分布图 5. 合理使用统计表
2. 对品质数据主要是做分类整理 3. 对数量数据主要是做分组整理 4. 适合于低层次数据的整理和显示方
法也适合于高层次的数据;但适合 于高层次数据的整理和显示方法并 不适合于低层次的数据
第二节 用图表法描述品质数据
一、品质数据的整理 二、品质数据的展示
品质数据的整理
整理过程
确定分类标志
将数据归类
【例3.1】某市移动公司为 研究移动数据业务集团客 户的行业分布状况,搜集 了该城市90个集团客户的 客户资料。将其所属行业 分为下列类别: 1.金融(银行证券保险) 2.政府,工商、税务 3.制造业 4.教育科研 5.交通运输 6.批发零售 7.公用事业 8.旅游酒店
移动数据业务集团客户行业类型的频数分布
统计数据为什么要用图表描述?
1、原始数据反映个体特征,庞大而杂乱,单从原始数 据中无法得到总体特征和数量规律
2、图表描述的结果能反映样本分布特征 3、图表描述的结果可用于研究变量之间的关系
用图表法描述数据的一般过程
数据的预处理 数据的描述
数据审核 数据筛选 数据排序
数据整理 数据展示
发现数据中的错误 处理数据中的错误 发现数据基本特征
☺
☺ ☺
☺☺
计算各类别中的数 据个数(频数) 制作频数分布表
用图形展示数据
数据整理中计算的指标
数据类型和指标
定类数据
频数 频率
定序数据
累计频数 累计频率
指标含义
将将将落各对各在类比类各别的别类的基的别频数频中率作数数(为百 1分00比逐而据)级计的逐累算个级加的数累比加值
实例1:定类数据的频数分布表