优选第三章应用统计学图表法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经济类管理类
基础课程
优选第三章应用统计学图表法
1 -1
学习目标
1. 了解数据预处理的内容和目的 2. 掌握品质数据整理和描述的方法 3. 掌握数量数据整理和描述的方法 4. 用Excel作频数分布表和分布图 5. 合理使用统计表
统计数据为什么要用图表描述?
1、原始数据反映个体特征,庞大而杂乱,单从原始数 据中无法得到总体特征和数量规律
定类数据
频数 频率
定序数据
累计频数 累计频率
指标含义
将将将落各对各在类比类各别的别类的基的别频数频中率作数数(为百 1分00比逐而据)级计的逐累算个级加的数累比加值
实例1:定类数据的频数分布表
【例3.1】某市移动公司为 研究移动数据业务集团客 户的行业分布状况,搜集 了该城市90个集团客户的 客户资料。将其所属行业 分为下列类别: 1.金融(银行证券保险) 2.政府,工商、税务 3.制造业 4.教育科研 5.交通运输 6.批发零售 7.公用事业 8.旅游酒店
第一节 数据的预处理
一、数据的审核 二、数据的筛选 三、数据的排序
一、数据的审核
原始数据
完整性审核
➢ 检查应调查的单位或个体是否有遗漏 ➢ 所有的调查项目或指标是否填写齐全
准确性审核
➢ 检查数据是否真实地反映了客观实际
情况,内容是否符合实际 ➢ 检查数据是否有错误,计算是否正确等
一、数据的审核
【 例 3.2】 在 一 项 关 于用户移动业务支出
情况的调查中,研究
人员在某城市抽样调 查 了 330 名 移 动 用 户 ,对其中的一个问题
:“手机话费一个月
多少钱?”设了七个 选项:
1、100元以内 2、 101-200元 3、201-300元 4、301-500元 5、501-600元 6、601-1200元 7、1501元以上
某城市330名用户每月手机话费支出的频数分布
用 户 数
频
向上累积
率 用户数 频率
(个) (%) (个)
(%)
向下累积
用户数 频率 (个) (%)
100元以内 161 48.8
161 48.8
330 100.0
101-200元 114 34.6
275 83.3
169
51.2
201-300元 29 8.8 304 92.1
第二手数据
适用性审核 时效性审核
➢ 应弄清楚数据的来源、数据的口径以及 有关的背景材料 ➢ 确定这些数据是否符合自己分析研究的 需要
➢ 应尽可能使用最新的统计数据
确认是否有必要做进一步的加工整理
审核数据准确性的方法
计算检查——主要用于对数量数据的审核
A省 B省 … 国内漫游出访通话量 8 12 … 国内漫游来访通话量 10 7 …
2. 排序有助于对数据检查纠错, 以及为重新归类或分组等提 供依据
3. 在某些场合,排序本身就是 分析的目的之一
4. 排序可借助于计算机完成
一、数据的整理
1. 要弄清所面对的数据类型,因为不 同类型的数据,所采取的处理方式 和方法是不同的
2. 对品质数据主要是做分类整理 3. 对数量数据主要是做分组整理 4. 适合于低层次数据的整理和显示方
55
16.6
301-500元 14 4.3 318 96.4
26
7.8
501-600元
6 1.8 324 98.2
12
3.6
601-1200元 4 1.2 328 99.4
6
1.8
1501元以上 2 0.6 330 100.0
2
0.6
合计
330 100 —
—
—
—பைடு நூலகம்
19% 32%
二、数据的展示
10% 15%
二、数据的筛选——处理数据中的错误
数据错误
能能 能否纠正 不能
纠正错误 筛选数据
• 剔除不符合要求或有明显错误的数据 • 将符合某种特定条件的数据筛选出来,而不符合特定条 件的数据予以剔出
三、数据的排序——发现数据的基本特征
1. 按一定顺序将数据排列,以 发现一些明显的特征或趋势, 找到解决问题的线索
法也适合于高层次的数据;但适合 于高层次数据的整理和显示方法并 不适合于低层次的数据
第二节 用图表法描述品质数据
一、品质数据的整理 二、品质数据的展示
品质数据的整理
整理过程
确定分类标志
将数据归类
☺
☺ ☺
☺☺
计算各类别中的数 据个数(频数) 制作频数分布表
用图形展示数据
数据整理中计算的指标
数据类型和指标
合计 324 289
Something Wrong !!!
检查调查表中的各项数据在计算结果和计算方 法上有无错误
审核数据准确性的方法
逻辑检查——主要用于对品质数据的审核
姓名 余小姐 罗先生 吴女士
性别 女 男 女
地址 香洲区 香洲 香州
不,他们住在 三个区!
他们住在同一 区
STATISTICA
从定性角度,审核数据是否符合逻辑,内容是 否合理,各项目或数字之间有无相互矛盾的现象
1. 在表示品质数据的分布时,条形信图息查询
是用条形图的高度或长短来表示收发各E-Mail
阅读网络新闻
类别数据的频数或频率
在线学习
12.3% 6.7%
采购与订货 5.5%
2. 绘制时,各类别可以放在纵轴,称 其他 4.5%
为条形图,也可以放在横轴,称为
柱形图
3. 条形图和柱形图有单式、复式等形
2、图表描述的结果能反映样本分布特征 3、图表描述的结果可用于研究变量之间的关系
用图表法描述数据的一般过程
数据的预处理 数据的描述
数据审核 数据筛选 数据排序
数据整理 数据展示
发现数据中的错误 处理数据中的错误 发现数据基本特征
品质数据:分类 数量数据:分组 用图表展示数据
本章内容
第一节 数据的预处理 第二节 用图表法描述品质数据 第三节 用图表法描述数量数据
24%
15% 12%
44% 18%
40%
29% 30%
12%
1999
2002
3 to 5 years
数据类型与图示
数据类型与图示
品质数据
数量数据
分组数据 分组数据 原始数据 时序数据 多元数据
条柱圆 直 折 茎 箱
线
雷
形形形 方 线 叶 线
达
图图图 图 图 图 图
图
图
品质数据的图示─条形图(Bar Graph)
移动数据业务集团客户行业类型的频数分布
行业类型
客户数(户) 频率(%)
金融(银行证券保险) 政府,工商、税务 制造业 教育科研 交通运输 批发零售 公用事业 旅游酒店
12 13.3
5
5.6
32 35.6
11 12.2
9 10.0
9 10.0
2
2.2
10 11.1
合计
90 100
实例2:定序数据的频数分布表
基础课程
优选第三章应用统计学图表法
1 -1
学习目标
1. 了解数据预处理的内容和目的 2. 掌握品质数据整理和描述的方法 3. 掌握数量数据整理和描述的方法 4. 用Excel作频数分布表和分布图 5. 合理使用统计表
统计数据为什么要用图表描述?
1、原始数据反映个体特征,庞大而杂乱,单从原始数 据中无法得到总体特征和数量规律
定类数据
频数 频率
定序数据
累计频数 累计频率
指标含义
将将将落各对各在类比类各别的别类的基的别频数频中率作数数(为百 1分00比逐而据)级计的逐累算个级加的数累比加值
实例1:定类数据的频数分布表
【例3.1】某市移动公司为 研究移动数据业务集团客 户的行业分布状况,搜集 了该城市90个集团客户的 客户资料。将其所属行业 分为下列类别: 1.金融(银行证券保险) 2.政府,工商、税务 3.制造业 4.教育科研 5.交通运输 6.批发零售 7.公用事业 8.旅游酒店
第一节 数据的预处理
一、数据的审核 二、数据的筛选 三、数据的排序
一、数据的审核
原始数据
完整性审核
➢ 检查应调查的单位或个体是否有遗漏 ➢ 所有的调查项目或指标是否填写齐全
准确性审核
➢ 检查数据是否真实地反映了客观实际
情况,内容是否符合实际 ➢ 检查数据是否有错误,计算是否正确等
一、数据的审核
【 例 3.2】 在 一 项 关 于用户移动业务支出
情况的调查中,研究
人员在某城市抽样调 查 了 330 名 移 动 用 户 ,对其中的一个问题
:“手机话费一个月
多少钱?”设了七个 选项:
1、100元以内 2、 101-200元 3、201-300元 4、301-500元 5、501-600元 6、601-1200元 7、1501元以上
某城市330名用户每月手机话费支出的频数分布
用 户 数
频
向上累积
率 用户数 频率
(个) (%) (个)
(%)
向下累积
用户数 频率 (个) (%)
100元以内 161 48.8
161 48.8
330 100.0
101-200元 114 34.6
275 83.3
169
51.2
201-300元 29 8.8 304 92.1
第二手数据
适用性审核 时效性审核
➢ 应弄清楚数据的来源、数据的口径以及 有关的背景材料 ➢ 确定这些数据是否符合自己分析研究的 需要
➢ 应尽可能使用最新的统计数据
确认是否有必要做进一步的加工整理
审核数据准确性的方法
计算检查——主要用于对数量数据的审核
A省 B省 … 国内漫游出访通话量 8 12 … 国内漫游来访通话量 10 7 …
2. 排序有助于对数据检查纠错, 以及为重新归类或分组等提 供依据
3. 在某些场合,排序本身就是 分析的目的之一
4. 排序可借助于计算机完成
一、数据的整理
1. 要弄清所面对的数据类型,因为不 同类型的数据,所采取的处理方式 和方法是不同的
2. 对品质数据主要是做分类整理 3. 对数量数据主要是做分组整理 4. 适合于低层次数据的整理和显示方
55
16.6
301-500元 14 4.3 318 96.4
26
7.8
501-600元
6 1.8 324 98.2
12
3.6
601-1200元 4 1.2 328 99.4
6
1.8
1501元以上 2 0.6 330 100.0
2
0.6
合计
330 100 —
—
—
—பைடு நூலகம்
19% 32%
二、数据的展示
10% 15%
二、数据的筛选——处理数据中的错误
数据错误
能能 能否纠正 不能
纠正错误 筛选数据
• 剔除不符合要求或有明显错误的数据 • 将符合某种特定条件的数据筛选出来,而不符合特定条 件的数据予以剔出
三、数据的排序——发现数据的基本特征
1. 按一定顺序将数据排列,以 发现一些明显的特征或趋势, 找到解决问题的线索
法也适合于高层次的数据;但适合 于高层次数据的整理和显示方法并 不适合于低层次的数据
第二节 用图表法描述品质数据
一、品质数据的整理 二、品质数据的展示
品质数据的整理
整理过程
确定分类标志
将数据归类
☺
☺ ☺
☺☺
计算各类别中的数 据个数(频数) 制作频数分布表
用图形展示数据
数据整理中计算的指标
数据类型和指标
合计 324 289
Something Wrong !!!
检查调查表中的各项数据在计算结果和计算方 法上有无错误
审核数据准确性的方法
逻辑检查——主要用于对品质数据的审核
姓名 余小姐 罗先生 吴女士
性别 女 男 女
地址 香洲区 香洲 香州
不,他们住在 三个区!
他们住在同一 区
STATISTICA
从定性角度,审核数据是否符合逻辑,内容是 否合理,各项目或数字之间有无相互矛盾的现象
1. 在表示品质数据的分布时,条形信图息查询
是用条形图的高度或长短来表示收发各E-Mail
阅读网络新闻
类别数据的频数或频率
在线学习
12.3% 6.7%
采购与订货 5.5%
2. 绘制时,各类别可以放在纵轴,称 其他 4.5%
为条形图,也可以放在横轴,称为
柱形图
3. 条形图和柱形图有单式、复式等形
2、图表描述的结果能反映样本分布特征 3、图表描述的结果可用于研究变量之间的关系
用图表法描述数据的一般过程
数据的预处理 数据的描述
数据审核 数据筛选 数据排序
数据整理 数据展示
发现数据中的错误 处理数据中的错误 发现数据基本特征
品质数据:分类 数量数据:分组 用图表展示数据
本章内容
第一节 数据的预处理 第二节 用图表法描述品质数据 第三节 用图表法描述数量数据
24%
15% 12%
44% 18%
40%
29% 30%
12%
1999
2002
3 to 5 years
数据类型与图示
数据类型与图示
品质数据
数量数据
分组数据 分组数据 原始数据 时序数据 多元数据
条柱圆 直 折 茎 箱
线
雷
形形形 方 线 叶 线
达
图图图 图 图 图 图
图
图
品质数据的图示─条形图(Bar Graph)
移动数据业务集团客户行业类型的频数分布
行业类型
客户数(户) 频率(%)
金融(银行证券保险) 政府,工商、税务 制造业 教育科研 交通运输 批发零售 公用事业 旅游酒店
12 13.3
5
5.6
32 35.6
11 12.2
9 10.0
9 10.0
2
2.2
10 11.1
合计
90 100
实例2:定序数据的频数分布表