统计学数据的图表展示分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
900
吸香烟(女性) 800
抽雪茄 2020/5/25
300
原因
寿命减少天数
危险工作,事故 交通事故 饮酒 滥用药物 一般工作,事故 自然放射性 喝咖啡 医疗X——射线
300 200 130
90 74
8 8 6
柱形图
寿命减少天数
1000
900
800
700
600
500
400
300
200
100
0
1 3 5 7 9 11 13
3.1.4 数据透视表
利用数据透视表可以利用Excel提供的数据透 视表工具,对数据重要信息按使用者习惯分析要 求进行汇总和作图,形成一个符合需要的交叉表 (列联表)。
在利用数据透视表时,数据源表中的首行必 须有列标题。
第一步:建立Excel数据清单,如表3-2
2020/5/25
表3-2
2020/5/25
这时会在第一行出现下拉键头,用鼠标点击箭头会出现如图3-2 所示的结果
第二步:在下拉键头方框内选择要筛选出的数据。比如, 要筛选出统计成绩为75分的学生。选择75,得到结果如图2-3 所示。要筛选出英语成绩最高的前四个学生,可选择【前4 个】,并在对话框中输入数据4,结果如图3-4所示。单击确定 后即可得到相应的结果。
第三章 数据的图表展示
3.1 数据的预处理 3.2 用图表展示定型数据 3.3 用图表展示定量数据 3.4 合理使用图表
2020/5/25
不同原因引起的寿命损失
原因
寿命减少天 数
未结婚(男性) 3 500
惯用左手
3 285
吸香烟(男性) 2 250
未结婚(女性) 1 600
30%超重
1 300
20%超重
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除
▪ 将符合某种特定条件的数据筛选出来,而不
符合特定条件的数据予以剔出
2020/5/25
【例3.1 】学生四门课程的成绩数据筛选
表3-1 8名学生考试成绩
2020/5/25
第一步:选择【工具 】菜单,并选择【筛选 】,如果要筛 选出给定条件的数据,可使用【自动筛选 】命令,如图3-1所示:
第二步:选中数据清单中的任意单元格,并选择【数据】 菜单中的【数据透视表和数据透视图】,弹出对话框如图3-7 所示。然后根据需要选择“数据源类型”和“报表类型”。这里我 们选用【Microsoft Office Excel数据列表或数据库】和【数据 透视表】 ,单击下一步,探出对框如图3-8所示 图 3-7
数据的排序
1. 定类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯上用升序 ▪ 汉字型数据,可按汉字的首位拼音字母排列,也可按
笔画排序,其中也有笔画多少的升序降序之分
2. 定距和定比数据的排序
– 递 序后增可排表序示:为设:一X组(1数)<据X(为2)<X…1,<XX2(,N) …,XN,递增排 – 递减排序可表示为:X(1)>X(2)>…>X(N)
单击【确定】后出现的结果如图3-6所示。
图3-5
图3-6
3.1.3 数据的排序
1. 按一定顺序将数据排列,以发现一些明显 的特征或趋势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重新 归类或分组等提供依据
3. 在某些场合,排序本身就是分析的目的之 一
4. 排序可借助于计算机完成
2020/5/25
2020/5/25
数据的审核、筛选与排序
1. 数据的审核Data Check
▪ 发现数据中的错误
2. 数据的筛选Data Filter
▪ 找出符合条件的数据
3. 数据排序Data Rank
▪ 发现数据的基本特征 ▪ 升序和降序
2020/5/25
3.1.1 数据的审核 (原始数据Check—Raw Data )
2020/5/25
原因
wenku.baidu.com
原因 未结婚(男 性) 惯用左手 吸 香烟(男性) 未结 婚(女性) 30%超 重
寿命减少的天数 3 500 3 285 2 250 1 600 1 300
帕累托图
Percent
寿命减少天数
4000
3500 3000
3500 3285
2500 2000
2250
1500 1000
图3-3
图3-4
第三步:如果要选出四门课成绩都大于70分的学生, 由于设定的条件比较多,需要使用【高级筛选】命令, 使用高级筛选命令时,必须建立条件区域。这时需要 在数据清单上方至少留出三行作为条件区域。然后在 【列表区域 】选出其中要筛选的数据清单,在【条件区 域】中选择匹配的条件。比如要筛选出四门课程成绩 均大于70分的学生,如图3-5所示。
审核的内容 1. 完整性审核
– 检查应调查的单位或个体是否有遗漏 – 所有的调查项目或指标是否填写齐全
2. 准确性审核
– 检查数据是否真实反映客观实际情况,内容是否 符合实际
– 检查数据是否有错误,计算是否正确等
2020/5/25
数据的审核
(原始数据)
审核数据准确性的方法
1. 逻辑检查
– 从定性角度,审核数据是否符合逻辑,内容是否合理, 各项目或数字之间有无相互矛盾的现象
500
1600 1300 900 800
0
2020/5/25
300 300 200
0
未结婚惯(用左吸手香烟未(结婚30(%超20重%超吸重香烟抽(雪茄危险工交作通事饮故酒 滥用药一物般工自作然放喝射咖啡医疗—X
原因
3.1 数据的预处理
Data Preparation
3.1.1. 数据的审核与筛选 3.1.2 数据的排序 3.1.3 数据透视表
图 3-8
第三步:确定数据源区。本利的数据源区为 $A$1:$F$31,如果在启动想到之前单击了数据 源单元格,Excel会自动选定数据源区域。单击 下一步,探出的对话框如图3-9所示。
– 主要用于对定类数据和定序数据的审核
2. 计算检查
– 检查调查表中的各项数据在计算结果和计算方法上有 无错误
– 主要用于对定距和定比数据的审核
2020/5/25
数据的审核 (第二手数据Second Hand Data )
1. 适用性审核
– 弄清楚数据的来源、数据的口径以及有关的 背景材料
– 确定这些数据是否符合自己分析研究的需要
2. 时效性审核
– 应尽可能使用最新的统计数据
3. 确认是否必要做进一步的加工整理
2020/5/25
3.1.2 数据的筛选
1. 对审核过程中发现的错误应尽可能予以纠正 2. 当发现数据中的错误不能予以纠正,或者有
些数据不符合调查的要求而又无法弥补时, 需要对数据进行筛选 3. 数据筛选的内容包括: