统计学数据图表展示

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.
计算检查
– –
2019/1/29
数据的审核
(第二手数据Second Hand Data )
1.
适用性审核
– 弄清楚数据的来源、数据的口径以及有关的 背景材料 – 确定这些数据是否符合自己分析研究的需要
2.
时效性审核
– 应尽可能使用最新的统计数据
3.
确认是否必要做进一步的加工整理
2019/1/29
【例3.1 】学生四门课程的成绩数据筛选
表3-1 8名学生考试成绩
2019/1/29
第一步:选择【工具 】菜单,并选择【筛选 】,如果要筛 选出给定条件的数据,可使用【自动筛选 】命令,如图3-1所示:
这时会在第一行出现下拉键头,用鼠标点击箭头会出现如图3-2 所示的结果
第二步:在下拉键头方框内选择要筛选出的数据。比如, 要筛选出统计成绩为75分的学生。选择75,得到结果如图2-3 所示。要筛选出英语成绩最高的前四个学生,可选择【前4 个】,并在对话框中输入数据4,结果如图3-4所示。单击确定 后即可得到相应的结果。
3.1.4 数据透视表
利用数据透视表可以利用Excel提供的数据透 视表工具,对数据重要信息按使用者习惯分析要 求进行汇总和作图,形成一个符合需要的交叉表 (列联表)。 在利用数据透视表时,数据源表中的首行必 须有列标题。
第一步:建立Excel数据清单,如表3-2
2019/1/29
表3-2
2019/1/29
3.1.2 数据的筛选
1. 2.
3.
对审核过程中发现的错误应尽可能予以纠正 当发现数据中的错误不能予以纠正,或者有 些数据不符合调查的要求而又无法弥补时, 需要对数据进行筛选 数据筛选的内容包括:
将某些不符合要求的数据或有明显错误的数
2019/1/29
据予以剔除 将符合某种特定条件的数据筛选出来,而不 符合特定条件的数据予以剔出

发现数据中的错误 找出符合条件的数据
2.
数据的筛选Data Filter 数据排序Data Rank
3.

发现数据的基本特征 升序和降序
2019/1/29
3.1.1 数据的审核 (原始数据Check—Raw Data )
1.
审核的内容
完整性审核
– 检查应调查的单位或个体是否有遗漏 – 所有的调查项目或指标是否填写齐全
第二步:选中数据清单中的任意单元格,并选择【数据】 菜单中的【数据透视表和数据透视图】,弹出对话框如图3-7 所示。然后根据需要选择“数据源类型”和“报表类型”。这里我 们选用【Microsoft Office Excel数据列表或数据库】和【数据 透视表】 ,单击下一步,探出对框如图3-8所示 图 3-7
寿命减少天数
300 200 130 90 74 8 8 6
柱形图
1000 900 800 700 600 500 400 300 200 100 0 1
201Leabharlann Baidu/1/29
原因 未结婚(男 性) 惯用左手 吸 香烟(男性) 未结 婚(女性) 30%超 重 寿命减少的天数 3 500 3 285 2 250 1 600 1 300
寿命减少天数
3
5
7 原因
9
11
13
Percent
帕累托图
3500 3285
疗 医 啡 咖 喝 放射 然 自 工作 般 一 药物 用 滥 酒 饮 事故 通 交 工作 险 危 茄 雪 抽 烟( 香 吸 超重 % 20 超重 % 30 婚( 结 未 烟( 香 吸 左手 用 惯 婚(
2250 1600 1300 900 800 300 300 200
2.
3.
4.
1.
定类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按
笔画排序,其中也有笔画多少的升序降序之分
数据的排序
2.
定距和定比数据的排序


递增排序:设一组数据为 X1 , X2 , … , XN ,递增排 序后可表示为:X(1)<X(2)<…<X(N) 递减排序可表示为:X(1)>X(2)>…>X(N)
单击【确定】后出现的结果如图3-6所示。
图3-5
图3-6
3.1.3 数据的排序
1.
按一定顺序将数据排列,以发现一些明显 的特征或趋势,找到解决问题的线索
排序有助于对数据检查纠错,以及为重新 归类或分组等提供依据 在某些场合,排序本身就是分析的目的之 一 排序可借助于计算机完成
2019/1/29
第三章
3.1 3.2 3.3 3.4
2019/1/29
数据的图表展示
数据的预处理 用图表展示定型数据 用图表展示定量数据 合理使用图表
不同原因引起的寿命损失
原 因 未结婚(男性) 惯用左手 吸香烟(男性) 未结婚(女性) 30%超重 20%超重 吸香烟(女性) 抽雪茄 2019/1/29 寿命减少天 数 3 500 3 285 2 250 1 600 1 300 900 800 300 原 因 危险工作,事故 交通事故 饮酒 滥用药物 一般工作,事故 自然放射性 喝咖啡 医疗X——射线

X
0
4000
3500
3000
2500
2000
1500
1000
寿命减少天数
2019/1/29
500
0
原因


3.1 数据的预处理
Data Preparation
3.1.1. 数据的审核与筛选 3.1.2 数据的排序 3.1.3 数据透视表
2019/1/29
数据的审核、筛选与排序
1.
数据的审核Data Check
2.
准确性审核
– 检查数据是否真实反映客观实际情况,内容是否 符合实际 – 检查数据是否有错误,计算是否正确等
2019/1/29
数据的审核
(原始数据)

1.
审核数据准确性的方法
逻辑检查
– –
从定性角度,审核数据是否符合逻辑,内容是否合理, 各项目或数字之间有无相互矛盾的现象 主要用于对定类数据和定序数据的审核 检查调查表中的各项数据在计算结果和计算方法上有 无错误 主要用于对定距和定比数据的审核
图3-3
图3-4
第三步:如果要选出四门课成绩都大于70分的学生,
由于设定的条件比较多,需要使用【高级筛选】命令, 使用高级筛选命令时,必须建立条件区域。这时需要 在数据清单上方至少留出三行作为条件区域。然后在 【列表区域 】选出其中要筛选的数据清单,在【条件区 域】中选择匹配的条件。比如要筛选出四门课程成绩 均大于70分的学生,如图3-5所示。
相关文档
最新文档