人大版,贾俊平,第五版,统计学 第3章 数据的图表展示
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.3 数值型数据的整理与展示
3.3.1 数据分组 将原始数据按照某种标准分成不同的组别 ,用于观察数据的分布特征
分组方法
单变量值分组
组距分组
等距分组
异距分组
实例
某生产车间50名工人日加工零件数如下(单 位:个)。试采用单变量值对数据进行分组
117 131 123 123 124 122 125 126 119 115 124 117 133 113 139 129 122 134 120 128 139 133 127 123 124 107 126 123 127 121 117 130 122 125 108 122 118 108 110 118 118 112 112 134 127 135 137 114 120 128
第3章 数据的图表展示
数据的预处理
品质数据的整理与展示
数值型数据的整理与展示
合理使用图标
3.1 数据的预处理
3.1.1 数据审核
二手 数据
适用性 •来源、口径以及有 关的背景材料 •是否符合自己分析 研究的需要
完整性 审核 •应调查的单位是否有遗漏 •所有的调查项目是否填写齐全
原始 数据
时效性
•应尽可能使用最新 的统计数据
(3)饼图
用圆形及园内扇形的面积来表示数值大小的 图形 主要用于表示总体中各组成部分所占的比例 ,对于研究结构性问题十分有用
例3.3
(4)环形图
环形图是由两个及两个以上大小不一的饼图 叠在一起,挖去中间的部分所构成的图形
3.2.2 顺序数据的整理与图示 1.累积频数和累积频率 可以是向上累计频数,也可以是向下累 计频数。向上累计频数分布是先列出各组的 上限,然后由标志值低的组向标志值高的组 依次累计频数。向下累计频数分布是先列出 各组的下限,然后由标志值高的组向标志值 低的组依次累计频数。 例3.5
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
等距分组表(使用开口组)
某车间50名工人日加工零件数分组表 按零件数分组
110以下 110~114 115~119 120~124 125~129 130~134 135以上
频数(人)
3 5 8 14 10 6 4 50
4
6
图3-9
8
10
简单箱线图
12
分布的形状与箱线图
QL 中位数 QU QL 中位数 QU Q L 中位数 QU
左偏分布
对称分布
不同分布的箱线图
右偏分布
未分组数据—多批数据箱线图
105 95 85 75 65 55 45
英 语
经数 济学
西经学 方济
市营学 场销
财管 务理
基会学 础计
统学 计
计机用础 算应基
准确性 审核 •数据是否有错误 •是否存在异常值
3.1.2 数据筛选
例3.1
3.1.3 数据排序
3.1.4 数据透视表 例3.2
3.2 品质数据的整理与展示
3.2.1 分类数据的整理与展示 1.频数与频数分布
频数:落在各类别中的数据个数。将各 类别及落在其中的相应频数列出,用表格 形式表现出来,称为频数分布。 例3.3
资料来源:《中国统计摘要1999》,中国统计出版社,1999,第79页。 注:1.本表为城市和县城的城镇居民家庭抽样调查材料。 2.消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗 保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。
附 加
显示数据
有对图形的统 计描述和文字 说明
让读者的注意力集 中在图形内容上
好图
避免歪曲
服务于一个明确 的目的
强调数据间的比较
3.4.2 统计表的设计
1997~1998年城镇居民家庭抽样调查资料
项目
一、调查户数 二、平均每户家庭人口数 三、平均每户就业人口数 四、平均每人全部收入 五、平均每人实际支出 #消费性支出 非消费性支出 六、平均每人居住面积
Min-Max 25%-75% Median v alue
8门课程考试成绩的箱线图
105 95 85
75
65 55 45
Min-Max 25%-75% Median value
学生1 学生3 学生5 学生7 学生9 学生11 学生2 学生4 学生6 学生8 学生10
11名学生8门课程考试成绩的箱线图
零件数 (个)
128 129 130 131 133 134 135 137 139
频数 (人)
2 1 1 1 2 2 1 1 2
等距分组表(上下组限重叠)
某车间50名工人日加工零件数分组表 按零件数分组
105~110 110~115 115~120 120~125 125~130 130~135 135~140
(2)气泡图 展示三个变量之间的关系 例3.9
(3)雷达图
数据类型及图示
数据类型与显示 数值型数据 分组数据 折 线 图 原始数据 茎 叶 图 箱 线 图 时序数据 线 多元数据 雷 达 图
品质数据 总计表
条 圆 环 直 形 形 形 方 图 图 图 图
图wenku.baidu.com
3.4 合理使用图表
3.4.1 鉴别图形优劣的准则
频 数 (人)
9 15 12
6
3
105
110
115
120
125
130
135
140
日加工零件数(个)
2.未分组数据:茎叶图和箱线图 (1)茎叶图
用于显示未分组的原始数据的分布,由“茎” 和“叶”两部分构成,其图形是由数字组成的,以 该组数据的高位数值作树茎,低位数字作树叶
(2)箱线图
将一组数据从大到小排列,分别计算出他的上边 缘,上四分位数,中位数,下四分位数,下边缘 ,还有一个异常值。 QU X最大值 X最小值 QL 中位数
3.时间序列数据:线图
时间一般绘在横轴,指标数据绘在纵轴 图形的长宽比例要适当,其长宽比例大致为10:7 一般情况下,纵轴数据下端应从“0”开始,以便 于比较。数据与“0”之间的间距过大时,可以采取 折断的符号将纵轴折断 例3.8
4.多变量数据的图示 (1)散点图
用两组数据构成多个坐标点,考察坐标点的分 布,判断两变量之间是否存在某种关联或总结坐标 点的分布模式 例3.9
单变量值分组表
某车间50名工人日加工零件数分组表
零件数 (个)
107 108 110 112 113 114 115 117 118
频数 (人)
1 2 1 2 1 1 1 3 3
零件数 (个)
119 120 121 122 123 124 125 126 127
频数 (人)
1 2 1 4 4 3 2 2 3
频率(%)
6 10 16 28 20 12 8 100
合计
3.3.2 数值型数据的图示 1.分组数据:直方图
用矩形的宽度和高度来表示频数分布的图形,实 际上是用矩形的面积来表示各组的频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示 频数或频率,各组与相应的频数就形成了一个矩形 ,即直方图(Histogram)
表头 列 标 题 数 字 资 料
单位
户 人 人 元 元 元 元 平方米
1997年
37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11.90
1998年
39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40
行 标 题
2.分类数据的图示 (1)条形图 是用宽度相同的条形的高度或长短来表示 数据变动的图形 条形图有单式、复式等形式 在表示定类数据的分布时,是用条形图的 高度来表示各类别数据的频数或频率 例3.3
(2)帕累托图 不同类别的数据根据其频率降序排列的 ,并在同一张图中画出累积百分比图 用双直角坐标系表示,左边纵坐标表示频 数,右边纵坐标表示频率
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
等距分组表(上下组限间断)
某车间50名工人日加工零件数分组表 按零件数分组
105~109 110~114 115~119 120~124 125~129 130~134 135~139
频数(人)