统计学数据的图表展示

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4
6
图3-9
8
10
简单箱线图
12
分布的形状与箱线图
QL 中位数 QU QL 中位数 QU Q L 中位数 QU
左偏分布
对称分布
不同分布的箱线图
右偏分布
未分组数据—多批数据箱线图
105 95 85 75 65 55 45
英 语
经 济 数 学
西 方 经 济 学
市 场 营 销 学
财 务 管 理
基 础 会 计 学
2.分类数据的图示 (1)条形图 是用宽度相同的条形的高度或长短来表示 数据变动的图形 条形图有单式、复式等形式 在表示定类数据的分布时,是用条形图的 高度来表示各类别数据的频数或频率 例3.3
(2)帕累托图 不同类别的数据根据其频率降序排列的 ,并在同一张图中画出累积百分比图 用双直角坐标系表示,左边纵坐标表示频 数,右边纵坐标表示频率
组,适用于离散型变量,并且变量的取值较少。
2人 3人 4人 5人 6人
2) 数量标志分组
B组距式分组:即每一组有一个
上限值和一个下限值所形成的区间, 适用于连续性变量,或离散型变量 •按销售额分组(万元) 且变量的取值较多不便一一列举的 •50以下 情况。
•50—200
例:对商店按销售额进行分组
•200—400 •400—600
1998年
39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40
行 标 题
资料来源:《中国统计摘要1999》,中国统计出版社,1999,第79页。 注:1.本表为城市和县城的城镇居民家庭抽样调查材料。 2.消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗 保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。
3.1.4 数据透视表 例3.2
统计数据类型
定类
定序
定距
定比
品质数据
数量数据
四个测定层次的比较
量 化 等 级
4
3
2
1
功 能 包 容
4
3 2 1
3.2 品质数据的整理与展示
3.2.1 分类数据的整理与展示 1.频数与频数分布
频数:落在各类别中的数据个数。 频数分布:将各类别及落在其中的相应频 数列出,用表格形式表现出来。 例3.3
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
等距分组表(上下组限间断)
某车间50名工人日加工零件数分组表 按零件数分组
105~109 110~114 115~119 120~124 125~129 130~134 135~139
频数(人)
频 数 (人 )
9 15 12
6
3
105
110
115
120
125
130
135
140
日加工零件数(个)
2.未分组数据:茎叶图和箱线图 (1)茎叶图
用于显示未分组的原始数据的分布,由“茎” 和“叶”两部分构成,其图形是由数字组成的,以 该组数据的高位数值作树茎,低位数字作树叶
(2)箱线图
将一组数据从大到小排列,分别计算出他的上边 缘,上四分位数,中位数,下四分位数,下边缘 ,还有一个异常值。 QU X最大值 X最小值 QL 中位数
2.
– – –
不等距分组
各组频数的分布受组距大小不同的影响 各组绝对频数的多少不能反映频数分布的实际状况 需要用频数密度(频数密度=频数 / 组距)反映频 数分布的实际状况
统计分组
• ☆基本原则:组内同质性,组间差异性 • ☆ 作用: • (1)划分现象的类型 • (2)表明总体内部的结构及整个结构的 类型和特征 • (3)揭示现象间的依存关系
统 计 学
计 算 机 应 用 基 础
Min-Max 25%-75% Median v alue
8门课程考试成绩的箱线图
105 95 85
75
65 55 45
Min-Max 25%-75% Median value
学生1 学生3 学生5 学生7 学生9 学生11 学生2 学生4 学生6 学生8 学生10
lg( n) K 1 lg( 2)
• 确定各组的组距:组距 (Class Width)是一个组的上限与下限 之差,可根据全部数据的最大值和最小值及所分的组数来确 定,即 组距=( 最大值 - 最小值)÷ 组数 根据分组整理成频数分布表
3.
分组中要注意的关键
1.选择分组标志 选择分组标志时,一般应考虑原则: • 根据研究问题的目的和任务选择分组标志 • 在若干标志中,选择能反映问题本质的标志 • 结合现象所处的历史条件具体情况具体分析 2.划分各组的界限:在分组标志的变异范围内,划定各相 邻组之间的性质界限和数量界限
项目
一、调查户数 二、平均每户家庭人口数 三、平均每户就业人口数 四、平均每人全部收入 五、平均每人实际支出 #消费性支出 非消费性支出 六、平均每人居住面积
表头 列 标 题 数 字 资 料
单位
户 人 人 元 元 元 元 平方米
1997年
37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11.90
(缺上限的开口组)
实例
某生产车间50名工人日加工零件数如下(单 位:个)。试采用单变量值对数据进行分组
117 131 123 123 124 122 125 126 119 115 124 117 133 113 139 129 122 134 120 128 139 133 127 123 124 107 126 123 127 121 117 130 122 125 108 122 118 108 110 118 118 112 112 134 127 135 137 114 120 128
第3章 数据的图表展示
数据的预处理
品质数据的整理与展示
数值型数据的整理与展示
合理使用图表
学习目的和要求 通过本章学习,掌握统计数据的分类 及数据的整理。重点掌握统计分组
的方法和次数分布表的编制。能 熟练运用统计软件对数据进行整 理。
3.1 数据的预处理
3.1.1 数据审核
检查数据中是否有错误。
二手 数据
单变量值分组表
某车间50名工人日加工零件数分组表
零件数 (个 )
107 108 110 112 113 114 115 117 118
频数 (人 )
1 2 1 2 1 1 1 3 3
零件数 (个 )
119 120 121 122 123 124 125 126 127
频数 (人 )
1 2 1 4 4 3 2 2 3
统计分组的形式
1.按分组标志个数不同 • 1)简单分组:把总体只按一个标志分组 2)复合分组:对同一总体选择两个或两个以上 标志层叠起来进行分组。例如,可以 同时选 择学科、学制、 性别三个标志对某学院全体 在校学生这个总体 进行分组。 2.按分组标志种类不同 如家庭人 • 1) 品质标志分组 口数分组 • 2) 数量标志分组 1人 A.单项式分组:即变量的一个取值为一
(3)饼图
用圆形及园内扇形的面积来表示数值大小的 图形 主要用于表示总体中各组成部分所占的比例 ,对于研究结构性问题十分有用
例3.3
(4)环形图
环形图是由两个及两个以上大小不一的饼图 叠在一起,挖去中间的部分所构成的图形
3.2.2 顺序数据的整理与图示 1.累积频数和累积频率 累积频数:将各有序类别或组的频数逐级 累加所得到的频数。分:向上累积和向下 累积。 累积频率:将各有序类别或组的百分比逐级 累加。分:向上累积和向下累积。 例3.5
适用性 •来源、口径以及有 关的背景材料 •是否符合自己分析 研究的需要
完整性 审核 •应调查的单位是否有遗漏 •所有的调查项目是否填写齐全
பைடு நூலகம்
原始 数据
时效性
•应尽可能使用最新 的统计数据
准确性 审核 •数据是否有错误 •是否存在异常值
3.1.2 数据筛选
例3.1
3.1.3 数据排序:发现数据的基本特征 • 把定量数据按从大到小或从小到大的顺序 排列, • 把定性数据按习惯的文字顺序排列,便于 我们研究其条理 方法:升序和降序
附 加
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
等距分组表(使用开口组)
某车间50名工人日加工零件数分组表 按零件数分组
110以下 110~114 115~119 120~124 125~129 130~134 135以上
频数(人)
3 5 8 14 10 6 4 50
用两组数据构成多个坐标点,考察坐标点的分 布,判断两变量之间是否存在某种关联或总结坐标 点的分布模式 例3.9
(2)气泡图 展示三个变量之间的关系 例3.9
(3)雷达图
数据类型及图示
数据类型与显示 数值型数据 分组数据 折 线 图 原始数据 茎 叶 图 箱 线 图 时序数据 线 多元数据 雷 达 图
•600—800
•800以上
组距分组
(要点)
1. 2. 3. 4. 将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 必须遵循“不重不漏”的原则
5. 可采用等距分组,也可采用不等距 分组
~ ~ ~ ~ ~
组距分组(步骤)
1. 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的 。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K
零件数 (个 )
128 129 130 131 133 134 135 137 139
频数 (人 )
2 1 1 1 2 2 1 1 2
等距分组表(上下组限重叠)
某车间50名工人日加工零件数分组表 按零件数分组
105~110 110~115 115~120 120~125 125~130 130~135 135~140
品质数据 总计表
条 圆 环 直 形 形 形 方 图 图 图 图

3.4 合理使用图表
3.4.1 鉴别图形优劣的准则
显示数据
有对图形的统 计描述和文字 说明
让读者的注意力集 中在图形内容上
好图
避免歪曲
服务于一个明确 的目的
强调数据间的比较
3.4.2 统计表的设计
1997~1998年城镇居民家庭抽样调查资料
11名学生8门课程考试成绩的箱线图
3.时间序列数据:线图
时间一般绘在横轴,指标数据绘在纵轴 图形的长宽比例要适当,其长宽比例大致为10:7 一般情况下,纵轴数据下端应从“0”开始,以便 于比较。数据与“0”之间的间距过大时,可以采取 折断的符号将纵轴折断 例3.8
4.多变量数据的图示 (1)散点图
组距分组
(几个概念)
• • • • 下 限:一个组的最小值 上 限:一个组的最大值 组 距:上限与下限之差 组中值:下限与上限之间的中点值
组中值=
下限值+上限值
2
• •
下限 上限 组中值 (闭口组) 2
邻组组距 组中值 下限 2 • (缺下限的开口组)组中值 上限 邻组组距 2 •
频率(%)
6 10 16 28 20 12 8 100
合计
3.3.2 数值型数据的图示 1.分组数据:直方图
用矩形的宽度和高度来表示频数分布的图形,实 际上是用矩形的面积来表示各组的频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示 频数或频率,各组与相应的频数就形成了一个矩形 ,即直方图(Histogram)
3.3 数值型数据的整理与展示
3.3.1 数据分组 将原始数据按照某种标准分成不同的组别 ,用于观察数据的分布特征
分组方法
单变量值分组
组距分组
等距分组
异距分组
组距分组与不等距分组
(在表现频数分布上的差异)
1.
– –
等距分组
各组频数的分布不受组距大小的影响 可直接根据绝对频数来观察频数分布的特征和规律
相关文档
最新文档