第二讲 用图表和统计量看数据
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
绿茶 矿泉水 碳酸饮料 果汁 其他
15 11 10 6 8
饮料类型
定性数据的展示
不同类型饮料分布饼图
其他 16% 果汁 12%
绿茶 22%
矿泉水 20% 碳酸饮料 30%
【例】为研究广告市场的状 况,一家广告公司在某城市 随机抽取200 人就广告问题 随机抽取 200人就广告问题 做了邮寄问卷调查, 做了邮寄问卷调查,其中的 一个问题是“ 一个问题是“您比较关心下 列哪一类广告? 列哪一类广告?” 1.商品广告;2.服务广 商品广告;2 告;3 金融广告;4 告;3.金融广告;4.房地 产广告;5 产广告; 5 . 招生招聘广告 ;6.其他广告。 其他广告。
非常不满意 不满意 一般 满意 非常满意 合计
24 108 93 45 30 300
8 36 31 15 10 100.0
定性数据的展示
定序数据频数分布表
(实例 )
乙城市家庭对住房状况评价的频数分布 乙城市
回答类别
向上累积 户数 (户) 户 百分比 (%) 户数 (户) 户 21 120 198 262 300 — 百分比 (%) 7.0 40.0 66.0 87.3 100.0 —
今天的 主食是 面包
多变量数据— 多变量数据—雷达图
绘制的雷达图) (由 Excel 绘制的雷达图)
食 品 6000 杂项商品和服务 4000 2000 居 住 0 家庭设备用品及服务 衣 着 城市 农村
教育文化娱乐服务 交通和通信
医疗保健
多变量数据— 多变量数据—雷达图
(实例) 实例)
【 例 3 .7 】 为 研 究 某 条河流的污染程度 ,环保局分别在上 游、中游和下游设 立取样点,每个取 样点化验水中的五 项污染指标,所得 数据如表3 13。 数据如表3-13。将各 指标用雷达图表示 出来,并分析该河 流的主要污染源。 流的主要污染源。
某城市居民关注广告类型的频数分布
广告类型 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告 合计
人数(人 人数 人) 112 51 9 16 10 2 200
比例 0.560 0.255 0.045 0.080 0.050 0.010 1
频率(%) 频率 56.0 25.5 4.5 8.0 5.0 1.0 100
指标 4
指标 3
上游 中游 下游
图3-16 河流污染指标雷达图
2.2用统计量描述数据 2.2用统计量描述数据
数据分布的特征和测度
一组数据的概括 众 数 MO 中位数M 中位数Me 均 值M 离中、 离中、离散程度 四分位数Q 四分位数 L Q 离散系数s/ 离散系数s/M
U
分布的形状
偏态S 偏态S 峰度K 峰度K
【例】某生产车 间 50 名 工 人 日 加 工零件数如下( 单位:个)。试 采用单变量值对 数据进行分组。 数据进行分组。
定量数据的展示
建立频数分布表
FREQUENCY(data_array, FREQUENCY(data_array,bins_arra y) Data_array 为一数组或对一组数值的 引用,用来计算频率。 Bins_array 为间隔的数组或对间隔的 引用,该间隔用于对 data_array 中的 数值进行分组。
用图表展示定量数据
频数分布表 1、对数据分k(5≤k ≤ 15)组 、对数据分k 15)组 2、确定各组组距(≈ (max-min) ÷k) 、确定各组组距(≈ (max3、统计各组数据个数(上组限不在内原则) 用图形看数据 1频数分布图-直方图 (histogram) 频数分布图2看原始数据的分布-茎叶图(Stem-and-leaf) 看原始数据的分布-茎叶图(Stem-and-leaf) 3看原始数据的分布-箱线图(Boxes Represent) 看原始数据的分布-箱线图( Represent) 4观察两变量间的关系-散点图 观察两变量间的关系5比较多个样本的相似性-雷达图 比较多个样本的相似性-
绘制的累计频数分布图) (由 Excel 绘制的累计频数分布图)
累 积 300 户 数 200 (户) 100 0 24 132
400 270 300
225
累 积 300 户 300 数 200 (户) 100 0
400
276 168 75 30 非常 满意
非常 不满意 一般 满意 (a)向下累积 向下累积 不满意
向下累积 户数 (户) 户 300 279 180 102 38 — 百分比 (%) 100.0 93.0 60.0 34.0 12.7 —
非常不满意 不满意 一般 满意 非常满意 合计
21 99 78 64 38 300
7.0 33.0 26.0 21.3 12.7 100.0
定性数据的展示
定序数据的图示— 定序数据的图示—累计频数分布图
非常 不满意 一般 满意 不满意 (b)向上累积 向上累积 甲城市家庭对住房状况评价的累积频数分布 非常 满意
定性数据的展示
绘制的环形图) (由 Excel 绘制的环形图)
13% 10% 15% 21%
7% 8% 非常不满意 33% 36% 一般 满意 非常满意 不满意
31% 26% 图3-4
甲乙两城市家庭对住房状况的评价
日加工零件数( 日加工零件数(个) 某车间工人日加工零件数的直方图
【例2.3】某电脑公司2008年前4 某电脑公司2008年前 年前4
个月销售数据如下表(单位:万元) 个月销售数据如下表(单位:万元)
从某大学经济管理专业二年级学生中随机 抽取11人 抽取11人,对8门主要课程的考试成绩进 行调查,数据表如下: 行调查,数据表如下:
定性数据的展示
建立频数分布表
COUNTIF(range,criteria) COUNTIF(range,criteria) Range 为需要计算其中满足条件的单 元格数目的单元格区域。 Criteria 为确定哪些单元格将被计算 在内的条件,其形式可以为数字、表达 式或文本。例如,条件可以表示为 32、 32、 "32"、 "32"、">32" 或 "apples"。 "apples"。
表3-13
不同样本点的化验指标
指标4 指标5 指标 指标 196 41 112 14 6 35
指标1 指标2 指标3 指标 指标 指标 上游 中游 下游 4.52 0.34 2.17 5.0 1.4 6.8 483 36 208
多变量数据— 多变量数据—雷达图
指标 1 1000 100 10 指标 5 1 0.1 指标 2
绘制的圆形图) (由 Excel 绘制的圆形图)
房地产广告 招生招聘广告 其他广告 1.0% 8.0% 5.8% 金融广告 4.5%
服务广告 25.5%
商品广告 56.0%
图2-4 某城市居民关注不同类型广告的人数构成
定性数据的展示
例2-2:根据2006年我国高等学校分科专任教 根据2006年我国高等学校分科专任教 师数据, 师数据,分别按教师的职称构成和分科构成绘 制圆形图和环形图。 制圆形图和环形图。
定量数据的展示
频数分布表的编制
(实例) 实例)
117 125 108 108 110 112 112 135 137 121 122 124 129 139 107 117 130 122 131 125 117 122 133 126 122 118 118 123 126 133 134 127 123 118 134 127 123 119 113 120 123 127 114 120 128 124 115 139 128 124
8门课程考试成绩的箱线图
11名考生考试成绩箱线图 11名考生考试成绩箱线图
多变量数据— 多变量数据—雷达图
【 例 】2006 年 上 海城乡居民家庭 平均每人各项生 活消费支出数据 如表3 12。 如表3-12。试绘制 雷达图。 雷达图。 表 2006年上海城乡居民家庭人均生活消费支出 年上海城乡居民家庭人均生活消费支出
定性数据的展示
Excel的函数 Excel的函数COUNTIF输出 的函数COUNTIF输出
频数表
饮料类型 绿茶 矿泉水 碳酸饮料 果汁 其他 总计
频数 11 10 15 6 8 50
百分比% 百分比% 22 20 30 12 16 100
定性数据的展示
不同类型饮料柱型图
16 12 频 8 数 4 0
【例】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各抽样调查300 户 各抽样调查300户 ,其中的一个问 题是:“您对您 家庭目前的住房 状况是否满意? 状况是否满意? 1 .非常不满 意;2 意;2.不满意; 3 . 一般;4 . 满 一般; 4 意;5 意;5.非常满意 。
甲城市家庭对住房状况评价的频数分布 甲城市 回答类别 户数 (户) 户 百分比 (%) 向上累积 户数 (户 (户 ) 24 132 225 270 300 — 百分比 (%) 8.0 44.0 75.0 90.0 100.0 — 向下累积 户数 (户 (户 ) 300 276 168 75 30 — 百分比 (%) 100.0 92 56 25 10 —
副教授 27%
教授 副教授 讲师 助教 教员
讲师 40%
定性数据的展示
环形图
内:经济学 外:文学
7% 25% 20% 5% 8%
6% 教授 副教授 讲师 助教 教员
27% 25%
40% 37%
定性数据的展示
雷达图
教授 40 30 20 10 0
教员
副教授 经济学 文学
助教
讲师
定பைடு நூலகம்数据的展示
定序数据频数分布表
定类数据的图示— 定类数据的图示—条形图
绘制的条形图) (由 Excel 绘制的条形图)
2
其他广告
10 16 9 51 112
广招生招聘广告 告 房地产广告 类 型 金融广告
服务广告 商品广告
0
40
80
人数( 人数(人) 120
图2-3 某城市居民关注不同类型广告的人数分布
定类数据的图示— 定类数据的图示—圆形图
第二讲 用图表和统计量看数据
定性数据的展示
用图表展示定性数据 (Excel)
条形图(bar chart) 条形图(bar chart) 柱型图(column) 柱型图(column) 饼图(pie) 饼图(pie) 环形图(doughnut) 环形图(doughnut) 雷达图(radar 雷达图(radar )
方差和标准差s 方差和标准差s
众数(M 众数(M )
O
(概念要点) 概念要点)
1. 2. 3. 4.
出现次数最多的变量值 不受极端值的影响 可能没有众数或有几个众数 主要用于定类数据,也可用于定序数据和 数值型数据
频率( ) 频率(%)
6 10 16 28 20 12 8 100
合计
定量数据的展示
分组数据— 分组数据—直方图
我一眼就看出 来了,大多数 人的日加工零 件数在120~ 件数在120~ 125之间! 125之间!
频 15 数
12
直方图下的面 积之和等于1
(人 ) 9
6 3 105 110 115 120 125 130 135 140
定量数据的展示
等距分组表
(使用开口组) 使用开口组)
某车间50名工人日加工零件数分组表 某车间 名工人日加工零件数分组表 按零件数分组
110以下 以下 110~114 115~119 120~124 125~129 130~134 135以上 以上
频数( 频数(人)
3 5 8 14 10 6 4 50
定性数据的展示
例题2 例题2-1一家市场调查公司为研究不同 类型饮料占有率,随机抽取一家进行调 查,调查员某天对50名顾客购买的类型 查,调查员某天对50名顾客购买的类型 进行记录如下表:
定性数据的展示
顾客购买的饮料类型登记表
绿茶 矿泉水 绿茶 碳酸饮料 矿泉水 碳酸饮料 果汁 碳酸饮料 矿泉水 碳酸饮料 碳酸饮料 绿茶 碳酸饮料 其他 矿泉水 绿茶 绿茶 其他 碳酸饮料 绿茶 绿茶 碳酸饮料 碳酸饮料 绿茶 矿泉水 绿茶 碳酸饮料 矿泉水 其他 其他 果汁 矿泉水 其他 碳酸饮料 其他 果汁 碳酸饮料 果汁 碳酸饮料 果汁 矿泉水 碳酸饮料 绿茶 其他 矿泉水 果汁 碳酸饮料 其他 矿泉水 绿茶
2006年我国高等学校教师职称数据 年我国高等学校教师职称数据 项目 经济学 文学 教授 2576 4632 副教授 9184 18643 讲师 13602 28020 单位: 单位:人 助教 6846 18361 教员 1577 5069
定性数据的展示
饼图
经济学
教员 教授 助教 5% 8% 20%
15 11 10 6 8
饮料类型
定性数据的展示
不同类型饮料分布饼图
其他 16% 果汁 12%
绿茶 22%
矿泉水 20% 碳酸饮料 30%
【例】为研究广告市场的状 况,一家广告公司在某城市 随机抽取200 人就广告问题 随机抽取 200人就广告问题 做了邮寄问卷调查, 做了邮寄问卷调查,其中的 一个问题是“ 一个问题是“您比较关心下 列哪一类广告? 列哪一类广告?” 1.商品广告;2.服务广 商品广告;2 告;3 金融广告;4 告;3.金融广告;4.房地 产广告;5 产广告; 5 . 招生招聘广告 ;6.其他广告。 其他广告。
非常不满意 不满意 一般 满意 非常满意 合计
24 108 93 45 30 300
8 36 31 15 10 100.0
定性数据的展示
定序数据频数分布表
(实例 )
乙城市家庭对住房状况评价的频数分布 乙城市
回答类别
向上累积 户数 (户) 户 百分比 (%) 户数 (户) 户 21 120 198 262 300 — 百分比 (%) 7.0 40.0 66.0 87.3 100.0 —
今天的 主食是 面包
多变量数据— 多变量数据—雷达图
绘制的雷达图) (由 Excel 绘制的雷达图)
食 品 6000 杂项商品和服务 4000 2000 居 住 0 家庭设备用品及服务 衣 着 城市 农村
教育文化娱乐服务 交通和通信
医疗保健
多变量数据— 多变量数据—雷达图
(实例) 实例)
【 例 3 .7 】 为 研 究 某 条河流的污染程度 ,环保局分别在上 游、中游和下游设 立取样点,每个取 样点化验水中的五 项污染指标,所得 数据如表3 13。 数据如表3-13。将各 指标用雷达图表示 出来,并分析该河 流的主要污染源。 流的主要污染源。
某城市居民关注广告类型的频数分布
广告类型 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告 合计
人数(人 人数 人) 112 51 9 16 10 2 200
比例 0.560 0.255 0.045 0.080 0.050 0.010 1
频率(%) 频率 56.0 25.5 4.5 8.0 5.0 1.0 100
指标 4
指标 3
上游 中游 下游
图3-16 河流污染指标雷达图
2.2用统计量描述数据 2.2用统计量描述数据
数据分布的特征和测度
一组数据的概括 众 数 MO 中位数M 中位数Me 均 值M 离中、 离中、离散程度 四分位数Q 四分位数 L Q 离散系数s/ 离散系数s/M
U
分布的形状
偏态S 偏态S 峰度K 峰度K
【例】某生产车 间 50 名 工 人 日 加 工零件数如下( 单位:个)。试 采用单变量值对 数据进行分组。 数据进行分组。
定量数据的展示
建立频数分布表
FREQUENCY(data_array, FREQUENCY(data_array,bins_arra y) Data_array 为一数组或对一组数值的 引用,用来计算频率。 Bins_array 为间隔的数组或对间隔的 引用,该间隔用于对 data_array 中的 数值进行分组。
用图表展示定量数据
频数分布表 1、对数据分k(5≤k ≤ 15)组 、对数据分k 15)组 2、确定各组组距(≈ (max-min) ÷k) 、确定各组组距(≈ (max3、统计各组数据个数(上组限不在内原则) 用图形看数据 1频数分布图-直方图 (histogram) 频数分布图2看原始数据的分布-茎叶图(Stem-and-leaf) 看原始数据的分布-茎叶图(Stem-and-leaf) 3看原始数据的分布-箱线图(Boxes Represent) 看原始数据的分布-箱线图( Represent) 4观察两变量间的关系-散点图 观察两变量间的关系5比较多个样本的相似性-雷达图 比较多个样本的相似性-
绘制的累计频数分布图) (由 Excel 绘制的累计频数分布图)
累 积 300 户 数 200 (户) 100 0 24 132
400 270 300
225
累 积 300 户 300 数 200 (户) 100 0
400
276 168 75 30 非常 满意
非常 不满意 一般 满意 (a)向下累积 向下累积 不满意
向下累积 户数 (户) 户 300 279 180 102 38 — 百分比 (%) 100.0 93.0 60.0 34.0 12.7 —
非常不满意 不满意 一般 满意 非常满意 合计
21 99 78 64 38 300
7.0 33.0 26.0 21.3 12.7 100.0
定性数据的展示
定序数据的图示— 定序数据的图示—累计频数分布图
非常 不满意 一般 满意 不满意 (b)向上累积 向上累积 甲城市家庭对住房状况评价的累积频数分布 非常 满意
定性数据的展示
绘制的环形图) (由 Excel 绘制的环形图)
13% 10% 15% 21%
7% 8% 非常不满意 33% 36% 一般 满意 非常满意 不满意
31% 26% 图3-4
甲乙两城市家庭对住房状况的评价
日加工零件数( 日加工零件数(个) 某车间工人日加工零件数的直方图
【例2.3】某电脑公司2008年前4 某电脑公司2008年前 年前4
个月销售数据如下表(单位:万元) 个月销售数据如下表(单位:万元)
从某大学经济管理专业二年级学生中随机 抽取11人 抽取11人,对8门主要课程的考试成绩进 行调查,数据表如下: 行调查,数据表如下:
定性数据的展示
建立频数分布表
COUNTIF(range,criteria) COUNTIF(range,criteria) Range 为需要计算其中满足条件的单 元格数目的单元格区域。 Criteria 为确定哪些单元格将被计算 在内的条件,其形式可以为数字、表达 式或文本。例如,条件可以表示为 32、 32、 "32"、 "32"、">32" 或 "apples"。 "apples"。
表3-13
不同样本点的化验指标
指标4 指标5 指标 指标 196 41 112 14 6 35
指标1 指标2 指标3 指标 指标 指标 上游 中游 下游 4.52 0.34 2.17 5.0 1.4 6.8 483 36 208
多变量数据— 多变量数据—雷达图
指标 1 1000 100 10 指标 5 1 0.1 指标 2
绘制的圆形图) (由 Excel 绘制的圆形图)
房地产广告 招生招聘广告 其他广告 1.0% 8.0% 5.8% 金融广告 4.5%
服务广告 25.5%
商品广告 56.0%
图2-4 某城市居民关注不同类型广告的人数构成
定性数据的展示
例2-2:根据2006年我国高等学校分科专任教 根据2006年我国高等学校分科专任教 师数据, 师数据,分别按教师的职称构成和分科构成绘 制圆形图和环形图。 制圆形图和环形图。
定量数据的展示
频数分布表的编制
(实例) 实例)
117 125 108 108 110 112 112 135 137 121 122 124 129 139 107 117 130 122 131 125 117 122 133 126 122 118 118 123 126 133 134 127 123 118 134 127 123 119 113 120 123 127 114 120 128 124 115 139 128 124
8门课程考试成绩的箱线图
11名考生考试成绩箱线图 11名考生考试成绩箱线图
多变量数据— 多变量数据—雷达图
【 例 】2006 年 上 海城乡居民家庭 平均每人各项生 活消费支出数据 如表3 12。 如表3-12。试绘制 雷达图。 雷达图。 表 2006年上海城乡居民家庭人均生活消费支出 年上海城乡居民家庭人均生活消费支出
定性数据的展示
Excel的函数 Excel的函数COUNTIF输出 的函数COUNTIF输出
频数表
饮料类型 绿茶 矿泉水 碳酸饮料 果汁 其他 总计
频数 11 10 15 6 8 50
百分比% 百分比% 22 20 30 12 16 100
定性数据的展示
不同类型饮料柱型图
16 12 频 8 数 4 0
【例】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各抽样调查300 户 各抽样调查300户 ,其中的一个问 题是:“您对您 家庭目前的住房 状况是否满意? 状况是否满意? 1 .非常不满 意;2 意;2.不满意; 3 . 一般;4 . 满 一般; 4 意;5 意;5.非常满意 。
甲城市家庭对住房状况评价的频数分布 甲城市 回答类别 户数 (户) 户 百分比 (%) 向上累积 户数 (户 (户 ) 24 132 225 270 300 — 百分比 (%) 8.0 44.0 75.0 90.0 100.0 — 向下累积 户数 (户 (户 ) 300 276 168 75 30 — 百分比 (%) 100.0 92 56 25 10 —
副教授 27%
教授 副教授 讲师 助教 教员
讲师 40%
定性数据的展示
环形图
内:经济学 外:文学
7% 25% 20% 5% 8%
6% 教授 副教授 讲师 助教 教员
27% 25%
40% 37%
定性数据的展示
雷达图
教授 40 30 20 10 0
教员
副教授 经济学 文学
助教
讲师
定பைடு நூலகம்数据的展示
定序数据频数分布表
定类数据的图示— 定类数据的图示—条形图
绘制的条形图) (由 Excel 绘制的条形图)
2
其他广告
10 16 9 51 112
广招生招聘广告 告 房地产广告 类 型 金融广告
服务广告 商品广告
0
40
80
人数( 人数(人) 120
图2-3 某城市居民关注不同类型广告的人数分布
定类数据的图示— 定类数据的图示—圆形图
第二讲 用图表和统计量看数据
定性数据的展示
用图表展示定性数据 (Excel)
条形图(bar chart) 条形图(bar chart) 柱型图(column) 柱型图(column) 饼图(pie) 饼图(pie) 环形图(doughnut) 环形图(doughnut) 雷达图(radar 雷达图(radar )
方差和标准差s 方差和标准差s
众数(M 众数(M )
O
(概念要点) 概念要点)
1. 2. 3. 4.
出现次数最多的变量值 不受极端值的影响 可能没有众数或有几个众数 主要用于定类数据,也可用于定序数据和 数值型数据
频率( ) 频率(%)
6 10 16 28 20 12 8 100
合计
定量数据的展示
分组数据— 分组数据—直方图
我一眼就看出 来了,大多数 人的日加工零 件数在120~ 件数在120~ 125之间! 125之间!
频 15 数
12
直方图下的面 积之和等于1
(人 ) 9
6 3 105 110 115 120 125 130 135 140
定量数据的展示
等距分组表
(使用开口组) 使用开口组)
某车间50名工人日加工零件数分组表 某车间 名工人日加工零件数分组表 按零件数分组
110以下 以下 110~114 115~119 120~124 125~129 130~134 135以上 以上
频数( 频数(人)
3 5 8 14 10 6 4 50
定性数据的展示
例题2 例题2-1一家市场调查公司为研究不同 类型饮料占有率,随机抽取一家进行调 查,调查员某天对50名顾客购买的类型 查,调查员某天对50名顾客购买的类型 进行记录如下表:
定性数据的展示
顾客购买的饮料类型登记表
绿茶 矿泉水 绿茶 碳酸饮料 矿泉水 碳酸饮料 果汁 碳酸饮料 矿泉水 碳酸饮料 碳酸饮料 绿茶 碳酸饮料 其他 矿泉水 绿茶 绿茶 其他 碳酸饮料 绿茶 绿茶 碳酸饮料 碳酸饮料 绿茶 矿泉水 绿茶 碳酸饮料 矿泉水 其他 其他 果汁 矿泉水 其他 碳酸饮料 其他 果汁 碳酸饮料 果汁 碳酸饮料 果汁 矿泉水 碳酸饮料 绿茶 其他 矿泉水 果汁 碳酸饮料 其他 矿泉水 绿茶
2006年我国高等学校教师职称数据 年我国高等学校教师职称数据 项目 经济学 文学 教授 2576 4632 副教授 9184 18643 讲师 13602 28020 单位: 单位:人 助教 6846 18361 教员 1577 5069
定性数据的展示
饼图
经济学
教员 教授 助教 5% 8% 20%