2统计学-图表描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简便,无信息损失 变量取值较多,不影响其显示效果 变量值较多,观测较多不影响显示效 果。概括性好 变量值较多,观测较多不影响显示效 果。概括性较好。反映次数分布直观
如果变量取较多,效果不好 如果观测数较大,显示效果不好 有信息损失 有信息损失。组数的确定带有一定 的主观性
直方图
多变量数据的图表描述
不满意 一般 满意 非常满意 合 计
24
108 93 45 30 300
8wenku.baidu.com0
36.0 31.0 15.0 10.0 100
24
132 225 270 300 -
8.0
44.0 75.0 90.0 100.0 -
300
276 168 75 30 -
100.0
92.0 56.0 25.0 10.0 -
116 43 8.1
9
第三步 汇总频数
上限不在本组内
如78应汇入78-83组
尺矩数据的图表描述
频 数
由频率所得的直方 图与由频数所得的直方 图的特征相同。
频 率
二百只灯泡的可使用小时数次数分布直方图
尺矩数据的图表描述
二百只灯泡可 使用小时数频 数分布盒形图
将数据分为 9 组时的直方图 60 24
由直方图看次数分布特征
钟形的右偏分布
尺矩数据的图表描述
由直方图看次数分布特征
钟形的左偏分布
尺矩数据的图表描述
由直方图看次数分布特征
正J形分布
尺矩数据的图表描述
由直方图看次数分布特征
反J形分布
尺矩数据的图表描述
由直方图看次数分布特征
U形分布
尺矩数据的图表描述
几种图示方法优劣比较 优 点线图 茎叶图 盒形图 点 缺 陷
某地一星期申请结婚女性年龄频数分布直方图(histogram)
尺矩数据的图表描述 二百只灯泡样本的可使用小时数 107 54 66 62 74 92 75 65 81 83 78 90 96 66 68 85 83 74 73 73 65 62 116 86 78 90 81 62 70 66 78 75 86 72 67 68 91 77 68 71 79 65 73 88 62 75 79 70 66 71 64 96 77 87 72 76 79 97 80 86 88 80 77 89 62 83 81 94 101 76 89 60 80 67 83 94 76 84 68 64 68 103 71 94 93 77 77 78 72 81 87 84 92 66 63 79 88 74 79 78 88 71 71 61 72 63 43 77 71 84 93 89 68 59 94 62 61 78 89 63 74 85 65 84 66 59 74 85 75 69 82 61 62 49 61 82 79 72 68 70 84 62 67 75 67 65 99 77 76 96 73 71 98 79 65 77 58 88 74 83 92 59 68 61 82 59 51 89 77 72 81 57 98 98 86 69 81 76 63 65 58 76 71 86 88-93 92 45 75 102 76 65 93-98 98-103 103-108 108-113 113-118 10 6 2 0 1 19 上限 下限 68-73 73-78 78-83 83-88 28 33 26 21 43-48 48-53 53-58 58-63 63-68 2 1 2 21 28 小时数 灯泡数
0
6 能在变量取值较多的情况下,很 好地显示分布状况,同时又没有丢失信
息。但不适合观测较多的数据。
6 0 4 7 0 0 0 1 1 3 3 4 5 5 5 5 6 6 7 7 7 9 9 9 9 2 2 3 3 3 3 4 4 4 9
尺矩数据的图表描述
适用变量取值较多和频数较多 下 四 分 位 数 上 四 分 位 数 的情况,但有一定的信息损失。
可口可乐
雪 碧
杏仁露 新骑士 醒 目 总 计
13
8 5 5 50
26
16 10 10 100
就某一变量针对总体中的大量个体 所搜集的数据,是大量的、零散的。须 对其进行分组和汇总整理。整理的结果 可用频数分布表来显示。
定类数据的图表描述
用饼形图表示频率分布 频 数
频 率
%
20 10,0% 10,0%
点线图简化了 数据,而且没有任 何信息损失。
20
25
30
35
40
45
50
55
60
变量取值 较少时,适宜 制作点线图。
点线图及后面将要 介绍的各种图形适宜数 量型变量数据的图示。
尺矩数据的图表描述
某地一星期申请结婚女性年龄频数分布茎叶图(stem plot)
6
5+ 5 4+ 4 3+ 3 2+ 2 1+
56
23 33 23 23 22
40
25 29 23 60 31
30
29 46 44 25 24
36
33 25 29 27 26
19 23 25 29 30 36
22 24 25 29 31 37
22 24 26 29 31 40
23 24 27 29 33 44
23 25 27 30 33 46
23 25 27 30 34 56
甲城市
乙城市
10,0%
8,0% 12,7%
7,0%
15,0% 36,0% 21,3% 33,0%
31,0% 26,0%
甲乙两城市家庭对住房状况评价频数分布饼形图
定序数据的图表描述
甲城市家庭对住房状况评价累积频数表 甲城市 回答类别 频数 频率% 频数 频率% 频数 频率% 向上累积 向下累积
非常不满意
年龄
n =37 14 24 最 大 观 测 值
最 小 观 测 值
中 位 数
最 大 观 测 值
10
20
30
40
50
60
70
某地一星期申请结婚女性年龄频数盒形图(box plot)
尺矩数据的图表描述
11名学生各科成绩 110 编号 1 2 3 4 5 6 7 8 9 10 11 英语 76 90 97 71 70 93 86 83 78 85 81 数学 65 95 51 74 78 63 91 82 75 71 55 经济学 93 81 76 88 66 79 83 92 78 86 78 营销学 74 87 85 69 90 80 77 84 91 74 70 统计 55 91 68 73 84 81 70 69 94 50 62 71 60 70 90 100
40
38,0% 16,0%
38%
10
20
26,0% 0 饼形图(pie chart ) 可口 可乐 雪碧 杏 仁露 新 骑士 醒目 0
条形图(bar chart)
定类数据频数分布的图示可采用饼形图或条形图
定类数据的图表描述
10,0% 10,0% 10,0% 10,0% 38,0% 16,0% 38,0% 360 ×38% 16,0%
50
40
30
20
10
0 46.7 55.0 63.3 71.7 80.0 88.3 96.7 105.0 113.3
二百只灯泡的可使用小时数频数分布直方图
尺矩数据的图表描述
由直方图看次数分布特征
观测无限增多,组数无限增 多,组距无限缩小,分布特征不
变,则图形趋近平滑曲线。
钟形的对称分布
尺矩数据的图表描述
满意
非常满意 合 计
45
30 300
15
10 100
64
38 300
21.3
12.7 100
定序数据的图表描述
120
甲城市
乙城市
100
80
60
40
20 0
非常 不满 意
不 满 意
一 般
满 意
非常 满意
非常 不满 意
不 满 意
一 般
满 意
非常 满意
甲乙两城市家庭对住房状况评价频数分布条形图
定序数据的图表描述
盒形图便于 变量间频数分特 征的比较。
80
40 n=
11 英语
11 数学
11 经济学
11 营销学
11 统计学
11名学生各科成绩频数分布盒形图
尺矩数据的图表描述
20
适用于大量观测的 情况,能很好地显示次 数分布状况。但也丢失 了不少数据细节。 10
直方图 0 20 25 30 35 40 45 50 55 60 通常是 等距的
新 骑 士 雪 碧
杏 仁 露 杏 仁 露 杏 仁 露 杏 仁 露 杏 仁 露 杏 仁 露 杏 仁 露 杏 仁 露
可口可乐 雪 碧
可口可乐 雪 醒 碧 目
可口可乐 醒 雪 目 碧
杏 仁 露 杏 仁 露
可口可乐
5软饮料购买频数分布表 软饮料 可口可乐 频数 19 频率% 38
频数是落在各类别 中的数据个数。各类别 频数与总频数之比称频 率。频数和频率分别从 绝对数和相对数上,反 映出数据在各变量值上 的分布状况。
二 百 只 灯 泡 使 用 小 时 数 组 距 频 数 分 布 表
73
63
63
89
82
64
85
92
64
73
第一步 确定组数
K 1
lg n lg 2
1
lg 200 8.64 9 lg 2
组。
※本例SPSS默认组数为15 可见该方法并非绝对。
第二步 确定组距
组距=(最大观测值-最小观测值)÷组数 ※组距宜取整数。最好是5或5的倍数
60
某地一星期申请结婚女性年龄频数分布表 年龄 19 22 23 24 25 26 27 29 频数 1 2 4 3 4 2 3 4 年龄 31 33 34 37 40 44 46 56 频数 2 2 1 1 1 1 1 1
30
3
60
1
尺矩数据的图表描述
某地一星期申请结婚女性年龄频数分布点线图(line plot)
可口可乐
可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 雪 碧
雪
雪 雪 雪 雪 雪 雪 雪 雪 雪
碧
碧 碧 碧 碧 碧 碧 碧 碧 碧
雪
雪
碧
碧
新 骑 士
新 骑 士 新 骑 士 新 骑 士 新 骑 士 醒 醒 醒 醒 醒 目 目 目 目 目
可口可乐 醒 目
杏 仁 露 可口可乐 可口可乐 醒 目
定序数据的图表描述
甲城市家庭对住房状况评价累积频数图
向上 累计 300
200
100 向下 累计 0
非 常 不 满 意
不 满 意
一 般
满 意
非 常 满 意
尺矩数据的图表描述
某地一星期申请结婚女性年龄原始数据
某地一星期申请结婚女性年龄排序
30
31 29 34 30 37 27
27
24 22 19 25 24
0
38%
26,0%
26,0%
饼形图的组数不宜太多
定类数据的图表描述
可口 可乐
雪碧
20
频 数
20
醒目
10
0
10 欧美人的观赏习惯
20
10
0
0 可口 可乐 雪碧 杏 仁露 新 骑士 醒目 醒目 新 骑士 杏 仁露 雪碧 可口 可乐
中国人的观赏习惯
阿拉伯人的观赏习惯
定序数据的图表描述
甲乙两城市家庭对住房状况评价频数分布表 甲城市 回答类别 频数 非常不满意 不满意 一般 24 108 93 频率% 8 36 31 频数 21 99 78 频率% 7 33 26 乙城市
定类数据的图表描述 对观测值按编码顺序排序,可获得一 种条理化结构,以观察观测值的变动范围。
可口可乐 可口可乐 雪 碧
杏 仁 露 可口可乐 可口可乐 杏 仁 露 可口可乐 杏 仁 露 新 骑 士 杏 仁 露
5种软饮料购买频数排序
可口可乐 杏 仁 露 可口可乐 醒 目
可口可乐
可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐
三十名学生的身高与体重数据 序号 1 2 身高x 156.0 155.0 144.6 161.5 161.3 158.0 161.0 162.0 164.3 144.0 157.9 176.1 168.0 164.5 153.0 体重y 47.5 37.8 38.6 41.6 43.3 47.3 47.1 47.0 33.8 33.8 49.2 54.5 50.0 44.0 58.0 序号 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 身高x 164.7 160.5 147.0 153.2 157.9 166.0 169.0 170.0 165.1 172.0 159.4 161.3 158.0 158.6 169.0 体重y 44.1 53.0 36.4 30.1 40.4 57.0 58.5 51.0 58.0 55.0 44.7 45.4 44.3 42.8 51.1
图 表 描 述
用SPSS作图表描述
图 表 描 述
定类数据的图表描述
定序数据的图表描述 多变量数据的图表描述
尺矩数据的图表描述
5种软饮料购买频数原始记录 可口可乐 新 骑 士 可口可乐 雪 雪 碧 碧 新 骑 士 可口可乐 可口可乐 雪 碧 雪 雪 碧 碧 雪 雪 碧 碧 可口可乐 新 骑 士 雪 碧