统计数据的图表展示
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
k 1 3 .3 2 2 ( lo g 1 0 n )
•最小K值法
mink|{2K n}
2020/6/30
组距、组上限、组下限
i(Higheslut e-vLaowesutev)al Numobfecrlasses
2020/6/30
V al i d
152.00
154.00
155.00
156.00
跳水 举重 次数 乒乓球 f 羽毛球 体操 射击 柔道 田径 跆拳道
5枚
5枚 4枚 4枚 3枚 3枚 2枚 1枚 1枚
频率 f /∑f
0.1786
0.1786 0.1429 0.1429 0.1071 0.1071 0.0714 0.0357 0.0357
2020/6/30
2020/6/30
《统计学》第二章 统计数据 STAT
1
1
3
2
5 5
4 3
圆形图(饼4 图 Pie)
体操 举重 乒乓球 羽毛球 射击 跳水 柔道 田径 跆拳道
《统计学》第二章 统计数据 STAT
7%
4% 4%
11%
17% 18%
11%
14%
14%
圆形图(饼图 Pie)
2020/6/30
体操 举重 乒乓球 羽毛球 射击 跳水 柔道 田径 跆拳道
《统计学》第二章 统计数据 STAT
跳水
5枚
举重
5枚
乒乓球
4枚
羽毛球
4枚
体操
3枚
射击
3枚
柔道 品质2数枚 列
田径
1枚
跆拳道
1枚
0.1786
0.1786 0.1429 0.1429 0.1071 0.1071 0.0714 0.0357 0.0357
2020/6/30
《统计学》第二章 统计数据 STAT
获金牌项目 金牌数 占总数比例
变量值 x
8.4
39.8
8
9.6
9.6
49.4
4
4.8
4.8
54.2
3
3.6
3.6
57.8
约2/3的8人身高不9.6 超过169.65cm 67.5
5
6.0
6.0
73.5
3
3.6
3.6
77.1
频数表 7
8.4
8.4
85.5
1
1.2
1.2
86.7
5
6.0
6.0
92.8
(用2 SPSS制2.4 作) 2.4
95.2
Cumulative relative percent of population
2020/6/30
Lorentz Curve
A B
Cumulative relative percent of income累计次数 分布图
2020/6/30
Exploratory Data Analysis
• The techniques of exploratory data analysis consist of simple arithmetic and easy-to-draw pictures that can be used to summarize data quickly.
限为175 估计组中
组距数列
值为172.5
2020/6/30
14 12 10
8 6 4 2 0
VAR00001
40
30
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
. . . . . . . . . . . . . . . . . . . . . . .
3
3.6
3.6
98.8
1
1.2
1.2
100.0
83
100.0
100.0
Example: Hudson Auto Repair
• Relative Frequency and Percent Frequency Distributions
Relative
Percent
Cost ($) Frequency Frequency
174.00
直方图
2020/6/30
研究贫富差别的基本方法:将人口按 收入水平等分为 5 组,观察收入差别。
20% 20% 20% 20% 20% 中国九十年代:最富的20%家庭
拥有全部财富的48%,最穷的20%家 庭拥有全部财富的4%。
2020/6/30
Lorentz CGu=rvAe/(A+B)
8
30
Count
6
4
5
5
4
4
2
3
3
0
2
举重
乒乓球
射击
柔道
20
10 0 田径
跳水
羽毛球
体操
跆拳道
2020/6/30
3.3数值型数据的整理与 展示
• Frequency Distribution频数分布 • Relative Frequency and Percent Frequency
Distributions相对频数和百分数 • Dot Plot打点图 • Histogram直方图 • Cumulative Distributions累计分布图 • Ogive穹形图
中国体育代表团在悉尼 奥运会上获金牌的项目
举重 射击 射击 跳水 体操 体操 乒乓 球 举重 乒乓球 羽毛球 举重 乒乓球 羽毛球 举重 举重 跳水 跳水 跳水 乒乓球 跳水 射击 体操 羽毛球 柔道 柔道 举重 田径 羽毛球 跆拳道
2020/6/30
《统计学》第二章 统计数据 STAT
获金牌项目 金牌数 占总数比例
• One such technique is the stem-andleaf display.
2020/6/30
Stem-and-Leaf Display
• A stem-and-leaf display shows both the rank order and shape of the distribution of the data.
17 0
0
.
1 0
7
1
.
1 0
7
2.
17 0
3
.
1N7 0
=
4.
83.00
0
VA R0000 1 14
12
条10形图
8
C oun t
6
4
2
0 152.00 155.00
2020/6/30 VAR00001
157.00
159.00
161.00
163.00
165.00
167.00
169.00
171.00
2020/6/30
次数 f
某年级次8数3名女生频身率高资料
f
f/Σf
身高
(CM) 150-155 155-160 160-165 165-170 170以上
总计
人数
(人) 3
11 34 24 11
83
比重
(%) 3.61
13.25 40.96 28.92 13.25
100
组距数列
2020/6/30
4 3 2 1 0 9 8 7 6 5 4 3 2 1 0 9 8 7 6 5 4 3 2
7 7 7 7 7 6 6 6 6 6 6 6 6 6 6 5 5 5 5 5 5 5 5
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Std. Dev = 4.86 Mean = 163.3 N = 83.00
V al i d P erc ent
Cumulative P erc ent
1
1.2
1.2
1.2
2
2.4
2.4
3.6
2
2.4
2.4
6.0
4
频数
1 2
4.8
频率1.2 2.4
4.8
有效1.2 2.4
10.8
累计12.0 14.5
2 12
2.4 14.5
频率2.4 14.5
频率16.9 31.3
7
8.4
有效 157.00 158.00
数据 159.00 160.00
161.00
162.00
163.00
164.00
165.00
166.00
167.00
168.00
169.00
170.00
171.00
172.00
174.00 2020/6/3T0otal
V AR00 0 01
Frequency
P erc ent
14
12
直10 方图
8
6
4
2
Std. Dev = 4.86
Mea n = 163 .3
0
1
5
2.
1 0
5
3
.
1 0
5
4
.
1 0
5
5.
1 0
5
6
.
1 0
5
7
.
15 0
8
.
1 0
5
9
.
1 0
6
0
.
16 0
1
.
1 0
6
2
.
1 0
6
3
.
16 0
4
.
1 0
6
5
.
1 0
6
6.
1 0
6
7
.
1 0
6
8
.
1 0
6
9.
50-59
.04
4
60-69
.26
26
70-79
.32
32
80-89
.14
14
2020/6/30
90-99
.14
14
Dot Plot
• One of the simplest graphical summaries of data is a dot plot.
• A horizontal axis shows the range of data values.
单值数列
30
20
10
Std. Dev = 4.86
Mean = 163.3
0
N = 83.00
152.5
157.5
162.5
167.5
172.5
组距为2.5的组距数列 155.0
160.0
165.0
170.0
175.0
VAR00001
40
30
20
20
10
Std. Dev = 4.86
Mean = 163.3
and Scatter Diagrams
2020/6/30
频数分布
相对频数
Frequency Distribution Relative Frequency
百分数
Percent Frequency Distribution
.
2020/6/30
饼状图 Pie Chart
条形图 Bar Graph
《统计学》第二章 统计数据 STAT
• Then each data value is represented by a dot placed above the axis.
2020/6/30
Example: Hudson Auto Repair
•
Dot
.
Plot
.
....
......... .................. .. . .. . .
..... . ...
.
50
60
70
80
90
100 110
Cost ($)
2020/6/30
40
直方图(Histogram)
30
20
10
Std. Dev = 4.86
Mean = 163.3
0
N = 83.00
154.0
158.0
162.0
166.0
170.0
174.0
VAR00001
2020/6/30
0
N = 83.00
组距为4的组距数列 154.0
158.0
162.0
166.0
170.0
174.0
2020/6/30
VAR00001
10
Std. Dev = 4.86
Mean = 163.3
0
N = 83.00
组距为6的组距数列 154.0
160.0
166.0
172.0
VAR00001
组数
•Sturges 经验公式
• Example 2.3 - coHinstotignraumed (Excel
Frequency
represen80ta7t3ion) 70
64
60
52
50
36
40
28
30
Frequency
20
10
0
1
2
3
4
5 M ore
Are a
2020/6/30
2020/6/30
《统计学》第二章 统计数据 STAT
5
5
5
4
44
33
3
2
2
1
11
0 体操
举重 乒乓球 羽毛球 射击 跳水 柔道
条形图(Bar)
田径 跆拳道
2020/6/30
Percent
30 28
90-100% C类因素
100
26
80-90% B类因素
90
24
22
0-80% A类因素
80
20
70
18
帕累16 托图
60
Pa1142reto
50
40
10
2020/6/30
变量值 某年级83名女生身高资料
x 身高 人数
身高 人数
(CM) (人)
(CM) (人)
152
1
164
3
154
2
165
8
155
2
166
5
156
4
167
3
157
1
168
7
158
2
169
1
159
2
170
5
160 12
171
2
161 单7值(项)1数72列 3
162
8
174ห้องสมุดไป่ตู้
1
163
4
总计 83
2
11
3
5
3 4
5 4
圆形图(饼图 Pie)
2020/6/30
体操 举重 乒乓球 羽毛球 射击 跳水 柔道 田径 跆拳道
2020/6/30
2020/6/30
• Bar Charts条状图
– Bar charts provide an alternative to pie charts.
– The frequency (or relative frequency) of each category is represented by a vertical bar.
上组限U 某年级83名女生身高资料
身高
人数组距d
下组限L
(CM) 150-155 155-160
(人)d=U-L 如13:1 160-155=5
开口组 d=邻组d 估计上组
160-165
165-170 170以上
总计
34 24
组中值x
11 x=(U+L)/2
如8:3(165+170)/2=167.5
2020/6/30
Contents
品质数据汇总
▪ 数量数据汇总 ▪ 探索性数据分析:
▪茎叶图
▪ 交叉分组列表和散点图
Summarizing Qualitative Data Summarizing Quantitative Data
Exploratory Data Analysis Crosstabulations
•最小K值法
mink|{2K n}
2020/6/30
组距、组上限、组下限
i(Higheslut e-vLaowesutev)al Numobfecrlasses
2020/6/30
V al i d
152.00
154.00
155.00
156.00
跳水 举重 次数 乒乓球 f 羽毛球 体操 射击 柔道 田径 跆拳道
5枚
5枚 4枚 4枚 3枚 3枚 2枚 1枚 1枚
频率 f /∑f
0.1786
0.1786 0.1429 0.1429 0.1071 0.1071 0.0714 0.0357 0.0357
2020/6/30
2020/6/30
《统计学》第二章 统计数据 STAT
1
1
3
2
5 5
4 3
圆形图(饼4 图 Pie)
体操 举重 乒乓球 羽毛球 射击 跳水 柔道 田径 跆拳道
《统计学》第二章 统计数据 STAT
7%
4% 4%
11%
17% 18%
11%
14%
14%
圆形图(饼图 Pie)
2020/6/30
体操 举重 乒乓球 羽毛球 射击 跳水 柔道 田径 跆拳道
《统计学》第二章 统计数据 STAT
跳水
5枚
举重
5枚
乒乓球
4枚
羽毛球
4枚
体操
3枚
射击
3枚
柔道 品质2数枚 列
田径
1枚
跆拳道
1枚
0.1786
0.1786 0.1429 0.1429 0.1071 0.1071 0.0714 0.0357 0.0357
2020/6/30
《统计学》第二章 统计数据 STAT
获金牌项目 金牌数 占总数比例
变量值 x
8.4
39.8
8
9.6
9.6
49.4
4
4.8
4.8
54.2
3
3.6
3.6
57.8
约2/3的8人身高不9.6 超过169.65cm 67.5
5
6.0
6.0
73.5
3
3.6
3.6
77.1
频数表 7
8.4
8.4
85.5
1
1.2
1.2
86.7
5
6.0
6.0
92.8
(用2 SPSS制2.4 作) 2.4
95.2
Cumulative relative percent of population
2020/6/30
Lorentz Curve
A B
Cumulative relative percent of income累计次数 分布图
2020/6/30
Exploratory Data Analysis
• The techniques of exploratory data analysis consist of simple arithmetic and easy-to-draw pictures that can be used to summarize data quickly.
限为175 估计组中
组距数列
值为172.5
2020/6/30
14 12 10
8 6 4 2 0
VAR00001
40
30
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
. . . . . . . . . . . . . . . . . . . . . . .
3
3.6
3.6
98.8
1
1.2
1.2
100.0
83
100.0
100.0
Example: Hudson Auto Repair
• Relative Frequency and Percent Frequency Distributions
Relative
Percent
Cost ($) Frequency Frequency
174.00
直方图
2020/6/30
研究贫富差别的基本方法:将人口按 收入水平等分为 5 组,观察收入差别。
20% 20% 20% 20% 20% 中国九十年代:最富的20%家庭
拥有全部财富的48%,最穷的20%家 庭拥有全部财富的4%。
2020/6/30
Lorentz CGu=rvAe/(A+B)
8
30
Count
6
4
5
5
4
4
2
3
3
0
2
举重
乒乓球
射击
柔道
20
10 0 田径
跳水
羽毛球
体操
跆拳道
2020/6/30
3.3数值型数据的整理与 展示
• Frequency Distribution频数分布 • Relative Frequency and Percent Frequency
Distributions相对频数和百分数 • Dot Plot打点图 • Histogram直方图 • Cumulative Distributions累计分布图 • Ogive穹形图
中国体育代表团在悉尼 奥运会上获金牌的项目
举重 射击 射击 跳水 体操 体操 乒乓 球 举重 乒乓球 羽毛球 举重 乒乓球 羽毛球 举重 举重 跳水 跳水 跳水 乒乓球 跳水 射击 体操 羽毛球 柔道 柔道 举重 田径 羽毛球 跆拳道
2020/6/30
《统计学》第二章 统计数据 STAT
获金牌项目 金牌数 占总数比例
• One such technique is the stem-andleaf display.
2020/6/30
Stem-and-Leaf Display
• A stem-and-leaf display shows both the rank order and shape of the distribution of the data.
17 0
0
.
1 0
7
1
.
1 0
7
2.
17 0
3
.
1N7 0
=
4.
83.00
0
VA R0000 1 14
12
条10形图
8
C oun t
6
4
2
0 152.00 155.00
2020/6/30 VAR00001
157.00
159.00
161.00
163.00
165.00
167.00
169.00
171.00
2020/6/30
次数 f
某年级次8数3名女生频身率高资料
f
f/Σf
身高
(CM) 150-155 155-160 160-165 165-170 170以上
总计
人数
(人) 3
11 34 24 11
83
比重
(%) 3.61
13.25 40.96 28.92 13.25
100
组距数列
2020/6/30
4 3 2 1 0 9 8 7 6 5 4 3 2 1 0 9 8 7 6 5 4 3 2
7 7 7 7 7 6 6 6 6 6 6 6 6 6 6 5 5 5 5 5 5 5 5
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Std. Dev = 4.86 Mean = 163.3 N = 83.00
V al i d P erc ent
Cumulative P erc ent
1
1.2
1.2
1.2
2
2.4
2.4
3.6
2
2.4
2.4
6.0
4
频数
1 2
4.8
频率1.2 2.4
4.8
有效1.2 2.4
10.8
累计12.0 14.5
2 12
2.4 14.5
频率2.4 14.5
频率16.9 31.3
7
8.4
有效 157.00 158.00
数据 159.00 160.00
161.00
162.00
163.00
164.00
165.00
166.00
167.00
168.00
169.00
170.00
171.00
172.00
174.00 2020/6/3T0otal
V AR00 0 01
Frequency
P erc ent
14
12
直10 方图
8
6
4
2
Std. Dev = 4.86
Mea n = 163 .3
0
1
5
2.
1 0
5
3
.
1 0
5
4
.
1 0
5
5.
1 0
5
6
.
1 0
5
7
.
15 0
8
.
1 0
5
9
.
1 0
6
0
.
16 0
1
.
1 0
6
2
.
1 0
6
3
.
16 0
4
.
1 0
6
5
.
1 0
6
6.
1 0
6
7
.
1 0
6
8
.
1 0
6
9.
50-59
.04
4
60-69
.26
26
70-79
.32
32
80-89
.14
14
2020/6/30
90-99
.14
14
Dot Plot
• One of the simplest graphical summaries of data is a dot plot.
• A horizontal axis shows the range of data values.
单值数列
30
20
10
Std. Dev = 4.86
Mean = 163.3
0
N = 83.00
152.5
157.5
162.5
167.5
172.5
组距为2.5的组距数列 155.0
160.0
165.0
170.0
175.0
VAR00001
40
30
20
20
10
Std. Dev = 4.86
Mean = 163.3
and Scatter Diagrams
2020/6/30
频数分布
相对频数
Frequency Distribution Relative Frequency
百分数
Percent Frequency Distribution
.
2020/6/30
饼状图 Pie Chart
条形图 Bar Graph
《统计学》第二章 统计数据 STAT
• Then each data value is represented by a dot placed above the axis.
2020/6/30
Example: Hudson Auto Repair
•
Dot
.
Plot
.
....
......... .................. .. . .. . .
..... . ...
.
50
60
70
80
90
100 110
Cost ($)
2020/6/30
40
直方图(Histogram)
30
20
10
Std. Dev = 4.86
Mean = 163.3
0
N = 83.00
154.0
158.0
162.0
166.0
170.0
174.0
VAR00001
2020/6/30
0
N = 83.00
组距为4的组距数列 154.0
158.0
162.0
166.0
170.0
174.0
2020/6/30
VAR00001
10
Std. Dev = 4.86
Mean = 163.3
0
N = 83.00
组距为6的组距数列 154.0
160.0
166.0
172.0
VAR00001
组数
•Sturges 经验公式
• Example 2.3 - coHinstotignraumed (Excel
Frequency
represen80ta7t3ion) 70
64
60
52
50
36
40
28
30
Frequency
20
10
0
1
2
3
4
5 M ore
Are a
2020/6/30
2020/6/30
《统计学》第二章 统计数据 STAT
5
5
5
4
44
33
3
2
2
1
11
0 体操
举重 乒乓球 羽毛球 射击 跳水 柔道
条形图(Bar)
田径 跆拳道
2020/6/30
Percent
30 28
90-100% C类因素
100
26
80-90% B类因素
90
24
22
0-80% A类因素
80
20
70
18
帕累16 托图
60
Pa1142reto
50
40
10
2020/6/30
变量值 某年级83名女生身高资料
x 身高 人数
身高 人数
(CM) (人)
(CM) (人)
152
1
164
3
154
2
165
8
155
2
166
5
156
4
167
3
157
1
168
7
158
2
169
1
159
2
170
5
160 12
171
2
161 单7值(项)1数72列 3
162
8
174ห้องสมุดไป่ตู้
1
163
4
总计 83
2
11
3
5
3 4
5 4
圆形图(饼图 Pie)
2020/6/30
体操 举重 乒乓球 羽毛球 射击 跳水 柔道 田径 跆拳道
2020/6/30
2020/6/30
• Bar Charts条状图
– Bar charts provide an alternative to pie charts.
– The frequency (or relative frequency) of each category is represented by a vertical bar.
上组限U 某年级83名女生身高资料
身高
人数组距d
下组限L
(CM) 150-155 155-160
(人)d=U-L 如13:1 160-155=5
开口组 d=邻组d 估计上组
160-165
165-170 170以上
总计
34 24
组中值x
11 x=(U+L)/2
如8:3(165+170)/2=167.5
2020/6/30
Contents
品质数据汇总
▪ 数量数据汇总 ▪ 探索性数据分析:
▪茎叶图
▪ 交叉分组列表和散点图
Summarizing Qualitative Data Summarizing Quantitative Data
Exploratory Data Analysis Crosstabulations