数据整理与统计图表
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
76~80分
矩形下的 面积和为1
图2.1《教育统计学》成绩的直方图
21
20
人 数
一组资料的任何图形的
异常值(outlier),是
指落在图形一般形态之
10
外的观测值。如左图中,
有两组的人数特别少。
这两组分别是45和100
这两组
0
45.0
50.0
55.0
60.0
65.0
70.0
75.0
80.0
85.0
2
数据的初步整理
3
数据的初步整理
数据整理的基本方式有两种:排序和统计分组。
一、 数据排序
❖ 将一组数据按照数值大小、高低、长短、多少等,依 升序或降序排列,就可显示出数据的分布情况。
❖ 对字符型数据,如性别、职业类别等,汉字可依照汉 语拼音、笔画数等排序,英文可按字母顺序排序。
❖ 数据排序后,还可进一步划分等级,如考试分数排序 后可转化为优良中差等级别,也可确定名次。
二者所表示的频数分布是一致的
23
图2.3《教育统计学》成绩的折线图
24
70 60
50
40 30
20 10
56 64 68 72 76 80 84 88 92 96 100
图2.4《教育统计学》成绩的累积次数直方图
25
同直方图 一样绘制, 不同的是 纵坐标为 累积次数
图2.5《教育统计学》成绩的累积次数分布曲线
❖ 直方图 ❖ 次数多边图 ❖ 累积次数分布图
1. 用矩形的宽度和高度来表示频数分布的图形,实 际上是用矩形的面积来表示各组的频数分布
2. 在直角坐标中,用横轴表示数据分组,纵轴表示 频数或频率,各组与相应的频数就形成了一个矩 形,即直方图(Histogram)
3. 直方图下的总面积等于1
20
一眼就可以看出大 多数学生的成绩在
96~
1
1
67
92~
2
3
66
88~
3
6
64
84~
6
12
61
80~
14
26
55
76~
15
41
41
72~
13
54
26
68~
8
62
13
64~
4
66
5
56~
1
6716
1
练习
❖ P27第1题资料,编制: 分组次数分布表 累加次数分布表 累加百分数表
17
四、 统计图 (一)统计图的结构
18
(二)几种常用统计图
❖ 排序按升序还是降序,要视数据及所反映的事物本身 的性质和研究目的而定。
4
二、 统计分组
(一)统计分组前的准备 ❖ 先对数据做进一步的校对和校验,尽可能地消除记录
误差,同时按照一定的原则,剔除异常数据。 (二)分组应注意的问题 ❖ 分组要以被研究对象的本质特性为基础。 ❖ 分类标志要明确,要满足周延原则和互斥原则。
k1.8(7N1)2/5
❖ 写出组限 (组限是每个组的起始点界限,组限的表述方法
有很多,表所2.2以某要班弄《教清育楚统每计组学的》成实绩上限和6实0~下70限这)一组的实下限为
分数
人数
59.5,实上限为69.5.它是左
60以下
1
闭右开的区间:[59.5,69.5)
60~70
3
70~80
8
80~90
10
❖ 依据每一个分数值在一列数据中出现的次数 或总计数资料编制成的统计表。常用于离散 数据类型。
11
12
主要用来表示连续数据在各个分组区间内的散布情况
编制次数分 布表的步骤
求 定定 全 组组 距 数距
求求 组组 限中
值
13
归登 类记 划次 记数
Rxmaxxmin
❖ 全距(R)
❖ 定组数(k)经i验全 组数距 /5k-20;或 ❖ 求组距(i)
12
90~100 总计
14 38 14
表2.3《教育统计学》成绩次数分布表
❖ 求组中值
相对 累积 累积相
组中值 实下限 实上限 2
分数区间 96~
次数 1
次数 0.01
次数 对次数 1 0.01
92~
2 0.03 3 0.04
❖ 归类划记 ❖ 登记次数
88~
3 0.04 6 0.08
84~
6 0.09 12 0.17
内容提要
数据初步整理 统计表
统计表的结构 统计表的分类 常用统计表的编制
统计图
统计图的结构 几种常用统计图介绍 其他类型统计图 数据类型与统计图选用
1
思考
❖ 某校学生的心理与教育统计成绩如下,根据 这些分数向上级部门提交一份报告。 71,81,74,61,78,79,68,67,81,79, 61,81,70,64,90,62,73,73,56,52, 79,70,69,63,74,87,52,57,66,72, 54,76,75,88,81,80,60,63,80,74, 77,69,53,48,66,83,81,45,78,71
26
同次数多边 形一样,不 同的是,横 坐标为每分 组区间的精 确上下限, 纵坐标是累 积次数。
(三)其他类型的统计分析图
▪ 条形图 ▪ 直方图 ▪ 圆形图 ▪ 线形图 ▪ 茎叶图 ▪ 箱形图 ▪ 散点图
27
1. 条形图是用宽度相同的条形的高度或长短来表示数 据变动的图形
5
(一)统计表的结构
表2-1 1989年全国培养研究生情况 (单位:万人)
注: 资料来源:《1989中国教育统计年鉴》,人民教育出版社出版
6
表2-2 高考河南省英语各种题型得分率(理科)
客观题
主观题
全卷
1993年 1994年 1993年 1994年 1993年 1994年
题量 85
80
1
16
86
80~ 14 0.20 26 0.39
76~ 15 0.21 41 0.61
Leabharlann Baidu
72~ 13 0.19 54 0.81
68~
8 0.11 62 0.93
64~
4 0.06 66 0.99
56~
1 0.01 67 1.00
总15计
67
1
表2.4《教育统计学》成绩累积次数分布表 分数区间 次数 向下累积次数 向上累积次数
86
分值 85
110
15
40
100
150
平均分 52.36 63.63
7.36
17.4 61.92 81.03
得分率 0.616
0.578
0.491 0.435
0.619 0.540
7
三、统计表 (一)统计表的结构
其中,表号、名称、标目、数字8 、线条必不可少。
(三)统计表的编制要求
9
(四)常用统计表的编制 ❖ 简单次数分布表 ❖ 分组次数分布表 ❖ 累积(累加)次数分布表
90.0
分数 95.0 100.0 105.0 110.0
图2.2《教育统计学》成绩的直方图
22
1. 在直方图的基础上,把直方图顶部的中点(组中值) 用直线连接起来,再把原来的直方图抹掉
2. 折线图的两个终点要与横轴相交,具体的做法是
▪ 在下端和上端分别增加一个组 ▪ 折线图下所围成的面积与直方图的面积相等,
矩形下的 面积和为1
图2.1《教育统计学》成绩的直方图
21
20
人 数
一组资料的任何图形的
异常值(outlier),是
指落在图形一般形态之
10
外的观测值。如左图中,
有两组的人数特别少。
这两组分别是45和100
这两组
0
45.0
50.0
55.0
60.0
65.0
70.0
75.0
80.0
85.0
2
数据的初步整理
3
数据的初步整理
数据整理的基本方式有两种:排序和统计分组。
一、 数据排序
❖ 将一组数据按照数值大小、高低、长短、多少等,依 升序或降序排列,就可显示出数据的分布情况。
❖ 对字符型数据,如性别、职业类别等,汉字可依照汉 语拼音、笔画数等排序,英文可按字母顺序排序。
❖ 数据排序后,还可进一步划分等级,如考试分数排序 后可转化为优良中差等级别,也可确定名次。
二者所表示的频数分布是一致的
23
图2.3《教育统计学》成绩的折线图
24
70 60
50
40 30
20 10
56 64 68 72 76 80 84 88 92 96 100
图2.4《教育统计学》成绩的累积次数直方图
25
同直方图 一样绘制, 不同的是 纵坐标为 累积次数
图2.5《教育统计学》成绩的累积次数分布曲线
❖ 直方图 ❖ 次数多边图 ❖ 累积次数分布图
1. 用矩形的宽度和高度来表示频数分布的图形,实 际上是用矩形的面积来表示各组的频数分布
2. 在直角坐标中,用横轴表示数据分组,纵轴表示 频数或频率,各组与相应的频数就形成了一个矩 形,即直方图(Histogram)
3. 直方图下的总面积等于1
20
一眼就可以看出大 多数学生的成绩在
96~
1
1
67
92~
2
3
66
88~
3
6
64
84~
6
12
61
80~
14
26
55
76~
15
41
41
72~
13
54
26
68~
8
62
13
64~
4
66
5
56~
1
6716
1
练习
❖ P27第1题资料,编制: 分组次数分布表 累加次数分布表 累加百分数表
17
四、 统计图 (一)统计图的结构
18
(二)几种常用统计图
❖ 排序按升序还是降序,要视数据及所反映的事物本身 的性质和研究目的而定。
4
二、 统计分组
(一)统计分组前的准备 ❖ 先对数据做进一步的校对和校验,尽可能地消除记录
误差,同时按照一定的原则,剔除异常数据。 (二)分组应注意的问题 ❖ 分组要以被研究对象的本质特性为基础。 ❖ 分类标志要明确,要满足周延原则和互斥原则。
k1.8(7N1)2/5
❖ 写出组限 (组限是每个组的起始点界限,组限的表述方法
有很多,表所2.2以某要班弄《教清育楚统每计组学的》成实绩上限和6实0~下70限这)一组的实下限为
分数
人数
59.5,实上限为69.5.它是左
60以下
1
闭右开的区间:[59.5,69.5)
60~70
3
70~80
8
80~90
10
❖ 依据每一个分数值在一列数据中出现的次数 或总计数资料编制成的统计表。常用于离散 数据类型。
11
12
主要用来表示连续数据在各个分组区间内的散布情况
编制次数分 布表的步骤
求 定定 全 组组 距 数距
求求 组组 限中
值
13
归登 类记 划次 记数
Rxmaxxmin
❖ 全距(R)
❖ 定组数(k)经i验全 组数距 /5k-20;或 ❖ 求组距(i)
12
90~100 总计
14 38 14
表2.3《教育统计学》成绩次数分布表
❖ 求组中值
相对 累积 累积相
组中值 实下限 实上限 2
分数区间 96~
次数 1
次数 0.01
次数 对次数 1 0.01
92~
2 0.03 3 0.04
❖ 归类划记 ❖ 登记次数
88~
3 0.04 6 0.08
84~
6 0.09 12 0.17
内容提要
数据初步整理 统计表
统计表的结构 统计表的分类 常用统计表的编制
统计图
统计图的结构 几种常用统计图介绍 其他类型统计图 数据类型与统计图选用
1
思考
❖ 某校学生的心理与教育统计成绩如下,根据 这些分数向上级部门提交一份报告。 71,81,74,61,78,79,68,67,81,79, 61,81,70,64,90,62,73,73,56,52, 79,70,69,63,74,87,52,57,66,72, 54,76,75,88,81,80,60,63,80,74, 77,69,53,48,66,83,81,45,78,71
26
同次数多边 形一样,不 同的是,横 坐标为每分 组区间的精 确上下限, 纵坐标是累 积次数。
(三)其他类型的统计分析图
▪ 条形图 ▪ 直方图 ▪ 圆形图 ▪ 线形图 ▪ 茎叶图 ▪ 箱形图 ▪ 散点图
27
1. 条形图是用宽度相同的条形的高度或长短来表示数 据变动的图形
5
(一)统计表的结构
表2-1 1989年全国培养研究生情况 (单位:万人)
注: 资料来源:《1989中国教育统计年鉴》,人民教育出版社出版
6
表2-2 高考河南省英语各种题型得分率(理科)
客观题
主观题
全卷
1993年 1994年 1993年 1994年 1993年 1994年
题量 85
80
1
16
86
80~ 14 0.20 26 0.39
76~ 15 0.21 41 0.61
Leabharlann Baidu
72~ 13 0.19 54 0.81
68~
8 0.11 62 0.93
64~
4 0.06 66 0.99
56~
1 0.01 67 1.00
总15计
67
1
表2.4《教育统计学》成绩累积次数分布表 分数区间 次数 向下累积次数 向上累积次数
86
分值 85
110
15
40
100
150
平均分 52.36 63.63
7.36
17.4 61.92 81.03
得分率 0.616
0.578
0.491 0.435
0.619 0.540
7
三、统计表 (一)统计表的结构
其中,表号、名称、标目、数字8 、线条必不可少。
(三)统计表的编制要求
9
(四)常用统计表的编制 ❖ 简单次数分布表 ❖ 分组次数分布表 ❖ 累积(累加)次数分布表
90.0
分数 95.0 100.0 105.0 110.0
图2.2《教育统计学》成绩的直方图
22
1. 在直方图的基础上,把直方图顶部的中点(组中值) 用直线连接起来,再把原来的直方图抹掉
2. 折线图的两个终点要与横轴相交,具体的做法是
▪ 在下端和上端分别增加一个组 ▪ 折线图下所围成的面积与直方图的面积相等,