数据整理与统计图表.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据整理与统计图表
江西师范大学初教学院
2014-09
内容提要
数据初步整理 统计表
统计表的结构 统计表的分类 常用统计表的编制
统计图
统计图的结构 几种常用统计图介绍 其他类型统计图 数据类型与统计图选用
2
思考
某校学生的心理与教育统计成绩如下,根 据这些分数向上级部门提交一份报告。 71,81,74,61,78,79,68,67,81,79, 61,81,70,64,90,62,73,73,56, 52,79,70,69,63,74,87,52,57, 66,72,54,76,75,88,81,80,60, 63,80,74,77,69,53,48,66,83, 81,45,78,71
76~ 15 0.21 41 0.61
72~ 13 0.19 54 0.81
68~
8 0.11 62 0.93
64~
4 0.06 66 0.99
56~
1 0.01 67 1.00
16 总计
67
1
3、累积次数分布表
表2.4《教育统计学》成绩累积次数分布表 分数区间 次数 向下累积次数 向上累积次数
96~
80.0
85.0
90.0
分数 95.0 100.0 105.0 110.0
图2.2《教育统计学》成绩的直方图
23
次数多边图
1. 在直方图的基础上,把直方图顶部的中点(组中值 )用直线连接起来,再把原来的直方图抹掉
1
1
67
92~
2
3
66
88~
3
6
64
84~
6
12
61
80~
14
26
55
76~
15
41
41
72~
13
54
Baidu Nhomakorabea26
68~
8
62
13
64~
4
66
5
56~
1
17 67
1
练习
P27第1题资料,编制: 分组次数分布表 累加次数分布表 累加百分数表
18
四、 统计图 (一)统计图的结构
19
(二)几种常用统计图
直方图 次数多边图 累积次数分布图
方法有很多,所以要弄清楚每组的实上限和实下限)
表2.2 某班《教育统计学》成绩
分数
人数
60以下
1
60~70 这一组的实下限为 59.5,实上限为69.5.它是左 闭右开的区间:[59.5,69.5)
60~70
3
70~80
8
80~90
12
90~100 总计
14 15 38
分组次数分布表的绘制(续)
求组中值
直方图
1. 用矩形的宽度和高度来表示频数分布的图形,实 际上是用矩形的面积来表示各组的频数分布
2. 在直角坐标中,用横轴表示数据分组,纵轴表示 频数或频率,各组与相应的频数就形成了一个矩 形,即直方图(Histogram)
3. 直方图下的总面积等于1
21
直方图(续)
一眼就可以看 出大多数学生
的成绩在 76~80分
矩形下 的面积 和为1
图2.1《教育统计学》成绩的直方图
22
直方图
(异常值)
20
人 数
一组资料的任何 图形的异常值 (outlier),是指 落在图形一般形 态之外的观测值。 如左图中,有两 组的人数特别少。 这两组分别是45 和100这两组
10
0
45.0
50.0
55.0
60.0
65.0
70.0
75.0
主要用来表示连续数据在各个分组区间内的散布情况
编制次数分 布表的步骤
求 定定 全 组组 距 数距
求求 组组 限中
值
14
归登 类记 划次 记数
分组次数分布表的绘制
全距(R) Rxmaxxmin 定组数(k)经验组数5-20;或 k1.8(7N1)2/5
求组距(i) i全距 /k
写出组限 (组限是每个组的起始点界限,组限的表述
4
数据的初步整理
数据整理的基本方式有两种:排序和统计分组。
一、 数据排序
将一组数据按照数值大小、高低、长短、多少等, 依升序或降序排列,就可显示出数据的分布情况。
对字符型数据,如性别、职业类别等,汉字可依照 汉语拼音、笔画数等排序,英文可按字母顺序排序。
数据排序后,还可进一步划分等级,如考试分数排 序后可转化为优良中差等级别,也可确定名次。
客观题
主观题
全卷
1993年 1994年 1993年 1994年 1993年 1994年
题量 85
80
1
16
86
86
分值 85
110
15
40
100
150
平均分 52.36 63.63
7.36
17.4 61.92 81.03
得分率 0.616
0.578
0.491 0.435
0.619 0.540
8
三、统计表 (一)统计表的结构
排序按升序还是降序,要视数据及所反映的事物本 身的性质和研究目的而定。
5
二、 统计分组
(一)统计分组前的准备 先对数据做进一步的校对和校验,尽可能地消除记
录误差,同时按照一定的原则,剔除异常数据。 (二)分组应注意的问题 分组要以被研究对象的本质特性为基础。 分类标志要明确,要满足周延原则和互斥原则。
3
数据的初步整理
统计表和统计图是对数据进行初步整理,以简 化的形式加以表现的两种最简单的方式。
在对数据进行统计分类以后,得到的各种数量 结果称为统计指标。
统计指标和被说明的事物之间的关系用表格的 形式表示就成为统计表。统计表具有简明、清晰、 准确的特点。
统计图是依据数字资料,应用点、线、面、体、 色等描绘制成的图形,是统计数据资料的可视化显 示方式。统计图比统计表更为具体形象。
其中,表号、名称、标目、数字、线条必不可少。
9
(三)统计表的编制要求
10
(四)常用统计表的编制 简单次数分布表 分组次数分布表 累积(累加)次数分布表
11
1.简单次数分布表
依据每一个分数值在一列数据中出现的次 数或总计数资料编制成的统计表。常用于 离散数据类型。
12
13
2.分组次数分布表
表2.3《教育统计学》成绩次数分布表
相对 累积 累积相
组中值 实下限 实上限 2
分数区间 96~
次数 1
次数 0.01
次数 对次数 1 0.01
归类划记
92~
2 0.03 3 0.04
88~
3 0.04 6 0.08
登记次数
84~
6 0.09 12 0.17
80~ 14 0.20 26 0.39
6
(一)统计表的结构
表2-1 1989年全国培养研究生情况 (单位: 万人)
培养单位 高等学校
毕业生数 3.35
招生数 2.6
在校生数 9.1
科研机构
0.37
0.25
1.03
合计
3.72
2.85
10.13
注: 资料来源:《1989中国教育统计年鉴》,人民教育出版社出版
7
表2-2 高考河南省英语各种题型得分率(理科)
江西师范大学初教学院
2014-09
内容提要
数据初步整理 统计表
统计表的结构 统计表的分类 常用统计表的编制
统计图
统计图的结构 几种常用统计图介绍 其他类型统计图 数据类型与统计图选用
2
思考
某校学生的心理与教育统计成绩如下,根 据这些分数向上级部门提交一份报告。 71,81,74,61,78,79,68,67,81,79, 61,81,70,64,90,62,73,73,56, 52,79,70,69,63,74,87,52,57, 66,72,54,76,75,88,81,80,60, 63,80,74,77,69,53,48,66,83, 81,45,78,71
76~ 15 0.21 41 0.61
72~ 13 0.19 54 0.81
68~
8 0.11 62 0.93
64~
4 0.06 66 0.99
56~
1 0.01 67 1.00
16 总计
67
1
3、累积次数分布表
表2.4《教育统计学》成绩累积次数分布表 分数区间 次数 向下累积次数 向上累积次数
96~
80.0
85.0
90.0
分数 95.0 100.0 105.0 110.0
图2.2《教育统计学》成绩的直方图
23
次数多边图
1. 在直方图的基础上,把直方图顶部的中点(组中值 )用直线连接起来,再把原来的直方图抹掉
1
1
67
92~
2
3
66
88~
3
6
64
84~
6
12
61
80~
14
26
55
76~
15
41
41
72~
13
54
Baidu Nhomakorabea26
68~
8
62
13
64~
4
66
5
56~
1
17 67
1
练习
P27第1题资料,编制: 分组次数分布表 累加次数分布表 累加百分数表
18
四、 统计图 (一)统计图的结构
19
(二)几种常用统计图
直方图 次数多边图 累积次数分布图
方法有很多,所以要弄清楚每组的实上限和实下限)
表2.2 某班《教育统计学》成绩
分数
人数
60以下
1
60~70 这一组的实下限为 59.5,实上限为69.5.它是左 闭右开的区间:[59.5,69.5)
60~70
3
70~80
8
80~90
12
90~100 总计
14 15 38
分组次数分布表的绘制(续)
求组中值
直方图
1. 用矩形的宽度和高度来表示频数分布的图形,实 际上是用矩形的面积来表示各组的频数分布
2. 在直角坐标中,用横轴表示数据分组,纵轴表示 频数或频率,各组与相应的频数就形成了一个矩 形,即直方图(Histogram)
3. 直方图下的总面积等于1
21
直方图(续)
一眼就可以看 出大多数学生
的成绩在 76~80分
矩形下 的面积 和为1
图2.1《教育统计学》成绩的直方图
22
直方图
(异常值)
20
人 数
一组资料的任何 图形的异常值 (outlier),是指 落在图形一般形 态之外的观测值。 如左图中,有两 组的人数特别少。 这两组分别是45 和100这两组
10
0
45.0
50.0
55.0
60.0
65.0
70.0
75.0
主要用来表示连续数据在各个分组区间内的散布情况
编制次数分 布表的步骤
求 定定 全 组组 距 数距
求求 组组 限中
值
14
归登 类记 划次 记数
分组次数分布表的绘制
全距(R) Rxmaxxmin 定组数(k)经验组数5-20;或 k1.8(7N1)2/5
求组距(i) i全距 /k
写出组限 (组限是每个组的起始点界限,组限的表述
4
数据的初步整理
数据整理的基本方式有两种:排序和统计分组。
一、 数据排序
将一组数据按照数值大小、高低、长短、多少等, 依升序或降序排列,就可显示出数据的分布情况。
对字符型数据,如性别、职业类别等,汉字可依照 汉语拼音、笔画数等排序,英文可按字母顺序排序。
数据排序后,还可进一步划分等级,如考试分数排 序后可转化为优良中差等级别,也可确定名次。
客观题
主观题
全卷
1993年 1994年 1993年 1994年 1993年 1994年
题量 85
80
1
16
86
86
分值 85
110
15
40
100
150
平均分 52.36 63.63
7.36
17.4 61.92 81.03
得分率 0.616
0.578
0.491 0.435
0.619 0.540
8
三、统计表 (一)统计表的结构
排序按升序还是降序,要视数据及所反映的事物本 身的性质和研究目的而定。
5
二、 统计分组
(一)统计分组前的准备 先对数据做进一步的校对和校验,尽可能地消除记
录误差,同时按照一定的原则,剔除异常数据。 (二)分组应注意的问题 分组要以被研究对象的本质特性为基础。 分类标志要明确,要满足周延原则和互斥原则。
3
数据的初步整理
统计表和统计图是对数据进行初步整理,以简 化的形式加以表现的两种最简单的方式。
在对数据进行统计分类以后,得到的各种数量 结果称为统计指标。
统计指标和被说明的事物之间的关系用表格的 形式表示就成为统计表。统计表具有简明、清晰、 准确的特点。
统计图是依据数字资料,应用点、线、面、体、 色等描绘制成的图形,是统计数据资料的可视化显 示方式。统计图比统计表更为具体形象。
其中,表号、名称、标目、数字、线条必不可少。
9
(三)统计表的编制要求
10
(四)常用统计表的编制 简单次数分布表 分组次数分布表 累积(累加)次数分布表
11
1.简单次数分布表
依据每一个分数值在一列数据中出现的次 数或总计数资料编制成的统计表。常用于 离散数据类型。
12
13
2.分组次数分布表
表2.3《教育统计学》成绩次数分布表
相对 累积 累积相
组中值 实下限 实上限 2
分数区间 96~
次数 1
次数 0.01
次数 对次数 1 0.01
归类划记
92~
2 0.03 3 0.04
88~
3 0.04 6 0.08
登记次数
84~
6 0.09 12 0.17
80~ 14 0.20 26 0.39
6
(一)统计表的结构
表2-1 1989年全国培养研究生情况 (单位: 万人)
培养单位 高等学校
毕业生数 3.35
招生数 2.6
在校生数 9.1
科研机构
0.37
0.25
1.03
合计
3.72
2.85
10.13
注: 资料来源:《1989中国教育统计年鉴》,人民教育出版社出版
7
表2-2 高考河南省英语各种题型得分率(理科)