数据的初步整理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表 2.12 100 名学生智力测验分数的频数分布
分 数 组中值 频 数 累积频数 累积百分比
80-
82.5
3
3
3
85-
87.5
8
11
11
90-
92.5
12
23
23
95-
97.5
21
44
44
100-
102.5
24
68
68
105-
107.5
14
82
82
110-
112.5
9
91
91
115—
117.5
4
38
(2)连续变量的频数分布表(第 18 页) 第一步:求全距
R=最大值—最小值=144—115=29(cm)最高的身高-最矮的身高 第二步:决定组数和组距
k:一般分为 10~15 组。(大写字母 k 表示,最多不超 20,最少不少于 10)
i:一般定为 1、2、3、5、10。(小写的 i,组距一般取整数)
第一节 数据的来源、种类及其分类 数据的来源 1.经常性资料(档案性资料):如学生、家长、和老师的资料等。(学生的年龄,成绩,考 勤记录,活动获奖情况;教师的年龄,性别、外语水平、科研项目、职称,学历,教龄等; 学校的办学情况:经费来源、教学资源、师资力量) 2.专题性资料:主要通过研究者对自己所感兴趣的或者是一些亟待解决的问题,通过调查 或实验的方法来搜集的。如“北京师范大学教学统计指标体系的研究” 教学过程 教学效果 硬件条件 教学管理 师资队伍 通过调查问卷评价教师,或通过实验方法。 数据的种类 数据就是随机变量的观察值。随机现象的观察和变量结果是不确定的。 1.按来源分:点计数据和度量数据。 点计数据是指计算个数所获得的数据。例如:要了解目前北师大教育学院的教师构成情况, 可以按性别分类,也可以按学历分类,然后计算各类的个数的数据,一般取整数,特殊情况 下用百分数或小数表示。 度量数据是指用一定的工具或一定的标准测量所获得的数据,一般用量具测量,如用试卷测 量成绩。此类数据往往带有小数点。 2.按随机变量取值是否具有连续性分:间断型随机变量的数据和连续型随机变量的数据 取值个数有限的数据,称为间断型随机变量的数据。这种数据的单位是独立的,两个单位之 间不能再划分成细小的单位,一般用整数表示各种考试排列的名次。 取值个数无限(不可数)的数据,称为连续型随机变量的数据。它们可能的取值范围能连 续充满某一个区间。数据的单位之间可以在划分成无限多个细小的单位。数据可以用小数表 示。比如学生的智商、身高、体重、考试分数等。
2.图号。按出现的顺序编序号;在图题的左前方(图 2.1a 是下图的图号)
3.标目。即统计的项目。对于有纵横轴的统计图,应在纵横轴上分别标明统计项 目及其尺度。 4.图形。图形线在图中为最粗,要清晰,图形的高与宽之比 3:5 为宜,以美观 为准。 5.图注。不是必要组成部分,而是补充说明;文字简明扼要;字体要小;写在图 题的下方。
100 分,而某个学生的考分记录是 192 分,显然这是登分时产生的错误。这是要剔除掉这个 分数。 分类标志:在分类时,关键是要抓住研究对象的本质特性,并对它的概念作出明确、严格的 界定,因为它是分类的基础和依据。分类的标志(即分组所依据的特征)不仅要明确,而且 要前后一致,要能将全部数据包含在内。分类标志理应为研究对象的一些非常重要的特征。 统计分类不仅以研究对象的本质特性为依据,还要以研究目的、任务的需要为依据,当然也 应当考虑到统计方法的可能性。 例如:对一个班级学生进行品行评定。 分类标志按形式划分,可分为性质类别和数量类别(即定性和定量两类)。性质类别是按事 物的不同性质进行分类,如按性别分类。数量类别是按数值的大小进行分类,并排成顺序, 如按分数段,类与类之间有等级关系。
计 % 36.6 37.2 8.9 10.2 7.2
100
4.线条:四条基本线条:顶线和底线,较粗,把横标目总标目与数字隔开的两条线;线条不 宜多,边线和把各行数字隔开的线都可以省略。 5.数字:一般用阿拉伯数字表示;如又小数,数位要一致,要对齐;尽量不要有空格--暂缺 数字可用省略号或问号表示;无数字可画横杠。 6.表注:不是必要组成部分;下方;补充说明表的来源或补充说明数字;标注字号不要大于 表中的其他文字。简单明了、重点突出、 注意:统计表的结构要尽量简单明了,层次清晰,重心突出,中心显著。 二、统计表的种类 1.简单表:只列出观察对象的名称、地点、时序或统计指标名称的统计表为简单表。
次数都呈现出来。
例如:对一个有 42 名学生的班级进行身高测量。
频数分布表:把频数分布用表格的形式表示出来就是频数分布表。
频数分布表分类:
1.简单频数分布表
(1)间断变量的频数分布表
表 2.8 38 名学生 6 道选择题做对的频数分布
做对题数 0 1 2 3 4 5 6
总和
频数
1 3 6 13 10 4 1
17 岁- 18 岁- 19 岁- 20 岁- 总和
人数
3
46
58
29
136
3.复合表:按两个或两个以上标志分组的统计表为复合表。一般表的分组标志不可以超过
三个,表 2.6 中按照年龄、性别、专业三个分组标志分类。
表 2.6 北师大教育学院 2000 级各班不同年龄男女生人
数
17 岁-
18 岁-
19 岁- 20 岁-
12
95-
97.5
21
100-
102.5
24
105-
107.5
14
110-
112.5
9
115—
117.5
4
120-
122.5
3
125-
127.5
2
总和
100
2.累积频数和累积百分比分布表: 累积频数就是把频数一组一组累加起来,得到的频数叫累积频数。 累积百分比就是把频数用百分比变成相对频数,用百分比表示出来。 用表格把这两种频数表示出来就是累积频数分布表和累积百分比分布表。 (1)累积频数分布表制作 A.先制作频数分布表 B.从最低一组的频数开始登记,最低一组的累积频数等于该组的频数。 C. 登记高一组的累积频数,该组的频数+低于该组的所有组的频数
人数
60 40 20 0
甲
乙
丙
丁
等级
图2.1a某年级操行评定结果
二、表示间断变量的统计图 1.直条图:用直条的长短表示统计事项数量的图形为直条图。常用来表示点计数据。
人数
100
50
0
甲
乙
丙
丁
本例 k=10,i=R/k=29/103(cm)
第三步:决定组限,即决定各组的上下限有时还需计算组中值。(每组的起止范围,及上下
限下限要低于小于最小值,上限等于),
组中值=(上限+下限)/2
第四步:登记频数
表 2.10 师大附小二年级 80 个学生身高的频数分布
身高
组中值
频数
115—
116.5
1
118—
表 2.3 学科名称 平均成绩
某班各科期末成绩
语文
数学
自然
75
80
86
表 2.4 北 师 大 教 育 学 院 2000 级 各 专 业 学 生 人 数
系别
教育 学前 公管 特教 总和
人数
36
35
42
23
136
2.分组表:只按一个标志分组的统计表为分组表。
表 2.5 北师大教育学院 2000 级各年龄学生人数
数据的统计分类(数据的分组) 数据的统计分类,是指按照研究对象的本质特征,根据分析研究的目的、任务,以及统计分 析时所用统计方法的可能性,将所获得的数据进行分组归类。它是对数据进行归纳、整理、 简化、概括的第一步,为进一步分析研究打下了基础。 在分类之前要检查,剔除一些由于误差导致的一些数据。如书写错误。一定要注意,不要随 心所欲地剔除掉那些不符合主观假设的数据,必须有充分的理由。例如:某次考试的满分是
数据的初步整理(描述统计)
作用:把杂乱分散的数据条理化,系统化,并以简单明了的统计图表表示出来,使数据中隐
藏的规律得以初步的显示,统计图处理的资料基本上都是一些数字,在数据整理和分析之前
首先要收集数据。在讲如何对数据进行分组,如何用统计图、统计表把这些数据整理的结果
表示出来之前我先要介绍一下教育统计工作中所处理的数据都从哪里来都有哪些种类
总和
男 女 男 女男女男女 男 女
教育
6
5
学前
1
9
共管8ຫໍສະໝຸດ 6特教47
总和 1
2
19 27
三、频数分布表列法
频数分布表示统计表中一种特殊的表格,也是
频数:某一个随机事件在 n 次试验中出现的次数称为这个随机事件的频数。一般用 f 表示。
频数分布:各种随机事件在 n 次试验种出现的次数分布称为频数分布,即把随机事件出现的
119.5
3
121—
122.5
8
124—
125.5
10
127—
128.5
20
130—
131.5
19
133—
134.5
12
136—
137.5
4
139—
140.5
2
142—
143.5
1
总和
80
表 2.11 100 名学生智力测验分数的频数分布
分 数 组中值
频数
80-
82.5
3
85-
87.5
8
90-
92.5
95
95
120-
122.5
3
98
98
125-
127.5
2
100
100
总和
100
100
100
第三节 统计图
统计图是用来表达统计指标与被说明的事物之间数量关系的图形。它是整理数据的一种方 法。在运用统计图时,一般附有统计表。 一、统计图的结构及其绘制规则 统计图由标题、图号、标目、图形、图注等项构成。 1.标题。简明扼要;切合内容;必要时注明时间地点;字体在图中为最大;一般在图的下方。
数据分类结果的表示方法:表格和图形。
第二节 统计表 一、统计表的结构及其编制的原则和要求 基本要素: 1.标题:表的名称;上方;简明扼要;(对大学生影响最大的人) 2.表号:表的序号;左方;时间顺序。)(表 2.1,表 2.2) 3.标目:表中对统计数据分类的项目。(横标目,表的左侧,如男生和女生;总标目:表上 方,如父亲、母亲、老师、同学、其他人)。从左到右读,横标目,统计对象,为主语,纵 标目,统计指标,作为谓语。
表 2.2 对大学生影响最大的人
父亲 母亲 老师 同学 其他人 合计
男 n 250 233 73 82 52
690
生 % 36.2 33.8 10.6 11.9 7.5
100
女 n 485 514 105 124 92
1320
生 % 36.7 38.9 8.0 9.4 7.0
100
合 n 735 747 178 206 144 2010