心理健康教育-心理与教育统计-重点分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

学习目标
1、次数分布表与图
2、几种常用的统计分析图
(一)次数分布及其表述方式概述
次数分布:一批数据中各个不同数值所出现的次数情况,或者是指一批数据在量尺上各等距区组内出现的次数情况。

对数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现,这就是次数分布表。

若用图形来表达,就叫做次数分布图。

(一)简单次数分布表
简单次数分布表,通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。

(二)分组次数分布表
分组次数分布表:主要用来表示连续数据在各个分组区间内的散布情况。

编制次数分布表的步骤:
1.求全距。

全距是一批数据中最大值与最小值之间的差距。

用R表示。

2.定组数。

定组数就是要确定把整批数据划分为多少个等距的区组。

组数用K表示。

一般来说,当一批数据的个数在200以内时,组数可取8-18组。

(二)分组次数分布表
编制次数分布表的步骤:
3.定组距。

用符号i表示。

一般是取奇数或5的倍数。

4.写出组限。

组限是每个组的起始点界限,组限的表述方法有很多,所以要弄清楚每组的实上限和实下限实际组限采取左闭右开取数
比如60~70 这一组的实下限为59.5,实上限为69.5.它是左闭右开的区间:[59.5,69.5)
(二)分组次数分布表
编制次数分布表的步骤:
5.求组中值。

组中值是各组的中点在量尺上的数值。

6.归类划记。

7.登记组数。

全距
1、定义
最大值与最小值之间的差距。

2 计算公式
R= X max-X min(公式1)
组数
1、定义
确定把整批数据划分为几个等距的区组
2、注意点
(1)若数据个数在100以上,习惯上取10-20组,一般取
12-16组。

(2)若数据服从正态分布(如学习成绩、智力测验的分
数等),则使用下列公式:(公式2)
K:组数;N:数据个数
组距
1、定义
任意一组的起点和终点之间的距离。

2 、注意点
(1)组距的大小,需以全距为参照。

(2)一般是取奇数或5的倍数,如1,3,5,7,9,10等(3)若组数(K)已定,则组距(i)为:
i=R/k (公式3)
组限
1、定义
一个组的起点值和终点值之间的距离,又叫组限。

起点值组称组下限,终点值组称组上限。

2、注意点
(1)最高组区间应包含最大的数据,最低组区间应包含最小的数据。

(2)最高组或最低组的下限最好是组距的整数倍。

(三)相对次数分布表
相对次数就是各组的次数f与总次数N之间的比值。

相对次数分布表主要能反映各组数据的百分比结构
(三)相对次数分布表
1、相对次数:各组的次数与总次数N 之间的比值。

其计算公式为:
2、示例:
表 52名学生拼写测验成绩的相对次数分布
组别组中值N 次数(f)相对次数
(Rf)55~59 57 2 2 0.04
50~54 52 3 3 0.06
45~49 47 2 2 0.04
40~44 42 6 6 0.11
35~39 37 13 13 0.25
30~34 32 11 11 0.21
25~29 27 7 7 0.14
20~24 22 6 6 0.11
15~19 17 2 2 0.04
∑N=52 1.00
(四)累积次数分布表
通过统计表能轻易地了解到位于某个数值以下的数据个数有多少,就可编制一个累积次数分布表。

累积次数分布表还分成“以下”累积次数分布表与“以上”累积次数分布两种。

在编制“以下”累积次数分布表时,从下面最低组往最高组方面依次累积。

表 52名学生拼写测验成绩的累积次数分布
组别组中值N 次数
(f)相对次数
(Rf)累积次数累积相对次数
55~59 57 2 2 0.04 52 1.00 50~54 52 3 3 0.06 50 0.96 45~49 47 2 2 0.04 47 0.90 40~44 42 6 6 0.11 45 0.86 35~39 37 13 13 0.25 39 0.75 30~34 32 11 11 0.21 26 0.50 25~29 27 7 7 0.14 15 0.29 20~24 22 6 6 0.11 8 0.15 15~19 17 2 2 0.04 2 0.04
∑N=5
2 1.00
直方图
1、用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布
2、在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)
3、直方图下的总面积等于1
矩形下的面积和为1
一眼就可以看出大多数学生的成绩在76~80分
图2.1《教育统计学》成绩的直方图
人 数
分数
10
20
次数多边图
1、在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉
2、折线图的两个终点要与横轴相交,具体的做法是
●在下端和上端分别增加一个组
●折线图下所围成的面积与直方图的面积相等,二者所
表示的频数分布是一致的
次数多边图
图2.3《教育统计学》成绩的折线图
其他类型的统计分析图条形图
直方图
圆形图
线形图
散点图
条形图
1.条形图是用宽度相同的条形的高度或长短来表
示数据变动的图形
2.条形图有单式、复式等形式
3.条形图的高度来表示各类别数据的频数或频率
4.绘制时,各类别可以放在纵轴,称为条形图,
也可以放在横轴,称为柱形图
条形图与直方图
1.描述的数据类型不同,条形图用来描述离散性数据的,而直方图用来描述连续性数据的.
2.坐标轴上的标尺代表的意义不同,在条形图中横坐标表示分类;直方图中表示刻度
3.图形直观形状不同,在条形图中,各条之间可以分开,而直方图而不能.
图2.7 2004年某校教师职称人数分布0
10
20
30
405060正高副高中级初级未聘职称人数95.0
90.085.080.075.070.065.060.02010
圆形图
单位圆内各扇形面积与整个圆形面积的百分比,表示统计事项在其总体中所占的相应比例的一种图方法
图2.7 某学院2004年教师学历学位比例(%)2.11
5.2673.68
5.269.47
1.05
1.05
2.11
博 士硕 士教育硕士
研究生
本 科
专 科
大普
中专
线形图
以起伏的折线来表示某种事物的发展变化及演变趋势的统计图
图2.8 杭州某学院02~04年引进博士人数变化情

6.00
5.00
4.00
3.00
2.00
1.00
.00
2002年2003年2004年
线形图
图2-10 我国城市7~18岁学生身高年增长情况
1
2
3
4
5
6
7
789101112131415161718男生女生
散点图
表示两种事物之间的相关性及联系模式
图2.11 幼儿教师教龄与月收入的关系
0500100015002000250005101520253035
月收入教龄图2.9 幼儿教师教龄与月收入的关系
一、几个概念
(一)全及总体与总体指标
全及总体。

简称总体(Population),是指所要研究的对象的全体,它是由所研究范围内具有某种共同性质的全部单位所组成的集合体。

总体单位总数用N表示。

(举例)
总体指标(参数)。

在抽样估计中,用来反映总体数量特征的指标称为总体指标,也叫总体参数。

研究目的一经确定,总体也唯一地确定了,所以总体指标的数值是客观存在的、确定的,但又是未知的,需要用样本资料去估计。

一、几个概念
(二)样本总体与样本指标
样本总体。

简称样本(Sample),它是按照随机原则,从总体中抽取的部分总体单位的集合体。

样本容量:样本中所包含的个体的数量,一般用n表示。

在实际工作中,人们通常把n≥30的样本称为大样本,而把n<30的样本称为小样本。

一、几个概念
(二)样本总体与样本指标
样本分量:其中每一个Xi是一个随机变量,称为样本分量。

样本观察值:一次抽样中所观察到的样本数据x1、x2、x3称为样本观察值。

对于某一既定的总体,由于抽样的方式方法不同,样本容量也可大可小,因而,样本是不确定的、而是可变的。

一、几个概念
(二)样本总体与样本指标
样本指标(统计量)。

在抽样估计中,用来反映样本总体数量特征的指标称为样本指标,也称为样本统计量或估计量,是根据样本资料计算的、用以估计或推断相应总体指标的综合指标。

一、几个概念
概率抽样也叫随机抽样,是指按随机原则抽取样本。

随机原则,就是排除主观意识的干扰,使总体每一个单位都有一定的概率被抽选为样本单位,每个单位能否入选是随机的。

一、几个概念
特点
–能有效地避免主观选样带来的倾向性误差(系统偏差),使样本资料能够用于估计和推断总体的数量特征,而且这种估计和推断得以建立在概率论和数理统计的科学理论之上
–可以计算和控制抽样误差,说明估计的可靠程度。

作用:
–在不可能或不必要进行全面调查时,利用概率抽样来推断总体;
–利用概率抽样修正或补充全面调查的不足。

一、几个概念
统计上所指的抽样一般都是指概率抽样
概率抽样最基本的组织形式有:简单随机抽样、分层抽样、等距抽样和整群抽样。

一、几个概念-概率抽样(小结)
抽样方法特点
简单随机抽样按照等概率的原则,直接从含有N个元素的总体中抽取
n个元素组成的样本(N>n)
分层抽样把异质性较强的总体分成一个个同质性较强的子总体,
再抽取不同的子总体中的样本分别代表该子总体,所
有的样本进而代表总体。

等距抽样把总体的单位进行排序,然后按照固定的抽样距离抽
取样本。

第一个样本采用简单随机抽样的办法抽取。

整群抽样抽样的单位不是单个的个体,而是成群的个体。

多阶段抽样把抽样过程分为几个阶段进行。

适用于总体规模特别
大,或者总体分布的范围特别广时
一、几个概念
非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。

重点调查、典型调查、配额抽样(是按照一定标准或一定条件分配样本单位数量,然后由调查者在规定的数额内主观地抽取样本)、方便抽样(指调查者按其方便任意选取样本。

如商场柜台售货员拿着厂家的调查表对顾客的调查)等就属于非随机抽样。

一、几个概念
优点:及时了解总体大致情况,总结经验教训,在进行大规模抽样调查之前的试点。

缺点:非随机抽样容易产生倾向性误差,并且误差不能计算和控制,也就无法说明调查结果的可靠程度。

一、几个概念
重复抽样,又称回置抽样,是指从总体的N个单位中,每次抽取一个单位后,再将其放回总体中参加下一次抽选,连续抽n次,即得到一个样本。

特点:样本是由n次相互独立的连续试验构成的,每次试验是在完全相同的条件下进行,每个单位中选的机会在各次都完全相等。

“重抽”(考虑顺序)可能的样本数目(从总体中可能抽取的样本个数,用M表示)为:Nn个。

一、几个概念
不重复抽样,也叫不回置抽样,是指抽中的单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。

特点:样本由n次连续抽取的结果构成,实际上等于一次同时从总体中抽取n个样本单位。

n次抽取结果不是独立的
可能的样本数目(考虑顺序): N(N-1)(N-2)…(N-n+1)个。

一、几个概念
统计调查误差,是指调查所得结果与总体真实数值之间的差异。

登记性误差。

是任何一种统计调查都可能产生。

代表性误差
-系统性误差:是由于非随机因素引起的样本代表性不足而产生的误差,表现为样本估计量的值系统性偏高或偏低,故也称偏差; -随机误差:又称偶然性误差,是指遵循随机原则抽样,但由于样本各单位的结构不足以代表总体各单位的结构而引起的样本估计量与总体参数之间的误差。

这就是抽样估计中所谓的抽样误差。

一、几个概念
统计调查误差,是指调查所得结果与总体真实数值之间的差异。

登记性误差。

是任何一种统计调查都可能产生。

代表性误差
-系统性误差:是由于非随机因素引起的样本代表性不足而产生的误差,表现为样本估计量的值系统性偏高或偏低,故也称偏差; -随机误差:又称偶然性误差,是指遵循随机原则抽样,但由于样本各单位的结构不足以代表总体各单位的结构而引起的样本估计量与总体参数之间的误差。

这就是抽样估计中所谓的抽样误差。

相关文档
最新文档