全距、四分位距、百分位距

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一节全距、四分位距、百分位距
一、全距(Range)
1、概念
全距是一组数据中最大值与最小值之差,故又称两极差,简称极差。

用符号R表示。

它是表示一组数据离散程度的最简单、最易理解的一种差异量数。

2、计算
全距计算比较简单。

对于原始数据求全距的方法是:找出最大值、最小值,然后用公式:R=最大值-最小值对于频数分布表求全距的方法:最大一组与最小一组组中值之差;
或者是最大一组上限与最小一组下限之差。

注意:如果数据是连续型,必须用精确上下限。

极差(概念要点及计算公式)
1. 一组数据的最大值与最小值之差
2. 离散程度的最简单测度值
3. 易受极端值影响
4. 未考虑数据的分布
计算公式为
未分组数据R = max(Xi) - min(Xi)
组距分组数据R = 最高组上限- 最低组下限
全距
3 应用条件及优缺点
全距概念清楚,意义明确,计算简单,是其明显的优点.
但因它仅由最大值与最小值求得,易受两极端数值的影响.如果两极端有偶然性或属异常值时,全距不稳定、不可靠。

它不考虑中间数值的差异,即其它数据未起作用,反应不灵敏。

它明显地受取样变动的影响。

由于上述原因,全距只是一种低效的差异量数,只能作为差异量的粗略指标。

它的用处一般只用于研究的预备阶段,用它检查数据的大概散布范围,以便确定统计分组。

即在编制频数分布表时决定全距范围之用。

二、四分位距(四分差)
1、四分位距的概念为了避免全距受两极端数值影响的缺点,则用按一定顺序排列的一组数据中间部位50 %个频数距离的一半作为差异量指标,即四分位距,又称四分差,用Q 表示。

i
若将从小到大排列的一 组数据分成频数相等的四段,第一 与第二段的分界点 称第一个四分位 数(Q1)。

第三 与第 四段的分界点 称第三个四分位数(Q3)。

则四分位距就是第三 个四分位 数(第 75%百分位 数)与第一个四分位 数 (第 25%百分位 数 )差的一半。

用公式表示 为 : Q =( Q3 - Q1 )/ 2
四分位差 ( 概念要点 )
1. 离散程度的 测度 值之一
2. 也称为内距或四分 间距
3. 第 3 四分位数与第 1四分位数之差 QD = Q3 – Q1
4. 反映了中 间 50% 数据的离散程度 5.不受 极端值的影 响 6.用于衡量中位 数的代表性
7. 主要用于定序 数据,也可用于 数值 型数据,但不能用于定 类数 据
2、计算方法
(1)原始 数据计算法
先将原始 数据从小到大排列好;
然后根据求中位 数的方法求出第一 个四分位 数和第三 个四分位数; 利用公式求四分位距。

Q =( Q3-Q1)/ 2 (2 )频数分布表 计算法 先求出第一 个四分位 数及第三 个四分位数; 然后将它们代入公式 计算四分位距,即可。

Q =( Q3 - Q1 )/ 2
2、计算方法
Lb 该分四分点所在 组 的精确下限 fQ1 与 fQ3 该四分点所在 组的次 数 N 数 据个数
Fb 该分数所在 组以下的累加次 数 组距
数值型分组数据的四分位数(计算示例)例

四分位差计算案例
注意:
也有人认为:
四分位距就是75%百分位数与25%百分位数间的距离. 它代表分布中间50%的距离. 四分位距(IQR) = Q3 - Q1
semi-interquartile range :四分位距的一半( interquartile range ) .
SIQR = (Q3 - Q1)/2
3、四分位距的应用及优缺点
优点:
四位位距简明易懂,计算简便,较少受两极端数值的影响,比全距可靠得多。

缺点:
但它忽略了左右共50 %数据的差异,又不适合代数运算,因而限制了它的应用。

使用:
当一组数据用中位数表示集中量时,就要用四分位距表示差异量。

因为它们同属于百分体系。

四分位距与中位数一样,适用于有特大或特小两极端数值,有个别数值不确切、不清楚,以及用等级的数据等情况
三、百分位距
1、概念:
百分位点位置
百分位数数值
百分位差段距离
百分位距是指两个百分位数之差。

常用的百分位距有两种:
一种是:第90与第10百分位数之差,用P90-P10表示。

即按一定顺序排列的一组数据中间部位80 %个频数的距离。

一种是:第93与第7百分位数之差,用P93 -P7表示。

是按一定顺序排列的一组数据中间部位86%个频数的距离。

2、计算方法:先计算百分位数:百分位数的计算方法我们第二章讲中位数时,涉及到了百分位数的计算方法。

然后计算百分位距:百分位距的计算方法很简单,即P90 -P10 或P93 -P7 计算。

1)百分位数的计算
其中:Pp 表示百分位数
p 表示与百分位数相对应的比数
N 表示总频数
Lp 表示百分位数所在组的下限
n 表示小于百分位数所在组下限的频数总和
fp 表示百分位数所在组的频数
i 表示组距例
2)百分位差P90 -P10 =P80 -P20 =Px-Py= 3 、适用条件用几个百分位距能较好地反映一组数据的差异程度。

在计算频数分布峰态量时,要用到上述的百分位距。

四百分等级(相对地位量数)
一)概念
在一个团体中,不管人数多少,如果我们要问:某—个人在一百个人中胜过多少人;或者问假使把这一团体分为一百等,这一个人占第几等。

回答这样的问题,用一个人的原分数或等第都不行。

因为在一班学生中的成绩,单独一个原来的分数,最多只能表示分数的高低,不能表示他在全班中的地位。

例如某个学生名列第十五名,我们不能知道他的成绩究竟如何,要了解他的成绩在班上的地位,还必须知道他同班同学有多少人。

如果全班有60 名学生,他名列第十五名,其成绩还是比较好的。

如果全班只有30 名学生,第十五名就是中等成绩。

如果全班只有20 名学生,第十五名就是较差的。

可见,普通等第是看不出优劣的。

平时所用的等第,也只能表示一个学生成绩的高低次序,而不能表示他在全班中的地位。

而百分等级则不同,它能表示一个分数在它所属团体中的地位。

如一个学生的分数之百分等级为70,就是表示这个学生的分数超过他所在团体的70%。

所以百分等级是一种相对地位量数,是教育、心理研究中较常用的一种量数。

在按分数高低大小顺序排列的情况下,它可以表示任何一个分数在该团体中酌相对地位。

什么是百分等级呢?所谓百分等级就是把一班学生的得分依高低次序排列,然后算出一个人在一百人中超过多少人,或算出这个人以下占多少百分比,表示这种关系的量数,在统计学中,就称为百分等级。

换言之,百分等级是把全班人数按照一百来计算,从他所得的分数决定他在全班所占的地位。

分数的百分等级越大,代表等级越高。

百分等级越小,代表等级越低。

如某学生的分数之百分等级为90,表示比他差的有90 %,如果百分等级为20 ,表示比他差的只有20 %。

百分等级的符号为PR。

二)百分等级的计算
1.未分组数据计算百分等级的方法是:将团体中各个体,按他们所得分数之高低排列成等第。

如第一名、第二、
?|以R代表之,第一名,R=1;第二名,
R=2 ;?|?| 余类推。

以全体人数除100,即100 /N,表示百分量表上每人应占的分数。

第一名占第一个100 /N,第二个占第二个100 /N,..
故求第几名百分等级,即以100R /N 代表。

无论是第几名百分等级,都应以每个分数的占位置的中点来代表它,所以把每段的距离减去半段,即减去50/N,而成(100R /N)-(50 /N)=(100R -50)/N
(100R -50)/N 是每个分数在百分表上的位置,这个位置是按一般等第排列的,其成绩越高,代表等第的数字越小;其成绩越差,其代表的数字越大。

故须从100 减去(100R -50 )/N,成成为:
100 -(100R -50 )/N
未分组数据计算百分等级的公式是:
PR=100 -(100R -50)/N
其中:PR 表示某个分数的百分等级
R 表示某个分数所在团体中按大小排列的等第。

N 个数。

例10 名学生的作文成绩依次排列为:56、64、68、69、73、75、78、79、83、86 分,试求得分为78分的百分等级。

作文成绩得78分的学生是第4名,故R=4,总人数N=10,代入公式得:
PR=100 -(100R -50 )/N=100 -(100×4-50 )/10 =65 即该生的百分等级为65,即在100 名学生中,该生的作文成绩胜达65名学生。

例试分别计算20名学生、80名学生数学成绩的第1名、第2名和第15名的百分等级。

20 名学生时:
P1=100 -(100×1-50)/20=98
P2=100 -(100×2-50)/20=92 P15=100-(100×15-50 )/20 =25 80 名学生时:
P1=100 -(100×1-50)/80=99
P2=100 -(100×2-50)/80=98 P15=100-(100×15-50 )/80 =82
根据以上计算,我们说在20 名学生的数学成绩中,第一名的百分等级为98 ,第二名的百分等级为92 ,第十五名
的百分等级为26。

而在80 名学生的数学成绩中,第一名的百分等级为99 ,第二名的百分等级为98 ,第十五名的百分等级为82 。

可见,团体的总人数不同,同一等第的百分等级并不一样。

2.分组资料(频数分布表)计算百分等级
PR 百分等级
N 总频数
Fb 该分数所在组以下的次数和
f 该分数所在组的频数
X 给定的原始分数
Lb 该分数所在组的精确下限
i 组距
例156 名学生的语文考试成绩分布如表,求66 分的百分等级
解释:在156 名学生中有48.7 %的学生的分数在66 分以下例表中原始分数为52 的百分等级
百分等级也可以从累加百分曲线图上求得。

只要把上面确定百分位数的过程倒转过来即可
如分布中,P10 亦即第10 百分位之值为19.33 分,那么,我们就可以把19.33 分或其成绩为19.33 分的学生,说成是居于第10 百分位的位置;P90 亦即第90 百分位之值为51.56 分,我们就可以把51.56 分说成是居于第90 百分位的位置。

统计学中习惯上都把这个百分位置称为某某分数的百分等级,如说19.33 的百分等级为10.00 ,51.56 分或得51.56 分的学生其百分等级为90.00 ,等等。

其它任何一个给定的分数也都可以转化为百分等级。

3.求一组的百分等级
一组的百分等级是以每组的组中值的百分等级来代表,其方法是;先分别求出每组精确上、下限的百分等级,然后将上、下限百分等级相加,以 2 除之,即为每组组中值的百分等级。

求每组精确上、下限的百分等级的方法是:首先将次数分布表由下而上求出各组的累积次数;然后从最低组起计算每组精确上限的百分等级。

即以总次数(N)除100,再乘以累积次数。

用公式表示为:
PR=100fcp/N
其中:
PR 表示每组上限的百分等级
fcp 表示每组的累加次数
N 表示总数
例求各组的百分等级
三)百分等级的应用
在教育和心理方面运用百分等级主要是运用“百分等级常模。

百分等级常模特别适用于教育成就测验,加语文成就测验、算术成就测验—⋯,在这类测验里,通常要测量非常多的学生,然后才可以把常模求出来。

根据常模就可知道得分多少,百分等级是多少;也可知道占某百分等级时,须得分多少。

这样一个换算表上所列数字便是百分等级常模。

假如我们知道某—学生的语文成就测验成绩为76 分,算术成就测验成绩为94 分,则我们无法知道他在团体中所
占的地位,也就是说无法知道他的成绩比别人好或坏。

此时,我们可以查阅百分等级常模。

假定查得语文成就测验得分为76 分时,PR 相当于70,而算术成就测验得分为94 分时、PR相当于68,则我们便知道该生的语文成就较70%学生为高,但算术成就只较68 %的学生为高而已。

相关文档
最新文档