教育统计学课件-4 离散趋势的度量

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差是指离均差(即每个数据与该组平均数之差)平方 2 的算术平均数。用 s 表示。标准差用 表示。

s



方差的计算方法
①未分组数据(原始数据)
2 X Xi 2 i s N N
2

②数据分组后(次数分布表)计算法
含义:每一天的销售量与平均数相比,平均 相差21.49台。


标准差的性质
①每一个观察值都加一个相同常数C之后,计算得到 的标准差等于原标准差。
即:如果Yi X i C,则有sY

sX
②每一个观察值都乘以一个相同常数C,则所得的标 准差等于原标准差乘以这个常数。
即:如果Yi C X i,则有sY C sX


四分位数
排序后处于25%和75%位置上的值
25%
Q1
25%
Q2
25%
25%
Q3
n 1 Q1 第25百分位数,其位置: 4
3( n 1) Q3第75百分位数,其位置: 4


9个家庭的人均月收入数据
原始数据: 排 序: 位 置: 1500 750 780 1080 850 960 2000 1250 1630 750 780 850 960 1080 1250 1500 1630 2000
1
2
3
4
5
6
7
8
9


9 1 3(9 1) Q1位置 2.5 Q3位置 7.5 4 4 780 850 1500 1630 Q1 815 Q3 1565 2 2


10个家庭的人均月收入数据
排 位 序: 置: 660 750 780 850 960 1080 1250 1500 1630 2000



百分位数
百分位数是位于依一定顺序排列的一组数据中某 一百分位置的数值。百分位数一般用 Pm 表示。: 百分位数的计算公式为:

Pm L
m 100
N Fb i f
m (1 100 ) N Fa Pm U i f
P m第m百分位数; L 百分位数所在组的组下限 U 百分位数所在组的组上限 f 百分位数所在组的次数; Fb 小于L的累积次数; Fa 大于U的累积次数;
c
X

2
N
s
2 fX c fX c N N
2


标准差的合成
方差、标准具有可加性,在已知几个小组的方差或标准差 的情况下,可以计算出几个小组联合在一起的总的方差或 标准差。
2 T
s
N i si2 N i d i2 Ni
N i s i2 N i d i2 Ni
di X T X i

X T 为总平均数;
sT
X i 为各组平均数;
分组数据的标准差计算
某电脑公司销售量数据标准差计算表 按销售量分组 140~150 150 ~ 160 160 ~170 170 ~180 180 ~ 190 190 ~ 200 200 ~ 210 210 ~220 220 ~230 230 ~240 合计 组中值(Xc) 145 155 165 175 185 195 205 215 225 235 — 次数(fi) 4 9 16 27 20 17 10 8 4 5 120
某管理局所属8家企业的产品销售数据
企业编号 1 2 3 4 5 6 7 8 产品销售额(万元) x1 170 220 390 430 480 650 950 1000 销售利润(万元) x2 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0
解:
x1 536.25(万元) s1 309.19(万元)
某管理局所属8家企业的产品销售数据
企业编号 1 2 3 4 5 6 7 8 产品销售额(万元) x1 170 220 390 430 480 650 950 1000 销售利润(万元) x2 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0
解:
X 1 536.25
X X1 S1 N N 2 2969700 4290 8 8
S CV 100% X


差异系数的应用
① 同一团体不同观测值离散程度的比较(即不同单 位资料差异程度的比较); ② 对于水平相差较大,但进行的是一种观测的各种 团体,进行观测值离散程度的比较(即单位相同而平 均数相差较大的两组资料差异程度的比较)。

某管理局抽查了所属的8家企业,其产品销售数据如表。 试比较产品销售额与销售利润的离散程度;

什么是差异量数(Variance)?
Variance is Descriptive statistics that use to summarize and report the degree to which scores vary from one another in a data. 差异量数是用来总结和报告数据集中的数据彼此 间的差异程度的统计量数。
2 1
2
371212.5 287564.0625
289.22
解:
X 1 536.25
S1 X 1i X 1 N


2
(170 536.25)2 ... (1000 536.25)2 8
289.22
S1 289.22 CV1 0.539 X 1 536.25


百分等级
百分等级是指表示某一分数在整个分数分布中所 处的百分位置。百分等级用 PR 表示。: 百分等级的计算公式为:
f X L 100 PR Fb N i
Fb小于L的累积次数; L 某特定原始变量所在组的组下限 f 某特定原始变量所在组所在组的次数
xC x 2
40 30 20 10 0 10 20 30 40 50 —
xC x 2 fi
160 270 320 270 0 170 200 240 160 250 55400
标准差
2 ( x x ) fi c i 1 k
s
n 55400 21.49(台) 120
Cv1=
309.19 536.25 =0.577
x 2 32.5215(万元) s 2 23.09(万元)
23.09 cv2= =0.710 32.5215
结论: 计算结果表明,cv1<cv2,说明产品销售额 的离散程度小于销售利润的离散程度;
某管理局抽查了所属的8家企业,其产品销售数据如表。 试比较产品销售额与销售利润的离散程度;


平均差的优缺点
平均差意义明确,计算容易,反应灵敏,较 好地代表了数据分布的离散程度。 但它计算要用绝对值,不利于进一步做统计 分析,应用受到了限制,属于一种低效差异 量数。



方差与标准差(Variance and Standard Deviations)
Variance is a measure of dispersion calculated by dividing the sum of the squared deviation scores by the number of observations. Standard Deviation is the square root of the variance. 方差是一种离散程度的量数,通过将离均差的平方和除以 数据的个数计算而来。 标准差是方差的平方根。
s
2
f Xc X N


2
2 fX c fX c 2 s N N
2



标准差的计算方法
①未分组数据(原始数据)计算法
s Xi X N


2
s
X N
2
X N
2

②数据分组后(次数分布表)计算法
s f
X
2
结论: 计算结果表明,cv1<cv2,说明产品销售额 的离散程度小于销售利润的离散程度; 21.60
(8.1 32.5125)2 ... (69.0 32.5125)2 8
S2 21.60 CV2 0.664 X 2 32.5125


全距
全距是一组数据中最大值与最小值之差。全距用 R表示。其计算方法为: 原始数据的全距是最大值与最小值之差。 次数分布表的全距一般是最大一组与最小一组的 组中值之差,或者是最大一组上限与最小一组下 限之差。
A.D. Xi X N xi' N



②数据分组后(次数分布表)计算法
A.D. f Xc X N f x N
某电脑公司销售量数据平均差计算表
按销售量分组 140~150 150 ~ 160 160 ~ 170 170 ~ 180 180 ~ 190 190 ~ 200 200 ~ 210 210 ~ 220 220 ~ 230 230 ~ 240 合计 组中值(xc) 145 155 165 175 185 195 205 215 225 235 — 次数(fi) 4 9 16 27 20 17 10 8 4 5 120
标准差与其他各种差异量数相比具有数学上的优越性特别是当已知一组数据的平均数与标准差后就可以知道落在平均数上下各一个标准差两个标准差或三个标准差范围之内的数据所占的百分比
心理与教育统计学
第三章 离散趋势的度量


本章要点:
1. 平均差、方差、标准差与差异系数; 2. 全距、四分位差和百分位差;

xC x
40 30 20 10 0 10 20 30 40 50 —
xC x f i
160 270 320 270 0 170 200 240 160 250 2040
解:
A.D
X
i 1
k
c
x fi
n
2040 17(台) 120
含义:每一天的销售量平均数相比,平均相 差17台

③每一个观察值都乘以一个相同常数C(C≠0),再加 一个常数d,所得的标准差等于原标准差乘以这个常 数。
即:如果Yi C X i +d;(C 0) 则有sY C s X ;


方差与标准差的特点
① 方差与标准差是表示一组数据离散程度的最好的指标。它们 是描述统计与统计推断分析中最常用的差异量数。 ② 标准差基本具备一个良好的差异量数应具备的条件:反应灵 敏; 严密确定;容易计算;适合代数运算;受抽样变动的影响 小;简单明了。
差异量数描述数据间彼此差异的程度,也叫离中趋势, 差异量数包括平均差、方差、标准差、全距、四分位差、 百分位差等。这些量数反映了数据的离散程度,即数据 的变异性。



平均差
平均差是指次数分布中所有原始数据与平均数绝 对离差的平均值。平均差用A.D.表示。其计算方 法是: ①未分组数据(原始数据)计算法
解: X 32.5125 2
X2 X2 S2 N N
2
2
12189.11 2 32.5125 8
1523.63875 1057.06265625
21.60
解: X 32.5125 2
S2 X 2i X 2 N






全距的特点与应用
7 8 9 10
7 8 9 10

全距概念清楚,意义明确,计算简单,是最简单的离散程 度测度值; 但它仅由最大值与最小值而求得,易受两极端数值影响。 不考虑中间数值的差异,反应不灵敏,未考虑数据的分布, 因此,它只是一种低效的差异量数。
它的用处一般只用于研究的预备阶段,用它检查数据的大 概散布范围,以便确定如何进行统计分组。



百分位差
百分位差是指两个百分位数之差, 常用的百分位 距有两种:
一为第90与第10百分位数之差; P90 P10 一为第93与第7百分位数之差; P93 P7
百分位差的意义与应用

百分位差与全距相比,可以避免两端极值的影响,但仍然不能很好 地反映中间数据的散布情况,因此只作为主要差异量的补助量数, 在实践中很少使用。


标准差与其他各种差异量数相比,具有数学上的优越性,特别 是当已知一组数据的平均数与标准差后,就可以知道落在平均 数上下各一个标准差、两个标准差,或三个标准差范围之内的 数据所占的百分比。


差异系数(Variance and Standard Deviations)
差异系数是指标准差与其算术平均数的百分比, 用CV表示。又名变异系数,其计算公式如下:
相关文档
最新文档