4.差异量
常用统计量二:差异量
03 方差
方差的定义
方差是用来度量一组数据分散程度的统计量,其计算公式为方差 = Σ[(x_i - μ)^2] / N,其中x_i表示每个数据点,μ表示平均值,N表示数据点的数量。
差异量与相关系数的关系
相关系数用于描述两个变量之间的线性关系,而差异量用于描述数据分布的离散程度。两者之间存在一定的联系,但也有明 显的区别。
在分析两个变量之间的关系时,如果两个变量之间的差异越大,那么它们之间的相关性可能越弱。因此,在分析相关系数时 ,需要考虑两个变量之间的差异程度,以更准确地理解它们之间的关系。
方差在统计学中广泛应用于描述数据的分散程度,帮助我们 了解数据的稳定性、波动性和离散程度。
在金融领域,方差被用于评估投资组合的风险;在生物学中 ,方差被用于分析实验数据的变异程度;在社会科学中,方 差分析被用于研究不同组之间的差异。
04 离散系数
离散系数的定义
离散系数是用来衡量一组数据的离散程度的统计量,通常 用标准差除以该组数据的平均值来计算。
常用统计量二差异量
目录
• 差异量的定义与分类 • 平均差 • 方差 • 离散系数 • 差异量与其他统计量的关系
01 差异量的定义与分类
差异量的定义
01
差异量是用来度量两个数值之间 差异的统计量,通常表示为两个 数值之差。
02
差异量用于比较不同数据集或不 同时间点之间的变化,帮助我们 了解数据之间的相对差异。
差异量的分类
绝对差异量
表示两个数值之间实际差值的绝 对值,不考虑正负号。
相对差异量
(完整版)心理与教育统计学第4章差异量数
复习专题:
平均增加率与几何平均数 平均增加量与算术平均数
一列数据分别为X1,X2,X3…Xn, 按一定的比例关系变化,则:
1
X2 X1
2
X3 X 2
N 1
XN X N 1
1 2 N 1
Mg N1 12 N1
Mg N1 X 2 X 3 X N X1 X 2 X N 1
160
170
180
190
A
B
4.1 全距与百分位数
• 4.1.1 全距
• 全距(range)又称为两极差,用符号R 表示。
• 用最大值(maximum)减去最小值 (minimum)得到全距。
R X max X min (4.1)
全距的特点: • 全距是最粗糙的差异量数,只利用了数据
中的极端值; • 容易受极端值的影响;
]
(4.5)
PR 百分等级; X 给定的原始分数。
成绩 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
60-
5
12
55-
4
7
50-
2
3
4.54+79.5=84.04
45-
1
1
合计
58
精确组限 79.5~84.49
5/7=0.71
采用次数分布表计算百分位数
PP
Lb
P 100
N
Fb
i fP
(4.4)
Pp为所求的第P个百分位数; Lb为百分数所在组的精确下限; fp为百分数所在组的次数; Fp为小于Lb的各组次数的和; N为总次数; i为组距。
X N X N 1 cN 1
4 第四章 差异量数
第三四分位为第九位和第十位的中位数,即:
Q3=(80+90)/2=85。 四分位差Q=(Q3-Q1)/2=(85-26)/2=29.5
24
在分组数据中:
n f b25 Q1 LQ1 4 i f Q1
3n f b75 Q3 LQ3 4 i f Q3
LQ:表示Q所在组的下限 N:表示总频数 fb:表示小于Q所在组下限的频数总和 i:表示组距
16
(五)用累加次数分布曲线图求百 分位数。P83 是一种粗略的计算方法
17
三、百分等级分数
百分等级分数与百分位数相反,它是事 先知道分布中的一个原始分数,再求这个原 始分数在分布中所处的相对位置—百分等级。
百分等级分数指出原始数据在常模团体 中的相对位置,百分等级越小,原始数据在 分布中相对位置越低;百分等级越大,原始 数据在分布中相对位置越高。
18
1 百分等级分数的计算公式
PR Fb
X Lb f
i N
100
式中:Lb 为某特定原始变量所在组的下限 Fb 小于Lb的累积频数
f 为某特定原始变量所在组的频数
N 为数据总的次数
i 为组距
19
2 百分等级分数的应用
例2 表4-1所列的考试分数分布中,已 知某应试者的考分为82分,问在这次考试 中低于该应试者的人数比例。
2 i 2 2 i
i
X X )
2
2X Xi N X
Xi X N X2 N X2
i
X
X 2(
X i2 2 X i2
N ( X i ) 2
) X i
X N (
N N
第四章 差异量
二 平均差、方差、标准差
4)方差、标准差的应用及优缺点 是表示一组数据离散程度的最好指标,是 常用的差异量数。
三
相对差异量
1)标准差的比较及差异系数的概念 绝对差异量和相对差异量(差异系数) 2)差异系数的使用及条件
四 差异量的数值关系与选用
1 差异量的数值关系
2 如何选用
1)共同考虑集中量和差异量; 2)多数数情况下,平均数和标准差一起进行一组数据 的描述。
练习
• 课内完成本章练习题1-8题
感谢各位的参与!
二 平均差、方差、标准差
1 平均差
1)离均差与平均差 离均差,又称离差或偏差,表示每一个观察值 与平均数的距离大小。——平均差,是次数分布 中所有原始数据与平均数绝对离差的平均值。 2)公式表达 3)平均差的意义 能较好地反应次数分布的离散趋势;但绝对值 的求取不利于进一步统计分析,因此为低效差异 量数,实践中谓方差、标准差 方差,也称变异数、均方,是每个数据与该组数据平均 数之差乘方后的均值,即离差平方后的均值。 标准差,是方差的平方根。 2)方差、标准差的计算 3)方差、标准差的性质 方差具有可加性和可分解性的特点,是方差分析的基本 依据。 方差、标准差的基本特性:a)每一个观测值都加上一个 常数C,所得数据的标准差或方差等于原标准差或方差;b) 每一个观测值都乘上一个常数C,所得数据的标准差等于原 标准差乘以这个常数C,所得数据的方差等于原方差乘以这 个常数C的平方。
1)何谓百分位距 百分位数(又称百分位点,指量尺上的一个点,在此点 以下数据分布中全部数据个数的一定百分比。)——百分 位差(指第10百分位数和第90百分位数之间的距离。)
一 全距与百分位距
2)百分位数的计算 与计算分组数据中数的原理一致。 3)百分等级的计算 百分位数的逆运算。
04差异量数-PPT课件
4.3 方差和标准差
方差和标准差的定义
XX S n
2
2
X X S n
2
原始数据计算公式
X X 2 S n n
2 2
X2 X S n n
2
9
4.3 方差和标准差
例: 下面是从甲乙两个班分别随机抽取10名学
生的英语听力考试成绩,计算这两个班这 次考试成绩的平均分分数和离散程度。 甲班 7 乙班 8 8 8 6 5 3 5 5 5 9 4 8 5 6 7
18
4.4 差异系数
例1:比较计量单位不同的数据资料的差异程度
表 抑郁水平与理性恋爱观差异程度对比
平均数 抑郁 理性恋爱观 17.74 1.68 标准差 3.69 0.41 差异系数 20.8 24.4
19
S CV 100 % X
17
4.4 差异系数
差异系数的作用
比较不同单位资料的差异程度
比较单位相同而平均数相差较大的两组资料的差异程度 可判断特殊差异情况
Tips
根据经验,一般CV值常在5%-35%之间。如果CV大于 35%时,可怀疑所求得的平均数是否失去了意义;如果 CV小于5%时,可怀疑平均数与标准差是否计算有误。
数理统计
张丹慧
教育统计和测量所
danhuizhang1980gmail
北京师范大学本科生公共课
2
全面反映一组数据的特征: 必须求出集中量数;还要求出差异量数。
差异量数越小,说明数据的离散程度越小,集中量数的代表性越大 差异量数越大,说明数据的离散程度越大,集中量数的代表性越小
第四章 差异量数
教育统计学第四章 差 异 量
σ =
2 x
∑ (x
2 i
i
− x)
2
n
σ =
2 x
∑x
n
−
∑x
n
i
2
• 例1 求数据组{52,62,74,45,50, 71,81,85}的方差。 为了使方差与数据组中的数据具有相 同的单位,将方差开平方, 同的单位,将方差开平方,称为数据组的 标准差,用符号бx表示。 标准差,用符号 表示。 标准差的计算公式: 标准差的计算公式: 标准差等于方差的算术平方根
差异系数的计算公式为: 差异系数的计算公式为:
cv =
σx
x
× 100%
例1 某学校一年级学生体重与身高情况 如下述资料表: 如下述资料表:
表4-3 某学校一年级学生体重与身高情况资料表
平均数 体重 身高 21.40公斤 公斤 125.85cm
标准差 2.19公斤 公斤 4.67cm
计算差异系数: 解 计算差异系数:
cv体重
cv身高
2.19 = × 100% = 10.23% 21.40
4.67 = × 100% = 3.71% 125.85
某班期末考试数学平均分为95分 例2 某班期末考试数学平均分为 分, 标准差为10分 语文平均分为60分 标准差为 分;语文平均分为 分,标准差 为9分,试比较数学和语文分数的离散程度。 分 试比较数学和语文分数的离散程度。
频数分布表方差和标准差的计算公式: 频数分布表方差和标准差的计算公式:σ =2Fra bibliotekx∑fx
N
2 i i
−
−
∑fx
N
i i
2
统计学第四章重点知识点
第四章 差异量教学目的:1.理解全距、四分位距、百分位距、平均差、方差、标准差和差异系数等概念;2.掌握各种差异量指标的计算方法。
数据的分布特征不仅有集中趋势,还有离中趋势。
以动态的眼光,从不同的角度看,数据是向中间变动的,也是向两端变动的。
两组数据可能平均水平相同,但两组数据的分布特征并不完全相同。
【如】:比较以下两组数据 A 组:88、82、73、76、81 B 组:92、86、70、72、80两组平均数,80==B A X X 但R A =88-73=15,R B=92-70=22。
即A 组较集中,B 组较分散。
因此,我们描述一组数据的分布特征,既要描述其集中趋势,也要描述其离中趋势。
差异量:表示一组数据的离中趋势或变异程度的量称为差异量。
常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差和差异系数。
第一节全距、四分位距、百分位距一、全距全距:是一组数距中最大值与最小值之差。
优点:意义明确,计算方便。
缺点:反响不灵敏,易受极端值影响。
二、四分位距〔一〕四分位距的的概念四分位距:是指一组按大小顺序排列的数据中间部位50%个频数距离的一半。
QD :表示四分位距; Q 3:表示第三四分位数; Q 1:表示第一四分位数。
所以:四分位距的公式又为: 〔二〕四分位数的计算方法 1、原始数据计算法〔1〕将数据由小到大进行排列;〔2〕分别求出三位四分位数〔点〕;〔3〕代入公式计算。
【例如】:有以下16个数据25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,其中四分位距的计算方法如下:〔1〕先将原始数据从小到大排列好;12、14、15、17、*19、20、22、25、*29、30、31、33、*35、37、39、40Q1=18 Md=27 Q3=34〔2〕求出Q1、Md、Q3;〔3〕将Q1、Md、Q3的得数代入公式〔4.1〕。
2、频数分布表计算法利用频数分布表计算公式为:关键是分别计算P75和P25,百分位数计算方法掌握了,这里的计算就不会有什么问题。
第四章 差异量
应用——在计算频数分布峰态量时,要用到百分位距。
13
第一节 全距、四分位距、百分位距
20
第二节 平均差
课堂练习 4、求频数分布表数据(Md=64)的平均差 解: MD
X Md n ( 15 64 1 45 64 3 55 64 4 65 64 5 75 64 4 85 64 2 95 64 1) 20 13.2
2 2 2
X
X
X
n
2
X n
2
2
41 39 37 35 38 5 4
2
28
第三节 方差和标准差
二、计算方法
2、频数分布表计算法 若原始数据已归入频数分布表,且无原始数据,可以用组中 值近似计算。
X
2
fX n
一、全距 1、原始数据 ——是一组数据中最大值与最小值之差,又称极差。用R表示。
甲组:54、63、72、74、82、88、99 乙组:67、71、73、76、79、82、84
甲组的全距 乙组的全距 R=99-54=45 R=84-67=17
平均数是76 平均数是76
6
第一节 全距、四分位距、百分位距
R≈6σX≈7.5MD≈9QD
34
类 别 标 准 差 方 差 全 距
优
点
缺 方差和标准差 点 第三节
应
用
1.感应灵敏 2.严密确定 3.适合代数法处 理 4.受抽样变动影 响小 1.意义简明 2.计算简单
4差异量数
11
练习:某小学二年级80名学生身高的频数分布如下表,求 其四分差。
小学二年级80名学生身高的频数分布表 身 高 115~ 118~ 121~ 124~ 127~ 130~ 133~ 136~ 139~ 142~ 总 和 频 数 1 3 8 10 20 19 12 4 2 1 80 累计频数 1 4 12 22 42 61 73 77 79 80 计算四分差
3、标准分数的性质
(1)一组原始数据的标准分数的算术平均数为 ,即 )一组原始数据的标准分数的算术平均数为0, (2)一组原始数据的标准分数的标准差为 ,即 )一组原始数据的标准分数的标准差为1,
25
4、标准分数的应用 (1)确定原始数据在其团体中的相对位置 例:某市中考,数学平均成绩为75分,标准差为12分。某 生数学考了78分,试问其数学成绩在全市考生中的地位如 何? 解:该考生数学成绩的标准分数为:
15
利用公式计算平均差
五、方差和标准差
(一)概念 方差是指离差平方的算术平均数。
方差的算术平方根称为标准差。总体标准差用 示,样本标准差用 S 表示。
表
标准差是一个较为准确的差异量数,常与算术平均数 配合使用,来描述一组数据的集中、离中趋势。标准差数 据越大,表明这组数据的离散程度越大。
16
离差
甲乙两组共12名小学生体育课跳远测验成绩如下, 甲乙两组共 名小学生体育课跳远测验成绩如下,请分别计算 名小学生体育课跳远测验成绩如下 其标准差。 其标准差。
甲乙两组小学生跳远成绩统计表(米) 组别 甲组 乙组 1.90 2.30 1.95 1.60 2.15 1.70 跳 远 成 绩 1.98 2.01 2.10 2.04 1.82 2.05 2.08 1.90 2.02 2.40 平均成绩 2.00 2.00
4 差异量数
0
Starting Salary
jinggangshan
第四章 差异量数
•差异量数就是描述一组数据离中趋势的量数。
•集中量数虽然能较好地描述一组数据的集中趋势,但 这还远远不够,它还不能代表一列数据分布的全貌。 客观世界的事物总是千差万别的,这其中不仅有质的 差异,而且还有量的差异,这种事物的差异则是统计 分布的另种特征——离中趋势或离散程度 。
•差异量数主要有:全距 (Range) 、四分位差 (Quartile) 、 百分位距(Percent Rank)、平均差(AD)、方差和标准差 (Variance & SD) 、差异系数(相对标准差CV).
jinggangshan
全距
• 全距是指一列数据最大差距,即一列数 据中最大数与最小数的差距,又称极差, 用符号RN(Range)表示. • 全距意义简明,计算简单,但容易受极 端数据的影响,不反映全部数据的差异 情况 ,使用价值极小。
jinggangshan
四分位差(Quartile)
N i Q1 LQ1 Fb 4 fQ1
N i Q3 LQ3 Fb 4 fQ3
jinggangshan
N i Q90 LQ90 Fb 4 fQ90
N i Q10 LQ10 Fb 4 fQ10
jinggangshan
•平均差(AD)
•是指一组数据的离差绝对值的算术平均数。 •未归表数据求平均差; •已归表数据求平均差。
0 0. 50 62 0.0 50 57 .0 0 50 52 0.0 50 47 0.0 50 42 0.0 50 37 .0 0 50 32 0.0 50 27 0.0 50 22 .0 0 50 17 0.0 50 12 0 . 00 75
第四章 差异量
2
X N
2
N
2
X N
X N
2
• 例4-4:某班的创造 表4-2 成绩分布表 思维成绩如下表。试 组别 f 问其平均差距为多少? 40-44 1 35-39 7 30-34 3 25-29 11 20-24 8 15-19 2 ∑ 32
分析一
d X Xt
St
ns d n
2 2
分析过程
组别
甲 乙 丙 丁
n
20 18 16 20 74
M S M-Mt (S2+d2) n(S2+d2)
80 75 70 70 - 8 6.1 7 1.1 8 -3.9 6 -3.9 - - 101.21 50.21 79.21 51.21 – 2024.20 903.78 1267.36 1024.20 5219.54
|d| 9.75 4.75 0.25 5.25 10.25 -
f|d| 117 346.75 13 204.75 246 927.50
3550 X 17.75 200
927 .50 AD 4.64 200
错误总数 6-10 11-15 16-20 21-25 26-30 总计
学生数量 12 73 52 39 24 200
⑤ 求fd2及其 连加和
d2 fd2 189.0625 189.0625 76.5625 535.9375 14.0625 42.1875 1.5625 17.1875 39.0625 312.5000 126.5625 253.3125 1350.0000 -
∑fd2
(三)加权式
1、基本式
1350 2 S 32 42.1875
04心理统计学-第四章 差异量数
第三节 标准差的应用
▪ 一、差异系数(coefficient of variation) P94
绝对差异量数 vs. 相对差异量数(不带测量单位)
➢ 用以比较多组数据之间离散程度的大小。
➢ 计算公式:CV s 离散程度的比 较(如,身高 vs. 体重);②(各均值相差较大时)不 同团体同种观测值离散程度的比较(如,成人体重 vs. 小孩体重)。
➢ 1、计算公式 : Z X X
s
例题计算 [自习例4-7]
➢ 例:某中学体检,全校身高平均为160cm,标准差为 24cm;体重平均为55kg,标准差为11kg。小明身高 172cm,体重66kg。问:①身高与体重哪个的分布更 为离散?②若从相对排名来看,小明是身高排名更靠前、 还是体重排名更靠前?(高的、重的排名在前)
例题计算 [自习例4-5、例4-6]
➢ 注意:①适用资料至少是等距,理论要求为比 率数据;②尚不能进行统计推论。
第三节 标准差的应用
▪ 二、标准分数(standard score,又称Z分数) P95
是以标准差为单位来表示一个原始分数在团体中 所处的相对位置量数。可用以比较多个数在其所 在数组分布中的相对位置的高低(Z分数越大,表 明该数据在其分布中的相对位置越高)。
第四章 差异量数
第一节 全距和百分位差 第二节 平均差、方差与标准差 第三节 标准差的应用:差异系数和
标准分数
第四节 差异量数的选用
第一节 全距和百分位差
▪ 一、全距 P80
➢ 又称两极差,用最大值与最小值之差来表示离中 趋势,符号R(range),公式 R X max X min
计算所得数值越大,表明数据越离散/分散 [下同]
➢ 3、标准分数的优缺点
第四章 差异量数
(二)方差和标准差的计算公式
1.基本计算公式 1.基本计算公式
Байду номын сангаас
Σ X −X S = N
2
(
)
2
2
公式1
Σ X −X S= N
例4-3 -
(
)
公式2
2.原始数据计算公式 基本公式的变式 原始数据计算公式(基本公式的变式 原始数据计算公式 基本公式的变式)
ΣX 2 ΣX NΣ X 2 − ( Σ X ) 2 S = − = N N2 N
组别 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
合计
次数f 2 2 3 5 8 11 9 5 4 2 1 52
累积次数
计算这个数列的四分位差
52 50 48 45 40 32 21 12 7 3 1
Q3 −Q1 Q= 2
第二节
平均差、 平均差、方差与标准差
组别 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
合计
次数f 2 2 3 5 8 11 9 5 4 2 1 52
累积次数
52 50 48 45 40 32 21 12 7 3 1
计算P90和P10之间 计算P90和P10之间 P90 的百分位差
(四)百分位数与百分等级
表5-1 52名学生数学成绩方差和标准差计算表
成绩 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45- 合计 组中值Xc 97 92 87 82 77 72 67 62 57 52 47 频数f 2 2 3 5 8 11 9 5 4 2 1 52
计 算
4第四章 差异量数
•方差与标准差的性质和意义 方差与标准差的性质和意义
方差与标准差的意义 标准差与其他各种差异量数相比,具有数学上的优越性, 标准差与其他各种差异量数相比,具有数学上的优越性, 特别是当已知一组数据的平均数与标准差后,就可以知道落在 特别是当已知一组数据的平均数与标准差后, 平均数上下各一个标准差、两个标准差, 平均数上下各一个标准差、两个标准差,或三个标准差范围之 内的数据所占的百分比。 内的数据所占的百分比。
思考题
为什么说标准差是重要而完善的差异量? 为什么说标准差是重要而完善的差异量?
答:
(1)标准差具有简单明了,反映灵敏,严密 标准差具有简单明了,反映灵敏, 确定,容易计算,适合代数运算, 确定,容易计算,适合代数运算,受抽样变动的 影响较少等优点。 影响较少等优点。 (2)标准差在避免两极端数值影响方面大大 超过全距、百分位差和四分位差; 超过全距、百分位差和四分位差;在避免绝对值 方面,优于平均差;在考虑单位方面,优于方差。 方面,优于平均差;在考虑单位方面,优于方差。
•差异系数 差异系数
差异系数的概念 差异系数是指标准差与其算术平均数的百分比, 差异系数是指标准差与其算术平均数的百分比,用 CV表示。其计算公式如下: CV表示。其计算公式如下: 表示 差异系数的应用 (1)同一团体不同观测值离散程度的比较(即不同单位 同一团体不同观测值离散程度的比较( 资料差异程度的比较); 资料差异程度的比较); 对于水平相差较大, (2) 对于水平相差较大,但进行的是一种观测的各种 团体,进行观测值离散程度的比较( 团体,进行观测值离散程度的比较(即单位相同而平均 数相差较大的两组资料差异程度的比较)。 数相差较大的两组资料差异程度的比较)。
•动差体系 动差体系
一级动差
《差异量》课件
CV
X
100%
X
CV 表示差异系数
表示标准差 X
X 表示算术平均数
二、应用
1.用来比较单位不同的数据
例如:某小学的学生平均体重为25公斤, 体重的标准差为3.7公斤,平均身高为110厘米, 标准差为6.2厘米,问体重与身高的离散程度哪 个大?
解:
CV
X
100%
X
体重
CV 3.7 100% 14.8%
评价
优点: 较少受两极端数值的影响。 缺点: 只利用用了一组数据中的两个数据,因此反应 不灵敏;反映一组数据的离散程度也不是特别理想; 是一种终结计算,不能做进一步的代数运算。
一般和中位数一起来反映一组数据的面貌。
三、百分位距:
百分位距是指两个百分位数之差。
P Pp1p2 Nhomakorabea常用的百分位距有两种:一为第90与第10百分位数之
21
100-
102.5
24
105-
107.5
14
110-
112.5
9
115—
117.5
4
120-
122.5
3
125-
127.5
2
总和
100
f(X-Md) 56.25 110.00 105.00 78.75 30.00 87.5 101.25 65 63.75 52.5 750
f(X- X )
57.75 114 111 89.25 18 80.5 96.75 63 62.25 51.5 744
8
90-
92.5
12
95-
97.5
21
100-
102.5
24
105-
第四章差异量
四级动差法---峰态系数
❖ 峰态系数:用动差计算(用SPSS计算更方便)
第21页,此课件共26页哦
第22页,此课件共26页哦
注意: (1)当a4 =0时,分布呈正态峰;当a4>0时,
分布呈高狭峰,当a4 <0时,分布呈低阔峰。 (2)只有当N>1000时,所计算出来的峰态系
❖ 优点:意义明确,计算容易,每个数据都参加了计算, 考虑到全部的离差,反应灵敏。
❖ 缺点:由于计算要用到绝对值,不适合代数运算,这一点 使它的应用受到很大限制,因此在统计分析中应用较少。
第7页,此课件共26页哦
平均差的计算
第8页,此课件共26页哦
第三节 方差和标准差
❖ 定义
(1)方差是离差平方的算术平均数;
(2)标准差是方差的方根。 ❖ 计算
第9页,此课件共26页哦
计算
第10页,此课件共26页哦
优点与缺点
❖ 优点
反应灵敏,严密确定,计算简单,适合代数运算。用 样本数据推断总体差异量时,方差和标准差是最好的 估计量。
❖ 缺点 易受两极端数值的影响,有个别数值不清楚时,无法计算。
第11页,此课件共26页哦
系数才可靠。
第17页,此课件共26页哦
峰态量
❖ 峰态量是描述次数分布的陡峭程度的指标。
第18页,此课件共26页哦
计算方法
❖ 百分位数法 ❖ 四级动差法
第19页,此课件共26页哦
百分位数法
注意: (1)当Ku=0.263,分布呈正态峰; (2)当Ku < 0.263,分布呈正态峰; (3)当Ku > 0.263,分布呈正态峰;
用途
(1)计算相关系数、标准分数等都用到标准差。
统计心理-第四章 差异量数
N
xi2
S2 i1
i1
N
N
3.标准差:
S
N
2
Xi X
i1
N
N
xi2
i1
N
方差与标准差是最常用的描述次数分布离散程度的差异量数。
(二)方差与标准差的计算
• 计算6,5,7,4,6,8这一组数据的方差和标准差。
(二)方差与标准差的计算
1. 基本公式:
N
2
1.n5,0X7.73
组限
95— 90— 85— 80— 75— 70— 65— 60— 55— 合计
分组数据求平均差
f
X C XC X
1
97
19.7
4 92 14.7
6 87
9.7
9 82
4.7
12 77
0.3
8 72
5.3
5
67
10.3
4 62 15.3
1
57 20.3
50
计算
1.n5,0X7.73
20
22
17
(ms)
第二节 平均差、方差与标准差
一、平均差 2.计算: (2)分组数据求平均差
f
A.D.
XC
X
n
组限
95— 90— 85— 80— 75— 70— 65— 60— 55— 合计
分组数据求平均差
f
XC
1
97
4 92
6 87
9 82
12 77
8 72
5 67
4 62
1
57
50
计算
Q3
Lb
3N 4
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
举例说明
教 育 统 计 学
• 以下是两组样本数据,及其样本平均数与样本标准差。
第一组 41 44 45 47 47 48 51 53 58 66
第二组 20 37 48 48 49 50 53 61 64 70
第一组 第二组
x =50.0,s=7.4 x =50.0,s=14.2
教 育 统 计 学
经计算,Min=5, Q1=23, Q2=30.5, Q3=36.5, Max=66 请问数据中有无极端值存在?
教 育 统 计 学
百分位距
• 百分位距是两个百分位数之差。 • 常用的百分位距有两种: • P90 -P10 • P93 -P7
教 育 统 计 学
平均差
X M X Md MD 或 n n
教 育 统 计 学
练习
• 1. 如果一个公司的职员每人加薪3000元,那么他们 收入的标准差如何变化?众数、中位数、均值、极 差、四分位距呢? • 2. 如果一个公司的职员每人工资增长2倍(变为原来 的3倍),那么他们收入的标准差如何变化?众数、 中位数、均值、极差、四分位距呢?
教 育 统 计 学
X
2
X X
N N
2
2
X
X X
2
在式中, X 表示方差, X 表示标准差; N表示总频数。
X X表示每个数据与平均数 的差数,称为离差;
教 育 统 计 学
• 标准差代表了什么意义? – 可以由标准差看出:平均而言,数据中的观察值 究竟有多偏离平均数。 – 标准差越大,表示数据中的观察值越偏离平均数, 而数据的分散程度也就越大。
原始数据计算法
X
2
X
N
2
2
X
N
2
X X N N 在式中, X表示原始数据;
2
X
N表示总频数。
教 育 统 计 学
• 例:某校对 5 个教师的教学效果进行测评,满分为 20 分, 5 个教师的得分为 14 分、 15 分、 13 分、 12 分 和14分,这五个教师得分的方差和标准差各是多少?
解 : X 68, X 930, N 5
2
X
2
930 68 186 184.96 1.04 5 5
2
X 1.04 1.02
教 育 统 计 学
频数分布表计算法
• 对于用频数分布表提供的数据资料,可以用组中
值作为各组数据的近似值来计算方差和标准差。
教 育 统 计 学
极端值的判断
• 运用Q1,Q3, QD来设定下限与上限 下限= Q1 – 3QD; 上限= Q3 + 3QD
凡是在上述范围之外的观察值,即为潜在的极端值。
下限 上限
位于此处的观察值即是 潜在的极端值。
教 育 统 计 学
一个例子 • 以下是抽取20位美国人,调查其每周观看电视的 时数,所得的一组资料。 25 66 34 30 41 27 35 31 26 32 38 30 32 15 38 20 43 05 16 21
教 育 统 计 学
3. 方差和标准差的优缺点及应用
• 优点:反应灵敏、严密确定、计算简单、适合代 数运算等。 • 缺点:意义不易理解、易受两极端数值的影响、 有个别数据不清楚时无法计算。 • 应用:是最常用的差异量数,标准差的应用尤其 广泛。标准差往往和算术平均数配对使用,以反 映一组数据的差异程度和集中程度。
教 育 统 计 学
• 柴比契夫规则:若存有一组资料与一个数值k (k 1 >1),则至少有 100 1 % 的观察值会落在距离
k2
平均数加减k个标准差的范围内。
至少100(1-1/k2)%的 观察值会落在平均数 加减k个标准差的范围 内
次 数
平均数 –k个标准差
平均数 平均数 + k个标准差
教 育 统 计 学
差异量
– 差异量是表示一组数据变异程度或离散程度的
一类特征量。差异量越大,说明数据分布的范
围越广,分布越不整齐;差异量越小,说明数
据变动范围越小,分布就越集中。
– 在教育工作中常用的差异量有全距、方差、标
准差、差异系数等。
教 育 统 计 学
全距
• 全距是一组数据中的最大值与最小值之差,又称为 极差。用R表示。 • 对于一组原始数据,全距等于其最大值与最小值之 差。 • 对于频数分布表提供的数据,全距等于最大一组与 最小一组的组中值之差,或者是最大一组的上限与 最小一组的下限之差。
教 育 统 计 学
• 三个标准差原则:
在任何一组数据中,大部分的观察值会落入距离 平均数加减三个标准差的范围内。 根据柴比契夫规则,89%的观察值会落入距离平 均数加减三个标准差的范围内。
• 适用任数据的分配型态。
根据经验法则,99%的观察值会落入距离平均数 加减三个标准差的范围内。 • 适用于钟型对称的数据分配型态(常态分配)
教 育 统 计 学
全距 = 78-72 =6英寸
全距 = 84-67=17英寸
教 育 统 计 学
四分位距
• 四分位距是用依一定顺序排列的一组数据中间部位 50%个频数距离的一半作为差异量的指标。即四分 位距就是第三个四分位数Q3与第一个四分位数Q1差 的一半。用QD表示。 QD=(Q3- Q1)÷2 Q3 = P75
相对差异量
1. 相对差异量的概念
• 前面的全距、方差和标准差都是带有单位的绝对差异 量。 • 相对差异量(即差异系数):是指一组数据的标准差 与算术平均数的百分比。它是没有单位的相对数。用 CV表示差异系数,计算公式为:
CV
X
X
100%
教 育 统 计 学
2. 差异系数的用途
• 差异系数越大,则该组数据内部的差异程度就越大,反 之,差异程度就越小。因此,我们可以通过计算两组数 据差异系数的大小来比较它们差异程度的大小。 • 比较不同单位数据组资料的差异程度。
教 育 统 计 学
计算公式:
P 75 P 25 Ku 2( P 90 P 10 )
• 当Ku<0.263时,分布呈高狭峰;
• 当Ku>0.263时,呈低阔峰;
• 当Ku=0.263时,分布为正态峰。
教 育 统 计 学
第四章 差异量
教 育 统 计 学
数据的“位置”
教 育 统 计 学
数据的“尺度” • 这两组数据“胖瘦”一样吗?
教 育 统 计 学
• 让我们来看一个例子
– 以下是从两个篮球队抽样的五位球员。 – 虽然两队的平均身高都是75英寸,中位数都是76英寸,众 数都是76英寸。但仔细观察,这两队的身高是否还是有所 不同呢?(1英尺 = 12英寸;1英寸=2.54公分)
教 育 统 计 学
偏态量与峰态量
• 1. 偏态量( skew):是描述次数分布的偏态方向和 程度的量数。 • 计算公式:
X M0 3( X Md ) SK SK S S
教 育 统 计 学
• 2. 峰态量( kurtosis ):描述次数分布的高低宽窄特 征的量数。
• 高狭峰:S较小,分数分布高窄,集中在平均数两侧。 • 低阔峰:S较大,分数分布低阔,散布较广。 • 正态峰:分布介于高峰态和低峰态之间。
• 比较单位相同而平均数相差较大的数据组资料的差异程 度。
教 育 统 计 学
例:现有成人组和婴儿组各100人的两个抽样总体。测得成 人组平均体重为65千克,标准差为6千克;婴儿组平均体重为4 千克,标准差为1.5千克。能否认为成人组体重的差异比婴儿 组体重的差异大? 例:对一个群体测量身高和体重,平均身高为170.2厘米, 身高标准差为5.30厘米;平均体重为70千克,体重标准差为 4.77千克。比较身高和体重的离散程度。
,
Q1 = P25
教 育 统 计 学
极值
• 落在上或者下四分位数的3个四分位距单位之外的观测值。
• 即:大于Q3+3QD 或小于Q1-3QD的数据为极值。
教 育 统 计 学
极端值
• 极端值的意义 – 又称「离群值」或「异常值」
– 在一组数据中,凡是落在数据整体组型之外的观 察值,即为极端值。
– 例如:全班几乎所有人的体重都落在45到80公斤 之间,其中以65到70公斤之间的人居多(整体组 型),但有一位同学的体重高达100公斤,显著的 偏离班上同学的体重范围,此即极端值。
教 育 统 计 学
方差和标准差
1. 方差和标准差的概念
• 方差和标准差是通过离差来定义的。
• 离差:是指一组数据中的各个数据与该组数据算术平均数 之差。
• 方差:是一组数据离差平方的算术平均数,即方差可由离 差的平方和除以数据个数所得。 • 标准差:是方差的算术平方根。
教 育 统 计 学
2. 方差和标准差的定义公式