心理和教育统计 第四章 差异量数20170908
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(公式4-9)
X 2 X N N N X 2 ( X ) 2 N2
2 X 其中:
2
( X )2
N
是原始数据的平方和 是原始数据总和的平方 为数据个数
38
标准差的原始数据公式
S 1 N
X X N N
2 2
2
N X ( X )
或MD表示。
30
1 原始数据计算公式
AD Xi X n x n
i
xi为离均差 (公式4-5)
2 次数分布表计算公式
AD f X c X n
(公式4-6)
31
3 评价
•优点: •1 平均差意义明确,计 算容易,反应灵敏。 •2 较好地反映了次数分 布的离散程度。 •缺点: •1 平均差计算时要用绝对 值,不适合代数运算,因 此在进一步统计分析中应 用较少。 •2 属于一种低效差异量数。
内容
• 第一节 全距与百分位数 • 第二节 平均差、方差与标准差 • 第三节 标准差的应用
• 第四节 差异量数的选用
• 理解差异量数的含义 • 认识标准差的性质、作用 • 掌握标准差的计算方法 • 熟悉运用各种差异量数描述一组数据的特征及若干组数据的比较 • 掌握标准分数及其运用
第一节 全距、百分位差
SS X X S n n
2
2
(公式4-7)
S
XX n
2
(公式4-8)
方差是每个数据与该组数据平均数之差平 方后的均值,即离均差平方后的平均数。 方差的平方根是标准差
37
2.方差和标准差的计算公式
• 方差的原始数据计算公式
2 ( X ) X 2 SS 2 N S N N
Cumulative Percent
百分等级分数
百分等级分数与百分位数相反,它是事先知道分布中 的一个原始分数,再求这个原始分数在分布中所处的相对 位置—百分等级。
百分等级分数指出原始数据在常模团体中的相对位置, 百分等级越小,原始数据在分布中相对位置越低;百分等 级越大,原始数据在分布中相对位置越高
2
(公式4-10)
公式(4-7)、(4-8)等价于(4-9)、(4-10),
当两个公式计算结果有出入时,应以原始数据计算公 式的结果更准确。
39
例子:
PR Fb
X Lb f
i N
100
82 80 51 1809
5 1900
100
PR 96.28
82分的百分等级96.28,即有96.28%的应试者考分低于82分
四分位距(差)
四分位差,是百分位差的一种,四分位距是第一个四分位数与第三 个四分位数之差的一半,即在一个次数分布中,中间50%的次数的 距离的一半。 用四分位数间距可反映数据变异程度的大小.计算公 式为:
25%
25%
Q1 Q2 Q3
Q1 Q2 Q3
Q=Q3-Q2=Q2-Q1=(Q3-Q1)/2
四分位差特点
优点: 1 常与中数联系起来共同应用。 2 对数据的离散程度的描述比全距好 缺点: 1 稳定性差 2 反映不灵敏 3 不能进行代数运算
第二节、平均差、方差与标准差
一、动差体系
•动差(moment)是物理学上测量力的旋转趋势的名称, 旋转趋势的大小随力点与原点距离大小而变化,其大小 是力与该距离的乘积。 •统计学借用力学上的动差概念来表示次数分布的离散 情况。 •把各组次数当作力学上的力,用数值或组中值与原点 之差作为距离来计算动差。 •以平均数为原点的动差叫做中心动差,常见的中心动 差:
第四章 差异量数 measures of variation
湖北医药学院
差异量
例:设甲、乙、丙三人,做四级英语模拟试题 ,每人数 做 5套 ,得分结果如下 盘编号 1 2 3 4 5 合计 甲 乙 丙
580 560 540 520 500 480 460 440 420
560 540 500 460 440
百位数的应用
• 某招干考试分数如表,预定取考分居前10%的应考人员进行面试 选拔,请划定面试分数线
• 本题要划定的分数线为P90,即分数线以下的考生占90%。应求 百分位分数,利用公式: 90 i 90 5 P90 Lb N Fb 69.5 1900 1641 100 f 100 98
量。
34
1、离差平方和
•把每一个原始数据与平均数之差的平方加起来, 就得到离均差的平方和,也叫和方、均方和:
SS
X
2
X
2
X
( X ) n
2
35
对原始数据公式的推算
SS X i X
2
X X
2 i 2 i 2 i
2X i
(X 2X X X
580 560 540 520 500 480 460 440 420
560 540 500 460 440
2500
520 510 500 490 480
2500
510 505 500 495 490
2500
均数
500
500
500
甲
乙 丙
对全距的评价
• 优点:简单、容易理解、计算简单的差异量数。 • 缺点:粗糙和不可靠,不稳定、不灵敏,明显受到抽样的影响。
方差(variance)又称为变异数、均方。是表示
一组数据离散程度的统计指标。一般样本的方差
用 S 2 表示,总体的方差用 2 表示。
标准差(standard deviation)是方差的算术平
方根。一般样本的标准差用 S 表示,总体的标准
差用 表示。
标准差和方差是描述数据离散程度最常用的差异
• 全距 (range),即最大和最小观察值之间的间距,用极差描述
资料的离散程度简单明了。
• 分布分数最大值(maximum) X的精确上限与分布分数最小值 (minimum) X 的精确下限的差值。 • 作用:一般来说,全距越大,说明数据越分散, 反之数据越集 中、越整齐。
差异量
例:设甲、乙、丙三人,做四级英语模拟试题 ,每人数 做 5套 ,得分结果如下 盘编号 1 2 3 4 5 合计 甲 乙 丙
式中: Lb 为某一百分位数所在组的精确下限 Fb 为百分位数所在组下限以下的累积频数 f 为某一百分位数所在组的频数
n 为数据总的次数 i 为组距
I,f
……………...………………
X Lb
Fb
11
步骤
• 如果得到了向上累加频数分布表,求百分位数的步骤如下:
• 1 找到P百分位数所对应的名次,即n*P% • 2 从累加频数中找到该名次所在的分组,及该组的频数f和组距i。 • 3 找到该分组区间的精确下限值Lb和该组以下的累加频数Fb
是一种低效的差异量数。
• 应用:用于对数据作预备性检查,了解数据的大概范围,以便如
何进行统计分组。
二、百分位差(百分位距)
• 百分位数(percentile)又叫百分位点,指量尺上的一个 点值,小于这个点值的个体(数据个数)占数据分布中全部
数据个数的一定百分比。第P百分位数:就是指在其值为
P的数据以下,包括分布中全部数据的p%,其符号为Pp.
n f b25 Q1 LQ1 4 i f Q1
3n f b75 Q3 LQ3 4 i f Q3
LQ:表示Q所在组的下限 N:表示总频数 fb:表示小于Q所在组下限的频数总和 i:表示组距
用中位数作集中量时,常用四分位距作差异量。
2 四分位数Q1、Q2、Q3之间的关系
25% 25% 25% 25%
N
3
3
4
f (x x) N
用来表示一个分 布中偏斜度或偏 态性的指标
4
f (x x) N
用来表示一个分 布中峰态性的指 标
29
二、平均差
平均差(average
deviation
或者
mean
deviation)是指一组数据中,每一个数据与该组
数据的平均数离差的绝对值的算术平均数,通常用AD
32
4 应用
•例子4-2: 有5名被试的错觉实验数据如下,求 其平均差 被试 1 2 3 • 错觉量 16 18 20 • 解:已知 n=5,M=18.6 4 22 5 17
AD 1.92
X X n
16 18.6 18 18.6 17 18.6 5
33
三、方差和标准差
百分等级分数的计算公式
• 式中:Lb 为某特定原始变量所在组的下限 • Fb 小于Lb的累积频数 • f 为某特定原始变量所在组的频数 • N 为数据总的次数
PR
Fb
X Lb f
i N
100
• i 为组距
百分等级分数的应用
• 例2 所列的考试分数分布中,已知某应试者的考分为82分,问在 这次考试中低于该应试者的人数比例 • 由一个原始分数求低于它的分数比例,是一个求百分等级的问题, 利用公式:
28
• 常见的中心动差: • 一级动差
1
f (x x) 0
i
因其总和等于0, 故不能用来表示离 散程度,一般采用 平均差
方差,最广泛的一种 差异量数指标,用来 表示一个分布中离中 趋势的指标,其平方 根是标准差
• 二级动差 • 三级动差 • 四级动差
wenku.baidu.com
N
2
2 f ( x x )
• P70表示70%的位数,它代表在按照从小到大顺序排列的一组数 据中的一个可能数值,小于这个数值的数据个数占70%,大于这
个数值的数据占30%。如:当P70=110,则表示在所有的数据中,
有70%的数据小于110,而有30%的数据大于110。
分组数据,百分位数的计算公式
p i Pp Lb n Fb 100 f
2500
520 510 500 490 480
2500
510 505 500 495 490
2500
均数
500
500
500
甲
乙 丙
第四章 差异量数
A、概念:表示一组数据的差异情况或离散程度的量数,反映数据分 布的离中趋势。描述事物差异性的表现。 差异量越小,平均数的代表性越好。 差异量越大,平均数的代表性则差。 B、种类: 绝对差异量,包括:全距、百分位差、四分位差、平均差、 标准差、方差。 相对差异量,常见的有差异系数。
•0,10,20,30,40,50,60,70,80,90,100,110. 第一个四分位为第三位和第四位的中位数,即:
Q1=(20+30)/2=25; • 第三四分位为第九位和第十位的中位数,即: Q3=(80+90)/2=85。 四分位差Q=(Q3-Q1)/2=(85-26)/2=29.5
• 在分组数据中
• 4 将上面的数据代入公式中即可计算出P值。
例4-1 用下面的次数分布表计算该分布的 百分位数P90及P10
百分位差
• 百分位差是指两个百分位数之差,也叫百分位距。 • 常用的百分位距有两种: • P90-P10和 P93-P7。 • 用几个百分位距能较好地反映一组数据的差异程度。但有一定的 局限,只作为主要差异量数的辅助量数
Q3 Q1 Q 2
(公式4-4)
–四分位差的计算,基于P25、P75两个百分位数,这两个 点值和中数一起把一组数据的次数等分为四部分。
四分位数通常与中数联系起来共同应用,中数可以看作 是第二四分位点。 对于未分组数据求四分位差,Q1、Q3可依照未分组数据 求中数的方法求得
例
•假设有数组:
2 i 2 2 i i
i
X X )
2
2X Xi N X
Xi X N
X
2 X i
X X 2( ) X N ( N N ( X ) ( X ) 2
2 2 i i
X2 N X2
i
)2
2 X i
N ( X i ) 2 N
N
36
1.方差和标准差的定义
73.02
用累加次数分布曲线图求百分位数
100
80
60
40
20
• 是一种粗略的计算方法
0
Current Salary
00 ,0 00 $1 25 1 8, $7 50 7 6, $6 50 7 8, $5 00 0 4, $5 50 5 7, $4 10 4 3, $4 00 3 9, $3 00 0 6, $3 40 5 3, $3 50 3 1, $3 00 7 9, $2 00 2 8, $2 00 4 6, $2 00 6 4, $2 00 8 2, $2 00 0 1, $2 50 1 8, $1 50 7 5, $1