心理和教育统计学第4章 差异量数

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
百分数
60 40 20 0 60 63 66 69 72 75 78 81 84 87 90 93 96
分数
4.1.5 四分位差
• 四分位差(quartile deviation),指在一个 次数分布中,中间50%的次数的距离的一 半。 • 通常用Q来表示。 • 第一四分位:Q1——P25 • 第二四分位:Q2——P50(中数) • 第三四分位:Q3——P75
2 2
2 2
2
2
(16 18.6) (18 18.6) (17 18.6) 23.20
(3)方差与标准差: 2 x 23.20 2 s 4.64 N 5 s s 2 4.64 2.15
(3)根据原始数据算方差:
s2
2 ( X X )
• 5名被试的错觉实验数据如下,求 其方差和标准差。
被试 错觉量(ms) 1 16 2 18 3 20 4 22 5 17
16 18 17 (1)平均数: X 18.6 5
(2)离均差的平方和:
x
2
( X1 X ) ( X 2 X ) ( X 5 X )
• 标准差(standard deviation),方差的平 均根。 • 样本统计量用s或SD表示; • 总体参数用 表示。
(1)总体方差与标准差公式
总体方差:
2
2 ( X )
N
(4.8)
2
总体标准差:
(X )
N
(4.9)
2 式中: ——总体方差;
——总体标准差;
12 15 15 16 7 8 9 10
P50即中数,位于第5号数据和6号数 据之间。 P10位于第1号数据和第2号数据之间
SPSS计算百分位数的方法:
求累加次数: (n 1) P% j g
n 表示数据的个数; P 表示百分位数; j 表示整数部分; g 表示小数部分
(4.2)
求百分位数:Pp (1 g ) X j gX j 1 (4.3) Xj表示第j个数据值;
A
B
4.1 全距与百分位数
• 4.1.1 全距
• 全距(range)又称为两极差,用符号R 表示。 • 用最大值(maximum)减去最小值 (minimum)得到全距。
R X max X min
(4.1)
全距的特点: • 全距是最粗糙的差异量数,只利用了数据 中的极端值; • 容易受极端值的影响; 全距的应用: • 主要用于对数据作预备性检查,了解数据 的大概分布范围; • 确定统计分组,编制次数分布表。
心理与教育统计学
第4章 差异量数
• • • • 4.1 全距与百分位数 4.2 平均差、方差与标准差 4.3 标准差的应用 4.4 差异量数的选用
• 差异量数是对一组数据的变异性,即 离中趋势特点进行度量和描述的统计 量,也称为离散量数(measures of dispersion) • 差异量越大,表明数据越分散、不集 中;差异量越小,表明数据越集中, 变动范围越小。
百分位差的应用
• 百分位差可以有效地避免极端数据的影响,这种 思想常常应用于日常生活中。 • 例如,在跳水比赛中,有7位裁判员,他们会一起 对跳水运动员的表现进行打分。虽然裁判本着客 观公正的标准去对待每一位运动员,但也难免存 在主观判断上偏颇。为了避免主观因素给运动员 带来的不公正性,比赛规定:从7名裁判员的分数 中.先舍去一个最高分和一个最低分,余下5名裁 判员的分数相加后,再乘以运动员所跳动作的难 度系数,便得出该动作的实得分。
成绩 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
合计
频数f 2 3 6 7 8 11 9 5 4 2 1 58
累加频数
58 56 53 47 40 32 21 12 7 3 1
首先计算P10和P90对 应的累加次数
58×10/100=5.80 58×90/100=52.20
(1)计算平均值
X
1 fX C N
(2)计算平均差
f |X A.D.
C
X |
n 1 | 61 79.84 | 1 | 64 79.84 | n 5.60
4.2.2 方差与标准差
• 方差(variance)也称变异数、均方。离均 差平方后的平均数,是每个数据与该组数据 平均数之差乘方后的均值。 • 样本统计量用符号 s 2表示 2 • 总体参数用符号 表示
P i PP Lb N Fb 100 fP 10 5 P 58 3 58 10 54.5 100 4 90 5 P90 84.5 58 47 88.83 100 6
P 90 P 10 88.83 58 30.83
P i PP Lb N Fb 100 fP 25 5 P25 64.5 58 12 65.89 100 9 75 5 P75 79.5 58 40 67 100 7
P75 P25 82 65.89 16.11
• 5名被试的错觉实验数据如下,求其平均差。
被试 错觉量(ms) 1 16 2 18 3 20 4 22 5 17
解:n=5,
| 16 18.6 | | 18 18.6 | | 17 18.6 | A.D. 5 1.92
16 18 17 X 18.6 5
4.2 平均差、方差与标准差
• 4.2.1 平均差 • 平均差(average deviation)或 mean deviation)原始数据与平均数 绝对离差的平均值。 • 用符号A.D.或M.D.表示
(1)原始数据计算公式:
|X A.D.
i
X |
n
|x |
i
(4.7a)
n
式中:A.D.——平均差; Xi——数据值; X ——平均值; xi ——离均差。
精确组限 79.5~84.49
5/7=0.71
采用次数分布表计算百分位数
P i PP Lb N Fb 100 fP
(4.4)
Pp为所求的第P个百分位数; Lb为百分数所在组的精确下限; fp为百分数所在组的次数; Fp为小于Lb的各组次数的和; N为总次数; i为组距。

N 2 2 ( X 2X X X )
N 2 2 X 2X X X ) N
N 2 X ( X ) 2 2 2 X N X N( N ) N 2 2 2 X 2 ( X ) ( X ) 2 s 2 N N N2 2 X X 2 2 ( ) 所以: s N N
7 6 5 4 3 2 1
58×0.8=46.4 46.4-40=6.4 6.4×0.71=4.54 4.54+79.5=84.04
成绩 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
合计
频数 2 3 6 7 8 11 9 5 4 2 1 58
58 56 53 47 40 32 21 12 7 3 1
Q3 Q1 四分位差: Q 2
25 i 其中: Q P L N Fb 1 25 b 100 f 25 N i Lb Fb 4 f 25
(4.6)
75 i Q3 P75 Lb N Fb 100 f 75 3N i Lb Fb 4 f 75
累加频数
58 56 53 47 40 32 21 12 7 3 1
求73对应的百分等级
100 fP PR [ Fb ( X Lb ) ] N i 100 11 [21 (73 69 .5) ] 58 5 49.48
利用累加次数分布图求百分等级和百分位数
100 80
4.1.2 百分位数
• 百分位数又称为百分位点,指两量尺 上的一个点,在此点以下,包括数据 分布中全部数据个数的一定百分比。 • P百分位数将所有数据分为两部分,小 于该数值的个数与总的个数的比值为 P%。
(1)根据原始数据计算百分位数
数值: 2 次序: 1
3 2
P10
5 3
5 4
7 5
9 6
P50
用次数分布表计算四分位差
成绩 95- 90- 85- 80- 75- 70- 65- 60- 55- 50- 45-
合计
频数f 2 3 6 7 8 11 9 5 4 2 1 58
累加频数
58 56 53 47 40 32 21 12 7 3 1
首先计算P25和P75对 应的累加次数。 58×25/100=14.5 58×75/100=43.5
——总体平均值; N ——总体的个数;

(2)样本方差与标准差公式
样本方差:
s2
2 ( X X )
n 1
(4.10) (4.11)
样本标准差:s
s
2 ( X X )
n 1
2 s 式中: ——样本方差;
——样本标准差; X ——样本平均值; N ——样本的个数;
当样本数量非常大时,总体和样 本方差的值差不多,本书并未区分总 体和样本方差的不同。
参考文献:虞仁和, 胡国清, 孙振球, & 黄正南. (2010). 关于百分位 数直接计算法的进一步探讨. 中国卫生统计, 27(3), 307-308.
数值: 2 次序: 1
3
5
5
7
9
12 15 15 16
2
P10
3
4
5
6
7
8
9
10
(n 1) P% j g Pp (1 g ) X j gX j 1
4.1.3 百分位差
• 由于全距表示一组数据的离散程度时, 受极端数据的影响。 • 可用百分位差表示离散程度,百分位 差是指两个百分位数之差。 • 如: P90-P10,P93 -P7 。 • 百分位差不能很好地反应中间数据的 分布情况,常作为辅助差异量数
用次数分布表计算百分位差 (P90—P10)
20
20
15
15
Frequency
Frequency
Mean = 160.479 Std. Dev. = 8.68513 N = 100
10
10
5
5
Mean = 159.6089 Std. Dev. = 4.78489 N = 100 0 130 140 150 160 170 180 190
0 130 140 150 160 170 180 190
4.1.4 百分等级
• 某一数值在一组数据中所处的百分位置, 称为该数值的百分等级(percentile rank) • 符号为PR
100 fP PR [ Fb ( X Lb ) ] N i
(4.5)
PR 百分等级; X 给定的原始分数。
成绩 频数f 95- 2 90- 3 85- 6 80- 7 75- 8 70- 11 65- 9 60- 5 55- 4 50- 2 45- 1 58 合计
求P10:(10 1)10% 1 0.1
j=1;g=0.1
P 10 (1 0.1) 2 0.1 3 2.1
(2)采用次数分布表计算百分位数 ( P80百分位数) 累积频数 f
84.50
84.04
83.79
83.07 82.36 81.64 80.93 80.21 79.50
25% Q1
25% 25% Q2
25% Q3
25% 25% 25% 25% Q1 Q2 Q3 四分Biblioteka Baidu差与Q1、Q2和Q3之间的关系
• 优点: • 四分位差通常与中数联系起来应用。与全 距相比,用百分位差表述数据的离散情况 稍微好一些。
• 缺点: • 没有把全部数据考虑在内,其稳定性会差 一些。 • 不适合代数运算 • 反应不够灵敏
(2)分组数据计算公式:
f |X A.D.
C
X |
n
f |x n
C
|
(4.7b)
式中:f——各组次数; XC——各组的组中值; xc ——各组中值与平均数的差。
分组数据计算平均差
1 X fX C N 61 1 64 1 97 2 1 1 2 79.84
相关文档
最新文档