第四章 差异量

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三组平均数均为8 A组最大值与最小值相差2 差异量越大,集中量的代表性越差; B组最大值与最小值相差8 C组最大值与最小值相差14 差异量越小,集中量的代表性越好。 哪一组的平均数代表性最好?
4
第一节 全距、四分位距、百分位距
集中量相同
差异量不同
集中量不同
差异量相同 集中量不同 差异量不同
5
第一节 全距、四分位距、百分位距
二、四分位距
1、概念 用依一定顺序排列的一组数据中间部位50%个频数距离的一 半作为差异量指标,即四分位距。
Q3 - Q1 QD 2
8
第一节 全距、四分位距、百分位距
二、四分位距
若将从小到大排列的一组数据分成频数相等的四段, 第一段与第二段的分界点称第一个四分位数, 第三段与第四段的分界点称第三个四分位数。 四分位数就是第三个四分位数(第25百分位数)与第一个四 分位数(第75百分位数)差的一半。
3 i Q3 LQ3 ( n n2 ) 4 fQ3 1 i Q1 LQ1 ( n n1 ) 4 fQ1
Q3 - Q1 QD 2
10
第一节 全距、四分位距、百分位距
二、四分位距
3、应用及优缺点 优点——简单易懂、计算简便、较少受两极端数值的影响, 比全距可靠。 缺点——但忽略了左右共50%数据的差异,又不适合代数运 算。 应用—— 适用于有特大或特小两极端数值, 有个别数值不确切、不清楚, 以及用等级表示的数据等情况。 当一组数据用中位数表示集中量时,就用四分位距表示差异 量,因为它们同属于百分体系。
2
fX n

2
X
fX
n
2
fX n

2
X——各组组中值;f——各组频数。
29
课堂练习 6、计算下列资料的方差及标准差 2 2 解: 2 fX fX
X
n 2 52.52 4 57.52 6 62.52 11 67.52 24 72.52 4 97.52 128 n
32
课堂练习
7、已知标准差9.6和频数36,求离差的平方和 2 解: ( X X ) 由, X 2

n
得离差平方和即
(X X )
2
n 36 9.6 3317 .76
2 X 2
33
第三节 方差和标准差
四、各种差异量的数值关系 当总频数相当大,且频数分布呈正态时, 全距、四分位距、平均差、标准差的数值存在如下关系: 全距大致等于6个标准差的距离,7.5个平均差的距离,9个 四分位距的距离。
11
第一节 全距、四分位距、百分位距
课堂练习
1、求下列原始数据的全距和四分位距。 23、36、20、25、33、31、27、29
解:由小到大排序:20、23、25、27、29、31、33、36
全距: R=36-20=16
Q3 - Q1 32 24 4 四分位距: QD 2 2
12
第一节 全距、四分位距、百分位距
2 2 2
X
X
X
n
2
X n
2
2
41 39 37 35 38 5 4
2
28
第三节 方差和标准差
二、计算方法
2、频数分布表计算法 若原始数据已归入频数分布表,且无原始数据,可以用组中 值近似计算。
X
2
fX n
虽然平均数相同,但离散程度不同。
平均数是76 平均数是76
甲组比较分散、参差不齐,变异性较大; 乙组比较集中、整齐、变异性较小。
3
第一节 全距、四分位距、百分位距
反映各变量值——远离其中心值的程度
下列三组数据分布是否相同? A:7、7、8、8、8、9、9 B:4、5、7、8、9、11、12 C:1、4、7、8、9、12、15
25%
Q1
25%
25%
QM
25%
Q3
9
第一节 全距、四分位距、百分位距
二、四分位距 2、计算方法 (1)原始数据计算法 先将原始数据从小到大排列,然后根据求中位数的方法求出 第一个四分位数Q1和第三个四分位数Q3,带入公式求解。 (2)频数分布表计算法 先用内插法求出第一个四分位数Q1及第四个四分位数Q3,然 后带入公式即可。
31
第三节 方差和标准差
三、方差和标准差的应用及其优缺点 缺点—— 1不太容易理解; 2易受两极端数值的影响; 3有个别数值模糊不清时,无法计算。 应用—— 1与其他差异量相比,方差和标准差应用最为广泛。 2最直接用途是描述一组数据的离散程度,当一组数据的集 中量用算术平均数表示时,差异量要用标准差表示。 3在计算其他统计量时,如差异系数、相关系数、标准分数 等,也都要用到标准差。而方差在统计推断中常常用到。
一、全距 2、频数分布表——全距为最大一组与最小一组组中值之差, 或者是最大一组的上限与最小一组的下限之差。
优点——概念清楚、意义明确、计算简单。 缺点——易受两极端数值影响。不考虑中间数值的影响,反 应不灵敏。 应用——作为差异量的粗略指标,在编制频数分布表时决定 全距范围之用。
7
第一节 全距、四分位距、百分位距
三、百分位距 ——百分位距是指两个百分位数之差。 常用的有两种: 一为第90与第10百分位数之差,用P90-P10; 一为第93与第7百分位数之差,用P93-P7表示。 优点——用几个百分位距能较好反映一组数据的差异程度。
应用——在计算频数分布峰态量时,要用到百分位距。
13
第一节 全距、四分位距、百分位距
三、方差和标准差的应用及其优缺点 优点—— 1反应灵敏,随任何一个数据的变化而变化; 2严密确定,一组数据的方差及标准差有确定的值; 3计算简单; 4适合代数计算,不仅求方差和标准差的过程可以进行代数 运算,而且可以将几个方差和标准差综合成一个总的方差和 标准差; 5用样本数据推断总体差异量时,方差和标准差是最好的估 计量。 在避免极端值影响方面,优于全距; 在考虑全部离差方面,优于四分位距; 在避免绝对值方面,优于平均差。
X Md
n ( 12 17 14 17 17 17 19 17 21 17 ) 5 2.8
19
第二节 平均差
二、平均差的计算方法
2、频数分布表计算法
频数分布表上各组组中值计算平均差的公式为
f X Md MD n
f—各组的频数;Md—中位数;X—各组的组中值;n—总频 数。
X
2
X n
2
X n

2
X
X
n
2
X n

2
26
课堂练习 5、分别用定义公式及原始数据计算5名男童体重(千克)41、 39、37、35、38的方差及标准差。 解:(1)定义公式 41 39 37 35 38 X 38 5 2 ( X X ) X2
1 i 5 Q1 LQ1 ( n n1 ) 67.5 (28 23) 70.28 4 fQ1 9
Q3 - Q1 81.03 70.28 QD 5.38 2 2
15
第一节 全距、四分位距、百分位距
解: (3)P90与P10的百分位距
90 i 90 5 P90 L90 ( n n1 ) 82.5 ( 112 94) 84.93 100 f90 100 14
2
2 52.5 4 57.5 6 62.5 11 67.5 24 72.5 4 97.5 128 87.48
X
fX
n
2
fX n
87.48 9.35
2
30
第三节 方差和标准差
标准差大好还是小好,要看具体问题。 如:某班某科的考试成绩标准差; 选拔性考试中,某考题的标准差。
25
第三节 方差和标准差
二、计算方法 定义式中需要计算平均数,相对麻烦,且平均数常有小数出 现,离差也会含小数,平方后小数位更多,不方便、不够精 确。因此常用以下方法。 1、原始数据计算法 ——直接用原始数据计算
10 i 10 5 P n n2 ) 57.5 ( 112 5) 61.375 10 L 10 ( 100 f10 100 8
P .93 61.375 23.555 23.56 90 P 10 84
16
第二节 平均差
一、概念 上述差异量不能说明全部数据的变动情况,而平均差可避免 这一缺点。
《教育统计学》
职教学院 刘春雷 E-mail:lcl2156@126.com
1
第四章
差异量
第一节 全距、四分位距、百分位距 第二节 平均差 第三节 方差和标准差
第四节 相对差异量
第五节 偏态量及峰态量
2
第一节 全距、四分位距、百分位距
甲组:54、63、72、74、82、88、99 乙组:67、71、73、76、79、82、84
f
21
第二节 平均差
三、平均差的优缺点 优点—— 意义明确、计算容易; 每个数据都参加了运算,考虑到全部的离差,反应灵敏。 缺点—— 计算要用绝对值,不适合代数运算,应用受限制,因此在统 计分析中较少应用。
22
第三节 方差和标准差
一、概念 方差——是指离差平方的算术平均数。 就是一组数据中每个数据与该组平均数之差,平方之,求其 和,再除以数据的个数。定义式如下:
一、全距 1、原始数据 ——是一组数据中最大值与最小值之差,又称极差。用R表示。
甲组:54、63、72、74、82、88、99 乙组:67、71、73、76、79、82、84
甲组的全距 乙组的全距 R=99-54=45 R=84-67=17
平均数是76 平均数是76
Biblioteka Baidu
6
第一节 全距、四分位距、百分位距
20
第二节 平均差
课堂练习 4、求频数分布表数据(Md=64)的平均差 解: MD
X Md n ( 15 64 1 45 64 3 55 64 4 65 64 5 75 64 4 85 64 2 95 64 1) 20 13.2
n (41 38) 2 (39 38) 2 (37 38) 2 (35 38) 2 (38 38) 2 5 4
2 ( X X ) X 4 2 n
27
课堂练习 解:(2)原始数据
X X n n 412 392 372 352 382 5
X
2
(X X ) n
2
23
第三节 方差和标准差
一、概念
标准差——方差的平方根。
X
2 ( X X )
n
方差和标准差都是非常重要的差异量指标。 将离差平方后,都变成正数,但数据的单位也被平方了, 经开平方后的标准差的单位与原始数据相一致。
24
第三节 方差和标准差
一、概念
——标准差的值越大,数据的离散程度越大, 即数据参差不齐,分布范围也就越广; ——标准差的值越小,数据的离散程度越小, 即数据越集中、整齐,分布范围越小。
平均差——是每一个数据与该组数据的中位数(或算术平均 数)离差的绝对值的算术平均数。通常用MD表示。
17
第二节 平均差
二、平均差的计算方法 1、原始数值计算方法
X Md MD n
X—原始数据;Md—中位数;n—总频数。
18
第二节 平均差
课堂练习 3、求下列原始数据12、14、17、19、21的平均差。 解: MD
R≈6σX≈7.5MD≈9QD
34
类 别 标 准 差 方 差 全 距


缺 方差和标准差 点 第三节


1.感应灵敏 2.严密确定 3.适合代数法处 理 4.受抽样变动影 响小 1.意义简明 2.计算简单
课堂练习 2、求下列112名学生测验分数的全距、四分位距及P90与P10 的百分位距。
14
第一节 全距、四分位距、百分位距
解: (1)全距: R=97.5-52.5=45(上下限)或R=95-55=40(组中值) (2)四分位距:
3 i 5 Q3 LQ3 ( n n2 ) 77.5 (84 60) 81.03 4 fQ3 34
相关文档
最新文档