第五章-离中趋势测量法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(
xf f
)
2
………(5.9a)
2
x x
f
2
2
2
2
………(5.9b)
(x x ) f
x f f
2
(
xf f
)
2
………(5.10a)
x x
2
………(5.10b)
标准差性质
方差和标准差具有以下主要的数学性质: ⑴变量数列的方差等于其变量值平方 的平均数减去平均数的平方,即:
(
x n
)
2
…………(5.7a)
2
x x
2
2
…………(5.7b)
(x x ) n
2
2
2
x n
2
(
x n
)
2
…………(5.8a)
x x
…………(5.8b)
同理可证,依据分组资料计算标准差和方差
的简单计算公式为:
(x x ) f f
2
x f f
2
简单方差:
2
(x x ) n
2
………(5.3)
加权方差:
2
(x x ) f f
2
………(5.4)
(二)标准差 标准差,又称均方差,是指各变量值与其算术 平均数离差平方的算术平均数的正平方根。 标准差就是方差的正平方根,记作 。 标准差的计量单位与数据原来的计量单位相 同,这样一来,标准差就很容易与平均数以及 其他有相同计量单位的统计指标进行比较。
(8 2 8 0 .0 8 ) 2 0 ( 7 8 .8 8 0 .0 8 ) 3 0 20 30
2 2
2 .4 6
(总方差)
组 内 组 间 2 0 7 .5 2 2 .4 6 2 0 9 .9 8
2 0 9 .9 8 1 4 .4 9 ( 分 )
全 距 系 数 VR R x
平 均 差 系 数 V AD
AD
标 准 差 系 数 V
x
x
例7,甲、乙两班学生的学科考试成绩情况为:
(百分制), x甲 7 2 .4 分 , 甲 8 .9 5 分 甲、乙两班考试平均成绩的代表性。
V
V
甲
0 .9 6 分 x乙 3 .8 8 分 , 乙 (五分制),试比较
2 x
2
Baidu Nhomakorabea
x x
2
2
⑵由于离差平方和为最小值,故据此求得的方 差小于各变量值对其他任意数的方差,即:
<
2 c
(C为任意常数)
( 3 ) 假 定 原 变 量 x的 方 差 为 x , 标 准 差 为 x ,
2
a、b为常数,那么:
若 y x a, 则
若 y a x, 则
甲
x甲 8.95 72.4
0.96 3.88
1 0 0% =
1 0 0% =
1 0 0 % 1 2 .3 6 %
1 0 0 % 2 4 .7 4 %
乙
x乙
乙
由标准差系数计算的结果可以判定,甲班 学生考试平均成绩的代表性高于乙班。
(二)偏度与峰度 1、偏度 偏度又称偏态,是指变量数列中次数分布 的非对称程度。 如果次数分布是完全对称的,称为对称分 布;如果不是完全对称的,则称偏态分布。一 般来说有以下几种情形:
AD x x n
…………(5.1)
例1,有两个参赛篮球队队员身高(单位:cm)如下: 甲队:185 191 195 202 217 乙队:190 197 199 200 204 以上述资料为例,计算简单平均差。
⑵加权平均差 在资料已经分组时,平均差采用加 权平均法计算,其计算公式为:
AD
(总 标 准 差 )
(三)标准分(Z分数) 标准分是离差与标准差的比值,即:
Z x x
……………(5.12)
标准分有三个特性:
⑴Z是和X一一对应的变量值。 ⑵Z分数没有单位,是一个不受原资料单位影响 的相对数,因而可以用于不同单位资料的比较。 ⑶Z分数实际表达了变量值距总体均值有几个标准差。 标准分可以为正、负或零值。它的含义是以平均数为标准, 以标准差为单位表示一个数据在团体中的相对位置。
d
o
偏态
X M
o
为了使不同数列的偏态值可比,同样可计算偏态的相 对数,即偏态系数,用α来表示
X Mo 3 (X M d ) S S
由于
0 , 所 以 的 取 值 为 0、 为 正 、 为 负 由 x M 0 决 定 。
0
( 1) x M
0, 0, 对 称 分 布 ;
⑴简单标准差 对于未分组资料计算标准差时可 采用简单法,其计算公式为:
(x x ) n
2
例,求26,45,88,62,74这些数字的标准差
⑵加权标准差 按照分组资料(变量数列)计算标准差时可采 用加权法。由组距数列计算标准差时,还应先 求出组中值(开口组的组中值以邻近组的组距 确定),再按加权法计算。其计算公式为:
例2: 1,2,3,4,5, 6,7,8,9,10 10个数从中间(空白部份)切开,右边中央数8=Q3,左边中间数 3=Q1 例3: 1,2,3,4,5,6, 7,8,9,10,11,12 12个数从中间(空白部份)切开,右边中间两数9,10平均9.5=Q3,左 边中间两数3,4平均3.5=Q1
第三节
例1 假设有数组:0,10,20,30,40,50,60,70,80,90, 100,110. 元素共12个,由小到大排列。 则第一四分位为第三位和第四位的中位数,即:Q3=(20+30) /2=25;同理,第三四分位为第九位和第十位的中位数,即:Q1= (80+90)/2=85。 四分位差Q=Q3-Q1/2=(85-26)/2=29.5 如果上面的数组表示12个学生的成绩,Q表示学生得分的分散情形, 若Q值越大,表示学生得分越参差不齐。
一、平均差 平均差是各个标志值与其算术平均 数离差绝对值的算术平均数(平均离 差),一般用AD表示。它反映标志值与 其算术平均数之间的平均差异。 在统计中,把总体中各个标志值与其 算术平均数之差( x x )叫做离差。 离差总和等于零,即 ( x x ) 0
⑴简单平均差 在资料未分组时,平均差采用简单平 均法计算,其计算公式为:
y
y
x;
a x;
y
若 y x / a, 则
a
x
;
若 y a b x, 则
y
b
x
⑷方差的分解定理(加法定理): 一个分组数列的总方差等于其各组组内 方差的平均数与其组间方差之和,即:
总 组内 组间
亦即 (x x ) f f
2
Z分数计算
第四节 相对离势
(一)变异系数(V) 变异系数又称离散系数,是各种变异指 标(全距、平均差、标准差)与其算术 平均数的比率,一般用符号V表示。 它是反映总体中标志值相对差异 程度的指标,是一个无名数。
常用的变异系数有三种,即全距系数、平均 差系数和标准差系数,而其中以标准差系数 的应用最为普遍。相应的计算公式为:
(二)四分位差
四分位差就是第三四分位数和第一四分位数之差的二 分之一,用Q.D表示,即Q.D =(Q3-Q1)/2。 1.离散程度的测度值之一 2.也称为内距或四分间距 3.反映了中间50%数据的离散程度不,受极端值的影响 用于衡量中位数的代表性
四分位距(四分差)就是第三四分位数和第一四 分位数之差,用于测定中间50%部分的距离为多少。 即IQR = Q3 -Q1 。
[例] 求74,84,69,91,87,74, 69这些数字 的全距。 [解] 把数字按顺序重新排列: 69,69,74,74,84,87,91, 显然有 R =Xmax– Xmin =91—69=22
对分组资料,不能确知最大值和最小值,求全距: (1)用组值最大组的组中值减去最小组的组中值(偏小) (2)用组值最大组的上限减去最小组的下限(偏大) (3)用组值最大组的组中值减去最小组的下限; 或最大组的上限减去最小组的组中值(接近) 求下表所示资料的全距
变异指标的种类和计算
1、按计算的基准来分有以下两类:
(1)以两数之差来表达的有全距和四分位差等。
(2)以对平均数偏差来表达的有平均差、标准 差等。
2、变异指标如按数量关系来分有以下两类: 凡用绝对数来表达的变异指标,统称绝对离势; 主要有极差、平均差、四分位差、 标准差等。 凡用相对数来表达的变异指标,统称相对离势; 主要有异众比率、标准差系数、平均 差系数和一些常用的偏态系数。
(1)当 x M
e
M 0时 , 对 称 分 布 ;
⑵当 ⑶当
x x
>Me > Mo时,右偏分布; <Me < Mo时,左偏分布。
(三) 偏态系数
我们在前面讨论统计图时已经对频数分布的正态和 偏态有所认识。我们又看到了算术平均数与中位数、众 数之间存在的关系:当总体呈对称分布时,X 、 M 、 M 三者完全相等;当总体呈不对称的偏态分布时,它们之 间存在着数量(位置)的差异。因此,偏态可由 X 与 M o 的差来表示,即
0
( 2) 当 x M
解:x xk fk fk
2 k
8 2 2 0 7 8 .8 3 0 20 30
2 2
8 0 .0 8 ( 分 )
组内
组间
2
2
2
fk
fk
2
1 2 .4 2 0 1 5 .6 3 0 20 30
2
2 0 7 .5 2
2
( xk x ) fk fk
x x f f
…………(5.2)
平均差资料分组 (例题分析)
Md
Mi i
1
k
x fi
n
2040 17 (台) 120
含义:每一天的销售量平均数相比, 平均相差17台
平均差性质
二、方差与标准差
(一)方差
总体方差,简称方差,就是各个标志值与 其算术平均数离差平方的算术平均数,一 般用符号 2 表示,其计算公式为:
第五章 离中趋势测量法 离中趋势测量法
离中趋势是指变量数列中变量值 之间的差异程度或离散程度。
本章重点: 1、平均差 2、方差与标准差 3、离散系数 本章难点: 1、方差与标准差 2、是非标志的方差
变异指标的概念和作用
一、变异指标的概念 变异指标又称标志变动度,是反映总体各单位标志值之间差异程度的 综合指标。 二、变异指标的作用 1、是衡量平均指标代表性的尺度 2、可用来研究现象的稳定性和均衡性 3、在抽样调查和相关分析中有着重要作用 变异指标用以反映总体各单位标志值的变动范围或参差程度,与平 均指标相对应,从另一个侧面反映了总体的特征。变异指标不仅可以 综合地显示变量值的离中趋势,还可以用来判别平均数的代表性。
2
2
2
2
2 k
fk
fk
( xk x ) fk fk
2
式 中 , k为 各 组 的 组 内 方 差 ;
xk为 各 组 的 算 术 平 均 数 ; f k为 各 组 的 次 数 。
例5,某班50名学生考试数学,其中女同学20 名,平均成绩82分,标准差为12.4分;男同学 30名,平均成绩78.8分,标准差15.6分。试确 定全班同学的总平均成绩、方差和标准差。
(x x ) f f
…………(5.6)
2
例,分组单项数列标 准差计算准差计算
用变形式
求下表所示资料的标准差(分组组距数列标准差)
原始式
用变形式
在实际应用中,标准差和方差的计算可采用 下列简单公式计算。 在资料未分组时,简单公式为:
(x x ) n
2
x n
2
常用的变异指标有 全距、平均差、标 准差和变异系数 等几种。
第一节
(一) 全距 全距又称极差(Range),是指一个变量数列中的最 大值与最小值之差,一般用R表示。 优点;计算简单,便于理解 缺点:受极值影响大,无法计算开口组资料; 数据利用率低,信息丧失严重;受抽样变动影响大
计算公式为 R = max(xi) - min(xi) 全距越大,表示变动越大。
四分位数
四分位数是将一组数据由小到大(或由大到小)排序后,用3个 点将全部数据分为4等份,与这3个点位置上相对应的数值称为四 分位数,分别记为Q1(第一四分位数),说明数据中有25%的数 据小于或等于Q1,Q2(第二四分位数,即中位数)说明数据中 有50%的数据小于或等于Q2、Q3(第三四分位数)说明数据中 有75%的数据小于或等于Q3。其中,Q3到Q1之间的距离的差的 一半又称为分半四分位差,记为(Q3-Q1)/2。