第三章数据的离中趋势、偏度峰度

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x

n
x

x 1 x 2 ..... x 2 n

15 17 ..... 30 11

242 11
22
(件)
AD

x x n

x 1 x x 2 x ... x n x n

15 22 17 22 ... 30 22 11
全距、平均差、方差和标准差有计量单位, 是标志变异的绝对指标。 而且指标的大小不仅 取决于变量值的差异程度,还取决于变量值水
平的高低。因而,对于具有不同水平的数列,
或不同量纲的数列,都不能直接用全距、平均
差、方差和标准差来比较平均数代表性的大小。
为了消除平均水平的影响,只能用相对形式—
—变异系数进行比较。
变异系数包括:
全距系数v R
R x
A.D x
Hale Waihona Puke Baidu
平均差系数
v AD
标准差系数v

x
第四节偏太、峰度的测度 (标准差的应用)
• 一、偏态及其测度 • 二、峰度及其测度
一、偏态及其测度
偏态
是对分布偏斜方向及程度的测度。
利用偏态系数既可以判 断分布的偏斜方向,还 可测度偏斜的程度
利用众数、中位数和均 值之间的关系判断分布 的偏斜方向
3 . 37 %
表明该地大学生月消费支出的频数分布属于正偏分布,众数对 算术平均数的偏斜程度为3.37%,即存在轻微程度的偏态分布
在计算偏态系数时,如果公式中的众数不易计算,可用中位数代替
集中趋势(Central tendency)

——平均指标
一组数据向其中心值靠拢的倾向和程度

• •
测度集中趋势就是寻找数据一般水平的代表值或中心值
不同类型的数据用不同的集中趋势测度值 选用哪一个测度值来反映数据的集中趋势,要根据所掌握的 数据的类型来确定
离中趋势(差异程度)——变异指标
第三节 离中趋势的测度
例: 工人人数:100——200 200——300 300——400 R=400-100=300 50——60 60——80 80以上 R=(80+20)- (50-10)=60
3、全距作用:全距R越大,说明总体各单位标志值变 动越大(越分散),全距R越小,说明总体各单位 标志值变动越小(越集中)。 4、优点、缺点 : 优点:计算方便、意义明确;常用于产品质量检查和 控制 缺点:由于全距取决于极端标志值,会带有偶然性, 所以它不能全面反映标志的变异程度,也不能用以 评价平均指标的代表性好坏。
某车间有两个生产小组,某周5天的产量如下:
甲:171,172,172,172,173(件) 乙:220,190,170,150,130(件) • 两组的平均日产量均为172件。 • 平均日产量172件的代表性甲组比乙组好,为 什么?
• 前面已学过总量指标、相对指标和平均指标, 借助这些指标,我们对现象总体的规模、结构、 比例和一般水平等有了认识。但这些指标不能 反映总体各单位的差异情况,相反地它们却把 各单位的差异抽象化,把各单位的差异给掩盖, 为了说明总体中各单位标志之间的差异和分布 变异情况我们又引进一个指标------变异指标--说明总体数量特征的另一个指标---------变异指 标。
;
2

xi f i fi
2
xi f i f i

2
.根据平均数和标准差的关 系。 (1)设 x 600 , V 25 %

提示:
则标准差为多少?
x 20 , x
2


n
x
2
(
n
x )
2
(2)设

450
则标准差系数为多少?
2 2 2
f
f 1 f 2 .... f n
例:有四位学生数学成绩分别为:65、72、76、85,求标准差 解:已知 1、 (分)
x
x
n

x1 x 2 x 3 x 4 n

65 72 76 85 4
74 . 5
例:有四位学生数学成绩分别为:65、72、76、 85,求标准差 解:已知
1、变异指标反映总体各单位标志值分布的离中趋势。 变异指标越大,则说明标志值分布愈分散,总体的同质性也愈 差,反之, 变异指标越小,则说明标志值分布愈集中,总体的同质性也愈 高. 2、变异指标可以说明平均指标的代表性程度, 变异指标越小,平均指标代表性越好,反之,变异指标越大, 平均指标代表性越差。 3、变异指标说明现象变动的均匀性或稳定性程度。 变动指标越小,则现象变动均匀性、稳定性越好,反之,则现 象变动均 匀性、稳定性越差。
A D

x x f


x1 x f 1 x 2 x f 2 x 3 x f 3 x n x f 4 f1 f 2 f 3 f 4
f

25 42 10 35 42 70 45 42 90 55 42 30 10 70 90 30
2 2 2
2
n

( 65 74 . 5 ) ( 72 74 . 5 ) ( 76 74 . 5 ) ( 85 74 . 5 )
2 2 2
2

4 2 2 2 2 ( 9 . 5 ) ( 2 . 5 ) (1 . 5 ) (10 . 5 )

209 4
4
7 . 2 (分)
二、变异指标的种类 1、全距(极差Range)
2、平均差(Average Deviation) 3、方差Variance和标准差S.D
4、变异系数(离散系数 )
二、变异指标的种类 1、全距(极差Range):
1)全距的定义:(极差)是标志的最大值与最小值之差,以R 表示 R=最大值— 最小值 2、组距式分组时, 闭口的组距R=最未组的上限-第一组的下限; 开口的组距R=(最未组的下限+相邻组组距)-(第一组的上限相邻组的组距) 例:产值(万元):50以下
75.37 (分)

2

f
( x x ) f
2

4992.5926 54
92.4554

f
9.62
(分)
方差和标准差具有以下数学性质 (1) 若每一个变量值加上一个常数,方差和标准差
不变。设a为任意常数,
则有:

yi xi a
y x
2
2
y x
(2)若每一个变量值均扩大一个常数倍,方差和标准
偏态系数计算方法有很多,比较常用的是:
SK (X
M
0
)


X
3
K
i
X

3
Fi

i1
N
皮尔逊测定法

3
动差测定法
例24:根据例11某地大学生消费支出资料计算偏态系数 已知平均数为458元,众数454.35元,标准差108.3元,则:
Sk x M
o


458 454 . 35 108 . 3
2、平均差(平均离差) 1)平均差的定义:是各单位标志值对算术平均数的离差绝对值的算术平均数, 用MD表示,是测定标志值变异程度的另一种方法。
A D

x x n
( 不分组 )A D


x x f

f
(分组)
2、平均差作用:平均差愈小,则标志变动愈小,平均差愈大,则标志变动 愈大 例1、某生产班组11个工人日产零件数为15、17、19、20、22、22、23、23、 25、26、30,求平均差 解:
慎用和善用统计平均指标 梁秋生 (摘自《统计与决策》2003.7) 实例一:据某报刊报道,某地的一个村庄近几年来经济发展 速度很快,全村106户农民家庭2000年户均年现金收入已经达到 25000元左右,这对该地区来说是一个很高的收入水平。可是实地 调查却发现,这个村106户家庭中,绝大多数家庭的年现金收入在 3000—5000元之间,与周围的村庄并无多大的差别。但是,这个村 里却有一户家庭,由于近几年来做收购生皮毛的生意,买卖十分兴 隆,年均收入达到200万元以上。正因为如此,村干部在计算全村
3 .1
(件)
• 例2:某车200个工人按日产量分组分配数列如下,计算平均差 已知: 1 25 , x 2 35 , x 3 45 , x 4 55 x 日产量 工人数(人)
f 1 10 , f 2 70 , f 3 90 , f 4 30
20—30 30—40 40—50
x 1 65 , x 2 72 , x 3 76 , x 4 85
1、 x
x
n

x1 x 2 x 3 x 4 n

65 72 76 85 4
74 . 5
2、
(x x)
n
2

( x1 x ) ( x 2 x ) ( x 3 x ) ( x 4 x )



(x x) n
2

( x 1 x ) ( x 2 x ) ..... ( x n x )
2 2
2
(不分组)
n
2

(x x)
f
(分组)


( x 1 x ) f 1 ( x 2 x ) f 2 ..... ( x n x ) f n
差也同比例变化。设a为任意常数,
yi axi
y a x
2 2
2
y a x
σ2和σ的简易计算公式
xi n
2
简单 :
2

xi ; n
2

xi n
2
xi n
2
加权 :
2

xi fi
2
fi
xi fi f i
一、变异指标的概念和作用
二、变异指标的种类及计算方法
• 一、变异指标的概念和作用
• (一) 变异指标的概念:又称标志变动度,它 是综合反映总体各个单位标志值的差异程度 或离散程度。
(二)变异指标的作用:
1、变异指标反映总体各单位标志值分布的离中趋势 2、变异指标可以说明平均指标的代表性程度 3、变异指标说明现象变动的均匀性或稳定性程度
6 .6
3、方差Variance和标准差S.D
测度标志变异最重要,最常用的指标。
标准差=方差的平方根。
方差——变量值与平均数的离差平方的平均数。

x x n
2
2

2
2

x x f
x
x f
2
f

x x n


2
f
1)标准差定义:是总体中各单位标志值与算术平均数的离差平方的算术平均 的平方根。是测定标志变异最主要的指标。 2)标准差作用:标准差愈小,则标志变动愈小;标准愈大,则标志变动愈大
10 70 90
解:
x
xf f

x1 f 1 x 2 f 2 x 3 f 3 x 4 f 4 f1 f 2 f 3 f 4
8400 200
50—60
合计
42
30
200

25 10 35 70 45 90 55 30 10 70 90 30
成绩(分) 55 65 75 85 85 合计
x
学生人数 2 15 19 15 3 54
xf f 2 ( x x ) f
xx -20.37 -10.37 -0.37 9.63 19.63 ——
( x x) f
2
829.8738 1613.0535 2.6011 1391.0535 1156.0107 4992.5926
x
2
(3)设 2 36 , x 2 360 ,则平均数为多少? (4)设

V 17 . 2 %, x
2
174
则平均数为多少?
4、离散系数 (变异系数)
一群牛的平均体重是180公斤,标
准差是18公斤;一群羊的平均体重是
15公斤,标准差是3公斤,能不能说羊
的平均体重的代表性高些?为什么?
某车间有两个生产小组,某周5天的产量如下:
甲:171,172,172,172,173(件)
乙:220,190,170,150,130(件) 可以计算全距:
2、平均差(Average Deviation) 变量值与平均数的离差绝对值的平均数
A .D
x x n
A.D

x x
f

f
家庭收入时,户均现金收入一下子就达到了25000元左右。然而, 不仅村里绝大多数村民对这种说法持否定态度,认为不能代表他们 真实的收入水平,就连那户致富的村民也不以为然。
某车间有两个生产小组,某周5天的产量如下:
甲:171,172,172,172,173(件)
乙:220,190,170,150,130(件) 你从这两组数据能看不出什么?
相关文档
最新文档