统计学第四章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 差异量
教学目的:
1、理解全距、四分位距、百分位距、平均差、方差、标准差与差异系数等概念;
2、掌握各种差异量指标的计算方法。
数据的分布特征不仅有集中趋势,还有离中趋势。以动态的眼光,从不同的角度瞧,数据就是向中间变动的,也就是向两端变动的。两组数据可能平均水平相同,但两组数据的分布特征并不完全相同。
【如】:比较下列两组数据 A 组:88、82、73、76、81 B 组:92、86、70、72、80
两组平均数,80==B A X X 但R A =88-73=15,R B=92-70=22。即A 组较集中,B 组较分散。因此,我们描述一组数据的分布特征,既要描述其集中趋势,也要描述其离中趋势。
差异量:表示一组数据的离中趋势或变异程度的量称为差异量。
常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差与差异系数。
第一节
全距、四分位距、百分位距
一、全距
全距:就是一组数距中最大值与最小值之差。 优点:意义明确,计算方便。 缺点:反应不灵敏,易受极端值影响。 二、四分位距
(一)四分位距的的概念
四分位距:就是指一组按大小顺序排列的数据中间部位50%个频数距离的一半。
)
(1.42
1
3Q Q QD -=
QD :表示四分位距; Q 3:表示第三四分位数; Q 1:表示第一四分位数。
所以:四分位距的公式又为:
2
25
75P P QD -=
(二)四分位数的计算方法 1、原始数据计算法 (1)将数据由小到大进行排列; (2)分别求出三位四分位数(点); (3)代入公式计算。
【例如】:有以下16个数据25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,其中四分位距的计算方法如下:
(1)先将原始数据从小到大排列好;
12、14、15、17、*19、20、22、25、*29、30、31、33、*35、37、39、40 Q 1=18 Md =27 Q 3=34
(2)求出Q 1、Md 、Q 3;
(3)将Q 1、Md 、Q 3的得数代入公式(4、1)。
82
18
34=-=
DQ 2、频数分布表计算法 利用频数分布表计算公式为:
)
(2.42
25
75P P QD -=
关键就是分别计算P 75与P 25,百分位数计算方法掌握了,这里的计算就不会有什么问题。 (三)优缺点
优点:意义明确,不受极端值影响。 缺点:反应不灵敏。 三、百分位距
百分位距:就是指两个百分位数之差。 常用的百分位距有两种:P 90-P 10与P 93-P 7 优点:意义明确,不受极值影响。 缺点:反映不灵敏。
第二节 平均差
一、平均差的概念
平均差:就是指每个数据与本组数据的平均数(或中位数)之差的绝对值的算术平均数(用MD 表示)。 二、平均差的计算方法
1、原始数据计算法 公式为:
)(||||3.4⎪⎪⎭
⎪⎪⎬
⎫-=-=
∑∑N Md X MD N
X X MD 或
【如】:求88、82、73、76、81的平均差。
4.45808180768073808280888058176738288|)||||
||||(||
|)(=÷-+-+-+-+-=∑-=∴=÷++++=∑=
N
X X MD N
X
X
:解 2、频数分布表计算法 公式为:
.
)
(|
|4.4为各组组中值:c c
X N
X X
f MD ∑-=
【例】:求表4、1中30数据的平均差。
表4、1
30个分数的频数分布表
分数 60— 70- 80- 90- 频数 5 12 10 3 组中值
65
75
85
95
7.783095
3851075126551=⨯+⨯+⨯+⨯=∑=
N fX X c )
(解:
5.7307.789537.7885107.7875127.78655)
2(|)||||
|||(|
|=÷-⨯+⨯+-⨯+-⨯=∑-=
-N
X X f MD c 三、平均差的优缺点
优点:意义明确,反应灵敏。
缺点:不适合代数运算。
第三节
方差与标准差
一、方差与标准差的概念
1、方差:就是一组数据离差平方的算术平均数(用2
x σ表示)。
定义公式为:
)()
(5.42
2N
X X x ∑-=
σ
。
:;
:为离差平方和为离差2
)(∑--X X X X
2、方差的方根即标准差
)()
(6.42
N
X X x ∑-=
σ
例:求72,78,80,86的方差与标准差 解:(1)求算术平均数
794
86
807872=+++=
=
∑N
X X
(2)求方差
254
)7986()7980()7978()7972()(22222
2=-+-+-+-=-=
∑N
X X x
σ
(3)求标准差
5252
===x x σσ
※:标准差的值越大,说明数据越分散。 二、方差与标准差的计算方法 1、原始数据计算法