离散趋势度量

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

未分组数据
N 1 Q1 4
2 ( N 1) Q2 4
四分位差: Q Q3 Q1
3( N 1) Q3 4
甲村11户家庭人口数资料
2,2,3,4,6,9,10,10,11,13,15
Q1
Qd 位置 Q1位置 Q3位置 N 1 11 1 6 2 2 N 1 11 1 3 4 4 3( N 1) 3(11 1) 9 4 4
N F 1 4 h1 Q1 l 1 f1
3N F3 4 h3 或Q 3 l 3 f1
四分位差: Q Q3 Q1
表2-5 某校学生家庭月收入 调查了甲校550名学生的家庭月收入,中位值是 收入(元) 频次f 累计频数F 1180.5元,在这个中位值的两旁共有50%的家庭月 10 10 500~700 收入是介于991.9~1361.7之间,差距是369.8元。这 65 75 700 ~900 个差距显示了离散程度,差距越大,中位值的代表 136 211 900 ~1100 158 369 1100 性越小。 ~1300 1300 ~1500 1500 ~1700 141 40 510 550
Q2
(Md)
Q3
0.75
4 12
10
79 Md 8 2
Q1 = 3+0.25(4-3)= 3.25 Q3 = 10+0.75(12-10)= 11.5
四分位差 Q = Q3- Q1 = 11.5- 3.25 = 8.25
甲村资料
Md 9
四分位差 Q = Q3- Q1 = 11- 3 = 8
第六章 变异指标
s大象 500 kg
x大象 3500 kg
可比
s免子 0.5kg
x免子 2.5kg
离散系数指标
第六章 变异指标
s身高 x身高
身高的差异水平:cm 用离散系数可以相互比较 体重的差异水平:kg
可 比
s体重 x体重
例:比较青少年身高与体重分布的差异重度。假 设通过调查得到如下资料
n
S越大,表示算术平均数的代表性越差;S越
大表示算术平均数的代表性越好
标准差的计算方法 (一)、计算公式

1、简单标准差 ——适用于未分组资料
S ( x x ) N
2
2、加权标准差 ——适用于分组资料
s
2 (x x) f f
•(二)、计算步骤 一般的计算过程:列表
组距 150~154 154~158 158~162 162~166 166~170 170~174 174~178 178~182 合计 f 1 2 7 10 16 12 7 5 60 X 152 156 160 164 168 172 176 180 --X X
( X X )2
f ( X X )2
计算算术 平均数
计算离差
计算离差 平方
乘以权数
求72、81、86、69、57这些数字的标准差。 解:先求算术平均数
X X
N
365 73 .0 5
( X X )2
X
72 81 86 69 57 365
(X X )
-1 8 13 -4 -16 0
Q2
(Md)
Q3
Md 9
Q1 = 3 Q3 = 11
四分位差 Q = Q3- Q1 = 11- 3 = 8
乙村 8 户家庭人口数资料
2,3,4,70.25,10,12,12 ,9
Q1 3
N 1 8 1 Qd 位置 4.5 2 2 Q1位置 Q3位置 N 1 8 1 2.25 4 4 3( N 1) 3(8 1) 6.75 4 4
X
72 81 86 69 57 365
X
2
5184 6561 7395 4761 3249 27151
S
X2 N
(
X
N
)2
27151 365 10 .06 5 5
2
第六章 变异指标
s大象 500 kg 不可比 s免子 0.5kg
x大象 3500 kg
x免子 2.5kg
第六章 变异指标
身高
身高的差异水平:cm 不可以相互比较 体重的差异水平:kg
体重
五、离散系数(标准差系数)
• 离散系数:一组数据的标准差与其相应的算术平 均数之比,称为离散系数,也称为标准差系数。
S CV 100 % X
离散系数的最大作用是可以比较不同单位数据分布 的差异程度。离散系数越大表示数据越分散,离散 系数越小表明数据越集中。
一、异众比率ν
异众比率ν是指非众数值的频数之和在总体频数中 所占的比例。公式为:
N f m0 N
f m 0 — 众数的频数
ν越小,众数的代表性越强,ν越大,众数代表性 也就越差。
二、全距R
全距又称极差,是指在一个变量数列中,两个极
端值之间的差。
公式为:
R =Xmax– Xmin
R越小,表示资料比较集中,R越大,表示资料比
平均数 X 身高 体重 170.28 58.16 标准差S 5.62 2.86
求出身高和体重的离散系数
S 5.62 100 % 3.30% 解: 身高 : CV 100 % 170 .28 X
S 2.86 100 % 4.92% 体重: CV 100 % 58.16 X
第二节、离散趋势测量法
甲、乙、丙三个村民小组15位已婚妇女的 初婚年龄分别为:
1 甲组 乙组 24 22
2 24 23
3 24 24
4 24 25
wk.baidu.com
5 24 26
平均分 24 24
丙组
18
20
25
30
27
24
二、离散趋势测量法
• 离散趋势是指一组变量值背离分布中心值 的特征。与集中趋势法具有互相补充的作 用。
f 1 2 7 10 16 12 7 5 60
计算左 边数列的 标准差
[解] 因为是分组资料,计算标准差运用加权式 先求算术平均数
Xf X
N
168 .5
X X
( X X )2 f ( X X ) 2
组距 150~154 154~158 158~162 162~166 166~170 170~174 174~178 178~182 合计
合起来应用,以准确全面地反映 描述总体的分布特征。集中值和
离散值相互补充的对应关系是:
众数
中位数
集中趋势的测度值
算术平均数 三者比较 异众比率 全距
离散趋势测度值
四分位差 标准差 离散系数(标准差系数)
3N F 3 4 h3 Q3 l 3 f3 412 .5 369 1300 200 1361 .7 141
四、标准差S
• 标准差S:各变量值对其算术平均数的离差平方的 算术平均数的算术平方根被称为标准差,又被称 均方差。 • ( x x )2 • 原始式: S
S
f 1 2 7 10 16 12 7 5 60
N
X 152 156 160 164 168 172 176 180 --
-16.5 272.25 272.25 -12.5 156.25 312.50 -8.5 72.25 505.75 -4.5 20.25 202.50 -0.5 0.25 4.00 3.5 12.25 147.00 7.5 56.25 393.75 11.5 132.25 661.25 0.0 --- 2499.00
5 25 55 80
= 良好-不及格
表明有50%的同学学业 成绩在良好与不及格 之间。
N 1 78 1 Q1位置 19 .75 4 4 3( N 1) 3(78 1) Q 3位置 59 .25 4 4
Q1= 良好 Q3= 不及格
分组数据
步骤: ① 计算向上累计次数 ② 求出Q1和Q3的位置 ③ 确定Q1和Q3的位置应属于哪一组 ④ 计算Q1和Q3位置的数值
乙村资料
Md 8
四分位差 Q = Q3- Q1 = 11.5- 3.25 = 8.25
甲村的离散程度略低于乙村,,如果以中位值作估 计时,在甲村所犯的错误要小于在乙村所犯的错误。
表2-6 学生的学业成绩
等级 f F
四分位差: Q Q3 Q1
优秀 良好 及格 不及格 合计
5 20 30 25 80
较分散。
三、 四分位差Q
四分位差:四分位差是第三四分位数与第一四分位数之差。

四分位数:用三个数值把总体中各单位分割成相等的四
部分,这三个数值被称为四分位数,即Q1、Q2、Q3。
25% 低 Q1 Q2
(Md)
25%
25% Q3
25% 高
公式为:Q=Q3-Q1
Q反映了中间50%数据的离散程度,Q越小,说明中间的 数值越集中,中位数的代表性越好 ;Q越大,说明中间数 值越分散,中位数的代表性越差。
2499 6.5(cm) 60
f ( X X )2
第六章 变异指标
(三)、标准差的简捷计算
目的: 避免离差平方和计算过程的出现
X2 N
2
简单标准差 加权标准差
S
X N

2
S
X f f
Xf f

2
求72、81、86、69、57这些数字的标准差。 解:
青少年在体重方面的差异明显大于在身高方面的差异。
小结
1.离散趋势指标的比较
类别 使用特点 适用性
异众比率
极差 四分位差 标准差
仅考虑频次 考虑变量的次序和大小
使用了全部资料
定类、定序、定距变量 定序、定距变量
定距变量 众值 中位值 均值 异众比率 四分位差 标准差
2.在社会统计学的分析中,集中
趋势分析与离散趋势分析常被结
1 64 169 16 256 506
S
(X X )
N
2

506 10 .06 5
[例] 调查大一男生60人的身高情况如下表所示,求 他们身高的标准差。
组距 150~154 154~158 158~162 162~166 166~170 170~174 174~178 178~182 合计
总数
550
Q1位置=137.75 Q3位置=413.25 中位值Md= 1180.5
Q1 =991.9 Q3 =1361.7
Q=1361.7-991.9=369.8元
N F 1 4 h1 Q 1 l1 f1 137 .5 75 900 200 991 .9 136
相关文档
最新文档