统计数据的描述之分布集中趋势的测度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从累计频数看, Q1在“ 不 满意”这一组别中; Q3在 “一般”这一组别中
四分位数为 Q1 = 不满意 Q3 = 一般
四分位数
2、由未分组数据确定四分位数
(1)确定位置:
Q
位置
1
n1 4
Q
3
位置
3(n 1) 4
(2)确定四分位数
四分位数
【例】:9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000
定类尺度数据的众数 (例题分析)
某专卖店新品球衣销售情况(单位:件)
球衣货号 AS01-90 AS02-95 AB09-10 SP09-05 SS12-10 PP89-15 合计
前日售出数量 6 18 25 88 15 8 160
当日出售数量 4 21 33 93 23 6 180
解:众数为“SP09-05” , 即
中位数为
Me=一般
定比尺度数据的中位数 (计算方法)
(1)由未分组资料确定中位数
(2)由单变量值分组确定中位数
(3)由组距分组数据确定中位数
定比尺度数据的中位数
(计算方法)
(1)由未分组资料确定中位数 排序:确定中位数位置
Om
n 1 2
❖ 奇数:中间位置的变量值为中位数。
❖ 偶数:中间位置相邻两个变量值的简单平均数是 中位数。
Q1
Q2
Q3
2. 不受极端值的影响
3、主要用于定序尺度数据,也可用于定比尺 度数据,但不能用于定类尺度数据
四分位数
1、由定序数据确定四分位数
(1)确定位置:
Q
1
位置
n 4
Q
3
位置
3n 4
(2)确定四分位数
四分位数
定序尺度数据的四分位数
(例题分析)
解:Q1位置= (300)/4 =75 Q3位置 =(3×300)/4 =225
第二章 统计数据的描述
第2节 分布集中趋势的测度
❖ 一、众数 ❖ 二、中位数 ❖ 三、四分位数 ❖ 四、均值 ❖ 五、几何平均数 ❖ 六、切尾均值 ❖ 七、众数、中位数和均值的比较
集中趋势 (central tendency)
❖ 一组数据向其中心值靠拢的倾向和程度 ❖ 测度集中趋势就是寻找数据水平的代表值或中
(B)1=fm-fm-1,即众数组的次数与Biblioteka Baidu一组次数之 差;
2=fm -fm+1,即众数组的次数与后一组次数 之差;
(C) i为众数组的组距。
某组地距区的分人组均月计收算入调众查数数据
MoL1 12i
4000 6843 2000 481 .697 元
(684)3(6832 )
中位数 (median)
• 排序后处于中间位置上的值
50%
50%
Me
不受极端值的影响
主要用于定序尺度数据,也可用于定比尺度数 据,但不能用于定类尺度数据
定序尺度数据的中位数
1、确定中位数的位置
中位数位置n 2
2、确定中位数
定序尺度数据的中位数
(例题分析)
解:中位数的位置为 300/2=150
从累计频数看, 中位数在“一般”这 一组别中
Mo= SP09-05
定序尺度数据的众数
(例题分析)
解:众数为“副教授 ”这一级别,即
Mo=副教授
定比尺度数据的众数 (单变量值分组)
【例】已知某企业某日工人的日产量资料如下:
解:该企业该 日全部工人日 产量的众数为 12件。
定比尺度数据的众数 (组距分组)
Mo
L 1 12
i
符号含义:
(A)L为众数组的下限;
中位数(10个数据的算例)
【例】:10个家庭的人均月收入数据
排序: 660 750 780 850 960 1080 1250 1500 1630 2000
位置: 1 2 3 4 5 6 7
8 9 10
位O 置 mn2 112 015.5
中位 M e数 96 20 108 10020
(2)由单变量值分组确定中位数
中位数 (9个数据的算例)
【例】9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630
排序:
750 780 850 960 1080 1250 1500 1630 2000
位 置:
12 3 4 5 6 7 8 9
位O 置 mn2 192 15 中位数Me 1080
4. 主要用于定类尺度数据,也可用于定序尺度数 据和定比尺度数据
众数的种类
无众数 data: 10 5 9 12 6 8
一个众数 data: 6 5 9 8 5 5
双众数 data: 25 28 28 36 42 42
多众数 data:32 32 32 33 34 34 34 35 36 36 36
位 置: 1 2 3 4 5 6 7 8 9
Q 1 位 9 4 置 1 2 .5Q 3 位 3 (置 9 4 1 ) 7 .5 Q 178 2805 801Q 3 5 15 21 06 0 1 35 065
四分位数
【例】:10个家庭的人均月收入数据 排序: 660 750 780 850 960 1080 1250 1500 1630 2000 位置: 1 2 3 4 5 6 7 8 9 10
某地区家庭收入分组
中位数的位置在第46(92/2)位,应在第二组
Me L
f
2
Sm1 i
fm
92 21
5000 2
5000 7777.8(元)
45
分位数
1、四分位数 2、十分位数 3、百分位数
四分位数
(quartile)
1. 排序后处于25%和75%位置上的值
25% 25% 25% 25%
心值 ❖ 不同类型的数据用不同的集中趋势测度值 ❖ 低层次数据的测度值适用于高层次的测量数据,
但高层次数据的测度值并不适用于低层次的测 量数据
众数
(mode)
1. 一组数据中出现次数最多的变量值
2. 一般情况下,只有在数据量较大且集中趋势明 显的情况下,才能用众数作为总体的代表值。
3. 众数是一个位置代表值,不受极端值的影响
中位数位置n 2
某公司销售人员月销售冰箱中位数计算
中位数位置:
Om
n 2
80 2
40
从累计频数看,中位数在“80”这一组别中,中位数为
Me=34(台)
❖(3)由组距分组数据确定中位数
第一步:确定中位数位置
Om
f
2
第二步:采用公式计算
Me L
f
2
Sm1 i
fm
其中:
L是中位数所在组的下限
fm是中位数所在组的次数 Sm-1是中位数所在组前面各组累计次数 i是中位数所在组的组距
四分位数为 Q1 = 不满意 Q3 = 一般
四分位数
2、由未分组数据确定四分位数
(1)确定位置:
Q
位置
1
n1 4
Q
3
位置
3(n 1) 4
(2)确定四分位数
四分位数
【例】:9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000
定类尺度数据的众数 (例题分析)
某专卖店新品球衣销售情况(单位:件)
球衣货号 AS01-90 AS02-95 AB09-10 SP09-05 SS12-10 PP89-15 合计
前日售出数量 6 18 25 88 15 8 160
当日出售数量 4 21 33 93 23 6 180
解:众数为“SP09-05” , 即
中位数为
Me=一般
定比尺度数据的中位数 (计算方法)
(1)由未分组资料确定中位数
(2)由单变量值分组确定中位数
(3)由组距分组数据确定中位数
定比尺度数据的中位数
(计算方法)
(1)由未分组资料确定中位数 排序:确定中位数位置
Om
n 1 2
❖ 奇数:中间位置的变量值为中位数。
❖ 偶数:中间位置相邻两个变量值的简单平均数是 中位数。
Q1
Q2
Q3
2. 不受极端值的影响
3、主要用于定序尺度数据,也可用于定比尺 度数据,但不能用于定类尺度数据
四分位数
1、由定序数据确定四分位数
(1)确定位置:
Q
1
位置
n 4
Q
3
位置
3n 4
(2)确定四分位数
四分位数
定序尺度数据的四分位数
(例题分析)
解:Q1位置= (300)/4 =75 Q3位置 =(3×300)/4 =225
第二章 统计数据的描述
第2节 分布集中趋势的测度
❖ 一、众数 ❖ 二、中位数 ❖ 三、四分位数 ❖ 四、均值 ❖ 五、几何平均数 ❖ 六、切尾均值 ❖ 七、众数、中位数和均值的比较
集中趋势 (central tendency)
❖ 一组数据向其中心值靠拢的倾向和程度 ❖ 测度集中趋势就是寻找数据水平的代表值或中
(B)1=fm-fm-1,即众数组的次数与Biblioteka Baidu一组次数之 差;
2=fm -fm+1,即众数组的次数与后一组次数 之差;
(C) i为众数组的组距。
某组地距区的分人组均月计收算入调众查数数据
MoL1 12i
4000 6843 2000 481 .697 元
(684)3(6832 )
中位数 (median)
• 排序后处于中间位置上的值
50%
50%
Me
不受极端值的影响
主要用于定序尺度数据,也可用于定比尺度数 据,但不能用于定类尺度数据
定序尺度数据的中位数
1、确定中位数的位置
中位数位置n 2
2、确定中位数
定序尺度数据的中位数
(例题分析)
解:中位数的位置为 300/2=150
从累计频数看, 中位数在“一般”这 一组别中
Mo= SP09-05
定序尺度数据的众数
(例题分析)
解:众数为“副教授 ”这一级别,即
Mo=副教授
定比尺度数据的众数 (单变量值分组)
【例】已知某企业某日工人的日产量资料如下:
解:该企业该 日全部工人日 产量的众数为 12件。
定比尺度数据的众数 (组距分组)
Mo
L 1 12
i
符号含义:
(A)L为众数组的下限;
中位数(10个数据的算例)
【例】:10个家庭的人均月收入数据
排序: 660 750 780 850 960 1080 1250 1500 1630 2000
位置: 1 2 3 4 5 6 7
8 9 10
位O 置 mn2 112 015.5
中位 M e数 96 20 108 10020
(2)由单变量值分组确定中位数
中位数 (9个数据的算例)
【例】9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630
排序:
750 780 850 960 1080 1250 1500 1630 2000
位 置:
12 3 4 5 6 7 8 9
位O 置 mn2 192 15 中位数Me 1080
4. 主要用于定类尺度数据,也可用于定序尺度数 据和定比尺度数据
众数的种类
无众数 data: 10 5 9 12 6 8
一个众数 data: 6 5 9 8 5 5
双众数 data: 25 28 28 36 42 42
多众数 data:32 32 32 33 34 34 34 35 36 36 36
位 置: 1 2 3 4 5 6 7 8 9
Q 1 位 9 4 置 1 2 .5Q 3 位 3 (置 9 4 1 ) 7 .5 Q 178 2805 801Q 3 5 15 21 06 0 1 35 065
四分位数
【例】:10个家庭的人均月收入数据 排序: 660 750 780 850 960 1080 1250 1500 1630 2000 位置: 1 2 3 4 5 6 7 8 9 10
某地区家庭收入分组
中位数的位置在第46(92/2)位,应在第二组
Me L
f
2
Sm1 i
fm
92 21
5000 2
5000 7777.8(元)
45
分位数
1、四分位数 2、十分位数 3、百分位数
四分位数
(quartile)
1. 排序后处于25%和75%位置上的值
25% 25% 25% 25%
心值 ❖ 不同类型的数据用不同的集中趋势测度值 ❖ 低层次数据的测度值适用于高层次的测量数据,
但高层次数据的测度值并不适用于低层次的测 量数据
众数
(mode)
1. 一组数据中出现次数最多的变量值
2. 一般情况下,只有在数据量较大且集中趋势明 显的情况下,才能用众数作为总体的代表值。
3. 众数是一个位置代表值,不受极端值的影响
中位数位置n 2
某公司销售人员月销售冰箱中位数计算
中位数位置:
Om
n 2
80 2
40
从累计频数看,中位数在“80”这一组别中,中位数为
Me=34(台)
❖(3)由组距分组数据确定中位数
第一步:确定中位数位置
Om
f
2
第二步:采用公式计算
Me L
f
2
Sm1 i
fm
其中:
L是中位数所在组的下限
fm是中位数所在组的次数 Sm-1是中位数所在组前面各组累计次数 i是中位数所在组的组距