集中趋势与离散趋势
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
该组的组中值 2249.5[ (2000 2499) 2 ]即为众数。即 MO=2249.5。
第一节 集中趋势分析
• 二、定序变量:中位数 • 中位数(Median)是指一组数据按值的大小顺序排列后,处于中央位置的变量值,用
Md表示,又称中位值。
1.根据原始资料求中位数 根据原始资料计算中位数时,要先对数据进行排序,然后确定中位数的位置,其公式 为:
Md
L
n 2
cf(m1) fm
(U
L) =1999.5
80 20 2 (2499.5 1999.5) 2250
40
即职工收入的中位数为 2250 元。
第一节 集中趋势分析
• 三、定距变量:均值
•
均值(Mean)又称算术平均数,它在统计学中有重要的地位,是社会调查
• U=中位数所在组的真正上限值; • n=全部个案数;
• cf(m-1)=低于中位值所在组真实下限的累积频次; • fm=中位数所在组的次数;
第一节 集中趋势分析
• 二、定序变量:中位数
例 6:下面以表 5-4 中的数据为例,说明如何从分组资料中求中位数。 表 5-4 某公司员工的收入分布
收入
频数(f)
• 由分组资料求中位数时,与前面的情况有所不同。在确定了中位值所在组的组别后,还要对“组
距”进行分解,以确定中位值的位置。具体方法是先列出累积频次,然后按上例同样的方法确定中位
数所在的组,最后利用下述公式计算出中位数:
•
Md
其中,L=中位数所在组的真正下限值;
L
n 2
cf (m1)
fm
(U L)
聊天
150
16.7
玩游戏
100
11.1
查找资料
50
5.6
其它
100
11.1
合计
900
100.0
【解】:这里的变量是“上网类型”,属于定类层次的变量。
表 5-1 中数据显示,在所调查的 900 人中,选择“浏览信息”的最多,有 300 人,占 总数的 33.3%,因此众数为“浏览信息”这一类别,即 MO=浏览信息。
女生 Md 的位置= n 1 =4.5,位于序列第四和第五位之间,对应的成绩是优和良,因 2
此,女生的 Md=“良和优之间”。
第一节 集中趋势分析
• 二、定序变量:中位数
例 4:在某个城市随机抽取 9 个家庭,调查得到每个家庭的人均月收入数据如下(单 位:元),计算人均月收入的中位数。
1500,750,780,1080,850,960,2000,1250,1630; 【解】:先将上面的数据排序:750,780,850,960,1080,1250,1500,1630 ,2000;
变量量 的值 集, 中一 趋般 势用。MO表示,又称众值。它主要用来测量定类层次变
第一节 集中趋势分析
• 一、定类变量:众数
例 1:表 5-1 的数据是甲校学生上网类型的统计数据,请根据表中的数据,计算众数。
表 5-1 上网类型的频数分布表
上网类型
频数
百分比
浏览信息
300
33.3
收发邮件
200
22.2
第五章 集中趋势与离散趋势
• 第一节 集中趋势分析 • 第二节 离散趋势分析 • 第三节 单变量描述分析的SPSS应用
第一节 集中趋势分析
• 集中趋势(central tendency)是指一组数据向某一中心值靠 拢的倾向,集中趋势分析就是寻找一个代表数据一般水平的代表 值或中心值。
• 一、定类变量:众数 • 众数(Mode)是一组数据中出现次数最多(即频数最高)的
非常不满意
24
24
不太满意
108
132
一般
95
227
比较满意
43
270
非常满意
30
300
合计
300
解:由表数据可知,
Md 位置= n 1 300 1 150.5
2
2
从表中累积频次中可看出,这个位置在“一般”这个等级内,因此 Md=“一般”。
第一节 集中趋势分析
• 二、定序变量:中位数
• 2.用分组资料求中位数
累积频次(cf↑)
1000-1499
10
10
1500-1999
10
20
2000-2499
40
60
2500-3000
20
80
合计
80
【解】:Md 的位置= n 1 80 1 40.5 ,Md 位于“2000—2499”组,
2
2
L=1999.5;U=2499.5;cf(m-1)=20;fm=40;n=80;代入公式得
第一节 集中趋势分析
一、定类变量:众数
例 2:根据表 5-2 的数据求该公司员工收入的众值。
表 5-2 某公司员工的收入分布
收入
员工数
组中值
1000-1499
10
1250
1500Leabharlann Baidu1999
10
1750
2000-2499
40
2250
2500-3000
20
2750
合计
80
【解】:从表中数据显示可知,频数最多的收入组别为“2000-2499”,对应的频数为 40 人,
Md 的位置= n 1 =5,数列中从左到右第 5 个是 1080,即 Md=1080 元。 2
我们再来看看数据个数为偶数时怎样计算中位数。 假设我们在例 4 中多抽取 1 个家庭,10 个家庭,每个家庭的人均月收入数据排序后为:
660,750,780,850,960,1080,1250,1500,1630 ,2000; 计算 10 个家庭人均月收入的中位数。
例 3:下面是男女两组成绩的定序数据,求男女生各自成绩的中位数。 男:优、良、差、良、优、中、中、中、良; 女:优、优、良、中、良、良、优、优; 【解】:先将成绩排序: 男:优、优、良、良、良、中、中、中、差; 女:优、优、优、优、良、良、良、中;
男生 Md 的位置= n 1 =5,位于序列的第 5 位,对应成绩是良,因此,Md=良; 2
Md 的位置= n 1 ,其中,n 为数据的个数。 2
当 n 为奇数时,中位数 Md 就直接等于 n 1 位置上对应的变量值;当 n 为偶数时,中 2
位数 Md 等于位于最中央的两个变量值的均值(如果是定序变量,中位数取值就是将两个变 量取值结合起来表示)。
第一节 集中趋势分析
• 二、定序变量:中位数
【解】:Md 的位置= n 1 =5.5,数列中第 5 个是 960,第 6 个是 1080,中位数 Md= 2
960 1080 1020 元。 2
第一节 集中趋势分析
• 二、定序变量:中位数
例 5:一项关于城市住房满意度调查结果如下表, 表 5-3 城市家庭对住房状况的评价
满意度
频数(f) 累积频数( cf )