集中量数和差异量数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
第四章集中量数
•定义:表示一组数据集中趋势的指标,或表示一组数据的典型情况。•分类:
• 1.算术平均数• 2.中数• 3.众数
• 4.加权平均数• 5.几何平均数•
6.调和平均数
2
一、算术平均数(样本用X ,M ;总体用U )
•(一)计算方法
•(二)平均数的优缺点
优点:(1)反应灵敏。(2)确定严密。•(3)简明易解。(4)计算简单。
•缺点:(1)易受极端数据的影响。•(2)数据模糊不清时,无法计算。•
3
二、加权平均数
•计算公式:
∑∑=
i
i
i w
W
X W M •W 是权数,X 是原始分数
计算加权平均数
省区代码
人数 平均分数
1 627 98
2 268 60
3 400 82
4 670 96
5 411 80
6 314 65
7 610 96
8 500 88 ∑
3800 665
某课题组在8个省区进行一项调查,各省区的取样人数和平均数见下表,求该项调查的总平均数
•解:A :若果不加权,仅用八个省份的平均分数
之和除以8,便可得到
97.863800
3304963800
88
5006026898627==⨯+⋅⋅⋅+⨯+⨯=
W M 13.838
665
==
W M B :A ,B 两种方法计算得到的平均值差异较大。哪个正确?为什么?答:用A 方法计算的平均数不正确,实质上是假定每个省区的取样人数相等,这不符合实际情况
6
加权平均数的应用
•选拔考试时,不同科目的考试分数最终合成总分时,可根据每个科目的重要性,赋予不同的权重。•一题多解时,可赋予不同权重。
•难易度不同的几次考试,计算总成绩时可赋予不同权重。
•同一个题目让不同年龄的学生做时,应考虑权重。•由各小组平均分计算总平均数是应用加权平均数的特例。
三、中数与众数
中数(M d )
是按顺序排列在一起的一组数据中居于中间位置的数。该数可能是数据中的某一个,也可能根本不是原有的数。
求中数的方法
1.数据中无重复
数值的情况
(1)数据个数为奇数
(2)数据个数为偶数
2.数据中有重复数据的情况
(1)重复值没有位于中间
(2)重复数目位于中间,数据的个数为奇数
(3)重复数目位于中间,数据的个数为偶数
d N 1
2
M =X +•求中数的方法
•首先将数据按其取值大小排序,找出位于中间的那个数就是中数。1、一组数据中无重复数值(1)数据个数为奇数,则中数为位置的那个数。即例二:求数列4,6,7,8,12的中数.
解:=3,数列中排在第3的数据为7,故M d=7
N 1
2+N 12
+(2)数据个数为偶数,则中数为居于中间位置两
个数的平均数,即第与第位置的两个数据相加除以2。即•例3:有2,3,5,7,8,10,15,19共8个数,求中数。
•解:数列中第位置的数是7,处于第位置的数是8,故Md=N
N 12
2
d X X
M =
2
++N
2N (+1)2
N
2N
(+1)
25.72
8
7=+2、中数附近有重复数时
①当重复数目位于数据中间,数据的个数为奇数时例:求数列11,11,11,11,13,13,13,17,17的中数。③当重复数目位于数列中间,数据的个数为偶数时,计算方法与数据的个数为奇数时基本相同
例:求数列11,11,11,11,13,13,13,17,17,18的中数。
•解:
14
12
12.5
13.5
12.83
13.16
12.66
13
中数的优缺点
•1、优点:
•计算简单,容易理解,不受极端数值的影响•2、缺点:
•(1)中数的计算不是每个数据都加入,其大小不受制于全体数据。
•(2)反应不够灵敏,极端值的变化对中数不产生影响。•(3)中数受抽样影响较大,不如平均数稳定。•(4)计算时需要对数据先排列大小。
•(5)中数乘以总数与数据的总和不相等(除非:中数=平均数)。
•(6)中数不能作进一步代数运算。•3、使用条件:
•(1)当一组观测结果中出现两个极端数目时。
•(2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。
•
(3)当需要快速估计一组数据的代表值时,也常用中数。
14
三、众数
•(一)求众数的基本方法–即出现次数最多的数据。
•(二)众数的应用
•需要快速而粗略的寻求一组数据的代表值时。•当次数分布中有两极端数据时。
X 224342222Y
5
4
4
5
4
5
5
4
5
众数、中位数和平均数的关系
负偏分布均值中位数众数
对称分布均值= 中位数=众数
正偏分布
众数中位数均值
1.正态分布
2.偏态分布
M
Mo Md ==M
Md Mo 23-=16
第二节差异量数
•差异量数:指一组数据的离中趋势,其大小可用来表示平均数的代表性。•类别:• 1.方差•2.标准差• 3.四分位差•4.百分位差• 5.平均差• 6.全距
最好的差异量数1718
•全距:
•公式:R=X max -X min
平均差:公式:
n
X X
D A i
∑-=
|
|..