集中量数和差异量数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
第四章集中量数
•定义:表示一组数据集中趋势的指标,或表示一组数据的典型情况。
•分类:
• 1.算术平均数• 2.中数• 3.众数
• 4.加权平均数• 5.几何平均数•
6.调和平均数
2
一、算术平均数(样本用X ,M ;总体用U )
•(一)计算方法
•(二)平均数的优缺点
优点:(1)反应灵敏。
(2)确定严密。
•(3)简明易解。
(4)计算简单。
•缺点:(1)易受极端数据的影响。
•(2)数据模糊不清时,无法计算。
•
3
二、加权平均数
•计算公式:
∑∑=
i
i
i w
W
X W M •W 是权数,X 是原始分数
计算加权平均数
省区代码
人数 平均分数
1 627 98
2 268 60
3 400 82
4 670 96
5 411 80
6 314 65
7 610 96
8 500 88 ∑
3800 665
某课题组在8个省区进行一项调查,各省区的取样人数和平均数见下表,求该项调查的总平均数
•解:A :若果不加权,仅用八个省份的平均分数
之和除以8,便可得到
97.863800
3304963800
88
5006026898627==⨯+⋅⋅⋅+⨯+⨯=
W M 13.838
665
==
W M B :A ,B 两种方法计算得到的平均值差异较大。
哪个正确?为什么?答:用A 方法计算的平均数不正确,实质上是假定每个省区的取样人数相等,这不符合实际情况
6
加权平均数的应用
•选拔考试时,不同科目的考试分数最终合成总分时,可根据每个科目的重要性,赋予不同的权重。
•一题多解时,可赋予不同权重。
•难易度不同的几次考试,计算总成绩时可赋予不同权重。
•同一个题目让不同年龄的学生做时,应考虑权重。
•由各小组平均分计算总平均数是应用加权平均数的特例。
三、中数与众数
中数(M d )
是按顺序排列在一起的一组数据中居于中间位置的数。
该数可能是数据中的某一个,也可能根本不是原有的数。
求中数的方法
1.数据中无重复
数值的情况
(1)数据个数为奇数
(2)数据个数为偶数
2.数据中有重复数据的情况
(1)重复值没有位于中间
(2)重复数目位于中间,数据的个数为奇数
(3)重复数目位于中间,数据的个数为偶数
d N 1
2
M =X +•求中数的方法
•首先将数据按其取值大小排序,找出位于中间的那个数就是中数。
1、一组数据中无重复数值(1)数据个数为奇数,则中数为位置的那个数。
即例二:求数列4,6,7,8,12的中数.
解:=3,数列中排在第3的数据为7,故M d=7
N 1
2+N 12
+(2)数据个数为偶数,则中数为居于中间位置两
个数的平均数,即第与第位置的两个数据相加除以2。
即•例3:有2,3,5,7,8,10,15,19共8个数,求中数。
•解:数列中第位置的数是7,处于第位置的数是8,故Md=N
N 12
2
d X X
M =
2
++N
2N (+1)2
N
2N
(+1)
25.72
8
7=+2、中数附近有重复数时
①当重复数目位于数据中间,数据的个数为奇数时例:求数列11,11,11,11,13,13,13,17,17的中数。
③当重复数目位于数列中间,数据的个数为偶数时,计算方法与数据的个数为奇数时基本相同
例:求数列11,11,11,11,13,13,13,17,17,18的中数。
•解:
14
12
12.5
13.5
12.83
13.16
12.66
13
中数的优缺点
•1、优点:
•计算简单,容易理解,不受极端数值的影响•2、缺点:
•(1)中数的计算不是每个数据都加入,其大小不受制于全体数据。
•(2)反应不够灵敏,极端值的变化对中数不产生影响。
•(3)中数受抽样影响较大,不如平均数稳定。
•(4)计算时需要对数据先排列大小。
•(5)中数乘以总数与数据的总和不相等(除非:中数=平均数)。
•(6)中数不能作进一步代数运算。
•3、使用条件:
•(1)当一组观测结果中出现两个极端数目时。
•(2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。
•
(3)当需要快速估计一组数据的代表值时,也常用中数。
14
三、众数
•(一)求众数的基本方法–即出现次数最多的数据。
•(二)众数的应用
•需要快速而粗略的寻求一组数据的代表值时。
•当次数分布中有两极端数据时。
X 224342222Y
5
4
4
5
4
5
5
4
5
众数、中位数和平均数的关系
负偏分布均值中位数众数
对称分布均值= 中位数=众数
正偏分布
众数中位数均值
1.正态分布
2.偏态分布
M
Mo Md ==M
Md Mo 23-=16
第二节差异量数
•差异量数:指一组数据的离中趋势,其大小可用来表示平均数的代表性。
•类别:• 1.方差•2.标准差• 3.四分位差•4.百分位差• 5.平均差• 6.全距
最好的差异量数1718
•全距:
•公式:R=X max -X min
平均差:公式:
n
X X
D A i
∑-=
|
|..
19
方差(S 2)和标准差(S )
•方差的计算公式:
N
X X s
∑-=
2
2
)(练习:计算6、5、7、4、6、8这一组数据的方差和标
准差。
20
方差与标准差的意义
•方差与标准差是表示一组数据离散程度的最好的指标。
其值越大,表明这组数据的离散程度越大,即数据越参差不齐,分布范围越广;反之亦然。
•一般而言,原始分数越大,方差和标准差的值也越大。
•当对同一个特质使用同类的测量工具进行测量,而且样本水平比较接近时,直接比较标准差的大小,就可以知道样本之间离散程度的大小。
•例:比较上海三年级儿童智力和北京三年级儿童智力的标准差,如果前者大于后者,说明什么?
•优点:(1)反映灵敏。
(2)有严密的计算公式。
(3)适合代数运算。
•缺点:不易理解;易受两极断数值的影响;有个别数值不清楚时,无法计算。
21
标准差的应用
•(一)差异系数
•1、两个以上样本所测的特质不同。
•2、两个以上样本所测的特质相同,但样本间的水平相差较大。
•公式:
•例:已知某小学一年级学生的平均体重为25公斤,体重的标准差是3.7公斤,平均身高110厘米,标准差为6.2厘米,问体重与身高的离散程度哪个大?%
100⨯=
X s CV 22
(二)标准分数(standard score)
•定义:又称Z 分数。
指原始分数和其平均数的差除
以标准差所得的商。
•标准分数是以标准差为单位的表示一个分数在团体中所处的相对位置量数。
•公式:
•---Z 分数无实际单位。
•Z=0; Z<0或Z>0; Z=1的含义
s
X X Z -=
23考试科目
原始成绩全体考生
甲乙平均分标准差语文85897010政治7062655外语6872698数学5340506理化7287758
总和
348350
练习:下表是高校入学考试中两名考生的成绩分数。
试问应该优先录取哪名考生?
24
标准分数的应用
•1、比较几个性质不同的观测值在各自数据分布中相对位置的高低。
•---某人Z 身高=-0.5,Z 体重=1.2
•2、计算不同性质的观测值的总和或平均值,以表示在团体中的相对位置
•---各个学科的成绩不同质,不可简单相加或相减
25
•3、表示标准测验分数。
---转换公式:Z’=aZ+b
a 、
b 为常数;
Z=(X-X)/σ,σ为测验常模的标准差。
例:比率智商公式IQ=智龄/实龄×100%
离差智商公式(韦克斯勒成人智力量表)IQ=15Z+100
Z=(X-X)/S, 常数100为总平均数,15为标准差比奈-西蒙智力量表Z’=16Z+100
26
•4、合成各个小组的标准差,求得总标准差。
•例:由各班级的标准差求得全年级的标准差。
•计算公式:
为各小组的平均数。
为总平均数,,
i T i T 222
X X X X -=+=
∑∑∑i i
i
i i
i T
d N
d N S N S 27
•练习:
•在三个班级中进行某项能力研究,三个班测查结果的平均
数和标准差分别如下,求三个班的总标准差。
班级n x s 1
42
103
16
236110123
50
98
17。