第三章集中量数
集中量数
X
C
fX
C
用原始数据及根据次数分布表计算的平均数,在数 值上有少许差异,但并不影响以后的统计分析。
某次考试成绩数据已经处理为次数图,根据次数图,求该成绩的平均值? 分组区间 XC组中值 f频数 96~ 97 2 fXC 194 d 6 fd 12 AM=79
93~
90~ 87~ 84~ 81~ i=3
Mo
M M
M M
d o
1 3
例:求数据11、11、11、11、13、13、13、17、17、18的众数。
2.众数的意义与应用
意义:众数的概念简单明了,容易理解,但
不稳定,受分组影响,亦受样本变动影响; 反应不够灵敏;公式计算得出的众数只是一 个估计值;不能作进一步代数运算;因此, 众数不是一个优良的集中量数。
第三章 集中量数
第一节 算术平均数
算术平均数,简称平均数或均数、均值。一般用M 表示。 ㈠平均数计算方法 1.未分组数据计算平均数的方法 公式: X X
i
N
∑X表示原始分数的总和,N表示分数的个数。
⒉用估计平均数计算平均数 条件:数据数目及每个观测数据值都很大,应用 基本公式计算较麻烦。 公式:
X X1 25 -2 27 0 28 1 27 0 25 -2 29 2 30 3 34 7 32 5 33 6
X=27+(-2+0+1+0+-2+2+3+7+5+6)/10 =29
使用次数分布表计算平均数的方法
公式 N 其中,X为各分组区间的组中值,f为各组次数, 为数据的总次数(等于N) f fd X AM 简便计算可写作: ×i N AM为估计平均数,i为组距,d X i AM 称为组差数
统计心理-第三章 集中量数
例。
XT
ni X i ni
加权平均数
例1:某小学三年级举行英语测验。甲班32名学生的平均 分为72.6,乙班40名学生平均分为80.2,丙班36名学生的 平均分为75分。求全年级英语测验的总平均分数。
xwN1xN 11NN 2x22N N 33x3
加权平均数
例2:某课题组在8个省区进行一项调查,各省区的取样 人数和平均分数见下表,求该项调查的总平均数。
2
中数;若数据个数为偶数时,则 X N 2 X N 2 1 2为中 数。
①求数列4,6,7,8,12的中数。 ②有2,3,5,7,8,10,15,19共8个数,求其中数。
(二)中数的计算方法
(2)一组数据中有重复数值的情况
①当重复数值没有位于数列中间时 求数列5,5,6,10,12,15,17的中数。
集中趋势与离中趋势
集中趋势是指数据分布中大量数据向某方向集中 的程度。
集中趋势与离中趋势
集中趋势是指数据分布中大量数据向某方向集中 的程度。
离中趋势是指数据分布中数据彼此分散的程度。 集中量数与差异量数:描述一组数据集中趋势和
离中趋势的统计量,共同描述一组数据的全貌及 统计特征。 测度集中趋势即寻找数据水平的代表值或中心值 集中量数包括算术平均数、中数、众数、加权平 均数、几何平均数、调和平均数等。
Mo3Md2M
第三节 其他集中量数
一、加权平均数 所得数据单位权重不相等时要使用加权平均数。
k
M WW 1X W 1 1W W 2X 22 W W nnXni
1
W
k
i
W
X
i
i
i1
W为权数,指各变量在构成总体中的相对重要性。
心理统计学(一) 第三章 集中量数
[学习重点]
集中量数
1.各种集中量数的概念和性质 2.各种集中量数的计算方法 3.各种集中量数的具体应用
第三章
集中量数
集中趋势与离中趋势是次数分布的两个 基本特征。数据的集中趋势就是指数据分布 中大量数据向某方向集中的程度,离中趋势 是指数据分布中数据彼此分散的程度。用来 描述一组数据这两种特点的统计量分别称为 集中量数和差异量数。这两种量数一起共同 描述或反映一组数据的全貌及其各种统计特 征。
算术平均数的计算方法
(1)未分组数据(原始数据)计算法
X X1 X 2 X N X i N N
fX c N
(2)数据分组后(次数分布表)计算法
X
(式中 XC 为各区间的组中值,f 为各区间的次数)
算术平均数的优缺点
算术平均数具备一个良好的集中量数所应具备的一些条件: ① 反应灵敏; ② 严密确定; ③ 简明易懂; ④ 计算简单; ⑤ 适合代数运算; ⑥ 较少受抽样变动的影响。 除此之外,算术平均数还有以下一些特殊的优点: ① 只知一组观察值的总和及总频数就可以求出算术平均数; ② 用加权法可以求出几个平均数的总平均数; ③ 用样本数据推断总体集中量数时,算术平均数最接近总体集中量数的 真值,它是总体平均数的最好估计值; ④ 在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。 但是算术平均数也有一些缺点: ① 易受极端数据的影响; ② 若出现模糊不清的数据时,无法计算平均数。
算术平均数的概念
算术平均数是所有观察值的总和除以总频数所得之商。用
表示。 X
若以 X1,X2,· · · ,XN 表示变量 X 的各个观察值,N 表示 观察值的个数,则算术平均数可表示为:
X1 X 2 X N Xi X N N
第三章集中量数
第三章 集中量数第一节 算术平均数 一、概念及计算公式 (一)概念算术平均数 (mean),是所有观测值(或变量值)的总和除以总数所得的商。
简称平均数、均数或均值。
其符号系统既有表示样本平均数的数学符号X 和英文符号M (M ean ),又有表示总体参数的希腊字符μ。
(二)计算公式1、未分组数据计算平均数方法 公式一:例3—1:现有一组实验观测数据,25,27,28,27,25,29,30,34,32,33.计算它们的平均数。
解:根据题意,已知N=10,根据公式:X = = =29公式二:X =AM+= 2、使用次数分布表计算平均数方法 公式一: 公式二:X =AM+ ×i例3—2:100名学生的数学成绩分布如下,计算平均数。
表3-1 简化平均数计算表组别 c XfdC fXfd96~ 97 2 6 194 12 93~ 94 3 5 282 15 90~ 91 4 4 364 16 87~ 88 83 704 24 84~ 85 11 2 935 22 81~ 82 17 1 1394 17 78~ 79 19 0 1501 0 75~ 76 14 -1 1064 -14 72~ 73 10 —2 730 —20 69~ 707 -3 490 -21 66~673—4201-12∑∑=f fm X Nfd∑Nx ∑'1033...2725+++10290NX X i∑=29102027=+63~ 64 1 -5 64 —5 60~611 —6 61 -6 ∑—100—798428①将∑fm ,N 代入上面第一个公式计算: X = = =79.84②设AM=79,将AM ,∑fd ,N ,i 代入上面第二个公式计算:X =AM + ×i=79+ ×3=79.84这两个公式计算的结果完全相同,但第二个公式更简便.二、平均数的特点1、一组变量值的和等于变量的个数与其平均数的乘积,即∑=X N X2、一组变量值的离均差之和等于零,即()∑=-0X X3、在一组变量值中,每个变量值加上或减去、乘以或除以常数c ,所得的平均数等于原平均数减去或加上,除以或乘以常数c 。
第三章 集中量数
例:某门课程期中考试成绩与期末考试成绩的权数分 别为3和7。已知某个考生期中考了92分,期末考了85分。 若不考虑其他因素,问该生在这门课上的成绩是多少。
W1 X 1 W2 X 2 Wn X n 解: X w W1 W2 Wn 92 3 85 7 = 3 7 =87.10
众数的优缺点
众数虽然简明易懂,但是它并不具备一个良好的集中 量的基本条件。它主要在以下情况下使用:
当需要快速而粗略地找出一组数据的代表值时; 当一组数据出现不同质的情况时 当次数分布中有极端数据时 当粗略估计次数分布的形态时,有时利用平均数与众数之 差,表示次数分布是否偏态的指标。
第二节
中数与众数
一、中数的概念 中位数是位于以一定顺序(从小到大或 从大到小)排列的一组数据中央位置的数值, 在这一数值上、下各有一半频数分布着。用 Md表示。
二、中位数的计算方法
1.总频数为奇数
某项研究调查了 25 名大学教师的月经济收入, 结果如下(单位:元) : 2275, 3300,3326, 3358, 3363, 3394, 3402, 3455, 3467,3485, 3500, 3565, 3587, 3592, 3618, 3633,3646, 3674, 3720, 3734, 3756, 3775, 3820, 5695, 7100
1.原始数据计算法 上学期考试结束后某专业学生的分数: 97,93,71,86,88,78,91,86,90, 47,88,74,78,75,85,98,98,100, 75,85,93,91,81,91,93,96,88, 75,100,98,94,97,97,97,77,98, 95
X 1 X 2 X N X N
心理统计学第三章集中量数
04 集中量数的计算方法
简单平均数计算方法
总结词
简单平均数是集中量数中最基本的计算方法,它通过将一组数值相加后除以数值 的数量来得出平均值。
详细描述
简单平均数计算公式为 $overline{x} = frac{1}{n} sum_{i=1}^{n} x_i$,其中 $n$ 是数值的数量,$x_i$ 是每一个数值。这种方法适用于数据分布均匀且无异常值的 情况。
对未来研究的展望
01 02
探索新的集中量数
随着数据类型和复杂性的增加,传统的集中量数可能无法满足某些研究 需求。未来研究可以探索新的集中量数,以更准确地描述数据的集中趋 势。
改进现有集中量数的计算方法和性质
现有集中量数的计算方法和性质可能存在一些局限性和不足之处,未来 研究可以尝试改进这些方法和性质,以提高集中量数的准确性和可靠性。
06 总结与展望
总结心理统计学第三章集中量数的要点
集中量数
集中量数是描述数据集中趋势的统计量,用于反映一组 数据的中心位置或典型值。
常见集中量数
常见的集中量数包括算术平均数、中位数和众数等。
算术平均数
算术平均数是所有数值的和除以数值的个数,是最常用 的集中量数之一。它具有线性性和可加性,能够反映数 据的平均水平。
在社集中量数来描述被调查者的社会特征, 例如通过平均年龄和标准差等指标来分析被调查者的社会 经济地位和人口结构。
社会政策制定
政府和社会组织可以利用集中量数来制定社会政策,例如 通过分析不同地区居民的平均收入和收入分布来制定社会 保障政策。
社会问题研究
研究者可以利用集中量数来研究社会问题,例如通过平均 失业率和标准差等指标来分析社会经济不平等和就业状况。
第三章 集中量数
计算
未分组数据-次数最多的数据
次数分布表-次数最多一组的组中值
皮尔逊经验公式Mo=3Md-2X拔
平均数。中数、众数三者之间的关系
1.正态分布Md=Mo=X拔
2.偏态分布 Mo=3Md-2X拔
3.负偏态中 分数分布在高端X拔<Md<Mo
4.正偏态中 分数分布在低端X拔>Md>Mo
缺点:容易受极端数据影响;如果出现模糊不清的数据无法使用
中数与众数
中数
概念
中位数又称中点数,简称中数,用符号Md表示,是位于按一定顺序排列的一组数中央位置的数据
中数是一种位置量数
计算
无重复数据时中间那个数(奇数)或中间位置两个数的平均数(偶数)
有重复数据时
众数(Mode)
概念
是指一群数据中出现次数最多的那个数,用符号Mo表示
其他集中量数
加权平均数
W是权重
几何平均数
求银行利பைடு நூலகம்时
调和平均数
MH
主要用于描述速度方面的集中趋势
不同性质代表单位不同,ABD都带单位
第三章 集中量数
算数平均数
概念及计算公式
用X拔或M表示概念 算数平均数是所有观测值(或变量值)的总和除以总数所得的商
每个数据对总体的贡献是等权的
计算公式
定义公式 估算公式 (AM为估计平均数)
平均数的特点
一组变量值的和等于变量的个数与其平均数的成绩
一组变量值的离均差之和等于零(说明平均数是一组数据的重心)
在一组变量值中,每个变量值加上或减去、乘以或除以常数C,所得的平均数等于原平均数减去或加上,除以或乘以常数C(平均数反应灵敏)
平均数的意义
03第三章 集中量数
2、缺点:
①易受极值的影响。
“修剪平均数”
②若有数据不够确切,则无法计算该样本平均数。 “缺失值(missing values)的处理”
第一节 算术平均数
五、计算和应用平均数的原则
1、同质性原则:同质的数据才有计算平均数的意义。
2、平均数与标准差、个体数值相结合的原则:描 述数据分布特征不能仅依赖于平均数,还需考察标准差 以及个体数值等。
两者一起描述一组数据的全貌。最常用的即为平均 数和标准差。
第一节 算术平均数
P54
一般简称为平均数(average)或均值(mean)。符
号为M,区分总体/样本平均数。 适用资料:等距数据及以上/连续数据。
一、平均数的计算 [自习,包括“使用次数分布表计算
平均数的方法” P56]
二、平均数的特点
[例3-8计算不当]
三、调和/倒数平均数:适用于比率数据,用于 描述平均速率等方面的问题。
本章要点
集中趋势/量数 vs. 离中趋势/量数 平均数的计算、特点和优缺点 中数和众数的含义、简单计算和优缺点 平均数、中数和众数的关系
本章课后作业
P78
1、分别计算下列几组数据的平均数、中数、 众数,并说明哪种集中量数更能代表该组数据 的集中趋势。
①离均差总和为0。
第三章集中量数
Mo = 3Mdn− 2 X
M o = Lb +
fa ⋅i fb
9
1
集中量数的选择与应用
一、均数、中数、众数的关系 正态分布时 :
X = Mdn = Mo
数据分布为偏态分布时,
(X − Mdn) : (X − Mo) = 1 : 3
众数、中位数和均值的关系图
均值 中位数 众数 均值 = 中位数 = 众数 众数 中位数 均值
1 1 1 1 1 + + ⋅⋅⋅ + N X1 X 2 XN 1 N = = 1 1 1 ∑ ∑ N X X MH =
17
本章学习要求
这节课你学到了什么知识? ? 这节课你学到了什么知识 ☆ 本章学习要求: 本章学习要求:
理解各集中量数的意义与作用 算术平均数、 算术平均数、加权平均数的计算与应用 集中量数的选择
N 2
Mdn =
+X
N +1 2
6
解:1、排序 例3-6:五名 学生的物理成 绩分别55,64, 89,98,34请问 五名学生的平 均成绩是多 少?
2、 N=5,为奇数 为奇数 3、中数位置=
N +1 2
=3
4、中位数是 中位数是64
例3-7:六架直升飞机的最大速度分别为450km/h、 420km/h、 500km/h 、 530km/h 、600km/h 、1100km/h,请问平均速 度是多少?
X =
∑
Xi
N
3
例3-1:10名学生的心理与教育 统计成绩为68,77,63,79, 70,79,70,79,86,80。 试问这组数的平均数为多少? 试问这组数的平均数为多少?
第三章集中量数详解
(二)运算性质与特点 1. 性质 (1)数据组全部观测值与其平均数的离差之和必定为0
(2)每一个观测值都加上(或减去)一个相同的常数C后,则计 算变换后数据的平均数,等于原有数据的平均数加上(或减去) 这个常数C。估计平均数的公式就是根据此特性建立的。
(3)每一个观测值都乘以(或除以)一个相同的常数C后, 则计算变换后数据的平均数,等于原有数据的平均数乘以 (或除以)这个常数C。
(2)有重复数值的情况
➢ 当重复数值没有位于数列中间,与前面计算方 法一样。
➢ 当重复数值位于数列中间,先求出重复数据的 实际含义,然后再根据前面进行其运算。
2. 分组以后求中数(P64),其公式为: 3. 中数的优缺点与应用(P65)
二、众数 (一)众数的内涵和特点
内涵:众数(Mode)是指在一组量数中,出现 频率最多的量数,用符号Mo
按下列公式来计算平均数:
(三)用估计平均数计算算术平均数的方法
先设定一个估计平均数,用符号AM表示。根据性质2, 先给各个数据减去一个常数,再求其平均值,最后再将所 得结果加上该常数,便可得到所要求的平均数。
AM越接近平均数 ,
就越小,计算越简便。
对于等组距的,参见书p57。
三、算术平均数的优缺点:P60 四、计算和应用算术平均数的原则:p61
第一节 算术平均数 第二节 中数与众数 第三节 其它集中量数
一、算术平均数的内涵及其性质
(一)内涵:一组同质数据值的总和除以数据总个数所得的
商称为算术平均数。用符号 数, 表示总体平均数。
(读作X杠)表示样本平均
它是统计学中最易理解最常应用的一种集中量指标。常
用M(Mean)表示。
设变量
代表各次观测值,N为观测的次数:
统计学 第3章集中量数
MW
W1 X1 W2 X 2 W1 W2
72 4 86 6 46
80.4
3、计算方法
3)加权算数平均数(weighted mean)的计算:
用M W 表示
如高考的标准分换算法。 研究生入学考试总分不一样。 P69例3-7
3、计算方法
4)使用次数分布表计算平均数:
与无重复数据时求中数的方法相同; 当中间的数值为重复数时:可将重复数看
作一个连续区间,然后根据中间数在区间 内的位置来确定中位数。
3、计算方法
2)一组数据中有重复数据 当重复数值没有位于数列中间时,求中数
与无重复数据时求中数的方法相同; 当中间的数值为重复数时:可将重复数看
作一个连续区间,然后根据中间数在区间 内的位置来确定中位数。
例如:P70 例3-8
2、几何平均数的应用
2)应用几何平均数的变式计算: 一组数据彼此间变异较大,几乎按一定的比 例关系变化,所要求的不是平均数,而是平 均增长率。平均增长率=平均发展速度-1
学习方面的进步率 学生或人口增加率 教育经费增加率
本章主要内容
一.算术平均数 二.中数 三.众数 四.平均数、中数、众数三者之间的关系 五.加权平均数 六.几何平均数 七.调和平均数
平均数
中数
众数
① 感应灵敏② 严密确 ③④
定③ 意义简明,易理
于
优 点
解④ 容易计算⑤ 适合
代数法的处理⑥ 少受
抽
③④
样变动的影响
1.加权平均数 2.离差、相关计算 应 3、统计推断 用
1.有极端数值时 2.模糊数据时 3.快速估计集中
量数时
1.有极端数值时 2、数据不同质时 3、粗略估计数据的
第三章 集中量数
( xi x )
2
( xi c)
2
3、所有的观测值都加上常数C,则平均值也增加常数C
1 N
(x
i
c) x c
4、所有观测值都乘以不等于0的常数C,则平均值也增大C倍
1 N
(c x
i
) cx y) x y
5
1 N
(x
平均数的优缺点 优点:1.反映灵敏 2.计算严密 3.计算简单 4.简明易解 5.适合于进一步用代数方法演算 6.较少受抽样变动的影响 缺点:1.易受极端数据的影响 2.若出现模糊不清的数据时 ,无法计 算平均数
解:这里的数据为顺 序数据。变量为“回 答类别”
甲城市中对住房 表示不满意的户数最 多,为 108 户,因此 众数为“不满意”这 一类别,即 Mo=不满意
合计
300
100.0
众数的意义与应用 ( 1 )当需要快速而粗略地寻求一组数据的 代表值时 ( 2 )当一组数据出现不同质的情况时,可 用众数表示典型情况 ( 3 )当次数分布中有两极端的数目,除了 一般用中数外,有时也用众数 ( 4 )当粗略估计次数分布的形态时,有时 用平均数与众数之差,作为表示次数分布是否 偏态的指标
x 1 N
x 79.8
(2)分组数据的计算方法
(组中值计算法)
分组区间
9590858075706560555045-
次数(f)
6 5 7 7 7 8 3 2 0 2 1
组中值(Xc)
97 92 87 82 77 72 67 62 57 52 47
N=48
方法:把组中值看成每一分组的平均数
顺序数据的中位数
第三章集中量数和差异量数
第二节 差异量数
一、 标准差 二 、 四分差 三 差异系数
一、 标准差
(一)、标准差的概念及适用条件 概念: 标准差是一组数据中每个数据与其算术 平均数之差的平方的算术平均数的算术平 方根。用符号σ 表示。
X
i
X
2
(3.1)
n
X 其中Xi为原始数据;N为数据个数; 的算术平均数。
计算公式为:
M dn Lb
n Fb M dn Lb 2 i n Fb f 2
i
式中:Lb 表示中位数所在组的精 确下限;Fb为中位数所在组以下的 累积次数;
f 式中:Lb 表示中位数所在组的精 确下限;Fb为中位数所
n为总次数;i 为组距;f 为中位数所在组的次数 。 n为总次数;i 为组距;f 为中位数所在组的次数 。
求出年平均增长率。
平均增长率=1.09-1=0.09 故所求的年平均增长率为9%。
2、只用首末项求几何平均数 设a0,a1,…,aN是N个年度中各年度某种数量值,
其中a0是初期量, aN是末期量。X1,X2,…,XN为
各年度发展速度,即
aN a1 a2 X 1 , X 2 ,..., X N a0 a1 aN 1
例如, 某班选八名同学参加年级数学竞赛,成绩分别为82,
90,95,88,90,94,80,93。求其平均成绩。 解:把N=8,X1=82,…,X8=93代入公式(3.1), 得
X 82 90 95 88 90 94 80 93 89 X
N 8
2、频数分布表计算法:对于已列成次数分布 表的分组数据,其算术平均数的计算公式为
表3-3 144名学生语文成绩表
第三章_ 语言统计学 集中量数
2014-7-23 18
(2)当重复数目位于数列中间,数据的个数为奇数的情形。 例:求数列11、11、11、11、13、13、13、17、17的中数。 解:首先假设位于中间的几个重复数目为连续数目,取序列中
上下各N/2那一点上的数值为中数。此数列个数为奇数,因此中 数所在的位置为(9+1)/2=5;在数列中第5个数为13,此为一个 重复数目,可以将其视做连续数,理解为三个13占据了一个分数 单位的全距,即12.5—13.5,它们均匀地分布在12.5~13.5 这个区间内: 每一个13占三分之一距离,在图中就用三个方块表示。第一个 13落在12.5~12.83这个区间内,第二个13落在12.83~ 13.16这个区间内,第三个13落在13.16—13.49这个区间内。 这样,三个13就落在不同的区间内。因为,中数是一个点值,因 此,需要计算出第一个13所在区间的组中值,这一点就是整个序 列中位居最中间的那一点,就是这组数据的中数。第一个区 间 的中值为 12.499+0.33/2=12.66。因此,该组数据的中数是 19 2014-7-23 12.66。
2.一组数据中有重复数值的情况 指一组数据中有相同数值的数据,这时计算中
数的方法基本与无重复数值的单列数据相同。但 根据重复数值数据在该组数据中所处的位置又细 分为几种情况。当位于中间的那几个数是重复数 值时,求中数的方法就比较复杂了。 (1)当重复数值没有位于数列中间时,求中数 的方法与无重复数据时求中数的方法相同。
第三节 其他集中量数
一、加权平均数 有些测量中所得数据,其单位权重
(weight)并不相等。这时若要计算平均数, 就不能用算术平均数,而应该使用加权 平均数(weighted mean)。计算公式如下:
第三章集中量数ppt课件
ana01xn
例5.某高校1980年—1985年在校生人数如表3— 4。求年平均增长率。
解:
①先求逐年发展速度 。用每一年与其上一年量值的
环比求出逐年的发展速度列入表3—4的第3列。 ②计算平均发展速度 。将表中第3列数据代入公式
〔3.6〕得: MG n X1X2X3Xn
51.120.901.051.161.22
第三节、几何平均数
一、概念
N个数值的连乘积的 N次方根,称为几何平均 数,用符号 M G 表示。几何平均数也是平均数的 一种,如果一组数据值按比例递增或递减,表示 其平均水平时应使用几何平均数。几何平均数一 般用于计算平均发展速度、平均增长速率等统计 指标。
二、计算公式
几何平均数的计算公式为:
M GnX1X2X3 Xn (3.6)
第三章 集中量数
第一节 算术平均数 一、概念
二、计算方法 三、加权算术平均数 四、算术平均数的性质
第二节 中位数 中位数的计算方法 第三节 几何平均数
描述一组数据集中趋势的量数,称为集中量 数。
集中量数是统计总体各统计事项某一数量标 志的代表值,它概括说明总体某一数量标志的 综合特征,反映研究对象在一定时间、地点、 条件下的一般水平。
解:
(1〕求平均发展速度 , 由公式〔3.7)。
MG n
an a0
4 1251.2223 56
(2〕计算平均增长率 , 由公式〔3.8〕得
x' M G 1 1 .22 2 1 3 0 .2223
即年平均增长率为22.23%。
(3〕计算2019年该小学的教学设备数 。知
求 n 6,
a6 ?
由公式〔3.9〕得
=8。
再如,一组数值为N4、158、71、98、41.50、12、
第三章集中量数
五、优缺点
(一)优点 1、反应灵敏,观测数据中任何一个数值或大或小的变化, 在计算平均数时都能反映出来。 2、计算严密,有确定的公式,只要是同一组观测数据, 计算的平均数都相同 3、计算简单,应用简单的四则运算 4、简单明了,容易理解 5、适合于进一步用代数方法演算。在求解其他统计特征 值,如离均差、方差、标准差的计算时,都要应用平均 数 6、较少受抽样变动的影响(观测样本的大小或个体的变 化,对计算平均数影响很小)
例子:评委打分
常用的计算最后得分的方式:去掉一个最高分,再去 掉一个最低分,然后计算剩余9个评分的算术平均数。 在中央电视台举办的一次全国业余通俗歌手大赛中, 假定11位裁判对某位歌手的评分按顺序排列为:9.9, 9.3,9.3,9.3,9.2,8.9,8.8,8.8,8.5,8.4, 7.4
2、若出现模糊不清的数据时,无法计算平均数,这 时一般采用中数作为该组数据的代表值 3、数据不同质时也不宜使用算数平均数 (数据同质:使用同一个观测手段,采用同样的观 测标准,能反映某一问题的同一方面特质的数据)
四、众数的应用
(一)当需要快速而粗略地寻求一组数据的代表值时 (二)当一组数据出现不同质的情况时
(三)当数据中有两极端的数目时,除了用中数外,也可 用众数 (四)当粗略估计次数分布的形态时,有时用平均数与众 数之差,作为表示次数分布是否偏态的指标 (五)当一组数据中同时有两个数值的次数都比较多时, 也多用众数来表示数据分布形态
老刘(厂长)工资:36000 弟弟(副厂长)工资:15000 6个亲戚(管理人员)工资:3750 5个领工:3000 10个工人:1500
X 4500
Coun t
15
10
Md 3000
5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、算术平均数的性质
一组变量值的和等于变量的个数与其平均数的乘积, 一组变量值的和等于变量的个数与其平均数的乘积, 即 ∑ X = NX 一组变量值的离均差之和等于零, 一组变量值的离均差之和等于零,即
∑ (X − X ) = 0
在一组变量值中,每个变量值加上或减去 、乘以或 在一组变量值中,每个变量值加上或减去、 除以常数 , 所得的平均数等于原平均数减去或 加上,除以或乘以常数 加上, 。
i N Mdn = La − − Fa f 2
5 57 = 74.5 − − 24 = 74.5 − 1.5 = 73 15 2
分组次数表与重复次数中位数的联系
1N Mdn = Lb + − Fb f 2
三、百分位数与四分位数
(一)百分位数:在任一百分位上的数值。
例3-6:五名学生的物理成绩分别55,64,89,98, 34请问五名学生的平均成绩是多少?
解:1、排序:34、55、64、89、98 2、 N=5,为奇数 为奇数 N +1 3、 中数位置= 2 =3 4、排在第 个位置上的数是 ,所以中位数 排在第3个位置上的数是 排在第 个位置上的数是64, 是64 答:五名同学的的物理平均成绩是64分。 五名同学的的物理平均成绩是 分
Fl →u
Fu→l
Fa = 24
57 54 46 33 18 9 3 1 —
3 11 24 39 48 54 56 57 —
④代入公式计算中数
i N Mdn = Lb + − Fb f 2 5 57 = 69.5 + − 18 = 69.5 + 3.5 = 73 15 2
例3-7:六架直升飞机的最大速度分别为 六架直升飞机的最大速度分别为450km/h、 六架直升飞机的最大速度分别为 、 420km/h、500km/h 、 530km/h 、600km/h 、 、 1100km/h,请问平均速度是多少 ,请问平均速度是多少? 1、排序:420、450、500、530、600、1100 N 2、N=6,为偶数 中数位置= 2
解:1、排序:2,3,4,4,6,9,9,9,10,14,17 、排序: , , , , , , , , , , 2、N=11,中位数的位置在第六个位置 、 , 3、但第六个位置的数为9,但9有三个 、但第六个位置的数为 , 有三个
第一个9 第一个
8.50
第二个9 第二个
9.166
第三个9 第三个
9.499
分析过程 求累积次数。 ① 求累积次数。
mN ② 确定百分数位置 。 100 确定公式中各符号的内容。 ③ 确定公式中各符号的内容。
8585-89 8080-84 75-79 757070-74 6565-69 6060-64 5555-59 50-54 50-
∑
3 8 13 15 9 6 2 1 57
8.833
4、中位数是在第一个9的中点, 、中位数是在第一个 的中点 的中点, 即(8.50+8.833) ÷2=8.666
课堂练习
随机抽取某市10个停车场的面积,测得其停车位分别为 、 随机抽取某市 个停车场的面积,测得其停车位分别为15、 个停车场的面积 18、14、25、33、33、33、90、100、100个。请问该市停 、 、 、 、 、 、 、 、 个 车场的停车面积分别为? 车场的停车面积分别为? 解:1、排序:14,15,18,25,33,33,33,90,100,100 、排序: , , , , , , , , , 2、中位数的位置在第5个与第 个之间,即33,有3个 、中位数的位置在第 个与第 个之间, 个与第6个之间 , 个
c
c
思考题二
某企业有一名总经理,两名经理,八名员工,总经理的工 资是12000元,经理的工资为4000元,员工的工资为1000元 。试问这个企业的平均工资为多少?
解:12000+4000×2+1000×10=30000(元) 30000÷(1+2+10)=2307.69(元/人) 答:该企业的平均工资为2307.69元
二、算术平均数的计算方法
(一)定义式
(二)加权式
∑X X=
N
i
∑ fX X= ∑f
i
Xi =观测值
f
=相应次数
加权式的变式
1)求总平均数
Xt
∑nX = ∑n
3)次数分布表-组中值
i
∑ fm X = ∑f
4)次数分布表-简捷式
n =群组人数
Xi =群组平均数
2)归一化均数
X = ∑Wi X i
∑f i X = A+ ∑f
57 54 46 33 18 9 3 1 —
3 11 24 39 48 54 56 57 —
30%时: 时
Lb = 64.5
Lb = 79.5
85%时: 时
f =9
Fb = 9
f =8 Fb = 46
30%时: Lb = 64.5
f =9 i=5
Fb= 64.5 + − 9 = 64.5 + 4.5 = 69 9 100
3 2 1 0 -1 -3 -4 — 9 16 13 0 -9 -6 -4 7
fd ∑ fd
∑ fd ∑f
13 77 15 72 9 6 2 1 67 62 57 52
5、代入公式
X = A+
65-69 60-64 55-59 50-54
-2 -12
7 = 72 + × 5 = 72.61 57
∑
57 —
∑
f
3 8 13 15 9 6 2 1 57
组中值法
1、计算组中值 m 2、计算fm 值 3 、计算 ∑ fm值
表3-2组中值法平均数计算表
X =
∑ fm ∑ f
4139 = = 72.61 57
f 组别 85-89 3 80-84 8 75-79 13 70-74 15 65-69 9 60-64 6 55-59 2 50-54 1 57 ∑
第一个 33 第二个 33 第三个 33
32.50 32.833 33.166 33.499
3、中位数为32.833 、中位数为 -
二、次数分布表
i N Mdn = Lb + − Fb f 2
i N Mdn = La − − Fa f 2
中数计算表
① 求累积次数,由下往上 求累积次数, 累加或由上往下累加。 累加或由上往下累加。 N ② 中数位置: 中数位置: 2
(m − A)
∑ fd × i ×i = A+ ∑f
m− A 为简化值 d= i
A =假设平均数
i =组距
例3-1:10名学生的心理与教育统计成绩为68, 77,63,79,70,79,70,79,86,80。试 问这组数的平均数为多少?
加权式
例3-2 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组: 考试成绩( 20 100 甲组: 考试成绩(X ): 0 人数分布(f): 人数分布( ):1 1 8 ): 乙组: 考试成绩( 乙组: 考试成绩(X ): 0 人数分布( ):8 人数分布(F ): 20 1 100 1
i Pm = Lb + f mN − Fb 100
求例3-9次数分布表中30%和85%位置上的数, 3-9 30% 85% 计算步骤: mN ①确定百分位置 及百分位数所在的组。 及百分位数所在的组。 100 ② 确定有关数值
例3-9
表 3-4 中数计算表 Fl →u Fu →l f 组别
3 、中位数的数值:排在第 、4位上的数分别为 中位数的数值:排在第3、 位上的数分别为 位上的数分别为500与530 与 1 Mdn = X N + X N =(500+530) ÷2=515 +1 2 2 2
2、中数附近有重复数时:需考虑重复数的影响 例3-8:2,17 ,3,4,6,9,4,9,10,14, 9
85%时:Lb = 79.5
f =8
i=5
Fb = 46
5 85 × 57 P85 = 79.5 + − 46 = 79.5 + 1.5 = 81 8 100
第四节 众数
•定义:一组数据中出现次数最多的数值,用 定义:一组数据中出现次数最多的数值, 定义 表示。 符号 Mo 表示。 •众数的确定方法 众数的确定方法
第二节 算术平均数
一 、 定义: 所有观测值( 或变量值) 的总和, 除以观 定义 : 所有观测值 ( 或变量值 ) 的总和 , 测值个数的商。简称平均数、均数或均值。 测值个数的商。简称平均数、均数或均值。 英文符号M Mean) 样本统计量符号为 X,英文符号M(Mean) 表示总体参数的希腊字符 µ 。
57 = 28.5 2
③找28.5所在组77-74组 ④ 确定公式中各符号的内容
Lb = 69.5 La = 74.5
f = 15
i = 5
Fb = 18
表 3-3 f 组别 85-89 3 80-84 8 75-79 13 70-74 15 65-69 9 60-64 6 55-59 2 50-54 1 ∑ 57
第三章 集中趋势的度量
第一节 第二节 第三节 第四节 第五节 数据的分布特征 算术平均数 中位数 众数 集中量数的选择与应用
数据分布的特征
集中趋势 (位置) 位置) 离中趋势 (分散程度) 分散程度) 偏态和峰度 (形状) 形状)
数据的特征和测量
数据的特征和测量
集中趋势
众 数 中位数 均 值