统计量数之集中量数
教育统计学03讲 集中量数
第三节 调和平均数
一、调和平均数的意义
⒈定义:又称倒数平均数。
MH N 1 i 1 X i
N
⒉在教育领域应用:主要应用于描述学习速度
二、调和平均数的计算举例
例1 有一种蔬菜,早晨的价格每千克0.5元,中午 0.2元,晚上0.1元。如果早、中、晚各买1元钱的 蔬菜,则当天所买的蔬菜平均价格是多少?
极端数据的影响
不大
最严重
较大
最少
最大
较少
平均价格 商品销售额 111 0.18元 1 1 1 商品销售量 0.5 0.2 0.1
以公式表示
MH
1 1 1 1 1 ( ) n x1 x2 xn
n 1 1 1 x1 x2 xn
n 1 x
例2 计算和比较两组学生演算速度
组别
第 一 组
M o 3Md 2M 现以表3 3为例 : Md 52.19 M 52.40 则 : M o 3 52.19 2 52.40 51.77
皮尔逊经验法只有当次数分布呈现正态或接近 正态时,才能使用。
(二)众数的求法
金氏插补法求众数
fa M o Lb i fa fb
第二节 几何平均数 MG
一、几何平均数的定义
1.
定义:
M G N X1 X 2 X N
几何平均数是计算平均比率或平均速度最适用的一种方 法。 凡是变量值的连乘积等于总比率或总速度的场合都适宜 用几何平均法计算平均比率或平均速度。
例1
希望机械厂生产的机床要经过四个连续作业车间 才能完成。2003年一季度第一车间铸造产品的合 格率为95%,第二车间粗加工产品的合格率为93% ,第三车间精加工产品的合格率为90%,第四车间 组装的合格率为86%,则该企业的产品合格率为多 少?
3集中量数
(五)调和平均数 1. 概念 调和平均数是一组数据倒数的算术平均数的倒数, 也称为倒数平均数。用 表示。 2. 在教育上的应用 调和平均数在教育方面主要用来求学习速度 学习速度(如: 学习速度 阅读速度、解题速度、识字速度等) 页书, 例:一名学生阅读2页书,读前一页时的速度折合为 一名学生阅读 页书 每小时20页 读后一页时的速度折合为每小时40页 每小时 页,读后一页时的速度折合为每小时 页, 问该生平均每小时的阅读速度为多少? 问该生平均每小时的阅读速度为多少?
5. 离差平方和最小。 离差平方和最小。
算术平均数的优缺点
1. 优点 :
–反应灵敏 反应灵敏 –计算简单、严密 计算简单、 计算简单 –概念明了,简洁 概念明了, 概念明了 –适合于进一步的代数运算 适合于进一步的代数运算 –较少受抽样变动的影响 较少受抽样变动的影响
缺点: 2. 缺点:
–易受极端数据的影响(修剪平均 易受极端数据的影响( 易受极端数据的影响 数) –出现模糊数据时,无法计算平均 出现模糊数据时, 出现模糊数据时 常用中位数) 数(常用中位数)
计算和应用平均数的原则
1. 同质性原则
各科考试难易程度不同时,计 算总平均分;研究某团体中人们 的个人收入,常因有极值的情况 而掩盖真实情况。
2. 平均数与标准差、方差相结 合的原则
Hale Waihona Puke (二)中位数1、概念 一组按大小顺序排列的数据中,居中间位置对应 的数据值即为中位数,用符号 表示。 2、中位数的计算方法 (1)对原始数据计算中位数 步骤:数据排序 计算中位数位深
(2)对频数分布表计算中位数
关键: 关键:
表示中位数所在组的精确下限 表示小于中位数所在组下限的频数总和 表示中位数所在组的精确上限 表示大于中位数所在组上限的频数总和 表示中位数所在组的频数
3集中量数
甲的成绩为
乙的成绩为
显然甲的成绩比乙高,所以从成绩看,应该录取甲。 显然甲的成绩比乙高,所以从成绩看,应该录取甲。
如果这家公司想招一名笔译能力较强的翻译,听、 说、读、写成绩按照2:2:3:3的比确定,计算两名应 试者的平均成绩(百分制).从他们的成绩看,应该 录取谁?
某年级五个班的语文考试成绩如下,求 该年级语文平均成绩。
3. 几何平均数在教育中的应用 如果已知初期量和末期量可以用公式 求平均发展速度。 求平均发展速度。 而平均增长率 则
。
年教职工人数如下表, 例:我国普通中学1994—1995年教职工人数如下表, 我国普通中学 年教职工人数如下表 求年平均增长率。 求年平均增长率。
我国普通中学教职工人数统计表 年份 1994 1995 1996 1997 1998 1999 教职工人数(万人) 教职工人数(万人) 逐年发展速度 419.07 429.48 442.44 454.09 462.13 475.36 —— 1.025 1.030 1.026 1.018 1.029
(三)众数
1、概念 理论众数:频数分布曲线最高点相对应的横坐标上的一点。 粗略众数:一组数据中频数出现的最多的那个数。 众数用M0表示。 2、众数的计算方法 (1)用观察法直接寻找粗略众数 例:2、4、3、6、4、5、4 (2)用公式求理论众数的近似值 A 皮尔逊的经验法(频数分布呈正态或接近正态时)
04 集中量数
X = Md = M O
X > Md > M O
X < Md < M O
当频数分布呈正态时, 当频数分布呈正态时,
Mo X
Md
当频数分布为正偏态和负偏态时, 当频数分布为正偏态和负偏态时,
Mo Md X
X Md Mo
正偏态
负偏态
四、其它集中量
♦
除了算术平均数、 除了算术平均数、中位数
和众数以外,在应用中还有一 和众数以外, 些其它集中量。 些其它集中量。这些统计指标 可以从其它角度描述一组数据 的集中趋势。 的集中趋势。
合计 F*Xc 计 算
195 185 262.5 262.5 620 797.5 607.5 312.5 230 105 17.5 3595.0
1 X = ΣfX C n
3595.0 = 52
= 69.13
52
2、算术平均数的意义
♦ ♦
算术平均数是应用最普遍的一种集中量。 算术平均数是应用最普遍的一种集中量。 真值是反映某种现象的真实水平的分数。 真值是反映某种现象的真实水平的分数。
一组数据中有模糊不清的数值时无法计算。 一组数据中有模糊不清的数值时无法计算。
4、计算和应用算术平均数的原则
同质性原则: 同质性原则:算术平均数只能用于表示 同类数据的集中趋势。 同类数据的集中趋势。
♦ ♦
平均数与个体数值相结合的原则: 平均数与个体数值相结合的原则:在解 释个体特征时,既要看平均数, 释个体特征时,既要看平均数,也要结合个 体的数据。 体的数据。 平均数与标准差、方差相结合原则: 平均数与标准差、方差相结合原则:描 述一组数据时既要分析其集中趋势, 述一组数据时既要分析其集中趋势,也要分 析离散程度。 析离散程度。
2.特征量---集中量数与差异量数
1、全距
• 全距 是一组数据中最大值与最小值的 差数,也叫两极差。
• 计算公式
R=Max(X)-Min(X)
式中R为全距, Max(X)、Min(X)分别 为数据中的最大值和最小值。
2、四分位差(对原始数据)
• 四分位数将一组数据按大小顺序排列后,分成次数相 等的四部分,位于个分界点的数据称为四分位数。 • 四分位差是第三四分位数与第一四分位数之差的一半。 Q3 Q1 • 计算公式 QD 2 例1 20名学生英语测试成绩为 52、79、73、60、45、44、89、87、65、81、68、 79、67、80、65、64、72、66、48、83. 求:测验成绩的四分差.
标准分数计算举例
• 例4、 已知A、B两个年级英语考试成绩如下 表。甲生是A年级的学生,成绩70分。乙生是 B年级的学生,成绩也是70分。求甲、乙两人 成绩的标准分数。 •
• 表3-12 A、B两年级英语考试成绩统计表 年 级 平均分 标准差 最高分 最 低 分
A B
80 60
14 12
100 70
几何平均数应用举例
• 例7、 我国普通中学1994-1999年教职工人 数如表3-5,求年平均增长率. • 表3-5 我国普通中学教职工人数统计表
•
年 份 1994 1995 1996 1997 1998 1999
教职工人数(万人) 逐年发展速度
419.07 429.48 442.44 454.09 462.13 475.36
语文 数学 英语 综合 合计
123 130 115 128
12 14 16 10
甲 125 145 120 130 520
乙 108 140 145 127 520
第三章 集中量数
例:某门课程期中考试成绩与期末考试成绩的权数分 别为3和7。已知某个考生期中考了92分,期末考了85分。 若不考虑其他因素,问该生在这门课上的成绩是多少。
W1 X 1 W2 X 2 Wn X n 解: X w W1 W2 Wn 92 3 85 7 = 3 7 =87.10
众数的优缺点
众数虽然简明易懂,但是它并不具备一个良好的集中 量的基本条件。它主要在以下情况下使用:
当需要快速而粗略地找出一组数据的代表值时; 当一组数据出现不同质的情况时 当次数分布中有极端数据时 当粗略估计次数分布的形态时,有时利用平均数与众数之 差,表示次数分布是否偏态的指标。
第二节
中数与众数
一、中数的概念 中位数是位于以一定顺序(从小到大或 从大到小)排列的一组数据中央位置的数值, 在这一数值上、下各有一半频数分布着。用 Md表示。
二、中位数的计算方法
1.总频数为奇数
某项研究调查了 25 名大学教师的月经济收入, 结果如下(单位:元) : 2275, 3300,3326, 3358, 3363, 3394, 3402, 3455, 3467,3485, 3500, 3565, 3587, 3592, 3618, 3633,3646, 3674, 3720, 3734, 3756, 3775, 3820, 5695, 7100
1.原始数据计算法 上学期考试结束后某专业学生的分数: 97,93,71,86,88,78,91,86,90, 47,88,74,78,75,85,98,98,100, 75,85,93,91,81,91,93,96,88, 75,100,98,94,97,97,97,77,98, 95
X 1 X 2 X N X N
教育与心理统计学 第二章 常用统计参数考研笔记-精品
第二章常用统计参数第二章常用统计参数用参数来描述一组变量的分布特征,便于我们对数据分布状况进行更好的代表性的描述,也有利于我们更好地了解数据的特点。
常见的统计参数包括三类:集中量数、差异量数、地位量数(相对量数X相关量数。
描述统计的指标通常有五类。
第一类集中量数:用于表示数据的集中趋势,是评定一组数据是否有代表性的综合指标,比如平均数、中数、众数等。
概述[不背]第二类差异量数:用于表示数据的离散趋势,是说明一组数据分散程度的指标,比如方差、标准差、差异系数等。
第三类地位量数:是反映个体观测数据在团体中所处位置的量数,比如百分位数、百分等级和标准分数等。
第四类相关量数:用于表示数据间的相互关系,是说明数据间关联程度的指标,比如积差相关、肯德尔和谐系数、①相关等。
第五类:是反映数据的分布形状,比如偏态量和峰度等(不作介绍I第一节集中量数(一)集中量数的定义(种类、作用)[湖南12名]描述数据集中趋势的统计量数称为集中量数。
集中量数能反映大量数据向某一点集中的情况。
常用的集中量数包括算术平均数、加权平均数、几何平均数、中数、众数等等,它们的作用都是用于度量次数分布的集中趋势。
(二)算术平均数(平均数、均数)(一级)简述算术平均数的定义和优缺点。
(1)平均数的含义算术平均数可简称为平均数或均数,符号可记为M。
算术平均数即数据总和除以数据个数,即所有观察值的总和与总频数之比。
只有在为了与其他几种集中.数洞区别时,如几何平均数、调和平均数、加权平均数,才全称为算术平均数。
如果平均数是由变量计算的,就用相应的变量表示,如又匕算术平均数是用以度量连续变量次数分布集中趋势及位置的最常用的集中量数,在一组数据中如果没有极端值, 平均数就是集中趋势中最有代表性的数字指标,是真值的最佳估计值。
(2)平均数的优缺点简述算术平均数的使用特点[含优缺点]算术平均数优点①反应灵敏。
观测数据中任1可一个数值或大或小的变化,甚至细微的变化,在计算平均数时,都能反映出来。
心理统计学第三章集中量数
04 集中量数的计算方法
简单平均数计算方法
总结词
简单平均数是集中量数中最基本的计算方法,它通过将一组数值相加后除以数值 的数量来得出平均值。
详细描述
简单平均数计算公式为 $overline{x} = frac{1}{n} sum_{i=1}^{n} x_i$,其中 $n$ 是数值的数量,$x_i$ 是每一个数值。这种方法适用于数据分布均匀且无异常值的 情况。
对未来研究的展望
01 02
探索新的集中量数
随着数据类型和复杂性的增加,传统的集中量数可能无法满足某些研究 需求。未来研究可以探索新的集中量数,以更准确地描述数据的集中趋 势。
改进现有集中量数的计算方法和性质
现有集中量数的计算方法和性质可能存在一些局限性和不足之处,未来 研究可以尝试改进这些方法和性质,以提高集中量数的准确性和可靠性。
06 总结与展望
总结心理统计学第三章集中量数的要点
集中量数
集中量数是描述数据集中趋势的统计量,用于反映一组 数据的中心位置或典型值。
常见集中量数
常见的集中量数包括算术平均数、中位数和众数等。
算术平均数
算术平均数是所有数值的和除以数值的个数,是最常用 的集中量数之一。它具有线性性和可加性,能够反映数 据的平均水平。
在社集中量数来描述被调查者的社会特征, 例如通过平均年龄和标准差等指标来分析被调查者的社会 经济地位和人口结构。
社会政策制定
政府和社会组织可以利用集中量数来制定社会政策,例如 通过分析不同地区居民的平均收入和收入分布来制定社会 保障政策。
社会问题研究
研究者可以利用集中量数来研究社会问题,例如通过平均 失业率和标准差等指标来分析社会经济不平等和就业状况。
心理统计学第三章 集中量数
有重复数时,需考虑重复数的影响。
例:求11,11,11,11,13,13,13,17, 17的中 数。
分析:N=9,中间位置为5,第5个数为13。
但是数据中有3个13,需要重新考虑。
有3个13,意味着3个13占了一个单位。
第五位的13 ,中数计算(12.5+12.83) /2=12.665
或者12.5+1/3*1/2=12.666
例题3-4 计算加权平均数
省区代码 1 2 3 4 5 6 7 8
人数 平均分数
627
98
268
60
400
82
670
96
411
80
314
65
610
96
500
88
3800
665
解:
62798 268 60 50088
MW
3800
330496 86.97 3800
例题3-5 课堂练习
大。
练习
P79 5-6(10分钟)
第二节 中数与众数
一、中数 中位数又称中点数,中位数,中值,简称中数,用符
号Md 或Mdn表示,是位于按一定顺序排列的一组数 中央位置的数值。 中数是一种位置量数。 能将数据分成较大的一半和较小的一半。
(一)未分组数据的中数计算
1.中数附近无重复数时 若数据个数(N)为奇数时,中数则为(N+1)/2
2.众数的计算 (1)直接观察法 未分组数据——次数最多的数值 次数分布表——次数最多一组的组中值
例题3-3 计算众数
组别 81~ 78~ 75~ 72~ 69~ 66~ 63~ 60~
f
向上累加次数
17
教育统计学第三章 集 中 量
(5) 设有一批数据 x1 , x2 , L , xn ;令
y i = kxi + c
(i = 1, 2 , L, n ; k c
知有50个数,只知其和为316,而不知其 具体数各是多少。若作变换yi = 2 xi − 10 ,求平均数。
平均数的近似计算方法:
x x
x − Md 1 = x − Mo 3
算术平均数、中位数、 算术平均数、中位数、众数在三种分布形态 中的位置关系
正态
正偏态
负偏态
M O ≈ 3Md − 2 x
fa M O = Lb + i f a + fb
分布 的 数 上 次数的 分布 分布 众数 次
皮尔逊经验公式 3 的 的
算数平均数、中位数、众数三者的关系: 算数平均数、中位数、众数三者的关系:
• 如果一个数据组的次数分布曲线呈正态,则算术 如果一个数据组的次数分布曲线呈正态, 平均数、中位数、众数三者相等, 平均数、中位数、众数三者相等, ·中位数位于三者中间,在负偏态时, < 中位数位于三者中间,在负偏态时, Md<Mo;在正偏态时,Mo<Md< 且有: < ;在正偏态时, < < ,且有:
第三章 集 中 量
数据还有两个重要的统计特征: 数据还有两个重要的统计特征:集中趋 势和离散趋势。 势和离散趋势。这两种趋势用量数描述就是 集中量和差异量 集中量是代表一批数据典型水平或集中趋 集中量是代表一批数据典型水平或集中趋 势的量, 势的量,它是反映次数分布中大量数据向某 一点集中的情况 我们常用的集中量有:算术平均数、 我们常用的集中量有:算术平均数、加权 平均数、中位数、众数等。 平均数、中位数、众数等。
三、由多组平均数求整体平均数的计算公式
第三章集中量数
Mo = 3Mdn− 2 X
M o = Lb +
fa ⋅i fb
9
1
集中量数的选择与应用
一、均数、中数、众数的关系 正态分布时 :
X = Mdn = Mo
数据分布为偏态分布时,
(X − Mdn) : (X − Mo) = 1 : 3
众数、中位数和均值的关系图
均值 中位数 众数 均值 = 中位数 = 众数 众数 中位数 均值
1 1 1 1 1 + + ⋅⋅⋅ + N X1 X 2 XN 1 N = = 1 1 1 ∑ ∑ N X X MH =
17
本章学习要求
这节课你学到了什么知识? ? 这节课你学到了什么知识 ☆ 本章学习要求: 本章学习要求:
理解各集中量数的意义与作用 算术平均数、 算术平均数、加权平均数的计算与应用 集中量数的选择
N 2
Mdn =
+X
N +1 2
6
解:1、排序 例3-6:五名 学生的物理成 绩分别55,64, 89,98,34请问 五名学生的平 均成绩是多 少?
2、 N=5,为奇数 为奇数 3、中数位置=
N +1 2
=3
4、中位数是 中位数是64
例3-7:六架直升飞机的最大速度分别为450km/h、 420km/h、 500km/h 、 530km/h 、600km/h 、1100km/h,请问平均速 度是多少?
X =
∑
Xi
N
3
例3-1:10名学生的心理与教育 统计成绩为68,77,63,79, 70,79,70,79,86,80。 试问这组数的平均数为多少? 试问这组数的平均数为多少?
心理与教育统计学第3章 集中量数
(3.9b)
公式中:La为中位数所在组的精确上限 fa为中位数所在组上限以上的累积频数 n为数据总数 fMd为中位数所在组的频数 i为组距
表3-7 52名学生数学成绩中位数计算表
成绩 95 90 85 80 75 70 65 60 55 50 45
合计
频数f 2 2 3 5 8 11 9 5 4 2 1 52
次数分布表计算平均数的基本公式:
f1 X C1 f 2 X C 2 f k X Ck X f1 f 2 f k
f
j 1 k j 1
k
j
X Cj
j
1 X fX C N
f
(3.3)
N f f1 f 2 f k
Xc 为分组区间的组中值 f 为各组次数
正态分布的3σ准则
3.1.5 计算和应用算术平均数的 原则
• 同质性原则:算术平均数只能用于表 示同类数据的集中趋势。 • 平均数与个体数值相结合的原则:在 解释个体特征时,既要看平均数,也 要结合个体的数据。 • 平均数与标准差、方差相结合原则: 描述一组数据时既要分析其集中趋势, 也要分析离散程度。
n i Md Lb f b 2 f Md
(3.9a)
公式中:Lb为中位数所在组的精确下限 fb为中位数所在组下限以下的累积频数 n为数据总和 fMd为中位数所在组的频数 i为组距
由上至下累积频数计算公式
n i Md La f a 2 f Md
3.2.2 次数分布表计算中数
• 由次数分布表计算中位数需要用到 累积次数分布表。 • 当表中数据的累积方向不同时,计 算公式也不同。
表3-6 52名学生数学成绩次数分布表
统计学 第3章集中量数
MW
W1 X1 W2 X 2 W1 W2
72 4 86 6 46
80.4
3、计算方法
3)加权算数平均数(weighted mean)的计算:
用M W 表示
如高考的标准分换算法。 研究生入学考试总分不一样。 P69例3-7
3、计算方法
4)使用次数分布表计算平均数:
与无重复数据时求中数的方法相同; 当中间的数值为重复数时:可将重复数看
作一个连续区间,然后根据中间数在区间 内的位置来确定中位数。
3、计算方法
2)一组数据中有重复数据 当重复数值没有位于数列中间时,求中数
与无重复数据时求中数的方法相同; 当中间的数值为重复数时:可将重复数看
作一个连续区间,然后根据中间数在区间 内的位置来确定中位数。
例如:P70 例3-8
2、几何平均数的应用
2)应用几何平均数的变式计算: 一组数据彼此间变异较大,几乎按一定的比 例关系变化,所要求的不是平均数,而是平 均增长率。平均增长率=平均发展速度-1
学习方面的进步率 学生或人口增加率 教育经费增加率
本章主要内容
一.算术平均数 二.中数 三.众数 四.平均数、中数、众数三者之间的关系 五.加权平均数 六.几何平均数 七.调和平均数
平均数
中数
众数
① 感应灵敏② 严密确 ③④
定③ 意义简明,易理
于
优 点
解④ 容易计算⑤ 适合
代数法的处理⑥ 少受
抽
③④
样变动的影响
1.加权平均数 2.离差、相关计算 应 3、统计推断 用
1.有极端数值时 2.模糊数据时 3.快速估计集中
量数时
1.有极端数值时 2、数据不同质时 3、粗略估计数据的
集中量数
集中量数统计资料经过分组归类的初步整理和列表绘图之后,已经能够简化繁冗的数量而窥其分布的大概面貌。
但如果要对数据资料进行深入的了解和研究,仅有图表是不够的,还必须计算出描述数据分布状况的特征量,包括集中量数、差异量数和相关量数等。
本节的主要内容是介绍有关集中量数的计算。
在将数据资料进行初步整理所编制的次数分布表或图上,我们可以看出各组数据分布的次数虽然各有不同,但大部分数据都趋向于某点,这种向某点集中的现象,称为集中趋势。
而代表数据的集中趋势的统计量被称为集中量数。
例如,如果要分析两个班某个学科的考试分数,我们很难做到将两个班学生的分数加以一一对应的比较,因为学生的考试分数大多是不相同的,而且两个班的学生人数也不一定相等。
在这种情况下,可以利用两班的平均分数进行比较,因为大多数的学生分数都分布在平均分数的附近,这里的平均分数就代表了某班某科的学生成绩的集中趋势。
常用的集中量数有算术平均数、中数、众数和几何平均数。
一. 算术平均数(一)算术平均数的概念与性质 1.概念算术平均数通常称为平均数、均值或均数。
它是各变量值的总和除以变量总次数所得之商。
因为“平均数”一词的英文是Mean ,所以一般用字母M 来表示。
如果想表明平均数M 是由哪个变量计算得来的(或称某个变量的平均值),可以在该变量字母上面加一杠“—”来表示。
如: 表示变量X 的平均数,表示变量Y 的平均数。
算术平均数是统计学中最常用的一种集中量数。
算术平均数的基本运算公式为 简写为NX X ∑=(公式10—1)式中:∑为希腊字母(读做Sigma ,西格玛),X 为算术平均数,N 为总次数,n X X X X 321为各变量值。
NX X X X X n++++=321例1,某小组11个学生的英语测验成绩分别为76,81,69,90,94,83,89,65,77,83,91。
其算术平均数为:M =119183776589839490698176++++++++++≈81.632.性质算术平均数有以下三个性质:A . 观察值的总和等于算术平均数的n 倍。
第三讲 集中量数
n
j 1
K
j
X
j
nT
加权平均数的适用条件
1、在研究对象总体中,当存在着所占比率不同或
重要程度不同的数据时,必须用加权平均的方法 计算总体的平均数。
2、比率变量和等距变量。
三 中数
中数Md:
又称中位数。在按大小顺序排列的一组数据中 位于中间位置的那个数。
中数可能是原始数据中的某一个,也可能不是 原有数据而是计算得出的数值。
中数将全部数据分成数目相等的两半。
中数的计算方法——未分组数据
奇数:从大到小排列第(N+1)/2个数 例:68 83 72 57 87 90 51
偶数:从大到小排列第N/2 和N/2+1个数的平均数。
例:81 86 77 75 94 88
中数的计算方法——已分组数据
Md = L + (N/2-F)·i/f L 为中数Md所在组分组区间的精确下限; N 为数据总数目 F 为中数所在组以下各组的累加次数 i 为组距 f 为中数所在组内包含的次数
第二章
集中量数
集中量数 一组数据的代表值。它反映和描述一组 数据的典型情况和集中趋势。
集中量数类型 算术平均数;加权平均数;中数;众1 X 2 X N X N
总体平均数
1 xi N i 1
N
未分组数据的计算
X1 X 2 X N X N
已分组数据的计算
f Xc N
X
算术平均数的作用
1、能代表研究对象的整体水平
2、能判断两组数据之间的差别
3、可用于研究某个事物的整体水平随时间发生变 化的情况。
算术平均数的优点与缺点
第三章_ 语言统计学 集中量数
2014-7-23 18
(2)当重复数目位于数列中间,数据的个数为奇数的情形。 例:求数列11、11、11、11、13、13、13、17、17的中数。 解:首先假设位于中间的几个重复数目为连续数目,取序列中
上下各N/2那一点上的数值为中数。此数列个数为奇数,因此中 数所在的位置为(9+1)/2=5;在数列中第5个数为13,此为一个 重复数目,可以将其视做连续数,理解为三个13占据了一个分数 单位的全距,即12.5—13.5,它们均匀地分布在12.5~13.5 这个区间内: 每一个13占三分之一距离,在图中就用三个方块表示。第一个 13落在12.5~12.83这个区间内,第二个13落在12.83~ 13.16这个区间内,第三个13落在13.16—13.49这个区间内。 这样,三个13就落在不同的区间内。因为,中数是一个点值,因 此,需要计算出第一个13所在区间的组中值,这一点就是整个序 列中位居最中间的那一点,就是这组数据的中数。第一个区 间 的中值为 12.499+0.33/2=12.66。因此,该组数据的中数是 19 2014-7-23 12.66。
2.一组数据中有重复数值的情况 指一组数据中有相同数值的数据,这时计算中
数的方法基本与无重复数值的单列数据相同。但 根据重复数值数据在该组数据中所处的位置又细 分为几种情况。当位于中间的那几个数是重复数 值时,求中数的方法就比较复杂了。 (1)当重复数值没有位于数列中间时,求中数 的方法与无重复数据时求中数的方法相同。
第三节 其他集中量数
一、加权平均数 有些测量中所得数据,其单位权重
(weight)并不相等。这时若要计算平均数, 就不能用算术平均数,而应该使用加权 平均数(weighted mean)。计算公式如下:
第三章集中量数ppt课件
ana01xn
例5.某高校1980年—1985年在校生人数如表3— 4。求年平均增长率。
解:
①先求逐年发展速度 。用每一年与其上一年量值的
环比求出逐年的发展速度列入表3—4的第3列。 ②计算平均发展速度 。将表中第3列数据代入公式
〔3.6〕得: MG n X1X2X3Xn
51.120.901.051.161.22
第三节、几何平均数
一、概念
N个数值的连乘积的 N次方根,称为几何平均 数,用符号 M G 表示。几何平均数也是平均数的 一种,如果一组数据值按比例递增或递减,表示 其平均水平时应使用几何平均数。几何平均数一 般用于计算平均发展速度、平均增长速率等统计 指标。
二、计算公式
几何平均数的计算公式为:
M GnX1X2X3 Xn (3.6)
第三章 集中量数
第一节 算术平均数 一、概念
二、计算方法 三、加权算术平均数 四、算术平均数的性质
第二节 中位数 中位数的计算方法 第三节 几何平均数
描述一组数据集中趋势的量数,称为集中量 数。
集中量数是统计总体各统计事项某一数量标 志的代表值,它概括说明总体某一数量标志的 综合特征,反映研究对象在一定时间、地点、 条件下的一般水平。
解:
(1〕求平均发展速度 , 由公式〔3.7)。
MG n
an a0
4 1251.2223 56
(2〕计算平均增长率 , 由公式〔3.8〕得
x' M G 1 1 .22 2 1 3 0 .2223
即年平均增长率为22.23%。
(3〕计算2019年该小学的教学设备数 。知
求 n 6,
a6 ?
由公式〔3.9〕得
=8。
再如,一组数值为N4、158、71、98、41.50、12、
第三章集中量数
五、优缺点
(一)优点 1、反应灵敏,观测数据中任何一个数值或大或小的变化, 在计算平均数时都能反映出来。 2、计算严密,有确定的公式,只要是同一组观测数据, 计算的平均数都相同 3、计算简单,应用简单的四则运算 4、简单明了,容易理解 5、适合于进一步用代数方法演算。在求解其他统计特征 值,如离均差、方差、标准差的计算时,都要应用平均 数 6、较少受抽样变动的影响(观测样本的大小或个体的变 化,对计算平均数影响很小)
例子:评委打分
常用的计算最后得分的方式:去掉一个最高分,再去 掉一个最低分,然后计算剩余9个评分的算术平均数。 在中央电视台举办的一次全国业余通俗歌手大赛中, 假定11位裁判对某位歌手的评分按顺序排列为:9.9, 9.3,9.3,9.3,9.2,8.9,8.8,8.8,8.5,8.4, 7.4
2、若出现模糊不清的数据时,无法计算平均数,这 时一般采用中数作为该组数据的代表值 3、数据不同质时也不宜使用算数平均数 (数据同质:使用同一个观测手段,采用同样的观 测标准,能反映某一问题的同一方面特质的数据)
四、众数的应用
(一)当需要快速而粗略地寻求一组数据的代表值时 (二)当一组数据出现不同质的情况时
(三)当数据中有两极端的数目时,除了用中数外,也可 用众数 (四)当粗略估计次数分布的形态时,有时用平均数与众 数之差,作为表示次数分布是否偏态的指标 (五)当一组数据中同时有两个数值的次数都比较多时, 也多用众数来表示数据分布形态
老刘(厂长)工资:36000 弟弟(副厂长)工资:15000 6个亲戚(管理人员)工资:3750 5个领工:3000 10个工人:1500
X 4500
Coun t
15
10
Md 3000
5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
练习
已知 X: 1 5 3 Y: 2 4 3 求 X ; Y;
2 X ;
XY; X 1Y 1; X X Y Y
3; 3; 35 ; 31 ; 16; 4
思考题:
当数据编制成次数分布之后,已看不到原始数据, 在这种情况下,如何计算平均数?
组别
52
合计
12 10 8 6 频 数 4 2 0
45 50 55 60 65 70 75 80 85 90 95 100
成
绩
图1 52名学生数学成绩分布的频数直方图
数
人
10
12
0
2
4
6
8
47 .5 .5 .5 .5 .5 .5 .5 .5 87 92 97 .5 .5 .5 52 57 62 67 72 77 82
算术平均数 加权平均数 几何平均数 调和平均数 中数 众数
问题
考试成绩 67, 87, 90, 58, 88, 76, 44, 63, 95, 81, 68, 83, 77, 72, 86, 89, 81, 93, 50, 62, 82, 92, 49, 51, 56, 64, 75, 79, 80, 71
加权平均数 几何平均数 调和平均数
加权平均数
用于分组数据 如果已知各组平均数和各组人数,要求 出总的平均数时,则要用加权平均数的 方法。
Xw
n X n
j j
j
n
jXLeabharlann jnT学校 均数 人数
n j 是第j组的人数 X j 是第j组的平均数 nT 是总人数
A B C
72.6 80.2 75
成 绩
图3 52名学生数学成绩分布图
40 35 30 25 20 15 10 5 0
39 44 49 54 59 64 70 75 80 85 90 95 100
用统计量数来描述一组数据变量的分布情况或分 布特征,便于研究者对数据分布状况进行更好的 代表性的描述,同时也有利于更加深入地了解数 据的特点。 需要计算出某些具有代表性的数据指标,对变量 所蕴含的信息作出更加简洁明了的数量化描述, 对其次数分布特征作出更加精确的定量描述,或 作出有根据的推断。
X X 0
X C X C CX CX CX D CX D
算术平均数在大多数情况下,是真值最 好的估计值。
算术平均数的优缺点:
优点:
反应灵敏、确定严密、简明易懂、计算简便、可 作进一步演算、较少受抽样影响 易受极端数据的影响、不能有模糊不清的数据、 不能用不同质的数据
算术平均数的性质
一组数据的每一个数与平均数的差(离均差)的 总和等于零; 一组数据的每一个数加上常数c,其平均数为原来 的平均数加常数c; 一组数据的每一个数乘以常数c,其平均数为原来 的平均数乘常数c; 一组数据的每一个数乘以常数c,再加上一个常数d 其平均数为原来的平均数乘常数c再加上常数d;
缺点:
算术平均数的适用条件
数据必须是同质的
如:如果身高均数在性别上有差异,那么 不分性别地求某一年龄组的身高均数时没 有实际意义的
数据取值必须明确 适用于呈正态分布的数据 数据离散不能太大
除了算术平均数以外,还有几种平均数 对于测量一组数据的集中趋势也很有用 ,这些统计指标包括:
主要内容
集中量数 差异量数 地位量数
学习目标
了解各种统计量数(集中、差异和地位量数) 的概率、性质和作用。 理解各种统计量数的适用条件及其特点。 掌握各种统计量数的计算。 正确使用各种统计量数对测量数据进行处理。 能够运用SPSS软件计算各种统计量数。
表2
成绩
52学生数学成绩次数分布表
平均增长率(例2-4)
某市近几年来高中毕业人数如下表,试求其平均增 长率;照此速度增长,到2012年统计有多少高中毕 业生? 学生人数 2000(x1) 变化率
32 40 36
几何平均数
第一种情况:一组数据中任何两个相邻数据之比 接近于常数,即数据按一定的比例关系变化。
平均增长率、心理物理学中的等距与等比量表实验进 行数据处理。
第二种:当一组数据中存在极端数据,分布呈偏 态时,算术平均数不能很好地反映数据的典型情 况。
X g N X1 X 2 ... X N
组中值 频数 累积频数
95 90 85 80 75 70 65 60 55 50 45
~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
97.5 92.5 87.5 52.5 77.5 72.5 67.5 62.5 57.5 52.5 17.5
2 2 3 5 8 11 9 5 4 2 1
52
2 4 7 12 20 31 40 45 49 51 52
组中值
次数
58~61
59.5
2
54~57
50~53 46~49
55.5
51.5 47.5
1
6 5
42~45
38~41 34~37 30~33 26~29 22~25 18~21 14~17
43.5
39.5 35.5 31.5 27.5 23.5 19.5 15.5
7
12 20 14 14 9 7 3
请问该班此次考试成 绩如何? 报出每人考分? 报告平均数?
算术平均数
平均数,均数,均值 度量连续变量次数分布集中趋势及位置的最 常用的集中量数。 总体平均数μ和样本平均数 X
X
i 1
N
i
N
X
X
i 1
n
i
n
例2-1
某项研究在一年级学生总体中抽取30名样本 ,测得他们的某项考试分数如下:60、71、 63、58、50、75、64、73、72、64、52、65 、67、76、72、70、58、50、80、51、79、 81、77、69、67、61、48、50、54、55
集中量数
一组数据的中心位置是用来度量该组数据的集中 趋势。 对该组数据的中心位置进行数量化的描述,即称 为集中量数或位置度量数。 集中量数是代表一组数据典型水平或集中趋势 (central tendency)的量。它能反映频数分布中大量 数据向某一点集中的情况。
图2-1:A、B、C
集中量数是用来描述一组数据集中趋势 (central tendency)的统计量数。