第三章集中量数 - 心理统计学!
第三章集中量数,趋中量数(MeasuresofCentralTendency)
第三章集中量數(或趨中量數)(Measures of Central Tendency)壹、本單元的目標1、解釋集中量數的目的,並說明此量數所傳達的訊息2、計算,說明,及比較眾數(mode)、中位數(median)、以及平均數(mean)的差異3、說明平均數的數學特性4、依照測量尺度及偏態(skew)來選擇適當的集中量數貳、各種集中量數上個單元所介紹的次數分配及圖表等是用來描述資料的整體分配情況。
本單元及下個單元則介紹兩類的描述統計,以進一步瞭解資料整體分配的細節。
這兩類統計能告訴我們以下的資訊是:1、代表此分配之典型或平均狀況的個案為何。
與此有關的描述統計就是各種「集中量數」。
2、此分配之變異或異質性的狀況。
與此有關的描述統計就是各種「離散量數」。
所以,集中量數就是以一個數值來描述樣本資料中,那一個分數或數值是最常見的、站在中間的位置、或最具代表性。
最常見的集中量數有三種,即眾數(Mode)、中位數(Median)、和算術平均數(Mean)。
這三種量數雖有共同的目的,但它們測量資料之集中趨勢(central tendency)的作法卻不同,也傳達不同的訊息。
因此,只有在特定的條件下,這三種量數的數值才會相同。
到底用那一個集中量數和the level of measurement(測量尺度)以及研究之目的有關。
集中量數之使用和測量尺度之關係:Nominal -ModeOrdinal -Mode、Median (也可用Mean,但解釋時要小心)Interval-Ratio -Mode、Median、Mean一、眾數(Mode):是指資料中出現最多的數值。
眾數適用於各種測量尺度。
但當變項為名目尺度時,這是唯一可用的集中量數。
在名目尺度變項,或次數分配表中,眾數是指含件數或次數最多的類別。
眾數雖是最簡單之集中量數,但有缺點:1、有些分配不一定有眾數,換言之,分配很平均時或眾數很多時,眾數即失去意義和功能。
[教育学]心理统计学:绪论_集中量数_图表
心理与教育统计学▪统计学是一种思想方法▪常用统计指标▪概率及概率分布▪抽样分布参数估计参数假设检验▪平均数差异的显著性检验方差分析▪相关分析回归分析▪χ2检验总体比率的推断非参数检验▪抽样设计问题▪某研究机构研制出一种能提高5岁幼儿阅读能力的游戏产品,该产品能在使用3个月之后提高幼儿的阅读能力,请设计一个实验验证这种游戏产品的作用。
——2007年心理学研究生入学试题统计学▪统计学是科学研究的基本技能。
▪统计学不难。
▪立足于自学。
▪从现实中寻找问题,在教材中寻找答案。
方案一▪抽取一组5岁幼儿,前测-游戏-后测。
▪如果成绩提高,说明产品有效。
▪问题:幼儿成熟,阅读水平也会提高。
方案二▪抽取A、B两组5岁幼儿,A组用该产品,B组不用,分别进行前测-游戏-后测。
▪如果两组前测成绩相当,后测A好于B,说明产品有效。
▪问题:前测成绩不等怎么办?方案三▪抽取A、B两组5岁幼儿,A组用该产品,B组不用,分别进行前测-游戏-后测。
▪A组后测成绩-前测成绩(提高幅度)高于B组,说明产品有效。
▪问题:谁能保证分数的差异不是出于随机误差?其他问题▪不能打百分制怎么办?▪及格-不及格▪及格人数-不及格人数▪如果有A、B、C三种产品竞争,如何设计研究方案?▪一次实验就能说明产品一定有效(或无效)吗?▪……统计资料也骗人(1)▪某城市公安局加大对带有黑社会性质的犯罪团伙的侦办力度,2004年共侦破此类案件50起,抓获犯罪嫌疑人800人,而2003年这两个数字分别是5起和100人。
一些人士惊呼:仅仅一年时间,该城市治安形势急剧恶化。
统计资料也骗人(2)▪某城市(人口数1000万)中过去没有禽流感传染给人的病例。
但是2003年出现了2例,2004年出现了4例。
由此可以得出结论:2003—2004年期间,该病发病率增加了100%。
这样的增幅足以令卫生部门和市民忧心忡忡。
统计资料也骗人(3)▪某公司在广告中声称,在过去的10年它销售的汽车中,10辆里面有9辆仍在道路上行驶。
心理统计学第三章
第三章第三章集中量数第一节算术平均数 ................................................. 错误!未定义书签。
第二节中位数 ................................................................. 错误!未定义书签。
第三节众数 ....................................................................... 错误!未定义书签。
第四节几何平均数和倒数平均数............................... 错误!未定义书签。
第五节 SPSS实验——均数、中数和众数...................... 错误!未定义书签。
同步练习与思考题 ............................................................... 错误!未定义书签。
学习目标1.识记和理解各种集中量指标的概念2.熟练掌握各种平均指标的计算方法3.掌握均数、中数和众数应用范围4.了解几何平均数和倒数平均数的应用在实验、测量或调查中获得的大量观测数据,具有一种向数据中央某一点靠拢的趋势,这种趋势在统计学中称为集中趋势(central tendency),它是数据分布的特征之一。
用于描述观测数据集中趋势的量数称为集中量数。
集中量数(central measures)是一组数据的代表值,用以说明一组数据分布的典型情况或一般水平,它比个别数据更能反映客观现象或事物的实际情况。
集中量数还可以用于组与组之间的差异比较。
譬如,某教师在两个平行班进行了传统教学法和多媒体教学的实验研究,通过一年实验后,观测到两个班级的平均成绩之间出现较大的差异。
描述客观现象集中趋势的数量指标有算术平均数、加权平均数、中数、众数、几何平均数和倒数平均数。
《心理统计学》重要知识点
《心理统计学》重要知识点第二章 统计图表简单次数分布表的编制:Excel 数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。
条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。
简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。
复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。
圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。
线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;第三章 集中量数● 集中趋势和离中趋势是数据分布的两个基本特征。
● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。
● 集中量数:描述数据分布集中趋势的统计量数。
● 离中趋势:是指数据分布中数据分散的程度。
● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):nx X i∑= Excel 统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。
中位数上下的数据出现次数各占50%。
3.众数(mode ,M O ):一组数据中出现次数最多的数据。
4.算术平均数、中数、众数之间的关系。
统计心理-第三章 集中量数
例。
XT
ni X i ni
加权平均数
例1:某小学三年级举行英语测验。甲班32名学生的平均 分为72.6,乙班40名学生平均分为80.2,丙班36名学生的 平均分为75分。求全年级英语测验的总平均分数。
xwN1xN 11NN 2x22N N 33x3
加权平均数
例2:某课题组在8个省区进行一项调查,各省区的取样 人数和平均分数见下表,求该项调查的总平均数。
2
中数;若数据个数为偶数时,则 X N 2 X N 2 1 2为中 数。
①求数列4,6,7,8,12的中数。 ②有2,3,5,7,8,10,15,19共8个数,求其中数。
(二)中数的计算方法
(2)一组数据中有重复数值的情况
①当重复数值没有位于数列中间时 求数列5,5,6,10,12,15,17的中数。
集中趋势与离中趋势
集中趋势是指数据分布中大量数据向某方向集中 的程度。
集中趋势与离中趋势
集中趋势是指数据分布中大量数据向某方向集中 的程度。
离中趋势是指数据分布中数据彼此分散的程度。 集中量数与差异量数:描述一组数据集中趋势和
离中趋势的统计量,共同描述一组数据的全貌及 统计特征。 测度集中趋势即寻找数据水平的代表值或中心值 集中量数包括算术平均数、中数、众数、加权平 均数、几何平均数、调和平均数等。
Mo3Md2M
第三节 其他集中量数
一、加权平均数 所得数据单位权重不相等时要使用加权平均数。
k
M WW 1X W 1 1W W 2X 22 W W nnXni
1
W
k
i
W
X
i
i
i1
W为权数,指各变量在构成总体中的相对重要性。
心理统计学(一) 第三章 集中量数
[学习重点]
集中量数
1.各种集中量数的概念和性质 2.各种集中量数的计算方法 3.各种集中量数的具体应用
第三章
集中量数
集中趋势与离中趋势是次数分布的两个 基本特征。数据的集中趋势就是指数据分布 中大量数据向某方向集中的程度,离中趋势 是指数据分布中数据彼此分散的程度。用来 描述一组数据这两种特点的统计量分别称为 集中量数和差异量数。这两种量数一起共同 描述或反映一组数据的全貌及其各种统计特 征。
算术平均数的计算方法
(1)未分组数据(原始数据)计算法
X X1 X 2 X N X i N N
fX c N
(2)数据分组后(次数分布表)计算法
X
(式中 XC 为各区间的组中值,f 为各区间的次数)
算术平均数的优缺点
算术平均数具备一个良好的集中量数所应具备的一些条件: ① 反应灵敏; ② 严密确定; ③ 简明易懂; ④ 计算简单; ⑤ 适合代数运算; ⑥ 较少受抽样变动的影响。 除此之外,算术平均数还有以下一些特殊的优点: ① 只知一组观察值的总和及总频数就可以求出算术平均数; ② 用加权法可以求出几个平均数的总平均数; ③ 用样本数据推断总体集中量数时,算术平均数最接近总体集中量数的 真值,它是总体平均数的最好估计值; ④ 在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。 但是算术平均数也有一些缺点: ① 易受极端数据的影响; ② 若出现模糊不清的数据时,无法计算平均数。
算术平均数的概念
算术平均数是所有观察值的总和除以总频数所得之商。用
表示。 X
若以 X1,X2,· · · ,XN 表示变量 X 的各个观察值,N 表示 观察值的个数,则算术平均数可表示为:
X1 X 2 X N Xi X N N
第三章集中量数
三、算术平均数的性质
一组变量值的和等于变量的个数与其平均数的乘积, 一组变量值的和等于变量的个数与其平均数的乘积, 即 ∑ X = NX 一组变量值的离均差之和等于零, 一组变量值的离均差之和等于零,即
∑ (X − X ) = 0
在一组变量值中,每个变量值加上或减去 、乘以或 在一组变量值中,每个变量值加上或减去、 除以常数 , 所得的平均数等于原平均数减去或 加上,除以或乘以常数 加上, 。
i N Mdn = La − − Fa f 2
5 57 = 74.5 − − 24 = 74.5 − 1.5 = 73 15 2
分组次数表与重复次数中位数的联系
1N Mdn = Lb + − Fb f 2
三、百分位数与四分位数
(一)百分位数:在任一百分位上的数值。
例3-6:五名学生的物理成绩分别55,64,89,98, 34请问五名学生的平均成绩是多少?
解:1、排序:34、55、64、89、98 2、 N=5,为奇数 为奇数 N +1 3、 中数位置= 2 =3 4、排在第 个位置上的数是 ,所以中位数 排在第3个位置上的数是 排在第 个位置上的数是64, 是64 答:五名同学的的物理平均成绩是64分。 五名同学的的物理平均成绩是 分
Fl →u
Fu→l
Fa = 24
57 54 46 33 18 9 3 1 —
3 11 24 39 48 54 56 57 —
④代入公式计算中数
i N Mdn = Lb + − Fb f 2 5 57 = 69.5 + − 18 = 69.5 + 3.5 = 73 15 2
例3-7:六架直升飞机的最大速度分别为 六架直升飞机的最大速度分别为450km/h、 六架直升飞机的最大速度分别为 、 420km/h、500km/h 、 530km/h 、600km/h 、 、 1100km/h,请问平均速度是多少 ,请问平均速度是多少? 1、排序:420、450、500、530、600、1100 N 2、N=6,为偶数 中数位置= 2
心理统计学第三章集中量数
04 集中量数的计算方法
简单平均数计算方法
总结词
简单平均数是集中量数中最基本的计算方法,它通过将一组数值相加后除以数值 的数量来得出平均值。
详细描述
简单平均数计算公式为 $overline{x} = frac{1}{n} sum_{i=1}^{n} x_i$,其中 $n$ 是数值的数量,$x_i$ 是每一个数值。这种方法适用于数据分布均匀且无异常值的 情况。
对未来研究的展望
01 02
探索新的集中量数
随着数据类型和复杂性的增加,传统的集中量数可能无法满足某些研究 需求。未来研究可以探索新的集中量数,以更准确地描述数据的集中趋 势。
改进现有集中量数的计算方法和性质
现有集中量数的计算方法和性质可能存在一些局限性和不足之处,未来 研究可以尝试改进这些方法和性质,以提高集中量数的准确性和可靠性。
06 总结与展望
总结心理统计学第三章集中量数的要点
集中量数
集中量数是描述数据集中趋势的统计量,用于反映一组 数据的中心位置或典型值。
常见集中量数
常见的集中量数包括算术平均数、中位数和众数等。
算术平均数
算术平均数是所有数值的和除以数值的个数,是最常用 的集中量数之一。它具有线性性和可加性,能够反映数 据的平均水平。
在社集中量数来描述被调查者的社会特征, 例如通过平均年龄和标准差等指标来分析被调查者的社会 经济地位和人口结构。
社会政策制定
政府和社会组织可以利用集中量数来制定社会政策,例如 通过分析不同地区居民的平均收入和收入分布来制定社会 保障政策。
社会问题研究
研究者可以利用集中量数来研究社会问题,例如通过平均 失业率和标准差等指标来分析社会经济不平等和就业状况。
心理统计学第三章 集中量数
有重复数时,需考虑重复数的影响。
例:求11,11,11,11,13,13,13,17, 17的中 数。
分析:N=9,中间位置为5,第5个数为13。
但是数据中有3个13,需要重新考虑。
有3个13,意味着3个13占了一个单位。
第五位的13 ,中数计算(12.5+12.83) /2=12.665
或者12.5+1/3*1/2=12.666
例题3-4 计算加权平均数
省区代码 1 2 3 4 5 6 7 8
人数 平均分数
627
98
268
60
400
82
670
96
411
80
314
65
610
96
500
88
3800
665
解:
62798 268 60 50088
MW
3800
330496 86.97 3800
例题3-5 课堂练习
大。
练习
P79 5-6(10分钟)
第二节 中数与众数
一、中数 中位数又称中点数,中位数,中值,简称中数,用符
号Md 或Mdn表示,是位于按一定顺序排列的一组数 中央位置的数值。 中数是一种位置量数。 能将数据分成较大的一半和较小的一半。
(一)未分组数据的中数计算
1.中数附近无重复数时 若数据个数(N)为奇数时,中数则为(N+1)/2
2.众数的计算 (1)直接观察法 未分组数据——次数最多的数值 次数分布表——次数最多一组的组中值
例题3-3 计算众数
组别 81~ 78~ 75~ 72~ 69~ 66~ 63~ 60~
f
向上累加次数
17
教育与心理统计学第三章:集中量数
几何平均 ①一组数据中有少数数据偏大或偏小,数据的分布呈偏态
数
②需要计算增长比率的平均数等这类问题
调和平均 求平均速率等这类问题 数
课后习题练习
课后作业
思考题与练习题:第4题 作业上交时间:下周上课
1)、当重复数值没有位于数列中间,求中数 的方法与无重复数据时求中数的方法相同
5,5,6,10,12,15,17(N=7) 2)、A、当重复数目位于数列中间,且数据
个数为奇数
11,11,11,11,13,13,13,17,17(N=9) B、当重复数目位于数列中间,且数据个数为
偶数
11,11,11,11,13,13,13,17,17,18
第二节 中数与众数
一、中数
又称中位数,中值,符号为Md或Mdn,按顺序排列在一起 的一组数据中居于中间位置的数。
一、未分组数据 1、无重复数值(先从小到大排序) (1)、数据个数为奇数
4,6, 7, 8, 12 (2)、数据个数为偶数
2 , 3 ,5 , 7 , 8,10 , 15 , 19
2、有重复数值
集中趋势——次中彼此分散的程度。
集中量数——用于描述数据集中程度的统计量 离散量数——用于描述数据离散程度的统计量,(即
数据的变异性)
第一节 算术平均数
算术平均数(arithmetic average)——将所有的数据 相加,再用数据的个数去除数据总和。(即用数据总和 除以数据个数),一般记为
①一组数据中出现两极端数目 ②次数分布的两端数据或个别数据不清楚时 ③需要快速估计一组数据的代表值时
①需要快速而粗略地寻求一组数据的代表值时 ②当一组数据出现不同质的情况 ③当次数分布中有两极端的数目时 ④当粗略估计次数分布的形态时,有时用平均数与众数之 差,作为次数分布是否偏态的指标 ⑤当一组数据的次数分布出现双众数时
心理与教育统计学第3章 集中量数
(3.9b)
公式中:La为中位数所在组的精确上限 fa为中位数所在组上限以上的累积频数 n为数据总数 fMd为中位数所在组的频数 i为组距
表3-7 52名学生数学成绩中位数计算表
成绩 95 90 85 80 75 70 65 60 55 50 45
合计
频数f 2 2 3 5 8 11 9 5 4 2 1 52
次数分布表计算平均数的基本公式:
f1 X C1 f 2 X C 2 f k X Ck X f1 f 2 f k
f
j 1 k j 1
k
j
X Cj
j
1 X fX C N
f
(3.3)
N f f1 f 2 f k
Xc 为分组区间的组中值 f 为各组次数
正态分布的3σ准则
3.1.5 计算和应用算术平均数的 原则
• 同质性原则:算术平均数只能用于表 示同类数据的集中趋势。 • 平均数与个体数值相结合的原则:在 解释个体特征时,既要看平均数,也 要结合个体的数据。 • 平均数与标准差、方差相结合原则: 描述一组数据时既要分析其集中趋势, 也要分析离散程度。
n i Md Lb f b 2 f Md
(3.9a)
公式中:Lb为中位数所在组的精确下限 fb为中位数所在组下限以下的累积频数 n为数据总和 fMd为中位数所在组的频数 i为组距
由上至下累积频数计算公式
n i Md La f a 2 f Md
3.2.2 次数分布表计算中数
• 由次数分布表计算中位数需要用到 累积次数分布表。 • 当表中数据的累积方向不同时,计 算公式也不同。
表3-6 52名学生数学成绩次数分布表
统计学 第3章集中量数
MW
W1 X1 W2 X 2 W1 W2
72 4 86 6 46
80.4
3、计算方法
3)加权算数平均数(weighted mean)的计算:
用M W 表示
如高考的标准分换算法。 研究生入学考试总分不一样。 P69例3-7
3、计算方法
4)使用次数分布表计算平均数:
与无重复数据时求中数的方法相同; 当中间的数值为重复数时:可将重复数看
作一个连续区间,然后根据中间数在区间 内的位置来确定中位数。
3、计算方法
2)一组数据中有重复数据 当重复数值没有位于数列中间时,求中数
与无重复数据时求中数的方法相同; 当中间的数值为重复数时:可将重复数看
作一个连续区间,然后根据中间数在区间 内的位置来确定中位数。
例如:P70 例3-8
2、几何平均数的应用
2)应用几何平均数的变式计算: 一组数据彼此间变异较大,几乎按一定的比 例关系变化,所要求的不是平均数,而是平 均增长率。平均增长率=平均发展速度-1
学习方面的进步率 学生或人口增加率 教育经费增加率
本章主要内容
一.算术平均数 二.中数 三.众数 四.平均数、中数、众数三者之间的关系 五.加权平均数 六.几何平均数 七.调和平均数
平均数
中数
众数
① 感应灵敏② 严密确 ③④
定③ 意义简明,易理
于
优 点
解④ 容易计算⑤ 适合
代数法的处理⑥ 少受
抽
③④
样变动的影响
1.加权平均数 2.离差、相关计算 应 3、统计推断 用
1.有极端数值时 2.模糊数据时 3.快速估计集中
量数时
1.有极端数值时 2、数据不同质时 3、粗略估计数据的
集中量数
X
C
fX
C
用原始数据及根据次数分布表计算的平均数,在数 值上有少许差异,但并不影响以后的统计分析。
某次考试成绩数据已经处理为次数图,根据次数图,求该成绩的平均值? 分组区间 XC组中值 f频数 96~ 97 2 fXC 194 d 6 fd 12 AM=79
93~
90~ 87~ 84~ 81~ i=3
N 1 2
N 2
N
1
2
②一组数据中有重复数值的情况 ⑴当重复数值没有位于数列中间时,方法与 无重复数据时相同。 ⑵重复数目位于数列中间,数据的个数为奇 数的情形。 ⑶重复数目位于数列中间,数据个数为偶数 情形。
例1:求数据5、6、5、12、10、15、17的中数。 解:先将数据按小到大的顺序排列: 5、5、6、10、12、15、17 一共七个数据,(7+1)/2=4 所以中数为10 例2:求数据11、11、11、11、13、13、13、17、17的中数。
b
式中 :L
表3-3 利用公式求分组次数表中中数
组限
65— 60— 55— 50— 45— 40— 35—
次数
3 4 11 13 8 6 3
自上而下累 自下而上 积次数 累积次数
i N Md L b Fb f 2 5 48 49.5 17 13 2 52 . 1 9 i N Md L a Fa f 2 5 48 5 4.5 18 13 2 52 . 1 9
X AM
X
N
式中:
X X i AM
AM为估计平均数 N为数据个数 估计平均数的大小,可根据数据表面值的大小任 意设定,但其值越接近平均数计算越简便。
第三章 集中量数
( xi x )
2
( xi c)
2
3、所有的观测值都加上常数C,则平均值也增加常数C
1 N
(x
i
c) x c
4、所有观测值都乘以不等于0的常数C,则平均值也增大C倍
1 N
(c x
i
) cx y) x y
5
1 N
(x
平均数的优缺点 优点:1.反映灵敏 2.计算严密 3.计算简单 4.简明易解 5.适合于进一步用代数方法演算 6.较少受抽样变动的影响 缺点:1.易受极端数据的影响 2.若出现模糊不清的数据时 ,无法计 算平均数
解:这里的数据为顺 序数据。变量为“回 答类别”
甲城市中对住房 表示不满意的户数最 多,为 108 户,因此 众数为“不满意”这 一类别,即 Mo=不满意
合计
300
100.0
众数的意义与应用 ( 1 )当需要快速而粗略地寻求一组数据的 代表值时 ( 2 )当一组数据出现不同质的情况时,可 用众数表示典型情况 ( 3 )当次数分布中有两极端的数目,除了 一般用中数外,有时也用众数 ( 4 )当粗略估计次数分布的形态时,有时 用平均数与众数之差,作为表示次数分布是否 偏态的指标
x 1 N
x 79.8
(2)分组数据的计算方法
(组中值计算法)
分组区间
9590858075706560555045-
次数(f)
6 5 7 7 7 8 3 2 0 2 1
组中值(Xc)
97 92 87 82 77 72 67 62 57 52 47
N=48
方法:把组中值看成每一分组的平均数
顺序数据的中位数
心理统计学-课程讲义3
【课程讲义】第三章集中量数【教学目标】明确一批数据的特征包括两个方面的内容:集中趋势、离散性;明确集中量数是描述数据集中趋势的量数,可以作为一批数据的代表值;明确算术平均数是所有集中量数中运用最广泛、最优的量数;明确各种集中量数的含义、计算方法、使用条件、性质及优缺点。
【学习方法】了解、理解、计算与应用。
【重点难点】算术平均数的概念及适用条件;算术平均数的计算方法;中位数的概念及适用条件;中位数的计算方法。
【讲义内容】前一章所讲的统计分组、统计表、统计图等,只是对研究工作中所获得的数据进行初步整理,其目的是对数据的性质、分布特征、差异情况及数据的一般规律有一直观和形象的认识。
因此说这一步还不是应用统计方法的步骤。
为了进一步发现和表示一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字——称为统计量或特征数。
对于一组数据来讲,最常用的统计量有两类。
一类是表现数据集中性质或集中程度的,另一类是表现数据分散性质或分散程度的。
数据的集中情况指一组数据的中心位置。
集中趋势的度量,即确定一组数据的代表值。
描述数据集中情况的统计量有多种,包括算术平均数、中数、几何平均数等。
由于这些统计量的作用在于度量数据的集中趋势,因此它们都称为集中量数。
本章主要介绍几种常用的集中量数。
集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。
数据除典型情况之外,还有变异性的特点。
对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有方差、标准差、全距、平均差、四分差及各种百分差等等,下一章中将对常用的差异量数进行介绍。
第一节 算术平均数一、算术平均数的概念和适用条件(一)概念算术平均数一般简称为平均数或均数(Mean )。
只有在与其他几种集中量数如几何平均数、加权平均数相区别的时候,才把它叫做算术平均数。
如果平均数是由X 变量计算的,就记为X (读作X 杠),若由Y 变量求得,则记为Y 。
第三章集中量数ppt课件
ana01xn
例5.某高校1980年—1985年在校生人数如表3— 4。求年平均增长率。
解:
①先求逐年发展速度 。用每一年与其上一年量值的
环比求出逐年的发展速度列入表3—4的第3列。 ②计算平均发展速度 。将表中第3列数据代入公式
〔3.6〕得: MG n X1X2X3Xn
51.120.901.051.161.22
第三节、几何平均数
一、概念
N个数值的连乘积的 N次方根,称为几何平均 数,用符号 M G 表示。几何平均数也是平均数的 一种,如果一组数据值按比例递增或递减,表示 其平均水平时应使用几何平均数。几何平均数一 般用于计算平均发展速度、平均增长速率等统计 指标。
二、计算公式
几何平均数的计算公式为:
M GnX1X2X3 Xn (3.6)
第三章 集中量数
第一节 算术平均数 一、概念
二、计算方法 三、加权算术平均数 四、算术平均数的性质
第二节 中位数 中位数的计算方法 第三节 几何平均数
描述一组数据集中趋势的量数,称为集中量 数。
集中量数是统计总体各统计事项某一数量标 志的代表值,它概括说明总体某一数量标志的 综合特征,反映研究对象在一定时间、地点、 条件下的一般水平。
解:
(1〕求平均发展速度 , 由公式〔3.7)。
MG n
an a0
4 1251.2223 56
(2〕计算平均增长率 , 由公式〔3.8〕得
x' M G 1 1 .22 2 1 3 0 .2223
即年平均增长率为22.23%。
(3〕计算2019年该小学的教学设备数 。知
求 n 6,
a6 ?
由公式〔3.9〕得
=8。
再如,一组数值为N4、158、71、98、41.50、12、
第三章集中量数
五、优缺点
(一)优点 1、反应灵敏,观测数据中任何一个数值或大或小的变化, 在计算平均数时都能反映出来。 2、计算严密,有确定的公式,只要是同一组观测数据, 计算的平均数都相同 3、计算简单,应用简单的四则运算 4、简单明了,容易理解 5、适合于进一步用代数方法演算。在求解其他统计特征 值,如离均差、方差、标准差的计算时,都要应用平均 数 6、较少受抽样变动的影响(观测样本的大小或个体的变 化,对计算平均数影响很小)
例子:评委打分
常用的计算最后得分的方式:去掉一个最高分,再去 掉一个最低分,然后计算剩余9个评分的算术平均数。 在中央电视台举办的一次全国业余通俗歌手大赛中, 假定11位裁判对某位歌手的评分按顺序排列为:9.9, 9.3,9.3,9.3,9.2,8.9,8.8,8.8,8.5,8.4, 7.4
2、若出现模糊不清的数据时,无法计算平均数,这 时一般采用中数作为该组数据的代表值 3、数据不同质时也不宜使用算数平均数 (数据同质:使用同一个观测手段,采用同样的观 测标准,能反映某一问题的同一方面特质的数据)
四、众数的应用
(一)当需要快速而粗略地寻求一组数据的代表值时 (二)当一组数据出现不同质的情况时
(三)当数据中有两极端的数目时,除了用中数外,也可 用众数 (四)当粗略估计次数分布的形态时,有时用平均数与众 数之差,作为表示次数分布是否偏态的指标 (五)当一组数据中同时有两个数值的次数都比较多时, 也多用众数来表示数据分布形态
老刘(厂长)工资:36000 弟弟(副厂长)工资:15000 6个亲戚(管理人员)工资:3750 5个领工:3000 10个工人:1500
X 4500
Coun t
15
10
Md 3000
5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 算术平均数 第二节 中位数与众数 第三节 加权平均数、几何平均数、调和平均数
第一节 算术平均数
一、概念及计算公式 (一)概念
算术平均数 (mean),是所有观测值(或变量值) 的总和除以总数所得的商。简称平均数、均数或 均值。
符号:样本平均数—— X、M(Mean), 总体平均数——
2、平均数与个体值相结合的原则 3、平均数与标准差、方差相结合的原则
第二节 中位数与众数
一、中数 中位数又称中点数,简称中数,用符号 Mdn
或 Md表示,是位于按一定顺序排列的一组数 中央位置的数值。
中数是一种位置量数。
二、中数的计算
(一)未分组数据的计算
1、中数附近无重复数时
若数据个数(N)为奇数时,中数则为 N 1 位置的
中数所在的组。因为本例累积次数36包含了
35.5,所以中数所在组为75-77。
④ 确定公式中各符号的内容,有
Lb 74.5,Fb 22 ,f Md 14 ,i 3
⑤代入公式计算中数
Md
Lb
i fMd
(N 2
Fb )
74.5 3 (35.5 22) 14
=77.4
二、众数
(一)众数的定义 众数(Mode)是指一群数据中出现次数最多的那 个数值,又称范数,用符号 Mo表示。众数的确定 方法
1、一组变量值的和等于变量的个数与其平均数的乘
积,即 X NX
2、一组变量值的离均差之和等于零,即
X X 0
3、在一组变量值中,每个变量值加上或减去、乘以 或除以常数,所得的平均数等于原平均数减去或
加上,除以或乘以常数 c 。
三、平均数的意义
平均数是应用最普遍的一种集中量数; 是真值渐进、最佳的估计值; 当观测次数无限增加时,算术平均数趋近于真值。
四、平均数的优缺点
优点:反应灵敏、计算严密、计算简单、简明容易 理解、适合进一步代数运算、较少受到抽样变动 的影响。
缺点:容易受极端数据影响;如果出现模糊不清的 数据,无法使用。
五、计算和应用平均数的原则
1、同质性原则:使用同一个观测手段,采用相同的 观测标准,能反映某一问题的同一方面特质的数 据
中数为第一个13所在区间的组中值,为 12.5+0.33/2=12.66。
(二)分组数据的计算
(用于由低分组向高分组累积次数时)
Md
Lb
i fMd
(N 2
Fb )
(用于由高分组向低分组累积次数时)
iN Md La fMd ( 2 Fa )
例3-3:求下表中的中数。
表3-2 中数计算表
组别 81~ 78~ 75~ 72~ 69~ 66~ 63~ 60~
f 向上累加次数
17
71
19
54
14
36
10
22
7
12
3
5
1
2
1
1
71
—
分析过程
① 求累积次数,由下往上累加或由上往下累加。
② 确定中数位置 N 2
。本例为71,则有 71 35.5。
2
③ 在累积次数栏中找包含35.5的累积次数并确定
2
那个数。
若数据个数(N)为偶数时,则中数为居于中间位
置两个数的平均数
Mdn
1 2
X
N 2
X
N 2
1
2、中数附近有重复数时
有重复数时,需考虑重复数的影响。
例:求11,11,11,11,13,13,13,17, 17的 中数。
第一个13
第二个13
第三个13
12.50
12.833
13.166
13.499
(二)众数的确定方法 1、直接观察法 未分组数据——次数最多的数值 次数分布表——次数最多一组的组中值
2、公式计算法 皮尔逊经验公式:
Mo 3Mdn 2X
金氏(W ·I ·King)插补法:
MO
Lb
fa
i
fa fb
三、平均数、中数与众数三者之间的关系
1、正态分布 均数、中数、众数三个指标值相等,即
X Mdn Mo
2、偏态分布
X Mdn: X Mo 1: 3
Mo 3Mdn 2 X
第三节 加权平均数、几何平均数、调和平均数
一、加权平均数
加权平均数是观测数据(X i )与其相应权数
(f )乘积的和除以总权数( f )所得的
商,用符号 X 表示。 权数是指各变量在构成总体中的相对重要 性,权数的大小,由观测者依据一定的理 论或实践经验而定。计算公式为
(二)计算公式 1、未分组数据计算平均数方法
公式一:X X i N
例3-1:现有一组实验观测数据,25,27,28,27,25,29, 30,34,32,33。计算它们的平均数。
: 解:根据题意,已知N=10,根据公式
X 25 27 ... 33 290AM x' N
27 20 29 10
2、使用次数分布表计算平均数方法
公式一: X f m f
公式二: X AM fd i
N
例3-2:100名学生的数学成绩分布如下,计算平均数。
表3-1 简化平均数计算表
组别 96~ 93~ 90~ 87~ 84~ 81~ 78~ 75~ 72~ 69~ 66~ 63~ 60~
中数为第一个13所在区间的组中值,为12.5+0.33/2=12.66。
2、中数附近有重复数时
有重复数时,需考虑重复数的影响。
例:求11,11,11,11,13,13,13,17, 17的 中数。
12.5-----13.5
12.5---12.83
12.83--13.16
13.16--13.5
12.67
—
7984 28
① 将 fm,N 代入上面第一个公式计算:
X=
fm
N
7984
= 100
=79.84
② 设 AM=79,将 AM, fd,N,i 代入上面第二个公式计算:
X = AM + fd N
×i=79+ 28 ×3=79.84
100
这两个公式计算的结果完全相同,但第二个公式更简便。
二、平均数的特点
m
f
d
fX C
fd
97
2
6
194
12
94
3
5
282
15
91
4
4
364
16
88
8
3
704
24
85
11
2
935
22
82
17
1
1394 17
79
19
0
1501 0
76
14
-1
1064 -14
73
10
-2
730 -20
70
7
-3
490 -21
67
3
-4
201 -12
64
1
-5
64
-5
61
1
-6
61
-6
—
100
X fXi f
例3-4:某课题组在8个省区进行一项调查,各省区的取 样人数和平均分数见下表,求总平均数。
省区代码 1 2 3 4 5 6 7 8