心理统计学第三章 集中量数
第三章集中量数,趋中量数(MeasuresofCentralTendency)
第三章集中量數(或趨中量數)(Measures of Central Tendency)壹、本單元的目標1、解釋集中量數的目的,並說明此量數所傳達的訊息2、計算,說明,及比較眾數(mode)、中位數(median)、以及平均數(mean)的差異3、說明平均數的數學特性4、依照測量尺度及偏態(skew)來選擇適當的集中量數貳、各種集中量數上個單元所介紹的次數分配及圖表等是用來描述資料的整體分配情況。
本單元及下個單元則介紹兩類的描述統計,以進一步瞭解資料整體分配的細節。
這兩類統計能告訴我們以下的資訊是:1、代表此分配之典型或平均狀況的個案為何。
與此有關的描述統計就是各種「集中量數」。
2、此分配之變異或異質性的狀況。
與此有關的描述統計就是各種「離散量數」。
所以,集中量數就是以一個數值來描述樣本資料中,那一個分數或數值是最常見的、站在中間的位置、或最具代表性。
最常見的集中量數有三種,即眾數(Mode)、中位數(Median)、和算術平均數(Mean)。
這三種量數雖有共同的目的,但它們測量資料之集中趨勢(central tendency)的作法卻不同,也傳達不同的訊息。
因此,只有在特定的條件下,這三種量數的數值才會相同。
到底用那一個集中量數和the level of measurement(測量尺度)以及研究之目的有關。
集中量數之使用和測量尺度之關係:Nominal -ModeOrdinal -Mode、Median (也可用Mean,但解釋時要小心)Interval-Ratio -Mode、Median、Mean一、眾數(Mode):是指資料中出現最多的數值。
眾數適用於各種測量尺度。
但當變項為名目尺度時,這是唯一可用的集中量數。
在名目尺度變項,或次數分配表中,眾數是指含件數或次數最多的類別。
眾數雖是最簡單之集中量數,但有缺點:1、有些分配不一定有眾數,換言之,分配很平均時或眾數很多時,眾數即失去意義和功能。
[教育学]心理统计学:绪论_集中量数_图表
心理与教育统计学▪统计学是一种思想方法▪常用统计指标▪概率及概率分布▪抽样分布参数估计参数假设检验▪平均数差异的显著性检验方差分析▪相关分析回归分析▪χ2检验总体比率的推断非参数检验▪抽样设计问题▪某研究机构研制出一种能提高5岁幼儿阅读能力的游戏产品,该产品能在使用3个月之后提高幼儿的阅读能力,请设计一个实验验证这种游戏产品的作用。
——2007年心理学研究生入学试题统计学▪统计学是科学研究的基本技能。
▪统计学不难。
▪立足于自学。
▪从现实中寻找问题,在教材中寻找答案。
方案一▪抽取一组5岁幼儿,前测-游戏-后测。
▪如果成绩提高,说明产品有效。
▪问题:幼儿成熟,阅读水平也会提高。
方案二▪抽取A、B两组5岁幼儿,A组用该产品,B组不用,分别进行前测-游戏-后测。
▪如果两组前测成绩相当,后测A好于B,说明产品有效。
▪问题:前测成绩不等怎么办?方案三▪抽取A、B两组5岁幼儿,A组用该产品,B组不用,分别进行前测-游戏-后测。
▪A组后测成绩-前测成绩(提高幅度)高于B组,说明产品有效。
▪问题:谁能保证分数的差异不是出于随机误差?其他问题▪不能打百分制怎么办?▪及格-不及格▪及格人数-不及格人数▪如果有A、B、C三种产品竞争,如何设计研究方案?▪一次实验就能说明产品一定有效(或无效)吗?▪……统计资料也骗人(1)▪某城市公安局加大对带有黑社会性质的犯罪团伙的侦办力度,2004年共侦破此类案件50起,抓获犯罪嫌疑人800人,而2003年这两个数字分别是5起和100人。
一些人士惊呼:仅仅一年时间,该城市治安形势急剧恶化。
统计资料也骗人(2)▪某城市(人口数1000万)中过去没有禽流感传染给人的病例。
但是2003年出现了2例,2004年出现了4例。
由此可以得出结论:2003—2004年期间,该病发病率增加了100%。
这样的增幅足以令卫生部门和市民忧心忡忡。
统计资料也骗人(3)▪某公司在广告中声称,在过去的10年它销售的汽车中,10辆里面有9辆仍在道路上行驶。
心理统计学第三章
第三章第三章集中量数第一节算术平均数 ................................................. 错误!未定义书签。
第二节中位数 ................................................................. 错误!未定义书签。
第三节众数 ....................................................................... 错误!未定义书签。
第四节几何平均数和倒数平均数............................... 错误!未定义书签。
第五节 SPSS实验——均数、中数和众数...................... 错误!未定义书签。
同步练习与思考题 ............................................................... 错误!未定义书签。
学习目标1.识记和理解各种集中量指标的概念2.熟练掌握各种平均指标的计算方法3.掌握均数、中数和众数应用范围4.了解几何平均数和倒数平均数的应用在实验、测量或调查中获得的大量观测数据,具有一种向数据中央某一点靠拢的趋势,这种趋势在统计学中称为集中趋势(central tendency),它是数据分布的特征之一。
用于描述观测数据集中趋势的量数称为集中量数。
集中量数(central measures)是一组数据的代表值,用以说明一组数据分布的典型情况或一般水平,它比个别数据更能反映客观现象或事物的实际情况。
集中量数还可以用于组与组之间的差异比较。
譬如,某教师在两个平行班进行了传统教学法和多媒体教学的实验研究,通过一年实验后,观测到两个班级的平均成绩之间出现较大的差异。
描述客观现象集中趋势的数量指标有算术平均数、加权平均数、中数、众数、几何平均数和倒数平均数。
统计心理-第三章 集中量数
例。
XT
ni X i ni
加权平均数
例1:某小学三年级举行英语测验。甲班32名学生的平均 分为72.6,乙班40名学生平均分为80.2,丙班36名学生的 平均分为75分。求全年级英语测验的总平均分数。
xwN1xN 11NN 2x22N N 33x3
加权平均数
例2:某课题组在8个省区进行一项调查,各省区的取样 人数和平均分数见下表,求该项调查的总平均数。
2
中数;若数据个数为偶数时,则 X N 2 X N 2 1 2为中 数。
①求数列4,6,7,8,12的中数。 ②有2,3,5,7,8,10,15,19共8个数,求其中数。
(二)中数的计算方法
(2)一组数据中有重复数值的情况
①当重复数值没有位于数列中间时 求数列5,5,6,10,12,15,17的中数。
集中趋势与离中趋势
集中趋势是指数据分布中大量数据向某方向集中 的程度。
集中趋势与离中趋势
集中趋势是指数据分布中大量数据向某方向集中 的程度。
离中趋势是指数据分布中数据彼此分散的程度。 集中量数与差异量数:描述一组数据集中趋势和
离中趋势的统计量,共同描述一组数据的全貌及 统计特征。 测度集中趋势即寻找数据水平的代表值或中心值 集中量数包括算术平均数、中数、众数、加权平 均数、几何平均数、调和平均数等。
Mo3Md2M
第三节 其他集中量数
一、加权平均数 所得数据单位权重不相等时要使用加权平均数。
k
M WW 1X W 1 1W W 2X 22 W W nnXni
1
W
k
i
W
X
i
i
i1
W为权数,指各变量在构成总体中的相对重要性。
第三章集中量数 - 心理统计学!
第一节 算术平均数 第二节 中位数与众数 第三节 加权平均数、几何平均数、调和平均数
第一节 算术平均数
一、概念及计算公式 (一)概念
算术平均数 (mean),是所有观测值(或变量值) 的总和除以总数所得的商。简称平均数、均数或 均值。
符号:样本平均数—— X、M(Mean), 总体平均数——
2、平均数与个体值相结合的原则 3、平均数与标准差、方差相结合的原则
第二节 中位数与众数
一、中数 中位数又称中点数,简称中数,用符号 Mdn
或 Md表示,是位于按一定顺序排列的一组数 中央位置的数值。
中数是一种位置量数。
二、中数的计算
(一)未分组数据的计算
1、中数附近无重复数时
若数据个数(N)为奇数时,中数则为 N 1 位置的
中数所在的组。因为本例累积次数36包含了
35.5,所以中数所在组为75-77。
④ 确定公式中各符号的内容,有
Lb 74.5,Fb 22 ,f Md 14 ,i 3
⑤代入公式计算中数
Md
Lb
i fMd
(N 2
Fb )
74.5 3 (35.5 22) 14
=77.4
二、众数
(一)众数的定义 众数(Mode)是指一群数据中出现次数最多的那 个数值,又称范数,用符号 Mo表示。众数的确定 方法
1、一组变量值的和等于变量的个数与其平均数的乘
积,即 X NX
2、一组变量值的离均差之和等于零,即
X X 0
3、在一组变量值中,每个变量值加上或减去、乘以 或除以常数,所得的平均数等于原平均数减去或
加上,除以或乘以常数 c 。
三、平均数的意义
平均数是应用最普遍的一种集中量数; 是真值渐进、最佳的估计值; 当观测次数无限增加时,算术平均数趋近于真值。
心理统计学第三章集中量数
04 集中量数的计算方法
简单平均数计算方法
总结词
简单平均数是集中量数中最基本的计算方法,它通过将一组数值相加后除以数值 的数量来得出平均值。
详细描述
简单平均数计算公式为 $overline{x} = frac{1}{n} sum_{i=1}^{n} x_i$,其中 $n$ 是数值的数量,$x_i$ 是每一个数值。这种方法适用于数据分布均匀且无异常值的 情况。
对未来研究的展望
01 02
探索新的集中量数
随着数据类型和复杂性的增加,传统的集中量数可能无法满足某些研究 需求。未来研究可以探索新的集中量数,以更准确地描述数据的集中趋 势。
改进现有集中量数的计算方法和性质
现有集中量数的计算方法和性质可能存在一些局限性和不足之处,未来 研究可以尝试改进这些方法和性质,以提高集中量数的准确性和可靠性。
06 总结与展望
总结心理统计学第三章集中量数的要点
集中量数
集中量数是描述数据集中趋势的统计量,用于反映一组 数据的中心位置或典型值。
常见集中量数
常见的集中量数包括算术平均数、中位数和众数等。
算术平均数
算术平均数是所有数值的和除以数值的个数,是最常用 的集中量数之一。它具有线性性和可加性,能够反映数 据的平均水平。
在社集中量数来描述被调查者的社会特征, 例如通过平均年龄和标准差等指标来分析被调查者的社会 经济地位和人口结构。
社会政策制定
政府和社会组织可以利用集中量数来制定社会政策,例如 通过分析不同地区居民的平均收入和收入分布来制定社会 保障政策。
社会问题研究
研究者可以利用集中量数来研究社会问题,例如通过平均 失业率和标准差等指标来分析社会经济不平等和就业状况。
教育与心理统计学第三章:集中量数
几何平均 ①一组数据中有少数数据偏大或偏小,数据的分布呈偏态
数
②需要计算增长比率的平均数等这类问题
调和平均 求平均速率等这类问题 数
课后习题练习
课后作业
思考题与练习题:第4题 作业上交时间:下周上课
1)、当重复数值没有位于数列中间,求中数 的方法与无重复数据时求中数的方法相同
5,5,6,10,12,15,17(N=7) 2)、A、当重复数目位于数列中间,且数据
个数为奇数
11,11,11,11,13,13,13,17,17(N=9) B、当重复数目位于数列中间,且数据个数为
偶数
11,11,11,11,13,13,13,17,17,18
第二节 中数与众数
一、中数
又称中位数,中值,符号为Md或Mdn,按顺序排列在一起 的一组数据中居于中间位置的数。
一、未分组数据 1、无重复数值(先从小到大排序) (1)、数据个数为奇数
4,6, 7, 8, 12 (2)、数据个数为偶数
2 , 3 ,5 , 7 , 8,10 , 15 , 19
2、有重复数值
集中趋势——次中彼此分散的程度。
集中量数——用于描述数据集中程度的统计量 离散量数——用于描述数据离散程度的统计量,(即
数据的变异性)
第一节 算术平均数
算术平均数(arithmetic average)——将所有的数据 相加,再用数据的个数去除数据总和。(即用数据总和 除以数据个数),一般记为
①一组数据中出现两极端数目 ②次数分布的两端数据或个别数据不清楚时 ③需要快速估计一组数据的代表值时
①需要快速而粗略地寻求一组数据的代表值时 ②当一组数据出现不同质的情况 ③当次数分布中有两极端的数目时 ④当粗略估计次数分布的形态时,有时用平均数与众数之 差,作为次数分布是否偏态的指标 ⑤当一组数据的次数分布出现双众数时
第三章集中量数
Mo = 3Mdn− 2 X
M o = Lb +
fa ⋅i fb
9
1
集中量数的选择与应用
一、均数、中数、众数的关系 正态分布时 :
X = Mdn = Mo
数据分布为偏态分布时,
(X − Mdn) : (X − Mo) = 1 : 3
众数、中位数和均值的关系图
均值 中位数 众数 均值 = 中位数 = 众数 众数 中位数 均值
1 1 1 1 1 + + ⋅⋅⋅ + N X1 X 2 XN 1 N = = 1 1 1 ∑ ∑ N X X MH =
17
本章学习要求
这节课你学到了什么知识? ? 这节课你学到了什么知识 ☆ 本章学习要求: 本章学习要求:
理解各集中量数的意义与作用 算术平均数、 算术平均数、加权平均数的计算与应用 集中量数的选择
N 2
Mdn =
+X
N +1 2
6
解:1、排序 例3-6:五名 学生的物理成 绩分别55,64, 89,98,34请问 五名学生的平 均成绩是多 少?
2、 N=5,为奇数 为奇数 3、中数位置=
N +1 2
=3
4、中位数是 中位数是64
例3-7:六架直升飞机的最大速度分别为450km/h、 420km/h、 500km/h 、 530km/h 、600km/h 、1100km/h,请问平均速 度是多少?
X =
∑
Xi
N
3
例3-1:10名学生的心理与教育 统计成绩为68,77,63,79, 70,79,70,79,86,80。 试问这组数的平均数为多少? 试问这组数的平均数为多少?
心理与教育统计学第3章 集中量数
(3.9b)
公式中:La为中位数所在组的精确上限 fa为中位数所在组上限以上的累积频数 n为数据总数 fMd为中位数所在组的频数 i为组距
表3-7 52名学生数学成绩中位数计算表
成绩 95 90 85 80 75 70 65 60 55 50 45
合计
频数f 2 2 3 5 8 11 9 5 4 2 1 52
次数分布表计算平均数的基本公式:
f1 X C1 f 2 X C 2 f k X Ck X f1 f 2 f k
f
j 1 k j 1
k
j
X Cj
j
1 X fX C N
f
(3.3)
N f f1 f 2 f k
Xc 为分组区间的组中值 f 为各组次数
正态分布的3σ准则
3.1.5 计算和应用算术平均数的 原则
• 同质性原则:算术平均数只能用于表 示同类数据的集中趋势。 • 平均数与个体数值相结合的原则:在 解释个体特征时,既要看平均数,也 要结合个体的数据。 • 平均数与标准差、方差相结合原则: 描述一组数据时既要分析其集中趋势, 也要分析离散程度。
n i Md Lb f b 2 f Md
(3.9a)
公式中:Lb为中位数所在组的精确下限 fb为中位数所在组下限以下的累积频数 n为数据总和 fMd为中位数所在组的频数 i为组距
由上至下累积频数计算公式
n i Md La f a 2 f Md
3.2.2 次数分布表计算中数
• 由次数分布表计算中位数需要用到 累积次数分布表。 • 当表中数据的累积方向不同时,计 算公式也不同。
表3-6 52名学生数学成绩次数分布表
统计学 第3章集中量数
MW
W1 X1 W2 X 2 W1 W2
72 4 86 6 46
80.4
3、计算方法
3)加权算数平均数(weighted mean)的计算:
用M W 表示
如高考的标准分换算法。 研究生入学考试总分不一样。 P69例3-7
3、计算方法
4)使用次数分布表计算平均数:
与无重复数据时求中数的方法相同; 当中间的数值为重复数时:可将重复数看
作一个连续区间,然后根据中间数在区间 内的位置来确定中位数。
3、计算方法
2)一组数据中有重复数据 当重复数值没有位于数列中间时,求中数
与无重复数据时求中数的方法相同; 当中间的数值为重复数时:可将重复数看
作一个连续区间,然后根据中间数在区间 内的位置来确定中位数。
例如:P70 例3-8
2、几何平均数的应用
2)应用几何平均数的变式计算: 一组数据彼此间变异较大,几乎按一定的比 例关系变化,所要求的不是平均数,而是平 均增长率。平均增长率=平均发展速度-1
学习方面的进步率 学生或人口增加率 教育经费增加率
本章主要内容
一.算术平均数 二.中数 三.众数 四.平均数、中数、众数三者之间的关系 五.加权平均数 六.几何平均数 七.调和平均数
平均数
中数
众数
① 感应灵敏② 严密确 ③④
定③ 意义简明,易理
于
优 点
解④ 容易计算⑤ 适合
代数法的处理⑥ 少受
抽
③④
样变动的影响
1.加权平均数 2.离差、相关计算 应 3、统计推断 用
1.有极端数值时 2.模糊数据时 3.快速估计集中
量数时
1.有极端数值时 2、数据不同质时 3、粗略估计数据的
心理统计学》重要知识点
《心理统计学》重要知识点第二章 统计图表简单次数分布表的编制:Excel 数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。
条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。
简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。
复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。
圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。
线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;第三章 集中量数● 集中趋势和离中趋势是数据分布的两个基本特征。
● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。
● 集中量数:描述数据分布集中趋势的统计量数。
● 离中趋势:是指数据分布中数据分散的程度。
● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):nx X i∑= Excel 统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。
中位数上下的数据出现次数各占50%。
3.众数(mode ,M O ):一组数据中出现次数最多的数据。
4.算术平均数、中数、众数之间的关系。
统计学 第三章 集中趋势的测量
第三章集中趋势的测量表示数据集中趋势的指标叫做集中量数,它是一组数据的代表值。
集中量数比起个别数据来,更能准确地反映所研究的事物和现象的真实情况,是真值最好的估计值。
当要用一个数值代表全部数据时,或两组数据要进行比较时,就要用到集中量数。
常用的集中量数有三种:平均数,中数,众数。
第一节平均数平均数通常是指算术平均数, 只有在需要与其它平均数相区别时,才使用算术平均数这一名称。
图3-1 集中量数在不同分布中的位置一、算术平均数算术平均数(Mean)符号X。
是集中趋势的重要指标。
如果数据的分布形态是正态分布,算术平均数的位置处于正态分布曲线的中间,位于对称轴上(图3-1上)。
在偏态分布中总处于曲线偏斜的一端(图3-1下)。
只有当数据相对集中,并且数据中没有极端数值的时候,平均数才具有代表性,才适合使用平均数表示集中趋势。
1.未分组数据的计算计算未分组数据的平均数,是用全部数据的和除以数据个数。
所得的值为整组数据的代表。
数据少时使用计算器较为方便。
平均数的计算公式:N XX ∑=(3.1)式中,X :原始数据;Σ:求和符号(希腊字母,读:sigma ),表示将所有的数据都加起来;N :数据个数;2.分组数据的计算当数据较多,或需要了解数据的分布形态已将数据分组后,可利用已列好的次数分布表计算平均数。
N X f X '∑=(3.2) 式中,f :各小组的数据个数;X’:各小组中数;Σ:和号; N :数据总个数。
例题3-2:一项心理测验成绩得出的次数分布表如下,请求出平均成绩。
表3-1 心理测验成绩 分数 X ’ F FX ’ 35-39 37 5 185 30-34 32 12 384 25-29 27 20 540 20-24 22 27 594 15-19 17 25 425 10-14 12 19 228 5 – 9 7 7 49 Σ/1152405计算步骤:(1)在表中求出各组次数与各组中点的乘积列fX’列。
集中量数
X
C
fX
C
用原始数据及根据次数分布表计算的平均数,在数 值上有少许差异,但并不影响以后的统计分析。
某次考试成绩数据已经处理为次数图,根据次数图,求该成绩的平均值? 分组区间 XC组中值 f频数 96~ 97 2 fXC 194 d 6 fd 12 AM=79
93~
90~ 87~ 84~ 81~ i=3
N 1 2
N 2
N
1
2
②一组数据中有重复数值的情况 ⑴当重复数值没有位于数列中间时,方法与 无重复数据时相同。 ⑵重复数目位于数列中间,数据的个数为奇 数的情形。 ⑶重复数目位于数列中间,数据个数为偶数 情形。
例1:求数据5、6、5、12、10、15、17的中数。 解:先将数据按小到大的顺序排列: 5、5、6、10、12、15、17 一共七个数据,(7+1)/2=4 所以中数为10 例2:求数据11、11、11、11、13、13、13、17、17的中数。
b
式中 :L
表3-3 利用公式求分组次数表中中数
组限
65— 60— 55— 50— 45— 40— 35—
次数
3 4 11 13 8 6 3
自上而下累 自下而上 积次数 累积次数
i N Md L b Fb f 2 5 48 49.5 17 13 2 52 . 1 9 i N Md L a Fa f 2 5 48 5 4.5 18 13 2 52 . 1 9
X AM
X
N
式中:
X X i AM
AM为估计平均数 N为数据个数 估计平均数的大小,可根据数据表面值的大小任 意设定,但其值越接近平均数计算越简便。
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](集中量数)
第3章集中量数1.应用算术平均数表示集中趋势要注意什么问题?答:在应用算术平均数表示几种趋势时,要注意:①算术平均数易受两极端数值(极大或极小)的影响。
②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。
如果不处理好这两个问题,那么算术平均数将无法表示集中趋势。
2.中数,众数,几何平均数,调和平均数各适用于心理与教育研究中的哪些资料?答:中数的适用条件:①当一组观测结果中出现两个极端数目时;②当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值;③当需要快速估计一组数据的代表值时,也常用中数。
众数的适用条件:①当需要快速而粗略地寻求一组数现代心理与教育统计学据的代表值时;②当一组数据出现不同质的情况时,可用众数表示典型情况,如工资收入、学生成绩等常以次数最多者为代表值;③当次数分布中有两极端的数目时,除了一般用中数外,有时也用众数;④当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标;⑤当一组数据中同时有两个数值的次数都比较多时,即次数分布中出现双众数时,也多用众数来表示数据分布形态。
几何平均数的适用资料:当要计算教育经费增加率、学习方面的进步率和学生或人口增加率的估计时,可使用几何平均数。
调和平均数的适用资料:在心理与教育研究方面的应用,主要是用来描述学习速度方面的问题。
调和平均数作为一种集中量数,在描述速度方面的集中趋势时,优于其他集中量数。
在有关研究学习速度的实验设计中,反应指标一般常取两种形式:一是工作量固定,记录各被试完成相同工作所用的时间。
二是学习时间一定,记录一定时间内各被试完成的工作量。
由于反应指标不同,在计算学习速度时也不一样,这是应用调和平均数要特别注意的地方。
3.对于下列数据,使用何种集中量数表示集中趋势其代表性更好?并计算它们的值。
(1)4 5 6 6 7 29(2)3 4 5 5 7 5(3)2 3 5 6 7 8 9答:(1)中数6,因为题目中有极端数据,不适合用算术平均数。
第三章 集中量数
( xi x )
2
( xi c)
2
3、所有的观测值都加上常数C,则平均值也增加常数C
1 N
(x
i
c) x c
4、所有观测值都乘以不等于0的常数C,则平均值也增大C倍
1 N
(c x
i
) cx y) x y
5
1 N
(x
平均数的优缺点 优点:1.反映灵敏 2.计算严密 3.计算简单 4.简明易解 5.适合于进一步用代数方法演算 6.较少受抽样变动的影响 缺点:1.易受极端数据的影响 2.若出现模糊不清的数据时 ,无法计 算平均数
解:这里的数据为顺 序数据。变量为“回 答类别”
甲城市中对住房 表示不满意的户数最 多,为 108 户,因此 众数为“不满意”这 一类别,即 Mo=不满意
合计
300
100.0
众数的意义与应用 ( 1 )当需要快速而粗略地寻求一组数据的 代表值时 ( 2 )当一组数据出现不同质的情况时,可 用众数表示典型情况 ( 3 )当次数分布中有两极端的数目,除了 一般用中数外,有时也用众数 ( 4 )当粗略估计次数分布的形态时,有时 用平均数与众数之差,作为表示次数分布是否 偏态的指标
x 1 N
x 79.8
(2)分组数据的计算方法
(组中值计算法)
分组区间
9590858075706560555045-
次数(f)
6 5 7 7 7 8 3 2 0 2 1
组中值(Xc)
97 92 87 82 77 72 67 62 57 52 47
N=48
方法:把组中值看成每一分组的平均数
顺序数据的中位数
心理统计学-课程讲义3
【课程讲义】第三章集中量数【教学目标】明确一批数据的特征包括两个方面的内容:集中趋势、离散性;明确集中量数是描述数据集中趋势的量数,可以作为一批数据的代表值;明确算术平均数是所有集中量数中运用最广泛、最优的量数;明确各种集中量数的含义、计算方法、使用条件、性质及优缺点。
【学习方法】了解、理解、计算与应用。
【重点难点】算术平均数的概念及适用条件;算术平均数的计算方法;中位数的概念及适用条件;中位数的计算方法。
【讲义内容】前一章所讲的统计分组、统计表、统计图等,只是对研究工作中所获得的数据进行初步整理,其目的是对数据的性质、分布特征、差异情况及数据的一般规律有一直观和形象的认识。
因此说这一步还不是应用统计方法的步骤。
为了进一步发现和表示一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字——称为统计量或特征数。
对于一组数据来讲,最常用的统计量有两类。
一类是表现数据集中性质或集中程度的,另一类是表现数据分散性质或分散程度的。
数据的集中情况指一组数据的中心位置。
集中趋势的度量,即确定一组数据的代表值。
描述数据集中情况的统计量有多种,包括算术平均数、中数、几何平均数等。
由于这些统计量的作用在于度量数据的集中趋势,因此它们都称为集中量数。
本章主要介绍几种常用的集中量数。
集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。
数据除典型情况之外,还有变异性的特点。
对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有方差、标准差、全距、平均差、四分差及各种百分差等等,下一章中将对常用的差异量数进行介绍。
第一节 算术平均数一、算术平均数的概念和适用条件(一)概念算术平均数一般简称为平均数或均数(Mean )。
只有在与其他几种集中量数如几何平均数、加权平均数相区别的时候,才把它叫做算术平均数。
如果平均数是由X 变量计算的,就记为X (读作X 杠),若由Y 变量求得,则记为Y 。
第三章集中量数ppt课件
ana01xn
例5.某高校1980年—1985年在校生人数如表3— 4。求年平均增长率。
解:
①先求逐年发展速度 。用每一年与其上一年量值的
环比求出逐年的发展速度列入表3—4的第3列。 ②计算平均发展速度 。将表中第3列数据代入公式
〔3.6〕得: MG n X1X2X3Xn
51.120.901.051.161.22
第三节、几何平均数
一、概念
N个数值的连乘积的 N次方根,称为几何平均 数,用符号 M G 表示。几何平均数也是平均数的 一种,如果一组数据值按比例递增或递减,表示 其平均水平时应使用几何平均数。几何平均数一 般用于计算平均发展速度、平均增长速率等统计 指标。
二、计算公式
几何平均数的计算公式为:
M GnX1X2X3 Xn (3.6)
第三章 集中量数
第一节 算术平均数 一、概念
二、计算方法 三、加权算术平均数 四、算术平均数的性质
第二节 中位数 中位数的计算方法 第三节 几何平均数
描述一组数据集中趋势的量数,称为集中量 数。
集中量数是统计总体各统计事项某一数量标 志的代表值,它概括说明总体某一数量标志的 综合特征,反映研究对象在一定时间、地点、 条件下的一般水平。
解:
(1〕求平均发展速度 , 由公式〔3.7)。
MG n
an a0
4 1251.2223 56
(2〕计算平均增长率 , 由公式〔3.8〕得
x' M G 1 1 .22 2 1 3 0 .2223
即年平均增长率为22.23%。
(3〕计算2019年该小学的教学设备数 。知
求 n 6,
a6 ?
由公式〔3.9〕得
=8。
再如,一组数值为N4、158、71、98、41.50、12、
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有重复数时,需考虑重复数的影响。
例:求11,11,11,11,13,13,13,17, 17的中 数。
分析:N=9,中间位置为5,第5个数为13。
但是数据中有3个13,需要重新考虑。
有3个13,意味着3个13占了一个单位。
第五位的13 ,中数计算(12.5+12.83) /2=12.665
或者12.5+1/3*1/2=12.666
例题3-4 计算加权平均数
省区代码 1 2 3 4 5 6 7 8
人数 平均分数
627
98
268
60
400
82
670
96
411
80
314
65
610
96
500
88
3800
665
解:
62798 268 60 50088
MW
3800
330496 86.97 3800
例题3-5 课堂练习
大。
练习
P79 5-6(10分钟)
第二节 中数与众数
一、中数 中位数又称中点数,中位数,中值,简称中数,用符
号Md 或Mdn表示,是位于按一定顺序排列的一组数 中央位置的数值。 中数是一种位置量数。 能将数据分成较大的一半和较小的一半。
(一)未分组数据的中数计算
1.中数附近无重复数时 若数据个数(N)为奇数时,中数则为(N+1)/2
2.众数的计算 (1)直接观察法 未分组数据——次数最多的数值 次数分布表——次数最多一组的组中值
例题3-3 计算众数
组别 81~ 78~ 75~ 72~ 69~ 66~ 63~ 60~
f
向上累加次数
17
71
19
54
14
36
10
22
7
12
3
5
1
2
1
1
71
—
(2)公式计算法 皮尔逊经验公式(需要记住)
2.缺点:容易受极端数据影响;如果出现模糊不清的 数据,无法使用。
试计算以下两列数据的平均数: 1,1,2,1,3,1,2,1,3 1,1,2,1,3,1,2,1,3,100
请思考
1出现极端数据该怎么处理? 修剪平均数——截尾平均数,从一组数据中去除一定
百分比(5%)的最大值和最小值,再次计算平均值 2出现模糊数据怎么处理? 一般用中数代替,描述其集中趋势
n
10
10
解法2: 先设定一个估计平均数AM=27,求x=Xi—AM的值。
Xi 25 27 28 27 25 29 30 34 32 33 x -2 0 1 0 -2 2 3 7 5 6
xi 2 0 1 0 2 2 3 7 5 6 20
X AM xi 27 20 29
注意
在报告平均数的时候需要注意加单位——数字加单位。 书写时,习惯上均数保留的小数位数要比原来测量值 多一位数字。
五、计算和应用平均数的原则
1.同质性原则——同质数据:使用同一个观测手段, 采用相同的观测标准,能反映某一问题的同一方面特 质的数据
比如考试成绩平均数,或者某个团体内的工资水平 2.平均数与个体值相结合的原则 3.平均数与标准差、方差相结合的原则 数据差异大,平均数的代表性就小;反之,其代表性
4.把符号各值带入公式
Md
Lb
(
N 2
Fb
fMd
)
i
74.5 (35.5 22) 3 14
77.4
如果是向下累加呢?
请把课后习题第4题进行向下累加,并计算其中数。
中数的优缺点
计算简单,容易理解,概念明了 缺点:不考虑每一个数据,大小不受制于全体数据,
反应不灵活,尤其对极端值反应不敏感;计算时需要 先排序;中数与总数相乘不等于数据总和;不能进一 步代数运算。 注意:出现极端数值时,用中数较好;当次数分布的 两端数据或个别数据不清晰时,用中数;当需要快速 估计一组数据的代表值时,用中数。
例题3-3 计算中数
组别 81~ 78~ 75~ 72~ 69~ 66~ 63~ 60~
f
向上累加次数
17
71
19
54
14
36
10
22
7
12
3
5
1
2
1
1
71
—
解:
1.确定中数位置N/2 。本例为71,则有35.5 。 2.在累积次数栏中找包含35.5的累积次数并确定中数
所在的组。因为本例累积次数36包含了35.5,所以中 数所在组为75-77。 3.数据时由下向上累加,确定公式中各符号的内容: Lb=74.5,Fb=22,Fmd=14,i=3
(二)计算公式
1、未分组数据计算平均数方法
公式一: X X i N
公式二: X AM x' N
例题3-1
现有一组实验观测数据,25,27,28,27,25,29, 30,34,32,33。计算它们的平均数。
解法1: 根据题意,已知N=10,根据公式:
X X i 25 27 ... 33 290 29
Md
Lb
(
N 2
Fb )
fMd
i
Lb为中数所在组区间的精确下限
Fb为该组以下各组的累加次数
N为分组数据的样本容量
i为组距
2.用于由高分组向低分组累积次数时
Md
La
(N 2
Fa ) i
f Md
La为中数所在组区间的精确上限
Fa为该组以上各组的累加次数 N为分组数据的样本容量
i为组距
Mo 3Md 2X
金氏(W ·I ·King)插补法(了解即可)
MO
Lb
fa
i
fa fb
三、平均数、中数与众数三者之间的关系
1.正态分布
Md Mo X
2.偏态分布
Mo 3Md 2X
平均数小于众数,称为负偏态;平均数大于 众数,称为正偏态。
在偏态分布中,平均数永远位于尾端。 中位数 位于把分布下的面积分成两等份的点上。 报告正态分布时只需报告平均数。 报告偏态分布时应报告平均数和中数。 一般偏态情况下,Md离均数较近,离众数较远,三
首先分别求每分钟的词汇量30/15=2;30/10=3; 然后带入公式
MH
1 1(1
1)
2.4
22 3
作业
P75两个例题 P77自学spss计算集中量数 P78 1-6 8
者关系如下:Mo=3Md-2M
第三节 其他平均数
一、加权平均数
加权平均数是观测数据(Xi)与其相应权数(W)乘 积的和除以总权数(W1+W2+……+Wn)所得的商, 用符号Mw表示。
权数是指各变量在构成总体中的相对重要性,权数 的大小,由观测者依据一定的理论或实践经验而定。
MW
W1 X1 W2 X 2 Wn X n W1 W2 Wn
以1,2,3,4,5,6这组数据为例,对上述平均数 的性质进行说明。
三、平均数的意义
1.平均数是应用最普遍的一种集中量数; 2.是真值渐进、最佳的估计值; 3.当观测次数无限增加时,算术平均数趋近于真值。
四、平均数的优缺点
1.优点:反应灵敏;计算严密;计算简单;简明容易 理解;适合进一步代数运算、较少受抽样变动的影响。
解:
12.5 12.83 13.16 13.5
12
位置为5
13
位置为6
14
位置为7
如果是偶数呢?
11, 13,11, 17,11, ,1811, 13, 17 , 13 请计算以上数列的中数。
请记住,不管有没有重复数据,第一步是排序
(二)分组数据的计算
1.用于由低分组向高分组累积次数时
位置的那个数,即X(N+1)/2 。 1,2,3,4,5,6,7 若数据个数(N)为偶数时,则中数为居于中间
位置两个数的平均数[XN/2+XN/2+1]/2。 1,2,3,4,5,6,7,8
练习
12, 7, 6,8, 4 2,3,5,8,7,19,15,10
注意:第一步,要排序
2、中数附近有重复数时
n
10
2.分组数据计算平均数方法
公式一:
X
f XC
f
公式二: X AM
f d i
n
例题3-2 计算下列数据的平均数
组别 96~ 93~ 90~ 87~ 84~ 81~ 78~ 75~ 72~ 69~ 66~ 63~ 60~
XC
f
d
97
2
6
பைடு நூலகம்
94
3
5
91
4
4
88
8
3
85
11
2
82
17
1
79
19
0
76
14
-1
73
10
-2
70
7
-3
67
3
-4
64
1
-5
61
1
-6
—
100
—
fX C
fd
194
12
282
15
364
16
704
24
935
22
1394 17 1501 0
1064 -14
730 -20 490 -21
201 -12
64
-5
61
-6
7984 28
解法1:
X f XC f
97 2 943 611 2 3 4 8 11 1
内容概要
第一节 算数平均数 第二节 中数与众数 第三节 其他集中量数