第三章集中量数和离中量数

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(3)用观察法得到的众数,不是经过严格 用观察法得到的众数, 计算而来, 计算而来,用公式计算所得众数亦只是一个 估计值。 估计值。 (4)众数不能作进一步代数运算。 众数不能作进一步代数运算。 (5)总数乘以众数,也与数据的总和不相 总数乘以众数, 等。 由此可见,众数不是一个优良的集中量数, 由此可见,众数不是一个优良的集中量数, 应用也不广泛。 应用也不广泛。
例:通过同一个测验,一年级(7岁)学生的平均分数 通过同一个测验,一年级(7岁 (7 为60分,标准差为4.02分,五年级(11岁)学生的 60分 标准差为4.02分 五年级(11岁 4.02 (11 平均分数为80分 标准差为6.04分 平均分数为80分,标准差为6.04分,问这两个年 80 6.04 级的测验分数中哪一个分散程度大? 级的测验分数中哪一个分散程度大?
差异量数的形式有很多种,但最主要的 也是最常用的就是方差和标准差。
一、方差与标准差的计算
方差也称均方。作为样本统计量用符号s 方差也称均方。作为样本统计量用符号s2表 作为总体参数用符号σ 表示。它是每 示,作为总体参数用符号σ2表示。它是每 个数据与该组数据平均数之差乘方后的均 即离均差平方后的平均数。 值,即离均差平方后的平均数。
③在一组数据中,每一个数都乘以一个常数C所得的 在一组数据中,每一个数都乘以一个常数C 平均数为原来的平均数乘以常数C 平均数为原来的平均数乘以常数C。

平均数的这些特点或性质, 平均数的这些特点或性质,在推演其他一些统计 公式中,经常使用。 公式中,经常使用。
三、算术平均数的优缺点
反应灵敏。 1. 反应灵敏。观测数据中的任何一个数值或 大或小的变化,都能反应出来。 大或小的变化,都能反应出来。 25 27 28 27 25 29 30 34 32 33
二、众数
• 众数:数据中出现次数最多的数 众数: (一)计算众数的方法 1.直接观察求众数 2、3、5、3、4、3、6 数据整理成次数分布表后, 数据整理成次数分布表后,观察次数最多 的那个分组区间的组中值为众数。 的那个分组区间的组中值为众数。
2.用公式求众数(数理众数) 用公式求众数(数理众数)
复习: 复习: 平均数、中数、 平均数、中数、众数
第三节 差异量数
差异量数是表示观测数据之间差异程度 变异性) 的一种统计量数, ( 变异性 ) 的一种统计量数 , 它表示了一 组数据的离散情况或离中趋势 。 组数据的 离散情况或离中趋势。 对于一组 离散情况或离中趋势 数据, 我们除了要知道它的集中趋势, 数据 , 我们除了要知道它的集中趋势 , 还 要了解这些数据的差异程度, 要了解这些数据的差异程度 , 从整体上进 行把握。 行把握。
在下述情况下,则会经常应用众数: 在下述情况下,则会经常应用众数: ①当需要快速而粗略地寻求一组数据的代 表值时; 表值时; ②当一组数据出现不同质的情况时,可用 当一组数据出现不同质的情况时, 众数表示典型情况,如工资收入、 众数表示典型情况,如工资收入、学生成绩 等常以次数最多者为代表值; 等常以次数最多者为代表值; ③当次数分布中有两极端的数目时,除了 当次数分布中有两极端的数目时, 一般用中数外,有时也用众数; 一般用中数外,有时也用众数;
2.频数分布表计算法: 2.频数分布表计算法:若一组原始数据已 频数分布表计算法 经编成了频数分布表,可用内插法, 经编成了频数分布表,可用内插法,通过 频数分布表计算中位数。 频数分布表计算中位数。
(三)中数的优缺点与应用 1.优点 中数计算简单,容易理解, 优点: 1.优点:中数计算简单,容易理解,中数的概念 简单明白。 简单明白。 2.不足 不足: 2.不足: 1)中数的计算不是每个数据都加入 中数的计算不是每个数据都加入, (1)中数的计算不是每个数据都加入,其大小不受 制于全体数据; 制于全体数据; (2)反应不够灵敏 反应不够灵敏, (2)反应不够灵敏,极端值的变化对中数不产生影 响; 计算下列数据平均数: 计算下列数据平均数: 4 5 6 6 7 29
标准差: deviation), 标准差:(standard deviation),即方差的 平方根, SD表示 平方根,用s或SD表示
二、方差与标准差的性质与意义
• 方差是对一组数据中各种变异的总和的测 方差是对一组数据中各种变异的总和的测 具有可加性 可分解性特点 可加性和 特点。 量,具有可加性和可分解性特点。 • 意义: 方差与标准差是表示一组数据离散 意义: 程度的最好指标。 程度的最好指标。其值越大说明次数分布 的离散程度越大,该组数据较分散。 的离散程度越大,该组数据较分散。
在一些特殊情况下,可以使用中数: 在一些特殊情况下,可以使用中数: ①当一组观测结果中出现两个极端数目时。 当一组观测结果中出现两个极端数目时。 ②当次数分布的两端数据或个别数据不清楚 时,只能取中数作为集中趋势的代表值。 只能取中数作为集中趋势的代表值。 ③当需要快速估计一组数据的代表值时,也 当需要快速估计一组数据的代表值时, 常用中数。 常用中数。
三、方差与标准差的优点: 方差与标准差的优点:
• • • • • • 反应灵敏 计算公式严密确定 容易计算 适合代数运算 受抽样变动影响小 简单明了
四、标准差的应用
(一)差异系数: 差异系数:
• 同一团体不同观测值离散程度的比较 • 对于水平相差较大,但进行的是同一观测 对于水平相差较大, 的各种团体离散程度的比较
25 27 28 27 25 29 30 34 32 93
三、算术平均数的优缺点
计算严密。只要是同一组数据, 2. 计算严密。只要是同一组数据,任何人在 任何情况下计算出来的平均数都相同。 任何情况下计算出来的平均数都相同。 计算简单。 3. 计算简单。 简明易解。 4. 简明易解。
适合做进一步代数演算。 5. 适合做进一步代数演算。在求解其他统计特征如 方差、标准差时,都需要应用平均数。 方差、标准差时,都需要应用平均数。 较少受抽样变动的影响。 6. 较少受抽样变动的影响 。 观测样本的大小或个体 的变化,对计算平均数影响很小。 的变化 , 对计算平均数影响很小 。 在来自同一总 体逐个样本的集中量数中, 体逐个样本的集中量数中 , 平均数的波动通常小 于其他量数的波动,因此,它是最可靠的量数。 于其他量数的波动,因此,它是最可靠的量数。
(3)中数受抽样影响较大,不如平均数稳定; (3)中数受抽样影响较大,不如平均数稳定; 中数受抽样影响较大 (4)计算时需要对数据先排列大小 计算时需要对数据先排列大小; (4)计算时需要对数据先排列大小; (5)中数乘以总数与数据的总和不相等 中数乘以总数与数据的总和不相等( (5)中数乘以总数与数据的总和不相等(中数 等于平均数时例外) 等于平均数时例外); (6)中数不能作进一步代数运算 中数不能作进一步代数运算。 (6)中数不能作进一步代数运算。 因此,在一般情况下,中数不被普遍应用。 因此,在一般情况下,中数不被普遍应用。
算术平均数应用原则 算术平均数应用原则
平均数与个体数值相结合。 2. 平均数与个体数值相结合 。 平均数作为整 个总体的综合特征, 个总体的综合特征 , 它能够用一个抽象的 代表数值反映客观事物的一般水平。 代表数值反映客观事物的一般水平 。 但一 个总体是由若干个千差万别的个别事物构 成的, 成的 , 若要全面而正确地认识这些客观事 仅仅靠平均数是不够的。 就总体而言, 物 , 仅仅靠平均数是不够的 。 就总体而言 , 差别会相互抵消, 差别会相互抵消 , 它往往会淹没个体之间 的差异,但就个体而言却不是这样。 的差异,但就个体而言却不是这样。 平均数与标准差、方差相结合原则。 3.平均数与标准差、方差相结合原则。
(二)标准分数
• 标准分数(Z分数),标准分数就是以标准 标准分数( 分数),标准分数就是 分数),标准分数就是以标准 差为单位, 差为单位,表示一个原始分数在团体中所 相对位置的量数 的量数。 处相对位置的量数。
这种方法较复杂, 这种方法较复杂,一般在心理与教 育统计中很少应用。 育统计中很少应用。
(二)众数的意义与应用 1.优点:众数的概念简单明了, 1.优点:众数的概念简单明了,容易理解 优点 2.缺点: 2.缺点: 缺点 (1)不稳定,受分组影响,亦受样本变动 不稳定,受分组影响, 影响。 影响。 (2)计算时不需每一个数据都加入,因而 计算时不需每一个数据都加入, 较少受极端数目的影响,反应不够灵敏。 较少受极端数目的影响,反应不够灵敏。
算术平均数的缺点
易受极端数据影响。 由于平均数反应灵敏, 1. 易受极端数据影响 。 由于平均数反应灵敏 , 因此当数据分布呈偏态时, 受极值的影响, 因此当数据分布呈偏态时 , 受极值的影响 , 平均数就不能恰当地描述分布的真实情况。 平均数就不能恰当地描述分布的真实情况 。 2.若出现模糊不清的数据时 若出现模糊不清的数据时, 2.若出现模糊不清的数据时,无法计算平均 数。 如:计算下列数据平均数: 计算下列数据平均数: 4 5 6 6 7 29
应用差异系数比较相对差异大小时,应注意: 应用差异系数比较相对差异大小时,应注意: 第一,测量的数据要保证具有等距尺度, 第一,测量的数据要保证具有等距尺度,这时计算 的平均数和标准差才有意义,应用差异系数进行 的平均数和标准差才有意义, 比较也才有意义。 比较也才有意义。 第二,观测工具应具备绝对零,这时应用差异系数 第二,观测工具应具备绝对零, 去比较分散程度效果才更好。 去比较分散程度效果才更好。 第三,差异系数只能用于一般的相对差异量的描述, 第三,差异系数只能用于一般的相对差异量的描述, 至今尚无有效的假设检验方法, 至今尚无有效的假设检验方法,因此对差异系数 不能进行统计推论。 不能进行统计推论。
千克, 例:已知某小学一年级学生的平均体重为25千克, 已知某小学一年级学生的平均体重为 千克 标准差为3.7千克 平均身高110厘米,标准差为 千克; 厘米, 标准差为 千克;平均身高 厘米 6.2厘米,问体重与身高的离散程度哪个大? 厘米, 厘米 问体重与身高的离散程度哪个大? 解:
体重的分散程度比身高大
算术平均数应用原则 算术平均数应用原则
同质性原则。 1. 同质性原则 。 平均数只有在总体是由同类 数据所组成且有足够多的数据单位时, 数据所组成且有足够多的数据单位时 , 才 具有科学价值和认识意义。 具有科学价值和认识意义 。 不同质的数据 不能计算平均数。 不能计算平均数。 所谓同质数据 是指使用同一个观测手段, 同质数据是指使用同一个观测手段 所谓 同质数据 是指使用同一个观测手段 , 采 用相同的观测标准, 用相同的观测标准 , 能反映某一问题的同 一方面特征的数据。 一方面特征的数据。 数学、 如:数学、语文的平均数排名
第二节 中数和众数
一、中数(Md) 中数( (一)概念:中位数是位于依一定顺序排列 概念: 的一组数据中央位置的数值,在这一数值上、 的一组数据中央位置的数值,在这一数值上、 下各有一半频数分布着。 下各有一半频数分布着。
(二)中位数的计算方法
1.原始数值计算方法 原始数值计算方法:将一组原始数据依大小顺 原始数值计算方法 序排列后,若总频数为奇数,就以位于中央的数 据作为中位数;若总频数为偶数,则以最中间的 两个数据的算术平均数作为中位数。
第三章 集中趋势与 离中趋势的度量
第一节
集中量数
一、算术平均数 二、中数和众数 三、其他集中量数
ቤተ መጻሕፍቲ ባይዱ
第二节
差异量数
第一节 算术平均数
一、算术平均数:所有观测值的总和除以观测 算术平均数 所有观测值的总和除以观测 值的个数所得的商。 值的个数所得的商。 计算:
二、算术平均数的特点
①在一组数据中每个变量与平均数之差(称为 在一组数据中每个变量与平均数之差( 离均差)的总和等于0 离均差)的总和等于0。 25 27 28 27 25 29 30 34 32 33 ②在一组数据中,每一个数都加上一常数C, 在一组数据中,每一个数都加上一常数C 则所得的平均数为原来的平均数加常数C 则所得的平均数为原来的平均数加常数C。
相关文档
最新文档