第三章 集中量数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• (2)分组数据
N / 2 − Fb Md = Lb + *i f Md N / 2 − Fa = La − *i f Md Lb中数所在组的精确下限 , Fb为该组以下各组的累加 次数, i为组距, La中数所在组的精确上限 , Fa为该组以上各组的累加 次数。
• 特点 • 计算简单、容易理解,不受极端数据的 影响; • 根据数据的相对位置决定,有较大的抽 样误差,不及平均数稳定,反应不灵敏; • 不能作进一步的代数运算。(在一般情 况下不被采用)
∑n x ∑n
i i
i
训练:某校一些班级某次英语考试的平均分分别为 、 训练:某校一些班级某次英语考试的平均分分别为78、 85、67、90、95,其人数依次为 、48、45、62、40,求该次 、 、 、 ,其人数依次为56、 、 、 、 , 某校英语考试的平均分。 某校英语考试的平均分
3.算术平均数的性质及应用特点
学会生 词 30 30 所用 时间 15分钟 10分钟 平均每分钟 学会生词Xi 30÷15=2 30÷10=3 N=2 代入公式得:
MH =
1 = 2.4 1 1 1 + 2 2 3
:
即该生平均每分钟学会生词2.4个
2学习任务的时间相同工作量不同,也先求单位时间的工作量再代入公式计算 学习任务的时间相同工作量不同, 学习任务的时间相同工作量不同 例2:一个学习实验的结果见表
• 算术平均数的性质 • ①一列数据中每一个数与平均数之差(称为离 均差)的总和等于0。
(x1 −x) +(x2 −x) +L+(xn −x) =(x1 + x2 +L+ xn) −nx =∑xi −nx =0
• ②给一列数据中的每一个数加上一个常数C, 则所得到的新数组的平均数为原来数组的平均 数加上常数C。
第三章 集中量数
• 【教学目标】理解各种集中量数的含义、性 教学目标】理解各种集中量数的含义、 质和作用;熟练掌握集中量数的计算方法; 质和作用;熟练掌握集中量数的计算方法; 恰当地应用集中量数描述一组数据的集中趋 势。 • 【学习重点】各种集中量数的概念和性质; 学习重点】各种集中量数的概念和性质; 各种集中量数的计算方法; 各种集中量数的计算方法;各种集中量数的 具体应用。 具体应用。 • 【难点】重复数据位于中间时,中数的求法 难点】重复数据位于中间时,
(1)主要适用于一组数据中有少量数据偏大或偏小, 数据分布呈偏态分布。 数据分布呈偏态分布
= lg − 1
∑
n
M
i =1
g
lg x i n
(2)数据按一定的比例关系变化 比例关系变化 直接计算平均变化率的公式
例题P77-81
Mg =
N −1
x2
x1
x3
被 试
解 题 数 24 20 16 12 8 4
时间 (小 时) 2 2 2 2 2 2
单位时 间 工作量 12 10 8 6 4 2
计算
1 2 3 4 5 6
MH =
6 = 4.9 1 1 1 1 1 1 + + + + + 12 10 8 6 4 2
平均每个被试每小时解题为4.9道
• 计算方法: • (1)未分组数据 • a.将数据依大小次序排列,若数据个数为 奇数,则取数列中间的那个数为中数, 即位于(n+1)/2的那个数 ;若数据个 数为偶数,则取中间两个数的平均数为 中数,即位于n/2和(n+1)/2 这两个数 的均数。
• b.数据重复且位于数列中间,数据个数为 数据个数为 奇数 • 例题见书P63例3-5 • c.数据重复且位于数列中间,数据个数为 数据个数为 偶数 • 例题见书P63例3-6
算数平均数用以度量连续变量次数分布集中趋 算数平均数 势的最常用的集中量数。
1.算数平均数的计算公式:个体的数据之和
除以个体数
n
1 µ= N
∑x
i =1
N
i
1 X = ∑ xi n i =1
• 用估计的平均数计算平均数
∑ x′ , 式中x′ = x − AM X = AM +
N
i
• 对于分组数据其平均数的计算公式为
最大 一般 ①有极端数据时②数 据不同质找典型③快 速估计代表值时④估 计分布形态时
五、调和平均数(harmonic mean)
用符号MH表示,在计算中先将各个数据的倒数平均, 倒数平均数。其计算公式如下: 然后再取倒数,故又称倒数平均数 倒数平均数
MH =
1 1 1 1 1 X + X +L+ X N 1 2 n
• 集中量数的概念 • 集中量数是指一组数据(一个样本数据) 集中量数 中哪一个数字最具代表性,或数据的中 中 重心集中于哪一个位置。 心或重心 重心 • 一般包括算术平均数、加权平均数、几 何平均数、中数、众数、调和平均数
一、算数平均数(arithmetic mean) 算数平均数 arithmetic mean
=
N 1 ∑X i
调和平均数主要用于描述学习速度 学习速度方面的问题 学习速度
1.学习任务的工作量相同,而所用时间不等。先求出单位时间的工作量,再代入 学习任务的工作量相同,而所用时间不等。先求出单位时间的工作量, 学习任务的工作量相同 时间不等 公式所得结果就是学习速度。 公式所得结果就是学习速度。 例1:有一学生15分钟学会生词30个,后又用10分钟学会生词20个。问该生平均 每分钟学会多少个生词? 解:用倒数平均计算,先求出单位时间的工作量
• ③给一列数据中的每一个数乘以一个常 数C,则所得到的新数组的平均数为原来 数组的平均数乘以常数C。 • ④一列数据中每个数乘以一个常数C,再 加上一常数d,其平均数等于原平均数乘 以常数C再加上常数d。
• ⑤ 一组数据中每个数与任意常数c的离 差平方和,不小于该组数据的离差平方 和。
(xi − c)2 ≥ ∑(xi − x)2 ∑ 证明: Qxi − c = (xi − x) + (x − c) ∴∑(xi − c) = ∑(xi − x) + 2n(x − c)∑(xi − x) + ∑(x − c)2
• 众数的优缺点 • 优点 优点:计算简单,容易理解,意义明白。 • 缺点:其大小不受制于全体数据;反应 缺点 不灵敏,不受极端值影响;受抽样影响 较大,不如平均数稳定。
四、平均数、众数、中数的相对位置
平均数、中数、 平均数、中数、众数之间的比较
比较的 项目 意义 适用数 据类型 计算 特性 进一步 运算 受抽样 的影响 受分组 的影响 极端数 的影响 适用场合 平均数(M) 平均数 与其两侧数据距离之 和相等数据的重心 等距、等比 需所有的数据 可以 较少 不大 最严重 一般情况都 用平均数 中数(Md) 中数 其两侧数据 个数相等 顺序 等距 等比 只需中间数据 不可以 较大 较大 最少 ①有极端数据时②当 两端数据或个别数据 不清楚时③快速估计 代表值时 众数(Mo) 众数 出现次数最多的数, 典型 性质 顺序 等距 等比 计算迅速 不可以 较大
x2
L
xn
x n −1
=
N −1
xn
x1
ቤተ መጻሕፍቲ ባይዱ
三、中数与众数
• 1.中数的概念(median)(南开大学2005试题) 1.中数的概念 median) 南开大学2005试题) 2005试题
• 中数 中数又称中位数,即指位于一组数据中间位置 中间位置的那一 中间位置 个数。可以是数列(递增或递减数列)中一个原始数 原始数 据(当个数为奇数时);还可能是通过计算出来的数 计算出来的数 (当个数为偶数时)。 • 适用场合(条件) 适用场合(条件) • 一组观测数据中出现极端数据 极端数据时; 极端数据 • 一组数据的两端有模糊数据 模糊数据出现; 模糊数据 • 需要快速估计一组数据的代表值时。
∑ fX X =
N
C
• f为各组次数,Xc为组中值。 为各组次数, 为组中值 为组中值。 为各组次数
2.加权平均数 2.加权平均数:知道小组平均求总平均,小组 加权平均数 小组 平均数与个数 个数乘积的和除以总个体数 总个体数(总人 平均数 个数 总个体数 数)。
n1 x1 + n2 x 2 + L + nk x k Xw = = n1 + n2 + L + n k
• 算数平均数的意义:
• 真值(true score):某一个体在某一特 真值( ) 性上的真实分数或称真实水平(多次测量 的平均分数)。 • 它是真值的最佳估计值(证明见P59) 它是真值的最佳估计值
二、几何平均数
几何平均数(geometeic mean):对一组数据相 几何平均数 乘开n次方所得到的数据
• 2.众数(mode)
• 众数 众数又称范数,指次数分布中出现次数最多的 那个数的数值。 • 适用条件 • 当一组数据出现不同质的情况或分布中出现极 极 端数据时;数据分布中出现双众数时,可用众 端数据 数进行粗略 粗略的估计。 粗略
• 计算方法 • (1)直接观察求众数:观察一组数次数 出现最多的就是 • (2)皮尔逊经验法MO=3Md-2M - • 众数的特点:简单明了、容易理解、较 少受极端数据的影响;反映不灵敏,不 稳定,受样本变动的影响,不能做进一 步的代数运算。 • (3)金氏插补法(略)
2 2
= ∑(xi − x) + n(x − c)2.
2
• 算术平均数的特点(简述算数平均数的使用特点,浙大 算术平均数的特点(简述算数平均数的使用特点, 2003,苏大2002 2002试题 2003,苏大2002试题) • ①优点:算术平均数是一个良好的集中量数,具有 优点 反应灵敏、计算严密、简明易解、计算简单、适合 进一步演算和较小受抽样变化的影响 较小受抽样变化的影响等。 较小受抽样变化的影响 • ②缺点:算术平均数易受极端数据 缺点: 极端数据的影响,这是因 极端数据 为平均数反应灵敏,每个数据的或大或小的变化都 会影响到最终结果;出现模糊不清 模糊不清的数据时,无法 模糊不清 计算平均数。 • 注意 注意:不同质的数据不能计算平均数(同质数据 同质数据是 同质数据 指使用同一 同一观测手段,采用相同 相同的观测标准,能反 同一 相同 同一方面特质的数据),因为不同质的 映某一问题同一方面特质 同一方面特质 数据观测手段、测量标准不一致。