4.差异量

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

教 育 统 计 学
练习
• 1. 如果一个公司的职员每人加薪3000元,那么他们 收入的标准差如何变化?众数、中位数、均值、极 差、四分位距呢? • 2. 如果一个公司的职员每人工资增长2倍(变为原来 的3倍),那么他们收入的标准差如何变化?众数、 中位数、均值、极差、四分位距呢?
教 育 统 计 学
教 育 统 计 学
• 柴比契夫规则:若存有一组资料与一个数值k (k 1 >1),则至少有 100 1 % 的观察值会落在距离
k2
平均数加减k个标准差的范围内。
至少100(1-1/k2)%的 观察值会落在平均数 加减k个标准差的范围 内
次 数
平均数 –k个标准差
平均数 平均数 + k个标准差
• 比较单位相同而平均数相差较大的数据组资料的差异程 度。
教 育 统 计 学
例:现有成人组和婴儿组各100人的两个抽样总体。测得成 人组平均体重为65千克,标准差为6千克;婴儿组平均体重为4 千克,标准差为1.5千克。能否认为成人组体重的差异比婴儿 组体重的差异大? 例:对一个群体测量身高和体重,平均身高为170.2厘米, 身高标准差为5.30厘米;平均体重为70千克,体重标准差为 4.77千克。比较身高和体重的离散程度。
教 育 统 计 学
第四章 差异量
教 育 统 计 学
数据的“位置”
教 育 统 计 学
数据的“尺度” • 这两组数据“胖瘦”一样吗?
教 育 统 计 学
• 让我们来看一个例子
– 以下是从两个篮球队抽样的五位球员。 – 虽然两队的平均身高都是75英寸,中位数都是76英寸,众 数都是76英寸。但仔细观察,这两队的身高是否还是有所 不同呢?(1英尺 = 12英寸;1英寸=2.54公分)
X
2
X X
N N
2
2
X
X X
2
在式中, X 表示方差, X 表示标准差; N表示总频数。
X X表示每个数据与平均数 的差数,称为离差;
教 育 统 计 学
• 标准差代表了什么意义? – 可以由标准差看出:平均而言,数据中的观察值 究竟有多偏离平均数。 – 标准差越大,表示数据中的观察值越偏离平均数, 而数据的分散程度也就越大。
教 育 统 计 学
差异量
– 差异量是表示一组数据变异程度或离散程度的
一类特征量。差异量越大,说明数据分布的范
围越广,分布越不整齐;差异量越小,说明数
据变动范围越小,分布就越集中。
– 在教育工作中常用的差异量有全距、方差、标
准差、差异系数等。
教 育 统 计 学
全距
• 全距是一组数据中的最大值与最小值之差,又称为 极差。用R表示。 • 对于一组原始数据,全距等于其最大值与最小值之 差。 • 对于频数分布表提供的数据,全距等于最大一组与 最小一组的组中值之差,或者是最大一组的上限与 最小一组的下限之差。
经计算,Min=5, Q1=23, Q2=30.5, Q3=36.5, Max=66 请问数据中有无极端值存在?
教 育 统 计 学
百分位距
• 百分位距是两个百分位数之差。 • 常用的百分位距有两种: • P90 -P10 • P93 -P7
教 育 统 计 学
平均差
X M X Md MD 或 n n
教 育 统 计 学
全距 = 78-72 =6英寸
全距 = 84-67=17英寸
教 育 统 计 学
四分位距
• 四分位距是用依一定顺序排列的一组数据中间部位 50%个频数距离的一半作为差异量的指标。即四分 位距就是第三个四分位数Q3与第一个四分位数Q1差 的一半。用QD表示。 QD=(Q3- Q1)÷2 Q3 = P75
相对差异量
1. 相对差异量的概念
• 前面的全距、方差和标准差都是带有单位的绝对差异 量。 • 相对差异量(即差异系数):是指一组数据的标准差 与算术平均数的百分比。它是没有单位的相对数。用 CV表示差异系数,计算公式为:
CV
X
X
100%
教 育 统 计 学
2. 差异系数的用途
• 差异系数越大,则该组数据内部的差异程度就越大,反 之,差异程度就越小。因此,我们可以通过计算两组数 据差异系数的大小来比较它们差异程度的大小。 • 比较不同单位数据组资料的差异程度。
教 育 统 计 学
3. 方差和标准差的优缺点及应用
• 优点:反应灵敏、严密确定、计算简单、适合代 数运算等。 • 缺点:意义不易理解、易受两极端数值的影响、 有个别数据不清楚时无法计算。 • 应用:是最常用的差异量数,标准差的应用尤其 广泛。标准差往往和算术平均数配对使用,以反 映一组数据的差异程度和集中程度。
解 : X 68, X 930, N 5
2
X
2
930 68 186 184.96 1.04 5 5
2
X 1.04 1.02
教 育 统 计 学
频数分布表计算法
• 对于用频数分布表提供的数据资料,可以用组中
值作为各组数据的近似值来计算方差和标准差。
举例说明
教 育 统 计 学
• 以下是两组样本数据,及其样本平均数与样本标准差。
第一组 41 44 45 47 47 48 51 53 58 66
第二组 20 37 48 48 49 50 53 61 64 70
第一组 第二组
x =50.0,s=7.4 x =50.0,s=14.2
教 育 统 计 学
原始数据计算法
X
2

X
N
2

2
X
N

2
X X N N 在式中, X表示原始数据;
2
X
N表示总频数。
教 育 统 计 学
• 例:某校对 5 个教师的教学效果进行测评,满分为 20 分, 5 个教师的得分为 14 分、 15 分、 13 分、 12 分 和14分,这五个教师得分的方差和标准差各是多少?
教 育 统 计 学
偏态量与峰态量
• 1. 偏态量( skew):是描述次数分布的偏态方向和 程度的量数。 • 计算公式:
X M0 3( X Md ) SK SK S S
教 育 统 计 学
• 2. 峰态量( kurtosis ):描述次数分布的高低宽窄特 征的量数。
• 高狭峰:S较小,分数分布高窄,集中在平均数两侧。 • 低阔峰:S较大,分数分布低阔,散布较广。 • 正态峰:分布介于高峰态和低峰态之间。
教 育 统 计 学
极端值的判断
• 运用Q1,Q3, QD来设定下限与上限 下限= Q1 – 3QD; 上限= Q3 + 3QD
凡是在上述范围之外的观察值,即为潜在的极端值。
下限 上限
位于பைடு நூலகம்处的观察值即是 潜在的极端值。
教 育 统 计 学
一个例子 • 以下是抽取20位美国人,调查其每周观看电视的 时数,所得的一组资料。 25 66 34 30 41 27 35 31 26 32 38 30 32 15 38 20 43 05 16 21
教 育 统 计 学
计算公式:
P 75 P 25 Ku 2( P 90 P 10 )
• 当Ku<0.263时,分布呈高狭峰;
• 当Ku>0.263时,呈低阔峰;
• 当Ku=0.263时,分布为正态峰。
教 育 统 计 学
方差和标准差
1. 方差和标准差的概念
• 方差和标准差是通过离差来定义的。
• 离差:是指一组数据中的各个数据与该组数据算术平均数 之差。
• 方差:是一组数据离差平方的算术平均数,即方差可由离 差的平方和除以数据个数所得。 • 标准差:是方差的算术平方根。
教 育 统 计 学
2. 方差和标准差的定义公式
教 育 统 计 学
• 三个标准差原则:
在任何一组数据中,大部分的观察值会落入距离 平均数加减三个标准差的范围内。 根据柴比契夫规则,89%的观察值会落入距离平 均数加减三个标准差的范围内。
• 适用任何数据的分配型态。
根据经验法则,99%的观察值会落入距离平均数 加减三个标准差的范围内。 • 适用于钟型对称的数据分配型态(常态分配)

Q1 = P25
教 育 统 计 学
极值
• 落在上或者下四分位数的3个四分位距单位之外的观测值。
• 即:大于Q3+3QD 或小于Q1-3QD的数据为极值。
教 育 统 计 学
极端值
• 极端值的意义 – 又称「离群值」或「异常值」
– 在一组数据中,凡是落在数据整体组型之外的观 察值,即为极端值。
– 例如:全班几乎所有人的体重都落在45到80公斤 之间,其中以65到70公斤之间的人居多(整体组 型),但有一位同学的体重高达100公斤,显著的 偏离班上同学的体重范围,此即极端值。
相关文档
最新文档