第5章离中趋势度量法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.
例以xx2=自如=7,由,5。那取样当么值本x,有x3则另=3必个5一然确数个取定值则2后,不,,即能而xx自不1,1=由能2x2,取取和x其值x23=他有,4,值两比x个如3=数x91=,据6则,可
4. 样本方差用自由度去除,其原因可从多方面解释,
从实际应用角度看,在抽样估计中,当用样本方差
去估计总体方差σ2时,它是σ2的无偏估计量
为什么称作标准差
Mary Smith 和Jason Jones都在申请奖学金,Mary 参加的是the Academic College Testing Service (ACT)test , 成 绩 为 26 ; Jason 参 加 的 是 the Stanford Admission Test (SAT),成绩是1100。两 类 考 试 的 分 数 范 围 分 别 是 0-36 、 200-1600 , 那 么 谁将获得奖学金?
R = max(xi) - min(xi)
7 8 9 10
4 - 23
西北工业大学管理学院
统计学
STATISTICS
平均差
(mean deviation)
1. 各变量值与其平均数离差绝对值的平均数 2. 能全面反映一组数据的离散程度 3. 数学性质较差,实际中应用较少
4. 计算公式为
未分组数据
n
xi x
4 - 30
西北工业大学管理学院
统计学
STATISTICS
按销售量分组 140~150 150 ~ 160 160 ~170 170 ~180 180 ~ 190 190 ~ 200 200 ~ 210 210 ~220 220 ~230 230 ~240 合计
4 - 31
样本标准差
(例题分析)
某电脑公司销售量数据平均差计算表
0 170 200 240 160 250
55400
统计学
STATISTICS
样本标准差
(例题分析)
k
(M i x)2 fi
s i1 n 1
55400 21.58(台) 120 1
含义:每一天的销售量与平均数相比, 平均相差21.58台
4 - 32
西北工业大学管理学院
统计学
STATISTICS
QL = 不满意 = 2 QU = 一般 = 3 四分位差:
Qd = QU - QL
=3–2 =1
4 - 21
西北工业大学管理学院
统计学
STATISTICS
数值型数据:方差和标准差
4 - 22
西北工业大学管理学院
统计学
STATISTICS
极差
(range)
1. 一组数据的最大值与最小值之差 2. 离散程度的最简单测度值 3. 易受极端值影响 4. 未考虑数据的分布 7 8 9 10 5. 计算公式为
➢ 由此可见,在射击比赛中,运动员能否取得 好的成绩,发挥的稳定性至关重要。那么, 怎样评价一名运动员的发挥是否稳定呢?
4 -4
统计学
STATISTICS
数据分布的特征
集中趋势 (位置)
离中趋势 (分散程度)
偏态和峰态 (形状)
4 -5
西北工业大学管理学院
统计学
STATISTICS
数据分布特征的测度
同容量样本的分布,方差比较的是 (xi x)2 的平均值
n-1,是自由度,可以得到总体方差的无偏估计。
4. 方差易受极端值影响。
4 - 29
西北工业大学管理学院
统计学
STATISTICS
样本方差
自由度(degree of freedom)
1. 一组数据中可以自由取值的数据的个数
2. 当样本数据的个数为 n 时,若样本均值x 确定后, 只有n-1个数据可以自由取值,其中必有一个数据 则不能自由取值
统计学
STATISTICS
第 5 章 离中趋势度量法
5.1 离中趋势度量的目的 5.2 离中趋势的度量 5.3 偏态与峰态的度量
4 -1
西北工业大学管理学院
统计学
STATISTICS
学习目标
1. 离中趋势的基本概念 2. 离中趋势各测度值的计算方法 3. 离中趋势各测度值的特点及应用场合
4 -2
西北工业大学管理学院
/
人
西北工业大学管理学院
统计学
STATISTICS
为抽选样本单位数提供依据
4 - 12
西北工业大学管理学院
统计学 为抽选样本单位数提供依据
STATISTICS
离中趋势指标 样本单位数 离中趋势指标 样本单位数
4 - 13
西北工业大学管理学院
统计学
STATISTICS
5.2 离散程度的度量
2040
统计学
STATISTICS
平均差
(例题分析)
k
M d
i 1
Mi x n
Hale Waihona Puke Baidu
fi
2040 120
17(台)
含义:每一天的销售量平均数相比,
平均相差17台
4 - 26
西北工业大学管理学院
统计学
方差和标准差
STATISTICS(variance and standard deviation)
STATISTICS
四分位差
(quartile deviation)
1. 对顺序数据离散程度的测度
2. 也称为内距或四分间距
3. 上四分位数与下四分位数之差
Qd = QU – QL 4. 反映了中间50%数据的离散程度
5. 不受极端值的影响
6. 用于衡量中位数的代表性
4 - 20
西北工业大学管理学院
组中值(Mi) 145 155 165 175 185 195 205 215 225 235
频数(fi) 4 9
16 27 20 17 10
8 4 5
M i x2
40 30 20 10
0 10 20 30 40 50
—
120
—
西北工业大学管理学院
M i x2 fi
160 270 320 270
n 1
统计学
样本方差和标准差
STATISTICS (simple variance and standard deviation)
1. 均值和标准差永远是联合使用的, 后者反映数值在均 值周围聚集的程度。
2. xi x 提供两个重要信息:样本观察值偏离其均值的
距离;偏离的方向。
3.
(xi x)2 随样本容量增加而增加,无法比较两个不
M d i1 n
k
组距分组数据
Mi x fi
M d i1 n
4 - 24
西北工业大学管理学院
统计学
STATISTICS
平均差
(例题分析)
某电脑公司销售量数据平均差计算表
按销售量分组
140~150 150 ~ 160 160 ~ 170 170 ~ 180 180 ~ 190 190 ~ 200 200 ~ 210 210 ~ 220 220 ~ 230 230 ~ 240
衡量、比较均值的代表性
4 - 10
西北工业大学管理学院
统计学 衡量、比较均值的代表性
STATISTICS
离中趋势指标 均值的代表性 离中趋势指标 均值的代表性
4 - 11
x甲
73
74
75 5
76
77
75件
/
人
x乙
50
65
70 5
90
100
75件 /
人
x丙
75
75
75 5
75
75
75件
1 15 50
0.7 70%
在所调查的50人当中,购 买其他品牌饮料的人数占 70%,异众比率比较大。因 此,用“可口可乐”代表消 费者购买饮料品牌的状况, 其代表性不是很好
4 - 18
西北工业大学管理学院
统计学
STATISTICS
顺序数据:四分位差
4 - 19
西北工业大学管理学院
统计学
4 - 34
西北工业大学管理学院
统计学
STATISTICS
相对位置的测量:标准分数
4 - 35
西北工业大学管理学院
统计学
STATISTICS
标准分数 (standard score)
1. 也称标准化值 2. 对某一个值在一组数据中相对位置的度量
4 -7
西北工业大学管理学院
统计学
STATISTICS
描述总体内部差异程度
4 -8
西北工业大学管理学院
统计学
STATISTICS
描述总体内部差异程度
厂名
甲厂 已厂
供货计划完成情况 (%) 一月 二月 三月 全季度
32
34
34
100
20
30
50
100
4 -9
西北工业大学管理学院
统计学
STATISTICS
方差的计算公式
标准差的计算公式
未分组数据:
n
(xi x)2
s 2 i1 n 1
组距分组数据:
注意:
样本方差用自 由度n-1去除!
未分组数据:
n
(xi x)2
s i1 n 1
组距分组数据:
k
(Mi x)2 fi
s 2 i1 n 1
s
4 - 28
西北工业大学管理学院
k
(Mi x)2 fi
i1
5.2.1 分类数据:异众比率 5.2.2 顺序数据:四分位差 5.2.3 (非)数值型数据:方差和标准差 5.2.4 相对位置的度量:标准分数 5.2.5 相对离中的趋势度量
4 - 14
西北工业大学管理学院
统计学
STATISTICS
离中趋势
1. 数据分布的另一个重要特征 2. 反映各变量值远离其中心值的程度(离散程度) 3. 从另一个侧面说明了集中趋势测度值的代表程度 4. 不同类型的数据有不同的离散程度测度值
1. 数据离散程度的最常用测度值
2. 反映了各变量值与均值的平均差异
3. 根据总体数据计算的,称为总体方差或标 准差;根据样本数据计算的,称为样本方 差或标准差
x = 8.3
4 - 27
4 6 8 10 12
西北工业大学管理学院
统计学
样本方差和标准差
STATISTICS (simple variance and standard deviation)
组中值(Mi) 145 155 165 175 185 195 205 215 225 235
频数(fi) 4 9
16 27 20 17 10
8 4 5
Mi x 40 30 20 10
0 10 20 30 40 50
合计
—
120
—
4 - 25
西北工业大学管理学院
Mi x fi 160 270 320 270 0 170 200 240 160 250
统计学
STATISTICS
四分位差
(例题分析)
甲城市家庭对住房状况评价的频数分布
回答类别
甲城市 户数 (户) 累计频数
非常不满意
24
24
不满意
108
132
一般
93
225
满意
45
270
非常满意
30
300
合计
300
—
解:设非常不满意为 1,不满意为2, 一般为 3, 满意为 4, 非常满 意为5 。 已知
4 - 15
统计学
STATISTICS
分类数据:异众比率
4 - 16
西北工业大学管理学院
统计学
STATISTICS
异众比率
(variation ratio)
1. 对分类数据离散程度的测度 2. 非众数组的频数占总频数的比例 3. 计算公式为
vr
fi fm 1 fm
fi
fi
4. 用于衡量众数的代表性
4 -3
统计学 哪名运动员的发挥更稳定?
STATISTICS
➢ 最会的比赛结果是,中国运动员郭文珺凭借 决赛的稳定发挥,以总成绩492.3环夺得金 牌,预赛排在第1名的俄罗斯运动员纳塔利 娅·帕杰林娜以总成绩498.1环获得银牌,预 赛排在第4名的格鲁吉亚运动员妮诺·萨卢克 瓦泽以总成绩487.4环的成绩获得铜牌,而 预赛排在第3名的蒙古运动员卓格巴德拉赫· 蒙赫珠勒仅以479.6环的成绩名列第8名
4 - 17
西北工业大学管理学院
统计学
STATISTICS
异众比率
(例题分析)
不同品牌饮料的频数分布
饮料品牌
频数
比例
百分比 (%)
可口可乐 15 0.30 30
旭日升冰茶 11 0.22 22
百事可乐
9 0.18 18
汇源果汁
6 0.12 12
露露
9 0.18 18
合计
50 1 100
解:
vr
50 15 50
数据特征的测度
集中趋势
众数 中位数 平均数
4 -6
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰态
西北工业大学管理学院
统计学 5.1 离中趋势度量的目的
STATISTICS
5.1.1 描述总体内部差异程度 5.1.2 衡量和比较均值指标的代表性高低 5.1.3 为抽选样本单位数提供依据
xACT 22, sACT 2, xSAT 1000, sSAT 100
4 - 33
西北工业大学管理学院
统计学
STATISTICS
为什么称作标准差
对于数值型数据由三种表示形式 ▪原始数据值:26ACT points, 1100SAT points ▪偏离平均值的距离:+4 +100 ▪偏离均值的标准差数:+2 +1
统计学 哪名运动员的发挥更稳定?
STATISTICS
➢ 在奥运会女子10米气手枪比赛中,每个运动员首先进行 每组10抢共4组的预赛,然后根据预赛总成绩确定进入决 赛的8名运动员。决赛时8名运动员再进行10枪射击,再 将预赛成绩加上决赛成绩确定最后的名次
➢ 在2008年8月10日举行的第29届北京奥运会女子10米气 手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10 枪的决赛成绩如下表