统计学-用统计量描述数据
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
位 置: 1 2 3 4 5 6 7 8 9
位置 n 1 9 1 5 中位数 1080
22
3 - 16
*
统计学
STATISTICS (第四版)
中位数的计算
(数据个数为偶数)
【例3-3】 10个家庭的人均月收入数据
排 序: 750 780 850 960 1080 1250 1500 1630 2000 2800
统计学 数据分析
(方法与案例)
统计学
STATISTICS (第四版)
统计名言
一些人使用统计就像喝醉酒的人 使用街灯柱—支撑的功能多于照 明。
——Andrew Lang
3-2
*
第 3 章 用统计量描述数据
3.1 水平的度量 3.2 差异的度量 3.3 分布形状的度量
统计学
STATISTICS (第四版)
➢ 在2008年8月10日举行的第29届北京奥运会女子10米气 手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10 枪的决赛成绩如下表
3-5
*
统计学
STATISTICS (第四版)
哪名运动员的发挥更稳定?
➢ 最会的比赛结果是,中国运动员郭文珺凭借决赛的稳 定发挥,以总成绩492.3环夺得金牌,预赛排在第1名 的俄罗斯运动员纳塔利娅·帕杰林娜以总成绩498.1环 获得银牌,预赛排在第4名的格鲁吉亚运动员妮诺·萨 卢克瓦泽以总成绩487.4环的成绩获得铜牌,而预赛 排在第3名的蒙古运动员卓格巴德拉赫·蒙赫珠勒仅以 479.6环的成绩名列第8名
学习目标
度量水平的统计量 度量差异的统计量 度量分布形状的统计量 各统计量的的特点及应用场合 用Excel和SPSS计算描述统计量
3-4
*
统计学
STATISTICS (第四版)
哪名运动员的发挥更稳定?
➢ 在奥运会女子10米气手枪比赛中,每个运动员首先进行 每组10抢共4组的预赛,然后根据预赛总成绩确定进入决 赛的8名运动员。决赛时8名运动员再进行10枪射击,再 将预赛成绩加上决赛成绩确定最后的名次
简单算数平均
(Simple mean)
设一组数据为:x1 ,x2 ,… ,xn (总体数据xN)
样本平均数 总体平均数
n
x
x1 x2
xn
xi
i1
n
n
N
x1 x2
xN
xi
i 1
N
N
统计函数—AVERAGE
3 - 10
*
统计学
STATISTICS (第四版)
加权平均数
(Weighted mean)
n
0 8 20 1100 1 12(分) 10
3 - 13
*
3.1 水平的度量 3.1.2 中位数和分位数
统计学
STATISTICS (第四版)
中位数
(median)
1. 排序后处于中间位置上的值。不受极端值影响
50%
50%
Me
2. 位置确定 中位数位置 n 1 2
3. 数值确定
Me
x
➢ 由此可见,在射击比赛中,运动员能否取得好的成绩, 发挥的稳定性至关重要。那么,怎样评价一名运动员 的发挥是否稳定呢?通过本章内容的学习就能很容易 回答这样的问题
3-6
*
第 3 章 用统计量描述数据
3.1 水平的度量
3.1.1 平均数 3.1.2 中位数和分位数 3.1.3 用哪个值代表一组数据?
—
频数(fi) 4 9
16 27 20 17 10
8 4 5
120
3 - 12
Mi fi 580 1395 2640 4725 3700 3315 2050 1720 900 1175
22200
k
Mi fi
x i1 n
22200 185 120
*
统计学
STATISTICS (第四版)
加权平均数
n1 2
来自百度文库
1 2
x
n 2
x
n 2
1
n为奇数 n为偶数
3 - 15
*
统计学
STATISTICS (第四版)
中位数的计算
(数据个数为奇数)
【例3-3】 9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000
设各组的组中值为:M1 ,M2 ,… ,Mk 相应的频数为: f1 , f2 ,… ,fk
k
样本加权平均:
x
M1 f1 M 2 f2
Mk
fk
Mi fi
i 1
f1 f2 fk
n
k
总体加权平均:
M1 f1 M 2 f2
Mk fk
Mi fi
i 1
f1 f2 fk
N
3 - 11
*
位 置: 1 2 3 4 5 6 7 8 9 10
位置 n 1 10 1 5.5
2
2
中位数 1180 1250 1165 2
统计函数—MEDIAN
3 - 17
*
统计学
STATISTICS (第四版)
四分位数—用3个点等分数据
(quartile)
1. 排序后处于25%和75%位置上的值
25% 25% 25% 25%
QL
QM
QU
2. 不受极端值的影响
3 - 18
*
统计学
STATISTICS (第四版)
四分位数的计算
(位置的确定)
方法1:定义算法
QL位置
n 4
QU位置
3n 4
方法2:较准确算法 (SPSS的算法)
(权数对均值的影响)
【例】甲乙两组各有10名学生,他们的考试成绩及其分布数 据如下
甲组: 考试成绩(x ): 0 20 100
人数分布(f ):1 1 8
乙组: 考试成绩(x): 0 20 100
人数分布(f ):8 1 1
n
x甲
xi
i 1
n
01 2011008 10
82(分)
n
x乙
xi
i 1
统计学
STATISTICS (第四版)
加权平均数
(例题分析)
某电脑公司销售额数据分组表
按销售额分组
140~150 150~160 160~170 170~180 180~190 190~200 200~210 210~220 220~230 230~240
合计
组中值(Mi) 145 155 165 175 185 195 205 215 225 235
3.1 水平的度量 3.1.1 平均数
统计学
STATISTICS (第四版)
平均数
(mean)
1. 也称为均值,常用的统计量之一
2. 消除了观测值的随机波动
3. 易受极端值的影响
4. 根据总体数据计算的,称为平均数,记为; 根据样本数据计算的,称为样本平均数, 记为x
3-9
x
x
*
统计学
STATISTICS (第四版)
位置 n 1 9 1 5 中位数 1080
22
3 - 16
*
统计学
STATISTICS (第四版)
中位数的计算
(数据个数为偶数)
【例3-3】 10个家庭的人均月收入数据
排 序: 750 780 850 960 1080 1250 1500 1630 2000 2800
统计学 数据分析
(方法与案例)
统计学
STATISTICS (第四版)
统计名言
一些人使用统计就像喝醉酒的人 使用街灯柱—支撑的功能多于照 明。
——Andrew Lang
3-2
*
第 3 章 用统计量描述数据
3.1 水平的度量 3.2 差异的度量 3.3 分布形状的度量
统计学
STATISTICS (第四版)
➢ 在2008年8月10日举行的第29届北京奥运会女子10米气 手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10 枪的决赛成绩如下表
3-5
*
统计学
STATISTICS (第四版)
哪名运动员的发挥更稳定?
➢ 最会的比赛结果是,中国运动员郭文珺凭借决赛的稳 定发挥,以总成绩492.3环夺得金牌,预赛排在第1名 的俄罗斯运动员纳塔利娅·帕杰林娜以总成绩498.1环 获得银牌,预赛排在第4名的格鲁吉亚运动员妮诺·萨 卢克瓦泽以总成绩487.4环的成绩获得铜牌,而预赛 排在第3名的蒙古运动员卓格巴德拉赫·蒙赫珠勒仅以 479.6环的成绩名列第8名
学习目标
度量水平的统计量 度量差异的统计量 度量分布形状的统计量 各统计量的的特点及应用场合 用Excel和SPSS计算描述统计量
3-4
*
统计学
STATISTICS (第四版)
哪名运动员的发挥更稳定?
➢ 在奥运会女子10米气手枪比赛中,每个运动员首先进行 每组10抢共4组的预赛,然后根据预赛总成绩确定进入决 赛的8名运动员。决赛时8名运动员再进行10枪射击,再 将预赛成绩加上决赛成绩确定最后的名次
简单算数平均
(Simple mean)
设一组数据为:x1 ,x2 ,… ,xn (总体数据xN)
样本平均数 总体平均数
n
x
x1 x2
xn
xi
i1
n
n
N
x1 x2
xN
xi
i 1
N
N
统计函数—AVERAGE
3 - 10
*
统计学
STATISTICS (第四版)
加权平均数
(Weighted mean)
n
0 8 20 1100 1 12(分) 10
3 - 13
*
3.1 水平的度量 3.1.2 中位数和分位数
统计学
STATISTICS (第四版)
中位数
(median)
1. 排序后处于中间位置上的值。不受极端值影响
50%
50%
Me
2. 位置确定 中位数位置 n 1 2
3. 数值确定
Me
x
➢ 由此可见,在射击比赛中,运动员能否取得好的成绩, 发挥的稳定性至关重要。那么,怎样评价一名运动员 的发挥是否稳定呢?通过本章内容的学习就能很容易 回答这样的问题
3-6
*
第 3 章 用统计量描述数据
3.1 水平的度量
3.1.1 平均数 3.1.2 中位数和分位数 3.1.3 用哪个值代表一组数据?
—
频数(fi) 4 9
16 27 20 17 10
8 4 5
120
3 - 12
Mi fi 580 1395 2640 4725 3700 3315 2050 1720 900 1175
22200
k
Mi fi
x i1 n
22200 185 120
*
统计学
STATISTICS (第四版)
加权平均数
n1 2
来自百度文库
1 2
x
n 2
x
n 2
1
n为奇数 n为偶数
3 - 15
*
统计学
STATISTICS (第四版)
中位数的计算
(数据个数为奇数)
【例3-3】 9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000
设各组的组中值为:M1 ,M2 ,… ,Mk 相应的频数为: f1 , f2 ,… ,fk
k
样本加权平均:
x
M1 f1 M 2 f2
Mk
fk
Mi fi
i 1
f1 f2 fk
n
k
总体加权平均:
M1 f1 M 2 f2
Mk fk
Mi fi
i 1
f1 f2 fk
N
3 - 11
*
位 置: 1 2 3 4 5 6 7 8 9 10
位置 n 1 10 1 5.5
2
2
中位数 1180 1250 1165 2
统计函数—MEDIAN
3 - 17
*
统计学
STATISTICS (第四版)
四分位数—用3个点等分数据
(quartile)
1. 排序后处于25%和75%位置上的值
25% 25% 25% 25%
QL
QM
QU
2. 不受极端值的影响
3 - 18
*
统计学
STATISTICS (第四版)
四分位数的计算
(位置的确定)
方法1:定义算法
QL位置
n 4
QU位置
3n 4
方法2:较准确算法 (SPSS的算法)
(权数对均值的影响)
【例】甲乙两组各有10名学生,他们的考试成绩及其分布数 据如下
甲组: 考试成绩(x ): 0 20 100
人数分布(f ):1 1 8
乙组: 考试成绩(x): 0 20 100
人数分布(f ):8 1 1
n
x甲
xi
i 1
n
01 2011008 10
82(分)
n
x乙
xi
i 1
统计学
STATISTICS (第四版)
加权平均数
(例题分析)
某电脑公司销售额数据分组表
按销售额分组
140~150 150~160 160~170 170~180 180~190 190~200 200~210 210~220 220~230 230~240
合计
组中值(Mi) 145 155 165 175 185 195 205 215 225 235
3.1 水平的度量 3.1.1 平均数
统计学
STATISTICS (第四版)
平均数
(mean)
1. 也称为均值,常用的统计量之一
2. 消除了观测值的随机波动
3. 易受极端值的影响
4. 根据总体数据计算的,称为平均数,记为; 根据样本数据计算的,称为样本平均数, 记为x
3-9
x
x
*
统计学
STATISTICS (第四版)