统计学原理第二章:数据的描述(3)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

M
i 1
k
i
fi
n
总体加权平均
M
i 1
k
i
fi
N
例题分析---加权平均数
某电脑公司销售量数据分组表
按销售量分组 140~150 150~160 160~170 170~180 180~190 190~200 200~210 210~220 220~230 230~240 合计 组中值(Mi) 145 155 165 175 185 195 205 215 225 235 — 频数(fi) 4 9 16 27 20 17 10 8 4 5 120 Mi fi 580 1395 2640 4725 3700 3315 2050 1720 900 1175 22200
中位数 1080
例题分析---顺序数据的中位数
【例】:10个家庭的人均月收入数据
排 位 序: 置: 660 750 780 850 960 1080 1250 1500 1630 2000
1 2
3
4
5
6
7
8
9
10

n 1 10 1 位置 5 .5 2 2
960 1080 中位数 1020 2
人数
(人) 3 11 34 24 11 83
比重
(%) 3.61 13.25 40.96 28.92 13.25 100.00
总计
1 Mo L d 1 2
23 M o 160 5 163 .48 23 10
2.中位数
(median)
排序后处于中间位置上的值
第二章
统计数据的描述
陕西科技大学管理学院会计教研室---王化中
www.sust.edu.cn
LOGO
目 录
2.1 数据的收集
2.2 数据的整理 2.3 数据的描述
2.4 数据的计算机处理
2.3 统计数据的描述
一组数据经过分组整理后,形成了次数分配。将次数 分配用直方图或曲线图画出来,我们可直观了解该组数据的 变化规律。然而,进一步的推断、决策等研究不仅要求我们 对其分布变化的规律有直观的了解,而且要求我们用几个最 简洁又最能充分描述其分布数量特征的统计量将其分布变化 的规律性表示出来。这些统计量包括:数据集中趋势的测度 、离散程度的测度、偏态程度的测度及峰度的测度。 位置和尺度
1
2
9 QL 位置 2.25 4

3
4
6 7 8 9 3 9 QU 位置 6.75 4
5
QL 780 (850 780) 0.25 QU 1250 (1500 1250) 0.75 1437.5 797.5
4.平均数
(mean)
也称为均值 集中趋势的最常用测度值 一组数据的均衡点所在 x 体现了数据的必然性特征 易受极端值的影响 有简单平均数和加权平均数之分 根据总体数据计算的,称为平均数,记为;根据 样本数据计算的,称为样本平均数,记为x
非常不满意 不满意 一般 满意 非常满意
合计
24 108 93 45 30
300
8 36 31 15 10
100.0
Mo=不满意
例题分析---数值数据的众数
单项分布数列
152 156 159 160 160 161 162 163 165 165 166 168 170 171 154 156 159 160 160 161 162 163 165 165 167 168 170 172 154 156 160 160 161 161 162 163 165 166 167 168 170 172 155 157 160 160 161 162 162 164 165 166 167 168 170 172 155 158 160 160 161 162 162 164 165 166 168 168 170 174 156 158 160 160 161 162 163 164 165 166 168 169 171
N
i
4.2加权平均数
(Weighted mean)
设各组的组中值为:M1 ,M2 ,… ,Mk 相应的频数为: f1 , f2 ,… ,fk 样本加权平均
M 1 f1 M 2 f 2 M k f k x f1 f 2 f k M 1 f1 M 2 f 2 M k f k f1 f 2 f k
(3)由组距数列求众数。先根
据各组次数确定众数组,再利用公 式计算。
众数的计算公式有上限公式和下
限公式
下限公式:
M=L﹢△1∕
( △1﹢ △2)×

上限公式: M=U-△2∕(△1﹢
MO
△2)×d
某年级83名女生身高资料
身高
(CM) 150-155 155-160 160-165 165-170 170以上
例释
这 是 一 个 印 度 男 孩

4.1简单平均数
(Simple mean)
设一组数据为:x1 ,x2 ,… ,xn (总体数据xN) 样本平均数
x1 x 2 x n x n
x
i 1
n
i
n
总体平均数
x1 x 2 x N i 1 N N
x
某年级83名女生身高资料
未分组数据: 中位数位置为:
累计 身高 人数 累计 (CM) (人) 人数 (CM) (人) 人数 身高
152 154 155 156 157 158 159 160 161 162 163
人数
1 2 2 4 1 2 2 12 7 8 4
N 1 2
83 1 42 2
1 3 5 9 10 12 14 26 33 41 45
164 165 166 167 168 169 170 171 172 174
总计
3 8 5 3 7 1 5 2 3 1 83
48 56 61 64 71 72 77 79 82 83
(3)由组距数列求中位数。确定中 位数位置后利用公式计算 下限公式: M=L﹢( ∑f∕ 2 -Sm-1 ∕f)× d 上限公式: M=U-(∑f∕ 2 -Sm﹢1 ∕f)× d

x
M
i 1
k
i
fi
n 22200 185 120
成绩(分) 60以下 60~70 70~80 80~90 90~100 合 计
人数(人) 6 12 19 10 3 50
比重(%) 12 24 38 20 6 100
组中值 (M) 55 65 75 85 95 -
556651275198510953 x= 61219103
甲城市 回答类别 非常不满意 不满意 一般 满意 非常满意 合计
户数 (户)
24 108 93 45 30 300
累计频数
24 132 225 270 300 —
例题分析---数值数据的四分位数
【例】:9个家庭的人均月收入数据(4种方法计 算)
原始数据: 排 序: 位 置: 1500 750 780 1080 850 960 2000 1250 1630 750 780 850 960 1080 1250 1500 1630 2000
Me=一般
例题分析---数值数据的中位数
【例】
原始数据: 排 序:
9个家庭的人均月收入数据
1500 750 780 1080 850 960 2000 1250 1630 750 780 850 960 1080 1250 1500 1630 2000

置:
1
2
3
4
5
6
7
8
9

n 1 9 1 位置 5 2 2
3.四分位数
(quartile)
排序后处于25%和75%位置上的值
25%
QL
25%
25%
QM
25%
QU
• 不受极端值的影响 • 计算公式
n QL 位置 4 Q 位置 3n U 4
例题分析---顺序数据的四分位数
甲城市家庭对住房状况评价的频数分布
解:QL位置= (300)/4 =75 QU位置 =(3× 300)/4 =225 从 累 计 频 数 看 , QL 在 “不 满意”这一组别中; QU在 “一般”这一组别中 四分位数为 QL = 不满意 QU = 一般
身高
人数
身高 人数
(CM) (人) 164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1 总计 83
(CM) (人) 152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4
某年级83名女生身高资料
身高
(CM) 150-155 155-160 160-165 165-170 170以上
人数
(人) 3 11 34 24 11 83
累计 人数
3 14 48 72 83
f
Me L 2
S m 1 fm
d
总计
83 14 M e 160 2 5 164.04 34
Mo=可口可乐
可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露 合计
15 11 9 6 9 50
0.30 0.22 0.18 0.12 0.18 1
30 22 18 12 18 100
例题分析---顺序数据的众数
甲城市家庭对住房状况评价的频数分布 回答类别 甲城市 户数 (户) 百分比 (%)
解:这里的数据为顺 序数据。变量为“回 答类别” 甲城市中对住房 表示不满意的户数最 多 , 为 108户 , 因 此 众数为“不满意”这 一类别,即
50%
• • • Me 不受极端值的影响
50%
主要用于顺序数据,也可用数值型数据,但不能用于分 类数据 各变量值与中位数的离差绝对值之和最小,即
x M
i 1 i
n
e
min
2.中位数
n 1 位置确定 中位数位置 2
x n 1 2 Me 1 x n x n 1 2 2 2 n为奇数
主要用于分类数据,也可用于顺序数据和数值型数据。 无众数 原始数据: 一个众数 原始数据:
10 6
5 5
9 12 9 8
6 5
8 5
多于一个众数 原始数据: 25 28 28 36 42 42
例题分析---分类数据的众数
不同品牌饮料的频数分布 饮料品牌 频数 比例 百分比 (%)
解:这里的变量为“饮 料品牌”,这是个分类 变量,不同类型的饮料 就是变量值 所 调 查 的 50 人 中 , 购买可口可乐的人数最 多,为15人,占总被调 查人数的30%,因此众 数为“可口可乐”这一 品牌,即
用图形表达的分布特征能量化吗?
集中趋势的测度
数据特征的测度
集中趋势
众 数 中位数 均 值
离散程度
异众比率
分布的形状
偏 态
四分位差
方差和标准差 离散系数 峰 态


一、集中趋势的度量
二、离散程度的度量 三、偏态与峰态的度量
一、集中趋势的度量
一组数据向其中心值靠拢的倾向和程度,测度集中趋势 就是寻找数据水平的代表值或中心值。 不同类型的数据用不同的集中趋势测度值。
73.4
x 5512%6524%7538%8520%956% 73.4
算术平均数的性质
各标志值与算术平均数离差之和等于零; 各标志值与算术平均数离差平方之和最小; 各标志值同时减去一个常数 (不等于零),计算的平均 数再加上一与原平均数相等; 将每个标志值同时除以常数 D(D 不等于零) 之后,计 算的平均数乘以 D,等于原来的平均数; 将每个标志值同时减去常数一再除以常数 D(A,D 不等 于零) 得新变量值,新变量值的平均数乘以 D 再加上 一之后与原变量平均值相等。 注意 A,D 的选择: A:最接近变量平均数的值, D:最大公约数。
数值确定
n为偶数
例题分析---顺序数据的中位数
甲城市家庭对住房状况评价的频数分布 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 甲城市 户数 (户) 24 108 93 45 30 300 累计频数 24 132 225 270 300 —
wk.baidu.com
解:中位数的位置为
(300+1)/2=150.5 从累计频数看, 中位数在“一般”这 一组别中 中位数为
www.sust.edu.cn
集中趋势的测度
分类数据:众数 顺序数据:众数、中位数和分位数 数值型数据:众数、中位数和分位数、均值 众数、中位数和均值的比较
1.众数
(mode)
一组数据中出现次数最多的变量值,适合于数据量较多 时使用,不受极端值的影响。


一组数据可能没有众数或有几个众数。
相关文档
最新文档