统计数据的描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
N
GM N X1 X 2 ... X N N Xi i 1
加权几何平均数:
GM
f
X f1 1
X f2 2
...
X fn n
f
N
Xf
i1
两边取对数: lg G f lg x
请计算P68,表6
f
二、分类数据:众数
众数
(概念要点)
1. 集中趋势的测度值之一 2. 出现次数最多的变量值 3. 不受极端值的影响 4. 可能没有众数或有几个众数 5. 主要用于分类数据,也可用于顺序数据 和数值型数据
析
数据分布的特征
集中趋势 (位置) 离中趋势 (分散程度)
偏态和峰度 (形状)
数据分布的特征和测度
数据的特征和测度
集中趋势
均值 众数 中位数
离散程度
分布的形状
四分位差 方差 标准差 离散系数
偏态 峰度
集中趋势
(Central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据一般水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值
Mo
【例4.1】 根据下表 数据,计 算50名工 人日加工 零件数的 众数
数值型分组数据的众数
(算例)
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
累积频数
3
3
105~110
Fra Baidu bibliotek
110~115
5
8
115~120
8
16
120~125
14
30
125~130
10
40
130~135
6
46
135~140
Mo=不满意
(三)数值型分组数据的众数
(要点及计算公式)
1. 众数的值与相邻两组频数的分布有关
2. 相邻两组的频数相等时,众数组的组中值
即为众数
Mo
3. 相邻两组的频数不相等时,众数采用下
列近似公式计算
M0
L (f
f f1 f1) ( f
f1)
i
Mo
4. 该公式假定众数组的频数在众数组内均匀分布
第四章 统计数据的描述
统计数据的描述有三个方面:集 中趋势、离散程度、分布形态
第四章 统计数据的描述
第一节 集中趋势的测度 第二节 离散程度的测度 第三节 偏态与峰度的测度
学习目标
1.集中趋势各测度值的计算方法 2.集中趋势不同测度值的特点和应用场合 3.离散程度各测度值的计算方法 4.离散程度不同测度值的特点和应用场合 5.偏态与峰度测度方法 6.用Excel、SPSS描述统计量并进行分
商品广告
112 0.560 56.0
服务广告
51
0.255 25.5
金融广告
9
0.045
4.5
房地产广告
16
0.080
8.0
招生招聘广告 10
0.050
5.0
其他广告
2
0.010
1.0
合计
200
1
100
解:这里的变量为“ 广告类型”,这是个 分类变量,不同类型 的广告就是变量值。 我们看到,在所调查 的200人当中,关注商 品广告的人数最多, 为112人,占总被调查 人数的56%,因此众 数为“商品广告”这 一类别,即
—
50
XiFi 322.5 562.5 940.0 1715.0 1275.0 795.0 550.0
6160.0
加权算术平均数公式转化:
先计算权重
x x1 f 1x2 f2 ... xn fn f 1 f2 ... fn
xi fi fi
xi
fi fi
计算P65表3与表4
算术平均数的几何性质
4
50
合计
50
—
M0
120
14 8
(14 8) (14 10)
5 123(个)
三、顺序数据:中位数和分位数
(一)中位数
(概念要点)
1.集中趋势的测度值之一 2.排序后处于中间位置上的值
计算公式:
xp
xi fi 1 P 0 Q P
fi
PQ
计算表5,P67
几何平均数
1. 集中趋势的测度值之一 2. N 个变量值乘积的 N 次方根 3. 适用于特殊的数据:变量值本身是比率
的形式,且比率的连乘积等于末期除以 基期 4. 主要用于计算平均发展速度
几何平均数
简单几何平均数:
如果 (xi x) 0 ,那么 (xi x) f 0
如果 (xi x)2 min ,那么 (xi x)2 f min
交替标志平均数
1表示具有某种属性的单位标志值
0表示不具有某种属性的单位标志值
有某种属性的单位数所占比重P=N1/N
不具有某种属性的单位数所占比重 P=N2/N
Mo=商品广告
(二)顺序数据的众数
(算例)
【例】根据下表的数据,计算众数
甲城市家庭对住房状况评价的频数分布
回答类别
甲城市 户数 (户) 百分比 (%)
非常不满意
24
8
不满意
108
36
一般
93
31
满意
45
15
非常满意
30
10
合计
300
100.0
解:这里的数据为定
序数据。变量为“回 答类别”。甲城市中 对住房表示不满意的 户数最多,为108户 ,因此众数为“不满 意”这一类别,即
众数
(众数的不唯一性)
无众数 原始数据: 10 5 9 12 6 8
一个众数 原始数据:
659855
多于一个众数 原始数据: 25 28 28 36 42 42
(一)分类数据的众数
(算例)
【例】根据下表数据,计算众数
表3-1 某城市居民关注广告类型的频数分布 广告类型 人数(人) 比例 频率(%)
4. 低层次数据的集中趋势测度值适用于高层次的测量数据, 反过来,高层次数据的集中趋势测度值并不适用于低层次 的测量数据
5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握 的数据的类型来确定
均值
1. 集中趋势的测度值之一 2. 最常用的测度值 3. 一组数据的均衡点所在 4. 易受极端值的影响 5. 用于数值型数据,不能用于分类数据
和顺序数据
一、算术平均数
计算公式:变量值之和/变量值个数
计算方法
简单算术平均数:x
x 1 x2
... n
xn
xi
n
加权算术平均数:x x1 f 1x2 f2 ... xn fn xi fi
f1 f2 ... fn
fi
(请计算P63表4-1到4-8)
如果fi 都相等,那么加权平均和简单平均 相同
例题:
表4-1 按零件数分组
105~110 110~115 115~120 120~125 125~130 130~135 135~140
合计
某车间50名工人日加工零件均值计算表
组中值(Xi) 107.5 112.5 117.5 122.5 127.5 132.5 137.5
频数(Fi) 3 5 8 14 10 6 4