第四章-数据特征测度4-变异指标
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
偏态 峰度
离中趋势(离散趋势)
1. 数据分布的另一个重要特征 2. 反映各变量值远离其中心值的程度(离散程度) 3. 从另一个侧面说明了集中趋势测度值的代表程度 4. 不同类型的数据有不同的离散程度测度值
一、标志变异指标的概念和作用
1.概念 标志变异指标是反映变量分布离散趋势 、与平均指标相匹配的指标。
未分组数据:
n
(xi x)2
2 i1
n
组距分组数据:
k
(Mi x)2 fi
2 i1
n
标准差的计算公式
未分组数据:
n
(xi x)2
i1
n
组距分组数据:
k
(Mi x)2 fi
i1
n
样本方差和标准差
(simple variance and standard deviation)
2040
平均差
(例题分析)
k
Md i1
Mi xfi n
204017(台 ) 120
含义:每一天的销售量平均数相比, 平均相差17台
(三)标准差和方差 (standard deviation and variance)
1. 标准差是各变量值与其均值离差平方的算术 平均数的平方根。标准差的平方为方差。
合计
某电脑公司销售量数据平均差计算表
组中值(Mi) 145 155 165 175 185 195 205 215 225 235
频数(fi) 4 9 16 27 20 17 10 8 4 5
Mi x2
40 30 20 10 0 10 20 30 40 50
—
120
—
Mi x2 fi
160 270 320 270
2.作用 (1)反映变量分布的离散趋势; (2)是对平均数的代表性程度的量度; (3)是对事物发展均衡性的量度。
二、标志变异指标的计算
(一)极差(全距)
(二)平均差
数值性数据
(三)标准差和方差
(四)离散系数
(五)离中趋势的其他测度量
异众比率
分类数据
四分位差
顺序数据
标准分数
相对位置的测量
(一)极差(range)
0 170 200 240 160 250
55400
样本标准差
(例题分析)
k
(M i x)2 fi
s i1 n 1
55400 21 .58 (台 ) 120 1
含义:每一天的销售量与平均数相比, 平均相差21.58台
方差或标准差是根据全部数据计算的,它 反映了每个数据与其均值相比平均相差的数值 ,因此能准确地反映出数据的离散程度。此外 方差具有许多优良的数学性质。。
2. 数据离散程度的最常用测度值
3. 反映了各变量值与均值的平均差异
4. 根据总体数据计算的,称为总体方差或标准
差;根据样本数据计算的,称为样本方差或
标准差
x = 8.3
4 6 8 10 12
总体方差和标准差
(population variance and standard deviation)
方差的计算公式
§4.4 标志变异指标-离散程 度的测度(Dispession)
一.分类数据:异众比率 二.顺序数据:四分位差 三.数值型数据:方差及标准差 四.相对位置的测量:标准分数 五.相对离散程度:离散系数
数据的特征和测度
(本节位置)
数据的特征和测度
集中趋势
众数 中位数 均值
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
4. 样本方差用自由度去除,其原因可从多方面来解释
,从实际应用角度看,在抽样估计中,当用样本方
Hale Waihona Puke Baidu
差s2去估计总体方差σ2时, s2是σ2的无偏估计量
样本标准差
(例题分析)
按销售量分组
140—150 150—160 160—170 170—180 180—190 190—200 200—210 210—220 220—230 230—240
方差的计算公式
未分组数据:
n
(xi x)2
s 2 i1 n 1
组距分组数据:
注意:
样本方差用自 由度n-1去除!
k
(Mi x)2 fi
s2 i1 n 1
标准差的计算公式
未分组数据:
n
(xi x)2
s i1 n 1
组距分组数据:
k
(Mi x)2 fi
s i1 n 1
样本方差
自由度(degree of freedom)
1. 一组数据中可以自由取值的数据的个数
2. 当样本数据的个数为 n 时,若样本均值x 确定后, 只有n-1个数据可以自由取值,其中必有一个数据则 不能自由取值
3.
例=自x2=5如由7。,,取当那样值么本x,x有=3另则35个一必确数个然定值则取后,2不,,即能x而x1,自1不=x2由能2,和取取xx2值3=其有4他,,两值x比个3=如数9,据x1则=可6 以,x
(四)离散系数(coefficient of variation)
1. 标准差与其相应的均值之比
2. 对数据相对离散程度的测度
3. 消除了数据水平高低和计量单位的影响
4. 用于对不同组别数据离散程度的比较
5. 计算公式为
v x
vs
s x
离散系数
(例题分析)
【 例 】某管理局抽查了所属的8家企业,其产品销售数 据如表。试比较产品销售额与销售利润的离散程度
4. 计算公式为
未分组数据 组距分组数据
n
xi x
M d i1 n k Mi x fi
Md i1 n
平均差
(例题分析)
某电脑公司销售量数据平均差计算表
按销售量分组
140—150 150—160 160—170 170—180 180—190 190—200
组中值(Mi) 145 155 165 175 185 195
频数(fi) 4 9 16 27 20 17
Mi x 40 30 20 10 0 10
200—210
205
10
20
210—220
215
8
30
220—230
225
4
40
230—240
235
5
50
合计
—
120
—
Mi x fi 160 270 320 270 0 170 200 240 160 250
企业编号
1 2 3 4 5 6 7 8
某管理局所属8家企业的产品销售数据
1. 一组数据的最大值与最小值之差 2. 离散程度的最简单测度值 3. 易受极端值影响 4. 未考虑数据的分布 7 8 9 10 5. 计算公式为
R = max(xi) - min(xi)
7 8 9 10
(二)平均差(mean deviation)
1. 各变量值与其均值离差绝对值的平均数 2. 能全面反映一组数据的离散程度 3. 数学性质较差,实际中应用较少