数据的描述性分析讲述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 数值平均数
数值平均数包括算术平均数、调和平均数和几何平均数.
①.算术平均数(均值, Arithmetic Mean)
总体均值常用X 或 表示,样本均值常用 x表示,样本均值
的计算公式:
简单算术平均数:
x

x1 x2
xn

n
xi
i 1
nn
n
加权算术平均数:
xi fi
x
i 1 n
fi
权数的意义和作用
• 权数:各组次数(频数)的大小所对应的标志值对平均数
的影响具有权衡轻重的作用.
• 当各组的次数都相同时,即当f1 =f2 =f3 = =fn 时:
加权算术平均数就等于简单算术平均数.
n
n
n
xi fi f xi
xi
x
i 1 n
fi

i 1
式中,m表示各单位或各组的标志值对应的标志总量.
例.某蔬菜批发市场三种蔬菜日成交数据如下 表,计算三种蔬菜该日的平均批发价格.
③.几何平均数(Geometric Mean)
是另一种形式的平均数,是n个标志值乘积的 n 次方根.主 要用于计算平均比率和平均速度. (1)简单几何平均数
1
G n x1 x2 xn xi n
nf
i1 n
i 1
例:计算某车间工人加工零件平均数(组距式数列)
解: X i xi fi 2640 66个 fi 40
i
关于计算结果的说明
●根据原始数据和分组资料计算的结果一般不会完全相等, 根据分组数据只能得到近似结果.
●只有各组数据在组内呈对称或均匀分布时,根据分组资料 的计算结果才会与原始数据的计算结果一致.
(1).各变量值与均值的离差之和等于零.
n
xi x =0
i =1
(2).各变量值与均值的离差平方和最小.
n
2
xi x = min
i =1
②.调和平均数(倒数平均数, Harmonic Mean)
调和平均数分为简单调和平均数和加权调和平均数. (1)简单调和平均数 标志值的倒数的算术平均数的倒数.
平均数

算术平均数
数值平均数 调和平均数

几何平均数
1.数值平均数:是以统计数列的所有数据 来计算的平均数.其特点是统计数列中任 何一项数据的变动,都会在一定程度上影 响数值平均数的计算结果. 2.位置平均数:它不是对统计数列中所有 数据进行计算所得的结果,而是根据数列 中处于特殊位置上的个别单位或部分单 位的标志值来确定的.
45
15
270
30
10
300
合计
300
100.0

负偏 注: (1)中位数总是介于众数和平均数之间.
正偏
(2) 皮尔逊经验法则 分布在轻微偏斜的情况下,众数、中位数和算术平均 数数量关系的经验公式为:
x Mo 3(x Me )
众数、中位数、平均数的特点和应用 1. 众数
– 不受极端值影响 – 具有不惟一性 – 数据分布偏斜程度较大且有明显峰值
例:分类数据的众数
例:顺序数据的众数
②.中位数(Median)
中位数是一组数据按一定顺序排列后,处于中间位置 上的变量
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
户数 (户)
百分比 (%)
向上累积 户数 (户)
非常不满意 不满意 一般 满意 非常满意
24
8
24
108
36
132
93
31
225
例3.1.2 某企业四个车间流水作业生产某产品, 一车间产 品合格率99%,二车间为95%,三车间为92%,四车间为90%,
计算该企业的平均产品合格率.
4 99% 95% 92% 90% =93.94%.
注:(1)
(2) 数值平均数主要适用于定量数据,而不适用于定性数据. (3) 简单数值平均数适用于未分组的资料,加权数值平均数 适用于分组的资料.
60分以下
2
60-70
30
70-80
8
80-90
4
90分以上
1
案例3:丙班《统计学》考试情况如下表:
60分以下
2
60-70
5
70-80
12
80-90
25
90分以上
7
问题
1、计算甲、乙、丙三个班的平均成绩;该平均值是真 实值还是近似值?如是近似值,什么情况下会是真实值?
2、计算甲、乙、丙三个班的中位数、众数;
时应用 2. 中位数
– 不受极端值影响 – 数据分布偏斜程度较大时应用 3. 平均数 – 易受极端值影响 – 数学性质优良
数值平均数与位置平均数的适用场合?
案例1:甲班《统计学》考试情况如下表:
60分以下
2
60-70
8
70-80
22
80-90
10
90分以上
4
案例2:乙班《统计学》考试情况如下表:
式中G表示几何平均数, xi表示各项标志值.
n
可以看作均值的一种变形lg G

1 n (lg x1 lg x2
lg xn )
lg xi
i 1
n
(2)加权几何平均数
n
G

fi
i1
x f1 1

x f2 2

n
xnfn
fi
i1
fi
xi
例3.1.1 一位投资者持有一种股票,1997,1998,1999,2000年 收益率分别为4.5%,2.0%,3.5%,5.4%. 计算该投资者在这四 年内的平均收益率.
2 位置平均数
①.众数(Mode)
一组数据中出现次数最多的变量值.
主要特点: ●不受极端值的影响. ●有的数据无众数或有多个众数.
说明:如果所有数据出现的次数都一样,那么这组数据没 有众数.
适用范围
众数主要用于分类数据,也可用于顺 序数据和数值型数据,对于未分组数据和 单项式分组数据,众数位置确定之后便找 到了众数.
1 H
11 x1 x2
n
n 1 11 xn x1 x2
百度文库
n
1 n 1
xn
x i1 i
(2) 加权调和平均数
n
H m1 m2 m3 mn m1 m2 m3 mn

mi
i 1
n mi
x1 x2 x3
xn
i1 xi
第四章 数据的描述性分析
本章内容
第一节 集中趋势的描述 第二节 离散程度的描述 第三节 分布的偏态与峰度
集中趋势
集中趋势反映的是一组数据向某一中 心值靠拢的倾向,在中心附近的数据数 目较多,而远离中心的较少。对集中趋 势进行描述就是寻找数据一般水平的中 心值或代表值。
位置平均数
众数 中位数
相关文档
最新文档