统计学-数据的描述性分析 PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
位置平均数
1.众数(Mode)
一组数据中出现次数最多的变量值.
主要特点: ●不受极端值的影响. ●有的数据无众数或有多个众数.
① 只有总体单位数比较多,而且又有明显的集中趋势时才
存在众数。
M0
M0
M0
若有两个次数相等的众数,则称复众数。
M0
M0
② 在单位数很少,或单位数虽多但无明显集中 趋势时,计算众数是没有意义的。
xi x =0
i =1
(2).各变量值与均值的离差平方和最小.
n
2
xi x = min
i =1
△ 算术平均数的特点
算术平均数适合用代数方法运算,因此运用 比较广泛;
易受极端变量值的影响,使X 的代表性变小; 受极大值的影响大于受极小值的影响;
当组距数列为开口组时,由于组中值不易确 定,使X 的代表性也不很可靠;同时要求各单位 标志值在组内是均匀分布的,此时各组的平均数正好 等于它的组中值。故用组中值计算得出来的平均数只
Gnx1x2Lxn xi1 n
式中G表示几何平均数, x i 表示各项标志值.
(2)加权几何平均数
n
n
G i1fi x1f1x2f2Lxnfn
fi
i1
fi
xi
例 某企业四个车间流水作业生产某产品, 一车间产品合 格率99%,二车间为95%,三车间为92%,四车间为90%, 计算该企业的平均产品合格率.
4 9 9 % 9 5 % 9 2 % 9 0 % = 9 3 .9 4 % .
△ 几何平均数的特点
如果数列中有一个标志值等于零或负值, 就无法计算 X;G
受极端值的影响较 X和 小X h; 它适用于反映特定现象的平均水平,即 现象的总标志值是各单位标志值的连乘积。
注:(1)
(2) 数值平均数主要适用于定量数据,而不适用于定性数据. (3) 简单数值平均数适用于未分组的资料,加权数值平均数 适用于分组的资料.
(5 0 1)9 (5 0 3)6
由上限公式,日产量众数8 0 5 0 36 1 07.8 6(千 9 )克
(5 0 1)9 (5 0 3)6
△ 众数的特点
众数是一个位置平均数,它只考虑总体分布中 最频繁出现的变量值,而不受各单位标志值的影 响,从而增强了对变量数列一般水平的代表性。
不受极端值和开口组数列的影响。
=mmX
在社会经济统计学中经常用到的仅是一种特定权 数的加权调和平均数。即有以下数学关系式成立:
X
Xf f
Xf
1 X
Xf
m
m X
Xh
式中:m Xf ,f m X
m是一种特定权数,它不是各组变量值出现的次 数,而是各组标志值总量。
△ 调和平均数的特点
如果数列中有一标志值等于零,则无法 计算 X;h
• 权数:各组次数(频数)的大小所对应的标志值对平均数
的影响具有权衡轻重的作用.
• 当各组的次数都相同时,即当f1=f2=f3=L=fn 时:
加权算术平均数就等于简单算术平均数.
n
n
n
xi fi f xi
xi
x
i1 n
fi
i1
nf
i1 n
i1
例:计算某车间工人加工零件平均数(组距式数列)
解: X i xi fi 264066个 fi 40
i
关于计算结果的说明
●根据原始数据和分组资料计算的结果一般不会完全相等, 根据分组数据只能得到近似结果.
●只有各组数据在组内呈对称或均匀分布时,根据分组资料 的计算结果才会与原始数据的计算结果一致.
(1).各变量值与均值的离差之和等于零.
n
一、 数值平均数
数值平均数包括算术平均数、调和平均数和几何平均数.
1.算术平均数(均值, Arithmetic Mean)
总体均值常用X 或 表示,样本均值常用 x 表示,样本均值
的计算公式:
简单算术平均数:
xx1 x2
xn
n
xi
i1
nn
n
加权算术平均数:
x
xi fi
i1 n
fi
权数的意义和作用
能是一个近似值。
2、调和平均数(又称“倒数平均数”)
调和平均数是各个变量值倒数的算术 平均数的倒数。
其计算方法如下:
(1).先计算各个变量值的倒数,即 1
X
(2).计算上述各个变量值倒数的算术平均数,即
1 X
n
(3).再计算这种算术平均数的的倒数,就是调和平均数,即 n
Xh
n
1 X
1 X
X 在加权的情况下:h
众数是一个不容易确定的平均指标,当分布数 列没有明显的集中趋势而趋均匀分布时,则无众 数可言;当变量数列是不等距分组时,众数的位
置也不好确定。
2.中位数(Median)
中位数是一组数据按一定顺序排列后,处于中间位置 上的变量
本章内容
第一节 集中趋势的描述 第二节 离散程度的描述 第三节 分布的偏态与峰度
集中趋势
集中趋势反映的是一组数据向某一中心值 靠拢的倾向,在中心附近的数据数目较多, 而远离中心的较少。对集中趋势进行描述就 是寻找数据一般水平的中心值或代表值。
1.数值平均数:是以统计数列的所有数据来计算的平 均数.其特点是统计数列中任何一项数据的变动,都会 在一定程度上影响数值平均数的计算结果. 2.位置平均数:它不是对统计数列中所有数据进行计 算所得的结果,而是根据数列中处于特殊位置上的个 别单位或部分单位的标志值来确定的.
下三图无众数:
说明:如果所有数据出现的次数都一样,那么这组数据没 有众数.
适用范围
众数主要用于分类数据,也可用于顺序数据和数值型数据, 对于未分组数据和单项式分组数据,众数位置确定之后便 找到了众数.
例:分类数据的众数
例:顺序数据的众数
数值型数据众数的计算方法
① 根据单项数列确定众数;
例
某种商品的价格情况
众数M0=3.00(元)
② 根据组距数列确定众数
(ⅰ) 由最多次数来确定众数所在组; (ⅱ)利用比例插值法推算众数的近似值。
例 表中70-80,即众数所在组。
计算众数的近似值:
下限公式: M0 XL112 d 上限公式: M0 XU122 d
由下限公式,日产量众数7 0 5 0 19 1 07.8 6(千 9 )克
较之算术平均数,X h 受极端值的影响要小。
例.某蔬菜批发市场三种蔬菜日成交数据如下表,计算三 种蔬菜该日的平均批发价格.
Fra Baidu bibliotek
3.几何平均数(Geometric Mean),又称“对数平均数” 是另一种形式的平均数,是n个标志值乘积的 n 次方根.主 要用于计算平均比率和平均速度. (1)简单几何平均数