数据的描述性分析PPT

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。




算术平均数
数值平均数 调和平均数
几 何 平 均 数
4
1.数值平均数:是以统计数列的所有数据 来计算的平均数.其特点是统计数列中任 何一项数据的变动,都会在一定程度上影 响数值平均数的计算结果. 2.位置平均数:它不是对统计数列中所有 数据进行计算所得的结果,而是根据数列 中处于特殊位置上的个别单位或部分单 位的标志值来确定的.
21
②.中位数(Median) 中位数是一组数据按一定顺序排列后,处于中间位置 上的变量
22
23
24
负偏 注: (1)中位数总是介于众数和平均数之间.
正偏
25
(2) 皮尔逊经验法则 分布在轻微偏斜的情况下,众数、中位数和算术平均 数数量关系的经验公式为:
xM o3(xM e)
26
众数、中位数、平均数的特点和应用 1. 众数
计算该企业的平均产品合格率.
4 9 9 % 9 5 % 9 2 % 9 0 % = 9 3 .9 4 % .
15
注:(1)
(2) 数值平均数主要适用于定量数据,而不适用于定性数据. (3) 简单数值平均数适用于未分组的资料,加权数值平均数 适用于分组的资料.
16
2 位置平均数
①.众数(Mode) 一组数据中出现次数最多的变量值.
30
案例3:丙班《统计学》考试情况如下表:
31
问题
1、计算甲、乙、丙三个班的平均成绩;该平均值是真 实值还是近似值?如是近似值,什么情况下会是真实值?
2、计算甲、乙、丙三个班的中位数、众数;
3、如要选择从算术平均数、中位数和众数三个平均数 中选择一个数来分别代表甲、乙、丙三个班的整体水平, 请问你会选择哪个平均数?为什么?
– 不受极端值影响 – 具有不惟一性 – 数据分布偏斜程度较大且有明显峰值
时应用 2. 中位数
– 不受极端值影响 – 数据分布偏斜程度较大时应用 3. 平均数 – 易受极端值影响 – 数学性质优良
27
数值平均数与位置平均数的适用场合?
28
案例1:甲班《统计学》考试情况如下表:
29
案例2:乙班《统计学》考试情况如下表:
5
1. 数值平均数
数值平均数包括算术平均数、调和平均数和几何平均数.
①.算术平均数(均值, Arithmetic Mean)
总体均值常用X 或 表示,样本均值常用 x 表示,样本均值
的计算公式:
简单算术平均数:
xx1 x2
xn
n
xi
i1
nn
n
加权算术平均数:
x
xi fi
i1 n
fi
6
权数的意义和作用
解: X i xi fi 264066个 fi 40
i
8
关于计算结果的说明
●根据原始数据和分组资料计算的结果一般不会完全相等, 根据分组数据只能得到近似结果.
●只有各组数据在组内呈对称或均匀分布时,根据分组资料 的计算结果才会与原始数据的计算结果一致.
(1).各变量值与均值的离差之和等于零.
n
xi x =0
i =1
(2).各变量值与均值的离差平方和最小.
n
2
xi x = min
9
i =1
②.调和平均数(倒数平均数, Harmonic Mean)
调和平均数分为简单调和平均数和加权调和平均数. (1)简单调和平均数 标志值的倒数的算术平均数的倒数.
H
1
11
ຫໍສະໝຸດ Baidu
x1 x2
n
n
1 11
• 权数:各组次数(频数)的大小所对应的标志值对平均数
的影响具有权衡轻重的作用.
• 当各组的次数都相同时,即当f1= f2= f3= = fn 时:
加权算术平均数就等于简单算术平均数.
n
n
n
xi fi f xi
xi
x
i1 n
fi
i1
nf
i1 n
i1
7
例:计算某车间工人加工零件平均数(组距式数列)
确定
2
中位数的位置,并对照累计次数确定中位数。
下限公式:
n
fi
Me L
i 1
2
sm1 i
fm
33
L 为中位数组的下限;
f 为总次数;
Sm1 为中位数组前一组的向上累计次数;
12
③.几何平均数(Geometric Mean)
是另一种形式的平均数,是n个标志值乘积的 n 次方根.主 要用于计算平均比率和平均速度.
(1)简单几何平均数
G nx1x2
1
xn xin
式中G表示几何平均数, x i 表示各项标志值.
n
可以看作均值的一种变形lgG1(
n
lgxi lxg1lgx2 lgxn)1i31n
第四章 数据的描述性分析
1
本章内容
第一节 集中趋势的描述 第二节 离散程度的描述 第三节 分布的偏态与峰度
2
集中趋势
集中趋势反映的是一组数据向某一中 心值靠拢的倾向,在中心附近的数据数 目较多,而远离中心的较少。对集中趋 势进行描述就是寻找数据一般水平的中 心值或代表值。
3



均数
众数 中 位 数
(2)加权几何平均数
n
n
G i1fi x1f1x2f2
xnfn
fi
i1
fi
xi
14
例3.1.1 一位投资者持有一种股票,1997,1998,1999,2000年 收益率分别为4.5% ,2.0% ,3.5% ,5.4% .计算该投资者在这四 年内的平均收益率.
例3.1.2 某企业四个车间流水作业生产某产品, 一车间产 品合格率99%,二车间为95%,三车间为92%,四车间为90%,
4、如要分别反映甲、乙、丙三个班的考试情况,你会 选择用哪些指标来衡量?
5、如要比较甲、乙、丙三个班的考试情况的优劣,你 又会选择什么样的指标来衡量?
6、甲乙丙三个班的考试成绩分别服从对称分布、左
偏分布、右偏分布中的哪种分布?为什么?
32
由组距数列确定中位数
n
先计算各组的累计次数,再按公式
i
1
fi
xn x1 x2
1
n n1
xn x i1 i
10
(2) 加权调和平均数
n
H m1m2 m3 mn
m1 m2 m3 mn
mi
i1
n mi
x1 x2 x3
xn
x i1 i
式中,m表示各单位或各组的标志值对应的标志总量.
11
例.某蔬菜批发市场三种蔬菜日成交数据如下 表,计算三种蔬菜该日的平均批发价格.
主要特点: ●不受极端值的影响. ●有的数据无众数或有多个众数.
说明:如果所有数据出现的次数都一样,那么这组数据没 有众数.
17
18
适用范围
众数主要用于分类数据,也可用于顺 序数据和数值型数据,对于未分组数据和 单项式分组数据,众数位置确定之后便找 到了众数.
19
例:分类数据的众数
20
例:顺序数据的众数
相关文档
最新文档