算术平均值的性质一
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Me
Li
n 2
Fi1 fi
(Ui
Li )
70
40 28 10 25
74.8
Me
Ui
n 2
Fi1 fi
(Ui
Li
)
80
40 27 25
10
74.8
中位数是位置平均数,不受极端值的影响。各个数值
相对其中位数的绝对离差之和为最小。
不足:中位数确定时只与中间位置的相关数据有关, 而不考虑其它数值的大小,缺乏敏感性;计算复杂。
i 1
N
N
它是反映数据集中的主要测度。
算术平均的统计含义:算术平均数是同质总体各 数据偶然性、随机性特征互相抵消后的稳定数值。反映 数据集中的特征。
例 某生产班组11个工人的日产零件数分别为:15,17,19, 20,22,…26,30。求该生产班组工人的平均日产零件数。
解: X 22
*
…*
22
75
i 1
二、中位数
将数据观察值x1,x2,…,xn按其变量值由小到 大的顺序排列,处于数列中点位置的数值就是中位 数(Me)。
中位数的确定方法: ①如果数据个数为奇数,则处于(n+1)/2位置的 标志值是中位数。
②如果数据个数为偶数,则处于n/2、n/2+1的两 个标志值的平均数为中位数。
③如果是组距分组资料,公式为:
则均值的计算公式为: k
X
X1 f1 X2 f2 .... X K f1 f2 .... fk
fk
Xi fi
i 1 k
fi
k i 1
Xi
fi
k
fi
i 1
i 1
其中Xi 表示第i 组的组中值,fi表示第i组的次数。
例:某单位80工人一周生产零件数的分组统计资料如下表:
工人一周生产零件数 60以下 60-70
n
Me
Li
2
Fi 1 fi
(U i
Li )
Me
Ui
n 2
Fi 1 fi
(U i
Li )
向上累积 向下累积
中位数是n/2位置上的数值,设落在第i组,
Li是中位数所在组的下限, fi是中位数所在组的次数。 Fi-1是中位数所在组的前一组的累积次数 Ui-Li是中位数所在组的组距 =上限-下限
某单位80工人一周生产零件数分组统计资料如下:
工人一周生 工人数fi 产零件数
组中值xi
xifi
向上累计频 向下累计频
数
数
60以下
7
55
385
7
80
60-70
21
65
1365
28
73
70-80
25
75
1875
53
52
80-90
19
85
1615
72
27
90以上
8
95
760
80
8
合计
80
---
6000
---
---
n 80
2
2
40, Fi1 28, Fi1 27, Li 70,Ui 80, fi 25
最小。
▪ 均值的缺点:均值易受极端值的影响,某个极端大值 或极端小值都会影响均值的代表性。同时还影响其对 集中趋势测度的准确性。
数列:1,2,2,3 平均数为2 数列:1,2,2,5 平均数为2.5
数列:1,2,2,7 平均数为3
2.加权算术平均数
如果数据是分组资料,经过整理形成了次数分配, 由于各组次数不同,要用次数作权数计算加权算术平 均数。
设众数在第i组,则
M0
Li
(
fi
fi fi1 fi1 ) ( fi
fi1 ) di
M0
Ui
( fi
fi fi1 fi1 ) ( fi
fi1 ) di
Li是众数所在组的下限, Ui是众数所在组的上限; fi是众数所在组的次数。 di= Ui-Li是中位数所在组的组距 =上限-下限
某单位80工人一周生产零件数分组统计资料如下:
三、众 数
▪ 众数是一组资料中出现次数最多的那个数值,也反 映数据集中的程度( M0 )。
▪ ①未分组资料,M0就是出现次数最多的变量值。 ▪ 20,15, 18,20,20,22,20,23
▪ 20,20,15,19, 19, 20,19,25
▪ 10,11,13,16,15,25 ,8,12
②分组资料:在等距分组的情况下,频数最多的组是 众数组,在该组内确定众数。
M0
Li
(
fi
fi fi1 fi1 ) ( fi
fi1 ) di
70
25 21
10 74
(25 21) (25 19)
M0
Ui
(
fi
fi fi1 fi1 ) ( fi
fi1 ) di
80
25 19
10 74
(25 21) (25 19)
在Excel中
▪ AVERAGE()—计算算术平均数 ▪ 利用SUM()函数和SUMPRODUCT()函数求加权算
第四章 集中趋势和离中趋势
4.1 集中趋势的计量 4.2 离中趋势的计量 4.3 数据的分布形状
4.1 集中趋势的计算
集中趋势反映一组数据中各数据所具有的共同 趋势,即资料中各数据聚集的位置。
一、算术平均(也叫均值 )
▪ 1.简单算术平均数
计算公式:
N
X
X1 X 2 ...... X N
Xi
工人数fi 7 21
组中值xi 55 65
xifi 385 1365
70-80
25
75
1875
80-90 90以上 合计
19
85
8
95
80
---
1615 760 6000
k
则加权算术平均为: X
x1 f1 x2 f2 L xk f1 f2 L fk
fk
xi fi
i 1 k
fi
6000 80
工人一周生 工人数fi 产零件数
组中值xi
xifi
向上累计频 向Байду номын сангаас累计频
数
数
60以下
7
55
385
7
80
60-70
21
65
1365
28
73
70-80
25
75
1875
53
52
80-90
19
85
1615
72
27
90以上
8
95
760
80
8
合计
80
---
6000
---
---
fi 25, fi121 , fi1 19, Li 70,Ui 80, di 10,
术平均。 ▪ MEDIAN()—计算中位数 ▪ MODE()—计算众数
四、均值、中位数、众数三者之间的关系
f
f
f
Mo Me x
x Me Mo
(对称分布)
X
Mo Me x
X
x Me Mo 正偏态分布(右)
X
xMeMo
x Me Mo
负偏态分布(左)
均值是数据分布的平衡点或重心,中位数把这个分 布划分为两半,众数正好是分布的顶端。
* * **
*
算术平均值的性质一:数据观察值与均值的离差值 之和为零.
▪ 此性质表明均值是各数值的重心
N
(Xi X) 0
i 1
算术平均值的性质二:观察值与均值的离差平方
和最小。 N
N
2
▪ X 0为任意数 ( Xi X 0 )2 ( Xi X )
i 1
i 1
故用算术平均值来预测作为估计值,误差平方和