统计学常用公式
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
公式一
1.众数【MODE ]
(1) 未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。 (2) 组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组, 再根据下面
的公式计算计算众数的近似值。
下限公式:
M 0
二L+ 1
— i
△l
+心2
式中:M o 表示众数;L 表示众数的下线;."■:!表示众数组次数与上一组次数之差;■"■: 2表示 众数组次数与下一组次数之差;i 表示众数组的组距。
上限公式:
M o 二i
式中:U 表示众数组的上限。
2.中位数【MEDIAN ]
(1)未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。 设一组数
据按从小到大排序后为X 1
,X 2
,…,X N
,中位数M e
,为则有:
M e =X ( N+1) 当N 为奇数
1
I
I
M e 二-X N +X N
当N 为偶数
2
2
+1
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式 N / 2确定中位数的位置,并确定中位数所在的 组,然后采用下面的公式计算中位数的近似值:
式中:M e
表示中位数;L 表示中位数所在组的下限;S m-1
表示中位数所在组以下各组的累 计次数;f m
表示中位数所在组的次数;d 表示中位数所在组的组距
M e = L+ i=1
2
-S
m-1
3.均值的计算【AVERAGE ]
(1)未经分组均值的计算
未经分组数据均值的计算公式为:
(2)分组数据均值计算
k
y x
一x i f i+x 2 +2 +X k f k _ 仁i
x= --- k~
fi + f2+ill+f k 實
i=4
4.几何平均数【GEOMEAN ]
几何平均数是N个变量值乘积的N次方根,计算公式为:
式中:G表示几何平均数;|丨表示连乘符号
5.调和平均数【HARMEAN ]
调和平均数是对变量的倒数求平均,然后再取倒数而得到的平均数, 与加权
调和平均数两种计算形式。
它有简单调和平均数
简单调和平均数:H= n
H= 1 1 1
+ +•••+ —
X i x2 x n
n
口
id x i
加权调和平均数:H
= m i+m2+…+m n
=凹+匹+...+m
X i x2x n
n
二m i
i T
J m
id x i
x=
x1+x x
f i
1
分组数据均值的计算公式为:
6 .极差【Range]
极差也称全距,是一组数据的最大值与最小值之差,即
R 二m a 冬-mxi n
式中:R表示极差;max区)和min区)分别表示一组数据的最大值与最小值。
7 .平均差【Mean Deviation】
平均差是各标志值与其平均数的绝对离差的算术平均。
式中:AD表示平均差
8 .方差【Variance]和标准差【Standard Deviation]
方差是各变量值与其均值离差平方的平均数。要求掌握方差和标准差的计算方法。
未分组数据方差的计算公式为:J x-X 2 i电
分组数据方差的计算公式为:' Xj _~x
i
=1
(1)根据未分组资料的计算公式:
n
送X -X
i A D =^-
n
(2)根据分组资料的计算公式:AD= Z x i-x f i
n
方差的平方根即为标准差,其相应的计算公式为:
未分组数据:
分组数据:
式中:二表示标准差。
9.离散系数
离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准 差与其相应的均值之比,是测度数据离散程度的相对指标。
其计算公式为: V .-一 =—
x
式中:V ;「表示离散系数。
10 .偏态【SKEW ]
偏态是对分布偏斜方向及程度的测度。 利用众数、中位数和均值之间的关系就可以判断分 布是左偏还是右偏。显然,判别偏态的方向并不困难,但要测度偏斜的程度就需要计算偏态系 数了。
11.峰值【KURT ]
EXCEL 中峰值系数的计算公式为:
2
3(n -1) n-1 n-3
EXCEL 中偏态系数的计算公式为:
n £円
(n j n -2二.s 一
WF £ 日]
n
T Y n -2 I n -3 ) g i s j
(1)样本均值的标准差
样本均值的标准差,即为样本均值的标准误差,又称为样本均值的抽样平均误差,它反映的是所有可能样本的均值与总体均值的平均差异程度,反映了所有可能样本的实际抽样误差水平。
样本均值的抽样平均误差计算公式为:
重复抽样方式:
;「2
N
-n
\ n N-1
通常情况下,当N很大时,(N-1 )几乎等于N,样本均值的抽样平均误差的计算公式也可简化为:
在公式中,二是总体标准差。但实际计算时,所研究总体的标准差通常是未知的,在大样本的情况下,通常用样本标准差S代替。
(2)大样本均值的极限误差
(3)大样本下总体均值的区间估计
总体均值的置信度为(1 )的置信区间:
X 一乙云X」—X z 2二x
_ CT _ CT
即X -Z-.2 x z,2
(4)总体方差未知,小样本正态总体均值的区间估计
总体均值的置信度为(1 -:)的置信区间:
X —t: 2二X < —X t/ X
-J- X t:.2
公式二
不重复抽样方式: