统计学常用公式

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

公式一
1. 众数【MODE 】
(1) 未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。

(2) 组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。

下限公式: 1
012
M =L+
+i ∆⨯∆∆ 式中:0M 表示众数;L 表示众数的下线;1∆表示众数组次数与上一组次数之差;2∆表示众数组次数与下一组次数之差;i 表示众数组的组距。

上限公式:
2
012
M =U-+i ∆⨯∆∆ 式中:U 表示众数组的上限。

2.中位数【MEDIAN 】
(1)未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。

设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:
e N+M =X
1
()2
当N 为奇数
e N N +1221M =X +X 2⎛⎫⎛⎫
⎪ ⎪⎝⎭⎝⎭⎧⎫⎪⎪
⎨⎬⎪⎪⎩⎭ 当N 为偶数
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:
N
=1
m-1
e m
-S 2
M =L+
i
i f
d f ⨯∑
式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。

3.均值的计算【A VERAGE 】
(1)未经分组均值的计算
未经分组数据均值的计算公式为: 112n ++=
=n
i
i x x x x x n n
=∑…
(2)分组数据均值计算
分组数据均值的计算公式为: 11221121
+++==+k
i i
k k i k k
i
i x f x f
x f x f
x f f f f
==+∑∑+
4.几何平均数【GEOMEAN 】
几何平均数是N 个变量值乘积的N 次方根,计算公式为:
式中:G 表示几何平均数;∏表示连乘符号。

5.调和平均数【HARMEAN 】
调和平均数是对变量的倒数求平均,然后再取倒数而得到的平均数,它有简单调和平均数与加权调和平均数两种计算形式。

简单调和平均数: 211H=
=
111
+++n
i
n
i n n x x x x =∑1…
加权调和平均数: 2121
1211m m +m ++m H==m m m m +++n i n
i n i n
n i
i x x x x ==∑∑…… 式中:H 表示调和平均数。

6.极差【Range 】
极差也称全距,是一组数据的最大值与最小值之差,即 ()()
R=max -min i i x x
式中:R 表示极差;()
max i x 和()
min i x 分别表示一组数据的最大值与最小值。

7.平均差【Mean Deviation 】
平均差是各标志值与其平均数的绝对离差的算术平均。

(1) 根据未分组资料的计算公式: 1
-AD=
i
n
i x x
n
=∑
(2) 根据分组资料的计算公式: 1
1
-AD=
i
n
i
i n
i
i x x
f f
==∑∑
式中:AD 表示平均差
8.方差【Variance 】和标准差【Standard Deviation 】
方差是各变量值与其均值离差平方的平均数。

要求掌握方差和标准差的计算方法。

未分组数据方差的计算公式为: ()
2
21
n
i x x n
σ=-=

分组数据方差的计算公式为: ()
2
21
1
i
n
i
i n
i
i x
x
f f
σ==-=
∑∑
式中:2σ表示方差。

方差的平方根即为标准差,其相应的计算公式为:
未分组数据:
σ=
分组数据:
σ=
式中:σ表示标准差。

9.离散系数
离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。

其计算公式为: V x
σσ
=
式中:V σ表示离散系数。

10.偏态【SKEW 】
偏态是对分布偏斜方向及程度的测度。

利用众数、中位数和均值之间的关系就可以判断分布是左偏还是右偏。

显然,判别偏态的方向并不困难,但要测度偏斜的程度就需要计算偏态系数了。

EXCEL 中偏态系数的计算公式为: ()()3
1--1-2i n
i x x n
n n s =⎡⎤⎢⎥⎣⎦

11.峰值【KURT 】
EXCEL 中峰值系数的计算公式为:
()()()()()(
)()42
1-13112313i
n i x x n n n n n n s n n =⎧⎫+-⎛⎫⎪⎪-⎨⎬ ⎪-----⎝⎭⎪⎪⎩⎭∑ 式中:s 表示样本标准差。

公式二
1.
均值估计
(1)样本均值的标准差
样本均值的标准差,即为样本均值的标准误差,又称为样本均值的抽样平均误差,它反映的是所有可能样本的均值与总体均值的平均差异程度,反映了所有可能样本的实际抽样误差水平。

样本均值的抽样平均误差计算公式为:
重复抽样方式: ()x σ==
不重复抽样方式: ()x σ=
通常情况下,当N 很大时,(N-1)几乎等于N ,样本均值的抽样平均误差的计算公式也可简化为:
()x σ=
在公式中,σ是总体标准差。

但实际计算时,所研究总体的标准差通常是未知的,在大样本的情况下,通常用样本标准差S 代替。

(2)大样本均值的极限误差 ()2x Z x ασ∆= (3)大样本下总体均值的区间估计
总体均值的置信度为(1α-)的置信区间:
()()
22x z x x z x αασμσ-≤≤+ 即22
x z x z ααμ-≤≤+(4)总体方差未知,小样本正态总体均值的区间估计
总体均值的置信度为(1α-)的置信区间:
()()22x t x x t x αασμσ-≤≤+

2
2x t x t ααμ-≤≤+
2.比例估计
(1)样本比例的抽样平均误差
样本比例的抽样平均误差为:
重复抽样下: ()p σ=
上式中,p 应为总体比例,实际计算时通常用样本比例p 代替。

不重复抽样下: ()p σ=≈ (2)样本比例的抽样极限误差
()2P Z p ασ∆=
(3)总体比率的区间估计
总体比例P 的置信度为(1α-)的置信区间为:
P P p p p -∆≤≤+∆
即 ()()22p Z p p p Z p αασσ-≤≤+
3. 总体均值检验
(1) 单一总体均值检验
①正态总体(总体方差已知)或大样本均值检验
检验统计量Z 为: x Z
=
②正态总体(总体方差未知)小样本均值检验
检验统计量t 为:
x t
=
(2) 两个总体的均值检验
①两个正态总体均值检验——两个总体方差已知或大样本
Z 检验统计量为:
-x x Z μμ--=
大样本下对两个总体均值进行检验时,在总体标准差未知的情况下,可用样本标准差代替总体标准差进行计算,检验统计量不变。

②两个正态总体均值检验(小样本)——两个总体方差未知但相等
T 检验统计量为:
-x x Z μμ--=
p s =
其中: ()
12
2
1
11111i n i s x x n ==--∑; ()
22
2
221
211i n i s x x n ==--∑
4. 总体比例检验
(1) 单一总体的比例检验
Z 检验统计量:
Z =
(2) 两个总体比例的检验
检验的统计量为:
Z =
其中:112212
ˆˆˆn p
n p p
n n +=+,ˆp
为当12p p =时1p 和2p 的联合估计值。

5. 总体方差假设检验
(1) 单一正态总体方差的假设检验
检验统计量为:
()22
2
1n s χσ-= 其中:(
)
2
2
1
1
i n
i x x
s n =-=
-∑为2σ的估计量。

(2) 两个正态总体的方差假设检验
检验统计量为: 22
12F s s =
其中: (
)
1
2
2
1
1
11
i n i x x
s n =-=
-∑; (
)
2
2
21
2
21
i n i x x
s n =-=
-∑。

公式三
1.单因素方差分析
设总体共分为k 种处理进行观察,第j 种处理试验了容量为j n 的样本。

(1) 计算各项离差平方和
在单因素方差分析中,需要计算的离差平方和有3个,它们分别是总离差平方和,误差项离差平方和以及水平项离差平方和。

总离差平方和,用SST (Sum of Squares for Total )代表:
()
2
11j
n k
ij i j SST x x ===-∑∑
式中:x 表示全部样本观测值的总均值。

其计算公式为:
ij
x
x n
=
∑∑
误差离差平方和,用SSE (Sum of Squares for Error )代表:
()2
11j
n k
ij j i j SSE x x ===-∑∑
式中:j x 表示第j 种水平的样本均值,1
j
n ij
i j j
x
x n ==

水平项离差平方和。

为了后面叙述方便,可以把单因素方差分析中的因素称为A 。

于是水平项离差平方和可以用SSA (Sum of Squares for Factor A )表示。

SSA 的计算公式为: ()
2
11j
n k
j i j SSA x x ===-∑∑
(2) 计算平均平方
用离差平方和除以自由度即可得到平均平方和(Mean Square )。

对SST 来说,其自由度为(n-1);对SSA 来说,其自由度为(r-1),这里r 表示水平的个数;对SSE 来说,其自由度为(n-r )。

与离差平方和一样,SST 、SSA 、SSE 之间的自由度也存在着如下的关系:
n-1=(r-1)+(n-r )
对于SSA ,其平均平方MSA (组间均方差)为: 1SSA
MSA r =
- 对于SSE ,其平均平方MSE (组内均方差)为: SSE
MSE n r
=
- (3) 检验统计量F MSA
F MSE
=
2.两因素方差分析
设两个因素A 、B 分别有k 个水平和n 个水平,共进行nk 次试验。

(1) 计算各项离差平方和
在两因素方差分析中,需要计算的离差平方和有4个,它们分别是总离差平方和,误差项离差平方和以及水平A 、B 项离差平方和。

总离差平方和,用SST (Sum of Squares for Total )代表: ()
2
ij SST x x =-∑∑
式中:x 表示全部样本观察值的总均值,其计算公式为: 11
1n k
ij i j x x nk ===∑∑
水平项离差平方和可以分别用SSA (Sum of Squares for Factor A )和SSB (Sum of Squares for Factor B )表示。

SSA 的计算公式为: ()
2
11n
k
j i j SSA x x •===-∑∑
式中: 1
1n
j ij i x x n •==∑
SSB 的计算公式为: ()
2
11
n k
i i j SSB x x •===-∑∑
式中: 1
1k
i ij j x x k •==∑
误差离差平方和,用SSE (Sum of Squares for Error )代表: ()
2
11n
k
ij i j i j SSE x x x x ••===--+∑∑
(2) 计算平均平方
用离差平方和除以自由度即可得到平均平方和(Mean Square )。

对SST 来说,其自由度为(nk-1);对SSA 来说,其自由度为(k-1),这里k 表示水平A 的个数;对SSB 来说,其自由度为(n-1),这里n 表示水平B 的个数;对SSE 来说,其自由度为(n-1)(k-1)。

这样,把各项离差平方和除以各自的自由度,即得到平均的离差平方和,简称为均方:
1SSA MSA k =
- 1SSB
MSB n =- ()()
11SSE MSE k n =-- (3) 检验统计量F
()MSA F A MSE =
()MSB
F B MSE
= 公式四
1.拟合优度的检验统计量:
()
2
21k
i e i e
f f f χ=-=∑
式中:i f 表示类别i 的观察频数;e f 表示假设0H 为真时,类别i 的期望频数;k 表示类别总数。

注意:当所有种类的期望频数均大于或等于5时,检验统计量服从自由度为(k-1)的2χ分布。

相关文档
最新文档