统计学公式汇总
(完整版)统计学公式大全
(完整版)统计学公式大全
统计学公式大全
本文档旨在提供统计学领域常用的公式大全,便于大家在研究和实践中进行参考和应用。
描述统计学公式
中心趋势度量
1. 平均数(Mean):$\bar{x} =
\frac{{\sum_{i=1}^{n}x_i}}{n}$
2. 中位数(Median):若数据个数为奇数,中位数为排序后的中间值;若数据个数为偶数,中位数为排序后的中间两个值的平均值。
3. 众数(Mode):出现频率最高的数值。
离散趋势度量
1. 方差(Variance):$Var(x) = \frac{{\sum_{i=1}^{n}(x_i - \bar{x})^2}}{n}$
2. 标准差(Standard Deviation):$SD(x) = \sqrt{Var(x)}$
3. 极差(Range):$Range(x) = \max(x) - \min(x)$
分布形状度量
1. 偏度(Skewness):$\text{Skewness} =
\frac{{\sum_{i=1}^{n}(x_i - \bar{x})^3}}{n \cdot SD(x)^3}$
2. 峰度(Kurtosis):$\text{Kurtosis} =
\frac{{\sum_{i=1}^{n}(x_i - \bar{x})^4}}{n \cdot SD(x)^4}$ 推断统计学公式
参数估计
1. 样本均值的抽样分布标准差(Standard Error of the Mean):$SE(\bar{x}) = \frac{{SD(x)}}{\sqrt{n}}$
统计学公式大全
• 报告期水平与某一固定时期水平之差 • 计算形式为:Δi=Yi-Y0 (i=1,2,…,n)
3. 各逐期增长量之和等于最末期的累积增长量
平均增长量
(概念要点)
• 1. 观察期内各逐期增长量的平均数 • 2. 描述现象在观察期内平均增长的数
量 • 3. 平计均算增公长式量为 逐 逐期 期增 增长 长量 量个 之数 和
2. 综合指数
– 反映多个项目变量的综合变动 – 如多种商品的价格或销售量的综合变动
权数的确定
(要点)
1. 根据现象之间的联系确定权数
– 计算数量指数时,应以相应的质量为权数 – 计算质量指数时,应以相应的物量为权数
2. 确定权数的所属时期
– 可以都是基期,也可以都是报告期或某一固定时期 – 使用不同时期的权数,计算结果和意义不同 – 取决于计算指数的预期目的
4. r2 1,说明回归方程拟合的越好;r20
,说明回归方程拟合的越差
5. 判定系数等于相关系数的平方,即r2=(r)2
指数的概念和性质
(概念要点)
1. 指数的概念
– 广义:任何两个数值对比形成的相对数 – 狭义:用于测定总体各变量在不同场合下综合变动
的一种特殊相对数
2. 指数的性质
– 相对性:总体变量在不同场合下对比形成的相对数
2 i1 K Fi i 1
统计学公式汇总
统计学公式汇总
统计学是研究数据收集、分析、解释和预测的一门学科。在统计学中,有许多重要的公式被广泛应用于数据的处理和分析过程中。本文
将汇总一些常见的统计学公式,并简要介绍其应用场景和使用方法。
1. 均值(Mean)
均值是统计学中最常用的概念之一,用于衡量一组数据的集中趋势。对于一个样本集合,均值可以通过将所有观测值相加,然后除以样本
容量来计算。其数学公式如下:
均值= ∑(观测值) / 样本容量
2. 方差(Variance)
方差是用于衡量一组数据的离散程度的指标。方差越大,表示数据
的离散程度越高;方差越小,表示数据的离散程度越低。方差的计算
公式如下:
方差= ∑((观测值-均值)^2) / 样本容量
3. 标准差(Standard Deviation)
标准差是方差的平方根,用于衡量数据的离散程度,并且具有和原
始数据相同的单位。标准差的计算公式如下:
标准差 = 方差的平方根
4. 相关系数(Correlation Coefficient)
相关系数用于衡量两组变量之间的线性关系强度和方向。相关系数的取值范围在-1到1之间,其中-1表示完全的负相关,1表示完全的正相关,0表示无相关。相关系数的计算公式如下:
r = Cov(X,Y) / (σX * σY)
5. 回归方程(Regression Equation)
回归方程用于建立一个或多个自变量与因变量之间的线性关系。回归方程的一般形式为:
Y = β0 + β1X1 + β2X2 + ... + βnXn + ε
其中,Y表示因变量,X1、X2、...、Xn表示自变量,β0、β1、
统计学常用公式
公式一
1. 众数【MODE 】
(1) 未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。
(2) 组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。 下限公式: 1
012
M =L+
+i ∆⨯∆∆ 式中:0M 表示众数;L 表示众数的下线;1∆表示众数组次数与上一组次数之差;2∆表示众数组次数与下一组次数之差;i 表示众数组的组距。 上限公式: 2
012
M =U-+i ∆⨯∆∆ 式中:U 表示众数组的上限。
2.中位数【MEDIAN 】
(1)未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:
e N+M =X
1
(
)2
当N 为奇数
e N N +1221M =X +X 2⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭⎧⎫⎪⎪
⎨⎬⎪⎪⎩⎭
当N 为偶数
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:
N
=1
m-1
e m
-S 2
M =L+
i
i f
d f ⨯∑
式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。
3.均值的计算【AVERAGE 】
(1)未经分组均值的计算
未经分组数据均值的计算公式为: 112n ++=
统计学常用公式汇总
《统计学原理》常用公式汇总(一)第三章统计整理
a) 组距=上限-下限b) 组中值=(上限+下限)÷2
c) 缺下限开口组组中值=上限-1/2邻组组距
d) 缺上限开口组组中值=下限+1/2邻组组距
第四章综合指标
i. 相对指标
1.结构相对指标=各组(或部分)总量/总体总量
2.比例相对指标=总体中某一部分数值/总体中另一部分数值
3.比较相对指标=甲单位某指标值/乙单位同类指标值
4.强度相对指标=某种现象总量指标/另一个有联系而性质不同的现象总量指标
5.计划完成程度相对指标=实际数/计划数
=实际完成程度(%)/计划规定的完成程度(%)
ii.平均指标
1.简单算术平均数:
2.加权算术平均数或
iii.变异指标
1.全距=最大标志值-最小标志值
2.差: 简单σ= ;加权σ=
3.差系数:
第五章抽样估计
1.平均误差:
重复抽样:
不重复抽样:
2.抽样极限误差
3.重复抽样条件下:
平均数抽样时必要的样本数目
成数抽样时必要的样本数目
4.不重复抽样条件下:
平均数抽样时必要的样本数目
第七章相关分析
1.相关系数
2.配合回归方程y=a+bx
3.估计误:
第八章指数分数
一、综合指数的计算与分析
(1)数量指标指数
此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。
( - )
此差额说明由于数量指标的变动对价值量指标影响的绝对额。
(2)质量指标指数
此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。
( -)
此差额说明由于质量指标的变动对价值量指标影响的绝对额。
加权算术平均数指数=
加权调和平均数指数=
(3)复杂现象总体总量指标变动的因素分析
概率与统计学公式大全
概率与统计学公式大全
概率与统计学是一门关于随机事件发生规律及其数学描述的学科。在实际问题的分析和决策中,概率与统计学都起着重要的作用。本文将汇总一些常用的概率与统计学公式,帮助读者更好地理解和应用这门学科。
一、概率公式
1. 概率的基本概念:
概率是指某个特定事件发生的可能性大小。用P(A)表示事件A发生的概率,有以下公式:
P(A) = N(A) / N(S)
其中,N(A)表示事件A包含的基本样本点的个数,N(S)表示全样本空间的基本样本点的个数。
2. 随机变量的概率分布:
随机变量是指在某个随机实验中可能取得不同值的变量。其概率分布可由概率质量函数(离散随机变量)或概率密度函数(连续随机变量)来描述。
离散随机变量的概率质量函数为:
P(X = x) = f(x)
连续随机变量的概率密度函数为:
P(a ≤ X ≤ b) = ∫[a, b] f(x)dx
其中,f(x)表示概率质量函数或概率密度函数。
3. 事件的和与积:
对于两个事件A和B,其和与积的概率表示如下:
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
P(A ∩ B) = P(A)P(B|A) = P(B)P(A|B)
其中,P(A ∪ B)表示事件A和B至少其中一个发生的概率,P(A ∩ B)表示事件A和B同时发生的概率,P(B|A)表示在事件A发生的条件下事件B发生的概率,P(A|B)表示在事件B发生的条件下事件A发生的概率。
二、统计学公式
1. 样本均值和总体均值:
样本均值的公式为:
X = (x₁ + x₂ + ... + xn) / n
统计学公式大全
▪ 质量指数:p1 0
p1q0 p0q0
▪ 数量指数:q1 0
p0 q1 p0q0
4. 可以消除权数变动对指数的影响
报告期变量值加权的综合指数
Yi Yn
Yi1 Y0
为连乘符号
2. 两个相邻的定基发展速度,用后者除以前者 ,等于相应的环比发展速度
Yi Yi1 Yi Y0 Y0 Yi1
增长速度
(要点)
1. 增长量与基期水平之比 2. 又称增长率 3. 说明现象的相对增长程度
4. 有环比增长速度与定期增长速度之分
5. 计算公式为
增长速度
2. 确定权数的所属时期
– 可以都是基期,也可以都是报告期或某一固定时期 – 使用不同时期的权数,计算结果和意义不同 – 取决于计算指数的预期目的
3. 确定权数的具体形式
– 可以是总量形式,也可以采取比重形式 – 主要取决于所依据的数据形式和计算方法
加权综合指数
(概念要点)
1. 通过加权来测定一组项目的综合变动 2. 有加权数量指数和加权质量指数
累积增长量 观察值个数 1
环比发展速度与定基发展速度
(要点)
1. 环比发展速度
– 报告期水平与前一期水平之比
Ri
Yi Yi1
(i 1,2, , n)
2. 定基发展速度
报告期水平与某一固定时期水平之比
统计学常用公式
公式一
1. 众数【MODE 】
(1) 未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。
(2) 组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。 下限公式: 1
012
M =L+
+i ∆⨯∆∆ 式中:0M 表示众数;L 表示众数的下线;1∆表示众数组次数与上一组次数之差;2∆表示众数组次数与下一组次数之差;i 表示众数组的组距。 上限公式: 2
012
M =U-+i ∆⨯∆∆ 式中:U 表示众数组的上限。
2.中位数【MEDIAN 】
(1)未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:
e N+M =X
1
(
)2
当N 为奇数
e N N +1221M =X +X 2⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭⎧⎫⎪⎪
⎨⎬⎪⎪⎩⎭
当N 为偶数
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:
N
=1
m-1
e m
-S 2
M =L+
i
i f
d f ⨯∑
式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。
3.均值的计算【AVERAGE 】
(1)未经分组均值的计算
未经分组数据均值的计算公式为: 112n ++=
统计学计算公式大全
统计学计算公式大全
统计学是数学中一个重要的分支,它利用分析数据,抽象出具有相似特征的概念,研究其变化规律、发展趋势,为决策提供重要的依据。统计学涉及的范畴较广,涉及统计数据的收集、分析处理、描述抽象、模型建立、推理预测等数学计算技术,其中重要的组成部分就是计算公式,下面就是统计学计算公式大全。
一、抽样调查统计
1、样本量的计算公式:
n=N/ (1+N*e2/δ2)
其中:n为样本量,N为总体量,e为期望的标准误差,δ为期望的置信度。
2、样本抽取
a)取系统抽样公式:
Pi=Di/n
其中:Pi为抽取的概率,Di为分层抽样时的各层系统抽样量,n 为总体量。
b)层抽样公式:
Di=ni/ni+N1+…+Nk
其中:Di为分层抽样时的各层系统抽样量,ni为各层抽样量,N1+…+Nk为总体量。
3、数据分析
a)差、方差、标准差
极差X=Xmax-Xmin
方差S2=G2S/(n-1)
标准差S=根号[G2S/(n-1)]
其中:Xmax,Xmin为所有样本数据的最大值和最小值,G1S和G2S分别为样本一阶矩和二阶矩,n为样本量。
b)值、中位数
均值:X=G1S/n
中位数:中位数=X((n+1)/2)
其中:G1S为样本一阶矩,n为样本量。
c)分位数
百分位数:Xp=(n+1)P/100
其中:P为百分位数,n为样本量
二、两个样本的比较
1、大样本检验
a) t检验
t=X1-X2/S
其中:X1,X2分别为样本1和样本2的均值,S为两个样本总体方差的平均值。
b) F检验
F=S12/S22
其中:S12,S22分别为样本1和样本2的方差。
统计学常用公式
公式一
1. 众数【MODE 】
(1) 未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。
(2) 组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。 下限公式: 1
012
M =L+
+i ∆⨯∆∆ 式中:0M 表示众数;L 表示众数的下线;1∆表示众数组次数与上一组次数之差;2∆表示众数组次数与下一组次数之差;i 表示众数组的组距。 上限公式: 2
012
M =U-+i ∆⨯∆∆ 式中:U 表示众数组的上限。
2.中位数【MEDIAN 】
(1)未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:
e N+M =X
1
(
)2
当N 为奇数
e N N +1221M =X +X 2⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭⎧⎫⎪⎪
⎨⎬⎪⎪⎩⎭
当N 为偶数
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:
N
=1
m-1
e m
-S 2
M =L+
i
i f
d f ⨯∑
式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。
3.均值的计算【AVERAGE 】
(1)未经分组均值的计算
未经分组数据均值的计算公式为: 112n ++=
常用数理统计公式
常用数理统计公式
以下是一些常用的数理统计公式:
1. 样本均值 (Sample Mean):
x̄ = (Σxi) / n
2. 总体均值 (Population Mean):
μ = (Σxi) / N
3. 样本方差 (Sample Variance):
s^2 = (Σ(xi - x̄)^2) / (n - 1)
4. 总体方差 (Population Variance):
σ^2 = (Σ(xi - μ)^2) / N
5. 样本标准差 (Sample Standard Deviation):
s=√s^2
6. 总体标准差 (Population Standard Deviation):
σ=√σ^2
7. 样本协方差 (Sample Covariance):
Cov(x, y) = (Σ(xi - x̄)(yi - ȳ)) / (n - 1)
8. 总体协方差 (Population Covariance):
Cov(X, Y) = (Σ(xi - μx)(yi - μy)) / N
9. 样本相关系数 (Sample Correlation Coefficient):
r = Cov(x, y) / (sxsy)
10. 总体相关系数 (Population Correlation Coefficient):ρ = Cov(X, Y) / (σXσY)
11. 样本标准误 (Standard Error of the Mean):
SEM=s/√n
12. 置信区间 (Confidence Interval):
统计学常用公式
公式一
1. 众数【 MODE 】
(1) 未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。 (2) 组距分组数据众数的计算
关于组距分组数据, 先找出出现次数最多的变量值所在组, 即为众数所在组, 再依据下边的公式计算计算众数的近似值。
下限公式:
M 0=L+
1
i
1
+
2
式中: M 0 表示众数; L 表示众数的下线; 1 表示众数组次数与上一组次数之差;
2 表示众数
组次数与下一组次数之差; i 表示众数组的组距。
上限公式:
M 0=U-
2 i
1+
2
式中: U 表示众数组的上限。
2.中位数【 MEDIAN 】
(1)未分组数据中中位数的计算
依据未分组数据计算中位数时, 要先对数据进行排序, 而后确立中位数的地点。 设一组数据按
从小到大排序后为 X 1, X 2, ⋯ , X N ,中位数 M e ,为则有:
M e
=X
( N+1)
当 N 为奇数
2
1
N +X
N +1
当 N 为偶数
M e = X
2
2
2
(2)分组数据中位数的计算
N / 2
分组数据中位数的计算时,要先依据公式
确立中位数的地点,并确立中位数所在的组,
而后采纳下边的公式计算中位数的近似值:
式中: M e 表示中位数; L 表示中位数所在组的下限; S m-1 表示中位数所在组以下各组的累计次
数; f m 表示中位数所在组的次数; d 表示中位数所在组的组距。
3.均值的计算【 AVERAGE 】
(1)未经分组均值的计算
n
x =
x 1
+x 2
+⋯ x
n
x i
未经分组数据均值的计算公式为:
= i 1
统计学重要公式
统计学重要公式
()
()
D 2
2
2
2
1. X X
2. N
3. Q
4. 1 (2) S 1
U L i
i
X
n
IQR Q Q X
N
X n μμσμ=
=
==--=
-=
-∑∑∑∑样本平均数:总体平均数:四分位差:方差:
()总体方差:样本方差:
22
5. 1 2 S S
6.100%100%100%
CV S CV X σσσμ==⎛⎫⎛⎫
=⨯=⨯ ⎪ ⎪⎝⎭⎝⎭
⎛⎫
=⨯ ⎪⎝⎭
标准差:
()总体标准差:()样本标准差:变异系数
标准差总体:平均数样本:
()()
(
)
()()2
2
1
211
1
11
1
7.() ,8. (,)1
9. ,
,
,i i i i i
i
XY XY
XY
XY X Y
XX YY
n i n
n
i XX i i
i i n n i i n
n
i i XY i
i
i i i i YY i X X X Z Z Z S X
X
Y
Y
Cov X Y S n S L r S S L L X L X X
X
n
X Y L X
X
Y
Y
X Y n
L Y μ
σ
=======--=
=
--==-=
=
⎛⎫ ⎪
⎝⎭=
-=
-⎛⎫⎛⎫
⎪ ⎪⎝⎭⎝⎭=
--=-=
-∑∑∑∑∑∑∑∑
标准分数分数或样本协方差皮尔逊相关系数(
)
2
2
1
2
111
1
,
,n i n
n
i i
i i n
n
i
i
i i Y Y
Y
n
X Y
X Y n n
=====⎛⎫ ⎪
⎝⎭=
-=
=
∑∑∑∑
∑
()
()()()()2
210. X 11. X 12. S 1
13.!
121,!
!12,
!,
!!!
i
i
i
i
i
i
i
i
m n
m m
n n
m n m
n n
W X W
F X F
F X
X
n n P n n n n m m n n P n C
《统计学原理》公式
《统计学原理》公式大全
一、统计整理
1.组距=上限 - 下限 2.组中值
(1)闭口组2
下限
上限组中值+= (2)开口组组中值
①2相邻组组距
上限值缺下限的开口组的组中-= ②2
相邻组组距
下限值缺上限的开口组的组中+
= 二、综合指标
1.计划完成相对数 =
计划任务数
实际完成数
2.计划执行进度 =
计划期计划任务累计数
数
一时间的实际完成累计自计划执行之日起至某
3.结构相对数 =
总体总量
总体中某部分数值
4.总体中另一部分数值
总体中某部分数值
比例相对数=
5.值
另一总体的同类指标数某总体的某指标数值
比较相对数=
6.的总量指标数值另一性质不同但有联系某一总量指标数值
强度相对数=
7.基期指标数值报告期指标数值
动态相对数=
8.总体单位总量
总体标志总量
算术平均数=
9.简单算术平均数 x —=
n
x
n x x x n ∑=
+++ 21 10.加权算术平均数 x —=∑∑=∑+++f xf f f x f x f x n n 2
211 11.简单调和平均数 ∑=
-
x
N x H 1
12.加权调和平均数 ∑
∑=-
m
x
m
x H 1
13.极差(R )= 最大标志值 — 最小标志值
14.简单平均差 D A ⋅=
n
x x
∑-—
15.加权平均差 D A ⋅=
∑-f
x x —
16.简单标准差 n
x x ∑-=
)
(—
2
σ
17.加权标准差 ∑∑-=
f
f
x x )
(—
2
σ
三、抽样推断
1.重复抽样条件下的抽样平均数的抽样平均误差 n
x σμ2
=
2.重复抽样条件下的抽样成数的抽样平均误差 n
P P p )
1(-=μ 3.不重复抽样条件下的抽样平均数的抽样平均误差 )1(2
统计学常用公式
公式一
1. 众数【MODE 】
(1) 未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。
(2) 组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。 下限公式: 1
012
M =L+
+i ∆⨯∆∆ 式中:0M 表示众数;L 表示众数的下线;1∆表示众数组次数与上一组次数之差;2∆表示众数组次数与下一组次数之差;i 表示众数组的组距。 上限公式:
2
012
M =U-+i ∆⨯∆∆ 式中:U 表示众数组的上限。
2.中位数【MEDIAN 】
(1)未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:
e N+M =X
1
()2
当N 为奇数
e N N +1221M =X +X 2⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭⎧⎫⎪⎪
⎨⎬⎪⎪⎩⎭
当N 为偶数
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:
N
=1
m-1
e m
-S 2
M =L+
i
i f
d f ⨯∑
式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。
3.均值的计算【A VERAGE 】
(1)未经分组均值的计算
未经分组数据均值的计算公式为: 1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学公式汇总文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]
统计学公式汇总
(1) αβδμσνπρυt u F X s 2χ
(2) 均数(mean ):n
X n
X X X X n
∑=+⋅⋅⋅++=21
式中X 表示样本均数,X 1,X 2,
X n 为各观察值。
(3) 几何均数(geometric mean, G ):
)lg (lg )lg lg lg (lg 1211
21n
X n X X X X X X G n n
n ∑--=+⋅⋅⋅++=⋅⋅⋅•=式中G 表示
几何均数,X 1,X 2,X n 为各观察值。
(4) 中位数(median, M )
n 为奇数时,)21
(+=n X
M
n 为偶数时,2/][)12
()2
(++=n n X
X M
式中n 为观察值的总个数。
(5) 百分位数 )%(L x
x f x n f i
L P ∑-⋅+
= 式中L为Px 所在组段的下限,f x 为其频数,i 为其组距,L f ∑为小于L各组段的累计频数。
(6) 四分位数(quartile, Q ) 第25百分位数P 25,表示全部观察值中有25%(四分之
一)的观察值比它小,为下四分位数,记作Q L ;第75百分位数P 75,表示全部观察值中有25%(四分之一)的观察值比它大,为上四分位数,记作Q U 。
(7) 四分位数间距 等于上、下四分位数之差。
(8) 总体方差 N
X 2
2
)(μσ-∑=
(9) 总体标准差 N
X 2
)(μσ-∑=
(10)样本标准差 1/)(1)(222-∑-∑=
--∑=n n
X X n X X s (11)变异系数(coefficient of variation, CV ) %100⨯=
X
s
CV (12)样本均数的标准误 理论值n
X σ
σ=
估计值n
s s X =
式中σ为总体标准差,s 为
样本标准差,n 为样本含量。
(13)样本率的标准误 理论值n
p )
1(ππσ-=
估计值n
p p s p )
1(-=
式中π为总体率,p 为样本率,n 为样本含量。
(14)总体率的估计:正态分布法,(n p p u p n p p u p /)1(,/)1(-⋅+-⋅-αα) 式中
p 为样本均数,s 为样本标准差,n 为样本含量。
(15)总体均数的估计t 分布法:(n
s t X n
s t X ⋅
+⋅
-νανα,,,) 式中X 为样本均数,s
为样本标准差,n 为样本含量,ν为自由度。
(16)总体均数的估计u 分布法:
总体标准差σ未知但较大时,(n
s u X n s u X ⋅
+⋅
-αα,) 式中X 为样本均
数,s 为样本标准差,n 为样本含量。
总体标准差σ已知时,(n
u X n
u X σ
σ
αα⋅
+⋅
-,) 式中X 为样本均数,σ为总
体标准差,n 为样本含量。
(17)样本均数与总体均数比较的t 检验:n
s X t /0μ-=
1-=n ν 式中X 为样本均数,
0μ为欲比较的总体均数,s 为样本标准差,n 为样本含量,ν为自由度。
(18)样本均数与总体均数比较的u 检验: n
s X u /0μ-=
式中X 为样本均数,0μ为欲比
较的总体均数,s 为样本标准差,n 为样本含量。
(19)样本均数与总体均数比较的u 检验:n
X u /0
σμ-=
式中X 为样本均数,0μ为欲比
较的总体均数,σ为总体标准差,n 为样本含量。
(20)配对设计差值的符号秩和检验正态近似法公式:48
)
(24)12)(1(4/)1(3
∑--
+++-=
j j
t t n n n n n T u
式中T 为秩和,求秩和方法:差值d =(X -μ0);依差值的绝对值从小到大编秩;差值为0者,舍去不计;如果差值相等,取平均秩次;分别求出正、负秩次之和T (+)、T (-);T 为二者绝对值较小者;n 为样本含量,但不包括差值等于0者;t j (=1,2,···)为第j 个相同差值的个数。
(21)配对设计两样本均数比较的t 检验:n
s d t d /0-=
1-=n ν 式中d 为差值d 的均
数,s d 为差值d 的标准差,n 为样本含量(即样本对子数),差值d =各对子数据之差(含正负号!),ν为自由度。
(22)成组设计两样本均数比较的t 检验:
)
1
1(2/)(/)(2
12122
22
2
12
121
2
12
2
11n n n n n X X n X X
X X s X X t X X +-+-+--=
-=
∑∑∑∑-
221-+=n n ν 式中1X 和2X 分别为两个样本均数, n 1和n 2为两个样本含量,ν为自由度。