统计学公式汇总

合集下载

统计学常用公式汇总

统计学常用公式汇总

统计学常用公式汇总项目三统计数据的整理与显示组距=上限-下限a)组中值=(上限 +下限)÷ 2b)缺下限张口组组中值=上限-邻组组距 /2c)缺上限张口组组中值=下限 +1/2 邻组组距例按达成净产值分组(万元)10 以下缺下限:组中值 =10— 10/2=510—20组中值 =(10+20) /2=1520—30组中值 =(20+30) /2=2530—40组中值 =(30+40) /2=3540—70组中值 =(40+70) /2=5570 以上缺上限:组中值 =70+30/2=85项目四统计描绘i.相对指标1.构造相对指标=各组(或部分)总量 / 整体总量2.比率相对指标=整体中某一部分数值 / 整体中另一部分数值3.比较相对指标=甲单位某指标值 / 乙单位同类指标值4.动向相对指标=报告期数值 / 基期数值5.强度相对指标=某种现象总量指标 / 另一个有联系而性质不一样的现象总量指标6.实质数实质达成程度%计划达成程度相对指标 K==计划数计划规定的达成程度 %7.1实质提升百分数计划达成程度(提升率): K=100%1计划提升百分数1实质提升百分数计划达成程度(降低率): K=100%1计划提升百分数ii.均匀指标1.简单算术均匀数:2. 加权算术均匀数或iii.变异指标1.全距=最大标记值-最小标记值2. 标准差 :简单σ =;加权σ=p p(1 p)成数的标准差3.标准差系数 :项目五时间序列的组成剖析一、均匀发展水平的计算方法:(1)由总量指标动向数列计算序时均匀数①由期间数列计算aan②由时点数列计算在连续时点数列的条件下计算(判断标记按日登记): a af f在中断时点数列的条件下计算(判断标记按月/ 季度 / 年等登记):若中断的间隔相等,则采纳“首末折半法”计算。

公式为:1a 1 a 2a n 1a n 1a2n12若中断的间隔不等, 则应以间隔数为权数进行加权均匀计算。

统计学公式汇总

统计学公式汇总

1 第三章 统计整理 公式名称 数学公式 说明 组距 (最大值-最小值)/组数 — 全距/组数

组中值 (上限+下限)/2 — 上限-相邻组的组距/2 开口组只有上限 下限+相邻组的组距/2 开口组只有下限

第四章 总量指标和相对指标 公式名称 数学公式 说明

相对指标 结构相对指标=总体部分数值/总体全部数值 无名数 分子分母不可互换

比例相对指标=总体中某一部分数值/总体中另一部分数值 无名数 分子分母可互换

比较相对指标=某条件下某类指标数值/另一条件下的同类指标值 无名数 分子分母可互换

动态相对指标=报告期水平/基期水平 无名数 分子分母不可互换

强度相对指标=某一总量指标数值/另一个有联系而性质不同的总量指标数值 有名数或无名数 分子分母有的可互换、有的

不可互换

计划完成程度相对指标=实际完成数/计划完成数 无名数 分子分母不可互换 2

第五章 平均指标和变异指标 公式名称 数学公式 说明 字母含义

算术平均数 nxx 简单 x:算术平均数

x:单位变量值 n:总体单位数 f:权数 

fxfx 加权

调和平均数 xnH1 简单

H:调和平均数

x:单位变量值 n:总体单位数 m:权数 

xmmH 加权

几何平均数 nxG

简单

G:几何平均数

n:变量值的个数 f:变量值的次数 :连乘

ffxG 加权

中位数 dfsfLMmme12 下限公式

eM:中位数

L:中位数所在的下限

U:中位数所在的上限

1ms

:以下累计至中位数所在组

以下一组的次数 1ms

:以上累计至中位数所在组

以上一组的次数

mf:中位数所在组的次数

d:中位数所在组的组距

dfsfUMmme12 上限公式

众 数 dLMo211

下限公式

oM:众数

L:众数所在的下限

U:众数所在的上限

1:众数所在组的次数与前一组

次数之差

2:众数所在组的次数与后一组

统计学公式

统计学公式
2.峰态系数( K ): K
3
xi x 4 n(n 1) 3(n 1) 2 ( ) . s (n 1)(n 2)(n 3) (n 2)(n 3)
2
统计学公式
二、概率分布
一、度量事件发生的可能性:
1.事件 A 发生的概率: P ( A) 二、随机变量的概率分布:
统计学公式
一、用统计量描述数据
一、水平的度量:
x x2 x3 1.简单平均数: x 1 n
xn

X
i 1
n
i
n
.
k
M f M 2 f2 M k fk 2.加权平均数: x 1 1 f1 f 2 f k
M
i 1
i i
f
n
.(如果原始数据被分成 k 组,各
2
E2
.
四、假设检验
一、一个总体参数的检验
1.大样本的检验
(1)在大样本的情况下,样本均值的抽样分布近似服从正态分布,其抽样标准差为 /
2
n.
采用正态分布的检验统计量.设假设的总体均值为 0 ,当总体方差 已知时,总体均值检验 的统计量为: z
x 0
/ n
.
(2)当总体方差 未知时,可以采用样本方差 s 来代替,此时总体均值检验的统计量为:
组的组中值分别用 M1,M 2, ,M k 表示,各组的频数分别用 f1,f 2, ,f k 表示,则得到 样本平均数计算公式)
x n 1 2 3.中位数( M e ) : Me 1 x n x n 1 2 2 2

n
p ;
(1 )

统计学常用公式汇总

统计学常用公式汇总

《统计学原理》常用公式汇总组距=上限-下限组中值=(上限+下限)÷2 缺下限开口组组中值=上限-1/2邻组组距缺上限开口组组中值=下限+1/2邻组组距111平均指标 1.简单算术平均数:2.加权算术平均数或iii.变异指标1.全距=最大标志值-最小标志值2.标准差: 简单σ=;加权σ= 3.标准差系数:第五章抽样估计1.平均误差:重复抽样:不重复抽样:2.抽样极限误差3.重复抽样条件下:平均数抽样时必要的样本数目成数抽样时必要的样本数目4.不重复抽样条件下:平均数抽样时必要的样本数目第七章相关分析 1.相关系数2.配合回归方程y=a+bx3.估计标准误:第八章指数分数一、综合指数的计算与分析(1)数量指标指数此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。

(-)此差额说明由于数量指标的变动对价值量指标影响的绝对额。

(2)质量指标指数此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。

(-)此差额说明由于质量指标的变动对价值量指标影响的绝对额。

加权算术平均数指数=加权调和平均数指数=(3)复杂现象总体总量指标变动的因素分析相对数变动分析:=×绝对值变动分析:-= (-)×(-)第九章动态数列分析一、平均发展水平的计算方法:(1)由总量指标动态数列计算序时平均数①由时期数列计算②由时点数列计算在间断时点数列的条件下计算:a.若间断的间隔相等,则采用“首末折半法”计算。

公式为:b.若间断的间隔不等,则应以间隔数为权数进行加权平均计算。

公式为:(2)由相对指标或平均指标动态数列计算序时平均数基本公式为:式中:代表相对指标或平均指标动态数列的序时平均数;代表分子数列的序时平均数;代表分母数列的序时平均数;逐期增长量之和累积增长量二. 平均增长量=─────────=─────────逐期增长量的个数逐期增长量的个数(1)计算平均发展速度的公式为:(2)平均增长速度的计算平均增长速度=平均发展速度-1(100%)。

统计学公式大全

统计学公式大全

第1章随机事件及其概率第二章随机变量及其分布指数分布正态分布f (x)二0,x :: 0其中’0,则称随机变量X服从参数为’的指数分布。

X的分布函数为F(x)二1-e—'x0, x<0。

记住积分公式:■box n e」dx = n!设随机变量X的密度函数为1 . .2 --------------------------------- --------------------f(x)=^^^e 2口,—旳C X W+P,J2兀◎其中"、二0为常数,则称随机变量X服从参数为2 的正态分布或高斯(Gauss)分布,记为X〜N(.L,;-)。

f(x)具有如下性质:f(x)的图形是关于x i对称的;2°当x八I时,f(J —为最大值;^'2ncr的分布函数为dt1°若X〜N(1,JF(x)l2=x ?-e参数"、二=1时的正态分布称为标准正态分布,记为X ~ N(0,1)1其密度函数记为(【2二°",八::::,分布函数为1 x t2::J(x)e. 2心:,J(x)是不可求积函数,其函数值,已编制成表可供查用。

口1①(-x)= 1-①(x)且①(0)=—2X A如果X 〜N (丄,二),贝V ~ N (0,1)。

F x 耳、(2dt。

第三章二维随机变量及其分布如果二维随机向量'(X ,Y )的所有可能取值为至多可列 个有序对(x,y ),则称匕为离散型随机量。

设.=(X ,Y )的所有可能取值为(x ,y j )(i, j =1,2,…), 且事件{ =(x i , y j )}的概率为p j,,称P {(X,Y)=&,y j )}二P j (i,j =1,2,)为.=(X ,Y )的分布律或称为 X 和Y 的联合分布律。

联合分布有时也用下面的概率分布表来表示:这里p j 具有下面两个性质:(1) p j > 0 (i,j=1,2,,); (2) 二二 p ij =1.i j(1 )联合 离散型 分布概率论与数理统计公式(全)2011-1-1若X1,X2, , X m X m+1, , %相互独立,h,g为连续函数,则: h(X1,X2, , X m)和g (X m+1, , X n)相互独立。

高等统计学常用公式汇总

高等统计学常用公式汇总

高等统计学常用公式汇总描述统计均值(Mean)均值是指一组数据的算术平均数,用于描述数据的集中趋势。

计算公式如下:\[\overline{X} = \frac{{\sum_{i=1}^n X_i}}{n}\]其中,\(\overline{X}\)代表均值,\(X_i\)代表第i个观测值,\(n\)代表总观测数。

方差(Variance)方差是用来衡量数据分散程度的指标,计算公式如下:\[Var(X) = \frac{{\sum_{i=1}^n (X_i - \overline{X})^2}}{n-1}\]其中,\(Var(X)\)代表方差,\(X_i\)代表第i个观测值,\(\overline{X}\)代表均值,\(n\)代表总观测数。

标准差(Standard Deviation)标准差是方差的平方根,用于衡量数据的波动性。

计算公式如下:\[SD(X) = \sqrt{Var(X)}\]其中,\(SD(X)\)代表标准差,\(Var(X)\)代表方差。

相关系数(Correlation Coefficient)相关系数用于衡量两个变量之间的线性相关程度。

计算公式如下:\[r = \frac{{\sum_{i=1}^n (X_i - \overline{X})(Y_i -\overline{Y})}}{\sqrt{\sum_{i=1}^n (X_i - \overline{X})^2\sum_{i=1}^n (Y_i - \overline{Y})^2}}\]其中,\(r\)代表相关系数,\(X_i\)代表第i个X变量观测值,\(Y_i\)代表第i个Y变量观测值,\(\overline{X}\)和\(\overline{Y}\)分别代表X变量和Y变量的均值。

推断统计总体均值的置信区间(Confidence Interval for Population Mean)总体均值的置信区间用于估计总体均值的范围。

统计学常用公式总结

统计学常用公式总结

心理统计常用公式总结1 、组数 K(总体分布为正态)( N 为数据个数, K 取近似整数)2 、算术平均数3 、中数4 、众数5 、加权平均数,其中 W i 为权数,其中为各小组的平均数, n i 为各小组人数6 、几何平均数,其中 n 为数据个数, X i 为数据的值7 、调和平均数8 、方差与标准差,其中9 、变异系数,其中 S 为标准差, M 为平均数10 、标准分数,其中 X 为原始数据,为平均数, S 为标准差11 、全距R=最大数-最小数12 、平均差13 、四分差,其中 L b 为该四分点所在组的精确下限, F b 为该四分点所在组以下的累加次数,和为该四分点所在组的次数, i 为组距, N 为数据个数14 、积差相关基本公式:,其中N 为成对数据的数目, S x 、 S y 分别为 X 和 Y 的标准差变形:差法公式:用估计平均数计算:用相关表计算:15 、斯皮尔曼等级相关,其中 D 为各对偶等级之差直接用等级序数计算:,其中 R X 、 R Y 分别为二变量各等级数有相同等级时:16 、肯德尔等级相关有相同等级:17 、点二列相关,其中是两个二分变量对偶的连续变量的平均数, p 、 q 是二分变量各自所占的比率, p+q=1 , S t 是连续变量的标准差18 、二列相关,其中 S T 与是连续变量的标准差与平均数, y 为 P 的正态曲线的高度19 、多系列相关,其中 P i 为每系列的次数比率, y 1 为每一名义变量下限的正态曲线高度,y h 为每一名义变量上线的正态曲线高度,为每一名义变量对偶的连续变量的平均数, S t 为连续变量的标准差20 、总体为正态,σ 2 已知:21 、总体为正态,σ 2 未知:22 、23 、24 、。

(完整word版)统计学常用公式

(完整word版)统计学常用公式

公式一1. 众数【MODE 】(1) 未分组数据或单变量值分组数据众数的计算未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。

(2) 组距分组数据众数的计算对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。

下限公式: 1012M =L++i ∆⨯∆∆ 式中:0M 表示众数;L 表示众数的下线;1∆表示众数组次数与上一组次数之差;2∆表示众数组次数与下一组次数之差;i 表示众数组的组距。

上限公式:2012M =U-+i ∆⨯∆∆ 式中:U 表示众数组的上限。

2.中位数【MEDIAN 】(1)未分组数据中中位数的计算根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。

设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:e N+M =X1()2当N 为奇数e N N +1221M =X +X 2⎛⎫⎛⎫⎪ ⎪⎝⎭⎝⎭⎧⎫⎪⎪⎨⎬⎪⎪⎩⎭ 当N 为偶数(2)分组数据中位数的计算分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:N=1m-1e m-S 2M =L+ii fd f ⨯∑式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。

3.均值的计算【A VERAGE 】(1)未经分组均值的计算未经分组数据均值的计算公式为: 112n ++==nii x x x x x n n=∑…(2)分组数据均值计算分组数据均值的计算公式为: 11221121+++==+ki ik k i k kii x f x f x f x f x f f f f==+∑∑+4.几何平均数【GEOMEAN 】几何平均数是N 个变量值乘积的N 次方根,计算公式为:式中:G 表示几何平均数;∏表示连乘符号。

心理统计学公式汇总

心理统计学公式汇总

心理统计学公式汇总在心理统计学的领域中,各种公式犹如工具,帮助我们理解、分析和解释数据。

下面就为大家汇总一些常见且重要的心理统计学公式。

一、集中趋势的测量1、算术平均数算术平均数是最常用的集中趋势测量指标,其公式为:\\bar{X} =\frac{\sum_{i=1}^{n} X_{i}}{n}\其中,\(\bar{X}\)表示算术平均数,\(X_{i}\)表示第\(i\)个观测值,\(n\)表示观测值的数量。

2、中位数当数据呈现偏态分布时,中位数比平均数更能代表数据的集中趋势。

对于未排序的数据,首先将其从小到大排序。

如果数据个数\(n\)为奇数,中位数就是位于中间位置的那个数;如果\(n\)为偶数,中位数则是中间两个数的平均值。

3、众数众数是数据中出现次数最多的数值。

二、离散程度的测量1、极差极差是一组数据中最大值与最小值之差,公式为:\(R =X_{max} X_{min}\)。

2、方差方差反映了数据相对于平均数的离散程度,其公式为:\S^2 =\frac{\sum_{i=1}^{n} (X_{i} \bar{X})^2}{n 1}\3、标准差标准差是方差的平方根,公式为:\(S =\sqrt{\frac{\sum_{i=1}^{n} (X_{i} \bar{X})^2}{n 1}}\)。

三、正态分布相关公式1、正态分布的概率密度函数\f(x) =\frac{1}{\sigma \sqrt{2\pi}} e^{\frac{(x \mu)^2}{2\sigma^2}}\其中,\(\mu\)是均值,\(\sigma\)是标准差。

2、标准正态分布若\(X\)服从正态分布\(N(\mu, \sigma^2)\),则\(Z =\frac{X \mu}{\sigma}\)服从标准正态分布\(N(0, 1)\)。

四、相关分析1、皮尔逊积差相关系数用于测量两个连续变量之间的线性关系,公式为:\r =\frac{\sum_{i=1}^{n} (X_{i} \bar{X})(Y_{i} \bar{Y})}{\sqrt{\sum_{i=1}^{n} (X_{i} \bar{X})^2 \sum_{i=1}^{n} (Y_{i} \bar{Y})^2}}\2、斯皮尔曼等级相关系数适用于测量两个顺序变量之间的相关性,公式为:\r_s = 1 \frac{6 \sum_{i=1}^{n} d_{i}^2}{n(n^2 1)}\其中,\(d_{i}\)是两个变量的等级差。

统计学原理常用公式汇总

统计学原理常用公式汇总

统计学原理常用公式汇总第2章统计整理a)组距=上限-下限b)组中值=(上限+下限)÷2c)缺下限开口组组中值=上限-1/2邻组组距d)缺上限开口组组中值=下限+1/2邻组组距e)组数k=1+3.322Lg n n为数据个数第3章综合指标i.相对指标1.结构相对指标=各组(或部分)总量/总体总量2.比例相对指标=总体中某一部分数值/总体中另一部分数值3.比较相对指标=甲单位某指标值/乙单位同类指标值4.强度相对指标=某种现象总量指标/另一个有联系而性质不同的现象总量指标5.计划完成程度相对指标=实际数/计划数=实际完成程度(%)/计划规定的完成程度(%)ii.平均指标1.简单算术平均数:2.加权算术平均数或3调和平均数:åå=fXfX h11式中:,hXf Xf mX Xmf XfX Xmm Xf fX======ååååååiii.标志变动度1.全距=最大标志值-最小标志值2.标准差: 简单σ= ;加权σ=3.标准差系数:iiii 抽样推断1. 抽样平均误差:重复抽样: nx σμ=np p p )1(-=μ 不重复抽样: )1(2Nn nx -=σμ 2.抽样极限误差 x x t μ=∆3.重复抽样条件下:平均数抽样时必要的样本数目222x t n ∆=σ成数抽样时必要的样本数目22)1(pp p t n ∆-=不重复抽样条件下:平均数抽样时必要的样本数目22222σσt N Nt n x +∆=第4章 动态数列分析一、平均发展水平的计算方法:(1)由总量指标动态数列计算序时平均数 ①由时期数列计算na a ∑=②由时点数列计算在间断时点数列的条件下计算:若间断的间隔相等,则采用“首末折半法”计算。

公式为: 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。

公式为:(2)由相对指标或平均指标动态数列计算序时平均数 基本公式为:式中:c 代表相对指标或平均指标动态数列的序时平均数;a 代表分子数列的序时平均数;b 代表分母数列的序时平均数;逐期增长量之和 累积增长量二、平均增长量=─────────=─────────逐期增长量的个数 逐期增长量的个数计算平均发展速度的公式为: (2)平均增长速度的计算平均增长速度=平均发展速度-1(100%)第5章 统计指数一、综合指数的计算与分析 (1)数量指标指数此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。

统计学常用公式汇总

统计学常用公式汇总

《统计学原理》常用公式汇总第三章统计整理+下限)÷21/2邻组组距+1/2邻组组距i. 相对指标/总体总量/总体中另一部分数值/乙单位同类指标值/另一个有联系而性质不同的现象总量指标/计划数=实际完成程度(%)/计划规定的完成程度(%)-实际完成月数)+超额完成计划数/(达标月产量-上年同月产量)X=nx∑调和平均数:Mh=∑xn1X=∑∑fxf=∑∑xmm= ;=M0=L+∆∆∆+211*d (=∆1众数组次数与前一组之差,另一个是与后一组的差,L是众数组的下限,d是众数组的组距)=M e L+fSmmf12--∑*d(L是下限,Sm-1是中位数组前各组之和,fm是中位数组次数,d是组距)(1)由总量指标动态数列计算序时平均数a.若间断的间隔相等,则采用“首末折半法”计算。

公式为:b.则应以间隔数为权数进行加权平均计算。

公式为:报告期水平/基期水平定基发展速度:......,21aaaa环比发展速度:.....,121aaaa定基发展速度-1环比发展速度-1/累积增长量=逐期增长量的个数/逐期增长量的个数=n n aa 0平均增长速度=平均发展速度-1(100%)一、综合指数的计算与分析此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。

(- )此差额说明由于数量指标的变动对价值量指标影响的绝对额。

此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。

(- )此差额说明由于质量指标的变动对价值量指标影响的绝对额。

(3)复杂现象总体总量指标变动的因素分析=×-=(-)×(-)平均数抽样时必要的样本数目 成数抽样时必要的样本数目要的样本数目y=a+bx。

统计学的公式汇总(doc 19页)

统计学的公式汇总(doc 19页)

统计学的公式汇总(doc 19页)部门: xxx时间: xxx整理范文,仅供参考,可下载自行编辑统计学公式汇总表一、组限和组中值1 当两组间的相邻组限重合时:组距=本组上限—本组下限组中值=(上限+下限)/ 2或=下限+组距/ 2或=上限—组距/ 22当两组间的相邻组限不重合时:组距=下组下限—本组下限或=本组上限—上组上限组中值=(本组下限+下组下限)/ 2或=本组下限+组距/ 2或=下组下限—组距/ 23 组距式分组中的“开口”情况:组中值=上限—邻组组距/ 2或=下限+邻组组距/ 2一、相对指标的种类和计算方法(一)计划完成相对数1计划完成相对数的基本计算公式:计划完成相对数= * 100%例:某公司计划2005年销售收入500万元,实际的销售收入552万元。

则:计划完成相对数= * 100% = 110.4%2计划完成相对数的派生公式:(1)对于产量、产值增长百分数:计划完成相对数= * 100%(2)对于产品成本降低百分数:计划完成相对数= * 100%例:某企业2005年规定产值计划比上年增长8%,计划生产成本比上年降低5%,产值实际比上年提高10%,生产成本实际比上年降低6%,试求该企业产值和成本计划完成相对数。

解:产值计划完成相对数= * 100% = 101.85%成本计划完成相对数= * 100% = 98.95%(3)计划执行进度相对数的计算方法:计划执行进度= * 100%例:某公司2005年计划完成商品销售额1500万元,1—9月累计实际完成1125万元。

则:1—9月计划执行进度= * 100% = 75%(二)结构相对数结构相对数= * 100%例:某地区2005年国内生产总值为1841.61亿元,其中第一产业增加值为88.88亿元,则:第一产业增加值所占比重= * 100% =4.83%(三)比例相对数比例相对数= * 100%例:某地区2005年国内生产总值为2106.96亿元,其中轻工业产值为1397.31亿元,重工业产值为709.65亿元,则:轻重工业比例=1397.31:709.65=1.97:1(四)比较相对数比较相对数= * 100%市名人口数(万人)国内生产总值(亿元)人均国内生产总值(元/人)甲725 280 3862乙340 192 5647 比较相对数(以乙市为100)213.24 145.83 68.39(五)动态相对数动态相对数= * 100%例:某地区国内生产总值2004年为2097.77亿元,2005年为2383.07亿元。

统计学公式汇总

统计学公式汇总
无名数
分子分母可互换
比较相对指标=某条件下某 类指标数值/另一条件下的 同类指标值
无名数
分子分母可互换
动态相对指标-报告期水平/基期水平
无名数
分子分母不可互换
强度相对指标=某一总量指 标数值/另一个有联系而性 质不同的总量指标数值
有名数或无名数
分子分母有的可互换、有的 不可互换
计划完成程度相对指标=实 际元成数/计划元成数
第三章统计整理
公式名称
数学公式
说明
组距
(最大值-最小值)/组数 全距/组数
——
组中值
(上限+下限)/2
——
上限-相邻组的组距/2
r开口组只有上限
下限+相邻组的组距/2
开口组只有下限
第四章总量指标和相对指标
公式名称
数学公式
说明
相对指标
结构相对指标=总体部分数 值/总体全部数值
无名数
分子分母不可互换
比例相对指标=总体中某一 部分数值/总体中另一部分 数值
N
2、公式中的标准差厉和成数P一 般用样本的标准差s和成数p来代 替。
成数:Up=*
Pdf
nN
平均数:ux=罕
重复 抽样
成数:Up={
P(1 P) n
区间估计
平均数:x—A-兰X兰x+A
x-
抽样极 限误差
重复抽样,心
n
A=JP(1-P);
p、n;
不重复抽样,心-=J—(1-丄)
xNnN
仆tJP(i)(1-N)
ai -4
环比
环比发展速度-1
平均发展 速度
x =
\ao
——
平均增长 速度

高等统计学常用公式汇总

高等统计学常用公式汇总

高等统计学常用公式汇总.txt 高等统计学常用公式汇总本文档汇总了高等统计学中常用的一些公式,以供参考和使用。

1.概率与统计1.1.概率公式概率密度函数(PDF)公式。

$f(x) = \frac{dF(x)}{dx}$,表示连续型随机变量的概率密度函数。

概率密度函数(PDF)公式。

$f(x) = \frac{dF(x)}{dx}$,表示连续型随机变量的概率密度函数。

概率密度函数(PDF)公式。

$f(x) = \frac{dF(x)}{dx}$,表示连续型随机变量的概率密度函数。

概率密度函数(PDF)公式。

$f(x) = \frac{dF(x)}{dx}$,表示连续型随机变量的概率密度函数。

概率密度函数(PDF)公式。

$f(x) = \frac{dF(x)}{dx}$,表示连续型随机变量的概率密度函数。

概率密度函数(PDF)公式。

$f(x) =\frac{dF(x)}{dx}$,表示连续型随机变量的概率密度函数。

概率密度函数(PDF)公式。

$f(x) = \frac{dF(x)}{dx}$,表示连续型随机变量的概率密度函数。

概率密度函数(PDF)公式。

$f(x) =\frac{dF(x)}{dx}$,表示连续型随机变量的概率密度函数。

概率密度函数(PDF)公式。

$f(x) = \frac{dF(x)}{dx}$,表示连续型随机变量的概率密度函数。

累积分布函数(CDF)公式。

$F(x) = P(X \leq x)$,表示随机变量的累积分布函数。

累积分布函数(CDF)公式。

$F(x) = P(X \leq x)$,表示随机变量的累积分布函数。

累积分布函数(CDF)公式。

$F(x) = P(X \leq x)$,表示随机变量的累积分布函数。

累积分布函数(CDF)公式。

$F(x) = P(X \leq x)$,表示随机变量的累积分布函数。

累积分布函数(CDF)公式。

$F(x) = P(X \leq x)$,表示随机变量的累积分布函数。

教育统计学公式汇总经典汇总

教育统计学公式汇总经典汇总

教育统计学公式汇总1、 众数:2、 中数:3、 加权平均数:4、 众数、中数和算术平均数之间的关系:5、 几何平均数:6、 调和平均数:7、 平均差:8、 样本标准差:9、 标准差的合成: 10、差异系数:0ab a bf M L if f =+•+2b d b nF M L i f-=+•2ad a n F M L if-=-•1112212kj jj k kw ktn Xn X n X n X X n n n n =++⋯+==++⋯+∑0M 3Mdn 2X =-g X =11lg lg nii g xX n-=⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭∑12111111111()H n i inM n x x x n x x ===++⋯+∑∑11'n n i ii i x X x AD nn==-==∑∑S ==w σ=100%SCV X =⨯100b mN F P L i•-=+•(1)100amN F P U i --=-•11、百分位数:12、百分等级分数:13、协方差:14、积差相关系数:15、斯皮尔曼等级相关:16、肯德尔和谐系数: 17、点双列相关:18、双列相关:19、多系列相关:20、φ(fai )相关:21、列联相关:22、 的分布(标准分):()100b x L f F i PR N-⎡⎤+⎢⎥⎣⎦=⨯1()()(,)niii x X yY COV X Y n=--=∑1()()i i i i XY x y x y r -=∑∑∑2261(1)R D r n n =--∑43(1)1(1)X YR R R r n n n n ⎡⎤=•-+⎢⎥-+⎣⎦∑231()12iR SS W k n n =-p q pb XX X r S -=p qb XX X pqr S Y-=•()2()LHis L Ht iY Y X rY Y S p⎡⎤-•⎣⎦=-∑∑r ϕ=C =X X XX X Z μμσσ--==23、总体平均数的置信区间:24、样本容量的估计:25、平均数之差的标准误:两组相关样本的情况:26、检验统计量:27、已知两组样本相关系数r 时的检验统计量:两组独立样本的情况: 28、两个总体方差都已知时的检验统计量:29、两个总体方差都未知时的检验统计量:(1) 两总体方差相等: (2) 两总体方差不等:1) 阿斯平—威尔士检验:22/X Z X Z αασσ⎡-•+•⎢⎣()22()df t Sn dα•=12X X σ-=t=X X t =X X Z =X X t =22S F S =大小211221212S n k S S n n =+22121(1)df k k n n =-+2) 柯克兰—柯克斯检验: 222121)1(2222)1(2121221··n Sn S t n St n S t n n ++='--ααα30、样本比率抽样分布的标准误:31、总体比率的置信区间:32、样本比率显著性检验的检验统计量:33、相关样本比率差异的显著性检验: Z34、独立样本比率差异的显著性检验:(1)独立样本之差(p 1-p2)的抽样分布:(2) 独立样本之差(p 1-p 2)在抽样分布中的标准误:(3) 独立样本比率差异显著性检验的检验统计量:其中,35、t 分布的检验统计量:其中,p σ=/2/2p Z P p Z αα-•≤≤+•Z =12p pσ-==12p p σ-==121212()()p p p p P P ZS ----==112212'n p n p p n n +=+rr t ρσ-==r σ=相关系数区间估计的置信区间为: 36、两总体相关系数的差异性检验:37、检验统计量的一般表达式:38、独立性检验:(1)在“R 变量与C 变量相互独立,彼此无关”的假设成立的条件下,第r 行第c 列的那个类别的理论期待次数:自由度:(2)对2×2表的资料进行独立性检验,计算检验统计量:39、非参数检验连续性校正 校正公式:40、符号秩次检验:(1)大样本的情况:T 的总体平均数为 μT =n(n+1)4(2)(2)22r rn n r t r tαασρσ---⋅≤≤+⋅Z =2χ220()ke ef f f χ-=∑2021()2e c ef f f χ--=∑()c r c r e n n n n f N P N N N N •=•=••=(1)(1)df r c =-•-22()()()()()N ad bc a b a c b d c d χ•-=++++0.5Z ±=n(r )-T 的总体标准差为 σT=√n (n+1)(2n+1)24其检验统计量为 24)12)(1(4/)1(+++-=-=Z n n n n n T T TTσμ其中,n= n ++n − T=min(T +,T −)41、秩和检验 (1)T 的总体平均数为:2)1(211++=n n n T μ(2)T 的总体标准差为:12)1(2121++=n n n n T σ(3)其检验统计量为: 12)1(2/)1(2121211++++-=-=Z n n n n n n n T T TTσμ。

初级统计学公式大全

初级统计学公式大全

初级统计学公式大全描述统计学公式1. 平均数平均数是一组数据的总和除以数据个数的结果。

公式:$\bar{X} = \frac{\sum_{i=1}^{n}X_i}{n}$2. 中位数中位数是将一组数据按照大小顺序排列后的中间值。

公式:$Me= X_{(\frac{n+1}{2})}$3. 众数众数是一组数据中出现频率最高的数值。

4. 标准差标准差是一组数据的离散程度的度量。

公式:$s = \sqrt{\frac{\sum_{i=1}^{n}(X_i - \bar{X})^2}{n-1}}$5. 四分位数四分位数是将一组数据按照大小顺序排列后,将其分为四等分的三个数值。

公式:$Q_1 = X_{(\frac{n+1}{4})}$,$Q_2 =X_{(\frac{2n+2}{4})}$,$Q_3 = X_{(\frac{3n+3}{4})}$概率公式1. 事件概率事件概率是指某一事件发生的可能性大小。

公式:$P(A) = \frac{\text{事件A发生的次数}}{\text{总事件发生次数}}$2. 条件概率条件概率是在已知某一条件下事件发生的概率。

公式:$P(A|B) = \frac{P(A \cap B)}{P(B)}$3. 独立事件概率独立事件概率指的是两个事件互不影响时同时发生的概率。

公式:$P(A \cap B) = P(A) \cdot P(B)$统计推断公式1. 置信区间置信区间是通过样本估计总体参数的范围。

2. 单样本假设检验单样本假设检验是通过样本数据判断总体参数是否满足某种假设。

公式:$t = \frac{\bar{X} - \mu_0}{\frac{s}{\sqrt{n}}}$3. 双样本假设检验双样本假设检验是通过两个样本数据判断两个总体参数是否满足某种假设。

回归分析公式1. 简单线性回归简单线性回归模型用于描述因变量与一个自变量之间的线性关系。

公式:$Y = \beta_0 + \beta_1X + \varepsilon$2. 多元线性回归多元线性回归模型用于描述因变量与多个自变量之间的线性关系。

统计学公式

统计学公式

统计学114个公式1.组距=本组上限-本组下限(不包括上.下限的数字)2.间断式分组组距: 组距=本组上限-前组上限3.组距=本组下限-前组下限4.组距=本组上限-本组下限+15.开口组中值:组中值=(上限+下限)/2 缺下限:上限- —————— =组中值6.缺上限:下限- ————— =组中值 7.d=R/n(R 为总体全距,n 为组数,d 为组距) 8.N=1+3.322lgN N 为组数,N 为总体容量9. 简单算术平均数X = (X 1+X 2 +X 3 +…+X n )/n(可简记为X =ΣX n /n )10.加权算术平均数X=(X 1f 1+X 2f 2+…+ X k f k )/ (f 1+f 2+…+f k )=ΣX i f i /Σf i (可简记为 X=ΣX i f i /Σf i )11. 算术平均数的数学性质(1)各变量值与算术平均数的离差之和等于零,即:相邻组组距2 相邻组组距 2=0(对于简单算术平均数) 或=0(对于加权算术平均数)12.(2)各变量值与算术平均数的离差平方之和为最小值,即: Σ(x i -x)2 =最小值 或Σ(x i -x)2≤Σ(x i -x 0)2 (只有当x = x 0 时,等号成立) 13. 简单调和平均数 H =km /(m/x 1+m/x 2+…+m/x k )=k /Σ(1/x i )可简记为:H = k /Σ(1/x i )14.加权调和平均数H =(m 1+m 2+…+m k )/(m 1/x 1+m 2/x 2+…+m k /x k )=Σm i /Σ(m i /x i )(可简记为:H =Σm i /Σ(m i /x i )。

)15. 简单几何平均数 G = n √x 1.x 2.x 3…x n = n √∏x i (可简记为G = n √∏x i )16. 加权几何平均数 G = Σfi √x 1 f1.x 2 f2.x 3 f3…x n fk= Σfi √∏x fi i(可简记为G =Σfi √∏x fi i ) 17. 算术平均数、调和平均数和几何平均数的数学关系 幂平均数的定义是:x t = t √Σx t /n 当t=1时,幂平均数就是算术平均数; 当=-1时,幂平均数就是调和平均数;当趋向于0时,幂平均数的极限形式就是几何平均数。

完整word版,统计学原理常用公式汇总,推荐文档

完整word版,统计学原理常用公式汇总,推荐文档

统计学原理常用公式汇总第2章统计整理a)组距=上限-下限b)组中值=(上限+下限)÷2c)缺下限开口组组中值=上限-1/2邻组组距d)缺上限开口组组中值=下限+1/2邻组组距e)组数k=1+3.322Lg n n为数据个数第3章综合指标i.相对指标1.结构相对指标=各组(或部分)总量/总体总量2.比例相对指标=总体中某一部分数值/总体中另一部分数值3.比较相对指标=甲单位某指标值/乙单位同类指标值4.强度相对指标=某种现象总量指标/另一个有联系而性质不同的现象总量指标5.计划完成程度相对指标=实际数/计划数=实际完成程度(%)/计划规定的完成程度(%)ii.平均指标1.简单算术平均数:2.加权算术平均数或3调和平均数:åå=fXfX h11式中:,hXf Xf mX Xmf XfX Xmm Xf fX======ååååååiii.标志变动度1.全距=最大标志值-最小标志值2.标准差: 简单σ= ;加权σ=3.标准差系数:iiii 抽样推断1. 抽样平均误差:重复抽样: nx σμ=np p p )1(-=μ 不重复抽样: )1(2Nn nx -=σμ 2.抽样极限误差 x x t μ=∆3.重复抽样条件下:平均数抽样时必要的样本数目222x t n ∆=σ成数抽样时必要的样本数目22)1(pp p t n ∆-=不重复抽样条件下:平均数抽样时必要的样本数目22222σσt N Nt n x +∆=第4章 动态数列分析一、平均发展水平的计算方法:(1)由总量指标动态数列计算序时平均数 ①由时期数列计算na a ∑=②由时点数列计算在间断时点数列的条件下计算:若间断的间隔相等,则采用“首末折半法”计算。

公式为:12121121-++++=-n a a a a a n n Λ 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学公式汇总 文档编制序号:[KKIDT-LLE0828-LLETD298-POI08] 统计学公式汇总 (1) αβδμσνπρυt u F X s

2

(2) 均数(mean):nXn

XXXXn21 式中X表示样本均数,X1,X2,

Xn为各观察值。 (3) 几何均数(geometric mean, G):

)lg(lg)lglglg(lg121121nXnXXXXXXGnnn•式中G表示

几何均数,X1,X2,Xn为各观察值。

(4) 中位数(median, M) n为奇数时,)21(nXM

n为偶数时,2/][)12()2(nnXXM 式中n为观察值的总个数。 (5) 百分位数 )%(LxxfxnfiLP 式中L为Px所在组段的下限,fx为其频

数,i为其组距,Lf为小于L各组段的累计频数。

(6) 四分位数(quartile, Q) 第25百分位数P25,表示全部观察值中有25%(四分之

一)的观察值比它小,为下四分位数,记作QL;第75百分位数P75,表示全部观

察值中有25%(四分之一)的观察值比它大,为上四分位数,记作QU。 (7) 四分位数间距 等于上、下四分位数之差。

(8) 总体方差 N

X22)(

(9) 总体标准差 N

X2)( (10)样本标准差 1/)(1)(222nnXXn

XXs

(11)变异系数(coefficient of variation, CV) %100

X

sCV

(12)样本均数的标准误 理论值nX 估计值n

ssX 式中σ为总体标准差,s为

样本标准差,n为样本含量。 (13)样本率的标准误 理论值np)1( 估计值n

ppsp)1( 式中π为总体率,

p为样本率,n为样本含量。 (14)总体率的估计:正态分布法,(nppupnppup/)1(,/)1() 式中p为样本均数,s为样本标准差,n为样本含量。

(15)总体均数的估计t分布法:(nstXn

stX,,,) 式中X为样本均数,s

为样本标准差,n为样本含量,ν为自由度。 (16)总体均数的估计u分布法:

总体标准差σ未知但较大时,(nsuXn

suX,) 式中X为样本均

数,s为样本标准差,n为样本含量。 总体标准差σ已知时,(nuXnuX,) 式中X为样本均数,σ为总

体标准差,n为样本含量。 (17)样本均数与总体均数比较的t检验:nsXt/0



 1n 式中X为样本均数,

0为欲比较的总体均数,s为样本标准差,n为样本含量,ν为自由度。 (18)样本均数与总体均数比较的u检验: nsXu/0



 式中X为样本均数,0为欲比

较的总体均数,s为样本标准差,n为样本含量。 (19)样本均数与总体均数比较的u检验:nXu/0



 式中X为样本均数,0为欲比

较的总体均数,σ为总体标准差,n为样本含量。 (20)配对设计差值的符号秩和检验正态近似法公式:48)(24)12)(1(4/)1(3jjttnnn

nnTu

式中T为秩和,求秩和方法:差值d=(X-μ0);依差值的绝对值从小到大编秩;

差值为0者,舍去不计;如果差值相等,取平均秩次;分别求出正、负秩次之和T(+)、T(-);T为二者绝对值较小者;n为样本含量,但不包括差值等于0者;tj(=1,2,···)为第j个相同差值的个数。

(21)配对设计两样本均数比较的t检验:nsdtd/

0 1n

 式中d为差值d的均

数,sd为差值d的标准差,n为样本含量(即样本对子数),差值d=各对子数据之

差(含正负号!),ν为自由度。 (22)成组设计两样本均数比较的t检验:

)11(2/)(/)(21212222212121212211nnnnnXXnXXXXsXXtXX







221nn 式中1X和2X分别为两个样本均数, n1和n2为两个样本含量,ν

为自由度。 (23)样本率与总体率的比较:未校正的正态近似法)1(000n

nXu 或

npu/)1(000式中X为样本阳性数,π0为欲比较的总体率,p为样本率, n

为样本含量。 (24)样本率与总体率的比较:校正的正态近似法)1(5.0||000n

nXu 或

nnpu/)1(2/1||000式中X为样本阳性数,π0为欲比较的总体率,p为样本率, n

为样本含量。 (25)样本率与总体率的比较:直接计算概率法:首先按照二项分布的原理计算从0到

n各个X的概率值P(X)=XXnXnXn00)1()!(!!。左单侧:PL表示从0到Xs

的累计概率;右单侧:PR 表示从Xs到n的累计概率;单侧概率P=MIN(PL,

PR);双侧概率P的计算方法有三种:A,单侧概率乘2;B,当X大于nπ0时,双侧概率=P(≥X)+P(≤(2 nπ0-X));当X小于nπ0时,双侧概率=P(≤X)

+P(≥(2 nπ0-X));C,将P(X)≤P(Xs)的各个概率值相加,即得双侧累计概率,即P=∑P(X),X满足条件P(X)≤P(Xs)。式中X为样本阳性数,π

0为欲比较的总体率,Xs为样本阳性数, n为样本含量。 (26)两个样本率的比较:正态近似法222111212221

)1()1(21nppnppppssppupp

 式中p

1

和p2分别为两个样本率, n1和n2为两个样本含量。

(27)两个样本率的比较:正态近似法213211

2121

,)11)(1(nnpnpnpnnppppuccc 式中

p1和p2分别为两个样本率, n1和n2为两个样本含量。 (28)四格表2检验:TTA22)( ν=(行数-1)(列数-1)式中A为实际

频数(actual frequency),T为理论频数(theoretical frequency),n

nnTCRRC 式

中TRC表示R行(row)C列(column)的理论频数,nR为相应行的合计值,nC

为相应列的合计值,n为总例数,ν为自由度。

(29)四格表2检验专用公式:))()()(()(22dbcadcbanbcad ν=(行数-1)(列

数-1)式中a,b,c,d为四格表的四个实际频数,n为总例数,ν为自由度。 (30)四格表2值的校正公式:))()()(()2/|(|22dbcadcbannbcad ν=(行数-1)(列

数-1) 式中a,b,c,d为四格表的四个实际频数,n为总例数,ν为自由度。 (31)行×列表2检验公式:)1(22CRnnAn ν=(R-1)(C-1)式中A为实

际频数(actual frequency),nR为相应行的合计值,nC为相应列的合计值,n为

总例数,,R为行数,C为列数,ν为自由度。 (32)行×列表2检验公式:)1(112RiCjjiijmnAn ν=(R-1)(C-1)式中Aij为

实际频数(actual frequency),ni为相应行的合计值,mj为相应列的合计值,n为

总例数,R为行数,C为列数,ν为自由度。 (33)四格表的确切概率法:!!!!!)!()!()!()!(ndcba

dbcadcbaP 式中a,b,c,d为四格

表的四个实际频数,n为总例数。取表原则可分为“差数极端法”和“概率极端法”。多数情况下,二者所得结果一致,但个别情况下,所得结果不同。一般认为,“概率极端法”最准确。

相关文档
最新文档