统计学:纯公式版
(完整版)统计学公式大全
(完整版)统计学公式大全统计学公式大全本文档旨在提供统计学领域常用的公式大全,便于大家在研究和实践中进行参考和应用。
描述统计学公式中心趋势度量1. 平均数(Mean):$\bar{x} =\frac{{\sum_{i=1}^{n}x_i}}{n}$2. 中位数(Median):若数据个数为奇数,中位数为排序后的中间值;若数据个数为偶数,中位数为排序后的中间两个值的平均值。
3. 众数(Mode):出现频率最高的数值。
离散趋势度量1. 方差(Variance):$Var(x) = \frac{{\sum_{i=1}^{n}(x_i - \bar{x})^2}}{n}$2. 标准差(Standard Deviation):$SD(x) = \sqrt{Var(x)}$3. 极差(Range):$Range(x) = \max(x) - \min(x)$分布形状度量1. 偏度(Skewness):$\text{Skewness} =\frac{{\sum_{i=1}^{n}(x_i - \bar{x})^3}}{n \cdot SD(x)^3}$2. 峰度(Kurtosis):$\text{Kurtosis} =\frac{{\sum_{i=1}^{n}(x_i - \bar{x})^4}}{n \cdot SD(x)^4}$ 推断统计学公式参数估计1. 样本均值的抽样分布标准差(Standard Error of the Mean):$SE(\bar{x}) = \frac{{SD(x)}}{\sqrt{n}}$2. 双侧置信区间公式(Confidence Interval):$\bar{x} \pm Z\cdot SE(\bar{x})$3. 样本比例的抽样分布标准差(Standard Error of Proportion):$SE(p) = \sqrt{\frac{{p(1-p)}}{n}}$4. 双侧置信区间公式(Confidence Interval):$p \pm Z \cdotSE(p)$假设检验1. 样本均值和总体均值的差异(t检验):$t = \frac{{\bar{x} -\mu}}{{SE(\bar{x})}}$2. 双侧拒绝域临界值(t分布):$t_{\text{critical}} = \pmt_{\alpha/2, df}$3. 样本比例和总体比例的差异(z检验):$z = \frac{{\hat{p} - p}}{{SE(p)}}$4. 双侧拒绝域临界值(z分布):$z_{\text{critical}} = \pmz_{\alpha/2}$回归分析公式简单线性回归模型1. 回归方程(Simple Linear Regression):$y = \beta_0 +\beta_1x + \epsilon$2. 线性预测公式(Simple Linear Regression):$\hat{y} =\hat{\beta}_0 + \hat{\beta}_1x$3. 斯皮尔曼秩相关系数(Spearman's Rank Correlation Coefficient):$r_s = 1 - \frac{6\sum d_i^2}{n(n^2 - 1)}$4. 相关系数的显著性检验(t检验):$t = \frac{r}{\sqrt{\frac{1 - r^2}{n-2}}}$结论本文档列举了统计学领域常用的公式,包括描述统计学中的中心趋势度量、离散趋势度量和分布形状度量,推断统计学中的参数估计和假设检验,以及回归分析中的简单线性回归模型等相关公式。
统计学计算公式
《统计学原理》复习资料(计算公式)一、编制分配数列(次数分布表)统计整理公式a)组距=上限-下限b)组中值=(上限+下限)÷2 c)缺下限开口组组中值=上限-1/2邻组组距d)缺上限开口组组中值=下限+1/2邻组组距二、算术平均数和调和平均数的计算加权算术平均数公式xfx f (常用)fx x f(x 代表各组标志值,f 代表各组单位数,ff 代表各组的比重)加权调和平均数公式mx mx (x 代表各组标志值,m 代表各组标志总量)三、变异系数比较稳定性、均衡性、平均指标代表性(通常用标准差系数V x 来比较)公式:标准差: 简单σ= ;加权σ=四、总体参数区间估计(总体平均数区间估计、总体成数区间估计)具体步骤:①计算样本指标x 、;p③由给定的概率保证程度()F t 推算概率度t⑤估计总体参数区间范围x x x X x ;p pp P p 抽样估计公式1.平均误差:重复抽样:n x np p p )1(不重复抽样:)1(2Nn n x2.抽样极限误差xx t 3.重复抽样条件下:平均数抽样时必要的样本数目222x t n 成数抽样时必要的样本数目22)1(p p p t n4.不重复抽样条件下:平均数抽样时必要的样本数目22222t N Ntn x 五、相关分析和回归分析相关分析公式1.相关系数2222)()(y y n x x n y x xy n2.配合回归方程y=a+bx22)(x x ny x xy nb xb y a 3.估计标准误:22n xy b y a y s y 五、指数分析计算指数分析公式一、综合指数的计算与分析(1)数量指标指数0001p q p q 此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。
(01p q -00p q )此差额说明由于数量指标的变动对价值量指标影响的绝对额。
(2)质量指标指数0111p q p q 此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。
医学统计学公式整理简洁版
医学统计学公式整理简洁版1. 平均数(Mean):一组数据的平均值,通过将所有值相加然后除以数据的个数得到。
公式:X̄=ΣX/n其中,X̄表示平均数,ΣX表示所有数据的总和,n表示数据的个数。
2. 中位数(Median):一组数据的中间值,将所有数据按升序排列,如果数据个数为奇数,则中位数是中间的值;如果数据个数为偶数,则中位数是中间两个值的平均数。
3. 众数(Mode):一组数据中出现次数最多的数值。
4. 标准差(Standard Deviation):衡量数据的离散程度,计算每个数据值与平均值的差的平方和的平均值的平方根。
公式:σ=√(Σ(X-X̄)²/n)其中,σ表示标准差,Σ(X-X̄)²表示每个数据值与平均值的差的平方和,n表示数据的个数。
5. 方差(Variance):标准差的平方。
公式:σ²=Σ(X-X̄)²/n6. 相关系数(Correlation Coefficient):度量两个变量之间的线性关系的强度和方向。
相关系数的值介于-1和1之间,接近-1表示负相关,接近1表示正相关,接近0表示无线性相关。
7. t检验(t-test):用于比较两组样本均值是否有显著差异。
8. 卡方检验(Chi-square test):用于比较观察频数与期望频数之间的差异是否显著。
9. 线性回归(Linear Regression):用于预测一个变量与另一个变量之间的关系,并且可以根据这个关系进行预测。
10. 生存分析(Survival Analysis):用于分析事件发生的概率和时间关系,常用于研究患者生存率和治疗效果。
统计学公式大全
3 i1 N3
峰度
(概念要点)
• 1. 数据分布扁平程度的测度 • 2. 峰度系数=3扁平程度适中 • 3. 偏态系数<3为扁平分布 • 4. 偏态系数>3为尖峰分布 • 5. 计算公式为
K Xi X 4 Fi
4 i1 N 4
时间序列的分类
时间序列
绝对数序列 相对数序列 平均数序列
时期序列 时点序列
线性模型法
(a和b的最小二乘估计)
1. 根据最小二乘法得到求解 a 和 b 的标准方程为
Ynab t tYa tb
t2
解得:b
ntY tY
nt 2 t2
a Y bt
2. 取时间序列的中间时期为原点时有 t=0,上
式可化简为
Y na tY bt 2
a Y
解得:
b
tY t2
增1% 长 绝对环 值 逐 比 = 期 增 增 1长 0 长 0前 速 1量 期 0度 0水
甲企业增长1%绝对值=500/100=5万元 乙企业增长1%绝对值=60/100=0.6万元
时间序列的构成要素与模型
(要点)
1. 构成因素
– 长期趋势 (Secular trend ) – 季节变动 (Seasonal Fluctuation ) – 循环波动 (Cyclical Movement ) – 不规则波动 (Irregular Variations )
3. 平均数时间序列
– 一系列平均数按时间顺序排列而成
绝对数序列的序时平均数
(计算方法)
时期序列
n
•
计算公 式:
Y Y1 Y2
Yn
Yi
i1
n
n
【例11.1】 根据表11.1中的国内生产总值 序列,计算各年度的平均国内生产总值
统计学主要计算公式
统计学主要计算公式统计学是研究数据收集、整理、分析、解释和呈现的科学。
在统计学中,有许多重要的计算公式被广泛应用于统计分析和推断,以下是一些常见的计算公式:1.平均值:平均值是一组数据的总和除以数据的数量。
公式:平均值=总和/数据数量2.中位数:中位数是一组有序数据中的中间值,将数据从小到大排列,若数据的数量为奇数,则中位数为中间的数值;若数据的数量为偶数,则中位数为中间两个数值的平均值。
3.众数:众数是一组数据中出现最频繁的值。
4.方差:方差是一组数据与其平均值的差的平方的平均值。
公式: 方差= (∑(xi-平均值)^2) / 数据数量5.标准差:标准差是方差的平方根,用于衡量一组数据的离散程度。
公式:标准差=√方差6.相关系数:用于衡量两个变量之间线性相关程度的统计量。
公式: r = Cov(X,Y) / (SD(X) * SD(Y))其中,Cov(X,Y)表示X和Y的协方差,SD(X)和SD(Y)分别表示X和Y的标准差。
7.正态分布概率密度函数:正态分布是统计学中最重要的分布之一,其概率密度函数可以描述随机变量的分布。
公式:f(x)=(1/(σ*√(2π)))*e^(-(x-μ)^2/(2σ^2))其中,μ表示均值,σ表示标准差,e表示自然常数。
8.合并概率公式:用于计算多个事件同时发生的概率。
公式:P(A∩B)=P(A)*P(B,A)其中,P(A)表示A事件发生的概率,P(B,A)表示在A事件发生的条件下B事件发生的概率。
9.条件概率公式:用于计算在已知其中一事件发生的条件下另一事件发生的概率。
公式:P(A,B)=P(A∩B)/P(B)其中,P(A,B)表示在B事件发生的条件下A事件发生的概率。
10.抽样误差公式:用于计算样本估计值与总体参数之间的误差。
公式:误差=Z*(标准误差)其中,Z表示置信水平对应的标准正态分布的分位数,标准误差表示样本估计的标准差。
这些计算公式是统计学中非常重要的工具,用于帮助我们理解和解释数据的特征和关系。
统计学公式
3
xi x 4 n(n 1) 3(n 1) 2 ( ) . s (n 1)(n 2)(n 3) (n 2)(n 3)
2
统计学公式
二、概率分布
一、度量事件发生的可能性:
1.事件 A 发生的概率: P ( A) 二、随机变量的概率分布:
统计学公式
一、用统计量描述数据
一、水平的度量:
x x2 x3 1.简单平均数: x 1 n
xn
X
i 1
n
i
n
.
k
M f M 2 f2 M k fk 2.加权平均数: x 1 1 f1 f 2 f k
M
i 1
i i
f
n
.(如果原始数据被分成 k 组,各
2
E2
.
四、假设检验
一、一个总体参数的检验
1.大样本的检验
(1)在大样本的情况下,样本均值的抽样分布近似服从正态分布,其抽样标准差为 /
2
n.
采用正态分布的检验统计量.设假设的总体均值为 0 ,当总体方差 已知时,总体均值检验 的统计量为: z
x 0
/ n
.
(2)当总体方差 未知时,可以采用样本方差 s 来代替,此时总体均值检验的统计量为:
组的组中值分别用 M1,M 2, ,M k 表示,各组的频数分别用 f1,f 2, ,f k 表示,则得到 样本平均数计算公式)
x n 1 2 3.中位数( M e ) : Me 1 x n x n 1 2 2 2
n
p ;
(1 )
统计学原理常用公式
统计学原理常用公式1.样本均值公式:样本均值是用来估计总体均值的一种方法,公式为:\bar{x} = \frac{{\sum_{i=1}^n x_i}}{n}\]其中,\(\bar{x}\) 是样本均值,\(x_i\) 是第 \(i\) 个观察值,\(n\) 是样本容量。
2.样本方差公式:样本方差是用来估计总体方差的一种方法,公式为:s^2 = \frac{{\sum_{i=1}^n (x_i - \bar{x})^2}}{n-1}\]其中,\(s^2\) 是样本方差,\(x_i\) 是第 \(i\) 个观察值,\(\bar{x}\) 是样本均值,\(n\) 是样本容量。
计算样本方差时使用的是无偏估计公式。
3.标准差公式:标准差是样本方差的平方根,公式为:s = \sqrt{s^2}\]其中,\(s\)是样本标准差。
4.离差平方和公式:离差平方和是指每个观察值与均值之差的平方的总和,公式为:\sum_{i=1}^n (x_i - \bar{x})^2\]5.切比雪夫不等式:切比雪夫不等式给出了随机变量与其均值之间的关系,公式为:P(,X-\mu,\geq k\sigma) \leq \frac{1}{k^2}\]其中,\(X\) 是随机变量,\(\mu\) 是均值,\(\sigma\) 是标准差,\(k\) 是大于零的常数。
6.二项分布的期望值和方差公式:二项分布用于描述在\(n\)次独立重复试验中成功的次数的概率分布。
其期望值和方差分别为:E(X) = np\]Var(X) = np(1-p)\]其中,\(X\)是二项分布随机变量,\(n\)是试验次数,\(p\)是单次试验成功的概率。
7.正态分布的概率密度函数和累积分布函数公式:正态分布描述了大部分自然现象中的连续性随机变量的分布。
f(x) = \frac{1}{{\sqrt{2\pi}\sigma}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]F(x) = \frac{1}{2}\left[1 + \text{erf}\left(\frac{x -\mu}{\sqrt{2}\sigma}\right)\right]\]其中,\(x\) 是正态分布的随机变量,\(\mu\) 是均值,\(\sigma\) 是标准差,\(\text{erf}\) 是误差函数。
(整理)统计学计算公式
第4章)(公式计划实际总2-4%100⨯=∑∑XX K计划任务数为平均数时)(公式计划实际平3-4%100⨯=X X K(ⅰ)当计划任务数表现为提高率时)(公式计划提高百分数实际提高百分数4-4%10011⨯++=Kⅱ)当计划任务数表现为降低率时时间进度=)(公式全期时间截止到本期的累计时间7-4%100⨯8)-4(%100公式数计划期间计划规定累计数计划期间实际完成累计计划完成程度相对指标⨯=)(公式水平计划规定末期应达到的平计划末期实际达到的水计划完成程度相对指标9-4%100⨯=(%100公总体的全部数值总体中某一部分数值结构相对指标⨯=)11-4(公式总体中另一部分数值总体中某一部分数值比例相对指标=)12-4(公式单位)的同一指标数值同时期乙地区(部门或的某一指标数值甲地区(部门或单位)比较相对指标=%100⨯=计划任务数实际完成数计划完成程度相对指标5)-4( %100-11公式计划降低百分数实际降低百分数⨯-=K %100⨯=全期的计划任务数本期内累计实际完成数计划执行进度)13-4(公式联系的总量指标数值另一性质不同但有一定某一总量指标数值强度相对数=14)-4(%100公式该指标基期数值某指标报告期数值动态相对数⨯=对于分组数据,众数的求解公式为:df f f f f f M m m m m m m ⨯-+---≈+-+)()(U 1110上限公式: df f f f f f M m m m m m m ⨯-+---≈+-+)()(U 1110上限公式:对于分组的数值型数据,中位数按照下述公式求解:对于分组的数值型数据,四分位数按照下述公式求解:LLL L L d f S n L Q ⨯-+≈-14 u U U U U d f S nL Q ⨯-+≈-143(1)简单算数平均数 (2)加权算数平均数nxx ni i∑==1∑∑∑∑====⋅==ki ki iii ki iki ii ff x f fx x 1111各变量值与算术平均数的离差之和为零。
(完整word版)统计学常用公式
公式一1. 众数【MODE 】(1) 未分组数据或单变量值分组数据众数的计算未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。
(2) 组距分组数据众数的计算对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。
下限公式: 1012M =L++i ∆⨯∆∆ 式中:0M 表示众数;L 表示众数的下线;1∆表示众数组次数与上一组次数之差;2∆表示众数组次数与下一组次数之差;i 表示众数组的组距。
上限公式:2012M =U-+i ∆⨯∆∆ 式中:U 表示众数组的上限。
2.中位数【MEDIAN 】(1)未分组数据中中位数的计算根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。
设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:e N+M =X1()2当N 为奇数e N N +1221M =X +X 2⎛⎫⎛⎫⎪ ⎪⎝⎭⎝⎭⎧⎫⎪⎪⎨⎬⎪⎪⎩⎭ 当N 为偶数(2)分组数据中位数的计算分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:N=1m-1e m-S 2M =L+ii fd f ⨯∑式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。
3.均值的计算【A VERAGE 】(1)未经分组均值的计算未经分组数据均值的计算公式为: 112n ++==nii x x x x x n n=∑…(2)分组数据均值计算分组数据均值的计算公式为: 11221121+++==+ki ik k i k kii x f x f x f x f x f f f f==+∑∑+4.几何平均数【GEOMEAN 】几何平均数是N 个变量值乘积的N 次方根,计算公式为:式中:G 表示几何平均数;∏表示连乘符号。
统计学计算公式大全
统计学计算公式大全统计学是数学中一个重要的分支,它利用分析数据,抽象出具有相似特征的概念,研究其变化规律、发展趋势,为决策提供重要的依据。
统计学涉及的范畴较广,涉及统计数据的收集、分析处理、描述抽象、模型建立、推理预测等数学计算技术,其中重要的组成部分就是计算公式,下面就是统计学计算公式大全。
一、抽样调查统计1、样本量的计算公式:n=N/ (1+N*e2/δ2)其中:n为样本量,N为总体量,e为期望的标准误差,δ为期望的置信度。
2、样本抽取a)取系统抽样公式:Pi=Di/n其中:Pi为抽取的概率,Di为分层抽样时的各层系统抽样量,n 为总体量。
b)层抽样公式:Di=ni/ni+N1+…+Nk其中:Di为分层抽样时的各层系统抽样量,ni为各层抽样量,N1+…+Nk为总体量。
3、数据分析a)差、方差、标准差极差X=Xmax-Xmin方差S2=G2S/(n-1)标准差S=根号[G2S/(n-1)]其中:Xmax,Xmin为所有样本数据的最大值和最小值,G1S和G2S分别为样本一阶矩和二阶矩,n为样本量。
b)值、中位数均值:X=G1S/n中位数:中位数=X((n+1)/2)其中:G1S为样本一阶矩,n为样本量。
c)分位数百分位数:Xp=(n+1)P/100其中:P为百分位数,n为样本量二、两个样本的比较1、大样本检验a) t检验t=X1-X2/S其中:X1,X2分别为样本1和样本2的均值,S为两个样本总体方差的平均值。
b) F检验F=S12/S22其中:S12,S22分别为样本1和样本2的方差。
2、小样本检验a) Z检验z=X1-X2/S其中:X1,X2分别为样本1和样本2的均值,S为样本1和样本2的总体标准差的平方根。
b)2检验χ2=∑[(Oi-Ei)2/Ei]其中:Oi,Ei分别为样本的实际频数和期望频数。
三、数据回归分析1、回归分析公式Y=a+bX其中:Y,X分别为回归变量,a,b分别为回归系数。
统计学原理-计算公式
统计学原理-计算公式位值平均数计算公式1、众数:是一组数据中出现次数最多的变量值组距式分组下限公式:002110m m d L M ??+??+= 0m L :代表众数组下限; 1100--=?m m f f :代表众数组频数—众数组前一组频数0m d :代表组距;1200+-=?m m f f :代表众数组频数—众数组后一组频数2、中位数:是一组数据按顺序排序后,处于中间位置上的变量值。
中位数位置21+=n 分组向上累计公式:e e e e m m m m e d f S f L M ?-∑+=-12 e m L 代表中位数组下限; 1-e m S :代表中位数所在组之前各组的累计频数;e mf 代表中位数组频数; e m d 代表组距3、四分位数:也称四分位点,它是通过三个点将全部数据等分为四部分,其中每部分包含25%,处在25%和75%分位点上的数值就是四分位数。
其公式为:411+=n Q 212+=n Q (中位数) 4)1(33+=n Q 实例数据总量: 7, 15, 36, 39, 40, 41一共6项Q1 的位置=(6+1)/4=1.75 Q2 的位置=(6+1)/2=3.5 Q3的位置=3(6+1)/4=5.25 Q1 = 7+(15-7)×(1.75-1)=13,Q2 = 36+(39-36)×(3.5-3)=37.5,Q3 = 40+(41-40)×(5.25-5)=40.25数值平均数计算公式1、简单算术平均数:是将总体单位的某一数量标志值之和除以总体单位。
其公式为:n x n x x x X n ∑=??++=212、加权算术平均数:受各组组中值及各组变量值出现的频数(即权数f )大小的影响,其公式为:fxf f f f f x f x f x X i i i ∑∑=??++??++=2122113、加权算术平均数的频率:其公式为:f f X f f X f f X f f X X n ∑?∑=∑∑??+∑+∑=22114、调和平均数:由于只掌握每组某个标志的数值总和(M )而缺少总体单位数(f )的资料,不能直接采用加权算术平均数法计算平均数,则应采用加权调和平均数。
统计学原理重要公式
统计学原理重要公式1.样本均值公式:样本均值是样本数据的总和除以样本的大小。
它的公式是:$$ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i $$其中,n是样本的大小,xi是第i个观测值。
2.总体均值公式:总体均值是从总体中取得的全部样本数据的总和除以总体的大小。
它的公式是:$$ \mu = \frac{1}{N} \sum_{i=1}^{N} x_i $$其中,N是总体的大小,xi是第i个观测值。
3.样本方差公式:样本方差是样本数据与样本均值差的平方和的平均值。
它的公式是:$$ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 $$其中,n是样本的大小,xi是第i个观测值,$ \bar{x} $是样本均值。
4.总体方差公式:总体方差是总体数据与总体均值差的平方和的平均值。
它的公式是:$$ \sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2 $$其中,N是总体的大小,xi是第i个观测值,$ \mu $是总体均值。
5.样本标准差公式:样本标准差是样本方差的平方根。
它的公式是:$$ s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2} $$其中,n是样本的大小,xi是第i个观测值,$ \bar{x} $是样本均值。
6.总体标准差公式:总体标准差是总体方差的平方根。
它的公式是:$$ \sigma = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2} $$其中,N是总体的大小,xi是第i个观测值,$ \mu $是总体均值。
7.样本比例公式:样本比例是样本中具有一些特征的观测值的比例。
$$ p = \frac{x}{n} $$其中,n是样本的大小,x是具有特征的观测值的数量。
初级统计学公式大全
初级统计学公式大全统计学是研究收集、整理、分析和解释数据的科学,广泛应用于各个领域。
以下是一些初级统计学中常用的公式,供参考:1. 均值(Mean)均值是统计数据的平均值,计算公式为:mean = (x1 + x2 + ... + xn) / n其中,xi为数据集中的每个观察值,n为数据集中的总观察数。
2. 中位数(Median)中位数是将数据集按照从小到大顺序排列后,位于中间位置的值,计算公式为:若n是奇数,中位数=第(n+1)/2个观察值若n是偶数,中位数=(第n/2个观察值+第(n/2+1)个观察值)/23. 众数(Mode)众数是数据集中出现频率最高的值,可能有多个众数。
4. 方差(Variance)方差是衡量数据集观察值与其均值差异的平均数,计算公式为:variance = (Σ(xi - mean)²) / (n-1)其中,xi为数据集中的每个观察值,mean为数据集的均值,n为数据集的总观察数。
5. 标准差(Standard Deviation)标准差是方差的平方根,用于衡量数据集观察值与均值的离散程度,计算公式为:std_deviation = sqrt(variance)6. 离散系数(Coefficient of Variation)离散系数是标准差与均值之比的绝对值,通过比较不同数据集的离散性,计算公式为:CV = (std_deviation / mean) × 100%7. 百分位数(Percentile)百分位数是将数据集按照从小到大顺序排列后,一些特定百分比位置的值。
8. 四分位数(Quartile)四分位数将数据集分割为四个等份,将数据集按照从小到大顺序排列后,计算公式为:Q1=第(n+1)/4个观察值Q2=中位数Q3=第3(n+1)/4个观察值9. 相关系数(Correlation Coefficient)相关系数度量两个变量之间线性关系的强度和方向,常用的是皮尔逊相关系数,计算公式为:correlation = (Σ((xi - mean_x) /std_deviation_x) × ((yi - mean_y) / std_deviation_y)) / (n - 1)其中,xi为第一个变量的观察值,mean_x为第一个变量的均值,std_deviation_x为第一个变量的标准差;yi为第二个变量的观察值,mean_y为第二个变量的均值,std_deviation_y为第二个变量的标准差。
统计学重要公式
统计学重要公式()()D 22221. X X2. N3. Q4. 1 (2) S 1U L iiXnIQR Q Q XNX n μμσμ====--=-=-∑∑∑∑样本平均数:总体平均数:四分位差:方差:()总体方差:样本方差:225. 1 2 S S6.100%100%100%CV S CV X σσσμ==⎛⎫⎛⎫=⨯=⨯ ⎪ ⎪⎝⎭⎝⎭⎛⎫=⨯ ⎪⎝⎭标准差:()总体标准差:()样本标准差:变异系数标准差总体:平均数样本:()()()()()22121111117.() ,8. (,)19. ,,,i i i i iiXY XYXYXY X YXX YYn i nni XX i ii i n n i i nni i XY iii i i i YY i X X X Z Z Z S XXYYCov X Y S n S L r S S L L X L X XXnX Y L XXYYX Y nL Y μσ=======--==--==-==⎛⎫ ⎪⎝⎭=-=-⎛⎫⎛⎫⎪ ⎪⎝⎭⎝⎭=--=-=-∑∑∑∑∑∑∑∑标准分数分数或样本协方差皮尔逊相关系数()22121111,,n i nni ii i nniii i Y YYnX YX Y n n=====⎛⎫ ⎪⎝⎭=-==∑∑∑∑∑()()()()()2210. X 11. X 12. S 113.!121,!!12,!,!!!iiiiiiiim nm mn nm n mn nW X WF X FF XXn n P n n n n m m n n P n Cm m n m C C -==-=-==--⋅⋅⋅-+=⨯⨯⋅⋅⋅⨯==-=∑∑∑∑∑加权平均数分组数据样本平均数分组数据样本方差排列组合公式ni i 114. ()1()15. P(A B)P(A)P(B)-P(A B)P(A B)P(A B)16. P(A|B), P(B|A)()()17. P(A B)()P(A|B)()P(B|A)18. P(A B)()()19. P(B)()P(B|A )20.i P A P A P B P A P B P A P A P B P A ==-⋃=+⋂⋂⋂==⋂=⋅=⋅⋂==⋅∑事件补的概率加法公式条件概率乘法公式独立事件全概率公式贝叶i i i njj 1()P(B|A )()P(B|A )P(A |B)P(B)()P(B|A )i i jP A P A P A =⋅⋅==⋅∑斯公式()22221.()()22.()()23.(),0,1,2,...,,124.(),()(1)25.()!!27.()x x n x n x x x n xr N rE X xp x Var X x p x p x C p q x n q p E X np Var X np p e e p x x x C C p x C μλμσμμσμλ-----====-===-====-==⋅=∑∑离散型随机变量的数学期望离散型随机变量的方差二项分布的概率函数二项分布的数学期望和方差泊松分布超几何分布()222,0128.()229.nN x x r f x e x Z μσπσμσ--≤≤=-=正态概率密度函数标准正态分布变换30. X :(), 131.:(),(1)1(1)X X PPE X N n N n nP E p p N n p p N n p p nμσσσσσσ=-⎛⎫= ⎪-⎝⎭==⎛⎫--= ⎪ ⎪-⎝⎭-=的数学期望和标准差有限总体时无限总体时比例的数学期望和标准差有限总体时无限总体时2222222232.:33.(1):,(2):,(3),,,(4),,34.:X X Z n S X Z nX Z n S X t nZ n αααααμμσσσμ-±±±±=∆估计时的抽样误差总体均值的区间估计大样本且方差已知大样本且方差未知总体正态小样本方差已知总体正态小样本方差未知估计时所需的样本容量222200(1)35.(1)36.37.::,/:/38.:,1/39.:(1)p p P p Z nZ p p p n X Z n X Z S nX t df n S np p Z p p nααμσμμ-±⋅-=∆-=-=-==--=-总体比率的区间估计的区间估计时所需的样本容量大样本总体均值的检验统计量方差已知方差未知小样本总体均值的检验统计量总体比率检验统计量()()()122222011212121222121240.:,41.,::(),XX Z Z n Z Z X X X X E X X n n αβαασμμμμσσσ--=----=-=+总体均值的单侧检验中所需样本容量用代替即为双侧检验的公式独立样本时两个总体均值之差的点估计量的期望值与标准差()()()()()()()()()()12121212121212121222212121212222222121212121212242.:(1)(,30),,:(2),, 11,()(3),X X X X X X X XX X X Xn n XX Z S S S n n X X Z S X X n n n n XX t S ααασσσσσσσσσσσσ------≥-±=+-±=-=+=+-±两个总体均值之差的区间估计大样本已知的点估计量为大样本未知时的标准差小样本正态()()()()()12121222121212122121212121211221112143.X (1) Z ,X (2),11(3)44.:(1)(1)(1)p dd p p X n n X t S n n d t S np p p p E p p p p p p p p p p p n n n μμσσμμμσ----=+---=⎛⎫+ ⎪⎝⎭-=---=----=+=+两个总体均值之差的假设检验统计量大样本小样本相关样本两个比率之差的点估计量的期望值与标准差1212222112212(1)(1)(1):p p p p p n p p p p S n n σ-----=+的点估计量 ()()()()()()12121212111122221221212112212121245.:,(1),,(1)5,46.::11:(1)p p pppp p p n p n p n p n p p p Z S p p p p Z n p n p p n n p p S p p n n ασσ------≥-±---=+=+⎛⎫==-+ ⎪⎝⎭两个总体比率之差的区间估计大样本时两个总体比率之差的检验统计量总体比率合并估计时的点估计量()()()()()22222/2(1/2)2222122221221147.:148.:49.:50.:,151.::ki ii ii j ij ij ijjijn S n S n S S F S f e df k e RT CT i j e n f e e αασχχχσχχ-=--≤≤-==-==-⨯⨯==-=∑一个总体方差的区间估计一个总体方差的检验统计量两个总体方差的检验统计量拟合优度检验统计量独立假设条件下列联表的期望频数第行之和第列之和样本容量独立性检验统计量()(),11idf R C =--∑∑()()1221111212152.:,:,1:,1:,1:():,:1jjjn iji jjn ij ji jj n kijkj i t t jj t kjjt j t kjjj K XXn XXSn XX n nn SSTRMSTR k SSTR nXX SSEMSE n kSSE nS k ========-=-==-=-=-=-=-∑∑∑∑∑∑∑检验个均值的相等性第j个处理的样本均值第j个处理的样本方差总样本均值处理均方处理平方和误差均方误差平方和个均值相等检()211i ::::X LSD :t 11jn kij tj i ji j MSTRF MSESST X X SST SSTR SSE XFisher MSE n n ====-=+-=⎛⎫+⎪ ⎪⎝⎭∑∑验统计量总平方和平方和分解多重比较方法的检验统计量()()()()()()2112.12.12254.::,1,:,1,:,1,:,11::,1,:k at ij tt t j i k b j t b j ar i tr i e t b r e ij t ijt i b SS X X df n SS a X X df k SS k X X df a SS SS SS SS df k a X SS Xdf ak akX SS =====-=-=-=-=-=-=--=--=-=-=∑∑∑∑∑∑∑∑随机化区组设计总平方和处理平方和区组平方和误差平方和求平方和的另一种方法总平方和处理平方和()()()()()()2222,1,:,1,:,11j ij b ijijr r e t b r e X df k aakX X SS df a k akSS SS SS SS df k a -=-=-=-=--=--∑∑∑∑∑∑∑∑区组平方和误差平方和()()()()()()21112.12.12..1155.::,1:,1,:,1,:,11:,abrijk ttt i j k ai tAi bj tB j abij i j tABi j e SST X X dfn A SSA br X X df a B SSB ar X X df b SSAB r X X X X dfa b SSE SST SSA SSB SSAB df a ========-=-=-=-=-=-=--+=--=---=∑∑∑∑∑∑∑析因试验总平方和因子平方和因子平方和交互作用平方和误差平方和(1)br ab ab r -=-()()()()01010121220157.::::min :,i i iii i i y x E y xy b b xy y x y x y nb x xnb y b xββεββ=++=+=+--=-=-∑∑∑∑∑∑简单线性回归模型简单线性回归方程估计的简单线性回归方程最小二乘法估计的回归方程的斜率和截距()()()()()()()()()222222222222221122::::()::():i i iiiii i i i i i iixy SST SSR SSESSE y y y SST yyynX SSR y yb X nX Y X Y n X XnSSRR r SSTr b b r S M σ=+=-=-=-⎡⎤⎢⎥=-=-⎢⎥⎣⎦⎡⎤-⎢⎥⎢⎥⎣⎦=-=====∑∑∑∑∑∑∑∑∑∑∑∑平方和分解误差平方和总平方和回归平方和判定系数决定系数样本相关系数的符号判定系数的符号均方误差的估计量2:2SSE SE n SSE S MSE n =-==-估计量的标准误差()()()()()1110012212212002200/20::::1:1:():1:1b iib i ib y i i y y y b X XnSb S X Xnb t t S SSR SSRMSR SSRMSRF F MSE X Xy S S n X X n E y y t S X XS S n ασσ-=-=-=====-=+⎡⎤⎢⎥-⎢⎥⎣⎦±⋅-=++∑∑∑∑∑∑的标准差的估计的标准差统计量回归均方自变量的个数检验统计量的估计的标准差的置信区间估计一个个别值估计的标准差()0022200/2:i i yy X X n y y t S α-⎡⎤⎢⎥-⎢⎥⎣⎦±⋅∑∑的预测区间估计()()()0112201122222258.::::min ,,::1:111::1p p p pi i a y x x x E y x x x y y SST SSR SSE SST SSR SSESSRR SSTn R R n p SSRMSR p SSEMSE n p F ββββεββββ=+++⋅⋅⋅++=+++⋅⋅⋅+-=+=-=--⋅--==--∑ 多元线性回归模型多元回归方程估计的多元回归方程最小二乘法之间的关系多元决定系数修正的多元决定系数回归均方误差均方检::iib MSRF MSE bt t S ==验统计量检验统计量。
统计学原理公式
第二章数据描述1、组距=上限—下限2、简单平均数:x=Σx/n3、加权平均数:x=Σxf/Σf4、全距: R=x max-x min5、方差和标准差:方差是将各个变量值和其均值离差平方的平均数。
其计算公式:未分组的计算公式:σ2=Σ(x-x)2/n分组的计算公式:σ2=Σ(x-x)2f/Σf样本标准差则是方差的平方根:未分组的计算公式:s=[Σ(x-x)2/(n-1)]1/2分组的计算公式:s=[Σ(x-x)2f/(Σf-1)] 1/2σ=[Σ(x-x)/n] 1/26、离散系数:总体数据的离散系数:Vσ=σ/x样本数据的离散系数:V s=s/x10、标准分数:标准分数也称标准化值或Z分数,它是变量值与其平均数的离差除以标准差后的值,用以测定某一个数据在该组数据的相对位置。
其计算公式为:Z i=(x i-x)/s标准分数的最大的用途是可以把两组数组中的两个不同均值、不同标准差的数据进行对比,以判断它们在各组中的位置。
第三章参数估计1、统计量的标准误差:(样本误差)(1)在重复抽样时;样本标准误差:σx=σ/n或σx=s/n样本的比例误差可表示为:σp=[π(1-π)/n]1/2或σp=[p(1-p)/n] 1/2(2)不重复抽样时:σ2x=σ2/n×(N-n/N-1)σ2p=p(1-p)/n×(N-n/N-1)2、估计总体均值时样本量的确定,在重复抽样的条件下:n= Z2σ2/E23、估计总体比例时样本量的确定,在重复抽样的条件下:n=Z2×p(1-p)/E24、(1)在大样本情况下,样本均值的抽样分布服从正态分布,因此采用正态分布的检验统计量,当总体方差已知时,总体均值检验统计量为:Z=(x-μ)/( σ/n)(2)当总体方差未知时,可以用样本方差来代替,此时总体均值检验的统计量为:Z=(x-μ)/( s/n)5、小样本的检验:在小样本(n<30)情况下,检验时,首先假定总体均值服从正态分布。
《统计学原理》公式
《统计学原理》公式大全一、统计整理1.组距=上限 - 下限 2.组中值(1)闭口组2下限上限组中值+= (2)开口组组中值①2相邻组组距上限值缺下限的开口组的组中-= ②2相邻组组距下限值缺上限的开口组的组中+= 二、综合指标1.计划完成相对数 =计划任务数实际完成数2.计划执行进度 =计划期计划任务累计数数一时间的实际完成累计自计划执行之日起至某3.结构相对数 =总体总量总体中某部分数值4.总体中另一部分数值总体中某部分数值比例相对数=5.值另一总体的同类指标数某总体的某指标数值比较相对数=6.的总量指标数值另一性质不同但有联系某一总量指标数值强度相对数=7.基期指标数值报告期指标数值动态相对数=8.总体单位总量总体标志总量算术平均数=9.简单算术平均数 x —=nxn x x x n ∑=+++ 21 10.加权算术平均数 x —=∑∑=∑+++f xf f f x f x f x n n 2211 11.简单调和平均数 ∑=-xN x H 112.加权调和平均数 ∑∑=-mxmx H 113.极差(R )= 最大标志值 — 最小标志值14.简单平均差 D A ⋅=nx x∑-—15.加权平均差 D A ⋅=∑-fx x —16.简单标准差 nx x ∑-=)(—2σ17.加权标准差 ∑∑-=ffx x )(—2σ三、抽样推断1.重复抽样条件下的抽样平均数的抽样平均误差 nx σμ2=2.重复抽样条件下的抽样成数的抽样平均误差 nP P p )1(-=μ 3.不重复抽样条件下的抽样平均数的抽样平均误差 )1(2N nn x -=σμ4.抽样成数的抽样平均误差 )1()1(Nnn P P p --=μ 5.抽样平均数的抽样极限误差 =∆xμ-⋅x t 6.抽样成数的抽样极限误差=∆pμp t ⋅7.概率度 t =μxx ∆ t = μpp ∆8.总体均值的区间估计 x __±∆x9.总体比例的区间估计 p ±∆P四、统计指数1.个体价格指数 p pk p 01=2.个体产量指数 q q k q 01=3.个体成本指数 z z k z 01=4.数量指标综合指数 ∑∑=p q p q k q 00015.质量指标综合指数 ∑∑=p q p q k p 01116.加权算术平均数指数 ∑∑⋅=p q p q k k q q 0007.加权调和平均数指数 ∑⋅∑=p q k p q k pp 111118.可变构成指数 ∑∑∑∑⋅⋅==)()(00011101_________f x f f x x x k 可变9.固定构成指数 ∑∑∑∑⋅⋅=)()(110111___f f x f x k 固定10.结构影响指数 ∑∑∑∑⋅⋅=)()(00110___f x f f x k 结构11.指数体系相对数形式 k k k p q qp ⨯= 即∑∑⨯∑∑=∑∑p q p q p q p q p q p q 011100010011 绝对数形式:)()(011100010011∑∑-+∑∑-∑∑=-p q p q p q p q p q p q五、动态数列1.根据时期数列计算平均发展水平 n a na a a a n ∑=+++=21—2.根据间隔相等的连续时点数列计算平均发展水平n a na a a a n ∑=+++=21—3.根据间隔不等的连续时点数列计算平均发展水平∑∑=ffa a —4.根据间隔相等的间断时点数列计算平均发展水平1221222132113221—-++++=-++++++=--n n a a a a a a a a a a a a nn nn5.根据间隔不等的间断时点数列计算平均发展水平f f f f aa f a a f a a a n n n n 12111232121—222---+++++++++= 6.根据相对数动态数列或平均数动态数列计算平均发展水平ba c ———=7.增长量 = 报告期水平 一 基期水平 8.逐期增长量=报告期水平一前一期水平,用符号表示为:a a ,,a a ,a a ,a a n n 1231201----- 9.累计增长量 = 报告期水平一某一固定基期水平用符号表示为:a a ,,a a ,a a ,a a n 0030201---- 10.各期的逐期增长量之和等于最后一个时期的累计增长量,用公式表示为: a a a a a a a a a a n n n 01231201)()()()(-=-++-+-+--11.相邻两个时期的累计增长量之差等于相应时期的逐期增长量,用公式表示为: a a a a a a n n n n 1010)()(---=---12.年距增长量 = 本期发展水平 - 去年同期发展水平 13.1-==时间数列的项数累计增长量逐期增长量的个数逐期增长量之和平均增长量14.基期水平报告期水平发展速度=15.前一期水平报告期水平环比发展速度=用符号表示为:a a a a a a a a n n 1231201,,,,- 16.某一固定基期水平报告期水平定基发展速度=用符号表示为:a a a a a a a a no o 03201,,,,17.定基发展速度等于相应时期内的各环比发展速度的连乘积,用符号可表示为:a a a a a a a a n n 1231201-⨯⨯⨯⨯ =aa n 018.相邻两个定基发展速度之比等于相应时期的环比发展速度,用符号可表示为:a a a a a a n nn n 1010--=÷19.去年同期发展水平本期发展水平年距发展速度=20.11-=-=-==发展速度基期水平报告期水平基期水平基期水平报告期水平基期水平报告期增长量增长速度21.1-=-==环比发展速度前一期水平前一期水平报告期水平前一期水平逐期增长量环比增长速度 22.1-=-==定基发展速度某一固定基期水平某一固定基期水平报告期水平某一固定基期水平累计增长量定基增长速度23.()1-==年距发展速度月或季去年同期发展水平年距增长量年距增长速度24.平均发展速度的计算公式为:ninnx x x x x x ∏=⋅⋅⋅⋅= 321—由于环比发展速度的连乘积等于相应定基发展速度,因此平均发展速度的公式可写成:non a a x =—25.平均增长速度 = 平均发展速度 一1 26.100100100%1前一期水平前一期水平期增长量逐期增长量环比增长速度逐期增长量的绝对值增长=⨯=⨯=。
统计学公式
统计学114个公式1.组距=本组上限-本组下限(不包括上.下限的数字)2.间断式分组组距: 组距=本组上限-前组上限3.组距=本组下限-前组下限4.组距=本组上限-本组下限+15.开口组中值:组中值=(上限+下限)/2 缺下限:上限- —————— =组中值6.缺上限:下限- ————— =组中值 7.d=R/n(R 为总体全距,n 为组数,d 为组距) 8.N=1+3.322lgN N 为组数,N 为总体容量9. 简单算术平均数X = (X 1+X 2 +X 3 +…+X n )/n(可简记为X =ΣX n /n )10.加权算术平均数X=(X 1f 1+X 2f 2+…+ X k f k )/ (f 1+f 2+…+f k )=ΣX i f i /Σf i (可简记为 X=ΣX i f i /Σf i )11. 算术平均数的数学性质(1)各变量值与算术平均数的离差之和等于零,即:相邻组组距2 相邻组组距 2=0(对于简单算术平均数) 或=0(对于加权算术平均数)12.(2)各变量值与算术平均数的离差平方之和为最小值,即: Σ(x i -x)2 =最小值 或Σ(x i -x)2≤Σ(x i -x 0)2 (只有当x = x 0 时,等号成立) 13. 简单调和平均数 H =km /(m/x 1+m/x 2+…+m/x k )=k /Σ(1/x i )可简记为:H = k /Σ(1/x i )14.加权调和平均数H =(m 1+m 2+…+m k )/(m 1/x 1+m 2/x 2+…+m k /x k )=Σm i /Σ(m i /x i )(可简记为:H =Σm i /Σ(m i /x i )。
)15. 简单几何平均数 G = n √x 1.x 2.x 3…x n = n √∏x i (可简记为G = n √∏x i )16. 加权几何平均数 G = Σfi √x 1 f1.x 2 f2.x 3 f3…x n fk= Σfi √∏x fi i(可简记为G =Σfi √∏x fi i ) 17. 算术平均数、调和平均数和几何平均数的数学关系 幂平均数的定义是:x t = t √Σx t /n 当t=1时,幂平均数就是算术平均数; 当=-1时,幂平均数就是调和平均数;当趋向于0时,幂平均数的极限形式就是几何平均数。
统计学公式大全
基本事件的全体,称为试验的样本空间,用 表示。
一个事件就是由 中的部分点(基本事件 )组成的集合。通常用大写字母
A,B,C,…表示事件,它们是 的子集。 为必然事件,Ø 为不可能事件。
不可能事件(Ø)的概率为零,而概率为零的事件不一定是不可能事件;同理, 必然事件(Ω )的概率为 1,而概率为 1 的事件也不一定是必然事件。 ①关系:
n
A Bi
2°
i1 , P( A) 0 ,
则
P(Bi / A)
P(Bi )P( A / Bi )
n
,i=1,2,…n。
P(Bj )P(A/ Bj )
j 1
此公式即为贝叶斯公式。
P(Bi ) ,( i 1,2 ,…,n ),通常叫先验概率。P(Bi / A) ,( i 1,2 ,…, n ),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了
(5)基本 事件、样本 空间和事 件
(6)事件 的关系与 运算
加法原理(两种方法均能完成此事):m+n 某件事由两种方法来完成,第一种方法可由 m 种方法完成,第二种方法可由 n 种方法来完成,则这件事可由 m+n 种方法来完成。 乘法原理(两个步骤分别不能完成这件事):m×n 某件事由两个步骤来完成,第一个步骤可由 m 种方法完成,第二个步骤可由 n 种方法来完成,则这件事可由 m×n 种方法来完成。 重复排列和非重复排列(有序) 对立事件(至少有一个) 顺序问题 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个, 但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试 验。 试验的可能结果称为随机事件。 在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有 如下性质: ①每进行一次试验,必须发生且只能发生这一组中的一个事件; ②任何事件,都是由这一组中的部分事件组成的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.计量资料的统计描述
均数(了解即可,加权的算法应该不看了)
①算数均数:直接法
n X
n Xn X X X ∑=
+++=
(21)
加权法
n fX
f fX f f f X f X f X f X k k k ∑=
∑∑=++++++=
(212211)
②几何均数(G ) 直接:⎪
⎭⎫
⎝⎛∑=-n X
G lg lg 1 加权:
⎪⎭⎫
⎝⎛∑=-n X f G lg lg 1
③中位数:直接:奇数时()2
/
1+=n X M 偶数时()2/12/2/++=n n X X M
加权略 离散趋势
①极差(全距)(R )= 最大值-最小值 ②四分位数间距(Q ):P 75 (上四分位数)- P 25(下四分位数) ③方差(S 2
):(离均差(-
-X X )平分和的总和÷N (或N-1))
总体方差:()N X 2
2μσ-∑= 样本方差:()
()1
1
2
2
2
2-∑-
∑=
--∑=
n n
X X n X X S
标准差(S ,SD ):
总体:()N
X 2
μσ-∑= 样本:()
()1
1
2
2
2
-∑-
∑=
--∑=
n n
X X n X X S
④变异系数(CV ):%100⨯=
X
S
CV 用于:a. 比较计量单位不同的几组资料的离散程度 b. 比较均数相差悬殊的几组资料的离散程度 2.计量资料统计推断 均数抽样误差与标准误 标准误:n
S n X ==
X S σσ σ为总体,S 为抽样
总体均数的估计
均数的双侧可信区间为:
①大样本或总样本已知(且为正态分布)时,按正态分布原理
()
X X X u X u X u
X σσσααα2/2/2
/ ,±=+-
= ,=
②小样本或总样本未知时,按t 分布原理:
()
X
X X S t X S t X S t
X ναναν
α,2/,2/,2/ ,±=+-
附:参考值范围计算公式(注意区分):(参考值用标准差,可信区间用标准误)
X
-100X 2/P ~ P X 偏态分布正态分布S u α± ,α=1-范围(如95%等)
t 检验
①单样本t 检验(已有一个大样本均数(视为总体均数0μ),本次样本的均数比较与0μX ) 1-n 0
0=-=-=
νμμn
S X S X t X (后面变式可以不用记,即标准误的算法变化)
一般假设:H0:μd= 0, H1:μd ≠ 0,α=
②配对t 检验(一般为对照配比的实验,计算差值, 比较与0d )
n
S d t d
0-=
一般假设:H 0:μd = 0,H 1:μd ≠ 0,α=
③两独立样本t 检验:比较与21X X
)
(2
)1(n )1(n 212
11
n 12122
22112
12
1n X X n n S S X X S X X t +-+-+--=
-=
-,v=n1+n2-2
附:若为两个大样本,可用u 检验
2
22
1212
12
12
1n S n S X
X S X X u X X +-=
-=
-
一般假设:H 0:μ1=μ2,H 1:μ1≠μ2 α=
方差齐性检验
计算公式:()()
1 1
22112221-=-==n n S S F νν较小较大
结果根据F 值,V1值,V2值,查F 表即可
一般假设:H 0:σ12=σ22
,即两组总体方差相等
H 1: σ12≠σ22
,即两组总体方差不等
α=(这个随意啦) 3.方差分析
①完全随机设计资料方差分析
完全随机设计方差分析计算表(较简单)
变异来源 离均差平方和SS
自由度 均方MS F
总 )1(2-N S
N-1
MS 组间/MS 组内
组间
2
)(X X n i
i -∑
k-1 (k 为组数)
SS 组间/df 组间 组内(视为误差)
SS 总 –SS 组间
N-k
SS 组内/df 组内
建立假设:H 0: 1=2 = 3 ,H 1:
1
,
2
, 3
不等或不全相等,=
②随机区组设计资料的方差分析 随机区组设计资料的方差分析
变异来源 离均差平方和SS
自由度()
均方MS F (求两个方差)
总 )1(2-=n S SS T
N-1
处理组间 2
)(∑-=X X m SS i A
k-1(k 为处理因素个数) SS A /(k-1) MS A /MSe 区组组间
2
)(∑-=X X k SS j B
m-1
(m 为组数)
SS B /(m-1) MS B /MSe
误差(sse )
SS 总—A SS —B SS
(k-1)(m-1) SSe/
e
建立假设:有两个方差比较,所以会有两个假设
: 处理因素导致应变量均数相等 ,H 1: 不等或不全相等,=
: 区组因素(如不同区组动物)导致应变量均数相等 ,H 1: 不等或不全相等,= ④多样本均数间的两两比较法
()
)1
1(2/
B
A B A n n MSe X X q +-= 自由度: =
e
4.计量资料
率的抽样误差和标准误
总体:n
p )
1(ππσ-=
样本: n
P p S p )
1(-=
( p =阳性率, 1- p=阴性率)
总体率的置信区间估计 正态近似法:
条件: n 足够大,样本率p 或1-p 均不太小时, 即np 和 n(1-p)>5
p
u
/2
× Sp
两个率的比较的u 检验(z 检验)
①样本率与总体率的比较: n
p p u p
)
1(πππ
σπ
--=
-=
②两个样本率比较(记前面一个公式就好):
)
1
1)(1(S 2
12
12
12
1n n p p p p p p u c c p p +--=-=
-,其中
2
121n n X X p c ++=
卡方检验:
1.计算公式:T 5, 且 N 40时, 使用(注意T 为理论频数)
()T
T A 2
2
-∑
=χ
, df=(行数-1)(列数-1)
A 为实际频数,T 为理论频数(计算方法有多种,此处略)
2.校正公式:1 T < 5,且N 40时,用连续性校正公式
()
∑
--=T
T A 2
5.02χ
四格表资料的Χ2
检验
四格表专用公式:)
)()()(()(22d b c a d c b a n
bc ad ++++-=χ,df =(R-1)(C-1)=1
四格表专用校正公式:())
)()()((2/22
d c b a d b c a n
n bc ad ++++--=
χ
1. T 5, 且 N 40时, 用非校正的公式
2. 1 T < 5,且N 40时,用连续性校正公式
配对设计资料的Χ2
检验(特殊的四格)
①b+c >40时:()c
b c b +-=
2
2χ ② b+c <40时:()
c
b c b +--=
2
12χ
行×列表资料的
2
检验 (R ×C 表资料)
基本公式:⎥⎦
⎤
⎢⎣⎡-∑
=122
C R n n A n χ ,df=(行数-1)(列数-1) 5.直线相关与回归 相关系数:YY
XX XY l l l r
=
,t 检验:r
r s r t 0
-=
,df =n -2
直线回归:bX a Y +=ˆ,()()()
X
b Y a l l X X Y Y X X b XX
XY
-==
---=∑∑2
,t 检验:b
S b t 0
-=
df =n -2。