研究生统计学计算公式

合集下载

统计学原理公式

统计学原理公式

统计学原理公式第二章数据描述1、组距=上限―下限2、简单平均数: x=Σx/n3、加权平均数:x=Σxf/Σf4、全距: R=xmax-xmin5、方差和标准差:方差是将各个变量值和其均值离差平方的平均数。

其计算公式:22未分组的计算公式:σ=Σ(x-x)/n22分组的计算公式:σ=Σ(x-x)f/Σf 样本标准差则是方差的平方根:21/2未分组的计算公式:s=[Σ(x-x)/(n-1)]2 1/2分组的计算公式:s=[Σ(x-x)f/(Σf-1)]1/2σ=[Σ(x-x)/n] 6、离散系数:总体数据的离散系数:Vσ=σ/x 样本数据的离散系数:Vs=s/x 10、标准分数:标准分数也称标准化值或Z分数,它是变量值与其平均数的离差除以标准差后的值,用以测定某一个数据在该组数据的相对位置。

其计算公式为:Zi=(xi-x)/s标准分数的最大的用途是可以把两组数组中的两个不同均值、不同标准差的数据进行对比,以判断它们在各组中的位置。

第三章参数估计1、统计量的标准误差:(样本误差)(1)在重复抽样时;样本标准误差:σx=σ/n 或σx=s/n 样本的比例误差可表示为:1/21/2σp=[π(1-π)/n] 或σp=[p(1-p)/n] (2)不重复抽样时: 22σx=σ/n×(N-n/N-1) 2σp=p(1-p)/n×(N-n/N-1)2、估计总体均值时样本量的确定,在重复抽样的条件下:222n= Zσ/E3、估计总体比例时样本量的确定,在重复抽样的条件下:22n=Z×p(1-p)/E 4、(1)在大样本情况下,样本均值的抽样分布服从正态分布,因此采用正态分布的检验统计量,当总体方差已知时,总体均值检验统计量为:Z=(x-μ)/( σ/n)(2)当总体方差未知时,可以用样本方差来代替,此时总体均值检验的统计量为:Z=(x-μ)/( s/n) 5、小样本的检验:在小样本(n<30)情况下,检验时,首先假定总体均值服从正态分布。

医学统计学公式整理简洁版

医学统计学公式整理简洁版

医学统计学公式整理简洁版1. 平均数(Mean):一组数据的平均值,通过将所有值相加然后除以数据的个数得到。

公式:X̄=ΣX/n其中,X̄表示平均数,ΣX表示所有数据的总和,n表示数据的个数。

2. 中位数(Median):一组数据的中间值,将所有数据按升序排列,如果数据个数为奇数,则中位数是中间的值;如果数据个数为偶数,则中位数是中间两个值的平均数。

3. 众数(Mode):一组数据中出现次数最多的数值。

4. 标准差(Standard Deviation):衡量数据的离散程度,计算每个数据值与平均值的差的平方和的平均值的平方根。

公式:σ=√(Σ(X-X̄)²/n)其中,σ表示标准差,Σ(X-X̄)²表示每个数据值与平均值的差的平方和,n表示数据的个数。

5. 方差(Variance):标准差的平方。

公式:σ²=Σ(X-X̄)²/n6. 相关系数(Correlation Coefficient):度量两个变量之间的线性关系的强度和方向。

相关系数的值介于-1和1之间,接近-1表示负相关,接近1表示正相关,接近0表示无线性相关。

7. t检验(t-test):用于比较两组样本均值是否有显著差异。

8. 卡方检验(Chi-square test):用于比较观察频数与期望频数之间的差异是否显著。

9. 线性回归(Linear Regression):用于预测一个变量与另一个变量之间的关系,并且可以根据这个关系进行预测。

10. 生存分析(Survival Analysis):用于分析事件发生的概率和时间关系,常用于研究患者生存率和治疗效果。

统计学常用公式

统计学常用公式

统计学常用公式统计学是一门研究数据收集、分析、解释和表达的科学。

在统计学中,有许多常用的公式被广泛应用于数据处理和推断分析。

本文将介绍一些统计学常用公式,并对其进行说明和用途解释。

一、描述统计学公式1. 平均值(Mean)平均值是一组数据的总和除以数据的个数,即:$\bar{X} = \frac{X_1 + X_2 + \cdots + X_n}{n}$其中,$\bar{X}$表示平均值,$X_i$表示第i个数据,n表示数据的个数。

2. 中位数(Median)中位数是将一组数据按照大小排列后,处于中间位置的数值。

当数据个数为奇数时,中位数即为排列后正中间的数;当数据个数为偶数时,中位数为排列后中间两个数的平均值。

3. 众数(Mode)众数是一组数据中出现频率最高的数值。

4. 标准差(Standard Deviation)标准差衡量数据的离散程度,其计算公式为:$SD = \sqrt{\frac{(X_1 -\bar{X})^2 + (X_2 -\bar{X})^2 + \cdots + (X_n -\bar{X})^2}{n-1}}$5. 方差(Variance)方差是标准差的平方,即:$Var = SD^2$6. 百分位数(Percentile)百分位数是指一组数据中某个特定百分比处的数值。

比如,第25百分位数是将一组数据从小到大排列后,处于前25%位置的数值。

二、概率与统计公式1. 随机变量期望(Expectation)随机变量期望是描述随机变量平均值的指标,也称为均值。

对于离散型随机变量X,其期望计算公式为:$E(X) = \sum_{i=1}^{n} X_i \cdot P(X_i)$对于连续型随机变量X,其期望计算公式为:$E(X) = \int_{-\infty}^{\infty} x \cdot f(x)dx$其中,$X_i$表示随机变量X的取值,$P(X_i)$表示对应取值的概率,$f(x)$表示X的概率密度函数。

研究生统计学讲义第2讲第3章定量资料的统计描述

研究生统计学讲义第2讲第3章定量资料的统计描述
左边μ=100,σ=10,X<90 右边μ=0,σ=1,u<-1.0,注 意刻度不同
现在我们把 X 转换为标准正态变量,因为μ=100, σ=10,所以
u X 90 100 1.0
10
因此90分能够用平均值下的1个标准差表示,见图 右图
P (X < 90)=P ( u <-1.0 )
附表3从u=0.00到u=4.99以增量0.01编成标准正态分布 的CDF表,沿着表的左边按所给u的一个小数找到u ,再从表的顶端找到u的第二位小数,在表内主要部
x2=78.6g/L时,u2 = (78.6-73.8)/3.9=1.23
2.查标准正态曲线下面积表(附表3):u= -0.46时 ,在表的左侧找到-0.4,在表的上方找到0.06,二者相 交处为0.3228,标准正态曲线下,横轴上u值小于- 0.46的面积为Ф(-0.46)= P(U<-0.46)=32.28%,即标 准正态变量u值小于-0.46的概率为32.28%;同样查 得u=1.23时,标准正态曲线下,横轴上u值小于1.23的 面积为Ф(1.23) =P(U<1.23)= 0.8907,即u值小于1.23的 概率为89.07% 。
图3.16左边μ=100,σ=10,X≥125 右边μ=0,σ=1, u≥2.5,注意刻度不同
只有0.62%的得分将是125或更高.
补例2 假设女高血压患者舒张压大约集中在100mmHg
,标准差是16mmHg ,血压是正态分布.求:
1.P (X<90) 2.P (X>124) 3.P (96<X<104) 4.求
2.中位数M (Median)
中位数M是排序观察值的中间值.当一组数据按照 从小到大的顺序排列起来时,值的深度d=(n+1)/2, 是它相对于极端值(末端)所在的位置.它不是由全 部观察值综合计算出来的,而是由居中位置的观察值 所决定,因此它不受个别特小或特大的观察值的影响 ,应用范围较广。

统计学主要计算公式

统计学主要计算公式

统计学主要计算公式统计学是研究数据收集、整理、分析、解释和呈现的科学。

在统计学中,有许多重要的计算公式被广泛应用于统计分析和推断,以下是一些常见的计算公式:1.平均值:平均值是一组数据的总和除以数据的数量。

公式:平均值=总和/数据数量2.中位数:中位数是一组有序数据中的中间值,将数据从小到大排列,若数据的数量为奇数,则中位数为中间的数值;若数据的数量为偶数,则中位数为中间两个数值的平均值。

3.众数:众数是一组数据中出现最频繁的值。

4.方差:方差是一组数据与其平均值的差的平方的平均值。

公式: 方差= (∑(xi-平均值)^2) / 数据数量5.标准差:标准差是方差的平方根,用于衡量一组数据的离散程度。

公式:标准差=√方差6.相关系数:用于衡量两个变量之间线性相关程度的统计量。

公式: r = Cov(X,Y) / (SD(X) * SD(Y))其中,Cov(X,Y)表示X和Y的协方差,SD(X)和SD(Y)分别表示X和Y的标准差。

7.正态分布概率密度函数:正态分布是统计学中最重要的分布之一,其概率密度函数可以描述随机变量的分布。

公式:f(x)=(1/(σ*√(2π)))*e^(-(x-μ)^2/(2σ^2))其中,μ表示均值,σ表示标准差,e表示自然常数。

8.合并概率公式:用于计算多个事件同时发生的概率。

公式:P(A∩B)=P(A)*P(B,A)其中,P(A)表示A事件发生的概率,P(B,A)表示在A事件发生的条件下B事件发生的概率。

9.条件概率公式:用于计算在已知其中一事件发生的条件下另一事件发生的概率。

公式:P(A,B)=P(A∩B)/P(B)其中,P(A,B)表示在B事件发生的条件下A事件发生的概率。

10.抽样误差公式:用于计算样本估计值与总体参数之间的误差。

公式:误差=Z*(标准误差)其中,Z表示置信水平对应的标准正态分布的分位数,标准误差表示样本估计的标准差。

这些计算公式是统计学中非常重要的工具,用于帮助我们理解和解释数据的特征和关系。

统计学原理重要公式

统计学原理重要公式

一.加权算术平均数和加权调和平均数的计算加权算术平均数: ∑∑=fxf x 或 ∑∑=ffxx加权调和平均数: ∑∑∑∑==fxf x m m x频数也称次数。

在一组依大小顺序排列的测量值中,当按一定的组距将其分组时出现在各组内的测量值的数目,即落在各类别(分组)中的数据个数。

再如在3.14159265358979324中,…9‟出现的频数是3,出现的频率是3/18=16.7% 一般我们称落在不同小组中的数据个数为该组的频数,频数与总数的比为频率。

频数也称“次数”,对总数据按某种标准进行分组,统计出各个组内含个体的个数。

而频率则每个小组的频数与数据总数的比值。

在变量分配数列中,频数(频率)表明对应组标志值的作用程度。

频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。

掷硬币实验:在10次掷硬币中,有4次正面朝上,我们说这10次试验中…正面朝上‟的频数是4例题:我们经常掷硬币,在掷了一百次后,硬币有40次正面朝上,那么,硬币反面朝上的频数为____.解答,掷了硬币100次,40次朝上,则有100-40=60(次)反面朝上,所以硬币反面朝上的频数为60.一.加权算术平均数和加权调和平均数的计算加权算术平均数: ∑∑=fxf x 或 ∑∑=ffxxx 代表算术平均数;∑是总和符合;f 为标志值出现的次数。

加权算术平均数是具有不同比重的数据(或平均数)的算术平均数。

比重也称为权重,数据的权重反映了该变量在总体中的相对重要性,每种变量的权重的确定与一定的理论经验或变量在总体中的比重有关。

依据各个数据的重要性系数(即权重)进行相乘后再相加求和,就是加权和。

加权和与所有权重之和的比等于加权算术平均数。

加权平均数 = 各组(变量值 × 次数)之和 / 各组次数之和 = ∑xf / ∑f加权调和平均数: ∑∑∑∑==fxf xm m x加权算术平均数以各组单位数f 为权数,加权调和平均数以各组标志总量m 为权数但计算内容和结果都是相同的。

统计学考研必备公式速记技巧与实例解析

统计学考研必备公式速记技巧与实例解析

统计学考研必备公式速记技巧与实例解析统计学考研对于公式的掌握至关重要,它是解决问题、推导统计学理论,甚至进行数据分析的基础。

然而,常常会出现记忆困难的情况,特别是对于大量的统计学公式。

因此,本文将介绍一些统计学考研必备公式速记技巧,并结合实例进行解析。

一、速记技巧一:建立联想建立联想是记忆公式的一种常用方法。

通过将公式与具体的概念或实例相联系,可以更加深刻地理解并快速记忆公式。

以方差公式为例,通常使用以下公式表示:$$Var(X) = E[(X - E(X))^2]$$我们可以将这个公式与“方差”的含义联系起来。

方差表示随机变量与其期望之间的差异程度,而公式中的$(X - E(X))^2$正是衡量这种差异程度的平方。

又如,协方差的公式为:$$Cov(X, Y) = E[(X - E(X))(Y - E(Y))]$$我们可以将协方差理解为两个随机变量之间的相关性度量,通过使用公式中的$(X - E(X))(Y - E(Y))$来计算两个变量之间的差异。

二、速记技巧二:寻找规律寻找公式中的规律也是记忆的一种技巧。

通过发现公式中的某些特定模式,可以大大减轻记忆的难度。

例如,二项式分布的概率函数可以表示为:$$P(X=k) = C_n^k p^k(1-p)^{n-k}$$公式中的$C_n^k$表示从n个元素中选取k个元素的组合数。

当需要记忆这个公式时,我们可以发现,$p^k(1-p)^{n-k}$是一个与具体问题相关的数值,而$C_n^k$则是需要从$n$和$k$中计算得出的。

因此,我们可以将公式的记忆分为两个部分,分别记忆$C_n^k$和$p^k(1-p)^{n-k}$,将它们组合起来就能得到完整的公式。

三、速记技巧三:构建缩写或关键词构建缩写或关键词也是记忆公式的常用方法。

将公式中的每个要素用简洁明了的缩写或关键词来表示,可以提高记忆效果。

以回归方程的公式为例:$$Y = \beta_0 + \beta_1X + \epsilon$$我们可以将$\beta_0$表示为“截距”,$\beta_1$表示为“斜率”,$X$表示为“自变量”,$Y$表示为“因变量”,$\epsilon$表示为“误差项”。

统计学常用公式

统计学常用公式

公式一1. 众数【MODE 】(1) 未分组数据或单变量值分组数据众数的计算未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。

(2) 组距分组数据众数的计算对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。

下限公式: 1012M =L++i ∆⨯∆∆ 式中:0M 表示众数;L 表示众数的下线;1∆表示众数组次数与上一组次数之差;2∆表示众数组次数与下一组次数之差;i 表示众数组的组距。

上限公式:2012M =U-+i ∆⨯∆∆ 式中:U 表示众数组的上限。

2.中位数【MEDIAN 】(1)未分组数据中中位数的计算根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。

设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:e N+M =X1()2当N 为奇数e N N +1221M =X +X 2⎛⎫⎛⎫⎪ ⎪⎝⎭⎝⎭⎧⎫⎪⎪⎨⎬⎪⎪⎩⎭ 当N 为偶数(2)分组数据中位数的计算分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。

3.均值的计算【AVERAGE 】(1)未经分组均值的计算未经分组数据均值的计算公式为: 112n ++==nii x x x x x n n=∑…(2)分组数据均值计算分组数据均值的计算公式为: 11221121+++==+ki ik k i k kii x f x f x f x f x f f f f==+∑∑+4.几何平均数【GEOMEAN 】几何平均数是N 个变量值乘积的N 次方根,计算公式为: 式中:G 表示几何平均数;∏表示连乘符号。

统计学常用计算公式

统计学常用计算公式

统计学常用计算公式
均值(Mean)
均值是一组数据的平均值,通过将所有数据求和并除以数据的个数来计算。

公式:$\bar{x} = \dfrac{\sum_{i=1}^{n}x_i}{n}$
其中,$\bar{x}$ 表示均值,$x_i$ 表示第 i 个数据,n 表示数据的个数。

中位数(Median)
中位数是一组数据中的中间值,即将数据按升序排列后,找到位于中间位置的数。

公式:
- 若数据个数为奇数:中位数为排序后的中间值。

- 若数据个数为偶数:中位数为排序后中间两个值的平均数。

众数(Mode)
众数是一组数据中出现次数最多的值。

标准差(___)
标准差是数据离均值的平均偏差,用来衡量数据的离散程度。

公式:$s = \sqrt{\dfrac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n}}$
其中,$s$ 表示标准差,$x_i$ 表示第 i 个数据,$\bar{x}$ 表示均值,$n$ 表示数据的个数。

方差(Variance)
方差是数据离均值的平方平均偏差,是标准差的平方。

公式:$Var(x) = s^2$
其中,$Var(x)$ 表示方差,$s$ 表示标准差。

以上是统计学常用的计算公式。

在进行统计分析时,这些公式能够帮助我们计算和理解数据的特征和变化程度。

统计学计算公式

统计学计算公式

《统计学原理》复习资料(计算公式)一、 编制分配数列(次数分布表) 统计整理公式a) 组距=上限-下限 b) 组中值=(上限+下限)÷2c) 缺下限开口组组中值=上限-1/2邻组组距 d) 缺上限开口组组中值=下限+1/2邻组组距 二、 算术平均数和调和平均数的计算 加权算术平均数公式 xfx f=∑∑(常用) fx x f=⋅∑∑(x 代表各组标志值,f 代表各组单位数,ff∑代表各组的比重)加权调和平均数公式 m x m x=∑∑ (x 代表各组标志值,m 代表各组标志总量)三、 变异系数比较稳定性、均衡性、平均指标代表性(通常用标准差系数V xσσ=来比较)公式:标准差: 简单σ= ; 加权 σ=四、 总体参数区间估计(总体平均数区间估计、总体成数区间估计) 具体步骤:①计算样本指标x σ、 ; p③由给定的概率保证程度()F t 推算概率度t⑤估计总体参数区间范围x x x X x -∆≤≤+∆;p p p P p -∆≤≤+∆抽样估计公式1.平均误差:重复抽样: nx σμ=np p p )1(-=μ 不重复抽样: )1(2Nn nx -=σμ2.抽样极限误差 x x t μ=∆3.重复抽样条件下:平均数抽样时必要的样本数目222x t n ∆=σ成数抽样时必要的样本数目22)1(pp p t n ∆-=4.不重复抽样条件下:平均数抽样时必要的样本数目22222σσt N Nt n x +∆=五、 相关分析和回归分析相关分析公式 1.相关系数[][]∑∑∑∑∑∑∑---=2222)()(y y n x xn yx xy n γ2.配合回归方程 y=a+bx∑∑∑∑∑--=22)(x x n y x xy n bx b y a -=3.估计标准误:22---=∑∑∑n xy b y a ysy五、指数分析计算指数分析公式一、综合指数的计算与分析(1)数量指标指数01pq p q ∑∑此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。

统计学计算公式大全

统计学计算公式大全

统计学计算公式大全统计学是数学中一个重要的分支,它利用分析数据,抽象出具有相似特征的概念,研究其变化规律、发展趋势,为决策提供重要的依据。

统计学涉及的范畴较广,涉及统计数据的收集、分析处理、描述抽象、模型建立、推理预测等数学计算技术,其中重要的组成部分就是计算公式,下面就是统计学计算公式大全。

一、抽样调查统计1、样本量的计算公式:n=N/ (1+N*e2/δ2)其中:n为样本量,N为总体量,e为期望的标准误差,δ为期望的置信度。

2、样本抽取a)取系统抽样公式:Pi=Di/n其中:Pi为抽取的概率,Di为分层抽样时的各层系统抽样量,n 为总体量。

b)层抽样公式:Di=ni/ni+N1+…+Nk其中:Di为分层抽样时的各层系统抽样量,ni为各层抽样量,N1+…+Nk为总体量。

3、数据分析a)差、方差、标准差极差X=Xmax-Xmin方差S2=G2S/(n-1)标准差S=根号[G2S/(n-1)]其中:Xmax,Xmin为所有样本数据的最大值和最小值,G1S和G2S分别为样本一阶矩和二阶矩,n为样本量。

b)值、中位数均值:X=G1S/n中位数:中位数=X((n+1)/2)其中:G1S为样本一阶矩,n为样本量。

c)分位数百分位数:Xp=(n+1)P/100其中:P为百分位数,n为样本量二、两个样本的比较1、大样本检验a) t检验t=X1-X2/S其中:X1,X2分别为样本1和样本2的均值,S为两个样本总体方差的平均值。

b) F检验F=S12/S22其中:S12,S22分别为样本1和样本2的方差。

2、小样本检验a) Z检验z=X1-X2/S其中:X1,X2分别为样本1和样本2的均值,S为样本1和样本2的总体标准差的平方根。

b)2检验χ2=∑[(Oi-Ei)2/Ei]其中:Oi,Ei分别为样本的实际频数和期望频数。

三、数据回归分析1、回归分析公式Y=a+bX其中:Y,X分别为回归变量,a,b分别为回归系数。

统计学计算公式范文

统计学计算公式范文

统计学计算公式范文统计学是一门研究数据收集、数据整理、数据分析和数据解释的科学。

它涵盖了许多数学和概率的知识,应用于各个领域,包括经济学、社会学、心理学等等。

在统计学中,有许多常用的计算公式,本文将会介绍一些常见的统计学计算公式。

一、描述统计学计算公式1.平均数平均数(Mean)是一组数据的算术平均值,计算公式为:Mean = (X1 + X2 + X3 + ... + Xn) / n2.中位数中位数(Median)是将数据按升序排列后,位于中间位置的值(如果数据个数为奇数),或位于中间两个位置的值的平均值(如果数据个数为偶数)。

计算公式为:Median = (X[(n+1)/2] + X[(n+1)/2+1]) / 2 (数据个数为偶数)Median = X[(n+1)/2] (数据个数为奇数)3.众数众数(Mode)是一组数据中出现次数最多的值。

计算公式为:找到出现次数最多的值即可。

4.方差方差(Variance)度量了一组数据的离散程度。

计算公式为:Variance = Σ((Xi - Mean)²) / (n-1)5.标准差标准差(Standard Deviation)是方差的平方根,用于衡量一组数据的离散程度。

计算公式为:Standard Deviation = √Variance二、概率论计算公式1.随机变量的期望随机变量的期望是衡量随机变量的平均值,计算公式为:E(X)=Σ(X*P(X))2.随机变量的方差随机变量的方差是衡量随机变量的离散程度,计算公式为:Var(X) = Σ(X² * P(X)) - [E(X)]²3.协方差协方差(Covariance)刻画了两个变量间的线性关系程度,计算公式为:Cov(X, Y) = Σ((Xi - Mean(X)) * (Yi - Mean(Y))) / (n-1)4.相关系数相关系数(Correlation Coefficient)度量了两个变量之间的线性关系强度和方向,计算公式为:Corr(X, Y) = Cov(X, Y) / (Standard Deviation(X) * Standard Deviation(Y))三、假设检验计算公式1.标准误差标准误差(Standard Error)衡量样本统计量与总体参数之间的差异。

统计学各章计算题公式及解题方法

统计学各章计算题公式及解题方法

统计学各章计算题公式及解题⽅法统计学各章计算题公式及解题⽅法第四章数据的概括性度量1. 组距式数值型数据众数的计算:确定众数组后代⼊公式计算:下限公式:M 0=L +?11+?2×d ;上限公式:M 0=U ??21+?2×d ,其中,L 为众数所在组下限,U 为众数所在组上限,?1为众数所在组次数与前⼀组次数之差,?2为众数所在组次数与后⼀组次数之差,d 为众数所在组组距 2. 中位数位置的确定:未分组数据为n+1 2;组距分组数据为n 23. 未分组数据中位数计算公式:M e ={x (n+12) ,n 为奇数12(x n 2+x n 2+1),n 为偶数4. 单变量数列的中位数:先计算各组的累积次数(或累积频率)—根据位置公式确定中位数所在的组—对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布)5. 组距式数列的中位数计算公式:下限公式:M e =L +n2S m1f m×d ;上限公式:M e =U ?n2+S m+1f m×d ,其中,f m 为中位数所在组的频数,s m?1为中位数所在组前⼀组的累积频数,s m+1为中位数所在组后⼀组的累积频数6. 四分位数位置的确定:未分组数据:{下四分位数:Q L =n+14上四分位数:Q U =3(n+1)4;组距分组数据:{下四分位数:Q L =n4上四分位数:Q U =3n 4 7. 简单均值:x?=x 1+x 2+?+x nn=∑x in i=1n8. 加权均值:x?=M 1f 1+M 2f 2+?+M k f kf 1+f 2+?+f k=∑M i f ik i=1n=∑M i k i=1fin,其中,M 1,M 2…M k 为各组组中值9. ⼏何均值(⽤于计算平均发展速度):x?=√x 1×x 2×…×x n n =√∏x i n i=1n10. 四分位差(⽤于衡量中位数的代表性):Q D =Q U ?Q L 11. 异众⽐率(⽤于衡量众数的代表性):V r =∑f i ?f m ∑f i=1?fm ∑fi12. 极差:未分组数据:R =max (x i )?min (x i );组距分组数据:R =最⾼组上限?最低组下限13. 平均差(离散程度):未分组数据:M d =∑|x i ?x?|n i=1n;组距分组数据:M d =∑|M i ?x?|k i=1?f in14. 总体⽅差:未分组数据:σ2=∑(x i ?µ)2N i=1N;分组数据:σ2=∑(M i ?µ)2k i=1?f iN15. 总体标准差:未分组数据:σ=√∑(x i ?µ)2N i=1N;分组数据:σ=√∑(M i ?µ)2k i=1?f iN16.样本⽅差:未分组数据:s n?12=∑(x?x?)2n i=1n?1;分组数据:s n?12=∑(M i ?x?)2?f ik i=1n?117. 样本标准差:未分组数据:s n?1=√∑(x?x?) 2n i=1n?1;分组数据:s n?1=√∑(M i ?x?)2?f ik i=1n?118. 标准分数:z i =x i ?x?s19. 离散系数:v s =s x?第七章参数估计1. Z α2的估计值:其中,t α2查p448 ,查找时需查n-1的数值3. ⼤样本总体⽐例的区间估计:p ±z α2√p (1?p )n4. 总体⽅差σ2在1?α置信⽔平下的置信区间为:(n?1)s 2χα/22≤σ2≤(n?1)s 2χ1?α/225. 估计总体均值的样本量:n =(Z α/2)2σ2E 2,其中,E 为估计误差6. 重复抽样或⽆限总体抽样条件下的样本量:n =(Z α/2)2π(1?π)E ,其中π为总体⽐例第⼋章假设检验1. 总体均值的检验(σ2已知或σ2未知的⼤样本)[总体服从正态分布,不服从正态分布的⽤正态分布近似]3.⼀个总体⽐例的检验(两类结果,总体服从⼆项分布,可⽤正态分布近似)(其中π0为1.期望频数的分布(假定⾏变量和列变量是独⽴的)⼀个实际频数f ij的期望频数e ij,是总频数的个数n乘以该实际频数f ij落⼊第i⾏和第j列的概率,即:e ij=n·(r in )?(e jn)=r i c jn2. χ2统计量(⽤于检验列联表中变量间拟合优度和独⽴性;⽤于测定两个分类变量之间的相关程度χ2=∑∑(f ij ?e ij )2eijcj=1r i=1,⾃由度为(r ?1)(c ?1),f ij 为列联表中第i ⾏第j列的实际频数,e ij 为列联表中第i ⾏第j 列的期望频数1) 检验多个⽐例是否相等检验的步骤提出假设H 0:?1 = ?2 = … = ?j ;H 1: ? 1 , ?2 , …,?j 不全相等;计算检验的统计量;进⾏决策:根据显着性⽔平?和⾃由度(r -1)(c -1)查出临界值??2,若?2>??2,拒绝H 0;若?22) 利⽤样本数据检验总体⽐例是否等于某个数值检验的步骤提出假设H 0:?1 = ,?2 = ,… ;H 1:原假设的等式中⾄少有⼀个不成⽴;计算检验的统计量;进⾏决:根据显着性⽔平?和⾃由度(r -1)(c -1)查出临界值??2;若?2 >??2,拒绝H 0;若?23) 检验列联表中的⾏变量与列变量之间是否独⽴检验的步骤提出假设H 0:⾏变量与列变量独⽴;H 1:⾏变量与列变量不独⽴;计算检验的统计量;进⾏决策:根据显着性⽔平?和⾃由度(r -1)(c -1)查出临界值??2,若?22,拒绝H 0;若?2系数的值在0~1之间φ=√χ2n ,其中,n 为实际频数总个数,即样本容量4. 列联相关系数(C 系数)⽤于测度⼤于2?2列联表中数据的相关程度C =√χ2χ2+n,其中,C 的取值范围是 0≤C <1;C = 0表明列联表中的两个变量独⽴;C 的数值⼤⼩取决于列联表的⾏数和列数,并随⾏数和列数的增⼤⽽增⼤;根据不同⾏和列的列联表计算的列联系数不便于⽐较 5. V 相关系数V =√χ2n min[(r?1),(c?1)],其中,V 的取值范围是 0≤V ≤1; V = 0表明列联表中的两个变量独⽴;V=1表明列联表中的两个变量完全相关;不同⾏和列的列联表计算的列联系数不便于⽐较;当列联表中有⼀维为2,min[(r-1),(c-1)]=1,此时V=φ第⼗章⽅差分析1. 单因素⽅差分析的要点:1) 建⽴假设的表述⽅法:H 0:µ1=µ2=?=µk ,⾃变量对因变量没有显着影响 H 1:µ1,µ2,…,µk 不全相等,⾃变量对因变量有显着影响2) 决策:i. 根据给定的显着性⽔平α,在F 分布表中查找与第⼀⾃由度df 1=k ?1、第⼆⾃由df 2=n ?k 相应的临界值 F αii. 若F> F α,则拒绝原假设H 0,表明均值之间的差异是显着的,所检验的因素对观察值有显着影响iii.若F< F α,则不拒绝原假设H0,不能认为所检验的因素对观察值有显着影响3)单因素⽅差分析表的结构:2.⽅差分析中的多重⽐较(步骤):采⽤Fisher提出的最⼩显着差异⽅法,简写为LSD1)提出假设:H0:µi=µj(第i个总体的均值等于第j个总体的均值)H0:µi≠µj(第i个总体的均值不等于第j个总体的均值)2)计算检验统计量:x?i?x?j3)计算LSD:LSD=tα2√MSE(1n i+1n j)4)决策:若|x?i?x?j|>LSD,则拒绝H0;若|x?i?x?j|3.双因素⽅差分析:1)⽆交互作⽤的双因素⽅差分析表结构:2)有交互作⽤的双因素⽅差分析表结构:4.关系强度测量:变量间关系的强度⽤⾃变量平⽅和(SSA)及残差平⽅和(SSE)占总平⽅和(SST)的⽐例⼤⼩来反映,根据R 2平⽅根R 进⾏判断R 2=SSA (组间平⽅和)SST (总平⽅和)第⼗⼀章⼀元线性回归1. 样本的相关系数:r =∑()()∑()2∑()2=∑∑∑∑2(∑)2∑2(∑)22. 相关系数的显着性检验步骤:1) 提出假设:H 0:ρ=0;H 1:ρ≠0 2) 计算检验统计量:t =|r |√n?2 1?r 2~t (n ?2)3) 确定α并决策:|t |>t α2,拒绝H 0;|t |,不拒绝H 03. ⼀元回归模型:y =β0+β1x+?4. ⼀元线性回归⽅程形式:E (y )=β0+β1x ,其中β0是直线⽅程在y 轴上的截距,是当x =0时,y 的期望值;β1是直线的斜率,称为回归系数,表⽰当x 每变动⼀个单位时y 的平均变动值5. ⼀元线性回归中,估计的回归⽅程:y ?=β0+β?1x ,其中β?0是估计的回归直线在y 轴上的截距,β?1是直线的斜率,它表⽰对于⼀个给定的x 的值,y ?是y 的估计值,表⽰当x 每变动⼀个单位时y 的平均变动值6. 根据最⼩⼆乘法求β0以及β?1的公式: {β?1=n ∑x i y i ?(∑x i n i=1)(∑y i n i=1)n i=1n ∑x i 2n i=1?(∑x in i=1)2β?0=y ??β1x?7. 误差平⽅和之间的关系:∑(y i ?y ?)2=n i=1∑(y ?i ?y ?)2+∑(y i ?yi )2n i=1n i=1,即:SST(总平⽅和)=SSR(回归平⽅和)+SSE (残差平⽅和) 8. 判定系数(回归平⽅和占离差平⽅和的⽐例):R 2=SSR SST=∑(yi y )2n i=1∑(y i y)2n i=1=1∑(y i ?y ?i )2n i=1∑(yi y )2n i=19. 估计标准误差(实际观察值与回归估计值离差平⽅和的均⽅根):s y =√∑(y i ?yi )2n i=1n2=√SSEn?2=√MSE10. 线性关系的显着性检验:1) 提出假设:H 0:β1=0,线性关系不显着;H 1:β1≠0,有线性关系 2) 计算检验统计量:F =SSR 1?SSE n?2?=MSR MSE ~F (1,n ?2)3) 确定显着性⽔平α,并根据分⼦⾃由度1和分母⾃由度n-2找出临界值F α4) 决策:若F >F α,拒绝H 0;F1) 提出假设:H 0:β1=0,线性关系不显着;H 1:β1≠0,有线性关系 2) 计算检验统计量:t =β1s β1~t (n 2)3) 确定显着性⽔平α并决策:若|t |>t α2?,拒绝H 0;|t |y ?0±t α2?(n ?2)s y √1n +(x 0?x?)2∑(x i ?x?)2ni=1 其中,s y 为估计标准误差,(n ?2)为t α2?的⾃由度13. 预测区间估计:y 0在1?α置信⽔平下的预测区间:y ?0±t α2?(n ?2)s y √1+1n +(x 0?x?)2∑(x i ?x?)2ni=1 14. 回归分析表的结构:15. ⼏点说明:1) 判定系数R 2测度了回归直线对观测数据的拟合程度,若所有观测点都落在直线上,残差平⽅和SSE=0,R 2=1,拟合是完全的2) 在⼀元线性回归中,相关系数r 实际上是判定系数R 2的平⽅根3) 相关系数r 与回归系数β1是同号的第⼗三章时间序列预测和分析1. 环⽐增长率:报告期增长率与前⼀期⽔平之⽐减1:G i =Y iY i?1?1 (i =1,2,Λ,n)2. 定基增长率:报告期⽔平与某⼀固定时期⽔平之⽐减1G i =Yi Y 01 (i =1,2,Λ,n),其中, Y 0表⽰⽤于对⽐的固定基期的观察值3. 平均增长率:序列中各逐期环⽐值(也称环⽐发展速度) 的⼏何平均数减1后的结果(描述现象在整个观察期内平均增长变化的程度)G=√Y 1Y 0×Y 2Y 1×Λ×Yn Y n?1n ?1=√Y n Y 0n ?1,G ?表⽰平均增长率,n 为环⽐值的个数 1) 当时间序列中的观察值出现0或负数时,不宜计算增长率2) 在有些情况下,不宜单纯就增长率论增长率,要注意增长率与绝对⽔平的结合分析4. 时间序列预测的步骤:1) 确定时间序列所包含的成分,也就是确定时间序列的类型 2) 找出适合此类时间序列的预测⽅法3) 对可能的预测⽅法进⾏评估,以确定最佳预测⽅案 4) 利⽤最佳预测⽅案进⾏预测5. 均⽅误差:通过平⽅消去正负号后计算的平均误差,⽤MSE 表⽰MSE =∑(Yi ?F i )2n i=1n,其中Y i 为观测值,F i 为预测值6. 简单平均法:根据过去已有的t 期观察值来预测下⼀期数值。

统计学公式

统计学公式

(一)频数分布中变量数列相关公式1、全距=最大标志值-最小标志值2、组距=各组最大标志值(上限) -各组最小标志值(下限) =全距÷组数3、组数、组距确定的斯特杰斯经验公式:4、重合式(指相邻两组中,前一组的上限和后一组的下限数值重合)组距=上限-下限组中值=(上限+下限)÷2 =下限+组距/2=上限-组距/25、不重合式(指前一组的上限与后一组的下限,两值紧密相连而不相重复)组距=下组下限-本组下限=本组上限-前组上限 组中值=(本组下限+下一组下限) ÷2 =本组下限+组距/2 =下组下限-组距/2 6、闭口式分组的组中值求法:(二)综合指标相关公式<1>相对指标之计划完成相对数1.(分子分母位子不能换)超额完成(或未完成)绝对数=实际完成数-计划数 2 . 短期检查:(1)产量、产值增长百分数:1 3.3lg max min 1 3.3lg :max min n N R X X d n N n N d R X X =+-==+组数,:总体单位数,:组距,:全距:最大变量值,:最小变量值2下限上限下限或 2组的下限组的上限组中值-+=+=100%计划完成数实际完成数计划完成相对数⨯=%100%%100%%100⨯++=计划增长实际增长计划完成相对数(2)产品成本降低百分数3.中长期检查(1) 水平法(注意提前完成时的相关问题)(2)累计法4.执行进度检查<2>相对指标之结构相对数<3>相对指标之比例相对数<4>相对指标之比较相对数<5>相对指标之强度相对数(注意与平均数的区别)%100%%100%%100⨯--=计划规定降低实际降低计划完成相对数%100⨯=计划期末年应达水平计划期末年实达水平计划完成相对数100%=⨯计划期内各年累计完成数同期计划规定的累计数计划完成相对数%100⨯=本期计划数成数计划期内某月止累计完计划执行进度%100⨯=总体的数值总体某部分的数值结构相对数同一总体另一部分数值总体中某一部分数值比例相对数=%100)()(⨯=同一现象数值单位另一地区某一现象数值单位某地区比较相对数另一现象数值某一现象数值强度相对数=<6>相对指标之动态相对数<7>平均指标之算术平均数nx ∑=x (简单算术平均)∑∑=fxf x (加权算术平均)<8>平均指标之调和平均数(注意其应用条件)∑∑==xn nx H 111(简单调和平均)∑∑∑∑==fx f ff x H 111(加权调和平均)<9>平均指标之几何平均数(简单几何平均)(加权几何平均)<10>平均指标之众数 (1)上限公式(2 %100⨯=基期数值报告期数值动态相对数注:U 为众数所在组组距的上限,L 为众数所在组组距的下限,f 为众数所在组的次数,f-1 为众数所在组前一组次数, f+1 为众数所在组后一组次数,i 为组距。

研究生统计学计算公式

研究生统计学计算公式

考试要求:不要求假设检验中统计量的计算查表求面积标准正态分布曲线下对称于0的区间其面积相等,于是有等式Φ(u )=1-Φ(-u ) 标准正态曲线下区间(u 1,u 2)面积的计算公式为:P(u 1< U < u 2) =Φ(u 2) -Φ(u 1)标准正态u 变换任意的正态分布N (μ,σ 2),经过公式:σμ-=X u 变换后,u 服从标准正态分布N (0,1)参考统计作业20130109-02版中第一部分1.Φ(-1.64)=?,P(-1.64< U <1.64)=?Φ(-1.64)=0.0505P(-1.64< U <1.64) = Φ(1.64)- Φ(-1.64) = [1- Φ(-1.64)]- Φ(-1.64) = (1-0.0505)-0.0505 = 0.8992.Φ(-2.58)= ?,P(-2.58 <U < 2.58)=?Φ(-2.58)=0.0049P(-2.58 <U < 2.58) = Φ(2.58)- Φ(-2.58) = [1-Φ(-2.58)]- Φ(-2.58) = (1-0.0049)- 0.0049 = 0.99023.已知 X 服从正态分布N(5,22),求X 落在区间(3,6)概率。

P(3<X<6) = P(X<6)-P(X<3) = Φ((6-5)/2)-Φ((3-5)/2) = Φ(0.5)-Φ(-1) = [1-Φ(-0.5)]- Φ(-1) = (1-0.3085)-0.1587 = 0.5328随机区组设计1)两个重要的等式SS总=SS处理+SS区组+SS误差df总=df处理+df区组+df误差2)两个重要的关系MS=SS/dfF处理=MS处理/MS误差F区组=MS区组/MS误差总SS总n-1处理组间SS处理k-1 MS处理MS处理/MS误差P处理区组间SS区组b-1 MS区组MS区组/MS误差P区组误差SS误差n-k-b+1 MS误差完全随机分组设计1)两个重要的等式:SS总=SS组间+SS组内df总=df组间+df组内2)两个重要的关系MS=SS/dfF=MS组间/MS组内总SS总N-1组间SS组间G-1 MS组间MS组间/MS组内P 组内(误差)SS组内N-G MS组内各种区间的计算。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

考试要求:不要求假设检验中统计量的计算
查表求面积
标准正态分布曲线下对称于0的区间其面积相等,于是有等式Φ(u )=1-Φ(-u ) 标准正态曲线下区间(u 1,u 2)面积的计算公式为:P(u 1< U < u 2) =Φ(u 2) -Φ(u 1)
标准正态u 变换
任意的正态分布N (μ,σ 2),经过公式:
σμ-=X u 变换后,u 服从标准正态分布N (0,1)
参考统计作业20130109-02版中第一部分
1.Φ(-1.64)=?,P(-1.64< U <1.64)=?
Φ(-1.64)=0.0505
P(-1.64< U <1.64) = Φ(1.64)- Φ(-1.64) = [1- Φ(-1.64)]- Φ(-1.64) = (1-0.0505)-0.0505 = 0.899
2.Φ(-2.58)= ?,P(-2.58 <U < 2.58)=?
Φ(-2.58)=0.0049
P(-2.58 <U < 2.58) = Φ(2.58)- Φ(-2.58) = [1-Φ(-2.58)]- Φ(-2.58) = (1-0.0049)- 0.0049 = 0.9902
3.已知 X 服从正态分布N(5,22),求X 落在区间(3,6)概率。

P(3<X<6) = P(X<6)-P(X<3) = Φ((6-5)/2)-Φ((3-5)/2) = Φ(0.5)-Φ(-1) = [1-Φ(-0.5)]- Φ(-1) = (1-0.3085)-0.1587 = 0.5328
随机区组设计
1)两个重要的等式
SS

=SS处理+SS区组+SS误差
df

=df处理+df区组+df误差
2)两个重要的关系
MS=SS/df
F
处理
=MS处理/MS误差
F
区组
=MS区组/MS误差
总SS总n-1
处理组间SS处理k-1 MS处理MS处理/MS误差P处理区组间SS区组b-1 MS区组MS区组/MS误差P区组误差SS误差n-k-b+1 MS误差
完全随机分组设计
1)两个重要的等式:
SS
总=SS
组间
+SS
组内
df
总=df
组间
+df
组内
2)两个重要的关系
MS=SS/df
F=MS
组间
/MS组内
总SS总N-1
组间SS组间G-1 MS组间MS组间/MS组内P 组内(误差)SS组内N-G MS组内
各种区间的计算。

相关文档
最新文档