统计学复习(含公式)

合集下载

(完整版)统计学公式大全

(完整版)统计学公式大全

(完整版)统计学公式大全统计学公式大全本文档旨在提供统计学领域常用的公式大全,便于大家在研究和实践中进行参考和应用。

描述统计学公式中心趋势度量1. 平均数(Mean):$\bar{x} =\frac{{\sum_{i=1}^{n}x_i}}{n}$2. 中位数(Median):若数据个数为奇数,中位数为排序后的中间值;若数据个数为偶数,中位数为排序后的中间两个值的平均值。

3. 众数(Mode):出现频率最高的数值。

离散趋势度量1. 方差(Variance):$Var(x) = \frac{{\sum_{i=1}^{n}(x_i - \bar{x})^2}}{n}$2. 标准差(Standard Deviation):$SD(x) = \sqrt{Var(x)}$3. 极差(Range):$Range(x) = \max(x) - \min(x)$分布形状度量1. 偏度(Skewness):$\text{Skewness} =\frac{{\sum_{i=1}^{n}(x_i - \bar{x})^3}}{n \cdot SD(x)^3}$2. 峰度(Kurtosis):$\text{Kurtosis} =\frac{{\sum_{i=1}^{n}(x_i - \bar{x})^4}}{n \cdot SD(x)^4}$ 推断统计学公式参数估计1. 样本均值的抽样分布标准差(Standard Error of the Mean):$SE(\bar{x}) = \frac{{SD(x)}}{\sqrt{n}}$2. 双侧置信区间公式(Confidence Interval):$\bar{x} \pm Z\cdot SE(\bar{x})$3. 样本比例的抽样分布标准差(Standard Error of Proportion):$SE(p) = \sqrt{\frac{{p(1-p)}}{n}}$4. 双侧置信区间公式(Confidence Interval):$p \pm Z \cdotSE(p)$假设检验1. 样本均值和总体均值的差异(t检验):$t = \frac{{\bar{x} -\mu}}{{SE(\bar{x})}}$2. 双侧拒绝域临界值(t分布):$t_{\text{critical}} = \pmt_{\alpha/2, df}$3. 样本比例和总体比例的差异(z检验):$z = \frac{{\hat{p} - p}}{{SE(p)}}$4. 双侧拒绝域临界值(z分布):$z_{\text{critical}} = \pmz_{\alpha/2}$回归分析公式简单线性回归模型1. 回归方程(Simple Linear Regression):$y = \beta_0 +\beta_1x + \epsilon$2. 线性预测公式(Simple Linear Regression):$\hat{y} =\hat{\beta}_0 + \hat{\beta}_1x$3. 斯皮尔曼秩相关系数(Spearman's Rank Correlation Coefficient):$r_s = 1 - \frac{6\sum d_i^2}{n(n^2 - 1)}$4. 相关系数的显著性检验(t检验):$t = \frac{r}{\sqrt{\frac{1 - r^2}{n-2}}}$结论本文档列举了统计学领域常用的公式,包括描述统计学中的中心趋势度量、离散趋势度量和分布形状度量,推断统计学中的参数估计和假设检验,以及回归分析中的简单线性回归模型等相关公式。

统计学计算公式

统计学计算公式

《统计学原理》复习资料(计算公式)一、编制分配数列(次数分布表)统计整理公式a)组距=上限-下限b)组中值=(上限+下限)÷2 c)缺下限开口组组中值=上限-1/2邻组组距d)缺上限开口组组中值=下限+1/2邻组组距二、算术平均数和调和平均数的计算加权算术平均数公式xfx f (常用)fx x f(x 代表各组标志值,f 代表各组单位数,ff 代表各组的比重)加权调和平均数公式mx mx (x 代表各组标志值,m 代表各组标志总量)三、变异系数比较稳定性、均衡性、平均指标代表性(通常用标准差系数V x 来比较)公式:标准差: 简单σ= ;加权σ=四、总体参数区间估计(总体平均数区间估计、总体成数区间估计)具体步骤:①计算样本指标x 、;p③由给定的概率保证程度()F t 推算概率度t⑤估计总体参数区间范围x x x X x ;p pp P p 抽样估计公式1.平均误差:重复抽样:n x np p p )1(不重复抽样:)1(2Nn n x2.抽样极限误差xx t 3.重复抽样条件下:平均数抽样时必要的样本数目222x t n 成数抽样时必要的样本数目22)1(p p p t n4.不重复抽样条件下:平均数抽样时必要的样本数目22222t N Ntn x 五、相关分析和回归分析相关分析公式1.相关系数2222)()(y y n x x n y x xy n2.配合回归方程y=a+bx22)(x x ny x xy nb xb y a 3.估计标准误:22n xy b y a y s y 五、指数分析计算指数分析公式一、综合指数的计算与分析(1)数量指标指数0001p q p q 此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。

(01p q -00p q )此差额说明由于数量指标的变动对价值量指标影响的绝对额。

(2)质量指标指数0111p q p q 此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。

统计学公式大全

统计学公式大全

3 i1 N3
峰度
(概念要点)
• 1. 数据分布扁平程度的测度 • 2. 峰度系数=3扁平程度适中 • 3. 偏态系数<3为扁平分布 • 4. 偏态系数>3为尖峰分布 • 5. 计算公式为
K Xi X 4 Fi
4 i1 N 4
时间序列的分类
时间序列
绝对数序列 相对数序列 平均数序列
时期序列 时点序列
线性模型法
(a和b的最小二乘估计)
1. 根据最小二乘法得到求解 a 和 b 的标准方程为
Ynab t tYa tb
t2
解得:b
ntY tY
nt 2 t2
a Y bt
2. 取时间序列的中间时期为原点时有 t=0,上
式可化简为
Y na tY bt 2
a Y
解得:
b
tY t2
增1% 长 绝对环 值 逐 比 = 期 增 增 1长 0 长 0前 速 1量 期 0度 0水
甲企业增长1%绝对值=500/100=5万元 乙企业增长1%绝对值=60/100=0.6万元
时间序列的构成要素与模型
(要点)
1. 构成因素
– 长期趋势 (Secular trend ) – 季节变动 (Seasonal Fluctuation ) – 循环波动 (Cyclical Movement ) – 不规则波动 (Irregular Variations )
3. 平均数时间序列
– 一系列平均数按时间顺序排列而成
绝对数序列的序时平均数
(计算方法)
时期序列
n

计算公 式:
Y Y1 Y2
Yn
Yi
i1
n
n
【例11.1】 根据表11.1中的国内生产总值 序列,计算各年度的平均国内生产总值

统计学公式汇总

统计学公式汇总

统计学公式汇总统计学是研究数据收集、分析、解释和预测的一门学科。

在统计学中,有许多重要的公式被广泛应用于数据的处理和分析过程中。

本文将汇总一些常见的统计学公式,并简要介绍其应用场景和使用方法。

1. 均值(Mean)均值是统计学中最常用的概念之一,用于衡量一组数据的集中趋势。

对于一个样本集合,均值可以通过将所有观测值相加,然后除以样本容量来计算。

其数学公式如下:均值= ∑(观测值) / 样本容量2. 方差(Variance)方差是用于衡量一组数据的离散程度的指标。

方差越大,表示数据的离散程度越高;方差越小,表示数据的离散程度越低。

方差的计算公式如下:方差= ∑((观测值-均值)^2) / 样本容量3. 标准差(Standard Deviation)标准差是方差的平方根,用于衡量数据的离散程度,并且具有和原始数据相同的单位。

标准差的计算公式如下:标准差 = 方差的平方根4. 相关系数(Correlation Coefficient)相关系数用于衡量两组变量之间的线性关系强度和方向。

相关系数的取值范围在-1到1之间,其中-1表示完全的负相关,1表示完全的正相关,0表示无相关。

相关系数的计算公式如下:r = Cov(X,Y) / (σX * σY)5. 回归方程(Regression Equation)回归方程用于建立一个或多个自变量与因变量之间的线性关系。

回归方程的一般形式为:Y = β0 + β1X1 + β2X2 + ... + βnXn + ε其中,Y表示因变量,X1、X2、...、Xn表示自变量,β0、β1、β2、...、βn表示回归系数,ε表示模型的误差项。

6. 样本容量和置信水平(Sample Size and Confidence Level)在统计学中,样本容量和置信水平是决定实验或调查结果可靠性的重要因素。

样本容量是指从总体中抽取的样本大小,而置信水平是指对总体参数的估计值的信任程度。

统计学主要计算公式

统计学主要计算公式

统计学主要计算公式统计学是研究数据收集、整理、分析、解释和呈现的科学。

在统计学中,有许多重要的计算公式被广泛应用于统计分析和推断,以下是一些常见的计算公式:1.平均值:平均值是一组数据的总和除以数据的数量。

公式:平均值=总和/数据数量2.中位数:中位数是一组有序数据中的中间值,将数据从小到大排列,若数据的数量为奇数,则中位数为中间的数值;若数据的数量为偶数,则中位数为中间两个数值的平均值。

3.众数:众数是一组数据中出现最频繁的值。

4.方差:方差是一组数据与其平均值的差的平方的平均值。

公式: 方差= (∑(xi-平均值)^2) / 数据数量5.标准差:标准差是方差的平方根,用于衡量一组数据的离散程度。

公式:标准差=√方差6.相关系数:用于衡量两个变量之间线性相关程度的统计量。

公式: r = Cov(X,Y) / (SD(X) * SD(Y))其中,Cov(X,Y)表示X和Y的协方差,SD(X)和SD(Y)分别表示X和Y的标准差。

7.正态分布概率密度函数:正态分布是统计学中最重要的分布之一,其概率密度函数可以描述随机变量的分布。

公式:f(x)=(1/(σ*√(2π)))*e^(-(x-μ)^2/(2σ^2))其中,μ表示均值,σ表示标准差,e表示自然常数。

8.合并概率公式:用于计算多个事件同时发生的概率。

公式:P(A∩B)=P(A)*P(B,A)其中,P(A)表示A事件发生的概率,P(B,A)表示在A事件发生的条件下B事件发生的概率。

9.条件概率公式:用于计算在已知其中一事件发生的条件下另一事件发生的概率。

公式:P(A,B)=P(A∩B)/P(B)其中,P(A,B)表示在B事件发生的条件下A事件发生的概率。

10.抽样误差公式:用于计算样本估计值与总体参数之间的误差。

公式:误差=Z*(标准误差)其中,Z表示置信水平对应的标准正态分布的分位数,标准误差表示样本估计的标准差。

这些计算公式是统计学中非常重要的工具,用于帮助我们理解和解释数据的特征和关系。

统计学原理重要公式

统计学原理重要公式

一.加权算术平均数和加权调和平均数的计算加权算术平均数: ∑∑=fxf x 或 ∑∑=ffxx加权调和平均数: ∑∑∑∑==fxf x m m x频数也称次数。

在一组依大小顺序排列的测量值中,当按一定的组距将其分组时出现在各组内的测量值的数目,即落在各类别(分组)中的数据个数。

再如在3.14159265358979324中,…9‟出现的频数是3,出现的频率是3/18=16.7% 一般我们称落在不同小组中的数据个数为该组的频数,频数与总数的比为频率。

频数也称“次数”,对总数据按某种标准进行分组,统计出各个组内含个体的个数。

而频率则每个小组的频数与数据总数的比值。

在变量分配数列中,频数(频率)表明对应组标志值的作用程度。

频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。

掷硬币实验:在10次掷硬币中,有4次正面朝上,我们说这10次试验中…正面朝上‟的频数是4例题:我们经常掷硬币,在掷了一百次后,硬币有40次正面朝上,那么,硬币反面朝上的频数为____.解答,掷了硬币100次,40次朝上,则有100-40=60(次)反面朝上,所以硬币反面朝上的频数为60.一.加权算术平均数和加权调和平均数的计算加权算术平均数: ∑∑=fxf x 或 ∑∑=ffxxx 代表算术平均数;∑是总和符合;f 为标志值出现的次数。

加权算术平均数是具有不同比重的数据(或平均数)的算术平均数。

比重也称为权重,数据的权重反映了该变量在总体中的相对重要性,每种变量的权重的确定与一定的理论经验或变量在总体中的比重有关。

依据各个数据的重要性系数(即权重)进行相乘后再相加求和,就是加权和。

加权和与所有权重之和的比等于加权算术平均数。

加权平均数 = 各组(变量值 × 次数)之和 / 各组次数之和 = ∑xf / ∑f加权调和平均数: ∑∑∑∑==fxf xm m x加权算术平均数以各组单位数f 为权数,加权调和平均数以各组标志总量m 为权数但计算内容和结果都是相同的。

统计学复习(含公式)

统计学复习(含公式)

1、统计学:是收集、汇总和分析统计数据的科学和艺术。

2、统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。

3、普查:是为某一特定目的而专门组织的一次性全面调查,如人口普查、工业普查、农业普查等。

4、抽样调查的特点:经济性;时效性高;适应面广;准确性高。

5、调查方案:是指导整个过程的纲领性文件,其内容包括调查目的、调查对象和调查单位、调查项目和调查表等内容。

6、组距分组的几个步骤:一、确定组数二、确定组距三、确定组限和进行次数分配四、绘制统计图五、分析。

)7、为消除组距不同对频数分布的影响,需要计算频数密度,即频数密度=频数/组距,用频数密度才能准确反映频数分布的实际情况.8、以组中值作为代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组距中值两侧呈对称分布。

9、描述统计的内容也包括频数分布、但主要是关于集中趋势和离中趋势的描述问题。

10、众数:是一组数据中出现次数最多的变量值。

从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数,记为M.11、众数是一组数据中心位置的一个代表值。

当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,实际上也可以认为有多个众数.12、协方差的大小会受到计量单位和数据均值水平的影响,从而使不同相关总体之间的相关程度缺乏可比性。

13、时间系列:是反映现象随时间的变化而变化的数据系列,也称为时间数列或动态数列。

14、用报告期水平减去基期水平,就等于增长量。

其中,当基期水平为上期水平时,就称为逐期增长量,当基期水平为某个时期的固定发展水平时,就称为累计增长量。

15、报告水平与基期水平之比,称为发展速度。

其中,当基期水平为上期水平时,就称为环比发展速度;当基期水平为某个时期的固定发展水平时,就称为定基发展速度。

16、序时平均数也称为动态平均数,它反映现象在一定时期内发展水平达到的一般水平.由于指标形式分绝对数、相对数和平均数等,所以对其平均的方法存在差异性。

统计学原理计算题(公式)复习资料

统计学原理计算题(公式)复习资料

《统计学原理》复习资料(计算部分)一、 编制分配数列(次数分布表) 统计整理公式a) 组距=上限-下限 b) 组中值=(上限+下限)÷2c) 缺下限开口组组中值=上限-1/2邻组组距 d) 缺上限开口组组中值=下限+1/2邻组组距1.某班40名学生统计学考试成绩分别为:57 89 49 84 86 87 75 73 72 68 75 82 97 81 67 81 54 79 87 95 76 71 60 90 65 76 72 70 86 85 89 89 64 57 83 81 78 87 72 61要求:⑴ 根据上述资料按成绩分成以下几组:60分以下,60~70分,70~80分,80~90分,90~100分,整理编制成分配数列。

⑵ 根据整理后的分配数列,计算学生的平均成绩。

解:分配数列成绩(分) 学生人数(人) 频率(%) 60以下 4 10 60—70 6 15 70—80 12 30 80—90 15 37.5 90—100 3 7.5 合计 40 100平均成绩 55465675128515953307076.754040xf x f⨯+⨯+⨯+⨯+⨯====∑∑(分)或 5510%6515%7530%8537.5%957.5%76.75fx x f=⋅=⨯+⨯+⨯+⨯+⨯=∑∑(分)2.某生产车间40名工人日加工零件数(件)如下:30 26 42 41 36 44 40 37 43 35 37 25 45 29 43 31 36 49 34 47 33 43 38 42 32 25 30 46 29 34 38 46 43 39 35 40 48 33 27 28要求:⑴ 根据以上资料分成如下几组:25~30,30~35,35~40,40~45,45~50,整理编制次数分布表。

⑵ 根据整理后的次数分布表,计算工人的平均日产量。

(作业10P 1) 解:次数分布表日加工零件数(件) 工人数(人)频率(%)25—307 17.5 30—35 8 20 35—40 9 22.5 40—45 10 25 45—50 6 15 合计 40100平均日产量 27.5732.5837.5942.51047.56150037.54040xf x f⨯+⨯+⨯+⨯+⨯====∑∑ 件或 27.517.5%32.520%37.522.5%42.525%47.515%37.5fx x f=⋅=⨯+⨯+⨯+⨯+⨯=∑∑ 件二、 算术平均数和调和平均数的计算 加权算术平均数公式 xfx f=∑∑(常用) fx x f=⋅∑∑(x 代表各组标志值,f 代表各组单位数,ff∑代表各组的比重)加权调和平均数公式 m x m x=∑∑ (x 代表各组标志值,m 代表各组标志总量)分析: m x mx=总产量工人平均劳动生产率(结合题目)总工人人数从公式可以看出,“生产班组”这列资料不参与计算,是多余条件,将其删去。

统计学常用公式

统计学常用公式

公式一1. 众数【MODE 】(1) 未分组数据或单变量值分组数据众数的计算未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。

(2) 组距分组数据众数的计算对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。

下限公式: 1012M =L++i ∆⨯∆∆ 式中:0M 表示众数;L 表示众数的下线;1∆表示众数组次数与上一组次数之差;2∆表示众数组次数与下一组次数之差;i 表示众数组的组距。

上限公式:2012M =U-+i ∆⨯∆∆ 式中:U 表示众数组的上限。

2.中位数【MEDIAN 】(1)未分组数据中中位数的计算根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。

设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:e N+M =X1()2当N 为奇数e N N +1221M =X +X 2⎛⎫⎛⎫⎪ ⎪⎝⎭⎝⎭⎧⎫⎪⎪⎨⎬⎪⎪⎩⎭ 当N 为偶数(2)分组数据中位数的计算分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。

3.均值的计算【AVERAGE 】(1)未经分组均值的计算未经分组数据均值的计算公式为: 112n ++==nii x x x x x n n=∑…(2)分组数据均值计算分组数据均值的计算公式为: 11221121+++==+ki ik k i k kii x f x f x f x f x f f f f==+∑∑+4.几何平均数【GEOMEAN 】几何平均数是N 个变量值乘积的N 次方根,计算公式为: 式中:G 表示几何平均数;∏表示连乘符号。

统计学公式大全

统计学公式大全
表示为 A-AB 或者 AB ,它表示 A 发生而 B 不发生的事件。
A、B 同时发生:A B,或者 AB。A B=Ø,则表示 A 与 B 不可能同时发生,
称事件 A 与事件 B 互不相容或者互斥。基本事件是互不相容的。
1
-A 称为事件 A 的逆事件,或称 A 的对立事件,记为 A 。它表示 A 不发生
的事件。互斥未必对立。 ②运算:
结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C 分配率:(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC)


Ai Ai
德摩根率: i1
i 1
AB AB,AB AB
(7)概率 的公理化 定义
设 为样本空间, A 为事件,对每一个事件 A 都有一个实数 P(A),若满
1
每次试验是独立的,即每次试验 A 发生与否与其他次试验 A 发生与
否是互不影响的。
这种试验称为伯努利概型,或称为 n 重伯努利试验。
用 p 表示每次试验 A 发生的概率,则 A 发生的概率为1 p q ,用 Pn(k) 表
示 n 重伯努利试验中 A 出现 k(0 k n) 次的概率,
积分元 f (x)dx 在连续型随机变量理论中所起的作用与 P( X xk) pk 在离
散型随机变量理论中所起的作用相类似。
1
(4)分布 函数
设 X 为随机变量, x 是任意实数,则函数 F(x) P(X x)
称为随机变量 X 的分布函数,本质上是一个累积函数。
P(a X b) F(b) F(a) 可以得到 X 落入区间 (a,b] 的概率。分布
P( X k) q k1 p, k 1,2,3, ,其中 p≥0,q=1-p。

统计学公式汇总

统计学公式汇总

统计学公式汇总(1)αβδμσνπρυt u F s(2)均数(mean):式中表示样本均数,X1,X2,X n为各观察值.(3)几何均数(geometric mean, G):式中G表示几何均数,X1,X2,X n为各观察值. (4)中位数(median, M)n为奇数时,n为偶数时,式中n为观察值的总个数.(5)百分位数式中L为Px所在组段的下限,f x为其频数,i为其组距,为小于L各组段的累计频数.(6)四分位数(quartile, Q)第25百分位数P25,表示全部观察值中有25%(四分之一)的观察值比它小,为下四分位数,记作Q L;第75百分位数P75,表示全部观察值中有25%(四分之一)的观察值比它大,为上四分位数,记作Q U。

(7)四分位数间距等于上、下四分位数之差。

(8)总体方差(9)总体标准差(10)样本标准差(11)变异系数(coefficient of variation, CV)(12)样本均数的标准误理论值估计值式中σ为总体标准差,s为样本标准差,n为样本含量。

(13)样本率的标准误理论值估计值式中π为总体率,p为样本率,n为样本含量. (14)总体率的估计:正态分布法,()式中p为样本均数,s为样本标准差,n为样本含量。

(15)总体均数的估计t分布法:()式中为样本均数,s为样本标准差,n为样本含量,ν为自由度。

(16)总体均数的估计u分布法:总体标准差σ未知但较大时,() 式中为样本均数,s为样本标准差,n为样本含量。

总体标准差σ已知时,()式中为样本均数,σ为总体标准差,n为样本含量. (17)样本均数与总体均数比较的t检验: 式中为样本均数,为欲比较的总体均数,s为样本标准差,n为样本含量,ν为自由度。

(18)样本均数与总体均数比较的u检验: 式中为样本均数,为欲比较的总体均数,s为样本标准差,n为样本含量。

(19)样本均数与总体均数比较的u检验:式中为样本均数,为欲比较的总体均数,σ为总体标准差,n为样本含量。

统计学计算公式大全

统计学计算公式大全

统计学计算公式大全统计学是数学中一个重要的分支,它利用分析数据,抽象出具有相似特征的概念,研究其变化规律、发展趋势,为决策提供重要的依据。

统计学涉及的范畴较广,涉及统计数据的收集、分析处理、描述抽象、模型建立、推理预测等数学计算技术,其中重要的组成部分就是计算公式,下面就是统计学计算公式大全。

一、抽样调查统计1、样本量的计算公式:n=N/ (1+N*e2/δ2)其中:n为样本量,N为总体量,e为期望的标准误差,δ为期望的置信度。

2、样本抽取a)取系统抽样公式:Pi=Di/n其中:Pi为抽取的概率,Di为分层抽样时的各层系统抽样量,n 为总体量。

b)层抽样公式:Di=ni/ni+N1+…+Nk其中:Di为分层抽样时的各层系统抽样量,ni为各层抽样量,N1+…+Nk为总体量。

3、数据分析a)差、方差、标准差极差X=Xmax-Xmin方差S2=G2S/(n-1)标准差S=根号[G2S/(n-1)]其中:Xmax,Xmin为所有样本数据的最大值和最小值,G1S和G2S分别为样本一阶矩和二阶矩,n为样本量。

b)值、中位数均值:X=G1S/n中位数:中位数=X((n+1)/2)其中:G1S为样本一阶矩,n为样本量。

c)分位数百分位数:Xp=(n+1)P/100其中:P为百分位数,n为样本量二、两个样本的比较1、大样本检验a) t检验t=X1-X2/S其中:X1,X2分别为样本1和样本2的均值,S为两个样本总体方差的平均值。

b) F检验F=S12/S22其中:S12,S22分别为样本1和样本2的方差。

2、小样本检验a) Z检验z=X1-X2/S其中:X1,X2分别为样本1和样本2的均值,S为样本1和样本2的总体标准差的平方根。

b)2检验χ2=∑[(Oi-Ei)2/Ei]其中:Oi,Ei分别为样本的实际频数和期望频数。

三、数据回归分析1、回归分析公式Y=a+bX其中:Y,X分别为回归变量,a,b分别为回归系数。

统计学复习资料整理

统计学复习资料整理

极差:一组数据的最大值与最小值之差称为极差,也称全距,用R表示。

其计算公式为:R=max (xi)-min(xi)离散系数:也称为变异系数,它是一组数据的标准差与其相应的平均数之比。

其计算公式为:V=S/X。

离散系数是测量数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。

离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。

三大统计分布:卡方分布、T分布、F分布卡方分布(χ2)定理:设n个相互独立并且都服从正态N(0,1)分布的随机变量X1、X2,……Xn,记则随机变量χ2服从自由度为n的χ2分布。

统计变量服从卡方分布,其含义是:在给定概率α的条件下,满足或者说表达式的概率为α。

T分布定理:设随机变量x,y相互独立,X~N(0,1),Y~χ2(n)记。

则随机变量T服从自由度为n的t分布。

设T~t(n),0<α<1,对于满足下列等式的数t a(n),称为t(n)分布的上侧分位数。

对于较大的n(>45)可以同标准正态分布的上侧分位数u a作为t(n)分布的上侧分位数F分布定理:设随机变量x,y相互独立,X~χ2(n1),Y~χ2(n2)记,则随机变量F服从第一自由度为n1,第二自由度为n2的F分布,记作:F~F(n1,n2)若F~F(n1,n2),易知:,若则统计量:描述样本特征的概括性数字度量。

完全由样本决定的量,叫做统计量;或者说不含有其他未知量的样本的函数称为统计量。

统计量可以看做是对样本的一种加工,它吧样本中所包含的关于总体的其一方面的信息集中起来.最常用的统计量是样本均值和样本方差S2。

自由度:随机变量所包含的独立变量的个数。

参数估计:就是用样本统计量去估计总体的参数。

在参数估计中,用来估计总体参数的统计量的名称称为估计量,用符号θ表示。

样本均值、样本比例、样本方差等都可以是一个估计量。

而根据一个具体的样本计算出来的估计量的数值称为估计值。

参数估计的方法有点估计和区间估计两种.点估计:就是用样本统计量θ的某个取值直接作为总体参数θ的估计值.区间估计:是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。

第五版统计学复习资料

第五版统计学复习资料

第二章
1、概率抽样也称随机抽样,是遵循随机原则进行的抽样,不加主观因素,组成总体的每个单位都有被抽中 的概率(非零概率) ,可以避免样本出现偏差,样本对总体有很强的代表性。 特点: (1) (2) (3) 分类: (1) 简单随机抽样:从包括总体 N 个单位的抽样框中随机地、一个个地抽取 n 个单位作为样本,每个 单位的入样概率是相等的。也就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单 位。 特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此之间无一定的关联性 和排斥性。简单随机抽样是其他各种抽样形式的基础。通常只是在总体单位之间差异程度较小和 数目较少时,才采用这种方法。 (2) 分层抽样:将抽样单位按某种特征或某种规划划分为不同的层,然后从不同的层中独立、随机地 抽取样本。 特点是: 由于通过划类分层, 增大了各类型中单位间的共同性, 容易抽出具有代表性的调查样本。 抽样时是按一定的概率以随机原则抽取样本。 每个单位被抽中的概率是已知的,或是可以计算出来的。 当用样本对整体目标量进行估计时,要考虑到每个样本单位被抽中的概率。
称为向上累积,反之为向下累积。频率的最终累积值为 100%。 (三)数值型数据的图示 1、分组数据:直方图 用面积来表示频数分布矩形的高度表示每一组的频数或频率,宽度则表示各组的组距。 制作频数分布直方图的方法: ①集中和记录数据,求出其最大值和最小值。数据的数量应在 100 个以上,在数量不多的情况下,至 少也应在 50 个以上。我们把分成组的个数称为组数,每一个组的两个端点的差称为组距。 ②将数据分成若干组,并做好记号。分组的数量在 5-12 之间较为适宜。 ③计算组距的宽度。用最大值和最小值之差去除组数,求出组距的宽度。 ④计算各组的界限位。各组的界限位可以从第一组开始依次计算,第一组的下界为最小值减去最小测 定单位的一半,第一组的上界为其下界值加上组距。第二组的下界限位为第一组的上界限值,第二组的下 界限值加上组距,就是第二组的上界限位,依此类推。 ⑤统计各组数据出现频数,作频数分布表。 ⑥作直方图。以组距为底长,以频数为高,作各组的矩形图。

统计学各章计算题公式及解题方法

统计学各章计算题公式及解题方法

统计学各章计算题公式及解题⽅法统计学各章计算题公式及解题⽅法第四章数据的概括性度量1. 组距式数值型数据众数的计算:确定众数组后代⼊公式计算:下限公式:M 0=L +?11+?2×d ;上限公式:M 0=U ??21+?2×d ,其中,L 为众数所在组下限,U 为众数所在组上限,?1为众数所在组次数与前⼀组次数之差,?2为众数所在组次数与后⼀组次数之差,d 为众数所在组组距 2. 中位数位置的确定:未分组数据为n+1 2;组距分组数据为n 23. 未分组数据中位数计算公式:M e ={x (n+12) ,n 为奇数12(x n 2+x n 2+1),n 为偶数4. 单变量数列的中位数:先计算各组的累积次数(或累积频率)—根据位置公式确定中位数所在的组—对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布)5. 组距式数列的中位数计算公式:下限公式:M e =L +n2S m1f m×d ;上限公式:M e =U ?n2+S m+1f m×d ,其中,f m 为中位数所在组的频数,s m?1为中位数所在组前⼀组的累积频数,s m+1为中位数所在组后⼀组的累积频数6. 四分位数位置的确定:未分组数据:{下四分位数:Q L =n+14上四分位数:Q U =3(n+1)4;组距分组数据:{下四分位数:Q L =n4上四分位数:Q U =3n 4 7. 简单均值:x?=x 1+x 2+?+x nn=∑x in i=1n8. 加权均值:x?=M 1f 1+M 2f 2+?+M k f kf 1+f 2+?+f k=∑M i f ik i=1n=∑M i k i=1fin,其中,M 1,M 2…M k 为各组组中值9. ⼏何均值(⽤于计算平均发展速度):x?=√x 1×x 2×…×x n n =√∏x i n i=1n10. 四分位差(⽤于衡量中位数的代表性):Q D =Q U ?Q L 11. 异众⽐率(⽤于衡量众数的代表性):V r =∑f i ?f m ∑f i=1?fm ∑fi12. 极差:未分组数据:R =max (x i )?min (x i );组距分组数据:R =最⾼组上限?最低组下限13. 平均差(离散程度):未分组数据:M d =∑|x i ?x?|n i=1n;组距分组数据:M d =∑|M i ?x?|k i=1?f in14. 总体⽅差:未分组数据:σ2=∑(x i ?µ)2N i=1N;分组数据:σ2=∑(M i ?µ)2k i=1?f iN15. 总体标准差:未分组数据:σ=√∑(x i ?µ)2N i=1N;分组数据:σ=√∑(M i ?µ)2k i=1?f iN16.样本⽅差:未分组数据:s n?12=∑(x?x?)2n i=1n?1;分组数据:s n?12=∑(M i ?x?)2?f ik i=1n?117. 样本标准差:未分组数据:s n?1=√∑(x?x?) 2n i=1n?1;分组数据:s n?1=√∑(M i ?x?)2?f ik i=1n?118. 标准分数:z i =x i ?x?s19. 离散系数:v s =s x?第七章参数估计1. Z α2的估计值:其中,t α2查p448 ,查找时需查n-1的数值3. ⼤样本总体⽐例的区间估计:p ±z α2√p (1?p )n4. 总体⽅差σ2在1?α置信⽔平下的置信区间为:(n?1)s 2χα/22≤σ2≤(n?1)s 2χ1?α/225. 估计总体均值的样本量:n =(Z α/2)2σ2E 2,其中,E 为估计误差6. 重复抽样或⽆限总体抽样条件下的样本量:n =(Z α/2)2π(1?π)E ,其中π为总体⽐例第⼋章假设检验1. 总体均值的检验(σ2已知或σ2未知的⼤样本)[总体服从正态分布,不服从正态分布的⽤正态分布近似]3.⼀个总体⽐例的检验(两类结果,总体服从⼆项分布,可⽤正态分布近似)(其中π0为1.期望频数的分布(假定⾏变量和列变量是独⽴的)⼀个实际频数f ij的期望频数e ij,是总频数的个数n乘以该实际频数f ij落⼊第i⾏和第j列的概率,即:e ij=n·(r in )?(e jn)=r i c jn2. χ2统计量(⽤于检验列联表中变量间拟合优度和独⽴性;⽤于测定两个分类变量之间的相关程度χ2=∑∑(f ij ?e ij )2eijcj=1r i=1,⾃由度为(r ?1)(c ?1),f ij 为列联表中第i ⾏第j列的实际频数,e ij 为列联表中第i ⾏第j 列的期望频数1) 检验多个⽐例是否相等检验的步骤提出假设H 0:?1 = ?2 = … = ?j ;H 1: ? 1 , ?2 , …,?j 不全相等;计算检验的统计量;进⾏决策:根据显着性⽔平?和⾃由度(r -1)(c -1)查出临界值??2,若?2>??2,拒绝H 0;若?22) 利⽤样本数据检验总体⽐例是否等于某个数值检验的步骤提出假设H 0:?1 = ,?2 = ,… ;H 1:原假设的等式中⾄少有⼀个不成⽴;计算检验的统计量;进⾏决:根据显着性⽔平?和⾃由度(r -1)(c -1)查出临界值??2;若?2 >??2,拒绝H 0;若?23) 检验列联表中的⾏变量与列变量之间是否独⽴检验的步骤提出假设H 0:⾏变量与列变量独⽴;H 1:⾏变量与列变量不独⽴;计算检验的统计量;进⾏决策:根据显着性⽔平?和⾃由度(r -1)(c -1)查出临界值??2,若?22,拒绝H 0;若?2系数的值在0~1之间φ=√χ2n ,其中,n 为实际频数总个数,即样本容量4. 列联相关系数(C 系数)⽤于测度⼤于2?2列联表中数据的相关程度C =√χ2χ2+n,其中,C 的取值范围是 0≤C <1;C = 0表明列联表中的两个变量独⽴;C 的数值⼤⼩取决于列联表的⾏数和列数,并随⾏数和列数的增⼤⽽增⼤;根据不同⾏和列的列联表计算的列联系数不便于⽐较 5. V 相关系数V =√χ2n min[(r?1),(c?1)],其中,V 的取值范围是 0≤V ≤1; V = 0表明列联表中的两个变量独⽴;V=1表明列联表中的两个变量完全相关;不同⾏和列的列联表计算的列联系数不便于⽐较;当列联表中有⼀维为2,min[(r-1),(c-1)]=1,此时V=φ第⼗章⽅差分析1. 单因素⽅差分析的要点:1) 建⽴假设的表述⽅法:H 0:µ1=µ2=?=µk ,⾃变量对因变量没有显着影响 H 1:µ1,µ2,…,µk 不全相等,⾃变量对因变量有显着影响2) 决策:i. 根据给定的显着性⽔平α,在F 分布表中查找与第⼀⾃由度df 1=k ?1、第⼆⾃由df 2=n ?k 相应的临界值 F αii. 若F> F α,则拒绝原假设H 0,表明均值之间的差异是显着的,所检验的因素对观察值有显着影响iii.若F< F α,则不拒绝原假设H0,不能认为所检验的因素对观察值有显着影响3)单因素⽅差分析表的结构:2.⽅差分析中的多重⽐较(步骤):采⽤Fisher提出的最⼩显着差异⽅法,简写为LSD1)提出假设:H0:µi=µj(第i个总体的均值等于第j个总体的均值)H0:µi≠µj(第i个总体的均值不等于第j个总体的均值)2)计算检验统计量:x?i?x?j3)计算LSD:LSD=tα2√MSE(1n i+1n j)4)决策:若|x?i?x?j|>LSD,则拒绝H0;若|x?i?x?j|3.双因素⽅差分析:1)⽆交互作⽤的双因素⽅差分析表结构:2)有交互作⽤的双因素⽅差分析表结构:4.关系强度测量:变量间关系的强度⽤⾃变量平⽅和(SSA)及残差平⽅和(SSE)占总平⽅和(SST)的⽐例⼤⼩来反映,根据R 2平⽅根R 进⾏判断R 2=SSA (组间平⽅和)SST (总平⽅和)第⼗⼀章⼀元线性回归1. 样本的相关系数:r =∑()()∑()2∑()2=∑∑∑∑2(∑)2∑2(∑)22. 相关系数的显着性检验步骤:1) 提出假设:H 0:ρ=0;H 1:ρ≠0 2) 计算检验统计量:t =|r |√n?2 1?r 2~t (n ?2)3) 确定α并决策:|t |>t α2,拒绝H 0;|t |,不拒绝H 03. ⼀元回归模型:y =β0+β1x+?4. ⼀元线性回归⽅程形式:E (y )=β0+β1x ,其中β0是直线⽅程在y 轴上的截距,是当x =0时,y 的期望值;β1是直线的斜率,称为回归系数,表⽰当x 每变动⼀个单位时y 的平均变动值5. ⼀元线性回归中,估计的回归⽅程:y ?=β0+β?1x ,其中β?0是估计的回归直线在y 轴上的截距,β?1是直线的斜率,它表⽰对于⼀个给定的x 的值,y ?是y 的估计值,表⽰当x 每变动⼀个单位时y 的平均变动值6. 根据最⼩⼆乘法求β0以及β?1的公式: {β?1=n ∑x i y i ?(∑x i n i=1)(∑y i n i=1)n i=1n ∑x i 2n i=1?(∑x in i=1)2β?0=y ??β1x?7. 误差平⽅和之间的关系:∑(y i ?y ?)2=n i=1∑(y ?i ?y ?)2+∑(y i ?yi )2n i=1n i=1,即:SST(总平⽅和)=SSR(回归平⽅和)+SSE (残差平⽅和) 8. 判定系数(回归平⽅和占离差平⽅和的⽐例):R 2=SSR SST=∑(yi y )2n i=1∑(y i y)2n i=1=1∑(y i ?y ?i )2n i=1∑(yi y )2n i=19. 估计标准误差(实际观察值与回归估计值离差平⽅和的均⽅根):s y =√∑(y i ?yi )2n i=1n2=√SSEn?2=√MSE10. 线性关系的显着性检验:1) 提出假设:H 0:β1=0,线性关系不显着;H 1:β1≠0,有线性关系 2) 计算检验统计量:F =SSR 1?SSE n?2?=MSR MSE ~F (1,n ?2)3) 确定显着性⽔平α,并根据分⼦⾃由度1和分母⾃由度n-2找出临界值F α4) 决策:若F >F α,拒绝H 0;F1) 提出假设:H 0:β1=0,线性关系不显着;H 1:β1≠0,有线性关系 2) 计算检验统计量:t =β1s β1~t (n 2)3) 确定显着性⽔平α并决策:若|t |>t α2?,拒绝H 0;|t |y ?0±t α2?(n ?2)s y √1n +(x 0?x?)2∑(x i ?x?)2ni=1 其中,s y 为估计标准误差,(n ?2)为t α2?的⾃由度13. 预测区间估计:y 0在1?α置信⽔平下的预测区间:y ?0±t α2?(n ?2)s y √1+1n +(x 0?x?)2∑(x i ?x?)2ni=1 14. 回归分析表的结构:15. ⼏点说明:1) 判定系数R 2测度了回归直线对观测数据的拟合程度,若所有观测点都落在直线上,残差平⽅和SSE=0,R 2=1,拟合是完全的2) 在⼀元线性回归中,相关系数r 实际上是判定系数R 2的平⽅根3) 相关系数r 与回归系数β1是同号的第⼗三章时间序列预测和分析1. 环⽐增长率:报告期增长率与前⼀期⽔平之⽐减1:G i =Y iY i?1?1 (i =1,2,Λ,n)2. 定基增长率:报告期⽔平与某⼀固定时期⽔平之⽐减1G i =Yi Y 01 (i =1,2,Λ,n),其中, Y 0表⽰⽤于对⽐的固定基期的观察值3. 平均增长率:序列中各逐期环⽐值(也称环⽐发展速度) 的⼏何平均数减1后的结果(描述现象在整个观察期内平均增长变化的程度)G=√Y 1Y 0×Y 2Y 1×Λ×Yn Y n?1n ?1=√Y n Y 0n ?1,G ?表⽰平均增长率,n 为环⽐值的个数 1) 当时间序列中的观察值出现0或负数时,不宜计算增长率2) 在有些情况下,不宜单纯就增长率论增长率,要注意增长率与绝对⽔平的结合分析4. 时间序列预测的步骤:1) 确定时间序列所包含的成分,也就是确定时间序列的类型 2) 找出适合此类时间序列的预测⽅法3) 对可能的预测⽅法进⾏评估,以确定最佳预测⽅案 4) 利⽤最佳预测⽅案进⾏预测5. 均⽅误差:通过平⽅消去正负号后计算的平均误差,⽤MSE 表⽰MSE =∑(Yi ?F i )2n i=1n,其中Y i 为观测值,F i 为预测值6. 简单平均法:根据过去已有的t 期观察值来预测下⼀期数值。

统计学期末复习

统计学期末复习
数量标志表明单位数量方面的特征。例如:工龄、工 资水平等都是数量标志。
2、标志表现是标志特征在各单位上的具体表现。
品质标志表现只能用文字表示。
数量标志表现又称标志值,只能用数字来表示。
五、统计指标及其分类
1、统计指标是反映实际存在的社会经济现象总体 某一综合数量特征的基本概念。
2、分类
(1)按照作用和计算方法的不同,可以分为总量 指标、相对指标和平均指标;
解:第一步,排序(略)。
第二步,组距式分组。60分以下 1名学生; 60—70分 3名学生;70—80分 5名学生; 80—90分 8名学生;90分以上 3名学生。
频数分布表的编制
按分数分组 60分以下 60—70 70—80 80—90 90分以上
合计
学生人数(人) 所占比重(%)
1
5
3
15
5
25
A、该市所有的居民 B、该市每一个居民 C、该市每一个居民的生活状况 D、该市每一户居民
2、下列属于质量指标的是( B ) A、总产值 B、合格率 C、总成本 D、人口数
3、某小组学生数学考试成绩分别为60分、68分、75分 和85分。这几个数字是( C )
A、标志 B、指标 C、标志值 D、变量
3、重点调查:指在对象中选择一部分重点 单位进行调查,以了解总体的基本情况。
重点单位:指标志总量占总体标志总量比重 很大的单位。
4、典型调查:在总体中有意识地选择若 干个具有代表性的单位进行调查的方式。
5、抽样调查是一种非全面调查,它是按 照随机原则从总体中抽取部分单位进行 调查,用以推算总体数量特征的一种统 计调查方法。
(2)按反映总体特征的不同,可分为数量指标和 质量指标;

统计学原理重要公式大全

统计学原理重要公式大全

一.加权算术平均数和加权调和平均数的计算加权算术平均数:∑∑=fxf x 或 ∑∑=f f x x加权调和平均数: ∑∑∑∑==f xf xm m x频数也称次数。

在一组依大小顺序排列的测量值中,当按一定的组距将其分组时出现在各组内的测量值的数目,即落在各类别(分组)中的数据个数。

再如在3.14159265358979324中,…9‟出现的频数是3,出现的频率是3/18=16.7% 一般我们称落在不同小组中的数据个数为该组的频数,频数与总数的比为频率。

频数也称“次数”,对总数据按某种标准进行分组,统计出各个组内含个体的个数。

而频率则每个小组的频数与数据总数的比值。

在变量分配数列中,频数(频率)表明对应组标志值的作用程度。

频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。

掷硬币实验:在10次掷硬币中,有4次正面朝上,我们说这10次试验中…正面朝上‟的频数是4例题:我们经常掷硬币,在掷了一百次后,硬币有40次正面朝上,那么,硬币反面朝上的频数为____.解答,掷了硬币100次,40次朝上,则有100-40=60(次)反面朝上,所以硬币反面朝上的频数为60.一.加权算术平均数和加权调和平均数的计算加权算术平均数:∑∑=f xf x 或 ∑∑=f f x xx 代表算术平均数;∑是总和符合;f 为标志值出现的次数。

加权算术平均数是具有不同比重的数据(或平均数)的算术平均数。

比重也称为权重,数据的权重反映了该变量在总体中的相对重要性,每种变量的权重的确定与一定的理论经验或变量在总体中的比重有关。

依据各个数据的重要性系数(即权重)进行相乘后再相加求和,就是加权和。

加权和与所有权重之和的比等于加权算术平均数。

加权平均数 = 各组(变量值 × 次数)之和 / 各组次数之和 = ∑xf / ∑f加权调和平均数: ∑∑∑∑==fxf xmm x加权算术平均数以各组单位数f 为权数,加权调和平均数以各组标志总量m 为权数但计算内容和结果都是相同的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

自己整理的统计学复习资料,(仅供参考)
一、某车间工人日产量资料如下 :计算该车间平均每个工人的日产量及标准差 .
平均日产量
标准差
甲、乙两班同时对《统计学原理》课程进行测试,甲班平均成绩为70分,标准差为9.0分;乙班的成绩分组资料如下 :(计算乙班学生的平均成绩,并比较甲、乙两班哪个班的平均成绩更有代表性?)
乙班学生的平均成绩 乙班学生的标准差
甲班学生的变异系数 乙班学生的变异系数 因为0.129 〉0.120,所以乙班学生的平均成绩更具有代表性
二、时间序列计算
已知某商店1997年销售额比1992年增长64%,1998年销售额比1992年增长86%,问1998年销售额比1997年增长多少?1992 1998年间,平均增长速度是多少?
1998年销售额比1997年增长的百分数
1992 1998年平均增长速度
三、统计指数计算
某农贸市场三种商品的价格和销售量资料如下:
试根据上表资料计算:拉氏形式的价格指数;派氏形式的价格指数 拉氏价格指数
派氏价格指数
四、区间估计计算
1、当总体方差已知时,求μ的置信区间 。

例题:已知某零件的直径服从正态分布,从该批产品中随机抽取10件,测得平均直径为202.5mm ,已知总体标准差σ=2.5mm ,试建立该种零件平均直径的置信区间,给定置信度为0.95 。

日产量(件)
1020
3040
10-1213-1516-1819-21工人数(人)171001700===
∑∑f xf x 3
)(2
=-=∑∑f f x x σ602
62512
5
以下60-7070-8080-9090-100学生人数(人)按成绩分组4
.7750
3870===
∑∑f xf x 29
.9)(2
=-=
∑∑f
f x x σ129
.070
0.9==
=
x
v σσ 120.04
.7729
.9==
=
x
v σ
σ %
41.131%
641%
861=-++=
%
90.10186.1116
=-=-=
-R x n
35042503A 500120
610
420100
58
B C
零售量零售价
零售量零售价
报告期
基期
商品%84.1232384.13650
4520
0001===∑∑=
q p q p K p %17.1242417.14510
5600
1011===∑∑=
q p q p K p 96.1,5.2,5.202,10====z x n σ55.110
5
.296
.1====∆n
z
z x x σ
μx
x x X x ∆+≤≤∆-55
.15.20255.15.202+≤≤-X
该种零件平均直径的置信区间为::[200.95,204.05]
2、当总体方差未知时,求μ的置信区间 。

例题:某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,标准差300小时,试在95.45%(t=2)概率保证下,估计这种新电子元件平均寿命区间
新电子元件平均寿命区间为: 5940-----6060(小时)
1、 当总体比例的置信区间估计 。

例题:某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式,从中抽取400件进行观察,
其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。

五、总体均值的假设检验
1、例: 根据过去大量资料,某厂生产的产品的使用寿命服从正态分布N (1020,1002)。

现从最近生产的一批产品中随机抽取16件,测得样本平均寿命为1080小时。

试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?
解:根据题意,提出假设:H 0: μ=1020;H 1: μ>1020, 检验统计量
检验统计量由α=0.05,查表得临界值Z0.05=1.645
由于Z =2.4>Z α=1.645,所以应拒绝H 0而接受H 1,即这批产品的使用寿命确有显著提高
2、例: 从长期的资料可知,某厂生产的某种电子原件服从均值为200小时,标准差未知的正态分布。

通过改变部分生产工艺后,抽得10件做样本,均值为204.8(小时), 标准差S=5.789 ,试问电子原件的平均值数据是否有所提高 。

解:根据题意建立如下假设:
检验统计量
由α=0.05,查表得临界值 。

由于, 所以拒绝H 0接受H 1,即可以接受“在新工艺下,这种电子元件的平均值有所提高的假设”
3、 例: 调查人员在调查某企业的主要生产线时,被告知性能良好生产稳定,产品合格率可达99%。

随机抽查了200件产品,其中
195件产品合格,判断厂方的宣称是否可信?(α=10%)
解:依题意,可建立如下假设:
样本比例 0.975 检验统计量:
给定α=0.1,查正态分布表得
由于 ,应接受原假设,即认为厂方的宣称是可信的
2,300,6000,100====t s x n (小时)30100300===n s x σ
60302=⨯==∆x x x t σx x x X x ∆+≤≤∆-60
6000606000+≤≤-X 4
.216
/1001020
1080/0=-==
n x Z σμ-200
20010>=μμ H H 622
.210/789.5200
8.204/0=-=-=n
S x μ8331.1)110(05.0)1(=-=-t n t α8331.1622.2)1(=->=n t T α
99
.099.010≠=P H P H
359
.1200025.0975.099
.0975.0)
1(0-=⨯-=--=
n
p p P p Z 645
.105.02/==μμα2
/αμ<U。

相关文档
最新文档