7.5(二)两个正态总体时的置信区间
两个正态总体均值差及方差比的置信区间
1,2)
均未知,
求方差比
2 1
2 2
的置信度为0.90 的置信
区间. 解 n1 Байду номын сангаас8, n2 13,
0.10,
s12 0.34(mm2 ), s22 0.29(mm2 ),
F / 2(n1 1, n2 1) F0.05(17, 12) 2.59,
F1
/ 2(17,
12)
F0.95 (17,
涉及的两总体分别为
N
(
1
,
2
)和N
(
2
,
2
),
1
,
2
,
2 1
,
2 2
均未知,两样本相互独立,
求
2 1
/
2 2
的置信水平为
0.90的置信区间。
解 现在 n1 7 , n2 8, 1 0.9, / 2 0.05,
1
1
F0.05 (6,7)
3.87 , F10.05 (6,7)
F0.05 (7,6)
2 1
2 2
的一个置信度为
1
的置信区间
S12 S22
F / 2 (n1
1 1, n2
1)
,
S12 S22
1 F1 / 2 (n1
1, n2
1) .
推导过程如下:
由于 (n1 1)S12
2 1
~ 2(n1 1),
(n2 1)S22
22
~ 2(n2 1),
且由假设知
( n1
1)S12
Y
~
N
1
2
,
2 1
n1
2 2
概率论与数理统计-第6章-第6讲-两个正态总体参数的置信区间
[0.3545 , 2.5545]
本讲内容
01 两个正态总体的情形 02 两个正态总体参数的置信区间 03 *6.2.3 单侧置信区间
03 *6.2.3 单侧置信区间
P(ˆ1 ˆ2 ) 1
[θˆ1, θˆ2 ] θ 的置信区间 双侧置信区间
但在某些实际问题中,例如,对于机器设备零部件来说,平均 寿命越长越好,我们关心的是平均寿命的“下限” ;又如,在购 买家具用品时,其中甲醛含量越小越好,我们关心的是甲醛含量均 值的“上限”.这就引出了单侧置信区间的概念.
2 1
2 2
2,
求均值差
1 2 的置信度为0.95 的置信区间;
02 两个正态总体参数的置信区间
解
(1) F0.025 (16, 12) 3.16,
F0.975 (16 ,
12)
1 F0.025 (12 ,
16)
1 2.89
由公式得方差比
2 1
2 2
的置信区间为
S12 S22
F0.975 (n2
12
2 2
n1 n2
P u U u 1,
2
2
( X Y uα 2
σ12 n1
σ
2 2
n2
,X
Y
uα
2
σ12 σ22 ) n1 n2
5
02 两个正态总体参数的置信区间
(2)
2 1
2 2
2
未知,1 2 的置信区间
T
X
Y Sw
(1
1 n1
2)
1 n2
~
t (n1
n2
2)
Sw
估什么?
1 2
2 1
统计学课后答案第七八章
6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
令狐采学解:总体方差知道的情况下,均值的抽样分布服从的正态分布,由正态分布,标准化得到标准正态分布:z=~,因此,样本均值不超过总体均值的概率P为:====21,查标准正态分布表得=0.8159因此,=0.63186.2在练习题6.1中,我们希望样本均值与总体均值的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?解:===6.3 ,,……,表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得解:由于卡方分布是由标准正态分布的平方和构成的:设Z1,Z2,……,Zn是来自总体N(0,1)的样本,则统计量服从自由度为n的χ分布,记为χ~??χ(n)因此,令,则,那么由概率,可知:b??,查概率表得:b??????6.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差,确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,试求b1,b2,使得解:更加样本方差的抽样分布知识可知,样本统计量:此处,n=10,,所以统计量根据卡方分布的可知:又因为:因此:则:查概率表:=3.325,=19.919,则=0.369,=1.887.1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本容量为40的样本,样本均值为25。
(1)样本均值的抽样标准差等于多少(2)在95%的置信水平下,估计误差是多少?7.2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
7.8 两个正态总体参数的区间估计
2 1
2 2
)
1
nm
因此,均值差1−2的置信水平1−α的置信区间为
(( X Y ) z 2
2 1
n
2 2
m
,(X
Y
)
z
2
2 1
2 2
)
nm
两个正态总体参数的区间估计
2.均值差1−2的置信区间 (方差12 =22 = 2,但 2 未知情形)
易知 ( X Y ) (1 2 ) ( X Y ) (1 2 ) ~ N (0,1)
枢轴量 T X Y (1 2 ) ~ t(n m 2)
S 1 n 1 m
根据 t分布的性质,取分位数tα/2 (n+m−2) 有
P{|
X Y (1 2 )
S 1 n 1 m
|
t
2(n
m
2)}
1
因此,均值差1−2的置信水平1−α置信区间为
2
(2n)=
2 0.05
(18)=28.869,12
2 (2n)
2 0.95
(18)
9.39
计算得:2nX 1062 1/λ 的置信水平为0.90的置信区间为 ( 1062 , 1062) (36.787,113.099)
28.869 9.39
两个正态总体参数的区间估计
2
,
2 2
m
)
由正态分布的性质可得
X
Y
~
N (1
2
,
2 1
两正态总体均值差的置信区间
两正态总体均值差的区间估计基于Wolfram Mathematica ,给出了两正态分布Ν[μ1,σ1]、Ν[μ2,σ2]总体均值差μ1-μ2在两总体方差已知、未知但相等、未知但样本量相等、未知但已知方差比、未知近似、未知精确的置信区间估计方法。
最后对理论结果进行程序模拟。
设X i ~Ν(μ1,σ1),i =1,2,...,n ,为正态总体X ~Ν(μ1,σ1)的一i.i.d.,样本均值X -=1n i =1n X i ,样本方差S X 2=1n -1 i =1n X i -X - 2。
设Y i ~Ν(μ2,σ2),i =1,2,...,m ,为正态总体Y ~Ν(μ2,σ2)的一i.i.d.,样本均值Y -=1m i =1m Y i ,样本方差S Y 2=1m -1 i =1m Y i -Y - 2。
一、两总体方差σ12=σ102、σ22=σ202已知定理1:X -Ν μ1,σ1n ,Y -Ν μ2,σ2m .CharacteristicFunction NormalDistribution [μ,σ],t n n;特征函数CharacteristicFunction 正态分布NormalDistribution μ,σn ,t ;%⩵%%//完全简化FullSimplify [#,n >0&&属于Element [n,整数域Integers ]]&True定理2:X --Y -Νμ1-μ2,⇔X --Y --(μ1-μ2)Ν[0,1].转换分布TransformedDistribution X -Y,X 正态分布NormalDistribution μ1,σ1n ,Y 正态分布NormalDistribution μ2,σ2m转换分布TransformedDistribution(X -Y )-(μ1-μ2), X 正态分布NormalDistribution μ1,σ1n ,Y 正态分布NormalDistribution μ2,σ2m //完全简化FullSimplifyNormalDistribution μ1-μ2,NormalDistribution [0,1]下面简要给出求μ1-μ2置信区间的方法:由α2≤Φ≤1-α2,得μ1-μ2的置信水平为1-α的置信区间为X --Y --Z1≤μ1-μ2≤X --Y --Zα2即X --Y --Z1-α2≤μ1-μ2≤X --Y -+Z1其长度:L =2Z 1-α2以下是程序模拟:需要Needs ["HypothesisTesting`"]μ10=10;μ20=1;σ10=3;σ20=4;X =伪随机变数RandomVariate [正态分布NormalDistribution [μ10,σ10],2000];Y =伪随机变数RandomVariate [正态分布NormalDistribution [μ20,σ20],1000];α=0.05;"(一)两方差已知""1.计算法"n =长度Length [X ];m =长度Length [Y ];M =平均值Mean [X ]-平均值Mean [Y ];σ=Q =分位数Quantile 正态分布NormalDistribution [0,1],1-α2;{M -Q σ,M +Q σ}"2.MeanDifferenceCI"MeanDifferenceCI X,Y,KnownVariance → σ102,σ202 ,置信级别ConfidenceLevel →1-α"3.NormalCI"NormalCI [M,σ,置信级别ConfidenceLevel →1-α]"区间长度:"L =2Q σ"相对区间长度:"r =L M "(二)两方差未知"清除Clear [μ,σ]{μ1,σ1}={μ,σ}/.求分布参数FindDistributionParameters [X,正态分布NormalDistribution [μ,σ]];2 正态分布\\正态分布统计分析\\两正态总体均值差的置信区间.nb求分布参数正态分布{μ2,σ2}={μ,σ}/.求分布参数FindDistributionParameters [Y,正态分布NormalDistribution [μ,σ]];"1.计算法"n =长度Length [X ];m =长度Length [Y ];M =平均值Mean [X ]-平均值Mean [Y ];σ=Q =分位数Quantile 正态分布NormalDistribution [0,1],1-α2;{M -Q σ,M +Q σ}"2.MeanDifferenceCI"MeanDifferenceCI X,Y,KnownVariance → σ12,σ22 ,置信级别ConfidenceLevel →1-α"3.NormalCI"NormalCI [M,σ,置信级别ConfidenceLevel →1-α]"区间长度:"L =2Q σ"相对区间长度:"r =L M(一)两方差已知1.计算法{8.75322,9.31447}2.MeanDifferenceCI {8.75322,9.31447}3.NormalCI{8.75322,9.31447}区间长度:0.561248相对区间长度:0.0621273(二)两方差未知1.计算法{8.75899,9.30871}2.MeanDifferenceCI {8.75899,9.30871}3.NormalCI{8.75899,9.30871}区间长度:正态分布\\正态分布统计分析\\两正态总体均值差的置信区间.nb30.549724相对区间长度:0.0608516二、两总体方差σ12=σ22未知σ12=σ22未知,由定理2,知X--Y- Ν μ1-μ2,σ,X--Y- -(μ1-μ2)σΝ[0,1]。
置信度(置信区间计算方法)
推导
选取枢轴量 T X ~ T (n 1)
S
n X 由P t (n 1) 确定t ( n 1) 2 S 2 n
这时, T2 T1 往往增大, 因而估计精度降低.
确定后, 置信区间 的选取方法不唯一,
ch73
常选最小的一个.
75
处理“可靠性与精度关系”的原 则
先
求参数 置信区间 保 证 可靠性
再
提 高 精 度
ch73
76
求置信区间的步骤
寻找一个样本的函数
— 称为枢轴量 它含有待估参数, 不含其它未知参数, 它的分布已知, 且分布不依赖于待估参 数 (常由 的点估计出发考虑 ). 例如 X~N ( , 1 / 5)
P(T1 T2 ) 1
则称 [ T1 , T2 ]为 的置信水平为1 - 的
置信区间或区间估计. T1 置信下限 T2 置信上限
ch73
几点说明
置信区间的长度 T2 T1 反映了估计精度 T2 T1 越小, 估计精度越高.
反映了估计的可靠度, 越小, 越可靠. 越小, 1- 越大, 估计的可靠度越高,但
( 引例中 a 1.96, b 1.96 )
由 a g ( X1, X 2 , X n , ) b 解出 T1 , T2
得置信区间 ( T1 , T2 ) 引例中
( T1 , T2 ) ( X 1.96 1 , X 1.96 1 ) 5 5
ch73 78
置信区间常用公式
7.5正态总体均值与方差的区间估计
1)
1,
即
P
X
S n t / 2 (n 1)
X
S n
t
/
2
(n
1)
1
,
于是得 的置信度为 1 的置信区间
X
S n
t
/
2
(n
1)
.
例1 有一大批糖果, 现从中随机地取16袋, 称得
重量(克)如下:
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
2
2
/
2
(n
1)
1,
即
(n 1)S 2
P
2
/
2
(
n
1)
2
(n 1)S 2
2 1
/
2
(n
1)
1 ,
于是得方差 2 的置信度为1 的置信区间
(n
2 /
1)S 2(n
2
1)
,
(n
2 1
/2
1)S 2 (n 1)
.
进一步可得:
标准差 的一个置信度为1 的置信区间
n 1S ,
只要n1和n2都很大(实用上 50即可), 则有
1 2的一个置信度为1 的近似置信区间
X
Y
z / 2
S12 n1
S22 n2
.
(3)
2 1
22
2,
但 2 为未知,
1 2的一个置信度为1 的置信区间
X Y t / 2(n1 n2 2)Sw
1 n1
1 n2
.
其中
Sw2
2. 两个总体方差比 12 的置信区间 22
双正态总体参数的区间估计
双正态总体参数的区间估计双正态总体参数的区间估计是统计学中的一种方法,用于估计由两个正态分布组成的总体的参数。
这种方法适用于当我们需要估计两个总体的平均值或比例时,且这两个总体可以被假定为来自两个不同的正态分布。
下面我们将详细介绍双正态总体参数的区间估计的原理和步骤。
双正态总体参数的区间估计可以分为两种情况:一种是当我们需要估计两个总体的平均值,另一种是当我们需要估计两个总体的比例。
首先,假设我们需要估计两个总体的平均值。
我们可以用样本平均值来估计总体平均值,并通过计算标准误差来构建置信区间。
如果我们假设两个总体的方差相等,则可以使用统计学中的配对t检验方法来进行推断。
具体步骤如下:1.收集样本数据。
从每个总体中随机抽取一定数量的样本,并记录下每个样本的观测值。
2.计算样本平均值。
对于每个总体,计算对应样本的平均值。
3.计算差值。
对于每个配对样本,计算它们的差值。
如果我们关注的是总体平均值的差异,则用两个总体对应样本的平均值之差来作为差值。
4.计算标准差。
计算差值样本的标准差,用来估计差值的标准误差。
5.确定置信水平。
选择一个置信水平,通常为95%。
这意味着我们希望有95%的置信度认为估计的区间包含真实的总体差异。
6.计算临界值。
确定配对t检验的自由度,并使用自由度和置信水平来查找相应的t临界值。
7.构建置信区间。
使用差值平均值±t临界值*标准误差来构建置信区间,这个区间将包含真实的总体差异。
另一种情况是当我们需要估计两个总体的比例。
在这种情况下,我们可以使用两个样本中的比例差异来估计总体的比例差异。
具体步骤如下:1.收集样本数据。
从每个总体中随机抽取一定数量的样本,并记录下每个样本中的成功次数和总次数。
2.计算样本比例。
对于每个总体,计算对应样本的比例,即成功次数除以总次数。
3.计算差异。
对于每个配对样本,计算它们的比例之差。
4.计算标准误差。
计算比例差异样本的标准误差,用来估计比例差异的标准误差。
置信区间法
置信区间法一、概述置信区间法(Confidence interval)是统计学中常用的一种方法,用于估计总体参数的范围。
在实际应用中,我们通常无法获得全体数据,只能通过从总体中抽取样本来进行推断。
而置信区间法可以帮助我们利用样本数据来估计总体参数,并给出一个可信的范围。
二、置信水平置信水平(Confidence level)是指在重复抽样的情况下,置信区间包含真实参数值的比例。
通常情况下,我们使用95%或99%作为置信水平。
三、构建置信区间构建置信区间需要以下三个步骤:1. 确定总体分布类型和总体参数;2. 根据样本数据估计总体参数;3. 利用统计方法确定置信区间。
四、正态分布情况下的置信区间当总体分布为正态分布时,可以使用t分布或标准正态分布来构建置信区间。
1. 样本量大于30且已知总体标准差时,使用标准正态分布构建置信区间;2. 样本量小于30或未知总体标准差时,使用t分布构建置信区间。
五、t分布情况下的置信区间当样本量小于30或未知总体标准差时,使用t分布构建置信区间。
1. 确定置信水平和自由度;2. 根据样本数据计算样本均值和样本标准差;3. 计算t值;4. 根据t分布表查找临界值;5. 构建置信区间。
六、实例假设我们想要估计一批产品的平均重量。
我们从该批产品中随机抽取了20个样本,得到平均重量为100g,标准差为10g。
现在我们希望以95%的置信水平来估计总体平均重量的范围。
1. 确定总体分布类型和总体参数:假设总体分布为正态分布,未知总体参数;2. 根据样本数据估计总体参数:样本均值为100g,样本标准差为10g;3. 利用统计方法确定置信区间:(1)因为样本量大于30且已知总体标准差,所以使用标准正态分布构建置信区间;(2)查找标准正态分布表可得到95%置信水平下的临界值为1.96;(3)根据公式:(x̄-zα/2 * σ/√n, x̄+zα/2 * σ/√n),计算置信区间为(96.08g, 103.92g)。
统计学中的假设检验与置信区间
统计学中的假设检验与置信区间统计学中的假设检验与置信区间是两个重要的概念,用于分析样本数据并对总体参数进行推断。
假设检验是一种统计推断方法,用于判断某个断言是否成立或者拒绝。
而置信区间则是用于估计总体参数的范围。
一、假设检验假设检验是一种基于样本数据对总体假设进行推断的方法。
其基本思想是:首先提出一个关于总体参数的假设,然后通过样本数据的分析来判断该假设是否成立。
在进行假设检验时,首先需要提出原假设(H0)和备择假设(H1)。
原假设是我们希望得到支持的假设,而备择假设则是我们希望进行反驳的假设。
然后,选择一个合适的检验统计量,根据该统计量的取值,计算出相应的P值。
若P值小于预先设定的显著性水平(通常为0.05),则拒绝原假设,否则接受原假设。
举个例子来说,假设我们要检验某个新药物的疗效是否优于传统药物。
原假设可以是该药物的疗效不优于传统药物,备择假设可以是该药物的疗效优于传统药物。
然后,收集一部分病人的数据,计算出适当的统计量,并根据该统计量的取值计算出P值,用以判断是否拒绝原假设。
二、置信区间置信区间是用于对总体参数的范围进行估计的方法。
它给出了一个范围,该范围内包含了可能的参数值,并以一定的置信水平(通常为95%)表示。
计算置信区间的方法有很多种,最常用的是基于正态分布的方法。
该方法假设样本数据近似服从正态分布,通过样本均值和样本标准差的计算,结合正态分布的性质,可以计算出一个置信区间,用于估计总体参数。
举个例子来说,我们想要估计某个城市的平均工资水平。
收集到了一部分居民的工资数据,计算出样本均值和样本标准差,然后使用正态分布的方法计算出一个置信区间,例如95%的置信区间为(1000, 2000),表示我们对于总体平均工资的估计范围在1000到2000之间,且有95%的置信水平。
三、假设检验与置信区间的联系假设检验与置信区间在某种程度上可以互相转化和补充。
在假设检验中,我们可以根据置信区间来判断原假设的合理性。
两样本区间估计和检验
(3)式是(1)式的特殊情形。
ˆ p z
ˆ 记 p X Yn / n, 对现在的情形, 式变为 (2)
2
ˆ ˆ ˆ ˆ ˆ p(1 p)/n ,p z 2 p(1 p)/n . (4)
7.6.2 泊松分布
设 X1, X2 ,…, Xn 为抽自具有泊松分布P(λ) 的总体的样本,因为E(X)=Var(X) =λ,应用(2) 式,并用 X 估计, 得到参数 的置信系数约
为 1 的置信区间
X z
2
X / n,X z
2
X /n .
(5)
7.6.2 泊松分布
但许多应用实践表明:当 n≥30时,近 似程度是可以接受的;当 n≥50时,近似程 度是很好的。
例1:某公司欲估计自己生产的电池寿命。现 从其产品中随机抽取50只电池做寿命试验。 这些电池寿命的平均值为2.266 (单位:100小 时),标准差S=1.935。求该公司生产的电池平 均寿命的置信系数为95%的置信区间。 解:查正态分布表,得 zα /2= z0.025=1.96,由公 式 (2),得电池平均寿命的置信系数为95%的 置信区间为
X Y z
/2
( / m) ( / n) ;
2 1 2 2
(5)
2 II. 当 12 2 但未知 时,由(2)式 ,得 1 2
的置信区间为:
X Y t
m n 2
( / 2)S m n
1
1
,
(6)
(7)
2 (m 1) S12 (n 1) S2 S . mn2
区间估计(三)
二、小结
1. 单个总体均值µ 的置信区间
σ zα / 2 . (1) σ 为已知 X ± , n (2) σ 2为未知 X ± S t (n −1). , α/2 n
2
2. 单个总体方差σ 2 的置信区间
(n −1)S2 (n −1)S2 2 χ (n −1) , χ 2 (n −1). α/2 1−α / 2
练习 为提高某一化学生产过程的得率 试图采用 为提高某一化学生产过程的得率, 一种新的催化剂, 为慎重起见, 一种新的催化剂 为慎重起见 在试验工厂先进行 试验. 次试验, 试验 设采用原来的催化剂进行了n1 = 8 次试验 2 得到得率的平均值 x1 = 91.73. 样本方差 s1 = 3.89, 又采用新的催化剂进行了n2 = 8 次试验 得到得率 次试验, 的平均值 x2 = 93.75, 样本方差 s2 2 = 4.02,假设两总 体都可认为近似地服从正态分布, 且方差相等, 体都可认为近似地服从正态分布 且方差相等 求 0 的置信区间 . 两总体均值差 µ1 − µ2的置信水平为 .95 解 由题意 两总体样本独立且方差相等 但未知 由题意, 两总体样本独立且方差相等(但未知 但未知),
σ 于是得 的一个置信度为0.90的置信区间 σ
0.34 1 , 0.34 2.38 × × 0.29 2.59 0.29
= [0.45,2.79]
练习
• 某车间有两台自动车床加工一类零件,零 件的直径服从正态分布。现从两班次的产 品中分别抽取5个和6个,其直径数据的样 本方差为0.00037和0.00092 • 试求:两班加工的零件直径的方差比的0.95 置信区间。
2
2
讨论两个整体总体期望之差和方差比的估计问题. 讨论两个整体总体期望之差和方差比的估计问题
置信度置信区间计算方法-置信区间公式表
置信度置信区间计算方法-置信区间公式表置信度置信区间计算方法置信区间公式表在统计学中,置信度和置信区间是非常重要的概念。
它们帮助我们在对总体参数进行估计时,给出一个可能包含真实参数值的范围,以及我们对这个范围的确定程度,也就是置信度。
首先,让我们来理解一下什么是置信度。
置信度通常用百分数表示,比如 95%或 99%。
它反映了我们在多次重复抽样和估计的过程中,得到的置信区间能够包含真实总体参数值的比例。
比如说,95%的置信度意味着如果我们进行 100 次抽样和估计,大约有 95 次得到的置信区间能够包含真实的总体参数值。
而置信区间则是一个可能包含总体参数真实值的范围。
这个范围的宽窄取决于我们所选择的置信度、样本数据的特征以及样本量的大小。
接下来,我们重点介绍几种常见的置信区间计算方法和相应的公式。
对于正态总体均值的置信区间计算,当总体方差已知时,我们使用的公式是:\\bar{X} \pm Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\其中,\(\bar{X}\)是样本均值,\(Z_{\alpha/2}\)是标准正态分布的双侧分位数(对应于置信度\(1 \alpha\)),\(\sigma\)是总体标准差,\(n\)是样本量。
例如,如果我们有一个样本均值为 50,总体标准差为 10,样本量为 100,并且想要计算 95%置信度下的置信区间,那么首先找到\(Z_{\alpha/2}\),对于 95%的置信度,\(\alpha = 005\),\(\alpha/2 = 0025\),对应的\(Z_{\alpha/2} \approx 196\)。
然后代入公式计算:\50 \pm 196 \times \frac{10}{\sqrt{100}}= 50 \pm 196\得到的置信区间就是 4804, 5196。
当总体方差未知时,我们用样本方差\(s\)来代替总体方差\(\sigma\),此时使用的是\(t\)分布,公式变为:\\bar{X} \pm t_{\alpha/2}(n 1) \frac{s}{\sqrt{n}}\其中,\(t_{\alpha/2}(n 1)\)是自由度为\(n 1\)的\(t\)分布的双侧分位数。
统计学课后答案第七八章
6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从()2,N n σμ的正态分布,由正态分布,标准化得到标准正态分布:x ~()0,1N ,因此,样本均值不超过总体均值的概率P为:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159 因此,()0.3P x μ-≤=0.63186.2在练习题6.1中,我们希望样本均值与总体均值μ的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?解:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=210.95Φ-≥0.975⇒Φ≥1.96⇒≥42.6828843n n ⇒≥⇒≥6.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使得 6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑ 解:由于卡方分布是由标准正态分布的平方和构成的: 设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量222212χ=+++n Z Z Z服从自由度为n 的χ2分布,记为χ2~ χ2(n ) 因此,令6221ii Z χ==∑,则()622216ii Zχχ==∑,那么由概率6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑,可知:b=()210.956χ-,查概率表得:b=12.596.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差22211(())1n i i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得 212()0.90p b S b ≤≤=解:更加样本方差的抽样分布知识可知,样本统计量:222(1)~(1)n s n χσ--此处,n=10,21σ=,所以统计量22222(1)(101)9~(1)1n s s s n χσ--==-根据卡方分布的可知:()()2212129990.90P b S b P b S b ≤≤=≤≤=又因为:()()()2221221911P n S n ααχχα--≤≤-=-因此:()()()()22221212299919110.90P b S b P n S n ααχχα-≤≤=-≤≤-=-= ()()()()222212122999191P b S b P n S n ααχχ-⇒≤≤=-≤≤- ()()()2220.950.059990.90P S χχ=≤≤=则: ()()2210.9520.0599,99b b χχ⇒==()()220.950.051299,99b b χχ⇒==查概率表:()20.959χ=3.325,()20.059χ=19.919,则()20.95199b χ==0.369,()20.05299b χ==1.887.1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本容量为40的样本,样本均值为25。
置信区间(详细定义及计算)
若由总体X的样本 X1,X2,…Xn 确定的 两个统计量
1 1 ( X 1 , X 2 , , X n ),
2 2 ( X 1 , X 2 , , X n )
T X S
2
~ t (n 1)
由公式知μ的置信区间为 [ X S t ( n 1)] 2 n 查表 t 0.05 (39) t0.025 (39) 2.0227 则所求μ的置信区间为 即 [103 .45 , 106 .55]
2
n
若σ2=25 μ的置信区间为
5 1.96] [X z 2 ] [105 40 n 20
[96.05 , 113.95]
用某仪器间接测量温度,重复测量5次得 1250 0 12650 1245 0 1260 0 12750 求温度真值的置信度为 0.99 的置信区间。
解
设μ为温度的真值,X表示测量值,通常是一个 正态随机变量 EX .
问题是在未知方差的条件下求μ的置信区间。 由公式 1 x 1250 [0 15 5 10 25] 1259 5 1 570 2 2 2 s [(1250 1259) (1275 1259) ] 5 1 4 2 s n 1 4 0.01 28.5 5.339 5 S [X t 2 ( n 1)] t ( 4 ) t ( 4 ) 4 . 6041 查表 0.01 0.005 n 则所求μ的置信区间为 [1259 24 .58 , 1259 24 .58]
2
n
两个正态总体均值及方差比的置信区间
置信区间为决策者提供了关于两个正态总体均值和方差比的不确定性估计。在许多实际应用中,如质量控制、生物统 计和金融等领域,这种不确定性估计对于制定决策和预测具有重要意义。
置信区间的精度
置信区间的精度取决于样本大小、总体分布以及所使用的统计方法的性质。在实践中,为了获得更精确 的置信区间,需要综合考虑这些因素,并选择适当的统计方法。
结合研究背景和实际应用场景,分析结果对实践的指 导意义和价值。
提出改进建议
根据分析结果,提出对未来研究的改进方向和建议。
05
总结与展望
研究成果总结
置信区间的计算方法
通过使用样本数据和适当的统计方法,可以计算出两个正态总体均值和方差比的置信区间。这些方法包括参数方法和 非参数方法,其中参数方法假设数据符合正态分布,而非参数方法则不依赖于数据分布的假设。
两个正态总体均值及 方差比的置信区间
目录
• 引言 • 两个正态总体均值的置信区间 • 两个正态总体方差比的置信区间 • 实际应用案例分析 • 总结与展望
01
引言
目的和背景
确定两个正态总体均值和方差比在一 定置信水平下的区间范围,为统计推 断提供依据。
解决实际生活中比较两个总体参数的 问题,如质量控制、医学研究Fra bibliotek经济 分析等领域。
公式:方差比的置信区间计算公式为 $left[frac{sigma_1^2}{sigma_2^2} pm t_{alpha/2,df} cdot sqrt{frac{hat{sigma}_1^2}{hat{sigma}_2^2} cdot left(frac{1}{n_1} + frac{1}{n_2}right)}right]$,其 中 $t_{alpha/2,df}$ 是t分布的临界值,$n_1$ 和 $n_2$ 是两个总体的样本量,$hat{sigma}_1^2$ 和 $hat{sigma}_2^2$ 是两个总体的样本方差。
第五节 正态总体均值与方差的区间估计 7-5
\ 2 的置信度为 1 - a 的置信区间为 2 2 ( n - 1)S ( n - 1)S ( 2 ) , 2 a / 2 ( n - 1) 1 - a / 2 ( n - 1)
而 的置信度为 1 - a 的置信区间为 (
n - 1S
2 / 2 ( n - 1) a
,
n - 1S
2 1 - a / 2 ( n - 1)
2 2 1 2 的置信区间包含1, 在实际中我们认为 1 , 由于 2
2 两者没有显著差别。 2
17
全章要求
1. 了解点估计的概念, 掌握矩估计法、极大 似然估计法; 2. 了解估计量的评选标准:
无偏性、有效性、一致性。
2 1 n1 + 2 n 2 2
~ N(0,1),
即 可 得 到 1 - 2的 一 个 置 信 度 为 a的 置 信 区 间 12 ( X - Y z a / 2 1 n1 + 2 n 2 ). 2
2. 当 和 均 未 知 时求 1 - 2的 置 信 区 间 ,
2 1 2 2
1
第七章 参 数 估 计
§5.正态总体均值与方差的区间估计
一. 单个正态总体的均值与方差的区间估计: 二. 两个正态总体的区间估计:
2
一. 单个正态总体的均值与方差的区间估计:
设总体 ~ N(, ), X1 , X2 , , Xn是一个样本 X .
2
1 .当 2 已知时,求 的置信区间。 X - 选取 Z = n
本题中的置信下限大于零,实际中可认为μ1比μ2大。
13
三. 两个总体方差比的置信区间:
仅讨论总体均值 1 , 2 未知的 情况,由于
2 ( n1 - 1) S1
置信度置信区间计算方法
为未知参数 的置信度为0.95的置信区间.
ch73 70
置信区间的意义
反复抽取容量为 5 的样本 , 都可得 一个区间 ,此区间不一定包含未知参数 的真值, 而包含真值的区间占95%.
若测得 一组样本值, 算得 x 1.86 则得一区间(1.86 – 0.877, 1.86 + 0.877) 它可能包含也可能不包含 的真值, 反复 抽样得到的区间中有95%包含 的真值.
(一) 一个正态总体 X ~N ( 2)的情形 (1) 方差 2已知, 的置信区间
( X z
2
n
, X z
2
2
n
) (1)
推导 由 X ~ N ( , ) n
g ( X 1 , X 2 , , X n , )
ch73
选取枢轴量
X
~ N (0,1)
Z X Y , n 1 2 2 SZ ( X i Yi ) ( X Y ) n 1 i 1
仿单个正态总体公式(2) 1 2 的置信区间为
ch73
SZ ( X Y ) t (n 1) 2 n
(8)
92
12 (5) 方差比 2 的置信区间 ( 1 , 2 未知) 2 2 S1 2 S12 / 12 S2 取枢轴量 F 2 2 2 ~ F (n 1, m 1) S2 / 2 1
区间估计
引例 已知 X ~ N ( ,1), 的无偏、有效点估计为 X
常数
随机变量
不同样本算得的 的估计值不同, 因此除了给出 的点估计外, 还希望根据 所给的样本确定一个随机区间, 使其包含 参数真值的概率达到指定的要求.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
机抽取机器 A 生产的管子 18 只, 测得样本方差为 2 s1 0.34(mm 2 ); 抽取机器B生产的管子 13 只, 测 得样本方差为 s2 0.29(mm 2 ). 设两样本相互独
2
立,且设由机器 A 和机器 B 生产的钢管内径分别服 2 2 2 从正态分布 N ( 1 , 1 ), N ( 2 , 2 ), i , i ( i 1,2)
.
1 和 2 均为未知, X Y z 2 (近似)
2 2
2 S12 S 2 . n1 n2
1 2 2 , 但 2 为未知,
2 2
2 2 Sw Sw X Y t ( n n 2) . 1 2 2 n1 n2
( n1 1) S1 ( n2 1) S 2 其中 S . n1 n2 2
2 2 2 w
西华大学数学与计算机学院
5
概 率 论 与 数 理 统 计 课 件
例3 为比较 I, II 两种型号步枪子弹的枪口速 度, 随机地取 I 型子弹10发, 得到枪口速度的平 均值为 x1 500 m/s, 标准差为 s1 1.10 m/s, 随机地取 II 型子弹20发, 得枪口速度的平均值 为 x2 496 m/s, 标准差为 s2 1.20 m/s. 假设 两总体都可认为近似地服从正态分布, 且由生 产过程可认为它们的方差相等. 求两总体均值 差 1 2 的一个置信度为0.95的置信区间. 解 由题意, 两总体样本独立且方差相等(但未知),
即 (4.15, 0.11).
西华大学数学与计算机学院
9
1 2. 两个总体方差比 2 的置信区间 2
2
概 率 论 与 数 理 统 计 课 件
仅讨论总体均值 1 , 2 为未知的情况.
( n1 1) S1
2
由于
1
2
~ ( n1 1),
2 2
( n2 1) S2
2
2
2 2
概 率 论 与 数 理 统 计 课 件
( n1 1) S1 ( n2 1) S 2 且 s 3.96, n1 n2 2
2 2 2 w
于是 1 2的一个置信水平为 .95的置信区间为 0
1 21 x1 x2 t 0.025 (14) S w ( 2.02 2.13), 8 8
2 2 X Y z 1 2 . 2 n1 n2
西华大学数学与计算机学院
3
( 2) 1 和 2 均为未知,
2 2
概 率 论 与 数 理 统 计 课 件
只要n1和n2都很大(实用上 50即可), 则有
1 2的一个置信度为1 的近似置信区间
§7.5 正态总体均值与方差的区间估计
(二)两个正态总体的情况
概 率 论 与 数 理 统 计 课 件
设 给 定 置 信 度 为 , 并 设 X 1 , X 2 , , X n1 为 1 第 一 个 总 体 ( 1 , 1 )的 样 本 Y1 , Y2 , , Yn2 为 第 二 N ,
X Y z 2
S1 S2 n1 n2
2
2
.
西华大学数学与计算机学院
4
( 3) 1 2 2 , 但 2 为未知,
2 2
概 率 论 与 数 理 统 计 课 件
1 2的一个置信度为1 的置信区间
2 2 X Y t ( n n 2) S w S w . 1 2 2 n1 n2
均未知, 求方差比 1 2 的置信度为 0.90 的置信 区间. 解 n1 18, n2 13, 0.10,
2 2
s 0.34, s 0.29,
2 1 2 2
西华大学数学与计算机学院
12
F0.05 (17, 12) IDF.F(0.95,17,12)=2.58,
1 2 1 x1 x2 t 0.025 ( 28) S w (4 0.93 ), 10 20
即
(3.07, 4.93).
7
西华大学数学与计算机学院
例4
概 率 论 与 数 理 统 计 课 件
为提高某一化学生产过程的得率, 试图采用
17
西华大学数学与计算机学院
1 4. 两个总体方差比 2 的置信区间 2
2
概 率 论 与 数 理 统 计 课 件
总体均值 1 , 2 为未知
S2 1 S12 1 1 . , 2 2 S 2 F ( n1 1, n2 1) S 2 F1 ( n1 1, n2 1) 2 2
概 率 论 与 数 理 统 计 课 件
2 S2 1 1 S12 1 1 P 2 2 2 1 , S 2 F1 ( n1 1, n2 1) S 2 F2 ( n1 1, n2 1) 2 2
1 于是得 2 的一个置信度为 1 的置信区间 2
西华大学数学与计算机学院
13
例6
概 率 论 与 数 理 统 计 课 件
甲、乙两台机床加工同一种零件, 在机床甲
加工的零件中抽取9个样品, 在机床乙加工的零件
中抽取6个样品,并分别测得它们的长度(单位:mm),
由所给数据算得 s1 0.245, s2 0.357, 在置信度
2 2
0.98下, 试求这两台机床加工精度之比 1 2 的置
(1) 1 和 2 均为已知
2 2
概 率 论 与 数 理 统 计 课 件
因 X , Y 分 是 1 , 2 的 偏 计 , 为 别 无 估 所 X Y 是1 2 的 偏 计 , 以 无 估 由X , Y 的 立 及 独 性
2 2 1 2 , X ~ N 1 , , Y ~ N 2 , n1 n2
.
( n 1) S 2 ( n 1) S 2 . , 2 2 ( n 1) 1 ( n 1) 2 2
西华大学数学与计算机学院
16
概 率 论 与 数 理 统 计 课 件
3. 两个总体均值差 1 2 的置信区间 2 12 2 2 2 1 和 2 均为已知, X Y z 2 n1 n2
2
体都可认为近似地服从正态分布, 且方差相等, 求 两总体均值差 1 2的置信水平为0.95的置 信区间. 解 由题意, 两总体样本独立且方差相等(但未知),
西华大学数学与计算机学院
8
n1 n2 8, 0.05,
t0.025 (14) IDF.T(0.975,14) 2.1448,
西华大学数学与计算机学院
6
0.05,
概 率 论 与 数 理 统 计 课 件
n1 10, n2 20,
查 表 得:
t0.025 ( 28) 2.0484,
9 1.102 19 1.202 2 又 sw 1.36607, 28
于是 1 2的一个置信度为0.95的置信区间为
~ 2 ( n2 1),
且由假设知
( n1 1) S1
1
2
与
2 2
( n2 1) S2
2
2 2
2
相互独立,
根据F分布的定义, 知
S1 1
S2 2
~ F ( n1 1, n2 1),
西华大学数学与计算机学院
10
2 2 S1 1 P F1 ( n1 1, n2 1) 2 F ( n1 1, n2 1) 1 , 2 2 2 S2 2
西华大学数学与计算机学院
2
2 2 1 2 , 可知 X Y ~ N 1 2 , n1 n2
概 率 论 与 数 理 统 计 课 件
或
X Y
1
2
1
2
2
n1
2
~ N 0, 1,
n2
于是得 1 2的一个置信度为1 的置信区间
一种新的催化剂, 为慎重起见, 在试验工厂先进行 试验. 设采用原来的催化剂进行了n1 8 次试验, 得到得率的平均值 x1 91.73. 样本方差 s1 3.89, 又采用新的催化剂进行了n2 8 次试验, 得到得率 的平均值 x2 93.75, 样本方差 s2 2 4.02,假设两总
西华大学数学与计算机学院
15
小结
概 率 论 与 数 理 统 计 课 件
1. 单个总体均值 的置信区间
(1) 为已知, X z . 2 n ( 2) 2为未知,
2
2. 单个总体方差 2 的置信区间
S2 X t ( n 1) 2 n
信区间. 假定测量值都服从正态分布, 方差分别为
2 12 ,
0.02,
F0.01 (8, 5) IDF.F(0.99,8,5)=10.29,
西华大学数学与计算机学院
14
F0.99 (8, 5) IDF.F(0.01,8,5)=0.15,
概 率 论 与 数 理 统 计 课 件
F0.95 (17, 12) IDF.F(0.05,17,12)=0.42,
1 于是 2 的一个置信度为0.90 的置信区间为 2
2
0.34 1 0.34 1 , 0.45, 2.79. 0.29 2.58 0.29 0.42
2
个 总 体N ( 2 , 2 )的 样 本 X , Y 分 别 是 第 一 、 二 个 ,