应用数理统计第二章参数估计(3)区间估计
数理统计之区间估计(ppt 50页)
置信水平的大小是根据实际需要选定的.
例如,通常可取置信水平1 =0.95或0.9等.
根据一个实际样本,由给定的置信水平,我
们求出一个尽可能小的区间 [ˆ1,ˆ2],使
P {ˆ1ˆ2}1
称区间 [ˆ1,ˆ2]为 的 置信水平为1 的
置信区间.
寻找置信区间的方法,一般是从确定 误差限入手.
教材上讨论了以下几种情形:
单个正态总体均值和方差 2的区间估计.
两个正态总体均值差 1 2和方差比
的区间估计.
2 1 2 2
比例 p 的区间估计.
下面我们举几个例子,其余部分请自己看.
休息片刻继续
例2 已知某地区新生婴儿的体重X~N(,2),
, 2未知,
…
随机抽查100个婴儿 得100个体重数据 X1,X2,…,X100
相应的置信区间平均长度越长.
也就是说,要想得到的区间估计可靠 度高,区间长度就长,估计的精度就差. 这是一对矛盾.
实用中应在保证足够可靠的前提下, 尽量使得区间的长度短一些 .
例3 某单位要估计平均每天职工的总医疗费, 观察了30天,其总金额的平均值是170元,标准 差为30元,试决定职工每天总医疗费用平均值 的区间估计(置信水平为0.95).
(ˆ1 ˆ2) 满足
P {ˆ1ˆ2}1
则称区间 [ˆ1,ˆ2]是 的置信水平(置信度、
置信概率)为 1 的置信区间.
ˆ1和ˆ2 分别称为置信下限和置信上限.
可见,
对参数 作区间估计,就是要设法找出
两个只依赖于样本的界限(构造统计量)
ˆ1 ˆ1(X1,…Xn) ˆ2 ˆ2(X1,…Xn)
下面我们就来正式给出置信区间的定义, 并通过例子说明求置信区间的方法.
区间估计 (3)ppt课件
当两样本为成对资料时,在置信度为P=1- α 时,两总体平均数差数µ 1-µ 2的置信区间可估 计为:
0+1.96x
临界值
u x
P ( 1 . 96 x 1 . 96 ) 0 . 95 x x
P ( x 1 . 96 ) P ( x 1 . 96 ) 0 . 05 x x
P ( 2 . 58 x 2 . 58 ) 0 . 99 x x
当为大样本时,不论总体方差σ2为已 知或未知,可以利用样本平均数 x 和总体 方差σ2作出置信度为P=1-α的中体平均数 的区间估计为:
( L x u , L x u ) 1 2 x x
其置信区间的下限L1和上限L2为
L u 1 x x
L u 2 x x
总体平均数的点估计L为:
L x tsx
tа为正态分布下置信度P=1- α时的t临界值
蛋白质含量的点估计为:
L x u 14 . 5 1 . 96 0 . 50 14 . 5 0 . 98 x
说明小麦蛋白质含量有95%的把握落在13.52%~ 15.48%的区间里。
P ( x 2 . 58 ) P ( x 2 . 58 ) 0 . 01 x x
P ( x 1 . 96 x 1 . 96 ) 0 . 95 x x
P ( x 2 . 58 x 2 . 58 ) 0 . 99 x x
总体平均数的点估计未知时,
σ2需由样本方差s2来估计,于是置信度为P
=1-α的总体平均数μ的置信区间可估计为
( x t s , x t s ) x x
数理统计中的参数估计与置信区间估计
数理统计中的参数估计与置信区间估计数理统计是概率论、数学统计和实证研究的基础,它研究的是通过观测和实验来获取数据,从而对总体的特征进行推断和估计的方法和理论。
在数理统计中,参数估计和置信区间估计是两个重要的概念和方法,用于对总体参数进行推断和估计。
一、参数估计参数估计是指通过样本数据对总体参数进行估计的方法。
总体参数是指总体的某个特征或指标,如均值、方差等。
参数估计可以分为点估计和区间估计两种方法。
1. 点估计点估计是指使用样本数据来估计总体参数的一个具体值,这个估计值被称为点估计量。
常用的点估计量有样本均值、样本方差等。
点估计的目标是使得估计值尽量接近真实的总体参数,即具有无偏性和有效性。
无偏性是指估计值的期望等于真实参数,有效性是指估计值的方差最小。
无偏性是一个重要的性质,它保证了估计值在大样本下趋近于真实值。
有效性则是在无偏估计的前提下,使估计值的方差最小,从而提高估计的准确性。
2. 区间估计区间估计是指通过样本数据得到总体参数的一个范围,这个范围被称为置信区间。
置信区间表示了总体参数的估计精度和可信程度。
在构造置信区间时,需要指定置信水平,常用的置信水平有95%和99%等。
置信水平为95%表示在大量重复抽样中,有95%的置信区间会包含真实的总体参数。
构造置信区间的方法有很多,如正态分布的置信区间、t分布的置信区间等。
不同的方法适用于不同的总体分布和样本信息。
在实际应用中,要根据具体的问题和数据的特点选择合适的置信区间方法。
二、数理统计中的应用参数估计和置信区间估计在数理统计中有广泛的应用,可以用于推断和估计各种领域的问题。
1. 总体均值的估计当我们要估计总体的均值时,可以使用点估计和区间估计的方法。
点估计是通过样本均值来估计总体均值,区间估计则是给出总体均值的一个范围。
2. 总体比例的估计当我们要估计总体的比例时,例如某种特征在总体中出现的比例,也可以使用点估计和区间估计的方法。
点估计是通过样本比例来估计总体比例,区间估计则是给出总体比例的一个范围。
应用统计方法第二章参数估计
2
1 1
2 x 1 1
2 2
2 dx
1 12
(
2
1 ) 2
令
X
S 2
1 2
(1
2
)
1 12
( 2
1)
解上述关于
1
,
2
的方程得
1 2
X X
3S 3S
8
.
Example 2.4 贝努利试验中,事件 A 发生的频率是该事件 发生概率的矩法估计。 Solution 此处,实际上我们视总体 X 为“唱票随机变量”, 即 X 服从两点分布:
此,必须采用求极值的办法,即对对数似然函数关于 i 求导, 再令之为 0,即得
ln L( ) i
(Xi
X )2
S2
记为ˆ 2 S 2 .第三步等号再一次用到习题 1.4.
7
.
Example 2.3 设 X 为[1, 2 ]上的均匀分布, X1, X 2 ,, X n
为样本,求1, 2 的矩估计。
Solution
a 1
2 xdx
1 2 1
2 2
12
2( 2 1 )
1 2
(
1
2)
2
.
Chapter 2 参数估计
(Parameter Estimation)
1
.
§2.1 点估计(Point Estimation) §2.2 估计量的评价准则 §2.3 区间估计(Interval Estimation)
2
.
§2.1 点估计(Point Estimation)
一、 矩估计法
若总体 X 的期望存在,E(X ) , X1, X 2 ,, X n 是出 自X 的样本,则由柯尔莫哥洛夫强大数定律,以
应用数理统计第二章
□
例2.1.11 总体 X ~ U (θ,θ +1) , θ 是未知参数, X1,…,Xn 是一组样本,求θ 的极大似然估计。 解. 总体的密度函数为: f(x,θ ) = 1, θ < x1,…,xn < θ +1 显然不能对参数 θ 求导,无法建立似然方程 注意到这个似然函数不是 0 就是 1 ,利用 顺序统计量,把似然函数改写成如下形式:
f(x,θ ) = 1, θ < x(1) <… < x(n) < θ +1 因此只要 θ < x(1) 并且 x(n) < θ +1 同时满足, 似然函数就可以达到极大值 1 。 所以 U (θ,θ +1) 中参数θ 的极大似然估计 可以是区间 ( x(n) - 1 ,x(1) ) 里的任意一个点 。 说明 MLE 可以不唯一,甚至有无穷多个 同理,总体 U (a,b) 左右端点 a 、b 的MLE 分别就是两个极值统计量 x(1) 、x(n) 。
k =1
n
注意这里总体参数 θ 是一个向量 (µ,σ2 ) , 因此对于似然函数取对数后分别对 µ,σ2 求导, 建立对数似然方程组:
1
σ
−
2
(x − µ) = 0 n + 1 2(σ 2 )2 ( xk − µ )2 = 0 ∑
k =1 n
2σ 2
解方程组得到正态总体两个参数的MLE
ˆ µ=X
1 n n−1 2 ˆ σ 2 = ∑ ( X k − X )2 = S n k =1 n
⎛ N ⎞ ∑ xk nN − ∑ xk L ( x ,θ ) = [ ∏ ⎜ ⎟ ] p (1 − p ) ⎝ xk ⎠
这里每一个 xk = 0、1、…、N 中的某个值
第二章 参数估计2-3 区间估计
I=0.814
上页 下页 返回
钢厂铁水含碳量X 例3. 钢厂铁水含碳量 ~ N(µ,0.1082), 现在随机测定 该厂9炉铁水得 炉铁水得X=4.484,求在置信度为 求在置信度为0.95 的条件 该厂 炉铁水得 求在置信度为 下铁水平均含碳量的置信区间。 下铁水平均含碳量的置信区间。 解
置信区间为
上页
下页
返回
联合方差
上页
下页
返回
1、 µ1 - µ2的1-α置信区间 、 α (1)、 σ12 、σ22已知 、
由于 X −Y ~ N(µ1 − µ2 ,
选取
2 2 σ1 σ2
n1
+
n2
)
因此置信度为1-α 因此置信度为 α的µ1 - µ2置信区间可为
上页
下页
返回
(2)、σ12 、σ22未知,且n1,n2较大 如大于 、 未知, 较大(如大于 如大于50)
=27.5, ,
=6.26, ,
上页
下页
返回
测量一批铅锭的比重,设铅锭的比重X 例6. 测量一批铅锭的比重,设铅锭的比重 ~ N(µ, 现进行16次检测得铅锭的比重有 σ2),现进行 次检测得铅锭的比重有 现进行 次检测得铅锭的比重有X=2.705, , S2=0.0292,试求总体 的均值µ和方差 σ2置信度为 求总体X的均值 0.95 的置信区间。 的置信区间。 解 (1)求µ的置信区间 σ2未知 n=16,α=0.05. 求 的置信区间, 未知, α 选取 查表得 置信区间为
(二)、总体X数学期望 (二)、总体X数学期望µ未知 数学期望µ 样本X 的无偏估计. 样本 1,X2, • • • , Xn, 且S2是σ2的无偏估计
选取样本函数
03-2 参数的区间估计.ppt
σ12 +σ22 n1 n2
L 2
=(x1
-
x2 )+
u σ α x1-x2
即
L 2
=(x1
-
x2
)+
uα
σ12 +σ22 n1 n2
2)总体方差未知,大样本
P(-u 0.05 .σx X -μ u0.05 σx )= 0.95
P( X - u0.05 σx ≤ μ≤ X + u0.05 σx )= 0.95
即有95%的概率保证总体平均μ
在( x u0.05 x , x u0.05 x )区间内,
即在(
x
- u0.05
σ n
,x
+ u0.05
)
1 n
E( X i )
1 n
n
X是的无偏估计量
第二节 参数的区间估计
点估计只给出了未知参数估计值的大小,没 有考虑试验误差的影响,也没有指出估计的可 靠程度。
区间估计 根据概率原理 估计出总体参数所 在的区间。
这种估计有一定的概率保证。
区间估计:
在一定概率保证下,估计出总体参数所在的 区间,称为参数的区间估计。
例:某自外地引入一新品种,在8个小区种植,得其千 粒重为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、 34.6,问在95%概率保证下新引入品种的千粒重的范围?
计算:千粒重的平均数为35.2g,标准差为0.58g。 查附表4,v=7时 t0.05=2.365,故:
35.2-2.365×0.58 ≤μ ≤ 35.2+2.365×0.58
即:33.8≤μ≥36.6,置信度为95%。
总体平均数μ的置信限
应用数理统计(武汉理工大)2-参数估计
1
D(S 2 )nI (
2)
n 1 n
1,
n
故S 2是渐进有效的。
第二章 参数估计
例: 设总体X (), X1, X 2 , , X n是X的一个样本, 讨论的无偏估计X的有效性。
解:lnp( X
,)
ln
X e
X!
X
ln
ln( X
!)
区间估计的关键: 用合适的方法确定两个统计量
1(X1, X2 , , Xn), 2(X1, X2 , , Xn)
第二章 参数估计
1.区间估计的定义及计算步骤
3) 区间估计的例子
例1 设总体X~N(μ , σ2), σ2已知,μ未知,设X1,…,Xn是X的样本, 求μ的置信度为1-α的置信区间。
)
2
n
,
D(ˆ2 )
D(nZ )
n2D(Z )
n2
n
2
2
当n 1时,显然D(ˆ1) D(ˆ2 ),故ˆ1比ˆ2有效。
第二章 参数估计
最小方差无偏估计问题 设 若 及T对 任(g意X(1, , X)的2都,任有一 , XD无n()T是 偏) g估(D计()T的量')一, T '个 ( X无1, X偏2估 , 计, X量n ), 则 无称 偏T估(计X1,, X或2 ,者,称X为n )是最g优(无)的偏一估致计最。小方差
其它类型的估计,如 贝叶斯估计…
第二章 参数估计
2.1参数的点估计
1. 矩估计 2. 极大似然估计 3. 点估计量的评价
数理统计课件 2.4.1--2.4.3区间估计
12.4 区间估计一、 区间估计的概念参数的点估计是用θ的一个估计值),,(ˆ1n x x θ估计未知参数θ.优点: 简便、直观缺点:没有反映估计的精确度,也未给出估计值的偏差范围。
为了弥补点估计的不足,可采用另一种估计方式—-区间估计。
定义2.11. 设总体X 的分布函数为θθ),,(x F 为未知参数,),,,(21n X X X 是来自总体X 的样本。
如果存在两个统计量),,,(ˆˆ2111n X X X θθ=,),,,(ˆˆ2122n X X X θθ=,对于给定的(01)αα<<,使得αθθθ−=<<1}ˆˆ{21P (2.33) 则称区间(1ˆθ,2ˆθ)为参数θ的置信度为α−1的置信区间,1ˆθ称为置信下限,2ˆθ称为置信上限。
所谓θ的区间估计,就是要在给定α值的前提下,去寻找两个统计量1ˆθ和2ˆθ,使其满足式(2.33)。
如何寻找θ的置信区间?2下面给出寻求未知参数θ的置信区间的一般步骤: 寻求未知参数θ的置信区间的一般步骤:(1). 设法找到一个包含样本1(,,)n X X …和待估参数θ的函数12(,,,;)n U U X X X θ= ,除θ外U 不含其他未知参数,U 的分布可求出且与θ无关; (2). 对于给定的置信度α−1,由等式{}1P c U d α<<=−适当地确定两个常数c, d ;(3). 求解不等式 12(,,,;)n c U d θ<ΧΧΧ<得 1ˆθ12212ˆ(,,,)(,,,)n n θθΧΧΧ<<ΧΧΧ 从而有1ˆ{P θ12212ˆ(,,,)(,,,)}1n nθθαΧΧΧ<<ΧΧΧ=− 故(1ˆθ,2ˆθ)就是所求的置信区间。
二、数学期望的置信区间1、已知DX ,求EX 的置信区间设总体X 服从正态分布N(µ,2σ),其中2σ已知。
现求总体均值µ的置信区间.设12,,,n ΧΧΧ 是来自总体X 的样本,自然用X 对µ作为点估计,因为,2(,)nN σµΧ∼故3X U =由正态分布表(附表1)可知,对于给定的α,存在一个值2u α,使得 2{||}1P U u αα<=−这里2u α是标准正态分布的α/2上侧分位数。
数学统计中的参数估计与区间估计
参数估计和区间估计是数学统计中非常重要的概念和方法,在众多统计应用领域都有广泛的应用。
通过参数估计和区间估计,我们可以利用样本数据估计总体中的未知参数,并且得到这些参数的可信区间。
参数估计是指根据样本数据对总体参数进行估计。
总体参数可以是总体均值、总体比例、总体方差等。
而样本数据是从总体中随机抽取的一部分数据。
通过计算样本数据的统计量,如样本均值、样本比例等,我们可以利用这些统计量对总体参数进行估计。
通常情况下,样本估计量与总体参数并不完全相等,而是存在一定的误差。
因此,我们需要对估计值进行修正,使得估计值更接近于总体参数的真实值。
参数估计的常用方法包括最大似然估计和矩估计等。
在参数估计的基础上,我们可以利用区间估计来研究估计值的可信程度。
区间估计是指通过样本数据对总体参数给出一个区间估计范围,这个范围称为置信区间。
置信区间是根据概率理论和统计推断方法计算出来的,它表示了一个参数的估计值在一定的置信水平下的范围。
在进行区间估计时,我们需要确定置信水平和置信区间的计算方法。
常用的置信水平有95%、99%等,这表示我们在统计推断中所采用的置信区间的正确性水平。
而置信区间的计算方法一般使用正态分布或t分布来进行。
区间估计的优势在于可以提供一个测量估计误差的范围。
在科学研究中,我们往往需要对实验结果进行合理的解释和判断。
如果我们只给出一个点估计,没有提供估计误差的范围,那么我们不能确定这个估计结果的可信程度。
而利用区间估计,我们可以提供一个置信水平下的范围,从而比较客观地评估估计结果的可信程度。
参数估计和区间估计在实际的统计应用中非常重要。
它们可以帮助我们从有限的样本数据中推断总体特征,并对推断结果给出一个可信程度的评估。
在社会科学、医学研究、市场调查等领域,参数估计与区间估计的方法被广泛应用于数据分析和决策制定中。
总的来说,数学统计中的参数估计与区间估计是我们对总体参数进行估计和评估的重要方法。
通过参数估计,我们可以利用样本数据对总体参数进行估计。
3、区间估计
sn 1
的95%的置信区间为:
sn1 Z0.05/2 s sn1 Z0.05/2 s
5 1.96 0.635 5 1.96 0.635
3.76 6.24
例3:从某年高考中随机抽取102份作文试卷,算得平均分数为26,标准 差为1.5,试估计全部考生作文成绩95%的置信区间。
解: 未知,总体平均数的区间估计公式为:
s s X t0.05/2 X t0.05/2 n-1 n-1
由于是大样本,故可作近似处理:
s s X Z 0.05/2 X Z 0.05/2 n n
ns 2
2 .025
2
ns 2
2 .975
2 2 (n 1 )sn ( n 1 ) s 2 1 n 1 2 2
.025
.975
9 0.286 9 0.286 2 0.135 2 0.95 19 2.7
2的95%置信区间为: 0.135 2 0.95
有效性
若多个统计量均可作为总体参数的无偏估计量,则变异最小
的那个样本统计量估计总体参数,有效性最高。
一致性
当n无限增大时,样本统计量越来越接近总体参数,估计值越 来越接近真值。
当N , X 2 2 当N , sn 1
充分性
指一个容量为n的样本统计量是否充分地反映了全部n个数据
X 2.58 X X 2.58 X 置信度为99%,犯错误的概率为1%
平均数区间估计的计算
1、σ 已知(总体若为正态,不管n的大小;总体若为非正态, 必须是大样本)。
概率论与数理统计--区间估计
由标准正态分布的上 分位点的定义知
P
X
/
n
z
/
2
1,
即
P X
n
z
/
2
X
n
z
/
2
1
,
于是得的一个置信水平为 1 的置信区间
X
n z / 2 ,
X
n
z
/
2
.
这样的置信区间常写成
X
由一个样本值算得样本均值的观察值 x 5.20,
则置信区间为(5.20 0.49), 即 (4.71, 5.69).
在例2中如果给定 0.05,
则又有
P
z0.04
X
/
n
z0.01
0.95,
即
P{ X
n
z0.01
X
n
z0.04
}
0.95,
另外定义中的表达式
P{ ( X1 , X 2 ,, X n ) ( X1 , X 2 ,, X n )} 1
还可以描述为 : 若反复抽样多次(各次得到的样本容量相等,都是n)
每个样本值确定一个区间( , ),
每个这样的区间或包含 的真值或不包含 的真值, 按伯努利大数定理, 在这样多的区间中,
第三节 区间估计
一、区间估计的基本概念 二、典型例题 三、小结
一、区间估计的基本概念
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例1 有一大批月饼,现从中随机地取16袋,称得重量(以克 计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 ,设袋装月饼的重量近似地服从正态 分布,试求总体均值的置信度为0.95的置信区间。 解: 2未知, 1-=0.95, /2=0.025,n-1=15, t0.975 (15) 2.1315 由已知的数据算得 x 503.75, S* 6.2022
n1 (n2 1) S12 12 n1 (n2 1) S12 P F (n 1, n1 1) 2 F (n 1, n1 1) 1 2 /2 2 2 1 / 2 2 2 n2 (n1 1) S2 n2 (n1 1) S2
10
得所求的标准差的置信区间为 (4.58, 9.60)
2.4.3 两个正态总体参数的区间估计
在实际中常遇到下面的问题:已知产品的某一质量指标 服从正态分布,但由于原料、设备条件、操作人员不同,或 工艺过程的改变等因素,引起总体均值、总体方差有所改变, 我们需要知道这些变化有多大,这就需要考虑两个正态总体 均值差或方差比的估计问题。
ˆ a ˆ b} {g(a) T ( X , X ,..., X ; ) g(b)} { 1 2 n
其中g ( x )为可逆的已知函数, T ( X 1 , X 2 ,..., X n ; 况
设总体X~N(,2),X1, X2, …,Xn是总体X的样本,求,2 /2 /2 的置信水平为(1)的置信区间.
求得 的置信水平为(1)的置信区间: ( 2未知)
S S* t1 2 (n 1) or X t1 2 (n 1) X n1 n
6
1) 例如当=0.05 时,即1-=0.95, X z0.975 , X z0.975 n n
2 2 2 2
~ t ( n1 n2 2)
其中 : M
从而可得
n1n2 ( n1 n2 2) n1 n2
的一个置信度为 1 的置信区间为
1 2
t1 2 ( n1 n2 2) 2 2 n1S1 n2 S2 X Y M
P{1 2 } 1
则称随机区间 ( 1 , 2 ) 是 的置信度为 (1 ) 的置信区间,
1 和 2 分别称为置信度为 (1 ) 的双侧置信区间的置信下
限与置信上限, (1 ) 称为置信水平(置信度). 这种估计 的方法叫做区间估计. 1)精度: 1 评价一置信区间 好坏的两个标准:
, n 1 15 解:现在 2 0.025,1 2 0.975
2 2 (15) 27.488, 查表得 0.975 0.025 (15) 6.262
又 S* =6.2022 ,
由(4)式
n 1 S * n 1 S * , 2 ( n 1) 2 ( n 1) 1 2 2
2 越小越好; P{ 1 2 } 越大越好2 2)置信度: .
[注]
1)当X是连续型随机变量时,对于给定的,我 们总是按要求:
P{ 1 2 } 1
求出置信区间. 2)当X是离散型随机变量时,对于给定的 , 常常找不到区间 ( 1 , 2 ) 使得 P{ 1 2 } 恰好 为 (1 ).此时我们去找 ( 1 , 2 ) 使得 P{ 1 2 } 尽可能地接近 (1 ) .
由此可得 1 2 的一个置信水平为 1 的置信区间为:
2 12 2 X Y z1 2 n n 1 2
12
2 2 2 2,但 2为未知. (b) 1
由定理1.15, 12 22 2 时,
M ( 1 2 ) ( X Y ) n1 S1 n2 S2
(2)方差 2 的置信区间 (只介绍 未知的情况) /2 2的无偏估计量为S*2 , 当1- 给定后,因为
( n 1) S *
2
/2
2
~ ( n 1)
2
2 / 2 (n 1)
21 / 2 (n 1)
即
得到方差 2 的一个置信度为1- 的置信区间:
3
区间估计的一般步骤:
• 1.给出“好”的点估计(按前面的标准),并 知道它的分布(只依赖待估的未知参数);
ˆ a, ˆ b] 2.求一个区间(参数的一个邻域) [ ˆc, ˆd ],使得对于给定的置信水平, 或 [
•
ˆ a ˆ b} 1 P{
且一般要求区间长尽可能小。 将不等式变形得到等价的形式
(4.71,5.69)的可信程度为95%. 3)置信水平为(1)的置信区间不唯一.如上例=0.05,可证 X X ÷ P z0.96 z0.99 0.95 z , X z 0 . 0 . 96 99 ÷ / n n n 置信区间长度越短表示估计的精度越高. 7
14
(2) 两个总体方差比 1 / 2 的置信区间 仅讨论总体均值1 ,2 为未知的情况。
2 2
由于
n1 (n2 1) S / ~ F (n1 1, n2 1) n2 (n1 1) S /
2 1 2 2 2 1 2 2
n1 (n2 1) S12 / 12 P F / 2 (n1 1, n2 1) F1 / 2 (n1 1, n2 1) 1 2 2 n2 (n1 1) S2 / 2
n 1 S n 1 S , 2 ( n 1) 2 ( n 1) 1 2 2
标准差 的一个置信度为1- 的置信区间9
例2 有一大批糖果,现从中随机地取16袋,称得重量(以克计) 如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 ,设袋装糖果的重量近似地服从正态分布, 试求总体标准差 的置信度为0.95的置信区间。
[例2.27] 有A、B 两种牌号的灯泡各一批, A、B种 灯泡的寿命是独立的且分别服从 X ~ N (1,12 )
2 Y ~ N ( 2 , 2 ) .希望通过抽样试验并进行区间估计,
考察:(ⅰ)两种灯泡的寿命是否有明显差异; (ⅱ)两种灯泡的质量稳定性是否有明显差异.
11
设总体X~N(1 ,12),Y~N(2 ,22), X1,X2,…,Xn1是X的样本,
13
[例2.28] 在例2.27中,随机选取A种灯泡5只,B种灯泡7只, 做灯泡寿命实验,算得两种牌号的平均寿命分别 为1000和980小时,样本方差分别为784和1024小 时2.取置信度0.99,希望进行区间估计.
考察:
(ⅰ)两种灯泡的寿命是否有明显差异;
(ⅱ)两种灯泡的质量稳定性是否有明显差异.
2 2 Y1,Y2,…,Yn2是Y的样本.这两个样本相互独立, X , Y , S1 , S2
分别为第一、二个总体的样本均值与方差.
1.两个总体均值差 1 2 的置信区间 (a)
12
2 和 2 已知,求 1 2 的置信区间
X Y ( 1 2 ) 2 2 2 2 ~ N ( 0 , 1 ) 相互独立 1 2 X , Y 1 2 X Y ~ N ( , ) 2 2 2 ~n1N ( n2 , X ~ N ( ), Y 1 1 , 21 2 n2 ) n 1 n1 n2
1
2.4.1 区间估计的一般步骤
定义1 设总体X的分布函数F(x;)含有一个未知参数,, 对于给定值 (0<<1),若由样本X1, X2, …,Xn确定的两个统 计量 ( X 1 , X 2 ,, X n ) 和 ( X 1 , X 2 ,, X n满足 )
求得 的置信度水平为(1)的置信区间: (2为已知)
X u u1 / 2 , X u1 / 2 或 1 2 X n n n
5
(b) 2为未知时,因为S 2是 2的点估计量,所以用S替换 ,
X
S n1
~ t ( n 1)
2 2 / 于是得 1 2 的一个置信度为 1 的置信区间为 2 2 S*1 S*1 2 F / 2 ( n2 1, n1 1), 2 F1 / 2 ( n2 1, n1 1) S*2 S*2
§2·4
区间估计
为了估计总体X 的未知参数 ,前面已经介绍了矩估计
ˆ 法和极大似然估计法.由于总体X的未知参数 的估计量
是随机变量,无论这个估计量的性质多么好,它只能是未知 参数的近似值,而不是 的真值.并且样本不同,所得到的 估计值也不同.那么 的真值在什么范围内呢?是否能通 过样本,寻求一个区间,并且给出此区间包含参数 真值的 可信程度.这就是总体未知参数的区间估计问题.
⑴ 均值 的置信区间
u1 / 2
u1 /2
(a) 2为已知时,因为 X是,的无偏估计,且 X ~ N (0,1) / n 对于给定的(0<<1),令
X P u 1 P X u1 / 2 X u1 / 2 1 1 n n / n 2
由公式(2)得均值的置信度为0.95的置信区间为
6.2022 2.1315 503.75 即(500.4, 507.1) 16 这就是说估计袋装月饼重量的均值在500.4与507.1之间,
这个估计的可信程度为95%。若以此区间内任一值作为 的 6.2022 2.1315 2 6.61 (克),这个 近似值,其误差不大于 16 误差估计的可信程度为95%。 8