区间估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
nX p p(1 p)u
2
2 2
2
数理统计 p的一元二次不等式
(n u ) p (2nX u ) p nX 0 2 2 故 p 的置信区间为该不等式的解集 ( p1 , p2 )
2 2
2
例:n=100
m=4 1-=0.95, u0.025=1.96
数理统计
譬如,在估计湖中鱼数的问题中,若我们 根据一个实际样本,得到鱼数 N 的极大似然估 计为1000条. 实际上,N的真值可能大于1000条,也可 能小于1000条.
若我们能给出一个区间,在此区间内我们 合理地相信 N 的真值位于其中. 这样对鱼数的 估计就有把握多了.
数理统计
也就是说,我们希望确定一个区间,使我们能 以比较高的可靠程度相信它包含真参数值. 湖中鱼数的真值
代入有μ 的置信区间为
(x
0
u , x
0
u )
计算得
0.108 0.108 (4.364 1.96, 4.364 1.96) 5 5 (4.269, 4.459) 结论:以95%的概率保证
铁水平均含碳量在4.269%至4.459%之间
(二)大样本( n >30)下总体均值μ 的 区间估计 *大样本下抽样分布(适用于任何分布)
[
]
这里所说的“可靠程度”是用概率来度量的 , 称为置信度或置信水平.
习惯上把置信水平记作 很小的正数.
1
,这里 是一个
数理统计
置信水平的大小是根据实际需要选定的. 例如,通常可取置信水平 1 =0.95或0.9等. 根据一个实际样本,由给定的置信水平,我 们求出一个尽可能 小的区间 ( θ , θ ) ,使
数理统计
解:要估计μ ,由于总体是正态分布,且 方差2 已知,故μ 的置信区间的公式为
(X
0
n
u , X
2
0
n
u )
2
1-α =0.95,故α =0.05, u0.025 = 1.96
数理统计 对于样本值x1, x2 …, xn有μ 的置信区间为
n 2 n 2 4.28 4.4 4.42 4.35 4.37 x 4.364 5
设总体 X ~ N ( , ) 其中 例:
2 0
2 数理统计 0 为已知
(3)由不等式 u1 U u2 得 /2 X u u
2
数理统计
0
1-
/2
2
u
0
n
u n
X
0
2
n 0 X u n 2
2
u
2
u X
3
(2)双侧置信区间(有上、下限):一 般取概率对称区间,因为此时区间长度最 短(因为是参数真值的范围,越小越好) 置信区间长度为
/3 2/3
数理统计
0
n 2
u
/2
3
u2
(u u2 )
3 3
3
/2
0
n
3
u
长度差
2
u
2
u
2
0
n
(u u2 2u )
m 1 u 2 n n
m m (1 ) n n
计算得 p 的置信上下限为
4 1 4 4 1.96 (1 ) 100 100 100 100
故 p 的置信区间为
(0.002,0.078)
(2)用 De Moivre-Laplace中心极限定理 数理统计
np 近似 i 1 U ~ N (0,1) np(1 p)
1,
为什么 这样取?
X P{| | u 2 } 1 n
数理统计
对给定的置信水平
源自文库
1,
查正态分布表得 u 2 , 使
X P{| | u 2 } 1 n
从中解得
P{ X
n
u 2 X
n
u 2 } 1
数理统计
(3)对于样本值 x1, x2 …, xn 及置信度1-α 具体计算θ 的范围 [θ 1(x1, …, xn) ,θ 2(x1, …, xn)]
例:已知某炼钢厂的铁水含碳量(%)在正常 情况下服从正态分布,且=0.108。现测量5炉 铁水,其含碳量分别是4.284,40 ,4.42 , 4.35,4.37(%),试以置信概率95%对总 体平均数μ 进行区间估计
θ θ ( X 1 , X 2 ,, X n )
(θ θ )
一旦有了样本,就把 估计在区间 ( θ , θ ) 内 .
这里有两个要求:
数理统计
1. 要求 以很大的可能被包含在区间( θ , θ )
内,就是说,概率 P{θ θ θ } 要尽可能大 . 即要求估计尽量可靠.
2. 估计的精度要尽可能的高. 如要求区间长度
数理统计
第三节
区间估计
置信区间定义 置信区间的求法 单侧置信区间 课堂练习 小结 布置作业
数理统计
引言
前面,我们讨论了参数点估计. 它是用样本算
得的一个值去估计未知参数. 但是,点估计值仅仅
是未知参数的一个近似值,它没有反映出这个近似 值的误差范围,使用起来把握不大. 区间估计正好 弥补了点估计的这个缺陷 .
的点 xα 为X的概率分布的上 α 分位点.
P (a X b) 1 α P ( X b) P ( X a ) 1 α P ( X b) 1 α , P ( X a ) α 2
2
数理统计
α
t (n)
α
0 t (n)
u1 u
u
t
α
α
F (n1 , n2 )
α
α
12 ( n)
2 ( n)
F (n1 , n2 ) 1
数理统计
例1 设X1,…Xn是取自 N ( , 2 ) 的样本, 2已知, 求参数 的置信度为 1 的置信区间.
的点估计为 X , X 取 U ~ N(0, 1) n
数理统计
4. 对于给定的置信水平 1 ,根据U(T, ) 的分布,确定常数a, b,使得 P(a <U(T, )<b) = 1 5. 对“a<S(T, )<b”作等价变形,得到如下形式:
θθθ
即
P{θ θ θ } 1 α
于是 ( θ , θ ) 就是 的100(1 )%的置信区间.
nu
2
2
103.84
2
2nX u
2
2
11.8416
2
nX 0.16 103.84 p 11.8416 p 0.16 0
p1 0.098375, p2 0.015663
数理统计 二、单总体均值μ 及方差2的区间估计
(一)单正态总体均值μ 及方差2的区间估计
S 故 的置信区间为 X u 2 n 0.025 计算得 的置信上下限为 0.081 1.96 200
即以95%的概率保证平均椭圆度在0.078至0.084
数理统计 2、0-1分布参数 p (比例)的区间估计
(1)用
X 近似 ~ N (0,1) S n
n m m 2 S 1 n n
数理统计
可见,确定区间估计很关键的是要寻找一个
待估参数 和估计量T 的函数U(T, ), 且U(T, )
的分布为已知, 不依赖于任何未知参数 .
而这与总体分布有关,所以,总体分布的形式是
否已知,是怎样的类型,至关重要.
参数,求参数μ 的置信度为1-α 的 置信区间。 2 解:(1)由于 X ~ N ( , 0 ) ,故μ 的估 计量为样本平均数 X,由此构造 /2 /2 X 1- U ~ N (0,1) 0 u u 2 2 n (2) Pu1 U u2 1 u2 u 2 由标准正态分布的上侧分位数定义得 u u 1 2
θ θ 尽可能短,或能体现该要求的其它准则.
可靠度与精度是一对矛盾,一般是 在保证可靠度的条件下尽可能提高 精度.
数理统计
二、置信区间的求法
在求置信区间时,要查表求分位点. 定义 设 0 α 1 , 对随机变量X,称满足
P ( X xα ) α P ( X xα ) 1 α
由于0-1分布参数 p 恰好是总体均值μ , S 故 p 的置信区间为 X u 2 n m 注意: X 故 p 的置信区间为
m 1 u 2 n n m m (1 ) n n
例:P56 例3(估计次品率)
n=100
数理统计
m=4 1-=0.95, u0.025=1.96
p 的置信区间是
P{θ θ θ } 1 α
称区间 ( θ , θ ) 为 的 置信水平为
置信区间.
1
的
数理统计
一、 置信区间定义
设 是 一个待估参数,给定 X1,X2,…Xn确定的两个统计量
0,
若由样本
θ θ ( X 1 , X 2 ,, X n )
满足
θ θ ( X 1 , X 2 ,, X n )
(θ θ )
P{θ θ θ } 1 α
则称区间 ( θ , θ ) 是 的置信水平(置信度 )为1
的置信区间.
θ 和 θ 分别称为置信下限和置信上限.
数理统计
可见,
对参数 作区间估计,就是要设法找出两个
只依赖于样本的界限(构造统计量).
θ θ ( X 1 , X 2 ,, X n )
i
X
n
故 p 的置信区间为 P u 2 U u 2 1
u 2 U u 2
nX np u 2 u 2 np(1 p)
n ( X p) 2 2 u 2 nX p p(1 p)u 2 p(1 p)
P{ X 1
n
u 2 X
n
u 2 }
于是所求 的 置信区间为
[X
n
u 2 , X
n
u 2 ]
也可简记为
σ (X uα 2 ) n
数理统计
从例1解题的过程,我们归纳出求置信区间 的一般步骤如下: 1. 明确问题, 是求什么参数的置信区间? 置信水平 1 是多少? 2. 寻找参数 的一个良好的点估计 T(X1,X2,…Xn) 3. 寻找一个待估参数 和估计量 T 的函数 U(T, ),且其分布为已知.
2
0
即μ 的置信区间为 ( X
0
n n
u
2
记为 X
0
u , X
2
0
n
u )
2
n
u
2
注意:
(1)区间估计不唯一;
/3 1-
数理统计
此时有
2/3
u
3
X
0
u2
u
3
3
u2
3
n
此时有即μ 的置信区间为
(X
0
n
u2 , X
3
0
n
u )
解 选
寻找一个待估参数和 统计量的函数 ,要求 其分布为已知.
明确问题,是求什么 参数的置信区间? 置信水平是多少?
寻找未知参 数的一个良 好估计.
有了分布,就可以求出 U取值于任意区间的概率.
数理统计
对于给定的置信水平, 根据U的分布,确定一 个区间, 使得U取值于该区间的概率为置信水平.
对给定的置信水平 查正态分布表得 u 2 , 使
数理统计
X 近似 ~ N (0,1)
n
X 近似 ~ N (0,1) S n
1、大样本下总体(分布不限)均值 在
1-置信水平下的置信区间为 S X u 2 或 X u 2 ( 未知) n n
数理统计
例:P55 n=200 方差未知 1-=95% u0.025=1.96
3 2
数理统计
/ 2
/ 2
u
长度差
3
u
u2 u
2 3
0
n
2
(u u2 2u )
3 3 2
(u u ) (u u2 ) 0
3 2 2 3
数理统计 2、区间估计的计算方法: (1)确定要估计的参数θ (一般为μ ,2 )
(2)依据总体的条件及样本的条件确定θ 的置信区间的理论公式 [θ 1(X1, …, Xn) ,θ 2(X1, …, Xn)]
*单正态总体N(μ , 2)的抽样分布
X
n
~ N (0,1)
(n 1) S 2 ~ (n 1) 2
X ~ t (n 1) * S n
*2
数理统计
一个总体参数的区间估计
总体参数 均值 比例 方差 符号表示 μ p 样本统计量
X (x )
2
P ( m / n) 2 (s 2 ) S