数理统计第四章 区间估计 4.1基本概念

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
2 精度 精度的标准不止一个.只介绍最常见的,随 机区间的平均长度越短越好这一标准.即
ˆ ˆ) E ( 2 1
越小越好.
下面的这个例子说明了精度,置信度(置 信水平)及其它们的关系.
12
例4.1.1
设样本X ( X 1 ,
, X n )来自正态总体
N ( , 2 ),其中 R, 2 0. 和 2的估计量分别 1 n 2 是样本均值X 和样本方差S ( X X ) , i n 1 i 1 用[ X kS / n , X kS / n ]作为总体均值的
2
区间估计.考虑其置信度(置信水平)和精度.
解:上述区间估计的置信度为
P ( X kS / n X kS / n )]
P | n ( X ) / S | k


P | T | k
13
其中T n ( X ) / S
~ tn 1 其分布与无关.
单侧置信上、下限都是置信区间的特例.因此,寻 求置信区间的方法可以用来求置信上、下限.
单侧置信限与双侧置信限之间存在一个简单的联系.
21
ˆ ( X )和 ˆ ( X )分别是参数的 引理4.1.1:设 L U 置信水平为1-1和1- 2的单侧置信上、下限, 且对任何样本X ,都有 ˆ (X ) ˆ (X ) L U ˆ ( X ), ˆ ( X )]是参数的置信水平为 则[
7
1 可靠度 ˆ1 , g ˆ2 ] 要求 g ( ) 以很大的可能被包含在区间[ g ˆ1 g ( ) g ˆ 2 )要尽可能大. 内,就是说,概率 P( g 即要求估计尽量可靠. 2 精度 估计的精度要尽可能的高. 如要求随机区间的平均长度,越短越好.
8源自文库
如何构造可靠度和精度尽可能高的区间估计? 通常采用的办法是 Neyman提出的妥协方案
下面考虑区间的平均长度
lk E (2kS / n )
14
由于(n 1)S 2 / 2 ,因此区间的平均长度为
2kE ( S ) 2 2k(n / 2) lk n n(n 1)((n 1) / 2)
显然,k越大,区间越长,精度越差. k越大,区间的置信系数越大,区间越可靠.
L U
1-(1 2 )的双侧置信区间.
证明:在引理的假定下,下列三个事件
ˆ ( X ) ˆ ( X ) ˆ ( X ) ˆ ( X )
L U
L
U
互不相容,“三个事件之并”为“必然事件”.考虑
22
ˆ ( X ) ˆ ( X ) ˆ ( X ) ˆ ( X ) ˆ ( X ) 1 P ˆ (X ) , 考虑 P ˆ ( X ) 1 P ˆ ( X ) P
ˆ (X ) ˆ ( X ) 1-, P 1 2
ˆ ( X ), ˆ ( X )]是参数的置信水平为 则称[ 1- 1 2 的置信区间.



ˆ (X ) ˆ (X ) inf P 1 2
ˆ ( X ), ˆ ( X )]的置信系数. 称为[ 1 2


17
ˆ ˆ (X , 说明: 1 1 1
ˆ ˆ (X , , X n )和 2 2 1
, X n )都是
随机变量的函数,因而也是随机变量.但是给定 样本观测值x=( x1 , , xn ), 就得到一个具体的闭区间 ˆ ( x , , x ), ˆ ( x , , x )],我们以1-的概率保证 [ 1 1 n 2 1 n ˆ ( x , , x ), ˆ ( x , , x )]. 未知参数 [
1 1 n 2 1 n
若取 5%,即置信水平为1 95%. 这时重复抽样100次,则在得到的100个区间 中包含参数 真值的平均有95个左右, 不包含参数 真值的平均有5个左右.
18
4.1.3 置信限
在一些实际问题中,有时候感兴趣的仅仅是 未知参数的置信上限或者置信下限. 例如,一种新材料的强度,关心的是它最 低不少于多少; 一个工厂的废品率,关心它最高不超过多少. 这些也是区间估计,称为置信上限或者置 信下限.定义如下:
15
由此例可以看出:在样本容量n给定后,为了 提高置信度,需要增加k值,从而缩短了区间, 降低了置信度. 置信度与精度相互制约着. 著名统计学家Neyman提出了妥协方案:保证 置信系数达到指定要求的前提下,尽可能提 高精度.由此引入置信区间的概念. 通常置信区间也称为Neyman置信区间.
16
ˆ ( X ), ˆ ( X )]为参数的一个 定义4.1.3:设[ 1 2 区间估计,若对给定的0 1, 有
L U
L
U

L

L
1

U

U
2
因此
ˆ ˆ ˆ ˆ P L ( X ) U ( X ) 1 P L ( X ) P U ( X )






1-(1 + 2 )
引理说明在有了单侧置信上、下限后,不难求得置 信区间.
23
4.1.4 置信域
在保证可靠度的前提下, 选择精度尽可能高的区间估计.
如果在应用中要求可靠度和精度都很高, 则必须加大样本容量, 即多做一些实验,才可能实现.
9
4.1.2 置信区间
为书写简单,以下假定被估计的g ( )就是自身, 这与一般情况没有原则区别.
1 置信度(或置信水平) ˆ , ˆ ]包含的概率 P ˆ ˆ] [ 随机区间[ 1 2 1 2 称为置信度(或置信水平). 这个概率与 有关.
ˆ ( X )和 ˆ ( X )是参数的置信水平为1- 则分别称 L U 的(单侧)置信下限和置信上限. ˆ ˆ inf P inf P L ( X ) U ( X )






20
分别称为置信上限、下限的置信系数.
ˆ ( X )而言,若 对置信下限 L ˆ )越大,则置信下限的精度越高. E ( L ˆ ( X )而言,若 对置信上限 U ˆ )越小,则置信上限的精度越高. E ( U
参数估计

点估计
区间估计
1
上一章,介绍了参数点估计,讨 论了估计量的优良性准则 . 给出了寻 求估计量最常用的矩估计法和极大似 然估计法以及一致最小方差无偏估计 . 参数点估计是用一个确定的值去估 计未知的参数. 看来似乎精确,实际上 把握不大. 为了使估计的结论更可信, 需要引入区间估计.
2
第四章 区间估计
P | n ( X ) / S | k


P | T | k
其中T n ( X ) / S
~ tn 1 其分布与无关.
因此,区间估计的置信系数为 inf P | T | k P | T | k
R
显然,k越大区间的置信系数越大,区间越可靠.
若对参数空间中任一,其置信度都很大, 则这个区间估计就是一个好的区间估计.
10
ˆ , ˆ ]为参数的一个 定义4.1.2:设随机区间[ 1 2 区间估计,则称置信度在参数空间上的下确界
ˆ ˆ inf P 1 2



为该区间的置信系数. 一个区间估计的置信度越大越好. 为了计算置信度和置信系数,需要利用 统计量的精确分布或者渐近分布.
ˆ1 ( X ) g ˆ1 ( X1, , X n ), g ˆ2 ( X ) g ˆ 2 ( X1 , , X n ) g
是定义在样本空间上,取值在上的两个统计量,且
ˆ1 ( X ) g ˆ2 ( X ) g ˆ1 ( X ), g ˆ 2 ( X )]为g ( )的一个区间估计. 则称随机区间[ g
4.1 区间估计的基本概念 4.1.1 参数的区间估计问题 估计你的年龄 八成在25-30岁之间 被估参数 可靠度 范围、区间 区间:越小越好
3
可靠度:越大越好
在估计湖中鱼数的问题中,若根据 一个实际样本,得到鱼数 n 的极大似 然估计为1000条. 实际上,n 的真值可能大于1000条, 也可能小于1000条. 为此, 希望确定一个区间 来估计参数真值
4
a 使我们能以比较高的可靠程度相信它 包含参数真值. 湖中鱼数的真值 [ ]
这里所说的“可靠程度”是用概率来度量的
b 区间估计的精度要高.
5
定义4.1.1设有一个参数分布族F { f ( x, ), }, g ( )是定义在参数空间上的一个已知函数, X ( X 1 , , X n )是从分布族中某总体f ( x, )中抽取的 样本.令
19
ˆ ( X )和 ˆ ( X )是定义在样本空间 定义4.1.4:设 L U
上,在参数空间上取值的两个统计量,若对 任给的0 1, 有
ˆ ( X ) 1-,一切 P
ˆ ( X ) 1-,一切 P L

U
6
根据这个定义,从形式上看,任何一个满足条件
ˆ1 ( X ) g ˆ2 ( X ) g
ˆ1 ( X ),g ˆ 2 ( X )都可以构成g ( )的一个 的统计量g ˆ1 ( X ),g ˆ 2 ( X )] 区间估计[g
既然一个未知参数的区间估计有很多种, 如何从中挑选一个好的区间估计? 评价标准:可靠度与精度(精确度)
(2)对给定的0 1, P S ( X ) 1
则称S ( X )是的置信水平为1-的置信域或置信集.
称 inf P S ( X ) 为置信系数.

24
4.1.5 构造区间估计的方法 Neyman置信区间 枢轴变量法:基于点估计构造枢轴变量. 利用假设检验构造置信区间.
25
定义4.1.5:设有一个参数分布族F { f ( x, ), }, 是参数空间,其中 (1 , , k ) Rk , k 2. X ( X 1 , , X n )是来自分布族中某总体f ( x, ) 的样本.若S ( X )满足
(1)对任一样本X , S ( X )是的一个子集;
相关文档
最新文档