概率论与数理统计 第7章.ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

即 S 2是 2 的无偏估计,故通常取S 2作 2的估计量.
例3 设总体 X 服从参数为 的指数分布, 概率密度
x 1 e , f ( x; ) 0,
x 0, 其他.
其中参数 0, 又设 X 1 , X 2 ,, X n 是来自总体 X 的 样本, 试证 X 和 nZ n[min( X 1 , X 2 ,, X n )] 都是 的无偏估计.
行到其中有15只失效时结束试验, 测得失效时 间(小时)为115, 119, 131, 138, 142, 147, 148, 155,
158, 159, 163, 166, 167, 170, 172.
试求电池的平均寿命 的最大似然估计值 .

n 50, m 15,
s( t15 ) 115 119 170 172 (50 15) 172
总体 X 的 k 阶矩 k E ( X k )的相合估计量, 进而若待估参数 g( 1 , 2 ,, n ), 其中g 为连续 ˆ g( 函数, 则 的矩估计量 ˆ1 , ˆ 2 , , ˆ n ) g( A1 , A2 ,
, An ) 是 的相合估计量.
第三节
估计量的评选标准
一、问题的提出
二、无偏性 三、有效性 四、相合性 五、小结
一、问题的提出
从前一节可以看到, 对于同一个参数, 用不 同的估计方法求出的估计量可能不相同. 而且, 很明显, 原则上任何统计量都可以作为未知参数 的估计量. 问题 (1)对于同一个参数究竟采用哪一个估计量好? (2)评价估计量的标准是什么? 下面介绍几个常用标准.
如果不能得到完全样本, 就考虑截尾寿命试验.
3. 两种常见的截尾寿命试验
(1) 定时截尾寿命试验
假设将随机抽取的 n 个产品在时间 t 0 时 同时投入试验 , 试验进行到事先规定的 截尾时 间 t0 停止, 如试验截止时共有 m 个产品失效, 它们的失效时间分别为 0 t1 t 2 t m t0 , 此时 m 是一个随机变量, 所得的样本 t1 , t 2 , , t m 称为定时截尾样本 .
证Hale Waihona Puke 因为 X1 , X 2 ,, X n 与 X 同分布,
故有 E ( X ik ) E ( X k ) k , i 1,2,, n.
1 n 即 E ( Ak ) E ( X ik ) k . n i 1
故 k 阶样本矩 Ak 是 k 阶总体矩 k 的无偏估计.
四、相合性
ˆ ˆ ( X 1 , X 2 , , X n ) 为参数的估计量, 若 ˆ ( X 1 , X 2 , , X n ) 若对于任意 , 当n 时, ˆ 为 的相合估计量. 依概率收敛于 , 则称
例如 由第六章第二节知 , 样本 k ( k 1)阶矩是
n 1 1 n 2 2 2 又 B2 ( X i X ) ( X i 2 X i X X ) n i 1 n i 1
1 n 2 X i X 2 A2 X 2 , n i 1 ( A2是样本二阶原点矩 )
特别的:
不论总体 X 服从什么分布,
只要它的数学期望存在,
X 总是总体 X 的数学期望 1 E ( X ) 的无偏 估计量.
例2
对于均值 , 方差 2 0 都存在的总体, 若
n 1 , 2 均为未知, 则 2 的估计量 ˆ 2 ( X i X )2 n i 1
8270,
的最大似然估计值为
8270 ˆ 551.33 (小时). 15
三、小结
定时截尾寿命试验 两种常见的截尾寿命试验 定数截尾寿命试验
s( t 0 ) ˆ 定时截尾样本的最大似然估计: , m s( t m ) ˆ . 定数截尾样本的最大似然估计: m
ti

其余 n m 个产品寿命超过tm 的概率为
t 1 m e dt ( e ) n m , tm 上述观察结果出现的概率近似地为
t n m
t1 t2 tm tm n 1 1 1 n m e dt1 e dt 2 e dt m (e ) m
例5 试证 : 样本均值 X 是总体均值 的相合估计
n 1 2 量, 样本方差 S 2 X X 及样本的二阶 i n 1 i 1
1 n 2 中心矩 B2 X i X 都是总体方差 2 的相合 n i 1 估计量. 证明 由大数定律知,
1 n 0, 有 lim P X i 1, n n i 1 1 n 所以 X X i 是 的相合估计量. n i 1


.
对数似然函数为
ln L( ) m ln [t1 t 2 t m ( n m )t m ], 1

d 令 ln L( ) 0, d
则 m


1

2
[t1 t 2 t m ( n m )t m ] 0,
s( t m ) ˆ . 得到 的最大似然估计值为 m 其中 s( t m ) t1 t 2 t m ( n m )t m 称为总
二、无偏性
若 X1 , X 2 ,, X n 为总体 X 的一个样本,
是包含在总体 X 的分布中的待估参数, ( 是 的取值范围 )
ˆ ( X 1 , X 2 ,, X n ) 的数学期望 若估计量 ˆ ) 存在, 且对于任意 有 E ( ˆ ) , 则称 E ( ˆ 是 的无偏估计量.


.
的最大似然估计值为
s( t 0 ) ˆ , m
其中 s( t0 ) t1 t 2 t m ( n m )t0 称为总 试验时间, 它表示直到时刻t0 为止 n 个产品的 试验时间的总和 .
例 设电池的寿命服从指数分布,
1 t e , t 0, 其概率密度为 f ( t ) 0 未知. 0, t 0, 随机地取50只电池投入寿命试验, 规定试验进
证明
因为 E ( X ) E ( X ) ,
所以 X 是 的无偏估计量.
而 Z min( X 1 , X 2 ,, X n ) 服从参数为 的指数分布, n n nx e , x 0, 概率密度 fmin ( x; ) 0, 其他. 故知 E ( Z ) , n
第二节 基于截尾样本的最 大似然估计
一、基本概念 二、基于截尾样本的最大似然估计 三、小结
一、基本概念
1. 寿命分布的定义
产品寿命T 是一个随机变量,它的分布称为寿 命分布.
2. 完全样本的定义
将随机抽取的n 个产品在时间t 0 时, 同时 投入试验直到每个产品 都失效. 记录每一个产 品的失效时间 , 这样得到的样本(即由所有产品 的失效时间 0 t1 t 2 t n 所组成的样本) 叫完全样本. (一种典型的寿命试验)
(2) 定数截尾寿命试验
假设将随机抽取的 n 个产品在时间 t 0 时 同时投入试验 , 试验进行到有 m 个( m 是事先规 定的, m n) 产品失效时停止, m 个产品的失效 时间分别为 0 t1 t 2 t m , 这里 t m 是第m 个产品的失效时间, 所得的样本 t1 , t 2 , , t m 称 为定数截尾样本 .
利用这一样本估计未知 参数 (产品的平均寿命 ).
在时间区间[0, tm ] 有 m 个产品失效, 有 n m 个产品的寿命超过tm .
利用最大似然估计法来估计 ,
为了确定似然函数, 观察上述结果出现的概率.
产品在 ( t i , t i dt i ] 失效的概率近似地为 f ( t i )dt i e dt i , i 1, 2,, m . 1
试验时间, 它表示直到时刻t m 为止 n 个产品的 试验时间的总和 .
2. 定时截尾样本的最大似然估计
设定时截尾样本 0 t1 t2 tm t0 ,
( 其中 t0 是截尾时间) 与上面讨论类似,
得似然函数为 L( ) 1 me
1 [ t1 t 2 t m ( n m ) t 0 ]
第四节区间估计一区间估计的基本概念二典型例题三小结一区间估计的基本概念确定的两个统计量若由样本对于给定值含有一个未知参的分布函数设总体为置信度的置信下限和置信上限的双侧置信区间分别称为置信度为的置信区的置信度为是随机的而区间没有随机性但它是一个常数虽然未知被估计的参数的本质是因此定义中下表达式而不能说参数的真值的概率包含着参数还可以描述为另外定义中的表达式每个样本值确定一个区按伯努利大数定理在这样多的区间中不包含的约占真值的约占包含的真值的真值或不包含每个这样的区间或包含1000001101000真值的约为个区间中不包含则得到的且不依赖于任何未知参的分布已知并且其中仅包含待估参数的函数寻求一个样本的置信区间的一个置信度为那么都是统计量其中不等式得到等价的若能从区间估计精度降低可信程度增大间长度增大置信区增大置信水平固定样本容量区间估计精度提高可信程度不变间长度减小置信区增大样本容量固定置信水平为未知为已知其中的样本是来自正态总体的置信区间的一个置信水平为于是得这样的置信区间常写成19616的置信区间得一个置信水平为由一个样本值算得样本均值的观察值的置信水平也是的置信区间是不唯一的置信水平为注意显然置信区间短表示估计的精度高
是 有偏的(即不是无偏估计). n 1 证 ˆ 2 X i2 X 2 A2 X 2 , n i 1 因为 E ( A2 ) 2 2 2 ,
又因为 E ( X 2 ) D( X ) [ E ( X )]2
2 2
2
n
2,
2
所以 E ( ˆ ) E ( A2 X ) E ( A2 ) E ( X )
无偏估计的实际意义: 无系统误差.
例1
设总体 X 的 k 阶矩 k E ( X k ) ( k 1)存在,
又设 X 1 , X 2 ,, X n 是 X 的一个样本,试证明不 论 1 n k 总体服从什么分布 , k 阶样本矩 Ak X i 是 k n i 1 阶总体矩 k 的无偏估计.
例4
(续例3)
试证当 n 1时, 的无偏估计量 X 较 nZ 有效.
证明
由于 D( X ) 2 ,
故有 D( X )
2
n
,
又因为 D( Z )
当n 1时,
2
n
, 2
故有 D(nZ ) 2 ,
D( nZ ) D( X ),
故 的无偏估计量 X 较 nZ 有效.


E ( nZ ) ,
所以 nZ 也是 的无偏估计量.
由以上两例可知,一个参数可以有不同的无 偏估计量.
三、有效性
ˆ1 和 ˆ2 , 如果 比较参数 的两个无偏估计量 ˆ1 的观察值在真值 在样本容量 n 相同的情况下 , ˆ2 更密集 , 则认为 ˆ1 较 ˆ2 有效 . 的附近较
二、基于截尾样本的最大似然估计
设产品的寿命分布是指数分布,
1 t e , t 0, 0 未知. 其概率密度是 f ( t ) 0, t 0,
1. 定数截尾样本的最大似然估计
设有n个产品投入定数截尾试验, 截尾数为m,
得定数截尾样本 0 t1 t 2 tm ,
由于方差是随机变量取值与其数学期望的 偏离程度, 所以无偏估计以方差小者为好.
ˆ1 ˆ1 ( X 1 , X 2 ,, X n )与 ˆ2 ˆ2 ( X 1 , X 2 ,, X n ) 设 ˆ1 ) D( ˆ2 ), 都是 的无偏估计量, 若有 D( ˆ1较 ˆ2有效. 则称
n 1 [ t1 t2 tm ( n m ) tm ] me dt1dt 2 dt m , m 其中dt1 , dt 2 , , dt m 为常数.
1
取似然函数为 L( ) 1 me
1 [ t1 t 2 t m ( n m ) t m ]
n 1 2 2 2 , 所以 ˆ 是有偏的. n n 若以 乘 偏的. ˆ 2 , 所得到的估计量就是无 n 1
(这种方法称为无偏化).
n n 2 E E ( ˆ ˆ 2) 2. n 1 n 1 n 1 n 2 2 2 ( X X ), 因为 S ˆ i n 1 i 1 n 1
相关文档
最新文档