10.2 参数bootstrap方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ )中产生容量为n的样本: 在F ( x;
* * * ˆ ). X1 , X2 ,, X n ~ F ( x;
这种样本可以产生很多 个, 例如产生 B个( B 1000),
就可以利用这些样本对总体进行统计推断 ,
其做法与非参数 bootstrap 方法一样. 这种方法称为参 数 bootstrap 方法.
二、典型例题
例1 已知某种电子元件的寿命(以小时计)服从韦
布尔分布,其分布函数为
1 e F ( x) 0,
( x )
, x0
0, 0 . 其他,
概率密度为
f ( x) 0,
1 ( x ) x 0 , x e
按X 100.0696 lnU 产生韦布尔分布的随机数.
12
ˆ ) F ( x ,100.0696)为分布函数 , 以F ( x ,
产生5000个容量为10的bootstrap 样本:
样本1 x , x ,, x , 得的bootstrap 估计
*1 2 ( x i ) 10
*1 1
*1 2
*1 10
* 1
i 1
10
样本5000 x
* 1
5000
,x
* 5000 2
* 5000 ,, x10 , 得的bootstrap 估计
* 5000
* 5000 2 ( x i ) i 1
10
10
将以上5000个i* 自小到大排序,
* ˆ 得 ( 250) 73.25736 , 取左起第250位,
ˆ(*50) , ˆ(*950) ) (0.0364, 0.4266)为的置信水平为 取(
0.90的bootstrap 置信区间 .
三、小结
参数bootstrap 方法
ˆ; 1. 利用样本x求出的最大似然估计 ˆ ) 代替F , 在 F ( x , ˆ ) 中得到数 2. 以 F ( x ,
其他,
已知参数 2. 今有样本
142.28 97.04 32.46 69.14 85.67 114.43 41.76
163.07 108.22 63.28
(1)确定参数的最大似然估计.
( 2)对于时刻t0 50 , 求可靠性 R(50) 1 F (50)
e
( 50 ) 2
ˆ(*500) 79.03652 . 取左起第500位得
于是在t 50时, 可靠性R(50)的置信水平为0.95的
bootstrap单侧置信下限为
e
ˆ(*250) )2 ( 50
0.6276 .
在t 50时, 可靠性R(50)的置信水平为0.90的
bootstrap单侧置信下限为
血型 人数
M 342
MN 500
N 187 共1029
ˆ; (1)求的最大似然估计
( 2)求θ的置信水平为0.90的bootstrap置信区间.
解 具有血型M , MN , N的人数分别为x1 , x2 , x3,
记x1 x2 x3 n.
L (1 )
似然函数为
2 x1
(2)先产生韦布尔分布的随机函数. 设U ~ U (0,1),
令U 1 e
( X )2 12 ln( 1 U ) . , 解得 X
因1 U ~ U (0,1), 故 X ln U 1 2 ,
也具有参数 2 ,的韦布尔分布.
ˆ 100.0696作为, 以
解得
代入数据x1 342 , x2 500, x3 187,
n 1029 ,
ˆ 0.4247 . 得到
ˆ代替, 得到(1 )2 0.331, 以
2 (1 ) 0.489 ,
2 0.180 .
于是血型的近似分布律为
血型
概率
M
0.331
MN
0.489
n
2
,
1 n 2 ln L C 2n ln 2 xi , i 1
C为常数 .
2 x i i 1 n
d 2n 2 n 2 3 xi 0, 令 ln L 0得 ˆ i 1 d
n
.
ˆ 100.0696 ; 以数据带入得的最大似然估计为
的置信水平分别为 0.95, 0.90的bootstrap单
侧置信下限 .
解 (1)设有样本x1 , x2 ,, xn ,
似然函数为
2,
n (
L
i 1
n
2
2 xi e
( xi )2
2 2 n xi e i 1
n
i 1
xi2 )
据样本 x * ;
3. 计算 R( x ) 的均值或中位数 .
*
第二节 参数bootstrap 方法
一、参数bootstrap 方法 二、典型例题 三、小结
一、参数bootstrap 方法
假设总体的分布函数 F ( x; ) 的形式已知,
但其中包含未知参数 ( 可以是向量).
已知有一个来自F ( x; )的样本:
X 1 , X 2 ,, X n , ˆ. 求的最大似然估计 ˆ代替得到F ( x; ˆ ). 在F ( x; )中以
2 (1 )
x2
2 x3
2 x2 x2 2 x3 (1 )2 x1 x2 ,
ln L x 2 ln 2 ( x2 2 x3 ) ln ( 2 x1 x2 ) ln(1 ).
令
d x2 2 x3 ( 2 x1 x2 ) 0 ln L d 1 x2 2 x3 x2 2 x3 , ˆ 2n 2 x1 2 x2 2 x3
e
ˆ(*500) )2 ( 50
0.6702 .
例2 据Hardy Weinberg定律, 若基因频率处于平
衡状态, 则在一总体中个体具有 血型M、MN、N
的概率分别是(1 )2 , 2 (1 ), 2 , 其中0 1.
据1937年对香港地区的调查有以下数据:
N百度文库
0.180
根据以上分布律产生1000个bootstrap 样本,
* ˆ* * ˆ ˆ 从而得到 的1000个bootstrap 估计1 , 2 ,,1000.
将这1000个数按自小到大的次序排序得到
* * * * * ˆ ˆ ˆ ˆ ˆ (1) (2) (50) (950) (1000).