Weibull分布的渐进区间型截尾数据的参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 20卷 第 3期
黑 龙 江 科 技 学 院 学 报
Vol. 20 No. 3
2010年 5月
Journal of Heilongjiang Institute of Science & Technology
M ay 2010
文章编号 : 1671- 0118 (2010) 03- 0242- 05
243
未见有文献报道 ,然而 ,此类数据又确实存在于产品 售后服务的统计数据 、医药统计数据等实际生活之 中 。在不完全信息的情况下 ,对于它们的研究有利 于人们进行医疗效果 、产品质量等的客观评估 。
1 预备知识
W eibull分布被广泛地应用于可靠性分析之中 ,
二参数 W eibull分布的概率密度函数为
m
∏ L (ν, β) =A
exp
-
Li ν
β
- exp
-
Ri ν
β
× k i
i =1
exp
-
Ri ν
β
ri
,
其中 , A = n! / ( k1 ! k2 ! …km ! r1 ! r2 ! … rm ! ) 。相 应的对数似然函数为
∑m
ln L (ν,β)∝
ki ·ln exp
-
Li ν
β
-
i =1
收稿日期 : 2010 - 03 - 22 作者简介 : 苑延华 (1969 - ) ,女 ,辽宁省本溪人 ,副教授 ,硕士 ,研究方向 :运筹学与控制论 , E2mail: yuanhua_69@ sina. com。
第 3期
苑延华 : W eibull分布的渐进区间型截尾数据的参数估计
W eibull分布的渐进区间型截尾数据的参数估计
苑延华
(黑龙江科技学院 理学院 , 哈尔滨 150027)
摘 要 : 不完全统计数据的分析是当前估计问题中重要的研究对象之一 ,特别是关于区间型
截尾数据的寿命分析 。针对一类源于 W eibull总体的渐进区间型截尾数据提出一种新的迭代算
法 。算例仿真结果表明 :此类数据应用最大似然估计法所得结果不可靠 ,而应用文中提出的迭代算
m-1
∑ 失效 ,并将余下的 rm = n - km -
( ki + ri ) 个个体
i =1
都终止实验 。
例如 , 在某一生产线上生产出来的汽车在销售
过程中无法同时进入消费领域 ,于是到观察结束时 ,
仍未返厂的零件就相当于某个区间内的失效个体 ,
对于已失效的零件一般只记录其失效发生在哪个时
间区间里 。汽车重要零配件售后服务的统计数据就
பைடு நூலகம்
关于 ν的方程 :
m
∑
i =1
ν
Li
·ki
·
lnβL(νi )
+
ν
Ri
·
lnβR(νi )
·
ri + ki exp
Li
β(ν)
ν
-
Ri
β(ν)
ν
1 - exp
Li
β(ν)
ν
-
Ri
β(ν)
ν
= 0。
由计算过程可见 , 似然方程的求解是非常复杂
的 ,尽管存在着非线性方程组求解的数值算法 ,但其
Key words: p rogressively interval censored data; W eibull distribution; survival function; iteration al2 go rithm
0 引 言
可靠性分析在工程 、农业 、医药和社会统计学研 究中有着重要的应用 。1953 年 ,美国的 Lesser博士 给出了可靠性的定义 。随后 ,可靠性研究引起世界 上众多专家学者的关注 , 研究成果丰富 , 应用广 泛 [ 1 - 3 ] 。从研究对象上讲 ,可分为对完全数据 (每 个样本的寿命都是观察得到的 )和不完全数据 (部
f (x) =
ν β
x
β
ν-
1
exp
-
ν
x
β
, x > 0,
0, x≤0,
分布函数为
ν
F (x) =
1 - exp
-
x
β
, x > 0,
0, x≤0。
与二参数 W eibull分布对应的风险函数为
h ( x)
=
1
f -
( x) F(
x)
=
ν x ν- 1 ββ , 0, x≤0,
x > 0,
生存函数为
-
ν
Ri
)
Ri
β
ν
-
Li ν
β
·exp
ν
Ri
β
-
Li ν
β
exp
Ri
β
ν
-
Li ν
β
- 1 2 ·νβ-ν- 1 ,
根据 β > 0,ν> 0 和 L i ≥R i - 1 , R i > L i , i = 2, 3, …, m ,
可知 任 意 取 定 ν时 ,
9f (ν,β) 9β
< 0 成立, 即函数
法 ,能有效地估计总体参数 。该算法收敛速度快 ,可靠性高 。
关键词 :渐进区间型截尾数据 ; W eibull分布 ; 生存函数 ; 迭代算法
中图分类号 : O213
文献标志码 : A
Estim a tions of pa ram e te rs of W e ibull distribution w ith p rogre ssive ly inte rva l censo red da ta
具有这样的特征 。
2 参数的点估计
对基于渐进区间截尾数据的 W eibull分布参数 的最 大 似 然 估 计 进 行 推 导 , 记 X1∶1∶m ∶n , …, X1∶k1∶m ∶n , X2∶1∶m ∶n , …, X2∶k2∶m ∶n , …, Xm ∶1∶m ∶n , …, Xm ∶km 是 ∶m ∶n 来自二 参数 W eibull分布的渐进区间截尾样本 ,带有截尾方 案 r = ( r1 , r2 , …, rm ) ,其中 , Xi∶j∶m ∶n表示在容量为 n 的 样本中 ,共有 m 个不交叠的观测区间 ,该个体是落到 第 i个观测区间 (Li , Ri ]里的第 j( j = 1, 2, …, ki )个个 体 。对应的似然函数为
ν
S ( x) =1 - F ( x) =
exp
-
x
β
, x > 0,
0, x≤0。
(1) 其中 ,β> 0是尺度参数 ,ν> 0是形状参数 。当 0 <ν< 1时 , W eibull分布有一个渐低的风险 ; 当 ν > 1 时 , W eibull分布有一个渐高的风险 ;当 ν= 1时 , W eibull
f (ν,β)是关于 β严格单调减的 。此外 ,由
m
∑ lim f (ν,β) =
β→0
i =1
(
ki
ν
Li
+
ri
ν
Ri
)
> 0,
lim f (ν,β) = - ∞ > 0
β→ + ∞
可知 ,“对于取定的 ν,由式 ( 2)可得 β的唯一解 ”结
论正确 ,不妨记为 β^ =β(ν) , 将其带入方程 ( 3)可得
YUAN Yanhua (College of Science, Heilongjiang Institute of Science & Technology, Harbin 150027, China)
Abstract: The incomp lete data analysis p resents one of the important subjects in the statistical analy2 sis of life data, especially on the life analysis of the interval censored data. This paper p roposes a new it2 eration algorithm in order to analyze a type of p rogressively interval censored data com ing from W eibull2 population. A simulation examp le show s that the p roposed iteration algorithm , capable of the effective es2 tim ation of param eters of population exhibits the advantages of faster convergent speed and higher reliabil2 ity, in comparison w ith the m axim um likelihood estimation which fails to be reliable for this p rogressively interval censored data.
exp
-
Ri ν
β
+ ri ·
-
Ri ν
β
,
可得关于 β和 ν的似然方程为 :
∑ 9 ( ln L (ν,β) ) 9β
=
m i =1
ν
ri Ri +
ki · Lνi ·exp
-
Li ν
β
-
Rνi ·exp
-
Ri ν
β
exp
-
Li ν
β
- exp
-
Ri ν
β
·
νβ-ν- 1 = 0,
(2)
∑ 9 ( ln L (ν,β) ) 9ν
分布退化为指数分布 ,其风险函数为常函数。
文中主要讨论渐进区间型截尾数据的参数估计
问题 。所谓渐进区间型截尾数据是指 :在初始时刻
有 n个个体在实验观察中 , 在时间区间 (L1 , R1 ]内
有 k1 个个体失效 , 但它们的具体失效时间未知 , 同
时随机选出 r1 个幸存个体终止实验 。接着在时间
区间 (L2 , R2 ]内观察到 k2 个个体失效 , 且它们的具
体失效时间未知 ,再同时随机选出 r2 个幸存个体终
止实验 ,这里 L2 ≥R1 。这样继续下去直到第 m 个时
间区间 (Lm , Rm ]的终点时刻 Rm 到来 (其 中 , L i ≥
R i - 1 , R i >L i , i = 2, 3, …, m ) , 此时观察到 km 个个体
-
Li
β
ν
-
Ri ν
β
·
ln
Ri
β
1 - exp
-
Li
β
ν
-
Ri ν
β
= 0,
(3) 似然估计 β^和 ν^就可通过解似然方程 ( 2 ) 和 ( 3 )
244
黑 龙 江 科 技 学 院 学 报 第 20卷
得到 。
由式 ( 2) ,令
f (ν, β) =
分或全部个体的寿命值未知 ,却知道发生在哪个时 间范围里 )的研究 ;从估计方法上可分为参数估计 、 非参数估计和半参数估计 [ 4 - 6 ] 。目前 ,对于不完全 数据的估计国内学者主要集中在定时截尾 、随机截 尾 、区间截尾 ( I、II型 ) 数据类型的估计理论研究 上 [ 7 - 11 ] ,并对其在各领域的实际应用 作了 深入 探 索 。国外学者进一步提出渐进截尾数据的统计推 断 [ 12 - 14 ] ,从估计理论到实际应用 ,成果斐然 。笔者 在上述基础上提出的渐进区间型截尾数据样本类型
∑m
i =1
riRνi + k i·
Lνi ·exp exp -
-
Li
β
ν
- Rνi·exp
Li
β
ν
- exp
-
Ri
β
Ri
β
ν
ν
=
∑m
νν
kiL i + riR i +
i =1
exp
ki (Lνi - Rνi )
ν
ν
Ri
β
-
Li
β
, -1
则
∑ 9f (ν, β) 9β
=
m i =1
ki
(Lνi
收敛速 度 和 收 敛 点 的 全 局 性 往 往 都 是 该 算 法 的
弱点 。
3 参数的频率估计
利用生存函数的频率估计值构造回归方程 , 利
用回归法进行参数估计 。为了简化讨论 , 不妨设 m
个观察窗口为 (L i - 1 , li ] ( i = 1, 2, …, m ) , 样本寿命
X1 , X2 , …, Xn 中有 ki 个落在这个区间内 , 另有随机
=
-
m i =1
ri ·ln
Ri
β
-
Li
β
ν
·ki ·ln
Li
β
+
Ri
β
ν
· ( ri + ki ) ·
Ri
β
ν
·
exp
Li
β
ν
-
Ri
β
ν
·ln
Ri
β
1 - exp
Li
β
ν
-
Ri ν
β
,
化简为
m
∑
ν
Li
·ki
·ln
Ri
β
+
ν
Ri
·ri
·ln
Li
β
-
ν
Ri
·
(
ri
+ ki ) ·
i =1
exp
P{ Yi
= yi }
= Cy i ri
m
∑ 选出的 ri 落于 ( li , + ∞) ,满足 n =
( ki + ri ) 。
i =1
定义生存函数式 ( 1 )在点 li ( i = 1, 2, …, m ) 处
的频率估计值 :设 Yi 表示 ri 个右截尾数据在区间段 ( li , lt ] ( i = 1, 2, …, j; t = j + 1, j + 2, …, m; j <m )内失 效的个体的个数 , 则 Yi = yi ( 0 ≤ yi ≤ ri ) 发生的概 率为
黑 龙 江 科 技 学 院 学 报
Vol. 20 No. 3
2010年 5月
Journal of Heilongjiang Institute of Science & Technology
M ay 2010
文章编号 : 1671- 0118 (2010) 03- 0242- 05
243
未见有文献报道 ,然而 ,此类数据又确实存在于产品 售后服务的统计数据 、医药统计数据等实际生活之 中 。在不完全信息的情况下 ,对于它们的研究有利 于人们进行医疗效果 、产品质量等的客观评估 。
1 预备知识
W eibull分布被广泛地应用于可靠性分析之中 ,
二参数 W eibull分布的概率密度函数为
m
∏ L (ν, β) =A
exp
-
Li ν
β
- exp
-
Ri ν
β
× k i
i =1
exp
-
Ri ν
β
ri
,
其中 , A = n! / ( k1 ! k2 ! …km ! r1 ! r2 ! … rm ! ) 。相 应的对数似然函数为
∑m
ln L (ν,β)∝
ki ·ln exp
-
Li ν
β
-
i =1
收稿日期 : 2010 - 03 - 22 作者简介 : 苑延华 (1969 - ) ,女 ,辽宁省本溪人 ,副教授 ,硕士 ,研究方向 :运筹学与控制论 , E2mail: yuanhua_69@ sina. com。
第 3期
苑延华 : W eibull分布的渐进区间型截尾数据的参数估计
W eibull分布的渐进区间型截尾数据的参数估计
苑延华
(黑龙江科技学院 理学院 , 哈尔滨 150027)
摘 要 : 不完全统计数据的分析是当前估计问题中重要的研究对象之一 ,特别是关于区间型
截尾数据的寿命分析 。针对一类源于 W eibull总体的渐进区间型截尾数据提出一种新的迭代算
法 。算例仿真结果表明 :此类数据应用最大似然估计法所得结果不可靠 ,而应用文中提出的迭代算
m-1
∑ 失效 ,并将余下的 rm = n - km -
( ki + ri ) 个个体
i =1
都终止实验 。
例如 , 在某一生产线上生产出来的汽车在销售
过程中无法同时进入消费领域 ,于是到观察结束时 ,
仍未返厂的零件就相当于某个区间内的失效个体 ,
对于已失效的零件一般只记录其失效发生在哪个时
间区间里 。汽车重要零配件售后服务的统计数据就
பைடு நூலகம்
关于 ν的方程 :
m
∑
i =1
ν
Li
·ki
·
lnβL(νi )
+
ν
Ri
·
lnβR(νi )
·
ri + ki exp
Li
β(ν)
ν
-
Ri
β(ν)
ν
1 - exp
Li
β(ν)
ν
-
Ri
β(ν)
ν
= 0。
由计算过程可见 , 似然方程的求解是非常复杂
的 ,尽管存在着非线性方程组求解的数值算法 ,但其
Key words: p rogressively interval censored data; W eibull distribution; survival function; iteration al2 go rithm
0 引 言
可靠性分析在工程 、农业 、医药和社会统计学研 究中有着重要的应用 。1953 年 ,美国的 Lesser博士 给出了可靠性的定义 。随后 ,可靠性研究引起世界 上众多专家学者的关注 , 研究成果丰富 , 应用广 泛 [ 1 - 3 ] 。从研究对象上讲 ,可分为对完全数据 (每 个样本的寿命都是观察得到的 )和不完全数据 (部
f (x) =
ν β
x
β
ν-
1
exp
-
ν
x
β
, x > 0,
0, x≤0,
分布函数为
ν
F (x) =
1 - exp
-
x
β
, x > 0,
0, x≤0。
与二参数 W eibull分布对应的风险函数为
h ( x)
=
1
f -
( x) F(
x)
=
ν x ν- 1 ββ , 0, x≤0,
x > 0,
生存函数为
-
ν
Ri
)
Ri
β
ν
-
Li ν
β
·exp
ν
Ri
β
-
Li ν
β
exp
Ri
β
ν
-
Li ν
β
- 1 2 ·νβ-ν- 1 ,
根据 β > 0,ν> 0 和 L i ≥R i - 1 , R i > L i , i = 2, 3, …, m ,
可知 任 意 取 定 ν时 ,
9f (ν,β) 9β
< 0 成立, 即函数
法 ,能有效地估计总体参数 。该算法收敛速度快 ,可靠性高 。
关键词 :渐进区间型截尾数据 ; W eibull分布 ; 生存函数 ; 迭代算法
中图分类号 : O213
文献标志码 : A
Estim a tions of pa ram e te rs of W e ibull distribution w ith p rogre ssive ly inte rva l censo red da ta
具有这样的特征 。
2 参数的点估计
对基于渐进区间截尾数据的 W eibull分布参数 的最 大 似 然 估 计 进 行 推 导 , 记 X1∶1∶m ∶n , …, X1∶k1∶m ∶n , X2∶1∶m ∶n , …, X2∶k2∶m ∶n , …, Xm ∶1∶m ∶n , …, Xm ∶km 是 ∶m ∶n 来自二 参数 W eibull分布的渐进区间截尾样本 ,带有截尾方 案 r = ( r1 , r2 , …, rm ) ,其中 , Xi∶j∶m ∶n表示在容量为 n 的 样本中 ,共有 m 个不交叠的观测区间 ,该个体是落到 第 i个观测区间 (Li , Ri ]里的第 j( j = 1, 2, …, ki )个个 体 。对应的似然函数为
ν
S ( x) =1 - F ( x) =
exp
-
x
β
, x > 0,
0, x≤0。
(1) 其中 ,β> 0是尺度参数 ,ν> 0是形状参数 。当 0 <ν< 1时 , W eibull分布有一个渐低的风险 ; 当 ν > 1 时 , W eibull分布有一个渐高的风险 ;当 ν= 1时 , W eibull
f (ν,β)是关于 β严格单调减的 。此外 ,由
m
∑ lim f (ν,β) =
β→0
i =1
(
ki
ν
Li
+
ri
ν
Ri
)
> 0,
lim f (ν,β) = - ∞ > 0
β→ + ∞
可知 ,“对于取定的 ν,由式 ( 2)可得 β的唯一解 ”结
论正确 ,不妨记为 β^ =β(ν) , 将其带入方程 ( 3)可得
YUAN Yanhua (College of Science, Heilongjiang Institute of Science & Technology, Harbin 150027, China)
Abstract: The incomp lete data analysis p resents one of the important subjects in the statistical analy2 sis of life data, especially on the life analysis of the interval censored data. This paper p roposes a new it2 eration algorithm in order to analyze a type of p rogressively interval censored data com ing from W eibull2 population. A simulation examp le show s that the p roposed iteration algorithm , capable of the effective es2 tim ation of param eters of population exhibits the advantages of faster convergent speed and higher reliabil2 ity, in comparison w ith the m axim um likelihood estimation which fails to be reliable for this p rogressively interval censored data.
exp
-
Ri ν
β
+ ri ·
-
Ri ν
β
,
可得关于 β和 ν的似然方程为 :
∑ 9 ( ln L (ν,β) ) 9β
=
m i =1
ν
ri Ri +
ki · Lνi ·exp
-
Li ν
β
-
Rνi ·exp
-
Ri ν
β
exp
-
Li ν
β
- exp
-
Ri ν
β
·
νβ-ν- 1 = 0,
(2)
∑ 9 ( ln L (ν,β) ) 9ν
分布退化为指数分布 ,其风险函数为常函数。
文中主要讨论渐进区间型截尾数据的参数估计
问题 。所谓渐进区间型截尾数据是指 :在初始时刻
有 n个个体在实验观察中 , 在时间区间 (L1 , R1 ]内
有 k1 个个体失效 , 但它们的具体失效时间未知 , 同
时随机选出 r1 个幸存个体终止实验 。接着在时间
区间 (L2 , R2 ]内观察到 k2 个个体失效 , 且它们的具
体失效时间未知 ,再同时随机选出 r2 个幸存个体终
止实验 ,这里 L2 ≥R1 。这样继续下去直到第 m 个时
间区间 (Lm , Rm ]的终点时刻 Rm 到来 (其 中 , L i ≥
R i - 1 , R i >L i , i = 2, 3, …, m ) , 此时观察到 km 个个体
-
Li
β
ν
-
Ri ν
β
·
ln
Ri
β
1 - exp
-
Li
β
ν
-
Ri ν
β
= 0,
(3) 似然估计 β^和 ν^就可通过解似然方程 ( 2 ) 和 ( 3 )
244
黑 龙 江 科 技 学 院 学 报 第 20卷
得到 。
由式 ( 2) ,令
f (ν, β) =
分或全部个体的寿命值未知 ,却知道发生在哪个时 间范围里 )的研究 ;从估计方法上可分为参数估计 、 非参数估计和半参数估计 [ 4 - 6 ] 。目前 ,对于不完全 数据的估计国内学者主要集中在定时截尾 、随机截 尾 、区间截尾 ( I、II型 ) 数据类型的估计理论研究 上 [ 7 - 11 ] ,并对其在各领域的实际应用 作了 深入 探 索 。国外学者进一步提出渐进截尾数据的统计推 断 [ 12 - 14 ] ,从估计理论到实际应用 ,成果斐然 。笔者 在上述基础上提出的渐进区间型截尾数据样本类型
∑m
i =1
riRνi + k i·
Lνi ·exp exp -
-
Li
β
ν
- Rνi·exp
Li
β
ν
- exp
-
Ri
β
Ri
β
ν
ν
=
∑m
νν
kiL i + riR i +
i =1
exp
ki (Lνi - Rνi )
ν
ν
Ri
β
-
Li
β
, -1
则
∑ 9f (ν, β) 9β
=
m i =1
ki
(Lνi
收敛速 度 和 收 敛 点 的 全 局 性 往 往 都 是 该 算 法 的
弱点 。
3 参数的频率估计
利用生存函数的频率估计值构造回归方程 , 利
用回归法进行参数估计 。为了简化讨论 , 不妨设 m
个观察窗口为 (L i - 1 , li ] ( i = 1, 2, …, m ) , 样本寿命
X1 , X2 , …, Xn 中有 ki 个落在这个区间内 , 另有随机
=
-
m i =1
ri ·ln
Ri
β
-
Li
β
ν
·ki ·ln
Li
β
+
Ri
β
ν
· ( ri + ki ) ·
Ri
β
ν
·
exp
Li
β
ν
-
Ri
β
ν
·ln
Ri
β
1 - exp
Li
β
ν
-
Ri ν
β
,
化简为
m
∑
ν
Li
·ki
·ln
Ri
β
+
ν
Ri
·ri
·ln
Li
β
-
ν
Ri
·
(
ri
+ ki ) ·
i =1
exp
P{ Yi
= yi }
= Cy i ri
m
∑ 选出的 ri 落于 ( li , + ∞) ,满足 n =
( ki + ri ) 。
i =1
定义生存函数式 ( 1 )在点 li ( i = 1, 2, …, m ) 处
的频率估计值 :设 Yi 表示 ri 个右截尾数据在区间段 ( li , lt ] ( i = 1, 2, …, j; t = j + 1, j + 2, …, m; j <m )内失 效的个体的个数 , 则 Yi = yi ( 0 ≤ yi ≤ ri ) 发生的概 率为