基于循序Ⅰ型删失数据的广义Pareto分布最优删失计划

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于循序Ⅰ型删失数据的广义Pareto分布最优删失计划程从华;程丽娟
【摘要】文章讨论了循序删失计划下广义Pareto分布的统计推断问题并得到期望Fisher信息矩阵.利用期望Fisher信息矩阵,在三种不同准则下,讨论了最优删失计划的设计问题:如何确定参与寿命分析实验的元件个数,观测区间个数以及实验检测区间长度.最后,给出了完成寿命测试实验的一个具体算法,并且给出了一个具体实例来演示该算法.演示结果表明,文章提出的算法是可行和有效的.
【期刊名称】《海南师范大学学报(自然科学版)》
【年(卷),期】2017(030)004
【总页数】5页(P391-395)
【关键词】循序删失;信息矩阵;最优删失计划
【作者】程从华;程丽娟
【作者单位】肇庆学院数学与统计学院,广东肇庆526061;岭南师范学院数学与统计学院,广东湛江524048;岭南师范学院数学与统计学院,广东湛江524048
【正文语种】中文
【中图分类】O212.1
广义Paretto分布最早由Pickands提出[1].随机变量X服从广义Pareto分布,如果它的概率密度函数(PDF)为
(1)
其中,μ,ξ∈R,σ∈(0,+∞).为了简单,重参数化参数,令这时,广义Pareto随机变量X的概率密度函数变为:
f(x;α,λ)=αλ(1+λx)-(α+1).
(2)
对应的分布函数为:
F(x;α,λ)=1-(1+λx)-α,x,α,λ>0.
(3)
其中,α和λ分别是形状参数和尺度参数.广义Pareto分布又被称为II型Pareto
分布或是Lomax分布,这个分布具有单调递减失效率函数的特性.在可靠性研究中,如果投入寿命测试元件的寿命Y服从参数为v的指数分布,同时v是一个服从尺
度参数和形状参数α的Gamma随机变量,则元件的寿命Y就是一个服从广义Pareto分布的随机变量.
广义Pareto模型在极端事件分析中有着广泛的应用.比如,保险分析中的大额报单索赔问题以及可靠性分析中的失效时间建模问题都可以利用广义Pareto模型来进行建模分析. Harris研究了保修服务时间决策问题[2]. Davis和Feldstein利用广
义Pareto模型研究了循序删失情形下的等效元件失效时间问题[3]. Hosking和Wallis研究了广义Pareto模型的参数和分位数估计问题[4]. Smith研究了非正则条件下的分布族参数最大似然估计问题[5]. Liang基于非参数经验贝叶斯方法讨论了广义Pareto分布的尺度参数估计问题[6]. Nigm等在两样本和随机样本容量条
件下讨论了广义Pareto分布未知参数的贝叶斯区间估计问题[7].Wu等在循序删
失数据情形下研究了广义Pareto分布参数的区间估计问题[8].
寻找最优删失计划是一个近年来受到广泛关注的问题.在循序删失情形下,本文首
先讨论广义Pareto分布未知参数的最大似然估计问题,并且给出广义Pareto模
型在循序删失条件下的期望Fisher信息矩阵.其次利用期望Fisher信息矩阵,在三种不同准则下,讨论最优删失计划的设计问题.在寿命分析实验中,大多数寿命实验还会受到实验经费预算的约束.近几年来许多学者也对此进行了研究,比如:Tse 等[9],Chen等[10]和 Wu等[11]. 在实验经费不超过给定数额条件下,讨论循序删失计划的最优设计问题. 针对循序I型区间删失特点,主要考虑三个问题,分别是如何确定参与寿命分析实验的元件个数,观测区间个数以及实验检测区间长度.最后给出完成寿命测试实验的一个具体算法,并且通过一个具体实例来演示本文的方法.
1 期望信息矩阵
为了计算未知参数的Fisher信息,需要以下的一些预备知识[12].
Xi|Xi-1,Xi-2,…,X1,Ri-1,Ri-2,…,R1~B(Mi,qi),
其中,服从二项分布,是第i步观测开始时未被移除的还在工作的元件个数,
Mi+1=Mi-Xi-Ri,Ri=(Mi-Ri)×pi.通过计算,可以得到以下结论
E(M1)=n,E(R1)=np1(1-q1),E(Xi)=E(Mi)qi,i=1,2,…,m,
利用以上结论,可以得到期望Fisher信息矩阵E,且E可以表示为:
(4)
这里
其中,h=log((1+λti-1)-α-(1+λti)-α).则未知参数(α λ)的最大似然估计的渐进协方差矩阵为
(5)
2 最优删失计划设计
2.1 算法设计
在实验成本约束条件下,这一小节讨论最优的实验设计问题.利用Ng等定义的如下三个最优准则来进行实验设计[13].
(1)D-最优:最小化协方差矩阵的行列式,det(V(α,λ)
(2)T-最优:最小化协方差矩阵的迹,tr(V(α,λ))=V11+V22.
(3)F-最优:最大化参数最大似然估计期望Fisher矩阵的迹,tr(E(α,λ))=E11+E22.假定相邻的观测区间长度差都等于给定的长度t,同时假定有n个元件投入寿命测试实验,有m个观测时刻点,第i个观测区间的时间长度为it,i=1,2,…,m.同时假设以下实验设计参数.
(a) 样本成本:令Cs是每一个参与测试的元件价格,则样本总成本为nCs.
(b) 检测成本:令Ci是每一个参与测试的元件检测成本,则总检测成本为mCi.
(c) 运转成本:令C0是每一个参与测试的元件在两次检测期间内的运转成本,则元件运转总成本为
因此,寿命测试实验的总成本是:
显而易见的是,每个实验准则都是n,m,t的函数,记为G(n,m,t).当实验总成本是给定参数Cb时,则约束条件变为:
(6)
因此,这个实验的最优设计可以表述为:
min imize(max imize)G(n,m,t),subject to nCs+mCi+tC0≤Cb,n,m∈N,and t>0,
其中,N是正整数.
可以看到目标函数和约束条件都是非线性函数. 下面将利用非线性混合规划方法求解上述目标函数.非线性规划问题由Kamat和 Mesquita首先提出[14].关于非线性混合规划方法比较全面的知识可以参考Grossmann的介绍[15]. 对本文涉及的目标函数和具体问题,主要参考Taha的方法[16]. 基于上述介绍,给出如下算法. (Ⅰ)计算整数n的上界.在实验经费束条件下,由于m≥1,这个上界为其中[.]表示取整函数.
(Ⅱ)令n=2,在给定n的条件下,计算m的上界.基于实验成本约束条件,m的上界为
(Ⅲ)计算相邻观测区间长度的差.基于实验成本约束和条件,相邻观测区间时间长度差为:
(Ⅳ)对于给定的n,计算函数G(n,m,tmn)的值.
(Ⅴ)令函数F(n)
(Ⅵ)令n=n+1,如果回到(Ⅱ),否则进入(Ⅶ).
(Ⅶ)计算最优函数G(n,m,tmn)的值,这里的
),
则(n*,m*,t*)就是我们寻找的最优删失计划.
2.2 演示实例
为了演示提出的算法,本节给出以下实例.利用Aggarwala提出的算法[12],在样本容量n=45以及实验参数m=7,t=0.15,α=1.5的条件下,可以获得循序I型删失样本.事先设定删失计划参数(P1,P2,…,P6,P7)=(0.1,0.1,…,0.1,1),则可以得到循序删失样本为X=(19,12,4,4,2,0,0)和R=(2,1,0,0,0,0,1).利用Dempster提出的EM算法[17],获得参数的最大似然估计为:基于参数的最大似然估计和前一小
节给出的算法,可以寻找到最优删失计划设计方案. 假设循序删失计划参数为:Cb=600,Cs=10,Ci=5,C0=2,则最优删失计划目标函数为
min imize(max imize)G(n,m,t),
subject to 10n+5m+m(m+1)t≤600,n,m∈N,and t>0.
利用上节给出的算法,可以获得最优删失计划如下.
D-最优:n*=55,m*=9,t*=0.0556.
T-最优:n*=54,m*=11,t*=0.0379.
F-最优:n*=56,m*=6,t*=0.2381.
通过数值实验结果,可以发现无论是D-最优,T-最优还是F-最优,本文给出的方法均是可以实现的.但各方案实现的具体结果有所差异,其中D-最优方案和T-最优方案在结果上更为相近,F-最优方案则有较大差异.这一结果并不令人意外,因为F-最优方案利用的是期望Fisher信息矩阵,而D-最优方案和T-最优方案使用同一个协方差矩阵.因此在实践中,在小样本情形时,建议使用D-最优方案和T-最优方案,反之使用F-最优方案.
参考文献:
[1] Pickands J. Statistical inference using extreme order statistics[J]. The Annals of Statistics, 1975, 3(1): 119-131.
[2] Harris C M. The Pareto distribution as a queue discipline[J]. Operations Research, 1968.16(2): 307-313.
[3] Davis H T, Feldstein M L. The generalized Pareto law as a model for progroressively censored survival data[J]. Biometrika, 1979, 66(2): 299-306.
[4] Hosking J R M,Wallis J R. Parameter and quantile estimation for the generalized Pareto distribution[J]. Technometrics, 1987, 29(3): 339-349. [5] Smith R L. Maximum likelihood estimation in a class of nonregular
cases[J].Bimetrika, 1985, 72(1): 67-90.
[6] Liang T C.Convergence rates for empirical Bayes estimation of the scaleparameter in a Pareto distribution[J]. Computational Statistics & Data Analysis , 1993, 16(1): 35-45.
[7] Nigm A M, Al-Hussaini E K, Jaheen Z F. Bayesian two-sample predictionunder the Lomax model with fixed and random sample size[J]. Journal of Applied Statistics, 2003, 37(6): 527-536.
[8] Wu S F. Interval estimation for the Pareto distribution based on the progressive type II censored sample[J]. Journal of Statistical Computation and Simulation, 2010, 80(4):463-474.
[9] Tse S K, Yang C, Yuen H K. Design and analysis of survival data underan integrated type II interval censoring scheme[J]. Journal of Biopharmaceutical Statistics, 2002, 12(3): 333-345.
[10] Chen J W, Li K H, Lam Y. Bayesian single and double variable sampling plans forthe Weibull distribution with censoring[J]. European Journal of Operational Research, 2007, 177(2): 1062-1073.
[11] Wu S J, Huang S R. Optimal progressive group-censoring pans for exponential distribution in presence of cost constraint[J]. Statistical Papers, 2010, 51(2):4 31-443.
[12] Aggarwala R. Progressive interval censoring: some mathematical results with applications to inference[J]. Communications in Statistics-Theory and Methods, 2001, 30(8): 1921-1935.
[13] Ng H K T, Chan P S, Balakrishnan N. Optimal progressive censoring plan for the Weibull distribution[J]. Technometrics, 2004, 46(6): 470-481.
[14] Kamat M P, Mesquita L.Nonlinear mixed integer programming[M]// Adeli H.Advanced in design optimization. London:Chapman & Hall Press, 1994.
[15] Grossmann I E. Review of nonlinear mixed-integer and disjunctive programming techniques[J]. Optimization and Engineering, 1965, 3(3): 227-252.
[16] Taha H A. Operations research: an introduction[M]. 5th ed.New York:Macmillan Press, 1992.
[17] Dempster A P, Laird N M, Rubin D B. Maximum likelihood from incomplete data via the EM algorithm[J]. Journal of the Royal Statistical Society:Series B, 1977, 39(1): 1- 38.。

相关文档
最新文档