基于遗传算法的分组逐步右截尾威布尔分布的参数估计及应用

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1 引言
近年来，随着工程机械行业的发展，以及行业对产品可靠性要求不断提高。

为了保证产品可靠性，不仅设计部门、试验部门都需要对新设计的产品进行寿命分析，售后及质量部门也需要对产品质量进行跟踪监测。

一方面产品的服役情况直接对零部件寿命产生巨大的影响，另一方面，若产品出现可靠性问题，将会对产品的品牌形象产生极大的影响，所以说对根据用户反馈的数据进行产品的可靠性研究非常重要。

传统的，售后及质量管理部门对可靠性的管控主要是监测反馈率及反馈时间，零件寿命等指标。

售后及质量管理部门需要对可靠性指标异常的零部件要提出预警，并与设计部门协作进行可靠性改进。

但是，由于产量的波动，服役工况差异等原因，传统的反馈率指标误差大，且不能分析出零部件整体的失效时间分布。

本文研究了基于遗传算法的分组逐步右截尾数据的威布尔分布参数估计方法，并对不同的优化目标进行了比较。

2 统计模型与似然函数
2.1 统计模型[1]
假设有数量为n的试验样本，其个体寿命为x i(i= 1,2,…,n)，x i相互独立且服从双参数Weibull分布[2]，其分布函数为：
−
=
−α
α
η
η
η
α
η
αx
x
x exp
),;(f
1
(1)
式中x≥0，α＞0，η＞0。

分组逐步右截尾方案为：在t
=0时刻将n
个产品投入
试验，在t
1
时刻增加n
1
个产品投入试验；在t
2
时刻增加n
2个产品投入试验；…；在t k时刻终止试验。

在整个试验过程中持续对试验产品的失效情况进行观察，记录各个批次产品的失效情况。

这一截尾方案与工程中产品投入服役的同时对产品失效
寿命进行的监测过程是一致的。

可知，对t
时刻投入试验的
产品进行了T
= t k - t
寿命的右截尾，记失效产品数量为f0；对t1时刻投入试验的产品进行了T1= t k- t1寿命的右
截尾，记失效产品数量为f
1
；…对t k-1时刻投入试验的产品进行了T k-1=t k-t k-1寿命的右截尾，记失效产品数量为f k-1；即，全体试验产品数量∑
=
=
k
i
i
n
n，全体失效数量∑
=
=
k
i
i
f
f−1。

2.2 似然函数
由Weibull分布函数及分组逐步右截尾方案可知其似然函数为：
基于遗传算法的分组逐步右截尾威布尔分布的
参数估计及应用
Parameter Estimation and Application of Weibull Distribution Based on Progressively Grouped Right Truncated Data Using Genetic Algorithm
覃康段传栋朱玉柱杨锦霞
（广西柳工机械股份有限公司装载机研究院，广西柳州 545000）
摘要：本文提出了分组逐步右截尾的统计模型，给出了极大似然公式。

并说明了这一截尾方
案与工程生产中对产品失效反馈的同时对产品寿命的监控过程是一致的。

利用遗传算法对分
组逐步右截尾统计模型进行了数值模拟，对比了几种优化目标，发现利用失效寿命的均值、
方差、以及失效数量这三个值的累积误差作为优化的目标效果最好，优化结果误差小。

并对
比了不同失效样本占比时威布尔分布参数的误差。

最后对收集到的装载机零部件失效数据进
行了威布尔参数估计，并求解这批产品可靠度为95%的可靠寿命。

关键词：威布尔分布；遗传算法；分组逐步右截尾；参数估计；蒙特卡洛模拟
中图分类号：O212；O213 文献标识码:A
Copyright©博看网. All Rights Reserved.
2022.04 建设机械技术与管理109
110
建设机械技术与管理 2022.04
∏=−−−
−
−
=k
i f n i
i f i
i i
i i
T T T T 01
1
exp exp ααααηηηα
ηηηα()[]()[]∏=−•
=k
i f n f
i
i
i
f f 0
)
(i i ,;T ,;T ),(L ηαηαηα•
(2)
对数似然函数为：
(
)()∑=−−
− −+ − =k
i i
i i i i i i T T f n T T f L 0
1
1ex p log ex p log ,log ααααηηηαηηηαηα•
•
(3)对数似然函数对参数α和η取偏导数，并令：
()0,log =∂∂αηαL ，()0
,log =∂∂η
ηαL (4)
解方程即可得到α和η的极大似然估计。

但是上述方程的求解过程非常复杂，这里我们使用遗传算法来对分布参数α和η来进行估计。

2.3 遗传算法参数优化
遗传算法是解决优化问题时常用的一种搜索算法。

其计算过程为：
（1）初始化种群：首先假设不同α和η参数组合的Weibull 分布，由这些不同的组合组成初始化的种群；
（2）评价：评价种群中每个个体适应度值的大小；（3）择优：跟据适应度进行归一化后并排序，随机选取个体保留下来，每个个体被选中的概率与其适应度成正比；
（4）生成新的种群：通过交叉、变异运算，生成新的种群；
（5）终止：当计算达到最大循环次数退出计算，并将最优解作为结果输出。

我们认为，如果两个服从Weibull 分布的样本W 1,n (x ；α1，η1)和W 2,n (x ；α2，η2)经过相同分组逐步右截尾取样后，获得两个样本集F 1,n (x )和F 2,m (x )，
若这两个截尾样本一致，则可以认为W 1,n (x ；α1，η1)和W 2,n (x ；α2，η2)是一致的，即α1=α2，η1=η2。

在优化问题中，核心是如何设置优化目标，在本文中，我们以两个分组逐步右截尾样本的差异最小化为目标来计算最分布参数的最优解。

本文中我们利用遗传算法来求解双参数Weibull 分布的最优解，并对比几种样本差异计算方法的优化效果。

2.3.1 Kolmogorov-Smirnov 检验
Kolmogorov-Smirnov 检验又称为K-S 检验，通常用于比较一个样本与一个参考分布，或用于比较两个样本，K-S 统计量的计算公式为：
()()−=
x F x m n up ,2,1x
m ,n F D s (5)
其中=up x
F s 是上确界函数，F 1,n (x )和F 2,m (x )分别是两组
样本的经验分布函数。

K-S 统计量越小，则认为两组样本越难区分。

反之，两组样本越容易区分。

所以我们可以将K-S 统计量最小作为优化目标，即：
()()()
−=x F x m n up ,2,1x m ,n F min D min s (6)
2.3.2 均值、方差、样本数量累积误差
若两个分组逐步右截尾样本集F 1,n (x )和F 2,m (x )是一致的，我们可以认为它们的均值、方差、和样本数量是相等的，即均值相对误差、方差相对误差、样本数量相对误差均为0，则有：
()[]()[]
()[]0mean mean mean
mean_error ,2,2,1=−=x F x F x F m m n ，
()[]()[]
()[]
0mse mse mse mse_error ,2,2,1=−=x F x F x F m m n ，
size_error =−=m
m
n ，其中：()[]()[]
()∑=−=n
1
i 2
,1i
1,,1mean x
n
1
mse x F x F n n ，()[]()[]
()∑=−=n
1
i 2
,1i
1,,1mean x
n
1
mse x F x F n n •
， ()[]()[]
()∑=−=m
1
i 2
,2i
2,m ,2mean x
m
1
mse x F x F m 我们以相对误差之加权和最小化作为优化目标，即：min(E n,m )=min[ω1·mean _e rror +ω2·mse_error +ω3·size_error )] (7)
其中，ω1，ω2，ω3，分别是它们的权重。

2.3.3 Weibull 拟合参数累积误差
类似的，假设经过分组逐步右截尾采样的数据仍符合Weibull 分布，通过拟合可以得到对采样数据的α和η，若两个分组逐步右截尾样本集F 1,n (x )和F 2,m (x )是一致的，则它们拟合后的参数相等，再结合样本数量，以它们的相对误差加权和来作为优化目标，即：
min(E n,m )=min[ω1·α_e rror +ω2·η_error +ω3·n_error )] (8)最后，我们通过数值模拟的方法来验证遗传算法下，几种优化目标对分组逐步右截尾下威布尔分布参数估计效果。

3 数值模拟
采用Monte Carlo 法来对分组逐步右截尾采样过程来进行数值模拟，参考Balakrishnan [3]提出的数据生成方法并利用Python 语言生成模拟数据，具体的步骤如下：
（1）从Weibull 分布W (x ;α,η)产生n 个随机样本，x 1，x 2，x 3，…，x n ；
Copyright ©博看网. All Rights Reserved.
2022.04 建设机械技术与管理
111
（2）对于给定的分组序列n 1，n 2，n 3，…，n k 对样本进行分组，有∑==k
0i i n n ；
（3）对于给定的观察时间t 1，t 2，t 3，…，t k ，对各组样本进行观察，其中对n 1组样本，考察从试验开始到tk 时刻的失效情况，对n 2组考察从试验开始到t k -1时刻的失效情况，……，对n k -1组考察从试验开始到t 2时刻的失效情况，对nk 组考察从试验开始到t 1时刻的失效情况；
（4）此时，得到分组逐步右截尾失效样本的数量f，以及每个样本的失效时间l 1，l 2，l 3，…，l f 。

首先，给定真值α=1.5，η=5000，给定样本总数量n =20000，给定随机生成的分组序列n 1，n 2，n 3，…，n k ，给定最大观察时间t k =500，给定观察间隔d =10，则有t 1，t 2，t 3，…，t k =10，20，30，……，500，根据这些参数生成一组分组逐步右截尾采样数据作为已知失效集合。

然后，假设α和η的值，通过采样过程生成假设值的失效集合F '(x )，并计算F '(x )与F (x )的优化目标值。

通过遗传算法不断的迭代计算，使优化目标值最小，最后得到最优α和η结果。

遗传算法中，种群数量pop=100，优化循环次数gen=200。

将这一过程循环20次，得到20组最优解，并计算α和η的均值和方差。

最后，使用几种优化目标在数值模拟中进行优化，结果如表1：
可以看到，利用失效寿命的均值、方差、以及失效数量这三个值的累积误差作为优化的目标效果最好，优化结果误差小。

通过对比可以看到，将失效数误差加入优化目标可以使得优化结果的精度得到提高，优化结果更加稳健。

值得一提的是，在数值模拟中失效样本占比较小的情况下（λ≈1.38%），通过计算得到的结果仍具有较高的准确性。

通过延长观察时间t k 可以得到不同失效样本占比时计算得到的α和η，如表2：
4 数据分析及结论
现在收集到404条装载机上某支架的失效反馈数据，如表3。

在18个月时间内有197828个该型号的支架装机并投入服役，每10天约有361个投入服役。

失效件的平均失效时间mean = 218.96天，方差mse = 10856.84。

针对这些反馈数据，使用遗传算法估计该支架寿命的威布尔分布参数α和η，以均值、方差、样本数量的累积误差最小化为优化目标。

通过计算求解，可得α=1.36，η=5217.81。

根据威布尔分布可靠度寿命公式[4]可求得这批产品可靠度为95%的可靠寿命为t 0.95 = 592天，小于设计需求，需要对支架进行改进。

参考文献
[1] 田玉柱,田茂再,陈平. 数据分组和右截尾情形下广
义指数分布的参数估计及应用[J]. 数学进展, 2012, 41(06):755-762.
[2] 叶南海，戴宏亮.机械可靠性设计与MATLAB 算法[M].
北京:机械工业出版社，2018.
[3] J. Blank and K. Deb, pymoo: Multi-Objective
Optimization in Python, in IEEE Access, vol. 8, pp. 89497-89509, 2020, doi: 10.1109/ACCESS.2020.2990567.
[4] B a l a k r i s h n a n N ，S a n d h u R A. A s i m p l e
simulational algorithm for generation progressive type II censored samples[J]. The American Statistician, 1995, 49(2): 229-230.收稿日期：2022-05-06
作者简介：覃康，硕士，工程师，主要从事疲劳寿命仿真分
析及可靠性分析方面的工作。