第9章 可靠性数据检验与分布参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
k
式中:
n - 样本数; k - 分组数,按样本大小取k=7~14; νi - 第i组的实际频数,νi≥5; pi - 第i组的理论频数(概率); m - 未知参数的数目; α - 显著性水平;
() - 临界值,可由
2
2 分布表查出。
例9-1 某220件产品的失效时间记录如下所示, 试检验该产品的寿命是否服从指数分布。
因此,需要处理截尾试验数据的方法。
9.1.3
截尾数据统计推断
假设观测母体包括n个样本,在t0=0时投入运行。运行过程 中,有些样本发生了失效,也会有样本退出运行。记录的 数据包括每个失效产品的失效时间和各失效发生前仍在运 行的样本数量。
令发生失效的时间为t1,t2, ……, tk按从不到大的顺序排
L( x1 , x2 ,...xn ; ) f ( x(i ) , )[1 F ( x( k ) , )]nk (9-7)
i 1
k
如果只知道第i个样本在运行时间段[0-xi](xi为已知量)内是否 失效,不知道准确的失效时间,则有如下似然函数
L( x1 , x2 ,... xn ; ) F ( xi , ) [1 F ( xi , )]
以上属于右截尾的情况,即如果一个样品失效的时间未知的原因是,
该样品在试验结束时还没有失效,那么就产生了右侧被截尾的数据。
如果一个样品已经失效,但不能确定准确失效时间的原因是不知道该 样品是何时投入试验的,那么就产生了左截尾数据。
单一截尾与多重截尾:单一截尾是只有一个截尾点。如果100个传感 器置于一个检测台上,检测在1000小时后完成,在1000小时处有一个 截尾点。如果在测试1000小时后有20个没有失效,测试1200小时后还 有15个未失,这时就有2个截尾点,结果数据是多重截尾的。如果确 切的失效时间未知,但是在一个时间区间内失效的次数被记录到了, 那么这就是区间数据或成组数据。
令 x1 , x2 ,...,xn 是服从概率密度函数 f ( x, ) 的独立随机变量, 其中 是唯一的分布参数。那么
L( x1 , x2 ,...xn ; ) f ( x1 , ) f ( x2 , )...f ( xn , )
(9-4)
就是随机变量的联合分布或似然函数。 分布参数的极大似然估计值 ˆ ,是使似然函数取最大值的 。
2 统计量为
2
i 1
k
( i npi ) 2 36.905 npi
取显著性水平 0.10,由 v k m 1 8 1 1 6 , 查表,得
2 2 ( ) 0.10 (6) 10.64
由于,
2 2 0.10 (6)
第9章
数据检验与分布参数估计
9.1 可靠性试验与可靠性数据 9.1.1 可靠性试验
可靠性分析需要可靠性数据。
可靠性数据可以通过记录现场失效获得,也可以通过可靠 性试验获得。 可靠性试验是指为了获得可靠性数据、验证及提高产品的 可靠性水平而进行的试验。
现场试验反映的是产品在使用条件下实际失效情况, 最能说明产品的可靠性水平。 实验室试验是在实验室内模拟现场情况进行的试验。 在实验室中也可以进行影响寿命的单项因素试验, 还可以进行加速试验。
k ˆ 1 t 1 (50 39 150 50 850 2) 293 t i i 220 n i 1 失效率λ的点估计为
ˆ
假设H0:
1 1 ˆ t 293
t 293
F (t ) 1 e
为了使用 2 检验法,首先对数据进行分组。由于每组中实际频数不
故拒绝原假设,既不能认为该产品的寿命服从指数分布。
9.3
K-S检验法
K-S 检验法(亦称 D 检验法)也是比较样本经验分布函数 Fn(x)与总体分布函数 F0(x)。但不是在划分的区间上考虑样本 经验分布函数 Fn(x)与假设的总体分布函数F0(x)之间的偏差, 而是在每一点上考虑它们之间的偏差。
宜少于5个,故将前7段时间各作为一组,最后两段时间合为一组。总计组
数k=8,在7-14范围内。具体计算列表如下。
例9-1计算列表
组号 i 1 2 3 4 5 6 7 8
i
39 50 35 32 28 18 12 6
p i (1 e
t - i 293
) (1 e
第9章 可靠性数据检验与分布参数估计
9.1.1 可靠性试验
无论通过那种途径获取可靠性数据,要等到全部观测对象失效,都需 要很长的时间。根据统计学理论,在只有部分试样失效时,也能获得 有关的可靠性指标。因而,视可靠性试验的目的不同,有些试验可以 在进行到一定时间即可停止。按试验截止情况,可分为定数截尾和定 时截尾试验两种。 定数截尾试验是试验到预定的失效样品数时停止试验。定时截尾试验 是试验到规定的时间时停止试验。 根据试验中试样失效后是否用新试样替换,可分为有替换试验和无替 换试验。
产品失效时间的数据记录 时间t: 0-100 失效数i: 39 -200 50 -300 35 -400 32 -500 28 -600 18 -700 12 -800 4 -900 2
解 假设该产品的寿命服从指数分布,参数λ未知。取每组的中值作为该 组时间的表征值 ti, 平均寿命的点估计为
i 1 i k 1
k
n
(9-8)
式中,k为失效样本数,n-k为未失效样本数。
9.1.5 分布类型假设检验
分布类型的判断有理论法和统计法两种。理论法是根据失效机理制定 的数学模型或根据某种分布的性质推导出来的。例如,失效率为常数 的寿命分布为指数分布;失效由“最弱”环节决定的寿命分布为威布 尔分析或极值分布;受很多独立随机因素的影响,且没有一个因素起 主导作用,这种分布为正态分布等。
Biblioteka Baidu
截尾数据以可划分为:
Ⅰ型截尾(定时截尾):在一项试验中,对多件样品同时进行试验, 出现失效后也可以补充新样品,试验在一段预定时间后结束。例如, 在试验台上同时测试100个轴承,并且在1000小时后结束测试,而不 管发生失效的轴承数量有多少,这样的试验就是定时截尾试验。在这 个例子当中,试验时间是固定的,而失效数据数量为随机变量。 II型截尾(定数截尾):试验中最初有多个样品,试验到指定数量的 样品失效时结束。例如,在在试验台上同时对100个轴承进行试验, 并且在出现30个失效后终止试验。这样的试验就是定数截尾试验。在 这个例子中,失效样品的数量是事先指定的,而试验时间是随机变量。
由此, 2 检验法首先计算理论频数与实际频数间的差异,将统计量的 观测值与临界值比较。满足条件则接受原假设;否则拒绝原假设。公 式如下:
( i npi ) 2 2 2 (k m 1) npi i 1
k
(9-9)
( i npi ) 2 2 2 (k m 1) npi i 1
(9-1)
9.1.4 参数估计
1.矩估计
一阶原点矩等于分布的平均值:
E ( x) {
x f (x )
i i i
如果x是离散随机变量
(9-2)
-
xf ( x )dx 如果x是连续随机变量
对均值的二阶矩等于分布的方差:
xi 2 f ( xi ) 2 i 2 E ( x ) x 2 f ( x)dx 2 如果X 是离散的
样品序号 1 2 3 4 5 6 7 8
失效时间 35 45 55 >60 >60 >60 >60 >60
很明显,只用三个失效样本平均值及标准偏差不能用 来估算这个案例中的分布参数。这三个样本平均值为 (35+45+55)/3=45。存活下来的五个数据中每个对应 的失效时间都大于60,因此真实的样本均值要比45大 的多。
9.2 检验法
2
2 检验法适用于大样本试验数据。其基本思想是,将随机试验的全部
可能结果划分为 k 个互不相容的事件 A1,A2,…,Ak,在假设成立
的条件下计算 P(Ai)=pi,i=1,2,…,k。在 n 次试验中,事件 Ai 出 现的频率 ni/n 与 pi 常有差异。但由大数定律可知,如果试验次数 很多,在假设成立的条件下,|ni/n-pi|的值应该很小。
Dn sup Fn ( x) F0 ( x) Dn,
x
(9-10)
式中
F0(x)——原假设的分布函数;
0, x x1 i Fn ( x) , xi x xi 1 n 1, x xn
Fn(x)——经验分布函数。
统计法是根据大量试验数据经统计得出的。很多同类性能在以往大量 试验的基础上已经验证了其分布。例如,几何尺寸、材料性能、硬度 等多服从正态分布;零件疲劳寿命则服从对数正态分布或威布尔分布 等。 在使用统计法时,对分布未知的情况下应做大样本的试验,以判定其 分布类型;对已有经验参考的情况则可做较小样本的试验,假设其分 布类型再进行相应的拟合性检验。下面介绍通用的2检验法和K-S检 验法。
K-S检验法比 2 检验法精确。但要求所检验的分布中不含未 知参数,且要假定总体分布函数为连续函数。
具体做法是,先将n个试验数据由小到大的次序排列。根据假 设的分布,计算每个数据对应的分布函数 F0(xi),并将其与经 验分布函数 Fn(xi)比较。其中,差的最大绝对值就是检验统 计量 Dn 的观测值。将 Dn 与临界值 Dn, 比较。满足条件,接 受原假设;否则拒绝原假设。条件如下:
四种组合形式:
⑴ 有替换定时截尾寿命试验; ⑵ 有替换定数截尾寿命试验; ⑶ 无替换定时截尾寿命试验; ⑷ 无替换定数截尾寿命试验。
9.1.2 可靠性试验数据
可靠性数据多种多样,很重要的一类是截尾数据。通过试验或现场 记录获得的数据可能既包括失效数据,也包括不失效数据。以下表 种的数据为例,在试验台上进行八个产品的试验;其中的三个失效 了,五个到试验结束时还没有失效。
列,ni为时刻ti之前仍在运行的样本数,wi为在(ti-1)-ti 时间段内退出运行(并未发生失效)的样本数。显然,
n1=n-w1, n2=n1-1-w2,以此类推。
要根据这样的观测数据估计样本的可靠度,有如下 的Kaplan-Meier公式:
1 R(t ) (1 ) ni {i:ti t }
t - i -1 293
)`
npi=220pi νi –npi ( i npi )
2
( i npi ) 2 npi
0.2827 0.2055 0.1461
62.194 45.210 32.140
-23.194 4.790 2.860
537.962 22.944 8.180
8.650 0.507 0.254
为了便于计算,通常先将似然函数取自然对数,即
ln L( x1 , x2 ,... xn ; ) ln f ( xi , )
i 1
n
(9-5)
解方程
ln L( x1 , x2 ,..., xn , ) 0
(9-6)
即可求得分布参数 的估计值。
对于概率密度函数为f(x,),累积分布函数为F(x,)的随机 变量,如果只知道其样本中的前k个顺序统计量x(1), x(2), …, x(k),而关于其它n-k个样本的已知信息只是大于x(k),这种情 况下的似然函数形式为
(9-3)
如果X 是连续的
其中 是分布均值。 对于正态分布等,这些矩提供了参数的直接估计量。
对于威布尔、对数正态和伽玛分布等,分布参数需要通过令样本矩等于理论矩来解
出分布参数。所需矩的数目取决于被估计的参数的数目。
2.极大似然估计
极大似然估计法是一种应用广泛的估计参数的方法。其基本原理是, 通过使已知样本出现的概率最大化的方法来确定参数值。
式中:
n - 样本数; k - 分组数,按样本大小取k=7~14; νi - 第i组的实际频数,νi≥5; pi - 第i组的理论频数(概率); m - 未知参数的数目; α - 显著性水平;
() - 临界值,可由
2
2 分布表查出。
例9-1 某220件产品的失效时间记录如下所示, 试检验该产品的寿命是否服从指数分布。
因此,需要处理截尾试验数据的方法。
9.1.3
截尾数据统计推断
假设观测母体包括n个样本,在t0=0时投入运行。运行过程 中,有些样本发生了失效,也会有样本退出运行。记录的 数据包括每个失效产品的失效时间和各失效发生前仍在运 行的样本数量。
令发生失效的时间为t1,t2, ……, tk按从不到大的顺序排
L( x1 , x2 ,...xn ; ) f ( x(i ) , )[1 F ( x( k ) , )]nk (9-7)
i 1
k
如果只知道第i个样本在运行时间段[0-xi](xi为已知量)内是否 失效,不知道准确的失效时间,则有如下似然函数
L( x1 , x2 ,... xn ; ) F ( xi , ) [1 F ( xi , )]
以上属于右截尾的情况,即如果一个样品失效的时间未知的原因是,
该样品在试验结束时还没有失效,那么就产生了右侧被截尾的数据。
如果一个样品已经失效,但不能确定准确失效时间的原因是不知道该 样品是何时投入试验的,那么就产生了左截尾数据。
单一截尾与多重截尾:单一截尾是只有一个截尾点。如果100个传感 器置于一个检测台上,检测在1000小时后完成,在1000小时处有一个 截尾点。如果在测试1000小时后有20个没有失效,测试1200小时后还 有15个未失,这时就有2个截尾点,结果数据是多重截尾的。如果确 切的失效时间未知,但是在一个时间区间内失效的次数被记录到了, 那么这就是区间数据或成组数据。
令 x1 , x2 ,...,xn 是服从概率密度函数 f ( x, ) 的独立随机变量, 其中 是唯一的分布参数。那么
L( x1 , x2 ,...xn ; ) f ( x1 , ) f ( x2 , )...f ( xn , )
(9-4)
就是随机变量的联合分布或似然函数。 分布参数的极大似然估计值 ˆ ,是使似然函数取最大值的 。
2 统计量为
2
i 1
k
( i npi ) 2 36.905 npi
取显著性水平 0.10,由 v k m 1 8 1 1 6 , 查表,得
2 2 ( ) 0.10 (6) 10.64
由于,
2 2 0.10 (6)
第9章
数据检验与分布参数估计
9.1 可靠性试验与可靠性数据 9.1.1 可靠性试验
可靠性分析需要可靠性数据。
可靠性数据可以通过记录现场失效获得,也可以通过可靠 性试验获得。 可靠性试验是指为了获得可靠性数据、验证及提高产品的 可靠性水平而进行的试验。
现场试验反映的是产品在使用条件下实际失效情况, 最能说明产品的可靠性水平。 实验室试验是在实验室内模拟现场情况进行的试验。 在实验室中也可以进行影响寿命的单项因素试验, 还可以进行加速试验。
k ˆ 1 t 1 (50 39 150 50 850 2) 293 t i i 220 n i 1 失效率λ的点估计为
ˆ
假设H0:
1 1 ˆ t 293
t 293
F (t ) 1 e
为了使用 2 检验法,首先对数据进行分组。由于每组中实际频数不
故拒绝原假设,既不能认为该产品的寿命服从指数分布。
9.3
K-S检验法
K-S 检验法(亦称 D 检验法)也是比较样本经验分布函数 Fn(x)与总体分布函数 F0(x)。但不是在划分的区间上考虑样本 经验分布函数 Fn(x)与假设的总体分布函数F0(x)之间的偏差, 而是在每一点上考虑它们之间的偏差。
宜少于5个,故将前7段时间各作为一组,最后两段时间合为一组。总计组
数k=8,在7-14范围内。具体计算列表如下。
例9-1计算列表
组号 i 1 2 3 4 5 6 7 8
i
39 50 35 32 28 18 12 6
p i (1 e
t - i 293
) (1 e
第9章 可靠性数据检验与分布参数估计
9.1.1 可靠性试验
无论通过那种途径获取可靠性数据,要等到全部观测对象失效,都需 要很长的时间。根据统计学理论,在只有部分试样失效时,也能获得 有关的可靠性指标。因而,视可靠性试验的目的不同,有些试验可以 在进行到一定时间即可停止。按试验截止情况,可分为定数截尾和定 时截尾试验两种。 定数截尾试验是试验到预定的失效样品数时停止试验。定时截尾试验 是试验到规定的时间时停止试验。 根据试验中试样失效后是否用新试样替换,可分为有替换试验和无替 换试验。
产品失效时间的数据记录 时间t: 0-100 失效数i: 39 -200 50 -300 35 -400 32 -500 28 -600 18 -700 12 -800 4 -900 2
解 假设该产品的寿命服从指数分布,参数λ未知。取每组的中值作为该 组时间的表征值 ti, 平均寿命的点估计为
i 1 i k 1
k
n
(9-8)
式中,k为失效样本数,n-k为未失效样本数。
9.1.5 分布类型假设检验
分布类型的判断有理论法和统计法两种。理论法是根据失效机理制定 的数学模型或根据某种分布的性质推导出来的。例如,失效率为常数 的寿命分布为指数分布;失效由“最弱”环节决定的寿命分布为威布 尔分析或极值分布;受很多独立随机因素的影响,且没有一个因素起 主导作用,这种分布为正态分布等。
Biblioteka Baidu
截尾数据以可划分为:
Ⅰ型截尾(定时截尾):在一项试验中,对多件样品同时进行试验, 出现失效后也可以补充新样品,试验在一段预定时间后结束。例如, 在试验台上同时测试100个轴承,并且在1000小时后结束测试,而不 管发生失效的轴承数量有多少,这样的试验就是定时截尾试验。在这 个例子当中,试验时间是固定的,而失效数据数量为随机变量。 II型截尾(定数截尾):试验中最初有多个样品,试验到指定数量的 样品失效时结束。例如,在在试验台上同时对100个轴承进行试验, 并且在出现30个失效后终止试验。这样的试验就是定数截尾试验。在 这个例子中,失效样品的数量是事先指定的,而试验时间是随机变量。
由此, 2 检验法首先计算理论频数与实际频数间的差异,将统计量的 观测值与临界值比较。满足条件则接受原假设;否则拒绝原假设。公 式如下:
( i npi ) 2 2 2 (k m 1) npi i 1
k
(9-9)
( i npi ) 2 2 2 (k m 1) npi i 1
(9-1)
9.1.4 参数估计
1.矩估计
一阶原点矩等于分布的平均值:
E ( x) {
x f (x )
i i i
如果x是离散随机变量
(9-2)
-
xf ( x )dx 如果x是连续随机变量
对均值的二阶矩等于分布的方差:
xi 2 f ( xi ) 2 i 2 E ( x ) x 2 f ( x)dx 2 如果X 是离散的
样品序号 1 2 3 4 5 6 7 8
失效时间 35 45 55 >60 >60 >60 >60 >60
很明显,只用三个失效样本平均值及标准偏差不能用 来估算这个案例中的分布参数。这三个样本平均值为 (35+45+55)/3=45。存活下来的五个数据中每个对应 的失效时间都大于60,因此真实的样本均值要比45大 的多。
9.2 检验法
2
2 检验法适用于大样本试验数据。其基本思想是,将随机试验的全部
可能结果划分为 k 个互不相容的事件 A1,A2,…,Ak,在假设成立
的条件下计算 P(Ai)=pi,i=1,2,…,k。在 n 次试验中,事件 Ai 出 现的频率 ni/n 与 pi 常有差异。但由大数定律可知,如果试验次数 很多,在假设成立的条件下,|ni/n-pi|的值应该很小。
Dn sup Fn ( x) F0 ( x) Dn,
x
(9-10)
式中
F0(x)——原假设的分布函数;
0, x x1 i Fn ( x) , xi x xi 1 n 1, x xn
Fn(x)——经验分布函数。
统计法是根据大量试验数据经统计得出的。很多同类性能在以往大量 试验的基础上已经验证了其分布。例如,几何尺寸、材料性能、硬度 等多服从正态分布;零件疲劳寿命则服从对数正态分布或威布尔分布 等。 在使用统计法时,对分布未知的情况下应做大样本的试验,以判定其 分布类型;对已有经验参考的情况则可做较小样本的试验,假设其分 布类型再进行相应的拟合性检验。下面介绍通用的2检验法和K-S检 验法。
K-S检验法比 2 检验法精确。但要求所检验的分布中不含未 知参数,且要假定总体分布函数为连续函数。
具体做法是,先将n个试验数据由小到大的次序排列。根据假 设的分布,计算每个数据对应的分布函数 F0(xi),并将其与经 验分布函数 Fn(xi)比较。其中,差的最大绝对值就是检验统 计量 Dn 的观测值。将 Dn 与临界值 Dn, 比较。满足条件,接 受原假设;否则拒绝原假设。条件如下:
四种组合形式:
⑴ 有替换定时截尾寿命试验; ⑵ 有替换定数截尾寿命试验; ⑶ 无替换定时截尾寿命试验; ⑷ 无替换定数截尾寿命试验。
9.1.2 可靠性试验数据
可靠性数据多种多样,很重要的一类是截尾数据。通过试验或现场 记录获得的数据可能既包括失效数据,也包括不失效数据。以下表 种的数据为例,在试验台上进行八个产品的试验;其中的三个失效 了,五个到试验结束时还没有失效。
列,ni为时刻ti之前仍在运行的样本数,wi为在(ti-1)-ti 时间段内退出运行(并未发生失效)的样本数。显然,
n1=n-w1, n2=n1-1-w2,以此类推。
要根据这样的观测数据估计样本的可靠度,有如下 的Kaplan-Meier公式:
1 R(t ) (1 ) ni {i:ti t }
t - i -1 293
)`
npi=220pi νi –npi ( i npi )
2
( i npi ) 2 npi
0.2827 0.2055 0.1461
62.194 45.210 32.140
-23.194 4.790 2.860
537.962 22.944 8.180
8.650 0.507 0.254
为了便于计算,通常先将似然函数取自然对数,即
ln L( x1 , x2 ,... xn ; ) ln f ( xi , )
i 1
n
(9-5)
解方程
ln L( x1 , x2 ,..., xn , ) 0
(9-6)
即可求得分布参数 的估计值。
对于概率密度函数为f(x,),累积分布函数为F(x,)的随机 变量,如果只知道其样本中的前k个顺序统计量x(1), x(2), …, x(k),而关于其它n-k个样本的已知信息只是大于x(k),这种情 况下的似然函数形式为
(9-3)
如果X 是连续的
其中 是分布均值。 对于正态分布等,这些矩提供了参数的直接估计量。
对于威布尔、对数正态和伽玛分布等,分布参数需要通过令样本矩等于理论矩来解
出分布参数。所需矩的数目取决于被估计的参数的数目。
2.极大似然估计
极大似然估计法是一种应用广泛的估计参数的方法。其基本原理是, 通过使已知样本出现的概率最大化的方法来确定参数值。