(一)可靠性基础

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

可靠性可靠性基础基础
Xie Meng-xian. (电子科大,成都市)
半导体器件和集成电路的可靠性评估(即失效率预测,failure rate prediction )是一个重
要的问题。

可靠性评估实际上也就是采用通过寿命试验而得到的失效的数据、来估算出器件
和集成电路的有效使用寿命。

有效使用寿命即为器件和集成电路能够正常工作的平均平均平均使用使用使用时间时间(MTTF ,mean time to
failure );与此密切相关的概念是失效率失效率失效率、可靠性指标可靠性指标
可靠性指标等可靠性参量。

因为通过寿命试验而获得的失效数据,往往遵从某种统计规律的分布函数——可靠性
函数,所以根据这些试验数据,由可靠性函数规律出发,即可估算出器件和集成电路的MTTF
和失效率等参量。

(1)失效的失效的模式模式模式::
半导体器件和集成电路会由于各种原因而失效,但是失效率往往与使用时间有关。

若在
经过时间t 之后未失效器件的数目为R(t),则通过
寿命试验可以获得大致如图1所示的三种失效模式
的函数关系:①早期失效模式;②偶发失效模式;
③磨损失效模式。

在数学上可用来描述这些失效模
式的函数即称为可靠性函数。

对于偶发失效的模式,比较符合实际的可靠性
函数是指数函数;由此可知偶发失效的失效率是一
个常数,即不管经过多长时间,器件失效的几率都
是一样的;根据这种可靠性函数,可较容易地进行
分析。

比偶发失效更早发生的失效称为早期失效。

大多数半导体器件和集成电路所出现的失效
都属于早期失效模式。

对于这种很快就会发生失效的器件和电路,一般都可以在使用之前、
通过例行试验(即采用一定条件的筛选工艺)来去除掉,以免带来后患。

磨损失效也称为疲劳失效,其特点是开始阶段的故障少,然后故障不断增加。

(2)可靠性函数可靠性函数——————统计分布统计分布统计分布::
可靠性函数都是一些统计分布函数。

从统计角度来看,统计数据的分布函数有许多种,
常用的有如指数分布、Gauss 分布、Γ分布、对数正态分布和Weibull 分布,它们的功能各
有千秋。

但是对于半导体器件和集成电路的可靠性而言,比较符合实际情况、使用最广泛
的分布规律有两种,即Weibull 分布和对数正态分布。

①Weibull 分布:
虽然指数分布函数比较简单、分析容易,同时也能很好地表征偶发失效模式的规律,不
过对于晶体管、二极管和集成电路的整个可靠性分析而言,比较符合实际情况的、可以用
作为可靠性函数的是Weibull 分布。

Weibull 分布的失效几率密度函数为
m
t m t m e t m t f )/()(ηη−−⋅=
相应的累积失效分布函数为 m
t e t F )/(1)(η−−=
式中的m 称为分布的形状参数(shape parameter ),η为分布的尺寸参数(scale parameter )。

图1 失效的三种模式
Weibull 分布的图形如图2所示,在m <1时为倒J 字型曲線,在m=1时为指数式分布,
在1<m <3.6时为偏向左边的曲线,在m ≈3.6时为正态分布曲线,在m >3.6时为偏向右
边的曲线。

分析表明,当Weibull 分布采用不同的形状参数时,即可表示不同的失效模式:
m<1时,早期失效模式;
m=1时,偶发失效模式;
m>1时,磨损失效模式;
可见,把Weibull 分布作为可靠性函数是合适的。

在Weibull 分布的失效模式下,元器件的MTTF 可表示为
dt t f t dt t R MTTF ∫∫∞
∞==00)()( 由于引起器件和集成电路失效的机理不同,
因此就相应地存在各不相同的MTTF 和失效率
数据。

最容易导致失效的就是其中MTTF 最短的
那一种机理。

Weibull 分布之所以能够很好地表征器件和
集成电路的失效规律,是由于Weibull 分布是根
据最弱环节模型或串联模型而得到的,它能充分
反映材料缺陷和应力集中源对材料疲劳寿命的
影响,而且具有递增的失效率,所以,将它作为
材料或零件的寿命分布模型或给定寿命下的疲劳强度模型是合适的;而且尤其适用于机电类产
品的磨损累计失效的分布模式。

由于它可以根据失效概率密度来容易地推断出其分布参数,
故被广泛地应用于各种寿命试验的数据处理。

总之,与其它统计分布相比,Weibull 分布具有更大的适用性。

②对数正态分布:
对于半导体器件和集成电路的失效,当各种原因所引起的失效事件是独立事件时,则失
效规律比较符合对数正态分布,这时总失效率就等于各种失效率的乘积。

若一个随机变量x 的对数服从正态分布,则该随机变量x 就服从对数正态分布;对数正
态分布的概率密度函数为
222/)(ln 21
)(σµπσ−−⋅=x e x x f
该分布函数的形式如图3所示。

对数正态分布是对数为正态分布的任
意随机变量的概率分布;如果x 是正态分
布的随机变量,则exp(x)为对数分布;同
样,如果y 是对数正态分布,则log(y)为正
态分布。

(3)可靠性参量可靠性参量::
通过寿命实验等可靠性试验,即可确
定出可靠性参量。

可靠性参量除了有效使
用时间以外,还有失效率和可靠性指标。

①失效率(或故障率,FR ,failure rate ):
失效率即某个瞬间、单位时间内所失效的器件和电路的数目比率。

由可靠性函数给出的
图2 Weibull 分布
图3 对数正态分布
R(t)可以把失效率表示为
1()()d R t R t d t
λ=−⋅ 当测量出了如图1所示的可靠性曲线时,则可由该曲线的效率(为dR/dt )求得失效率。

失效率的常用的单位是[% /1000小时]或者“菲特”[FIT],1FIT=10−9/小时。

②可靠性指标(RI ,reliability index ):
可靠性指标就是在较长一段时间中、单位时间内所失效的器件和电路的数目比率。

如果
N 个元器件在T 时间内损坏的数目为n ,则定义可靠性指标为
1n RI N T
=⋅ 在可靠性试验中,一般取T=1000小时,这时RI 的单位是[% /1000小时]或者FIT (10−9/小
时)。

例如,若有100个器件在进行1000小时的寿命试验时,发生了一个损坏,则RI=10-5/
小时=10000FIT 。

人们常常把失效率与可靠性指标混为一谈,虽然它们的单位相同,但实际上它们在意义
上有所不同:失效率λ表示的是瞬时故障率,而可靠性指标RI 表示的是累积故障率。

(4)加速寿命试验加速寿命试验和加速系数和加速系数和加速系数::
常用的一种可靠性试验是加速寿命试验加速寿命试验加速寿命试验(accelerating life test )
,就是把半导体器件或集成电路样品放置在比正常工作条件要苛刻、容易引起失效的环境中来进行处理,使得样品能
够较快地发生疲劳劣化,以获得关于失效的数据,并从而求得有效使用时间等可靠性参量。

采用什么样的条件来进行加速寿命试验是一个至关重要的问题。

为了“加速”劣化,当
然要选取超过元器件极限性能指标(额定值)的条件来进行寿命试验;不过,由于元器件的
额定值本来往往就远超过正常使用时的指标,所以一般把在额定值条件下进行的寿命试验也
称为加速寿命试验。

在额定值下进行寿命试验所获得的失效率自然远大于实际使用状况下的失效率,这两种
失效率的比值称为加速系数加速系数(accelerating factor )。

在设计元器件时,如果知道了其加速系数
的话,则由加速寿命试验的结果即可推定出实际使用时的失效率。

各种元器件的加速系数,需要分别通过大量样品的试验和长时间的寿命试验才能确定出
来。

例如对Si 平面晶体管,在结温为90~100℃范围内、在极限性能指标下进行多次、长
期试验,可得到加速系数为10~20倍。

因此,若在额定值下寿命试验给出的失效率为10−5,
那么实际使用的失效率即为0.5~1×10−6。

半导体器件和集成电路的寿命往往与结温有关,因此在进行加速寿命试验时,往往就选
取最大功率或者最高结温来作为加速寿命试验的条件。

有一种旨在提高元器件整体可靠性的处理措施,与加速寿命试验过程有点类似,即所谓
“老化老化
老化”(aging )。

这就是把元器件置于使用状态或者接近额定值的条件下来进行处理,使得早期失效的元器件能够被筛选掉,同时也可以使得元器件的特性稳定化(例如使晶体管
的电流放大系数和反向饱和电流达到恒定)。

老化有电(功率)老化和热老化等不同的处理形式。

例如,对于晶体管的电老化,就是把
晶体管放置在加上电压和电流的状态下来处理(这时将由于集电极损耗而发热);对于晶体
管的热老化,就是把晶体管置于最高结温的高温下来处理。

(5)降额使用额使用((derating ):
对于半导体器件和集成电路,在额定值下试验时,即可加速失效。

显然,在实际使用时,
如果降低使用的功率或者结温的话,那么就必将大大延缓参数退化、降低失效率、提高可靠
性。

这种降额(derating )使用的技术是常常被用作为提高可靠性的一个重要方法。

降额通常采用降额降额降额因子因子(使用值与额定值之比)和环境温度来表示。

降额因子大小的选
取,决定于多方面的因素,需要根据设备系统使用的要求而定。

例如,对于常用的BJT,可靠性要求较低一些的降额标准为:Si-BJT的结温≤120℃,Ge-BJT的结温≤70℃,电压和电流都降低到额定值的80%以下;可靠性要求较高一些的降额标准为:Si-BJT的结温≤110℃,Ge-BJT的结温≤65℃,电压降低到额定值的80%以下(瞬态工作时,降低到额定值以下),电流降低到额定值以下。

不同的可靠性要求,降额的程度也就不同。

可以有三种降额等级,如下表所列。

Ⅰ级降额是最大的,可靠性要求最高;Ⅲ级降额是最小的,可靠性要求最低;Ⅱ级降额则处于Ⅰ级和Ⅲ级降额之间。

使用降额技术虽然可以有效地提高元器件和集成电路的可靠性,但是降额是有一定限度的。

如果超过最佳范围的更大降额,则不但元器件可靠性改善的效果不大,而且还会带来其它一些问题;有时甚至会使元器件的特性发生变化或者找不到合用的元器件,更严重的是反而可能使元器件产生新的失效机理而损害整个系统的可靠性。

相关文档
最新文档