改善Fab良率的最佳方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
改善F a b良率的最佳方案作者:BruceWhitefield,ManuRehani和NathanStrader,LSILogicCorp2005-12-28点击:1302
很久以来,定期检测每个工艺步骤增加的缺陷来验收用于生产的设备,已经成为半导体业的惯例。
对设备的缺陷状况做出的判断,对于器件的有非常重要的影响。
不论这种检测的频率和影响如何,就采用的方法而言,是相对粗糙的,而且这种数据支持系统主要是针对工程缺陷分析和传统的()技术而设计的。
本文介绍LSILogic采用最佳的设备控制方法,采用新的数据系统来改进其晶圆厂的设备颗粒。
这种方法调研了设备缺陷验收的整个企业过程,建立了一个新的数据系统构造来支持所有人在这方面的努力。
这种新的数据系统叫作YieldDRIVER,它意味着通过设备的明显改进而实现缺陷的降低。
良率和
IC制造工厂利润率中最高的两个杠杆因素是芯片的良率和设备的生产率。
对以上两者都非常关键的是如图1所示的简单的设备颗粒验收检测。
检测颗粒是为了保证产品在交付之前工艺设备不会产生降低良率的缺陷检测当步工艺前后点检片上颗粒的数量,来计算增加的缺陷
数量。
像半导体制造中的许多其他动向一样,器件几何尺寸和运转晶圆厂费用的无情压缩,都在推动设备颗粒特性的改善和更紧的控制。
结果之一便是如何进行缺陷检测的确切细节已经变得非常关键,同时这个过程还要足够简单,使操作人员能够每天来进行。
2002年,在LSI的Gresham晶圆厂里,出于新技术导入和良率经济效益的考量,要求设备的颗粒水平降低50%。
并且这种改善要在现有设备的基础上实现,要避免基建投资,改善总体的设备利用率而不增加成本。
更换旧的工艺设备、购买更先进的颗粒检测设备不作为选项。
授权一个工厂范围内的缺陷控制职能交叉小组来完成这个任务。
降低缺陷的途径
这个缺陷控制小组决定首先来分析整个工厂范围内现存的设备缺陷控制方法,以发现改进的机会。
分析的主要发现是:
●许多非常好的颗粒管理实例已经在使用之中。
●缺陷测量和计算的已知最佳方案(BKMs)并没有在所有的测试中都贯彻实施。
●缺陷测量和控制的BKMs并没有在所有的设备中都贯彻实施。
●晶圆厂中的人并不是均等地拥有缺陷测量和结果分析的能力。
●经理们对于自己负责的设备,仅仅报告检测、维持缺陷性能的状况是不够的。
●缺陷数据系统主要是针对工程分析,而不是针对生产缺陷控制而设计。
简而言之,人们发现缺陷控制的知识和财富已经存在于这个组织中,但是并没有把这些知识均衡地应用,在做一件事情时没有把所有的已知最佳方案结合起来。
这个缺陷控制小组认为:要完成缺陷降低的任务,最有效的方法,就是推动迅速彻底得在所有工艺中实施已经存在的最佳实践案例,同时提供一个基础来支持高效、一致地运用这些案例。
如果它是BKM,那为什么不采用呢?
小组第一步是鉴别和记录缺陷控制的BKMs。
在回顾这些最佳个案时发现,似乎一些步骤,由于组织上、程序上或者基础上的原因,很难实施或者不能在所有情况下实施。
人们经常说:大部分问题的起因是缺乏沟通。
这对于设备缺陷的控制过程的确是正确的。
用如图2所示的工作流程方块图很容易描绘出这种情形。
方法(process)、系统基础(systeminfrastructure)和组织现实(organizationalrealities),存在于相互关联但又相互隔离的平面内。
要取得成功,设备缺陷控制过程必须在这所有三个维度上都采取措施。
比如,颗粒监控的第一步,可能要求刻蚀操作工(组织)通过追踪制造执行系统(MES)中的点检片,来遵循设备验收的规范(方法),但是下一步可能要求良率操作工(组织)通过使用缺陷分析软件(系统)来遵循分析规范(方法)。
颗粒监控的实际工作应该是完美地贯穿于所有这三个方面。
如果任何一个方面的要求没有达到,那么这种方法就崩溃了,导致低效率的、重复性的过程,或者这种方法的使用不足。
为了改进设备缺陷的控制实践,这个小组不得不考虑整个工作流程空间。
重大的组织变更超出了这个小组的职权范围,但是方法却必须要遵循已知的最佳案例。
这意味着,系统基础必须做出调整来提供一个充满活力的工作流程。
组织方面
这个Fab的组织架构是一个工艺区域和职责纪律相交的矩阵,这是很多晶圆厂的典型情况。
这个组织的实际情况是,其基础架构不能提供报告和数据总结,以便及时提醒fab中各个独立区域中负责各种纪律的经理们,以及负责特定区域的生产主管们。
基础架构必须支持的典型的组织矩阵和不同焦点,如图3所描述。
如果陪训资料和规范没有包含BKM方法的话,这会导致职员的陪训不足和视野狭窄,从而造成另外一种形式的组织断裂。
的实际情况,要求组织基础和架构支持BKM在每个工艺区域中执行。
在会议上通过与工艺经理、设备负责人、生产主管和全体职员讨论来鉴别BKM。
它们被收录在两个BKM文档中。
第一个是参考文档(DCR),为工艺负责人提供一个设计最佳缺陷控制方案的模板。
DCR包括了针对于特定工艺的最佳实践案例,比如:
●记录点检过程中必须要检测的感兴趣的缺陷(DOI,defectofinterest)。
●确定并且检测生产中晶圆经过设备的所有通路。
●选择能够代表生产过程的测试方法。
第二个BKM文档的目标是执行缺陷控制方案以及建立整个fab的缺陷控制标准。
56个确认的最佳案例可以分解为三个执行层次,如下:
●层次1:基础,注意和责任人
●层次2:扩展BKM
●层次3:缺陷降低和成本优化
每一个BKM都要仔细定义和研究,理解如何贯彻执行它们。
这种分析用来定义支持基础需要具备的能力。
并不是每一项措施都需要基础架构的变化,尤其是在第一个层次,因此应该并行地实施BKM和架构改进。
为了推动执行和判断障碍所在,缺陷控制小组在每周的会议上,与制造、设备维护、和工艺模块一起,回顾D
CR计划和执行层次的进展情况。
基础架构方面
随着BKM的建立和组织需要的确定,要对基础架构进行调整,以便使缺陷控制措施能够有效地完成。
基础架构需要分解为三个范畴:
参考文书
●培训资料
●最佳案例(BKMs)
●感兴趣的缺陷(DOI)
●失控时的行动方案(OCAP)
数据系统
●BKM支持功能
●性能标准和报告
●使用标准和报告
工具
●监控成本优化的计算
●DCR计划模板
●DOI模板
本文的焦点是数据系统的研发,但是需要注意的是,没有基础架构中其余的部分,就不能有效地贯彻执行。
数据系统
针对缺陷监控已经建立的方法是,从每一次的检测中取得颗粒增加的数量,将其加入到控制图中。
先进的SPC系统采用的方法:比如解决非正态分布问题的估计权重移动平均图(EWMA),用于改进对于缺陷暴发的监测。
这是一个非常好的方法,但是在实际应用中由于数据中噪音的缘故会有一定的局限性,会忽略掉一些有用的信息,比如空间分布,以及缺陷分类。
更重要的是,这个工作流程必须要能够推动工艺前后的检测和数据分析中BKM的应用。
虽然拥有一个高级的在线SPC系统,但是在回顾了设备点检使用的情况后,大家认为,把SPC图表功能添加到缺陷分析系统中,要比为SPC图表系统研发缺陷分析能力更加有效。
在线上缺陷分析中,经常使用高级的软件工具。
现存的缺陷数据分析软件中,KLA-Tencor的Klarity,是为在线检查数据的工程分析而设计的,它为有经验的用户提供了强大的,交互式功能。
不幸的是,它在处理数据结构,需要管理信息系谱,将测试结果与特定的工艺区域、工艺类型、设备、子设备,最后与测试时间联系起来时,其能力有一定的局限性。
为了满足这种链接的需求,以及满足监控处理、测试结果的特定组织报告的需求,我们决定设计一种新的用户界面,使用户能够进入已经存在的缺陷数据库以及其他的数据库,以便能够以简单易用的界面对设备缺陷进行控制。
这个新的界面叫做YieldDriver。
YieldDriver设计时将BKM嵌入到系统功能中,这样就能够支持设备缺陷控制工作中的特别需求。
这样,最好的方法也变成了最容易的方法。
测试数据的关联
要实现支持BKM,需要的功能之一便是:能够连贯地将测试前后的颗粒检测结果,与工艺区域、正在进行的测试、以及正在检验的设备的部件关联起来,以便能够准确地计算正在检验的工艺或者设备对于颗粒的贡献。
在一个拥有120个操作工和工程师,需要检测180台设备,工艺步骤超过300的fab里面,这不是一个简单的数据管理问题。
通过把点检晶圆批应用于每项检测中,利用工厂的MES系统控制这些点检晶圆,数据关联就能够实现自动化,但是这就要求MES系统要有新的功能,并且需要增加点检晶圆的用量。
更实用的方法是,让用户将刚刚测试得到的数据关联起来,图4给出了颗粒检测、以及如何收集关联缺陷数据的流程图。
通过一个图形用户界面来完成数据关联,在这个界面中,用户从下拉菜单中确认要进行的检测(图5)。
下一步是选择检测前后的测试。
通过限定时限选择刚刚使用过的点检晶圆批,系统会给出很少的备选数据提示,通常只有一个正确的待选数据。
在后测试完成后,从这个列表中,通过如图6所示的图形用户界面,用户将正确的前、后数据关联起来。
利用已有的测试设备和数据库,将颗粒数据与被检验的工艺、设备关联起来,这是一种简便有效的方法。
这种方法还支持将以前的检测结果作为下一次检测的初始数据,这样就节约了检测的时间。
深入挖掘
分析
从工艺区域开始数据选择,以便与fab组织机构相一致。
主要的图表屏幕提供了交互式的深入分析功能,设计用来支持设备缺陷检测。
每个层次缩小了数据的选择范围(如表所示)。
一旦需要的数据被选中(如图7),它能够用图表列出需要的任意时段。
数据可以用图的形式表示出来(如图8),还有一些额外的功能来支持工作。
附加的图表注释功能包括:
●标注“C”的点表示已经查看过并且已分类。
●点击一个数据点,能够调出分类数据和晶圆图。
●空心点表示未包括的数据点。
数据排除不是直接做的,而是根据分类图自动进行处理的,这种处理是建立在性能考量的基础上的,是有正当理由的。
●矩形表示数据点在数据收集完成后没有马上被复查。
这一点是支持BMK 的,BKM总是复查晶圆图寻找明显的信号,并对失效进行快速反馈。
●许多参数可以在不同的图表中描绘出来。
这与最关键的BKM是一致的,注重管理“大的”-那些对于有更大影响的颗粒,而不是缺陷的总数(TDC)。
用户还可以开发各种单独的图表,为自动缺陷分类(ADC)得到的各种缺陷设置规格界限。
●设备的状态可以在图表中表示
出来,可以看到这种工艺设备在缺陷高发的期间,是在使用中,还是由于维护而停机。
●这些图表都有链接,可以很快的链接到参考文书,比如DOI,OCAP,DCR,还可以链接到设备维护的历史记录。
一旦缺陷数据描绘完毕,就可以用一张计量表格来表达计算结果,这对于缺陷控制工作是有帮助的。
●AvgDef是图表中平均的缺陷水平,用于与控制限、规格和目标数进行快速比较。
●AQBF,或者失效前的平均检测次数,是两次失效之间检测次数的一个量测。
●Exl%是被排除于计算之外的数据点所占的百分比。
排除是建立在数据分类的基础之上的,是设计用来去掉那些不能反映量产晶圆特性的数据点,比如
设备异常或者颗粒检测有问题时,用于调查问题的检测数据。
去掉的数据不计入量度计算。
●%A是在控制限以上并且已经被分类或者标注的数据点所占的百分比。
●%OOC是超出控制限的点所占的百分比。
●%R是得到及时复查的点的量度。
它是按照BKM方法,对于每一个数据点都在缺陷检测一小时之内,把晶圆图调出来进行复查的一种量度。
●YD#是图表上数据点的个数。
●CCL是建立在当前图上的数据基础上计算出来的控制限。
它提供了一种方法,来快速查看控制限,以便找出统计上性能最差的设备腔体。
●CL是当前的控制限,Spec是规格限,Lrn是用来触发额外缺陷分析的选择性控制限,它与控制限和规格限的目的不同。
Goal是相对于控制限来说要达到的目标。
图9是表达图8中图表的一张计量表。
这些表格按照设备类型,工艺,以及区域来积累而成,为fab经理提供一个总体的性能方面的统计结果。
和晶圆图的检查
从经验上讲,增加的缺陷一直是按照检测后的缺陷减去检测前的缺陷计算得来。
不幸的是,有时,这种方法会误检出干净的设备。
这是一种特殊的情况,晶圆上增加或者减去薄膜,如果颗粒检测是按照BKM的方法,就要去匹配实际的工艺步骤。
这种处理方法会降低对先前存在颗粒的探测,从而导致虚假的低缺陷计算。
这种效应在YieldDriver操作者培训材料的一页中有解释(图10)。
检查晶圆缺陷图的BKM方法是在缺陷检测完成后两小时内,对每一个数据点进行测试前、测试后,以及叠加后增加的缺陷图的检查。
新的数据系统使这一点变得很容易,点击一个数据点时,会给出所有这三张图。
图11给出了一点例子,缺陷图通过了增加缺陷的控制限,但是却有明显的需要对策的边缘特征。
如图12所示,可以将缺陷图拖到图表的分析部分,调出每张缺陷图像以及其他的分析功能。
管理方面的努力
缺陷控制小组的目标是在整个工厂内建立BKM系统,使其成为标准的案例。
这要求各部门经理在一定程度上要日常留意这方面,并且在月度或者季度工厂业绩回顾时把这些趋势图增加进去。
在这些变为现实之前,我们首先要确保这些系统按照计划应用于日常的运作之中。
在此之前,确保系统按照要求执
行非常重要。
为了把这些方法变为标准的工作流程,我们对于结果、实施和完成情况给出了一个衡量标准。
如图13所示的报告,就是设计用来翻班交接或者生产会议时的快速日常回顾。
这个报告给出了过去24小时这个特定区域所有故障检测的细节。
它是系统产生的,张贴在内部网上,能够快速溜览。
其他基于区域的网络报告,以缺陷性能的形式提交了YieldDriver的结果,按照工作周给出趋势图,按照设备来区分(图14)。
这让经理对于整个区域的结果能够一目了然,确定哪些工艺更容易出故障。
这个报告是交互式的,用户点击一下图表就能深入分析特定设备的详细数据。
图
15给出的报告是用来监控组织机构针对缺陷数据是如何利用和进行反映的。
它给出outofcontrol的比例(%OOC),没有评注的比例,以及没有复查的比例(两小时之内)。
经理们使用这个报告来发现变化:有多少数据点被排除于计算之外,有多少晶圆图没有被复查分类。
为了持续改进,%OOC应该保持在5%到10%。
因为%OOC是使用的控制限的函数,零不良意味着规格太松,而过多的不良则意味着规格太紧,导致工艺的频繁停机。
结果
主动的工作带来的是整个fab缺陷密度超过50%的下降。
同时,还有故障前平均检测30%的增加,这在改进设备正常动转时间上起了很大的作用。
缺陷控制的成果对于的总体影响,最好是通过对于量产晶圆的在线缺陷检测来估量。
图17给出了致命缺陷密度的变化趋势图,其来源于工艺流程中20点在线自动检测的数据。
这个趋势与晶圆电学测试得到的良率改善情况相一致。
其他公司聚中精力控制设备缺陷不良率后,也报道了类似的结果。
自动叠加计算缺陷增加量的计算方法,还带来了其他的收益:使得在监控时可以使用具有高起始颗粒缺陷的晶圆,同时又不降低检测的精度。
这意味着点检片可
以用更长的时间,从而降低点检片的成本。
许多工艺可以降低对于晶圆型号的要求。
这种缺陷数据系统能够把检测后的结果作为下一次检测的初始值,从而使得颗粒检测设备的使用效率更高。
总结
由于设备和工艺产生的缺陷的降低,良率和设备的利用率都得到了改善。
所有这些都是在现有工艺和测试设备的基础上,通过持续应用BKMs控制缺陷得以实现的。
描绘整个工作流程,提供适当的数据基础,从而为提高单台设备验收检测的能力提供支持。
这种嵌入了最佳实例、专门设计用来支持设备缺陷控制的缺陷数据系统,在实现缺陷控制目标的过程中,起了非常重要的作用。