零售打分卡模型估计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、资产池分池概述
零售风险暴露没有初级法和高级法的区别,只要实施内部评级法,银行必须使用分池(Pool)技术来自行估计违约概率、违约损失率和违约风险暴露。
商业银行首先将零售风险暴露分为个人住房抵押贷款、合格循环零售风险暴露、其他零售风险暴露三大类,在此基础上建立细分的零售风险暴露的风险分池体系。
按照《新资本协议》的要求,同一资产池内的零售风险暴露的风险程度应保持一致,资产池间的资产具有风险的异质性。
银行在将贷款分到资产池中时至少要考虑如下风险要素:
◆借款人风险特征,包括债务人类别和人口统计特征等,如收入状况、年龄、职业、
客户信用评分、地区等。
◆债项风险特征,包括产品和抵质押品的风险特征,如抵质押方式、抵质押比例、担
保、优先性、账龄等。
◆贷款的逾期:银行分别确定逾期贷款和未逾期贷款
特别地,对于已经违约和尚未违约的贷款,应分别进行风险划分;对于数据缺失的零售贷款,数据缺失的程度应作为风险分池的一个因素。
各资产池之间借款人和贷款的分布应合理,避免单个池中零售暴露过于集中。
按照银监会的规定,若单个资产池中风险暴露超过该类零售总量的30%,银行需要向银监会证明该资产池中的贷款具有风险同质性,并且不影响估计该池的风险参数。
对于资产池划分,银行可根据自身对于资产池划分精细化程度的需求以及数据质量情况,分别建立独立的PD/LGD/EAD资产池(即每笔贷款同时对应一个PD池、一个LGD池,一个EAD池),也可以建立综合的PD/LGD/EAD资产池(即每笔贷款只对应一个资产池,每个资产池具有PD、LGD、EAD三个参数)。
二、资产池划分方法
从方法论的角度,资产池划分方法可以分为:
1.基于申请评分卡和行为评分卡:以评分卡的模型细分为基础,按照分数的高低划
分为不同的资产池。
2.决策树:利用决策树模型,通过递归的方法,将资产划归到不同的池中。
3.聚类:使用多元统计聚类方法,将具有类似特征的资产划分为同一资产池。
4.专家判断法:当数据不充分时,可依靠专家经验进行资产池的划分。
以上方法不是独立的,可进行组合使用,国际先进银行多采用基于评分卡的方法,对于
没有建立评分卡的产品,则辅以其它的方法。
从Use Test(使用测试)原则出发,资产池划分方法分为两类:
自下而上(Bottom-up):指已有评分模型对每一笔贷款进行了风险评分,根据风险评分,进行层层聚类。
自下而上(Top-down):在没有风险评分模型的情况下,结合业务经验,通过统计分析确定分池指标,从总体资产组合出发,层层划分后获得资产池。
此种方式较为粗糙,PD、LGD、EAD等参数估计的精确程度较差。
1.1.1.1 风险参数-PD
按照《新资本协议》的规定,对于零售风险暴露,违约的定义可以用于特定债项层面,而不应用在借款人层面。
借款人对一项债务违约,不强迫银行将借款人对银行集团的所有债务都按照违约处理。
违约定义上的这一点差别导致了零售暴露和公司暴露内部评级体系本质上的额差别,公司暴露最重要的架构就是客户和债项的二维评级;零售暴露则基于债项层面来实现分池技术,同一客户的不同债项可以分到不同的池,而具有不同的违约概率。
一、PD模型建设
PD池的划分过程即是PD模型建设的过程,一般情况下,都需要结合使用自上而下或者自下而上的方法,无论采用哪种方法,PD模型都最终表现为决策树的形式,不同之处在于决策树节点的确定方法和确定顺序。
自上而下的方法,其决策树节点的确定顺序是从“树根”到“叶子”的方法,是逐步细分的过程。
自下而上的方法,其决策树节点的顺序是从“叶子”到“树根”,是逐步聚类的过程。
在PD模型建设过程中,需要回答两个问题,一是每一步分杈的标准是什么?二是什么时候停止分杈?决策树中每个节点的判定标准是是否能够将资产池进行有效区分,即不同资产池间是否满足风险异质性;决策树最后节点确定,是资产池内的贷款具有了风险同质性,除了同质性,为了保证模型的稳定性,每个资产池应具有一定数量的贷款,保证风险参数-违约概率、违约损失率、违约风险暴露计量的统计显著性。
二、违约概率校准
违约概率校准的作用有两个,一是对于已经开发了风险评分卡的敞口,其违约定义与《新资本协议》规定的并不一致,需要校准;二是没有开发风险评分卡的敞口,但是有相近的产
品的评分卡可以有效排序,需要校准。
违约概率校准的前提是风险驱动因子依然有效,风险评分依然有效排序,但是因为违约定义的变化导致排序对应的违约概率不一致。
校准的过程如下图所示:
300~349
350~399
400~449
450~499
500~599
600~699
700~799
800~900
申请评分300~349
350~399
400~449
450~499
500~599
600~699
700~799
800~900行为评分
映射Rankorder 排序表违约概率(%)
三、 PD 值的长期平均估计
按照《新资本协议》规定,用于计算监管资本的违约概率应该是长期平均违约概率,以保持监管资本的谨慎性原则。
资产池划分方案初步确定后,即可获得每个资产池每年的PD 值,然后要最终确定该资产池的PD ,还需要将每年的PD 校准到已违约加权的长期平均PD ,并要充分考虑经济衰退的影响。
计算长期平均PD 时,应该是违约加权而不是简单平均,主要目的是为了平抑业务量的波动。
如下表:
简单平均的公式为(r 1+ r 2+ r 3+ r 4+ r 5)/5,其中r 为违约率,则平均违约率为7.0%。
违约加权的公式为(r 1m 1+ r 2m 2+ r 3m 3+ r 4m 4+ r 5m 5)/(m 1+ m 2+ m 3+ m 4+ m 5),其中r 为违约率,m 为贷款总数,则平均违约率为5.72%。
在经济衰退期,即使客户群和风险管理水平没有发生太大的变化,PD 也会有明显上升。
《新资本协议》要求计算违约加权的长期平均PD的过程,要充分考虑经济衰退的影响,那PD得长期平均估计应该覆盖一个完整的经济周期。
四、成熟性效应
成熟性效应是指贷款的违约概率与客户账龄密切相关,在贷款初期,违约概率非常低,在发放贷款一段时间后违约概率才达到高峰。
最典型的例子就是住房抵押贷款,国外的研究表明,住房抵押贷款发放初期违约概率较低,知道4~5年后违约概率才达到高峰,而国内住房贷款抵押贷款提前还贷十分严重,一般在3~4年违约概率达到成熟性效应高峰。
对于具有成熟性效应的产品的新客户,由于违约表现期(通常设为12个月)时间跨度不够长,客户违约行为未充分表现,导致监管资本的当前计提不足无法覆盖未来的风险。
如果新客户量比较大,到成熟时,监管资本会发生异常波动。
成熟性效应解决方法是对违约概率进行成熟性效应因子调整。
当违约率趋于稳定时,则可认为成熟性效应已经完全呈现,由此可以计算出成熟性效应因子。
假设违约率稳定时的违约率为8.45%,而对于开户1年的客户观察期内的违约率为4.24%,则开户1年的客户的成熟性因子为8.45%/4.24%=2。
是否需要进行成熟性效应因子调整,与新客户占整体客户的比例有关,如果新饿虎占比很小,成熟性效应的影响比较小,可以不做调整;如果新客户占比比较稳定,由于在未来总会存在低违约的新客户,监管资本会比较稳定,也可以不做调整。
1.1.1.2 风险参数-LGD
同非零售风险暴露一样,零售暴露违约损失率的计算公式为:
LGD = 1 -
在建立PD模型时,要考虑模型样本的因变量是否违约,而对于LGD模型,模型样本的因变量是历史违约损失率,其计算过程包括三大关键点,即回收现金流(有效催收窗口)、回收成本、折现率,计算难度远超过是否违约。
一、有效催收窗口
回收现金流,虽然在理论上都是历史上可以观察到的,但难点在于很多不良贷款在账上
一挂就是多年,或者因破产、押品处理等法律因素,不良贷款最终回收金额的确认需要多年的时间。
为了全面地估计历史回收额,需要很长的历史表现期,而历史数据的积累时间长度是有限的。
通过有效催收窗口的方法可以解决这个问题。
贷款的回收金额是一个时间序列,RC1,,RC2,。
RC t,,。
RC n,n→∞,理论上,只要贷款仍有拖欠余额,银行就不断催收,贷款就有回收的可能,即RC t,>=0。
在实际催收业务中,不良贷款催收到一定程度就很难有还款,
即超过某一时间点m时,则∞
∑ RCt ≈ 0
t=m,则可以确认时间点m为有效催收时间点,在后续的
模型建设中,只研究前m个回收现金流RC1,,RC2,。
RC t,,。
RC m。
二、催收成本
《新资本协议》规定催收成本包括直接成本和间接成本,但对直接成本和间接成本的具体内涵未作详细界定。
中国银监会对此进行了进一步的明确,指出“直接损失或成本是指能够归结到某笔具体债项的损失或成本,包括本金和利息损失、抵押品清收成本或法律诉讼费用等。
间接损失或成本是指商业银行因管理或清收违约债项产生的但不能归结到某一笔具体债项的损失或成本。
催收成本的计量是各国银行面临的一个普遍问题,国外银行的问题在于催收成本的分摊,而中国的商业银行,相关IT系统建设落后,成本信息没有记录,更难以进行成本分摊。
为此银行需要对该部分数据进行补录,由于没有数据可查,数据补录只能依靠专家经验,补录数据项的设计不宜过细,但至少要覆盖如下几个维度:不同产品的催收成本,不同时间/年份的催收成本,不同催收手段的催收成本,不同逾期程度客户的催收成本。
三、折现率
折现率反映的是银行资金的时间价值。
在中国金融市场,可以选择的折现率有贷款基准利率、合同贷款利率、资本要求回报率、存款利率、国债利率、银行内部资金成本等。
《新资本协议》要求考虑“折扣效应”,但采用一个什么样的折现率,《新资本协议》和中国银监会未作详细规定。
折现率的计算可以采用以下几种方法:
◆采用风险调整后折现率对回收现金流折现,该折现率为无风险利率与反映回收和清
收成本现金流风险的溢价之和;
◆将回收和清收成本转化为确定性等价现金流,并采用无风险利率对等价现金流折现;
◆同时对折现率、回收率和清收成本进行风险调整,且前后调整原则一致。
从理论上讲,通过对回收不确定性现金流建立金融学模型,是可以计量出相对应的风险补偿的,期权调整利差模型可能是比较合适的选择,但是,如何描述回收现金流的不确定性是无法回避的难题。
四、LGD资产池
当回收金额、回收成本、折现率的计量得到解决,就可以计算每笔债项的LGD,然后可以以此为因变量,类似于PD池开发,采用自下而上或自上而下的方法。
如前所述,LGD的分布存在严重的双峰现象,特别是LGD取值为0和1的比重非常大,对于零售暴露,LGD取值为0的现象更为突出。
数据特征决定模型的方法论,LGD模型应该选择决策树模型或构造样本logistic回归。
LGD池划分的风险驱动因素(自变量)可选择债项或客户信息,例如客户年龄、账龄、已回收拖欠比例等。
PD模型基本分组是申请评分和行为评分模型,而LGD模型的基本分组时违约客户模型和非违约客户模型。
LGD分池过程中,同质性和异质性的处理,以及决策树最后节点的确定,与PD池的方法类似。
LGD的长期平均估计也应该是一个违约加权的长期平均,并需充分考虑经济衰退的影响。
经济衰退对LGD的影响主要有以下三方面:
◆催收成本:经济衰退时催收会更加困难,所花费的单位成本会提高;
◆回收率:经济衰退会导致客户还款能力下降,回收率也会随之降低;
◆回收时间:经济衰退时,贷款回收时间会加长。
由于上述三方面的影响,LGD必须保守估计。
1.1.1.3 风险参数-EAD
违约风险暴露(EAD)是指债务人违约时预期的表内和表外项目的风险暴露总额,不低于估算时点未清偿余额。
对于零售风险暴露,可以分为非循环类贷款业务和循环类贷款业务。
◆对于非循环类贷款业务,《新资本协议》规定预期EAD不低于估算时点未清偿余额。
非循环类贷款的还款类型一般分为一次性还贷和分期付款两种,无论哪种,模型预
期的EAD都小于等于估算时点未清偿余额,故直接采用估算时点未清偿余额作为
EAD的估计。
◆对于循环类贷款业务,关键在估算风险转换系数(CCF),以反映在违约时或违约后
借款人继续提款的可能性。
因此,EAD模型的重点在于循环类贷款业务的CCF模型建设,其计算公式为:循环类贷款业务EAD=已提取金额 + CCF * 已承诺未提取金额
一、CCF预测模型
1.模型因变量CCF
CCF的计量至少需要分为如下三类:
◆对还没有提取余额的新客户,则定义为:
CCF = 违约余额/ 信用额度
◆对已存在客户,而且当前余额低于信用额度,则定义为:
CCF = (违约余额–当前余额)/(信用额度–当前余额)
在实际数据中,如果出现CCF小于零,则直接取值为零。
CCF不能小于零,是因为《新资本协议》规定预期EAD不低于估算时点未清偿余额,而在实际中,
CCF可能小于零,例如客户在违约前进行了部分还款,导致违约余额小于当前
余额。
◆对已存在客户,而且当前余额高于(包括等于)信用额度,则定义为:
CCF = (违约余额–当前余额)/ 当前余额
当前余额高于信用额度的出现和银行的风险管理政策有关,如银行在客户违约前调低了信用额度,如果观察点在调额之后,则信用额度小于当前余额。
对于当前余额高于(或等于)信用额度的已存在客户,实际上并不在《新资本协议》的规定范围内,因为违约余额不能进一步扩大,可以直接采用估算
时点未清偿余额作为EAD的估计。
2.模型分组
CCF模型的分组有新客户CCF模型、当前余额低于信用额度的已存在客户CCF模型、当前余额高于(包括等于)信用额度的已存在客户CCF模型。
对于已存在客户还可以考虑活跃客户和不活跃客户的分组,按照(信用额度-当前余额)/信用额度的比例高低分组。
3.模型自变量
CCF模型的自变量可以选择客户和账户信息,具体的自变量选择与模型分组有关,对于新客户,只能选择客户信息和征信信息,例如年龄、婚姻状况、学历、信用历史等变量;而对于已存在的客户,账龄、额度使用率、余额、取现次数等账户信息变量预测
能力比较有效。
4.模型方法
理论上,CCF是一个连续变量,而且取值为(-∞,+∞),理论上可以采用一般的线性回归和非线性转化的线性回归模型。