信用评分卡模型监控模板
信用评分模型简介
信⽤评分模型简介1、信⽤评分模型出现的动机是什么? 我们去银⾏借款的时候,他们往往都会看我们的⼀些个⼈信息,⽐如,年龄,收⼊,家庭状况,⼯作单位,婚姻状况等,也会设置⼀些门槛,只有满⾜了⼀定的门槛才会贷款于你。
但是这种对单个指标设置的门槛会存在⼀些问题,⽐如:(1)有些借款⼈虽说⼀些条件不满⾜,但是其他条件都很好(2)如何利⽤零散、⾮结构化的信息整合成科学的核额体系是⼀个难题(3)贷后管理、资产质量分析和风险定价需要可量化的数字评价体系⽀持 这样,⼀种信⽤评分就应运⽽⽣,解决了以上难题。
具象的个体风险被标准化,分数的存在使得审批有了最简单易⽤的判断标准;整体的信贷资产质量也有了量化指标2、信⽤评分的业务定义 信⽤评分表⾯上是⼀个分数,实质上是⼀个模型。
模型只是我们解决问题的⼿段,解决业务问题才是我们的⽬的。
信⽤风险计量体系包含主体评级模型和债项评级模型,主体评级和债项评级均有⼀系列评级模型组成,其中主体评级模型可⽤“四张卡”来表⽰,分别是A卡、B卡、C卡和F卡;债项评级模型通常按照主体的融资⽤途,分为企业融资模型、现⾦流融资模型和项⽬融资模型等。
我们通常所接触到的评分⼤都⽤于信贷审批,即申请评分卡(A卡,Application scorecard)。
同时,业内还常⽤的有B卡(Behavior scorecard)和C卡(Collection scorecard),分别⽤于贷后管理及催收管理。
其中,它们的使⽤场景不同的:A卡⼜称为申请者评级模型,是使⽤最⼴泛的,⽤于贷前审批阶段对借款申请⼈的量化评估;B卡⼜称为⾏为评级模型,主要任务是通过借款⼈的还款及交易⾏为,结合其他维度的数据预测借款⼈未来的还款能⼒和意愿;C卡⼜催收评级模型,是在借款⼈当前还款状态为逾期的情况下,预测未来该笔贷款变为坏账的概率,由此衍⽣出滚动率、还款率、失联率等细分的模型;F卡有称为欺诈评级模型,主要应⽤于相关融资类业务中新客户可能存在的欺诈⾏为的预测管理。
银行信用风险内部评级模型监控体系
信用风险内部评级模型监控体系本文系统性梳理了信用风险内部评级监控体系的整体框架,具体阐述了监测体系的建设目标、监测内容和方法、监测结果的应用等内容,提出了银行内部评级模型监控体系下一步重点关注领域和解决思路。
20世纪50年代以来,随着银行业务复杂程度的提高,国际银行业采用了越来越多的风险计量模型来评估客户、产品、交易的风险。
近10年来,银行风险管理的技术方法取得了跨越式发展。
当前,国内商业银行已普遍建立内部评级体系,对客户交易等风险进行定量评估和计算。
本文系统性梳理了信用风险内部评级监控体系的整体框架,具体阐述了监测体系的建设目标、监测内容和方法、监测结果的应用等内容,提出了银行内部评级模型监控体系下一步重点关注领域和解决思路。
一、开展内部评级体系监测的目的商业银行内部评级体系是独立于外部评级的,基于本行内部信息对客户、交易等做出风险判断的过程。
内部评级体系的建设和实施,是商业银行风险管理现代化过程的一个重要标志,它把对客户、债项风险的判断从完全依赖专家判断的传统模式,转变成为基于大数据和专家经验的现代化工具方式,极大地提高了风险识别和计量的效率。
经过近些年的推广和深入应用,银行内部评级体系结果不仅应用于监管资本的计量,更广泛应用于银行内部的贷款审批、授信额度调整、经济资本计算与考核、行业限额制定、信贷政策制定等领域,成为银行风险管理的基础性工具之一。
但是,先进工具的使用也带来了潜在的模型风险,模型一旦设计、使用不当,将可能导致对客户风险判断的实质性偏离,并带来信贷风险。
因此,建立一套针对内部评级模型的全面、及时、准确的监测体系,及时发现模型使用过程中的问题,并建立问题诊断体系,已经成为银行业风险计量和风险管理领域的核心工作之一。
二、内部评级监测体系的设计目标商业银行建设内部评级监测体系的目标是,实现自动、及时、全面、自诊断地监测内部评级体系运行情况,包括监测内部评级体系中模型、模型支持体系运行情况,及时发现并诊断内部评级体系运行中存在的问题,为后续实施改进措施如深入验证、模型优化、应用流程修正等提供依据和支持。
评分卡模型
评分卡模型0 引言信用评分模型是消费信贷管理中的先进的技术手段,是银行、信用卡公司、个人消费信贷公司、电信公司、水电服务公司、保险公司等涉及消费信用的企业实体最核心的管理技术之一。
被广泛应用于信用卡生命周期管理、汽车贷款管理、住房贷款管理、个人贷款管理、其他消费信贷管理等领域,在市场营销、信贷审批、风险管理、账户管理、客户关系管理等各个方面都发挥十分重要的作用。
信用评分模型运用先进的数据挖掘技术和统计分析方法,通过对消费者的人口特征、信用历史记录、交易记录等大量数据进行系统的分析,挖掘数据中蕴含的行为模式、信用特征,捕捉历史信息和未来信用表现之间的关系,发展出预测性的模型,以一个信用评分来总和评估消费者未来的某种信用表现。
信用评分本质上是模式识别中的一类分类问题将企业或个体消费者划分为能够按期还本付息(即“好”客户)和违约(即“坏”客户)两类。
具体作法是根据历史上每个类别(如期还本付息、违约)的若干样本,从已知的数据中找出违约及不违约者的特征,从而总结出分类的规则,建立数学模型,用于测量借款人的违约风险(或违约概率),为消费信贷决策提供依据。
1 基于Logistic回归分析的客户信用评价卡模型本文将采用 Logistic 逻辑回归分析方法对小额贷款公司的客户信用进行评价。
首先,建立信用评价模型,给出客户信用评分卡模型,并对客户样本进行初步分类预测。
下面的理论基础和变量选择都以该小额贷款公司为例。
1.1 建模的准备1.1.1 目标变量的定义研究的目标变量为客户是否具有“违约”行为,本文是以客户逾期未归还贷款定义为“违约”行为(即“坏”客户)。
1.1.2 定量指标的筛选方法第一种定量指标的筛选方法:用随机森林法寻找自变量中对违约状态影响最显著的指标。
第二种定量指标的筛选方法:计算变量间的相对重要性,并通过相对重要性的排序,获取自变量中对违约状态影响最显著的指标。
第三种定量指标的筛选方法:通过自变量间的广义交叉验证法,获取自变量中对违约状态影响最显著的指标。
信用卡评分模型实例
信⽤卡评分模型实例数据准备⽬标:完成⼀个评分卡,通过预测某⼈在未来两年内将会经历财务危机的可能性来提⾼信⽤评分效果,帮助贷款⼈做出最好的决策准备:基于个⼈信贷的场景, 确定违约的定义:根据新的Basel II Capital Accord(巴塞尔⼆资本协议),规定逾期90天算作违约。
在判别指标上,选择使⽤历史最⼤违约天数。
数据的获取与整合数据描述数据属于个⼈消费类贷款,只考虑评分卡最终实施时能够使⽤到的数据应从如下⼀些⽅⾯获取数据:基本属性:包括了借贷⼈当时的年龄偿还能⼒:包括借贷⼈的⽉收⼊、负债⽐率信⽤往来:两年内35-59天逾期次数,两年内60-89天逾期次数,两年内90天或⾼于90天逾期次数。
财产状况:包括开放式信贷和贷款数量、不动产贷款或额度数量贷款属性:暂⽆其他因素:包括借贷⼈的家庭数量(不包括本⼈在内)原始变量变量名变量类型变量描述SeriousDlqin2yrs y/n超过90天或更糟糕的逾期拖⽋RevolvingUtilizationOfUnsecuredLines percentage⽆担保放款的循环利⽤:除了不动产和像车贷那样除以信⽤额度总和的⽆分期付款债务的信⽤卡和个⼈信⽤额度总额Age integer借款⼈当时的年龄NumberOfTime30-59DaysPastDueNotWorseinteger35-59天逾期但不糟糕的次数DebtRatio percentage负债⽐率MonthlyIncome real⽉收⼊NumberOfOpenCreditLinesAndLoans integer开放信贷和贷款数量,开放式贷款(分期付款如汽车贷款或抵押贷款)和信贷(如信⽤卡)的数量NumberOfTimes90DaysLate integer90天逾期次数:借款者有90天或更⾼逾期次数NumbeRealEstateLoansOrLines integer不动产贷款或额度数量:抵押贷款和不动产放款包括房屋净值信⽤额度NumberOfTime60-89DaysPastDueNotWorse integer60-89天逾期但不糟糕次数:借款⼈在过去两年内有60-89天逾期还款但不糟糕的次数NumberOfDependents integer家属数量:不包括本⼈在内的家属数量时间窗⼝:⾃变量的观察窗⼝为过去两年,因变量表现窗⼝为未来两年数据处理导⼊数据导⼊从kaggle下载cs-training.csv⽂件,去除原始变量中的顺序变量,即第⼀列的X变量。
贷中行为评分卡(B卡)模型
贷中行为评分卡(B卡)模型一、风控业务背景随着新客获客成本越来越高,贷中客户管理越来越重要,包括额度管理(提降额度)、利率调整、提单意愿预测、流失倾向预测、营销响应预测等。
行为评分卡(Behavior Scoring)是一种根据客户在账户使用期间所产生的各种行为,动态预测客户风险的评分模型。
其像是对客户过去一段时间的动态表现录像,然后与其在未来时间的一些状态照片对比。
本文以信用卡和小额信贷分期产品为例,介绍行为评分卡(B卡)的基本知识。
二、信贷场景信贷生命周期管理大致可分为贷前(准入审核、额度授信、支用审批等)、贷中(额度管理、流失预测、营销响应等)、贷后(催收:还款率预测、账龄滚动、失联预测)三个阶段。
图 1 - 信用卡和小额信贷分期产品如图1所示,我们以信用卡和小额信贷分期产品为例,分别介绍两者的特点:1. 信用卡信用卡在审批下卡前的阶段称为贷前,机构(银行、信用卡公司)会对客户风险综合评估,给予一个初始信用额度(如8000元)。
下卡并激活后,进入贷中阶段,期间客户可在信用额度范围内进行透支消费,每两个账单日之间的消费流水账单将在后一个账单日(例如每月8号)通知客户。
账单日至最晚还款日(例如每月26号)前,客户可以随时还款,期间免息。
还款方式一般支持一次性还清和分期还款。
分期还款将产生利息收入,因此对于机构而言,自然是希望客户分期,默认推荐项也就是这个(为提高转化率,UI设计时肯定在右手边)。
一旦客户逾期,那就进入贷后催收阶段。
2. 小额信贷分期在贷前阶段,小额信贷分期产品所产生的每笔支用订单都需审批,通过后才放款到客户手中。
放款后至结清的这段时间称为贷中。
订单具有金额、期限、利率等属性,其约定了出借人和借款人之间的契约。
与信用卡分期还款类似,小额信贷分期产品在每个还款日也必须偿还相应的本金和利息。
在客户发起支用申请订单后,将会生成一张还款计划表,如图2所示。
显然,该还款方式为等额本息,即:在还款期内,每月偿还同等数额的贷款(包括本金和利息)。
个人信用评分模型
个人信用评分表 1、保障支持最高得分为15分(1)住房权利最高得分为8分无房 0分租房 2分单位福利分房 4分所有或购买 8分(2)有无抵押最高得分为7分有抵押 7分无抵押 0分2、经济支持最高得分为34分(1)个人收入最高得分为26分月收入6000元以上 26分月收入3000元~6000元 22分月收入2000元~3000元 18分月收入1000元~2000元 13分月收入300元~1000元 7分(2)月债务偿还情况最高得分为8分无债务偿还 8分10元~100元 6分100元~500元 4分500元以上 2分3、个人稳定情况最高得分为27分(1)从业情况最高得分为16分公务员 16分事业单位 14分国有企业 13分股份制企业 10分其他 4分退休 16分失业有社会救济 10分失业无社会救济 8分(2)在目前住址时间最高得分为7分6年以上 7分2年~6年 5分2年以下 2分(3)婚姻状况最高得分为4分未婚 2分已婚无子女 3分已婚且有子女 4分4、个人背景最高得分为24分(1)户籍情况最高得分为5分本地 5分外地 2分(2)文化程度最高得分为5分初中及以下 1分高中 2分中专 4分大学及以上 5分(3)年龄最高得分为5分女30岁以上 5分男30岁以上 4.5分女30岁以下 3分男30岁以下 2.5分(4)失信情况最高得分为9分未调查 0分无记录 0分一次失信 0分两次以上失信 -9分无失信 9分其他可参考的评分指标项目:1、工作年限(10分)5年以下:2分;6-10年:5分;11-20年:8分;20年以上:10分。
2、债务占资产比例(10分)0%:10分;<15%:5分;15%-50%:2分;>50%:-5分。
3、循环信用透支账户个数(5分)0:5分;1-2:3分;3个:0分;>5个:-5分。
4、信用额度使用率(5分)0-15%:5分;16-50%:3分;50%-80%:0分;>80%:-5分。
评分卡模型
评分卡模型0 引言信用评分模型是消费信贷管理中的先进的技术手段,是银行、信用卡公司、个人消费信贷公司、电信公司、水电服务公司、保险公司等涉及消费信用的企业实体最核心的管理技术之一。
被广泛应用于信用卡生命周期管理、汽车贷款管理、住房贷款管理、个人贷款管理、其他消费信贷管理等领域,在市场营销、信贷审批、风险管理、账户管理、客户关系管理等各个方面都发挥十分重要的作用。
信用评分模型运用先进的数据挖掘技术和统计分析方法,通过对消费者的人口特征、信用历史记录、交易记录等大量数据进行系统的分析,挖掘数据中蕴含的行为模式、信用特征,捕捉历史信息和未来信用表现之间的关系,发展出预测性的模型,以一个信用评分来总和评估消费者未来的某种信用表现。
信用评分本质上是模式识别中的一类分类问题将企业或个体消费者划分为能够按期还本付息(即“好”客户)和违约(即“坏”客户)两类。
具体作法是根据历史上每个类别(如期还本付息、违约)的若干样本,从已知的数据中找出违约及不违约者的特征,从而总结出分类的规则,建立数学模型,用于测量借款人的违约风险(或违约概率),为消费信贷决策提供依据。
1 基于Logistic回归分析的客户信用评价卡模型本文将采用 Logistic 逻辑回归分析方法对小额贷款公司的客户信用进行评价。
首先,建立信用评价模型,给出客户信用评分卡模型,并对客户样本进行初步分类预测。
下面的理论基础和变量选择都以该小额贷款公司为例。
1.1 建模的准备1.1.1 目标变量的定义研究的目标变量为客户是否具有“违约”行为,本文是以客户逾期未归还贷款定义为“违约”行为(即“坏”客户)。
1.1.2 定量指标的筛选方法第一种定量指标的筛选方法:用随机森林法寻找自变量中对违约状态影响最显着的指标。
第二种定量指标的筛选方法:计算变量间的相对重要性,并通过相对重要性的排序,获取自变量中对违约状态影响最显着的指标。
第三种定量指标的筛选方法:通过自变量间的广义交叉验证法,获取自变量中对违约状态影响最显着的指标。
python评分卡模型
python评分卡模型信⽤风险计量模型可以包括跟个⼈信⽤评级,企业信⽤评级和国家信⽤评级。
⼈信⽤评级有⼀系列评级模型组成,常见是A卡(申请评分卡)、B卡(⾏为模型)、C卡(催收模型)和F卡(反欺诈模型)。
今天我们展⽰的是个⼈信⽤评级模型的开发过程,数据采⽤kaggle上知名的give me some credit数据集。
⼀、建模流程典型的信⽤评分卡模型如图1-1所⽰。
信⽤风险评级模型的主要开发流程如下:(1) 获取数据,包括申请贷款客户的数据。
数据包括客户各个维度,包括年龄,性别,收⼊,职业,家⼈数量,住房情况,消费情况,债务等等。
(2) 数据预处理,主要⼯作包括数据清洗、缺失值处理、异常值处理、数据类型转换等等。
我们需要把原始数据层层转化为可建模数据。
(3) EDA探索性数据分析和描述性统计,包括统计总体数据量⼤⼩,好坏客户占⽐,数据类型有哪些,变量缺失率,变量频率分析直⽅图可视化,箱形图可视化,变量相关性可视化等。
(4) 变量选择,通过统计学和机器学习的⽅法,筛选出对违约状态影响最显著的变量。
常见变量选择⽅法很多,包括iv,feature importance,⽅差等等 。
另外缺失率太⾼的变量也建议删除。
⽆业务解释性变量且没有价值变量也建议删除。
(5) 模型开发,评分卡建模主要难点是woe分箱,分数拉伸,变量系数计算。
其中woe分箱是评分卡中难点中难点,需要丰富统计学知识和业务经验。
⽬前分箱算法多达50多种,没有统⼀⾦标准,⼀般是先机器⾃动分箱,然后再⼿动调整分箱,最后反复测试模型最后性能,择优选取最优分箱算法。
(6) 模型验证,核实模型的区分能⼒、预测能⼒、稳定性、排序能⼒等等,并形成模型评估报告,得出模型是否可以使⽤的结论。
模型验证不是⼀次性完成,⽽是当建模后,模型上线前,模型上线后定期验证。
模型开发和维护是⼀个循环周期,不是⼀次完成。
(7) 信⽤评分卡,根据逻辑回归的变量系数和WOE值来⽣成评分卡。
风控模型---贷后催收模型
风控模型---贷后催收模型做过风控模型或者有过这⽅⾯基础的同学们应该都知道评分卡其实也分很多种,按照时间线来划分的有:申请评分卡—> 欺诈评分卡—> ⾏为评分卡—> 市场评分卡—> 催收评分卡(⼜分为失联模型、还款率模型、是否还款模型、迁徙率模型)本⽂主要介绍的是催收评分卡:⼀、⽬标变量定义:衡量还款能⼒客户为正负样本,这⾥⾯正负样本的定义很重要,所以在做模型⼯作之前需要把正负样本的定义和业务⽅⾯沟通,根据实际情况定义好正负样本。
⼆、数据预处理:缺失值以及⼀致性⾼的特征处理:如果特征超过50%是缺失的,则删除该特征;剩下的特征分两步⾛,离散型数据⽤众数填充,连续型特征⽤KNN⽅法填充。
另外,对⼀致性⾼的特征处理:删除⼀致性很⾼的特征,因为这些特征对于⽬标变量没有预测能⼒。
在进⾏分箱之前,应该先对数据集进⾏切分,划分为训练集和测试集。
从训练数据进⾏woe和iv,之后对iv进⾏特征选择。
我看到很多博客⾥⾯的内容是不在这⼀步划分训练和测试集,⽽是在⼊模型的时候才划分,我觉得那样做的话,在做分箱这⼀步相当于看了测试集的结果,会造成过拟合。
#划分训练集和测试集train_x,test_x,train_y,test_y=train_test_split(data.iloc[:,1:],data.iloc[:,0],train_size=0.7)train=pd.concat([train_y,train_x],axis=1)train=train.reset_index(drop=True)test=pd.concat([test_y,test_x],axis=1)test=test.reset_index(drop=True)WOEWOE(weight of Evidence)字⾯意思证据权重,对分箱后的每组进⾏。
假设good为好客户(未违约),bad为坏客户(违约)。
#good(i)表⽰每组中标签为good的数量,#good(T)为good的总数量;bad相同。
企业信用评分卡模型实战(python,附代码)
企业信⽤评分卡模型实战(python,附代码)企业信⽤评级在全球⾦融领域有⼴泛应⽤。
它涉及到公司管理,企业债发⾏,企业融资,企业上市,企业并购,个⼈炒股和购买公司债券等多个场景。
企业债发⾏ 企业主体信⽤评级越⾼,意味着该企业抗风险能⼒、盈利能⼒越强,发债融资成本越低。
作为企业董事会,管理者,决策者应该了解企业主要财务指标,了解⾃⾝企业评级。
企业发债时都需要评级。
国内评级这块主要分为AAA、AA+、AA、AA-、A+。
企业评级过低会限制某些⼯具的发⾏额度、交易场所可质押性等等 如果是评级太低,企业发⾏债券没⼈买。
⽬前⼴⼤投资者的投资门槛是AA。
企业上市 企业上市融资时也需要信⽤评级。
⽬前国内只有优质企业才能上市融资,上市牌照是很难拿的。
如果财务指标和资质不达标,则不能上市。
企业并购 企业并购是企业之间的兼并和收购⾏为。
如果收购⽅不能很好了解对⽅企业评级,买来的企业可能是包装过的垃圾企业。
失败企业并购会让企业背上巨⼤债务负担。
个⼈炒股 个⼈炒股投资者如果不懂企业评级,也难以买到优质股,容易被⼈忽悠买到垃圾股。
建议不会数据科学的⼈趁早离开股市和⾦融投资,否则可能⽋下巨额债务。
如果个⼈通过学习机器学习模型,可以识别有价值企业,股票,债券,财富升值概率显著⾼于不懂模型的⼈。
企业信⽤评级模型如何搭建?企业如何才能通过信⽤评级? 标准普尔、穆迪,惠誉国际,中诚信等知名评级机构的评级规则如何破解?欢迎各位同学学习python信⽤评分卡建模视频系列教程(附代码, 博主录制) :公司管理者应该学习企业信⽤评级企业主体信⽤评级越⾼,意味着该企业抗风险能⼒、盈利能⼒越强,发债融资成本越低。
作为企业董事会,管理者,决策者应该了解企业主要财务指标,了解⾃⾝企业评级。
国内评级这块主要分为AAA、AA+、AA、AA-、A+。
如果是评级太低,企业发⾏债券没⼈买。
⽬前⼴⼤投资者的投资门槛是AA如果财务指标和资质不达标,则不能上市。
商业银行信用风险评估模型
商业银行信用风险评估模型商业银行信用风险评估模型的建立主要包括以下几个关键步骤:1. 数据采集和预处理:首先,需要收集借款人的基本信息,如个人资产负债表、现金流量表和经营业绩报表等。
同时,还需获取借款人的信用报告和借款申请表等相关文件。
然后,对这些数据进行预处理,包括数据清洗、转换和标准化等,以确保数据的准确性和一致性。
2. 特征工程:在数据处理的基础上,需要从大量的特征中选取相关的、有区分度的特征,以提高模型的准确性和预测能力。
常用的特征包括借款人的年龄、性别、收入水平、教育背景、婚姻状况等,以及借款人的信用历史、财务指标、借款需求等。
3. 模型选择和训练:根据评估目标和数据特点,选择合适的信用风险评估模型进行建模。
常见的模型包括逻辑回归模型、决策树模型、支持向量机模型和神经网络模型等。
然后,使用训练数据对模型进行训练,以优化模型的参数和超参数,并使用交叉验证等方法评估模型的性能。
4. 模型评估和验证:使用验证数据集对建立的模型进行评估和验证,计算模型的准确率、召回率、精确率和F1值等指标,以评估模型的性能和稳定性。
如果模型的表现不佳,需要对模型进行优化和调整,如增加样本量、调整模型参数等。
5. 模型应用和监控:在模型验证通过后,可以将其应用于实际的信用风险评估中。
在实际应用过程中,需要对模型进行监控和更新,以适应市场变化和风险变化。
同时,还需要建立合理的模型评估指标体系,对模型的表现进行定期评估和追踪。
综上所述,商业银行信用风险评估模型是通过采集和处理借款人的基本信息,选取合适的特征,并使用合适的模型进行训练和评估,以预测借款人的信用风险水平。
模型的建立需要充分考虑数据的质量和模型的选取及优化,以提高评估的准确性和效果。
同时,模型的应用和监控也是不可忽视的,以确保模型的长期有效性和稳定性。
商业银行信用风险评估模型的建立与实施需要综合考虑多个因素和环节。
首先,数据的质量和可靠性对模型的精确性和预测能力至关重要。
客户层申请评分卡(A卡)模型
客户层申请评分卡(A卡)模型一、风控业务背景不夸张地说,贷前风控可覆盖80%的风险,这是业内普遍共识,当然更是信贷风控的内在需要,毕竟放款后就只能靠催收尽可能减少损失,而放款前能做到避免资损。
申请评分卡(Application Scoring)就像是在申请时给消费者照一张相,然后与借款后一段时间的另一张照片对比。
它只是将申请者的静态特征与未来固定时期后的静态状态的好坏标签进行比较。
目前,鲜有资料讨论如何构建产品层、客户层A卡。
本文以贷前授信风控模型为例,介绍客户层申请评分卡的一些构建思路。
二、产品层和客户层评分概述在风控建模中,我们需要明确3个基本点:样本观察点是什么?X(特征)是什么?Y(好坏标签)是什么?1. 模型分类根据是否用到多个产品的订单建模,信用评分模型可以分为2个层次:产品层:评估借款人在某个产品上的违约风险。
客户层:评估借款人在所有产品上的违约风险。
图 1 - 客户-产品-订单之间的对应关系2. 样本观察点模型本质是学习拟合X和Y之间的关系,而样本观察点决定了模型学习哪部分群体的模式。
在授信模型中,样本观察点一般选择授信日。
确定观察点后,我们也就能确定截止观察点前,可以采集到的数据,从而构建特征X。
3. 好坏定义在风控建模中,我们都是根据支用放贷订单(或叫借据)的还款表现来定义好坏,并训练一个二分类概率模型预测违约概率(Probability of Default,PD)。
不同于对猫、狗这样明确的0-1标签,信贷风控追求的是风险与收益之间的平衡,因此好坏定义常常是模糊的。
原因在于,坏的客群虽然能带来坏账损失,但同时也能带来利息、罚息等收入。
那么,我们能接受多坏的客群呢?这就取决于风险容忍度。
因此,我们才会做滚动率分析、Vintage分析等。
二、同一产品客户层授信模型风控特征—时间滑窗统计特征包含了观察期、观察点及表现期这三者的概念,这是建模的基础知识。
对于贷前授信模型而言,我们分别定义为:1.观察点:授信日,指客户在此时提交申请资料,希望能获得金融机构授信资格。
信用评级模型介绍课件
支持向量机模型的优缺点
优点
SVM模型具有较强的泛化能力和分类性能,在信用评级中能够取得较好的效果; 同时,SVM模型对于非线性问题也有很好的处理能力。
THANKS
感谢观看
缺点
模型的解释性较差,难以直观理 解模型的决策逻辑;同时,模型 的训练时间较长,需要较大的计 算资源。
06
模型评估与选择
模型评估指标
01
02
03
04
准确率
评估模型预测正确的比例,是 模型最基本的评估指标。
召回率
评估模型在所有正样本中预测 正确的比例,适用于关注少数
重要样本的场景。
F1分数
综合考虑准确率和召回率的评 估指标,是模型综合性能的度
客户信用评级
基于客户的征信信息、交易记录等,构建逻辑回归模型,对客户进 行信用评级,以制定相应的授信政策。
逾期预测
利用逻辑回归模型,对借款人逾期还款的可能性进行预测,提前采 取风险控制措施。
逻辑回归模型的优缺点
优点 • 解释性强:逻辑回归模型的参数具有明确的统计学意义,便于解释和理解。
• 计算效率高:模型训练过程中,通常采用梯度下降等优化算法,计算效率较高。
前向传播算法 神经网络模型通过前向传播算法,将输入数据的 特征提取并逐层传递,最终输出预测结果。
反向传播算法 通过反向传播算法,神经网络可以计算预测误差, 并调整网络中的权重参数,以最小化预测误差。
神经网络模型在信用评级中的应用
特征提取
01
神经网络模型可以从大量的财务数据中提取有效的特征,用于
评分卡模型——精选推荐
评分卡模型⼀、评分卡模型PS:核⼼点在于我们需要⼀个判别指标来对数据进⾏打标签分类1、项⽬简介:信⽤评分技术是⼀种应⽤统计模型,其作⽤是对贷款申请⼈做风险评估分值的⽅法。
在互⾦公司等各种贷款业务机构中,普遍使⽤信⽤评分,对客户实⾏打分制,以期对客户有⼀个优质与否的评判。
评分卡主要分为三类A卡(申请评分卡)、B卡(⾏为评分卡)、C卡(贷后评分卡)。
我们主要讨论的是A卡即申请评分卡,⽤于贷前审批阶段对借款申请⼈的量化评估;2、评分卡原理:申请评分卡是⼀种统计模型,它可基于对当前申请⼈的各项资料进⾏评估并给出⼀个分数,该评分能定量对申请⼈的偿债能⼒作出预判。
客户申请评分卡由⼀系列特征项组成,每个特征项相当于申请表上的⼀个问题(例如,年龄、银⾏流⽔、收⼊等)。
每⼀个特征项都有⼀系列可能的属性,相当于每⼀个问题的⼀系列可能答案(例如,对于年龄这个问题,答案可能就有30岁以下、30到45等)。
在开发评分卡系统模型中,先确定属性与申请⼈未来信⽤表现之间的相互关系,然后给属性分配适当的分数权重,分配的分数权重要反映这种相互关系。
分数权重越⼤,说明该属性表⽰的信⽤表现越好。
⼀个申请的得分是其属性分值的简单求和。
如果申请⼈的信⽤评分⼤于等于⾦融放款机构所设定的界限分数,此申请处于可接受的风险⽔平并将被批准;低于界限分数的申请⼈将被拒绝或给予标⽰以便进⼀步审查。
3、开发流程:导⼊数据集→数据预处理→数据探索→特征⼯程→建⽴模型→建⽴评分卡4、流程demo:4.1、数据集导⼊4.2、数据预处理1) 查看数据信息了解数据信息状态,包括数据量、数据维度、数据特征类型等等2) 缺失值处理对于缺失值较少的‘家属数量’我们可以直接删除缺失值。
及对数据集进⾏去重处理。
3) 异常值检测及处理利⽤箱型图对特征进⾏可视化来检测异常数据。
通过以上特征可视化我们可以对明显偏离的样本,⽐如年龄为0,或是逾期次数过⾼进⾏盖帽或者是删除操作4.3、数据可视化分析1) 单变量可视化可以看出:(1) 客户主体集中在⽉收⼊10000以下的⼈群,⽉收⼊在15000之前的坏客率和⽉收⼊呈负相关收⼊越⾼坏客率越低,后进⼊⼀段平稳(2) 当收⼊超过20000后,坏客率⼜在上升。
风控建模—行为评分卡(B卡)简单记录
风控建模—行为评分卡(B卡)简单记录最近在做行为评分卡,查阅网上各种资料,发现大多都是介绍准入模型的,对于B卡的介绍很少,而且具体的取样方法及观察点的确定说的也模糊不清。
今天简单记录一下我做的行为模型过程,着重介绍观察点及取样的方法,以作备忘。
行为卡主要在用户申请提现之后,依据其在账户使用期间所产生的各种行为来预测未来风险的一种评分模型。
本文以小额信贷分期产品为例,介绍一下B卡的开发流程。
1. B卡模型的业务背景a.小额信贷产品场景介绍b.B卡适用产品和客群c.B卡适用的场景2.B卡模型的设计3.模型特征开发4.模型开发流程1. B卡模型的业务背景1.1 小额信贷产品场景介绍在小额分期场景中,用户的生命管理周期可分为贷前、贷中、贷后三个阶段,每家公司对于这三个阶段的定义稍有不同,本文定义如下:— 1 —贷前:机构对新注册的用户进行授信审批,给予一个初始信用额度(授信阶段),之后用户进行第一次金额支用,机构对其进行支用审批,这笔支用订单包含了金额,利率,期限等属性。
用户支用成功后会生成一张还款计划表,该还款方式如果为等额本息,则每月还相同的本息。
此阶段的用户被称为新客,很多机构将新客的授信,距授信3个月内用信订单环节称为贷前。
贷中:新客转化为老客后,就进入到了贷中阶段,每家机构对老客的定义不同,有些把复贷的作为老客,有些则要求新客还款N期后才转为老客。
小额信贷分期属于循环贷产品,即在额度允许的范围内,用户可支用申请多笔订单,用户申请新的一笔订单之前,机构会参考其历史账单的还款行为,若存在在逾未还账单,则用户势必会被拒绝,该决策考虑的因素有两个:一是及时止损,老订单的损失还未挽回,新订单大概率会造成进一步损失,二是用户未还清账单还来借款,说明其现金流出现问题,很可能在借新钱还旧债。
老客的支用,额度管理,营销转化、流失预警和挽回都属于贷中阶段。
贷后:新老客的账单出现逾期,即进入贷后的催收管理,催收员会根据不同的逾期程度,采取不同的催收措施。
个人信用评分模型
常用的预测信息的原始数据元素
• (3)信用申请人的特征是否发生了变化?是否有更多分值低的消费者申请 贷款但是 被拒绝了?他们的特征是什么?
• (4)账户的信用分值的分布是否发生了变化?
个人欺诈评分模型构建
• 欺诈是信用卡公司面临的一个严峻的问题,包括申请欺诈、信 用卡丢失、信用卡被 盗、信用卡伪造、信用卡机密信息被盗、 账户被窃取等。不管何种欺诈类型,归根结底, 都是通过欺诈 性的申请或欺诈性的使用信用卡交易来实现的。
• 在这种定义下,银行准确地记录第一次欺诈日 就非常关键。当 然,如果银行的数据库系统能翔实地记录每一次核实的欺诈交
困难和对策
• 由于交易欺诈“大海捞针”的特点,即大量的交易中只有极少部分是欺诈 性交易, 所以交易欺诈风险评分模型往往使用极精细极复杂的模型技术, 主要利用机器学习和神经网络模型技术,这需要极大的样本量,样本个数 往往达数百万个交易。
• 在实际建立个人信用评分模型时,往往将多种方法交叉使用。例如,可以 使用“分类树方法”选择变量,以确定变量之间的相互关系,构造出新的 变量。再将这些新变量 和原始变量一起使用,通过回归的方法构建出预 测模型。然后,把预测模型产生的结果 与神经网络模型产生的结果进行 比较,以确定模型的有效性,并对模型进行改进。
个人信用评分模型构建
• 在了解个人信用评分模型之前,需要了解“信用评分卡”的概 念。在消费者信用评 分过程中,信用评分卡是一种表格,由描 述借款人状况的各个特征变量的不同取值对应 的信用分值所组 成。使用信用评分卡可以计算不同借款人的信用评分分值。
• 个人信用评分模型的建—立是市场分析人员、风险管理经理、 统计—学家、数据库管理 人员和计算机程序员等多个领域的专 家综合协调的结果。为了保证个人信用评分模型的 顺利开发和 应用,必须对建模过程的每个部分进行仔细的设计和计划
信用评分模型监控
信用评分模型监控信用评分模型监控报告可以从观察期间的稳定度(前端监控报告)与表现期间的鉴别度(后端监控报告)两个方面对各项指标进行监控。
目录一、前端监控报告1.1 评分分布表(SDR)1.2 群体稳定度指标(PSI)1.3 变量稳定度分析1.4 人工否决分析1.5 数据输入错误率分析1.6 产品大事记二、后端监控报告2.1 好坏客户评分分布表2.2 母体鉴别度分析2.3 变量鉴别度分析2.4 好坏概率与评分分析2.5 人工否决表现分析一、前端监控前端监控报告可以在模型上线后一个月开始执行,目的是观察申请客户或者近期客户的类型与模型开发样本是否一致,避免客群发生剧烈波动而导致模型失效的情况发生。
评分分布表评分分布表是统计各个评分组别的评分客户数及其占全体户数的比率。
上图中,开发样本中500-549组别中客户占比为1.48%,而现行客户中此组别占比为2.53%,左右两列对比观察发现“高评分组别占比减少,且客户占比向低评分组别移动”,其具体原因需要根据变量稳定度分析来进行更详细的分析。
评分分布表也可以采用条形图的方式,更加直观清晰。
群体稳定度指标(PSI)群体稳定度指标是用来衡量整体评分卡在开发样本时点与现行评分时点的客户占比的差异程度,PSI越小表示越稳定。
一般PSI小于0.1说明群体之间无明显变化,较为稳定;PSI大于0.25说明群体之间有显著变化,需要进行评分模型的调整;介于0.1-0.25之间说明有波动,需要密切观察稳定性。
PSI的公式为:此外还可以每月对PSI进行监控,现行样本就是当月样本,开发样本就是当月之前的所有样本,将个月份的PSI绘制成一条折线,便于观察PSI趋势的变化。
需要注意的是,PSI只显示母体分布是否发生明显波动,并不能表现是往高分组还是低分组移动,需要搭配上面的评分分布表才能够判断变化方向。
变量稳定度分析母体分布出现波动并不代表模型内所有变量均发生不稳定波动,可以通过变量稳定度分析来确定是什么变量造成母体分布偏移,方法和PSI类似但是公式略有不同。
金融评分卡模板
金融评分卡模板篇一:评分卡评分卡姓名:班级:评分卡姓名:班级:篇二:信用评分卡介绍信用评分卡信用评分是指根据银行客户的各种历史信用资料,利用一定的信用评分模型,得到不同等级的信用分数,根据客户的信用分数,授信者可以通过分析客户按时还款的可能性,据此决定是否给予授信以及授信的额度和利率。
虽然授信者通过人工分析客户的历史信用资料,同样可以得到这样的分析结果,但利用信用评分却更加快速、更加客观、更具有一致性。
一、引进信用评分卡的目的及意义1、由于零售信贷业务具有笔数多、单笔金额小、数据丰富的特征,决定了需要对其进行智能化、概率化的管理模式。
信用评分模型运用现代的数理统计模型技术,通过对借款人信用历史记录和业务活动记录的深度数据挖掘、分析和提炼,发现蕴藏在纷繁复杂数据中、反映消费者风险特征和预期信贷表现的知识和规律,并通过评分的方式总结出来,作为管理决策的科学依据。
2、目前国内大多数银行信用卡部门采取人工审批作业形式,审批依据是审批政策、客户提供的资料及审批人员的个人经验进行审批判断,存在以下问题:(1)信审人员对申请人所提交申请资料真实性的认定基本依赖于受理申请资料的信贷业务员的职业操守和业务素质,审批人员对申请人资料的核实手段基本依赖于电话核查,对申请核准与否基本依赖于自己的信审业务经验,授信审查成本高、效率低而又面临很大的欺诈风险,这种状况很难应对年末所谓的“行业旺季”中大规模集中的小额贷款业务需要。
(2)审批决策容易受主观因素影响、审批结果不一致,审批政策调控能力相对薄弱。
(3)不利于量化风险级别,无法进行风险分级管理,影响风险控制的能力及灵活度,难以在风险与市场之间寻求合适的平衡点。
(4)审批效率还有较大提升空间。
3、信用评分卡具有客观性,它是根据从大量数据中提炼出来的预测信息和行为模式制定的,反映了借款人信用表现的普遍性规律,在实施过程中不会因审批人员的主观感受、个人偏见、个人好恶和情绪等改变,减少了审批员过去单凭人工经验进行审批的随意性和不合理性。