人工智能在信贷业务风控的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人工智能在信贷业务风控的应用
目录
1 / 模型算法介绍
2 / AI应用于信贷业务风控
•逻辑回归(Logistic Regression)是业界最常用的传统定量评分模型的建模方法;
•通过逐步回归(Stepwise)等过程选择出最显著的评分变量,并基于最大似然估计(MLE)拟和各个变量的回归系数。
评分校准
模型训练与验证
模型设计
数据分析
•数据抽取与整合•数据诊断/清洗•特征变量衍生
•双变量分析
•变量筛选
•模型训练
•评分结果校准
Base Score: 600
GB Odds=20:1
PDO=20
•目标变量定义
✓GB 定义
✓Exclusion设定
•建模样本抽样设计
1、模型算法介绍
√ 决策树(Decision Tree)
决策树模型是对总体进行连续的分割(partition),以预测一定目标变量结果的统计技术。
决策树一般包含若干个层次的“枝叶”,同一“枝叶”内的个体十分相似(目标变量值接近),而不同“枝叶”之间的个体则存在较大的不相似性(目标变量值相距较远)。
决策树法的决策程序如下:
(1)绘制树状图,根据已知条件排列出各个方案和每一
方案的各种自然状态。
(2)将各状态概率及损益值标于概率枝上。
(3)计算各个方案期望值并将其标于该方案对应的状态
结点上。
(4)进行剪枝,比较各个方案的期望值,并标于方案枝
上,将期望值小的(即劣等方案剪掉)所剩的最后方案为最佳方案。
决策树案例图-预测用户是否具备还贷能力
1.1、决策树模型
1.2、神经网络模型
√ 神经网络
神经网络模型是一种把各种投入要素通过复杂的网络转换成产出的信息加工结构,它的模型方法起源于科研人员对人脑和神经系统如何加工信息的研究,后来被应用于数据挖掘领域,在信用卡模型技术中占有一席之地,特别是在反欺诈预测模型中大展身手。
1.3、聚类分析K-means
√ 聚类分析
聚类分析属于探索性的数据分析方法。
通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。
聚类结果要求组内对象相似性较高,组间对象相似性较低。
在面对难题的时候,人们喜欢把一个对象分割成较小的块, 分而治之。
聚类法的基本原理是:把一个大的帐户群体分割成一些较小的块,对每个块进行分析,并建立针对性的策略。
一个广泛应用的聚类方法是K-Means法,最先由J. B. MacQueen在1967年开发。
1.4、随机森林算法
√随机森林(Random Forest)
随机森林由多棵决策树组成,每棵决策树擅长特定人群、重点关注特定变量,然后一起决策,作出最终判断。
随机森林在构建每棵决策树时,通过样本和变量两个维度进行随机抽样。
随机森林的优点是训练速度快,可以很好地进行并行化,能够处理大规模数据。
随机森林顾名思义,是用随机的方式建立一个森
林,森林里面有很多的决策树组成,随机森林的
每一棵决策树之间是没有关联的。
在得到森林之
后,当有一个新的输入样本进入的时候,就让森
林中的每一棵决策树分别进行一下判断,看看这
个样本应该属于哪一类(对于分类算法),然后
看看哪一类被选择最多,就预测这个样本为那一
类。
1.5、机器学习算法
√机器学习(Machine Learning, ML)
机器学习是一门多领域交叉学科。
专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
机器学习算法最有名的例子是Google公司的Alpha Go。
阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由
谷歌(Google)旗下DeepMind公司的戴维·西尔弗、
艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程
序利用“价值网络”去计算局面,用“策略网络”去选
择下子。
目录
1 / 模型算法介绍
2 / AI应用于信贷业务风控
拓展客户
管理客户
审批客户
生命周期
管理决策
评分模型
信息反馈
目标客户?产品/激励?
利率/年费/其他收费?邮寄与否?
批准与否?定价?
初始信用额度高低?交叉销售?
信用局风险评分信用局收益评分信用局破产评分市场反应评分转账倾向评分
申请风险评分信用局风险评分信用局收益评分
提高/降低信用额度?交易授权?超额透支授信?反欺诈?重新定价?激活/挽留?坏账催收?续发信用卡?
行为风险评分行为收益评分行为流失倾向评分信用局风险评分信用局收益评分
2.1、案例:模型在信用卡的生命周期管理中的应用
提高风险识别能力提高运营效率减少运营成本增加收益
利率定价
自动审批拒绝
额度政策•申请评分越高,审批通过率也越高。
•
申请评分模型应用于各业务条线的审批阶段,主要包括自动审批拒绝、额度及利率策略等。
某机构小微金融业务审批通过率和评分卡关系
2.2、案例:模型应用于审批准入
2.3、反欺诈的方法论和交叉验证-BBD应用案例
•BBD(成都数联铭品科技有限公司)成立于2013年,是一家专注服务于金融行业和政府机构的大数据综合服务提供商。
BBD的合作伙伴包括发改委、海关、人民银行等政府机构。
•BBD是国家发改委的战略合作伙伴与数据共享方,2016年12月与发改委签订的战略合作协议中,双方将依托全国信用信息共享平台,围绕联合奖惩“红黑名单”等信用信息进行共享,并建立企业诚信评价体系,对企业诚信风险、信用风险分别进行评价。
•BBD使用大数据、人工智能等新技术,基于企业关联关系,用图计算的方法搭建图层,用机器学习的方式在企业行为事件中寻找、预测下一个反洗钱事件的概率,做到事前预测,事中监管和事后处理,为国内外反洗钱行为监管提供有力技术支持。
动态本体模型
非结构化数据处理加工(NLP)
结构化数据清洗整合
谱系算法模型
客户谱系——基于大数据的精准场景服务(提供联合建模)客户尽职调查
贸易背景真实性
调查
财务会计审计
风险预警监控
信贷准入5000余万
商事主体
1.5亿
企业关联自然人
企业关联
知识库
2.9亿
投资、任职关系链
1100万
疑似关系链
“权益法”
算法
递归穿透
优化算法
实际控制人
模型
受益所有人
规则模型
最短关联
路径算法
最强全局
路径算法
“企业关联方”
规则模型
“一致行动人”
规则模型
节点关联度
模型
企业全景谱系
企业股权架构
实际控制人
关联方
集团派系
产业谱系
产业谱系
风险传导
集团谱系
2.4、反欺诈的方法论和交叉验证-知识图谱网络模型应用案例(知因智慧)
2.5、反欺诈的方法论和交叉验证-人脸识别
浙商银行成功将“人脸生物特征识别+后台人工审核”相结合的双重验证模式引入到直销银行手机客户端的新用户注册环节。
生物识别技术目前已广泛应用于金行业账户开立环节,随着未来生物识别技术的成熟以及多元化交错发展,能够更好更准确地满足商业银行合规管理KYC(了解你的客户)的要求。
•早期预警策略是基于行为评分模型所设计的。
•
应用早期预警模型评分能够对现有未逾期客户进行风险细分,在账户表现没有恶化之前,识别高风险的客户。
•
对预警发现的问题客户需要进行后续调查,进一步确认风险,从而确认采用何种后续的动作。
•
通过调查核实后,调高风险分类级别,早期转移到催收系统。
未逾期账户
账龄小于6个月
账龄大于6个月
行为评分风险划分
判断是否曾逾期
评分低风险评分中风险
评分中高风险
评分高风险
曾经发生逾期首次还款逾期
未曾发生逾期征信未有不良
征信存在不良
一般风险余额极高风险余额预警优先级1
预警优先级2预警优先级3
预警优先级2预警优先级4预警优先级5预警优先级1
预警优先级2预警优先级4
2.6、大数据风控-早期预警策略
账单周期开始
还款到期
1 -29天
30 -90天
90+天
核销
催收管理时间轴
风险预警
•信用风险评估•资产质量监控•高风险群体预警
与行动早期欠款
•客户关系的维护及客户保留•自愈
•对高风险客户进行积极催收
中期欠款
•协议还款•风险缓释: 抵质押物跟踪管控
晚期欠款
•资产保全•处置/收回•协议还款
•诉讼/法务催收•第三方代理
清收
•债务出售•核销
•资产处置:车辆
拍卖
催收评分模型是催收策略的基础,不同的催收阶段策略目标点会有差异:
2.7、大数据风控-催收管理
2.8、大数据风控-智能不良资产管理平台
奕资管是为银行/互金(B)、投资方(I)和处置方(C)提供不良资产精准评估及优化处置的2B软件/SaaS平台。
它利用大数据模型及智能在时间和空间上制定全局优化策略,用于匹配不良资产处置资源,最终提高不良资产的评估精度和处置效益。
在保证各方数据安全的前提下,通过半透明的数据联结方式加工、过滤敏感信息,打通B/I/C之间的信息壁垒。
通过案件智能匹配、联络及处置手段优化、全流程进度管控等自主研发的核心功能,为客户全方位优化催收策略和提升工作效率,以最大化回款收益。
在产品的各功能模块中,应用目前流行的模型及算法,包括传统模型、GBM模型、聚类算法、深度学习模型等,并通过集成算法对多个模型进行整合以提升模型表现。
小结
关于人工智能应用于信贷管理的问题思考1)数据挖掘和人工智能技术的关系;
2)人工智能技术对传统风险评级模型带来的挑战;
3)AI技术和传统信贷审批和管理经验的挑战;
4)数据获取、客户授权和客户隐私问题。
谢谢。