信用评分模型的开发流程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
26
通常需要分配下列任务:
✓检查、评估现行的信贷政策和管理流程.并依据评分模型管 理的需要做出修改,确立所需要的新管理流程。
✓把信用评分模型编写成合适的软件程序并在银行的IT系统里 面实施。
✓对模型的实施进行稽核,以保证实施程序的完全正确。 ✓监督数据的加工、监督每天评分的计算和分布。 ✓生产前台评分跟踪报告,评估和监控评分分布的变化、模型 针对客户群体的变化、批准率或其他模型管理指标的变化等。
15
分析单个变量的预测能力
16
五、模型的检验
模型的检验有两种方式: ➢ 样本内检验
利用模型开发所用的样本来对比预测情况与实际 情况的差别,属于样本内检验。
➢ 样本外检验 利用事先预留的、不用于模型开发而只用于模型 检验的样本来对比预测情况与实际情况的差别, 属于样本外检验。
17
五、模型的检验
8
从信用卡行为信息中提炼的预测变量
9Baidu Nhomakorabea
衡量还款能力的预测变量
10
衡量还款意愿的预测变量
11
二、模型的变量
➢ 静态的,只衡量当前的信息 ➢ 动态的,衡量一定时期以来的发展趋势 ➢ 提炼出来的变量要有预测性,与目标变量有较强的
相关性和逻辑因果关系,而且具备稳定性,能够经 受时间的考验。
12
三、模型的分组
一个变量作为模型候选之用,这样可以大大减少候选变量的数 目,有效解决多维相关性的问题,而又不遗漏过多有效的信息。 3. 选择适当的模型方法 线性回归分析、非线性回归分析、逻辑回归模型、神经网络模型、 决策树模型、判别分析、线性规划、非线性规划等 对于二元性结果的预测,最流行的是逻辑回归模型和神经网络模型 4. 确定模型的变量组合和权重
选择样本的原则: 1. 样本的代表性
➢ 代表过去 ➢ 代表未来 2. 样本的充分性 3. 样本的时效性 4. 样本的排除性 5. 样本的表现推测性
3
二、模型的变量
信用评分模型的变量主要有两种: ➢ 表现变量(因变量)
模型所要预测的结果,它可以是二元性的结果, 也可以是连续性的结果。 ➢ 预测变量(自变量)
预测力弱的模型好坏区分度
22
五、模型的检验
拟合度曲线 ➢ 衡量模型预测精确度的曲线,它把账户按评分从低
到高排列,划分成若干栏位,对比每个评分栏位上 所预测的坏账率与实际上的坏账率。 ➢ 模型预测的坏账概率接近于实际坏账率,说明模型 的预测准确度也较好。
23
风险评分模型的拟合度曲线
24
六、模型的实施与跟踪
✓生产后台评分检验报告,评估模型的预测效果、评分否决的 状况和效果、评分模型运用策略的效果等。
✓对管理人员、技术人员和业务人员进行关于信用评分模型的 实施和管理方面的培训,让相关人员了解信用评分模型的相关 知识和技术。
27
信用评分模型实施步骤一览表
28
29
六、模型的实施与跟踪
➢ 制定信贷政策 1. 明确管理目标 目标必须是现实的、清楚的、具体的,必须针对 评分卡所针对的信贷业务,必须满足银行运营环境 的限制。 2. 根据目标制定信贷政策 制定如何使用信用评分模型的政策 3. 决定政策性批准或政策性拒绝的标准 4. 处理缺失信息
从可观察到的信息中提炼出来的、与表现变量 有较强相关性的、用来预测未来结果的变量。
4
二、模型的变量
表现变量的界定: ➢ 第一,“坏”的定义必须与银行的总体政策目标相一致。
“坏”的定义是由市场营销部门、风险管理部门、 债务催收部门等共同协商,并综合考虑各方面因素后决 定的。 ➢ 第二,“坏”的定义必须考虑到表现期的长短。 ➢ 第三,“坏”的定义必须考虑到期终表现与期中表现。 ➢ 第四,“坏“的定义必须考虑到某些群体的不可确定性。 ➢ 第五,“坏”的定义必须简明,不宜过于复杂。
5
二、模型的变量
预测变量的提炼: ➢ 主要靠分析人员的直觉、长期经验的积累和数据挖掘
技术的应用。 ➢ 直接从原始数据中获得 ➢ 从信用局的记录里面提炼 ➢ 从银行内部的信贷账户主档案中记录的行为信息里面
提炼 ➢ 衡量消费者还款能力 ➢ 衡量消费者还款意愿
6
直接的预测变量
7
从信用局记录中提炼的预测变量
(一)正确的事实包括几大要素: 1. 管理人员的重视和支持 2. 相关实施人员的培训 3. 模型的稽核 4. 模型的书面记录 5. 模型的跟踪监控和管理信息系统
25
六、模型的实施与跟踪
(二)信用评分模型的实施与管理 ➢ 组织计划 1. 指定一个信用评分模型经理人员 2. 给相关人员明确分配在信用评分模型实施与管理上的分工 与责任 3. 取得内部共识和支持 4. 系统性地、有条不紊地落实模型实施和管理的各个步骤 5. 计划评分支持系统 6. 协调各分支机构的评分工作 7. 保护评分卡的安全 8. 计划把数据保留在数据库里 9. 计划改变申请表的信息
1
一、模型的样本
样本的选取方法主要有两种: ➢ 随机抽样:
在确定样本规模后从总体中完全随机地抽取,每 种类型的个体在样本中的比例与在总体中的比例是一 样的。 ➢ 分类抽样:
首先根据模型的需要确定样本的类别.对每一类 别的样本分别确定其抽样个数,然后在每一类别内部 随机抽取所需的样本。
2
一、模型的样本
18
风险评分模型的交换曲线
19
五、模型的检验
K-S指标 ➢ 衡量的是好账户和坏账户的累计分布比例之间距离
最大的差距。 ➢ 好账户与坏账户之间的距离越大,K-S指标越高,
模型的区分功能越强。
20
风险评分模型K-S指标
21
五、模型的检验
区分度 ➢ 显示了好账户和坏账户分数的区分程度和重叠程度。
预测力强的模型好坏区分度
把行为模式相同或类似的目标客户或现行账户分成同 一组,而把行为模式不同的目标客户或现有账户分进 不同的组,以最大限度地区别不同行为模式和数理关 系,提高模型的预测能力。
13
模型分组
14
四、模型的制定
1. 分析单个变量的预测能力 发现具备强大预测能力的变量作为模型的候选变量,剔除不具备预
测力或预测力极其微弱的变量,以缩小候选变量的范围。 2. 减少候选变量的数量 进一步分组,从每一组变量中选择预测力最强、信息有效性最高的
交换曲线 ➢ 检验模型区分好账户和坏账户能力高低的常用工具 ➢如果模型完全没有分辨好坏的预测力,则交换曲线是 图中45度的对角线 ➢模型的分辨能力越强,交换曲线越往左上角靠近。 ➢模型的稳定性越强,则样本内和样本外检验的结果越 接近。如果样本内和样本外检验的交换曲线距离很远, 说明模型的稳定性极差,需要作较大的调整
通常需要分配下列任务:
✓检查、评估现行的信贷政策和管理流程.并依据评分模型管 理的需要做出修改,确立所需要的新管理流程。
✓把信用评分模型编写成合适的软件程序并在银行的IT系统里 面实施。
✓对模型的实施进行稽核,以保证实施程序的完全正确。 ✓监督数据的加工、监督每天评分的计算和分布。 ✓生产前台评分跟踪报告,评估和监控评分分布的变化、模型 针对客户群体的变化、批准率或其他模型管理指标的变化等。
15
分析单个变量的预测能力
16
五、模型的检验
模型的检验有两种方式: ➢ 样本内检验
利用模型开发所用的样本来对比预测情况与实际 情况的差别,属于样本内检验。
➢ 样本外检验 利用事先预留的、不用于模型开发而只用于模型 检验的样本来对比预测情况与实际情况的差别, 属于样本外检验。
17
五、模型的检验
8
从信用卡行为信息中提炼的预测变量
9Baidu Nhomakorabea
衡量还款能力的预测变量
10
衡量还款意愿的预测变量
11
二、模型的变量
➢ 静态的,只衡量当前的信息 ➢ 动态的,衡量一定时期以来的发展趋势 ➢ 提炼出来的变量要有预测性,与目标变量有较强的
相关性和逻辑因果关系,而且具备稳定性,能够经 受时间的考验。
12
三、模型的分组
一个变量作为模型候选之用,这样可以大大减少候选变量的数 目,有效解决多维相关性的问题,而又不遗漏过多有效的信息。 3. 选择适当的模型方法 线性回归分析、非线性回归分析、逻辑回归模型、神经网络模型、 决策树模型、判别分析、线性规划、非线性规划等 对于二元性结果的预测,最流行的是逻辑回归模型和神经网络模型 4. 确定模型的变量组合和权重
选择样本的原则: 1. 样本的代表性
➢ 代表过去 ➢ 代表未来 2. 样本的充分性 3. 样本的时效性 4. 样本的排除性 5. 样本的表现推测性
3
二、模型的变量
信用评分模型的变量主要有两种: ➢ 表现变量(因变量)
模型所要预测的结果,它可以是二元性的结果, 也可以是连续性的结果。 ➢ 预测变量(自变量)
预测力弱的模型好坏区分度
22
五、模型的检验
拟合度曲线 ➢ 衡量模型预测精确度的曲线,它把账户按评分从低
到高排列,划分成若干栏位,对比每个评分栏位上 所预测的坏账率与实际上的坏账率。 ➢ 模型预测的坏账概率接近于实际坏账率,说明模型 的预测准确度也较好。
23
风险评分模型的拟合度曲线
24
六、模型的实施与跟踪
✓生产后台评分检验报告,评估模型的预测效果、评分否决的 状况和效果、评分模型运用策略的效果等。
✓对管理人员、技术人员和业务人员进行关于信用评分模型的 实施和管理方面的培训,让相关人员了解信用评分模型的相关 知识和技术。
27
信用评分模型实施步骤一览表
28
29
六、模型的实施与跟踪
➢ 制定信贷政策 1. 明确管理目标 目标必须是现实的、清楚的、具体的,必须针对 评分卡所针对的信贷业务,必须满足银行运营环境 的限制。 2. 根据目标制定信贷政策 制定如何使用信用评分模型的政策 3. 决定政策性批准或政策性拒绝的标准 4. 处理缺失信息
从可观察到的信息中提炼出来的、与表现变量 有较强相关性的、用来预测未来结果的变量。
4
二、模型的变量
表现变量的界定: ➢ 第一,“坏”的定义必须与银行的总体政策目标相一致。
“坏”的定义是由市场营销部门、风险管理部门、 债务催收部门等共同协商,并综合考虑各方面因素后决 定的。 ➢ 第二,“坏”的定义必须考虑到表现期的长短。 ➢ 第三,“坏”的定义必须考虑到期终表现与期中表现。 ➢ 第四,“坏“的定义必须考虑到某些群体的不可确定性。 ➢ 第五,“坏”的定义必须简明,不宜过于复杂。
5
二、模型的变量
预测变量的提炼: ➢ 主要靠分析人员的直觉、长期经验的积累和数据挖掘
技术的应用。 ➢ 直接从原始数据中获得 ➢ 从信用局的记录里面提炼 ➢ 从银行内部的信贷账户主档案中记录的行为信息里面
提炼 ➢ 衡量消费者还款能力 ➢ 衡量消费者还款意愿
6
直接的预测变量
7
从信用局记录中提炼的预测变量
(一)正确的事实包括几大要素: 1. 管理人员的重视和支持 2. 相关实施人员的培训 3. 模型的稽核 4. 模型的书面记录 5. 模型的跟踪监控和管理信息系统
25
六、模型的实施与跟踪
(二)信用评分模型的实施与管理 ➢ 组织计划 1. 指定一个信用评分模型经理人员 2. 给相关人员明确分配在信用评分模型实施与管理上的分工 与责任 3. 取得内部共识和支持 4. 系统性地、有条不紊地落实模型实施和管理的各个步骤 5. 计划评分支持系统 6. 协调各分支机构的评分工作 7. 保护评分卡的安全 8. 计划把数据保留在数据库里 9. 计划改变申请表的信息
1
一、模型的样本
样本的选取方法主要有两种: ➢ 随机抽样:
在确定样本规模后从总体中完全随机地抽取,每 种类型的个体在样本中的比例与在总体中的比例是一 样的。 ➢ 分类抽样:
首先根据模型的需要确定样本的类别.对每一类 别的样本分别确定其抽样个数,然后在每一类别内部 随机抽取所需的样本。
2
一、模型的样本
18
风险评分模型的交换曲线
19
五、模型的检验
K-S指标 ➢ 衡量的是好账户和坏账户的累计分布比例之间距离
最大的差距。 ➢ 好账户与坏账户之间的距离越大,K-S指标越高,
模型的区分功能越强。
20
风险评分模型K-S指标
21
五、模型的检验
区分度 ➢ 显示了好账户和坏账户分数的区分程度和重叠程度。
预测力强的模型好坏区分度
把行为模式相同或类似的目标客户或现行账户分成同 一组,而把行为模式不同的目标客户或现有账户分进 不同的组,以最大限度地区别不同行为模式和数理关 系,提高模型的预测能力。
13
模型分组
14
四、模型的制定
1. 分析单个变量的预测能力 发现具备强大预测能力的变量作为模型的候选变量,剔除不具备预
测力或预测力极其微弱的变量,以缩小候选变量的范围。 2. 减少候选变量的数量 进一步分组,从每一组变量中选择预测力最强、信息有效性最高的
交换曲线 ➢ 检验模型区分好账户和坏账户能力高低的常用工具 ➢如果模型完全没有分辨好坏的预测力,则交换曲线是 图中45度的对角线 ➢模型的分辨能力越强,交换曲线越往左上角靠近。 ➢模型的稳定性越强,则样本内和样本外检验的结果越 接近。如果样本内和样本外检验的交换曲线距离很远, 说明模型的稳定性极差,需要作较大的调整