浅析信用评分模型(一)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅析信用评分模型(一)
摘要]本文对信用评分领域中主要的模型和方法做了细致的概述和优缺点比较,这些模型包括判别分析模型、决策树分析回归分析和神经网络模型。
关键词]信用评分判别分析模型决策树分析回归分析法神经网络法
一、信用评分概况
信用评分模型作为信用风险管理的基础和核心,无论是对于建立社会征信体系还是对于金融机构的信贷资产管理,都有着不可替代的作用。其主要目的,在于尽量将能够预测借款人未来行为的指标加以整合,并统一成可以比较的单一指标,以显示借款人在未来特定时间内违约的可能性,所有的信用评分模型,无论采用什么理论或方法,其最终目的都是将贷款申请者的信用级别分类。为达到分类目的。当前,对个人信用评分模型的定义有多种,较为权威的种观点认为:“信用评分是预测贷款申请人或现有借款人违约可能性的一种统计方法。”这一观点指出了信用评分的作用和目的,不过随着信用评分模型的不断发展,信用评分已不仅是一种统计方法,也包含了运筹学,如数学规划法、非线性模糊数学(如神经网络方法)等。此外,信用评分的实际操作应用也与决策原则紧密相关,决策原则事实上决定了信用评分模型实现其目的和作用的程度。因此,对个人信用评分模型这一数学工具在金融和银行业中的应用来说,较为全面和恰当的定义应是,“信用评分是运用数学优化理论(包括统计方法、运筹方法等),依照即定原则或策略(损失最小原则或风险溢价原则),在数据分析决策阶段区分不同违约率水平客户的方法。
二、各类信用评分模型概述
1.判别分析模型
判别分析法是对研究对象所属类别进行判别的一种统计分析方法。进行判别分析必须已知观测对象的分类和若干表明观测对象特征的变量值。判别分析就是要从中筛选出能提供较多信息变量并建立判别函数,使推导出的判别函数对观测样本分类时的错判率最小。这种方法的理论基础是样本由两个分布有显著差异的子样本组成,并且它们拥有共同的属性。它起源于1936年Fisher引进的线性判别函数,这个函数的目的是寻找一个变量的组合,把两个拥有一些共同特征的组区分开来。
判别分析方法的优点:适用于二元或多元性目标变量,能够判断,区分个体应该属于多个不同小组中的哪一组。自身也存在不可避免的缺点:该模型假设前提是自变量的分布都是正态分布的,而实践中的数据往往不是完全的正态分布,从而导致统计结果的不可靠性。
2.决策树方法
决策树模型是对总体进行连续的分割,以预测一定目标变量的结果的统计技术。决策树构造的输入是一组带有类别标记的例子,构造的结果是一棵二叉或多叉树。构造决策树的方法是采用自上而下的递归构造。在实际中,为进行个人信用分析,选取个人信用作为目标属性,其他属性作为独立变量。所有客户被划分为两类,即好客户的和坏客户,将客户信用状况转换为“是否好客户”(值为1或0),而后利用数据集合来生成一个完整的决策树。在生成的决策树中可以建立一个规则基。一个规则基包含一组规则,每一条规则对应决策树的一条不同路径,这条路径代表它经过节点所表示的条件的一条链接。通过创立一个对原始祥本进行最佳分类判别的决策树,采用递归分割方法使期望误判损失达到最小。
决策树模型的优点:浅层的决策树视觉上非常直观,容易解释;对数据的结构和分布不需做任何假设;可以容易地转化成商业规则。它的缺点在于:深层的决策树视觉上和解释上都比较困难;决策树对样本量的需求比较大;决策树容易过分微调于样本数据而失去稳定性和抗震荡性。
3.回归分析法
回归分析法是目前为止应用最为广泛的一种信用评分模型,这其中以著名的logistic回归为代
表。除此之外,线性回归分析、probit回归等方法亦属于此类。最早使用回归分析的Orgler,他采用线性回归模型制定了一个类似于信用卡的评分卡,他的研究表明消费者行为特征比申请表资料更能够预测未来违约可能性的大小。同数学规划方法中一样,假设已经通过一定的方法从样本变量中提取出了若干指标作为特征向量,回归分析的思想就是将这些指标变量拟合成为一个可以预测申请者违约率的被解释变量,自然就是违约率p,回归分析中应用最广泛的模型当属线性回归模型,它是对大量的数据点中表现出来的数量关系模拟出一条直线,回归分析的目标就是使目标变量值和实际的目标变量值之间的误差最小。因此最早将回归方法应用于信用评分研究的模型,就是简单的线性回归模型,目前基于logistic回归的信用评分系统应用最为普遍。