对信用卡客户分类和数据挖掘

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对信用卡客户分类和数据挖掘

选题背景:随着经济的发展,我国信用卡市场逐步壮大并日益繁荣。近几年信用卡逐渐成为我国居民个人消费使用最为频繁的支付工具之一。信用卡属于一种贷款,这也构成了客户对于开证银行的债务关系,所以信用卡开证行对于用户的基本信息以及对于其信用价值评估也成为了重要的一环,评估的结果可以用来分析客户的最大信用额度几何、客户是否能够成功开通信用卡业务,以及还款的时间比例等等是否合理。因此商业银行利用先进的数据挖掘技术对客户基本信息分析进行客户分类,区别不同的客户群体,然后针对不同客户群体,采取不同的发卡方式,、营销策略、风险控制举措这些举动都是十分有必要的,也是对信用卡产品获得市场份额有巨大帮助作用的。

选题意义:利用数据挖掘技术对信用卡客户进行分析的主要意义。从小的方面来说,利用数据挖掘技术对信用卡客户进行分类,不仅有利于信用卡客户关系得到系统、有序、差异性管理,还有利于银行进行有效的风险控制和风险管理。一是通过对信用卡客户的分类,银行可以针对不同客户群体,全面深入地了解客户的不同需求,并推出有针对性的特色产品,从而提高发卡率、市场占有率、客户使用率等,为银行创造更多的收益。二是通过对信用卡客户的分类,可以分析发现风险较高客户群,特别地对这类客户群的消费行为、信用状况进行监测和控制,以便可以及早发现并消除潜在的信用风险和欺诈风险。从大的方面来说,商业银行在建立有效的信用卡分类管理智能系统的基础上,充分利用数据挖掘技术强大的数据分析和挖掘能力,帮助信用卡业务管理者做出正确的判断和决策,不断创新信用卡个性化服务内容,增强信用卡产品在国内或者国际市场上的竞争力。文献综述

信用卡作为特殊的金融商品、现代化的金融工具,是国际流行的先进结算手段、支付工具和新颖的消费信贷方式,日益受到人们的青睐。由于使用信用卡,改现金交易为转账结算,取代了一定数量的市场流通货币,减少了货币的发行量,减少了国家每年用于货币印刷、调拨、运输、仓储和投放所耗费的资金,也加快了社会流动资金周转速度,促进经济发展。信用卡还能促进商品销售,刺激社会需

求。

对于持卡人而言,信用卡的发行和使用,使持卡人通过使用信用卡获得商品和劳务服务,免除了携带大量现金的不便和风险,同时还可通过透支简便地获得银行贷款。同时贷记卡持卡人非现金交易还可以享受如下优惠条件:(1)免中国人民银行1999年3月1日颁布执行的《银行卡业务管理办法》第9页共75页浙江大学硕士学位论文数据挖掘技术在银行信用卡业务中的应用研究息还款期待遇。银行记账日至发卡银行规定的到期还款日之间为免息还款期。免息还款期最长为60天。持卡人在到期还款日前偿还所使用全部银行款项即可享受免息还款期待遇,无须支付非现金交易的利息。(2)最低还款额待遇。持卡人在到期还款日前偿还所使用全部银行款项有困难的,可按照发卡银行规定的最低还款额还款。对于特约商户来说,由于有信用卡发卡银行的信用保证,特约商户可以放心地为持卡人提供商品和服务,从而扩大商品的销售量,并减轻收款点款工作量,简化了支付、记账和结账的过程。

信用卡的发行,使银行有了一种新的争取特约商户和信用卡客户存款的手段,有利于扩大银行转账结算业务,同时增加银行信贷资金的来源,从而获得更多的利差收入,已经成为银行的重要盈利手段。据统计,国外信用卡业务银行带来的利润一般占到银行利润的30%左右,花旗银行甚至还要高,占50%以上。美国运通公司更是凭借运通卡成为全球服务、旅游、娱乐业界的巨无霸。对于银行而言,信用卡业务的收入主要包括存款利差收入、年费、结算手续费、透支利息等。在这几项收人中,年费收入是固定不变的,普通信用卡大约20一40元一年,只要发卡就会有年费收入,其他几项收入随业务量的大小而变化,结算手续费收入随卡均消费额的变化而变化,利息收入随透支额的变化而变化。

所采用的方法:决策树算法中的CHAID算法、ID3算法、神经网络算法、以及聚类算法中的两步算法等。

数据来源:国外某家银行对于信用卡用户申请的批准。其中包括客户的年龄、工作、婚姻状况、教育程度、是否有违约、收支是否平衡、是否有房屋、是否有贷款、联系方式、还款期限、之前的透支次数、预期收入水平、银行是否批准予以其下一季信用卡的使用权等等。

数据预处理:对于年龄我们只取其十位数、工作按其行业类型分别划分为

0-10、单身已婚和离婚分别为0、1、2,教育水平按小学中学大学分为1、2、3。对于房屋、是否有贷款、银行是否批准、是否违约等中“是”用1、“否”用0代替、通讯方式无、座机、手机分别为0、1、2.收大于支取1.收小于支取0. 分析过程:对于我们处理过的数据我首先做的是特征选择。特征选择也叫特征子集选择 ( FSS ) 。是指从已有的M个特征中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。对于一个学习算法来说,好的学习样本是训练模型的关键。从特征选择的结果我们可以看到campaign这一项并不重要,所以我们在模型后剔除该变量,第二的default(违约行为)因为单个类别过大的原因我们也将其剔除,对于剩余的数据我们以conclusion(银行决定是否给予客户下一季的信用卡使用权)作为输出进行决策树分析。我分别采用了CHAID、神经网络、以及C.50算法结果显示他们分析结果中的正确率基本一致都在89.32%。但是相比较而言神经网络模型所给出的结论会更加可靠:因为神经网络算法对于本文所采用的数值相对准确。逻辑性的思维是指根据逻辑规则进行推理的过程;它先将信息化成概念,并用符号表示,然后,根据符号运算按串行模式进行逻辑推理;这一过程可以写成串行的指令,让计算机执行。然而,直观性的思维是将分布式存储的信息综合起来,结果是忽然间产生想法或解决问题的办法。这种思维方式的根本之点在于以下两点:1.信息是通过神经元上的兴奋模式分布储在网络上;2.信息处理是通过神经元之间同时相互作用的动态过程来完成的。所以说神经网络算法可以接受的数据类型来说离散型的数据最为适合。

CHAID

正确4,037 89.29%

错误484 10.71%

总计4,521

神经网络

正确4,042 89.40%

错误479 10.60%

总计4,521

相关文档
最新文档