数据挖掘技术及其在商业银行中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘技术及其在商业银行中的应用
作者:傅俊
来源:《软件导刊》2014年第02期
摘要:数据挖掘是一种专业性的数据处理技术,在大数据领域的应用优势明显。

商业银行经常需要处理大量的客户信息,是典型的数据量巨大的商业领域,在商业银行中应用数据挖掘技术是未来发展的必然选择。

在人们对商业银行服务要求越来越高的背景下,加强数据挖掘技术的研究及在商业银行中的应用具有重要意义。

关键词关键词:数据挖掘;商业银行;客户关系
中图分类号:TP391文献标识码:A 文章编号:16727800(2014)002011804
0引言
当前,我国商业银行之间的竞争日趋激烈。

在商业银行竞争中信息处理是重要的一环,商业银行的信息处理能力直接影响着商业银行的竞争水平。

在数据量非常庞杂的商业银行领域,要想实现长远发展就必须高度重视应用专业的数据处理技术。

数据挖掘技术作为一门专业的数据处理技术,近年来被广泛应用于数据量庞大的领域。

数据挖掘技术在商业银行中的应用能够有效提升商业银行的数据处理能力,有效提升商业银行的竞争力,加强数据挖掘技术的应用是商业银行未来发展的必然选择。

1数据挖掘技术
所谓数据挖掘又叫做资料勘探、数据采矿。

数据挖掘主要是指从大量庞杂的数据中自动搜索出隐藏在这些数据中有着特定或者特殊关系信息的过程。

数据挖掘技术是各种信息技术相互融合、不断发展的结果。

完整的数据挖掘技术需要统计学、数据库技术、可视化技术、人工智能技术等诸多技术的支持。

数据挖掘技术的应用一般具有特定步骤和算法,了解数据挖掘技术的步骤与算法是应用这项技术的重要前提。

1.1数据挖掘技术应用步骤
数据挖掘技术一般需要按照以下几个步骤来进行应用:分类→估计→预测→相关性分析→聚类→描述与可视化,这几个步骤共同构成了完整的数据挖掘技术。

分类是数据挖掘的第一步,对各种数据进行详细分类是进一步应用的前提。

在数据中一般要选出已经分好类的训练集,在训练集上应用数据挖掘技术,如果还没有分好类就需要进行有效性分类。

例如对信用卡数据就可以根据风险高低分为高、中、低3种类别。

而后就是估计,数据估计重点是针对连续
值的输出,数据估计的对象是不连续的。

在应用过程中需要对此予以高度重视。

在应用过程中工作人员可以事先估值,在取得连续变量之后进行分类。

数据挖掘技术离不开科学预测,数据挖掘中的预测主要是针对未知变量进行有针对性的预测。

相关性分析和聚类这两项工作就是要按照数据之间特定的关系来进行有效分组。

描述与可视化就是要把数据挖掘结果通过特定方法展示出来。

1.2数据挖掘技术算法
算法是数据挖掘的核心,数据挖掘效果主要取决于所选算法。

通常意义上数据挖掘技术算法包含以下3种:①基于划分的算法:是把原先数据划分成几个互不相交的块来进行有效挖掘;②Aprior算法:是通过候选项集来确定频繁项集。

这种算法主要是基于两阶段频集思想的递推算法。

Appriori算法的应用首先是要找出频集,而后再产生强关联规则。

这些规则主要是要满足最小支持度与最小可信度,最后就是要找到期望规则。

这种算法在数据挖掘中优势巨大,但同时产生大量候选集和重复扫描数据,这也是难度最大的两个问题;③FP-树频集算法:是采取分而治之的策略来处理相关数据。

在第一遍扫描之后,把数据库频集压缩到频繁树模式树中,之后再将FP-tree化成条件库,最后再对条件库进行分类挖掘。

这种方法与第二种方法相比更具优势,也更有效率。

在数据挖掘中还有一项最为关键的环节——孤立点分析。

在庞杂的数据库中经常会找到一些与其它数据不一致的数据,这些数据一般称为孤立点。

在日常数据分析中人们往往会抛弃这些孤立点,但是在实际应用中这些孤立点可能会有着重要意义,在实际应用中加强对孤立点的分析有助于商业银行的工作,例如孤立点分析对于信用卡诈骗行为的侦查就具有重要意义。

2数据挖掘技术在商业银行应用分类
数据挖掘技术是一种专业的数据处理技术,这种处理技术在商业银行中有着广泛的应用。

随着商业银行竞争的日益激烈,数据挖掘技术被广泛应用于客户关系管理、风险评估、竞争情报系统和金融监管等各个领域。

2.1客户关系管理
客户关系管理是商业银行的核心环节。

客户关系管理主要是指在最佳时间、以最合理价格向客户提供最优服务的行为。

要想实现高水平的客户关系管理就需要实现对各种信息资源的有效整合。

客户关系管理的实质就是要实现从大众营销向一对一营销的转变,加强数据挖掘技术在客户关系管理中的应用有助于实现这个目的。

数据挖掘在客户关系管理中的具体应用有以下3个方面:①分类识别。

从众多客户资料中选出优质客户,熟悉优质客户的购买习惯、数量以及偏好,重点选择那些忠诚度较高的客户;
②用来提升服务效率。

通过数据挖掘技术的分类,工作人员能够很方便地了解客户群体特性,
而后再利用聚类分析的方法展开群体性营销,有效提升商业银行的服务效率;③实现交叉销售。

由于当前商业银行面临的环境日益复杂,经常需要交叉销售,而实现交叉销售就要利用数据挖掘技术中的关联性分析,关联性分析的应用能够有效提升交叉销售的水平。

2.2风险评估与控制
作为典型的金融行业,商业银行在平常运行过程中往往面临着巨大的风险,这些风险的产生会对商业银行自身造成严重影响,加强对商业银行面临的各种风险进行评估是商业银行实现长远发展的必然选择。

数据挖掘技术可以实现对商业银行风险的科学评估。

数据挖掘技术在风险评估中主要是通过最终异常点来实现的。

在实际评估中遗传算法、粗糙集、模糊理论都是经常运用的方法。

在商业银行面临的风险中,信用风险是最为典型也是最为严重的风险。

所谓信用风险主要是指信用卡诈骗、贷款无法收回、恶意透支等风险。

数据挖掘工具中神经网络算法和决策树算法是评估信用风险的有效手段。

针对信用风险的评估关键是要做好分类工作,工作人员要根据相关因素划分优质客户与高风险客户。

2.3竞争情报系统
随着商业银行竞争的日趋激烈,建立竞争情报系统已经成为商业银行发展的必然选择,知己知彼才能百战不殆。

数据挖掘技术能够有效应用于竞争情报系统的建设中。

当前在竞争情报系统的建设中经常会遇到各种各样的文本和报告,要想从文本和报告中找出相关信息一般需要应用到数据挖掘技术中的关联分析技术。

工作人员经常通过对文本和报告中的关键字进行关联分析,找出各种数据之间的隐含关系,全面清晰地认识竞争对手。

在市场竞争中充分认识竞争对手,了解竞争对手的实际情况是实现自身长远发展、提升竞争力的必然举措。

2.4金融监管
在金融市场迅速发展的今天,强有力的金融监管是保证金融市场正常运行、预防各种市场风险的有效途径。

当前数据挖掘技术在金融监管方面的应用主要集中于反洗钱方面。

数据挖掘技术中的孤立点分析、分类研究、聚类、序列模式在反洗钱中的应用具有巨大优势,通过应用数据挖掘技术,金融监管机构能够实现对洗钱行为的有效侦测。

3客户满意度模型
客户满意度是衡量商业银行竞争优势的一个重要指标,提升客户满意度和客户忠诚度是未来商业银行必须重视的一项工作。

客户满意度所代表的是商业银行提供的产品和服务于客户期望的吻合程度。

客户满意度的调查具有重要意义,对银行满意度的调查主要是通过客户满意度指数(CSI)这个指标来进行衡量的。

3.1客户满意度分类
3.2客户满意度决策树模型
针对商业银行客户满意度模型,数据挖掘技术主要是建立决策树模型。

决策树模型是对离散型目标函数的模拟。

决策树模型在建立过程中往往需要多次测试,只有经过多次测试才能实现对商业银行客户满意度的有效调查。

建立决策树模型可以通过CHAID、CART等算法来实现。

一般意义上客户满意度关系模型的建立包括以下3个步骤:
(1)选取特征量。

特征量的选取是建立客户满意度模型的重要基础性工作,做好这项工作意义重大。

在实际工作中一般需要选择特定指标作为决策树模型的研究变量。

商业银行一般通过问卷调查的方式来选取变量值。

(2)信息增益值计算。

在输入变量之后接下来的工作就是对选用信息增益做出相关性分析。

在分析过程中要把客户满意度的5个评价标准当作模型输出变量来用。

为了保证模型的准确度,系统随机抽取样本的70%作为训练集,其余的30%作为测试集。

(4)启示。

通过建立客户满意度决策模型,商业银行从中能够得到不少启示:商业银行必须结合当前存在的一系列问题来进行调整,只有这样才能真正适应时代发展的要求。

在今后工作中要从品牌建设、人员队伍建设、组合型理财产品以及提供更多的便利服务等几个方面入手,不断提升商业银行的客户满意度。

客户满意度是商业银行的核心竞争力,在实际工作中工作人员需要高度重视提升客户满意度这项工作,要以自身高品质的服务来不断提升客户满意度。

4信用卡授卡风险评估模型
在商业银行中信用风险是最为重要的风险,科学评估信用风险,加强对信用风险的控制是商业银行重要的工作。

在信用卡授卡过程中如果不能够全面有效地分析客户资料,就有可能带来极大的风险,因而建立信用卡授卡风险评估模型十分重要。

4.1信用卡授卡风险评估模型
所谓信用卡授卡风险评估模型主要指的是专门用于对信用卡申请者信用风险进行有效评价的模型,这一模型的建立对于实现信用风险的有效控制具有重要意义,商业银行通过该模型来对信用卡申请者进行审批。

模型的主要功能是从众多客户申请资料中找出客户信用的关键性因素,信用卡授卡模型的建立对于实现信用风险控制具有重要意义。

4.2数据挖掘建模
数据挖掘建模是一项系统性工程,完成这项工程有4个步骤:数据准备、建模、模型评估以及模型应用,加强对这几个环节的研究有重要意义,下面重点分析这几个环节。

(1)数据准备。

数据准备工作是数据挖掘建模的基础,直接影响着风险评估结果,在数据准备中可以根据特定机构的调查结果来进行评价。

本文主要是通过国内某商业银行的250名信用卡申请者的资料来进行建模,评价时通过1代表良好,0代表信用较差来进行评价。

数据准备工作主要是通过SAS/Enterprise Miner平台完成,在应用过程中需要注意以下几点:①本次选取的是250名信用卡申请者资料,无需再进行抽取,直接应用;②在该模型中S 是作为事件响应变量来使用的,属性值只有0和1两种状况;③在所有数据中训练数据要占到70%,而验证数据要占到30%;④在评估过程中不需要进行缺失值处理,因为该数据源没有缺失值。

(4)模型应用。

模型建立的最终目的是应用,在当前实施过程中该模型基本上能够符合实际要求。

在数据挖掘过程中每
个节点的功能是不一样的,引入建模数据源、设置目标变量、数据分块、回归建模、模型评估、评估结果统计、抽取模型评分程序、引入运用模型数据源、查看数据评分分布情况、编写应用程序是其中重要节点。

信用卡授卡风险评估模型不同于信用评分体系,该评估模型也不能取代信用评分体系。

因此,在应用这个模型过程中有些问题还需要高度重视。

评估模型只有在得到信用评分体系的支持,客户信用风险评价结果才更加真实可靠。

在实际应用过程中,信用风险评估模型与信用评分体系两者不可偏废,要互为支撑、共同发展。

此外还要注意数据挖掘方法是多种多样的,在应用数据挖掘方法进行建模时,需要根据实际情况灵活选择数据挖掘方法。

数据挖掘方法的应用关键在于找到影响客户信用的关键性因素,这些关键性因素是在不断变化的,因而数据挖掘方法也不能一层不变,需要根据实际变动情况随时调整应用方法。

最后就是信用风险评估模型和信用评分体系要相互协同。

信用卡授卡风险评估模型在实际应用过程出现新的模式之后要及时调整客户信用评分体系,进一步完善信用评分体系,通过这样才能够有效实现对商业银行信用风险的评估与控制。

5结语
数据挖掘技术是一种先进的数据处理技术,随着信息技术的快速发展,数据挖掘技术在商业银行中的作用越来越重要,这种技术的应用能够有效提升商业银行的竞争力。

随着我国市场经济体制改革的不断深入,商业银行之间的竞争日趋激烈,在这样的背景下加强数据挖掘技术的研究,对于提升商业银行竞争力具有重要意义。

本文详细分析了数据挖掘技术的概念,以客户满意度关系模型和信用卡授卡风险评估模型为例,有针对性地分析了数据挖掘技术在商业银
行中的应用。

商业银行在今后的应用过程中必须不断变更数据挖掘方法,以此不断提升竞争力。

参考文献:
[1]R.格罗思.数据挖掘——构筑企业竞争优势[M].西安:西安交通大学出版社, 2008.
[2]蒋缨,强海涛.数据挖掘在商业银行中的应用趋势分析[J].经济研究,2005(5).
[3]马宜清,屈松川.数据挖掘技术在商业银行中的应用[J].福建电脑,2009(5).
[4]黄勇.数据挖掘技术:增强银行核心竞争力的重要工具[J].中国金融电脑,2008(4).
[5]李芳.基于数据仓库技术的银行风险管理[J].现代商业,2008(20).
[6]白铁刚,高建军.金融机构反洗钱的数据挖掘技术[J].中国刑事警察,2007(6).
[7]王颖枫.大数据时代的数据挖掘——商业银行经营效益分析的重要性及方法[J].中小企业科技与管理,2013(15).
[8]刘忠宝.数据挖掘在商业银行中的应用[J].现代企业文化,2012(9).
(责任编辑:杜能钢)。

相关文档
最新文档