数据挖掘技术在商业银行中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
档Bayes 鉴别器[J ].计算机学报,2004,27(4):566-572.
[17]奚伟鹏,李昕,蒋凯,武港山.面向网上论坛的信息抽取技术[J ].计算
机工程,2005,31(4):66-68.
[18]吴昊,耿焕同.基于潜在语义分析的BBS 主题发现算法研究[J ].电脑
知识与技术,2008,4(2):431-433.
[19]蒋凡,高俊波,张敏,王煦法.BBS 中主题发现原型系统的设计与实现
[J ].计算机工程与应用,2005,41(31):151-153.
[20]鲁明羽,姚晓娜,魏善岭.基于模糊聚类的网络论坛热点话题挖掘[J ].
大连海事大学学报,2008,34(4):52-58.
[21]Gilad Mishne ,Natalie Glance.Leave a Reply :An Analysis of Weblog
Comments [C ]//The Third Annual Workshop on the Weblogging Ecosystem ,Edinburgh ,Scotland ,May 2006.
[22]时明达,林鸿飞.基于内容相关度和语义分析的Blog 热点话题发现
[C ]//内容计算的研究与应用前沿———第九届全国计算语言学学术会议论文集,2007:570-575.
Research on Development of Topic Detection and
Tracking
CHEN Xue-chang ,HAN Jia-zhen ,WEI Gui-ying
(School of Economics and Management,University of Science and Technology Beijing,Beijing 100083,China )
Abstract :The research object of TDT (Topic Detection and Tracking )is massive news flow ,monitoring the topic of news ,finds out new users attracting information ,and somehow show the organized reports about a certain topic.At first ,the paper introduces TDT and its primary tasks ,related concepts and evaluation methods.Then ,recent research situation about Topic Detection is focused.Finally ,the paper analyzes the development tendency and fu-ture direction of Topic Detection.
Key words :Topic ;Topic Detection ;Topic Tracking
[收稿日期]2011-01-05
[作者简介]
陈敏(1976-),女,黑龙江伊春人,北京银行博士后科研工作站博士,主要研究方向:数据挖掘技术在商业银行中的应用。
数据挖掘技术在商业银行中的应用
陈
敏
(北京银行博士后科研工作站,北京100081)
[摘要]数据挖掘能够有效分析商业银行数据库中的信息,将其转化为知识为银行的经验决策服务。本文在介绍
数据挖掘技术及其主要任务的基础上,总结了数据挖掘在商业银行业务中的主要应用领域为客户关系管理、风险管理和金融欺诈监测,并具体介绍了数据挖掘技术在上述几个领域内的应用。
[关键词]数据挖掘;客户关系管理;风险管理;欺诈监测doi:10.3969/j.issn.1673-0194.2011.09.015[中图分类号]TP391;F832.33[文献标识码]A
[文章编号]1673-0194(2011)09-0059-04
1前言商业银行在经营的过程中积累了大量的数据,在信息时代,能否快速准确地从这些数据中发掘规律,获取知识;能否有效地利用这些规律和知识为银行的经营、决策服务,对银行提升竞争力及长远发展来说,是至关重要的。
发达国家和地区的商业银行早已利用数据挖掘技
术来进行数据库中知识的挖掘。例如,美国汇丰银行用数据挖掘工具KXEN 来挖掘不断增长的客户数据,用
来发现交叉销售和“翻滚”销售。美国花旗银行和瑞士银行也是较早采用数据挖掘技术的银行。以美国第一银行为代表的信贷银行深入地将数据挖掘技术运用到信用卡用户分析中。然而,数据挖掘技术在银行业真正得到重视是在客户关系管理系统兴起之后,众多的欧美银行纷纷采用数据挖掘技术来为自己的经营决策服务,其中包括美洲银行、美国商务银行、皇家苏格兰银行、法国兴业银行、德意志银行、荷兰银行、澳大利亚国
中国管理信息化
C hina Management Informationization
2011年5月第14卷第9期
May ,2011Vol .14,No .9
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
民银行等。简言之,在数据仓库规模迅速膨胀,数据库技术日益成熟的今天,发达国家和地区的银行都把数据挖掘技术作为一个重要的战略决策手段。
上述欧美银行不仅有完善高效的数据收集系统,最重要的是将数据仓库中的数据切切实实地变成了有用的知识,并在经验过程中,实现了知识到财富的转换过程。
相比于国外的银行,数据挖掘在我国商业银行中的应用则显得相对苍白无力,对大部分银行来说,还处在数据收集、整理、规范的阶段。对大量数据的进一步处理和应用,还处在一个相当原始的阶段。数据挖掘这项强大的数据处理技术,仍停留在概念的层面。很多银行不知道数据挖掘在哪些银行业务中可以得到应用,更不了解数据挖掘针对银行业务的强大功能,因此在这方面的研究投入也不够。在此背景下,本文在概述数据挖掘技术的前提下,探讨数据挖掘可能在商业银行中的几种应用。
2数据挖掘技术简介
数据挖掘是指“在数据中发现有效的、新颖的、潜在有用的、可理解的模式的非平凡过程”[1]。数据挖掘这个研究领域是数据库、模式识别、机器学习、统计学、人工智能、并行与分布式计算、数学和可视化技术等多学科交叉的产物,是一个新兴的但具有广泛应用前景的研究领域。数据挖掘的主要任务可以进一步分为如下几类。
2.1关联规则挖掘
关联规则挖掘是从大量数据中发现项集之间有趣的关联或相关联系,是形如A圯B的蕴涵式,支持度s%是指事务数据库D中至少有s%的事务包含A∪B;可信度c%是指在事务数据库D中包含A的事务至少有c%同时也包含B。关联规则可以帮助许多商务决策的制定。
2.2分类与预测
分类需要构造分类函数或分类模型,通过分类函数,把数据库中的数据项映射到某个类上。分类模型可以用多种形式表示,如分类(IF-THEN)规则、分类树、数学公式或神经网络等。分类和预测可以用于提取描述重要数据类的模型或预测数据未来的趋势,例如可以通过建立分类模型,对银行的贷款客户进行分类,以降低贷款的风险等。
2.3聚类分析
聚类技术用于发现数据库中未知的类,与分类不同之处在于,在聚类前对类的数量与类型均是未知的,是按照“物以类聚”的原则,将满足相似性条件的对象划分在一组内,不满足相似性条件的对象划分在不同的组。每个组都叫做类(Cluster),每一类中的对象尽量相似,而不同类间的对象尽量不同。
2.4孤立点分析
数据库中可能包含一些数据对象,它们与数据的一般行为或模型不一致。这些数据对象是孤立点(Outlier)。统计方法常将孤立点视为噪声或异常而丢弃,或试图使孤立点的影响最小化。但在一些应用中孤立点本身可能是非常重要的信息,例如在欺诈探测中,孤立点可能代表了欺诈行为。
2.5演变分析
数据演变分析(Evolution Analysis)描述行为随时间而变化的对象的发展规律或趋势,并对其建模。例如可以从股票交易数据中挖掘出整个股票市场和特定公司的股票演变规律,帮助预测股票市场的未来走向,帮助做出股票投资的决策。
3数据挖掘技术在商业银行中的应用
数据挖掘在商业银行的应用可以分为客户关系管理、风险控制和金融欺诈识别3个方面。人们经常提到的市场营销,可以归在客户关系管理的范围内,客户关系管理的其中一个作用就是通过分析客户特征,从而提供更合适的产品与服务,而这就是营销的本质。下面对数据挖掘在以上3个方面的应用进行介绍。
3.1客户关系管理
数据挖掘在客户关系管理中的应用相对成熟,早在10年前,国外的相关学者就提出,数据挖掘技术能够使CRM系统向顾客提供更有针对性,更高质量的服务[2]。数据挖掘能够发现数据库当中数据之间深层次的关联;能够将本质相似的数据归为同样的类;能够发掘数据库中的异常数据,这都是传统的计量方法所不具备的能力。因此当银行建立了CRM系统之后,需要做的就是采用数据挖掘这样强大的工具来将数据库中的客户信息变成财富。
总体来说,利用数据挖掘来进行客户关系管理要实现3个目标:首先是留住现有客户。维持一个老客户所需的成本是寻求一个新客户成本的0.5倍。通过分析现有客户的特征,挖掘客户的爱好和兴趣,从而以最快的速度响应客户的需求,有针对性地提供金融产品及服务,可以提高客户的忠诚度,从而留住现有客户。其次是实现现有客户价值最大化,客户的生命周期决定了在各个不同的阶段,客户对金融产品及服务的需求是不同的,因此要合理地满足同一个客户在不同生命阶段的需求,在令客户满意的同时,最大限度地实现客户价值。最后是通过提供更有竞争力的产品与服务,通过更有效的营销手段来吸引其他银行的客户。
系统建设