大数据分析在银行业中的应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

·102·

NO.08 2019

( Cumulativety NO.44 )

中国高新科技

China High-tech 2019年第08期(总第44期)

0 引言

目前,大数据分析与应用已成为银行进行定量化、精细化管理的重要方法。在信息化高速发展的时代背景下,各银行积累的客户数据、交易记录、管理数据等呈现爆炸性增长,海量的大数据给银行业带来压力的同时,也同样带来了机遇。因此,如何有效地进行大数据分析和挖掘,并提升其中的价值,是目前大多数商业银行所面临挑战。

1 银行大数据的特点

1.1 数据类型的多样性和多源性

商业银行的数据来源十分庞大,例如,有来自银行柜台、自助终端、网上银行、手机银行等线上线下各种类型的信息。大数据的表现方式也很多,如视频、图像、音频及各种媒体等渠道。1.2 数据的全面性和有用性

数据最重要的作用是能满足分析需求。要使数据量具有足够的分析价值,数据采集的面必须要足够。同时也要注意到,大数据中存在的众多信息并不是全部都能为其所用,需要银行不断地对数据进行清查,过滤掉不断生成的垃圾信息,从而获得有价值的信息。

1.3 数据的动态性与实时性

具有时效性的数据才有更大的参考价值,特别是在现今的互联网时代,更需要在最短时间之内在庞杂的大数据中找出最重要的信息。商业银行的大

数据具有变化速度快、频率高的特点,对这种快速动态变化的数据就需要有很高的实时处理能力。

2 数据分析工作流程

数据作为银行的重要战略资产,实施有效的数据分析是每一个银行必不可少的工作内容。银行大

数据分析工作的步骤如图1所示。

图1 银行大数据分析工作流程图

其中,数据的收集、挖掘与分析是整个工作流程中的核心环节。2.1 确定目标

在大数据时代,庞大的数据体系所蕴含的价值也在不断体现,银行发展将越来越依赖于对数据的占有和分析,众多的金融环节都需要通过对数据的收集和分析后完成。因此,在对大数据分析中首先要确定目标。例如,将客户的稳定增长作为目标之一时,银行就必须对客户产生的行为数据、交易数据、流动数据等进行综合分析,并在此基础上制定出适合客户内在需求、安全、便捷、高价值的产品。此外,在资本业务中提供现金的模式和信号识别,对非结构化数据进行挖掘;在交易银行业务中实现客户细分;为第三方总结深入洞察在资产管理业务中提供个性化定价;在财富管理业务中实现更

大数据分析在银行业中的应用

汪 彤 杨 波

(中国建设银行东西湖支行,湖北 武汉 430040)

摘要:整合和分析各种渠道的数据,建立强大的银行金融业务和服务体系对银行的金融信息化至关重要。基于此背景下,文章针对银行大数据的特点,对来源广泛的银行大数据的获取方式、挖掘手段、分析技术及风险把控等问题进行了详细的分析。

关键词:大数据;数据挖掘;数据分析;银行 文献标识码:A 中图分类号:F832

文章编号:2096-4137(2019)08-102-03 DOI:10.13535/ki.10-1507/n.2019.08.35

收稿日期:2019-03-20

作者简介:汪彤(1969-),男,浙江富阳人,中国建设银行东西湖支行经济师,研究方向:金融。

具成本效应的财务建议等都是大数据分析的目标。

2.2 数据采集

数据采集是挖掘数据价值的第1步,数据量越大时,可提取出来的有用数据也就更多。因此要对数据收集工作有足够的重视,并采取一系列的方法和手段。在收集数据时,要收集全部数据,而非抽样数据,常用的数据采集方式分为离线采集、实时采集和互联网采集,互联网采集又包括Web采集和APP采集。

2.2.1 离线采集和实时采集

离线采集主要是指工作人员在无可靠数据链接或实时数据传递速度不理想的情况下,批量一次性待机和导出数据。对于数据时效性要求不高的场合,可以进行离线数据采集。实时采集主要考虑流处理的业务场景,比如,用于记录数据源执行的各种操作活动,包括网络监控的流量管理、金融应用的股票记账和Web服务器记录的用户访问行为。

2.2.2 互联网中的Web采集和APP采集

移动端APP采集崛起之前,Web采集一直是数据采集的主流方式,PC/WEB的数据采集方式一般有3种:Web Service日志、JavaScript标记和包嗅探器,其优缺点如表1所示。

表1 PC/WEB的数据采集方式的比较

Web Service日志JavaScript标记包嗅探器

优点

较容易获取数据

源;

方便对历史数据再

处理;

可以记录搜索引擎

爬虫的访问记录;

记录文件下载状况

数据收集灵活;

可定制性强;

可以记录缓存、代

理服务器访问;

对访问者行动追踪

更为准确

对跨域访问的监

测比较方便;

取得实时数据比

较方便

缺点无法记录缓存、代

理服务器访问;

无法捕获自定义的

业务信息;

对访问者的定位过

于模糊;

对跨域访问的监测

比较麻烦

用户端的JS设置会

影响数据收集;

记录下载和重定向

数据比较困难;

会增加网站的JS脚

本负荷

初期导入费用较

高;

无法记录缓存、

代理服务器访

问;

对用户数据隐私

有安全隐患

移动端APP的采集原理与Web采集一样,差异

在于需要通过PC端获取监听APP发送和接受的数据包,其他分析和编写采集代码与Web端相同。

数据采集本身不是目的,只有采集到的数据是可用、能用,且能服务于最终应用分析的数据采集才是根本。

2.3 数据挖掘

数据挖掘是指在大量的数据中挖掘出信息,通过认真分析来揭示数据之间的联系、趋势和模式。它是对信息的价值化的获取,即考虑数据是否有价值。例如在对银行客户分类优化中,通过对客户需求的挖掘,提供有针对性的优惠和更加个性化的产品,给顾客带来更高的接受度,从而提高客户的满意度,制造更高的利润和更好的客户保留。数据挖掘分为直接数据挖掘和间接数据挖掘。

2.3.1 直接数据挖掘

直接数据挖掘的目标是利用可用的数据建立一个模型,利用这个模型对特定变量(如可以理解成客户)进行描述。分类、估值、预测属于直接数据挖掘。

2.3.2 间接数据挖掘

间接数据挖掘没有选出某一具体的变量用模型进行描述,而是在所有的变量中建立起某种关系。相关性分组或关联规则、聚类、描述和可视化等都属于间接数据挖掘。

2.4 数据分析

数据分析的目的是通过对海量表面看似杂乱无章的数据,进行统计、定量分析、解释与模型预测,找出隐藏在数据背后的内在规律和风险,提供出可靠的经济决策方案或有参考价值的建议。目前主要可以应用的数据分析方式有以下2种。

(1)复核分析:即以通过重计算和核对的方法对银行数据进行二次校验,以确保数据的完整性和准确性。

(2)异常特征分析:即根据数据中特定字段的相应特征,例如违规处理的长期冻结账户、异常计结息、异常大额交易、存贷款账户异常波动等特征,分析和筛选存在异常和风险的内容,并对进一步跟进结果。该类分析可以有效识别出银行业务流程中的潜在风险,而不仅局限于数据本身的准确性,是银行业数据分析的主要分析手段。

2.5 风险跟踪

网上银行、手机银行、第三方支付应用等新兴电子渠道的高速发展,给消费者带来便利的同时也带来了一定的威胁。因此通过数据分析了解用户消费支付习惯、规避交易风险成为构建银行风险交易分析系统的关键。例如,通过接入实时数据的方式,设定监控规则,如出现同一用户在不同的渠道、短时间内、不同IP多次登陆同一账号时,符合监控规则出现异常的条件,这时即可根据设置好的预警级别,系统自动报警提醒。

2.6 数据固化

在通过分析得出结果后,需要对结果所揭示的问题进行进一步的风险跟踪调查。最后对已经确认

·103·

相关文档
最新文档