银行大数据解决实施方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
银行大数据解决方案
一、项目背景
2015年8月31日,国务院印发了《促进大数据发展的行动纲要》,这一战略性文件为我国大数据发展与应用提供了指导纲领和政策保障。在数据已成为银行重要资产和宝贵资源的形势下,《纲要》也为银行利用大数据推动转型发展指明了方向和实施路径,带来了发展新机遇。
当前中国银行业正在步入大数据时代的初级阶段。经过多年的发展与积累,目前银行业的数据量已经达到100TB以上级别,并且非结构化数据量正在以更快的速度增长。银行业在数据方面有天然的优势:一方面,银行在业务开展过程中积累了包括客户身份、资产负债情况、资金收付交易等大量高价值密度的数据,这些数据在运用专业技术挖掘和分析之后,将产生巨大的商业价值;另一方面,银行具有较为充足的预算,可以吸引到实施大数据的高端人才,也有能力采用大数据的最新技术。
总体来看,尽管大数据在银行业的应用刚刚起步,目前影响还比较小,但是从发展趋势来看,应充分认识大数据带来的深远影响。银行业需要进行统一的大数据平台建设,建立综合预测分析体系,整合生产系统数据资源。在此基础上与《纲要》规划的信用信息共享交换平台和公共机构数据统一开放平台有效对接,双管齐下扩展数据来源和采集渠道。这可以一方面高效收集、有效整合企业和社会公共数据,掌握企业真实需求,实现精准营销。尤其可通过农业农村信息综合服务和农业资源要素数据共享,获取三农数据和小微企业数据,解决数据挖掘和分析难点,提升三农和小微金融服务水平。另一方面利用平台动态监控企业经营及个人信用变化情况,强化信用风险智能化管理和预警,降低信用评估、风险控制的难度和不确定性,实现风险管控和精准营销的双重收益。
二、银行大数据平台总体框架
2.1银行大数据平台框架概述
银行大数据建设是基于已有的信息化基础,充分利用和整合已有信息化资源,打破行业、部门之间的信息壁垒,运用大数据技术进行采集、加工、建模、分析,将数据价值融入到金融之中,从而提升创新能力和产品服务能力。
(1)大数据分析基础平台
按照功能划分数据区,设计数据模型,在统一流程调度下,整合各类数据,同现有的企业级数据仓库和历史数据存储系统一起,形成基础数据体系,提供支撑经营管理的各类数据应用,支撑上层应用。
(2)数据应用系统
基于基础数据平台,持续建设各类数据应用系统,通过数据挖掘、计量分析和机器学习等手段,对丰富的大数据资源进行开发使用,并将数据决策化过程结合到风控、营销、营运等经营管理活动,充分发挥大数据价值。
(3)数据管控
建立数据标准,提升数据质量,加强元数据管理能力,为平台建设及安全提供保障。
2.2银行大数据平台建设原则
平台是大数据的基础实施,其建设、设计和系统实现过程中,应遵循如下指导原则:经济性:基于现有场景分析,对近年数据量进行合理评估,确定大数据平台规模,后续根据实际情况再逐步优化扩容。可扩展性:架构设计与功能划分模块化,考虑各接口的开放性、可扩展性,便于系统的快速扩展与维护,便于第三方系统的快速接入。
可靠性:系统采用的系统结构、技术措施、开发手段都应建立在已经相当成熟的应用基础上,在技术服务和维护响应上同用户积极配合,确保系统的可靠;对数据指标要保证完整性,准确性。
安全性:针对系统级、应用级、网络级,均提供合理的安全手段和措施,为系统提供全方位的安全实施方案,确保企业内部信息的安全。大数据技术必须自主可控。
先进性:涵盖结构化,半结构化和非结构化数据存储和分析的特点。借鉴互联网大数据
存储及分析的实践,使平台具有良好的先进性和弹性。支撑当前及未来数据应用需求,引入对应大数据相关技术。
平台性:归纳整理大数据需求,形成统一的大数据存储服务和大数据分析服务。利用多租户, 实现计算负荷和数据访问负荷隔离。多集群统一管理。
分层解耦:大数据平台提供开放的、标准的接口,实现与各应用产品的无缝对接
2.3银行基础数据层来源
2.3.1银行内部大数据资源
金融行业的数据大多数来源于客户自身信息以及其金融交易行为,其中八成左右的数据集中于银行。因此依照目前积累沉淀的数量资源情况,将数据主要分为三大类:第一类:客户基础数据
客户信息数据,即客户基础数据,主要是指描述客户自身特点的数据。
个人客户信息数据包括:个人姓名、性别、年龄、身份信息、联系方式、职业、生活城市、工作地点、家庭地址、所属行业、具体职业、婚姻状况、教育情况、工作经历、工作技能、账户信息、产品信息、个人爱好等等。
企业客户信息数据包括:企业名称、关联企业、所属行业、销售金额、注册资本、账户信息、企业规模、企业地点、分公司情况、客户和供应商、信用评价、主营业务、法人信息等等。
目前银行业的客户信息数据积累数量无疑是最大,如果将这些割裂的数据整合到大数据平台,形成全局数据,再按照自身需要进行归类和打标签,由于都是结构化数据因此将有利于数据分析。可以将这些信息集中在大数据管理平台,对客户进行分类,依据其他的交易数据,进行产品开发和决策支持。
第二类:支付信息
交易信息数据,可以称之为支付信息,主要是指客户通过渠道发生的交易以及现金流信息。
个人客户交易信息:包括工资收入、个人消费、公共事业缴费、信贷还款、转账交易、委托扣款、购买理财产品、购买保险产品、信用卡还款等。
企业客户交易信息:包括供应链应收款项、供应链应付款项、员工工资、企业运营支出、同分公司之间交易、同总公司之间交易、税金支出、理财产品买卖、金融衍生产品购买、公
共费用支出、其他转账等。
第三类:资产信息
资产信息主要是指客户在金融机构端资产和负债信息,同时也包含金融机构自身资产负债信息,其中数据大多来自银行。
个人客户资产负债信息包括:购买的理财产品、定期存款、活期存款、信用贷款、抵押贷款、信用卡负债、抵押房产、企业年金等。
企业客户资产负债信息包括:企业定期存款、活期存款、信用贷款、抵押贷款、担保额度、应收账款、应付账款、理财产品、票据、债券、固定资产等。
银行自身端资产负债信息包括:自身资产和负债例如活期存款、定期存款、借入负债、结算负债、现金资产、固定资产贷款证券投资等。
第四类:新型业务数据
此类数据包括系统的运行日志、客服语音、视频影像、网站日志等。
2.3.2外部大数据所需来源
银行机构进行大数据分析,为了赢得差异化竞争,就必须考虑其他数据源的输入,这些数据是自身不具有的,但是对其数据分析和决策起到了很重要的作用。
银行内部有客户信息、交易信息、信用信息、资产信息等,具有较全的数据,需要的外部数据具有一定针对性,下表是外部数据需求的整理。