非法集资反洗钱数据模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非法集资反洗钱数据模型
传统的反洗钱模型
简单的说,传统的反洗钱模型是对一段时间内客户的交易行为进行分析的过程。
比如,对各系统交易流水表中提取一段时间内客户的帐号,客户号,客户名称,对手帐号,金额数量大于一定的限额,或者有一定数量的外币交易,这里面还要考虑单日交易的交易额是否超过一定额度,或者在一段时间内流动总金额超过一定限额,有时还要考虑每次交易金额是否都是100的整数倍。
互联网金融洗钱模型
除了传统的反洗钱模型,还应该考虑快速发展的互联网金融提供了便捷的同时,也为洗钱活动提供了土壤。
与传统金融活动相比,互联网洗钱更为隐蔽、全球化程度更高、成本更低廉、追踪难度大。
互联网金融数据最大的特征就是数据碎片化导致的信息分割。
借助互联网金融平台完成一笔交易,从纵向来看,需要发卡机构、互联网支付机构、电信运营商、收单机构、持卡人、商户甚至外包服务机构共同参与,支付流程的碎片化导致了交易信息和客户身份信息的分割;从横向来看,发卡机构包括全国性商业银行、股份制商业银行、城商行、农商行、农信社、村镇银行等,持卡人和商户数量更是数不胜数,参与主体的碎片化使得同一客户的身份信息和交易信息被分散保存在不同机构中。
在建立以数据为中心的互联网金融反洗钱模型的过程中,必须以大数据技术为基础,建立海量关联交易数据库,包括数据的收集、整理、加工、储存、应用。
数据收集
通过网络爬虫系统,突破地理距离的限制,捕捉和整合相关信息,并通过校验规则的设立及其关联性分析得到有效数据。
二是考虑与互联网金融机构建立合作机制,直接通过数据接口获取相关数据。
数据整合
数据整合是保障分析结果可靠性、准确性必不可少的环节。
从金融风险的定义出发,确定反洗钱需求,对数据进行重新整合,提取与之对应的分析数据。
具体而言,一是数据类型转换,使不同的数据信息来源可以被量化分析,比如将字符型变量转换成数值型变量等;二是数据变量的非线性转换,使得转换后的变量能更好地适合模型算法;三是挖掘不同主题数据的关联关系,建立关联数据仓库。
数据分析
数据分析是互联网金融风险管理控制的实施手段。
全面的数据分析应包括现行的指标体系、统计模型以及人工智能方法等。
通过聚类分析,一方面从物理地址上识别关联用户,同一IP、移动终端(手机终端、iPad终端)、电脑终端、网站ID等用户入口识别关联账号;另一方面从交易末端账号对应的银行卡号往前追踪,从而识别关联客户。
从正向的用户入口和逆向终端银行账户交叉验证识别同一用户或
用户群,发现关联交易。
反洗钱系统逻辑分层设计
大数据反洗钱系统的设计,一般包含以下几个方面:
1.源数据层
数据来自银行内部各个系统数据源。
2.数据存储层
初始与源数据层表结构一致,隔离源数据层表结构的变化。
3.数据汇聚层
数据汇聚层主要完成主题数据整理,包括客户、账户、交易数据采集。
4.数据计算层
依据定义的可疑规则,分析数据汇聚层的数据,找出可疑交易,并生成报表。
信息管理层对数据计算层分析出的预警信息以及报表信息进行
管理,包含角色管理、用户管理、规则定义、白名单配置、权限管理、日志管理、报表管理、报送管理等。
5.决策分析层
用户对预警信息进行处理,确认可疑交易,筛选出相关数据报送监管局。