一种基于机器学习的反洗钱系统及方法[发明专利]

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202011311913.7
(22)申请日 2020.11.20
(71)申请人 四川新网银行股份有限公司
地址 610094 四川省成都市成都高新区吉
泰三路8号1栋1单元26楼1-8号
(72)发明人 王萍 贾坤 
(74)专利代理机构 成都智言知识产权代理有限
公司 51282
代理人 蒋秀清
(51)Int.Cl.
G06Q 40/04(2012.01)
G06Q 50/26(2012.01)
G06N 20/00(2019.01)
(54)发明名称
一种基于机器学习的反洗钱系统及方法
(57)摘要
本发明公开了一种基于机器学习的反洗钱
系统及方法,属于人工智能反洗钱领域,解决了
现有技术中反洗钱系统时效性较差、无法进行实
时拦截,检测准确率不稳定、浪费检测人力的问
题,其包括业务系统,业务系统下接时效特征加
工层,时效特征加工层下接分布式模型运算层,
分布式模型运算层下接实时策略层,实时策略层
下接决策层,决策层下接业务系统与反洗钱核查
系统,反洗钱核查系统下接数据系统,数据系统
下接时序特征加工层,形成数据闭环,提高洗钱
策略的识别精度和洗钱策略识别的覆盖度,进行
对洗钱交易的实时识别并进行阻断、降低洗钱检
测的人力成本与时间成本。

权利要求书2页 说明书6页 附图6页CN 112561696 A 2021.03.26
C N 112561696
A
1.一种基于机器学习的在线实时反洗钱系统,其特征在于,包括:
时序特征加工层:基于用户信息构建时序特征,并将时序特征转入分布式模型运行层;
分布式模型运行层:基于时序特征数据,构建洗钱模型,并整合得到洗钱模型结果集,并将洗钱模型结果集转入实时策略层;
实时策略层:基于洗钱模型结果集,构造洗钱策略集,并将洗钱策略集转入决策层;
决策层:整合洗钱策略集,进行反洗钱决策,并将反洗钱决策转入反洗钱核查系统。

2.根据权利要求1所述的一种基于机器学习的在线实时反洗钱系统,其特征在于,所述决策层下接反洗钱核查系统。

3.根据权利要求2所述的一种基于机器学习的在线实时反洗钱系统,其特征在于,所述反洗钱核查系统下接反洗钱核查数据系统,所述反洗钱核查数据系统下接反洗钱数据系统,所述反洗钱数据系统下接时序特征加工层。

4.根据权利要求1所述的一种基于机器学习的在线实时反洗钱系统,其特征在于,所述时序特征加工层上接业务系统。

5.根据权利要求1所述一种基于机器学习的在线实时反洗钱系统,所述时序特征加工层上接数据系统。

6.根据权利要求1所述的一种基于机器学习的在线实时反洗钱系统的反洗钱方法,其特征在于,包括以下步骤:
步骤A:将业务系统、反洗钱系统、反洗钱核查系统及数据系统形成闭环流程。

步骤B:时序特征加工层将数据系统中的数据集进行加工,构建时序特征,并将时序特征传入分布式模型运行层
步骤C:分布式模型运行层基于时序特征,构建洗钱模型,将洗钱模型计算集成为洗钱模型结果集,并将洗钱模型结果集转入实施策略层;
步骤D:实时策略层基于洗钱模型结果集,构造洗钱策略集,并将洗钱策略集转入决策层;
步骤E:决策层通过整合洗钱策略集,进行是否拦截与是否预警的决策结果,并将决策结果反馈至业务系统和转入反洗钱核查系统;
步骤F:反洗钱核查系统将数据转入反洗核查数据系统,反洗钱核查系统将数据进行筛分后转入反洗钱数据系统,反洗钱数据系统将数据传入时序特征加工层。

7.根据权利要求6所述的一种基于机器学习的在线实时反洗钱系统的反洗钱方法,其特征在于,所述步骤A的具体步骤为:
步骤A1:业务系统、反洗钱系统、反洗钱核查系统以及数据系统通过API接口访问和域名访问的方式形成闭环流程。

8.根据权利要求6所述的一种基于机器学习的在线实时反洗钱系统的反洗钱方法,其特征在于,所述步骤B的具体步骤为:
B1:在时序特征加工层进行关联频次统计,计算设定时间段内满足条件A关联B的次数或人数;
B2:在时序特征加工层进行历史信息统计,计算设定时间段内满足设定条件的历史信息;
B3:在时序特征加工层进行统计频次,计算设定时间范围内满足设定条件的统计值。

9.根据权利要求6所述的一种基于机器学习的在线实时反洗钱系统的反洗钱方法,其特征在于,所述步骤B的具体步骤为:
B1:分布式模型运算层将多个模型写入分布式并行框架内进行计算,并将计算结果整合为洗钱模型结果集。

一种基于机器学习的反洗钱系统及方法
技术领域
[0001]本发明属于智能发洗钱监控领域,具体属于一种基于机器学习的在线实时反洗钱系统及方法。

背景技术
[0002]反洗钱、反恐融资已经上升为国家战略,成为处理国家非传统安全事务的重要工具,2012 年以来,反洗钱金融行动特别工作组(FATF)对反洗钱国际标准及其评估方法做了全面修改,反洗钱内涵扩大到反洗钱、反恐怖融资和反大规模杀伤性武器扩散融资三大领域,反洗钱工作范围也从最初的反毒、反恐怖、反腐败扩展到扩散融资、税务犯罪、互联网金融等更广泛的领域,已不再局限于简单的技术性事务,而是与国际政治博弈紧密捆绑在一起,上升到国家战略层面,成为国家处理除领土、主权和军事安全以外的非传统安全问题的重要工具。

[0003]目前对于反洗钱工作,一般基于交易数据,进行名单结合洗钱专家规则的交易预警,再由人工进行侦测,将可疑交易进行统计,包括当日单笔大额交易、短期内资金分散转入、集中转出或集中转入、分散装出、与客户身份、财务状况、经营业务明显不符等,银行将可以案例与大额案例进行后,报告到人行的反洗钱检测分析中心。

[0004]在传统洗钱方案中,采用事后跑批,具有较长的滞后性,不能实时发现洗钱交易,也不能进行实时拦截;其次,基于专辑规则的交易检测准确率无法达到最优状态,容易造成大量的无效预警,浪费检测人力。

发明内容
[0005]针对现有技术中反洗钱系统时效性较差、无法进行实时拦截,检测准确率不稳定、浪费检测人力的问题,本发明提供一种基于机器学习的在线实时反洗钱系统及方法,其目的在于:提高洗钱策略的识别精度和洗钱策略识别的覆盖度,进行对洗钱交易的实时识别并进行阻断、降低洗钱检测的人力成本与时间成本。

[0006]本发明采用的技术方案如下:
[0007]一种基于机器学习的在线实时反洗钱系统,包括:
[0008]时序特征加工层:基于用户信息构建时序特征;
[0009]分布式模型运行层:基于时序特征数据,构建洗钱模型,并整合得到洗钱模型结果集;
[0010]实时策略层:基于洗钱模型结果集,构造洗钱策略集;
[0011]决策层:整合策略集新信息,进行反洗钱决策
[0012]采用上述方案,时序特征加工层能够对用户信息进行整合,包括:用户基础属性、设备环境位置信息、操作行为数据、点击流数据,时序特征加工层基于上述用户信息进行构建时序特征,其中时序特征包括:关联频次、统计频次、历史信息,时序特征加工层将上述时序特征转入分布式模型运行层,分布式模型运行层根据洗钱类型与模型方法,构建洗钱模
型,并给予洗钱模型进行洗钱识别,得到洗钱模型结果集,分布式模型运算层将洗钱模型结果集转入实时策略层,实时策略层基于洗钱模型结果集,构造洗钱策略集,为了平衡分型与业务体验的关系,采用分组并联串行的策略组织架构,低风险客户群采用轻级策略,高风险客户群采用重级策略,最终得到实时策略结果集,并将实时策略结果集转入决策层通过整合实时策略结果集信息,根据风险等级给出决策结果,包括:通过不预警、通过预警、拦截预警三种决策结果,实现了对洗钱交易的实时监控与拦截,并通过对客户信息进行时序特征加工,大大提高了反洗钱系统的检测精度与效率。

[0013]为了对反洗钱系统做出的决策结果进行反馈,所述决策层下接反洗钱核查系统,所述反洗钱核查系统的方式为人工侦测,通过人工侦测方式,对反洗钱系统提供的可疑交易进行进一步地洗钱鉴别。

[0014]为了使时序特征加工层中的数据更加全面和准确,所述反洗钱核查系统下接反洗钱核查数据系统,所述反洗钱核查数据系统下接反洗钱数据系统,所述反洗钱数据系统下接时序特征加工层,其中反洗钱核查系统中得出的数据转入反洗钱核查系统,所述反洗钱核查系统将数据进行筛分过滤,并将筛分过滤后的数据转入反洗钱数据系统,反洗钱数据系统将数据转入时序特征加工层,通过上述数据流闭环,提高了时序特征加工层的数据覆盖度与准确性,在反洗钱系统工作过程中能够得到更加精准的时序特征。

[0015]为了使反洗钱系统具有实时性,时序特征加工层上接业务系统,通过将时序特征加工层与业务系统对接,业务系统能够实时访问反洗钱系统,反洗钱实时响应业务系统在线请求,实现了对银行业务交易的实时检测。

[0016]为了能够对业务系统的在线请求做出实时响应。

时序特征加工层上接数据系统在业务系统发出请求后,时序特征加工层能够根据数据系统中的用户信息实时进行数据处理,保证了对实时请求处理的数据支撑。

[0017]一种基于机器学习的在线实时反洗钱系统的反洗钱方法,包括以下步骤:[0018]步骤A:将业务系统、反洗钱系统、反洗钱核查系统及数据系统形成闭环流程。

[0019]步骤B:时序特征加工层将数据系统中的数据集进行加工,构建时序特征,并将时序特征传入分布式模型运行层
[0020]步骤C:分布式模型运行层基于时序特征,构建洗钱模型,将洗钱模型集成为洗钱模型结果集,并将洗钱模型结果集转入实施策略层;
[0021]步骤D:实时策略层基于洗钱模型结果集,构造洗钱策略集,并将洗钱策略集转入决策层;
[0022]步骤E:决策层通过整合洗钱策略集,进行是否拦截与是否预警的决策结果,并将决策结果反馈至业务系统和转入反洗钱核查系统;
[0023]步骤F:反洗钱核查系统将数据转入反洗核查数据系统,反洗钱核查系统将数据进行筛分后转入反洗钱数据系统,反洗钱数据系统将数据传入时序特征加工层
[0024]采用上述方案,通过系统界面配置,工具化程度高,降低人力及时间成本。

反洗钱系统基于时序特征加工层、分布式模型运行层、实时策略层、决策层解耦串行的设计结构和运行方式,极大的降低了计算复杂度,其中通过时序特征加工层与业务系统的实时响应,与数据系统对时序特征加工层的实时数据支撑,实现了对银行交易的实施反洗钱监控,其中时序特征加工层通过对对用户信息进行提炼抽象,大大提升了模型识别的效果。

[0025]为了提高系统间的数据传输实时性,所述步骤A的具体步骤为:
[0026]步骤A1:业务系统、反洗钱系统、反洗钱核查系统以及数据系统通过API接口访问和域名访问的方式形成闭环流程。

业务系统、反洗钱系统、反洗钱查核系统与数据系统通过API接口对接,能够实现系统间的通信与数据共享,保证了各个系统之间的数据畅通性。

[0027]为了使分布式模型运行层达到好的模型建构效果,时序特征加工层对转入的数据进行三种抽象后的时序特征方法,所述步骤B的具体步骤为:
[0028]B1:在时序特征加工层进行关联频次统计,计算设定时间段内满足条件A关联B的次数或人数;
[0029]B2:在时序特征加工层进行历史信息统计,计算设定时间段内满足设定条件的历史信息;
[0030]B3:在时序特征加工层进行统计频次,计算设定时间范围内满足设定条件的统计值。

[0031]通过上述三种时序特征加工方法,能够显著提高反洗钱交易的识别,使转入分布式模型运算层的时序特征更加清晰与具有对可以交易的针对性,提高了反洗钱系统的侦测效率与准确性。

[0032]为了提高模型计算效率与提高业务系统的前端的时效,所述步骤B的具体步骤为:[0033]B1:分布式模型运算层将多个模型写入分布式并行框架内进行计算,并将计算结果整合为洗钱模型结果集。

[0034]分布式模型运算层将各个模型写入分布式并行框架内进行计算,解决了传统技术中串行框架地下的计算效率,与在面对网络波动时,计算时间不足时出现的模块计算失败的技术缺陷。

[0035]综上所述,由于采用了上述技术方案,本发明的有益效果是:
[0036] 1.时序特征加工层能够对用户信息进行整合,包括:用户基础属性、设备环境位置信息、操作行为数据、点击流数据,时序特征加工层基于上述用户信息进行构建时序特征,其中时序特征包括:关联频次、统计频次、历史信息,时序特征加工层将上述时序特征转入分布式模型运行层,分布式模型运行层根据洗钱类型与模型方法,构建洗钱模型,并给予洗钱模型进行洗钱识别,得到洗钱模型结果集,分布式模型运算层将洗钱模型结果集转入实时策略层,实时策略层基于洗钱模型结果集,构造洗钱策略集,为了平衡分型与业务体验的关系,采用分组并联串行的策略组织架构,低风险客户群采用轻级策略,高风险客户群采用重级策略,最终得到实时策略结果集,并将实时策略结果集转入决策层,局测测那个通过整合实时策略结果集信息,根据风险等级给出决策结果,包括:通过不预警、通过预警、拦截预警三种决策结果,实现了对洗钱交易的实时监控与拦截,并通过对客户信息进行时序特征加工,大大提高了反洗钱系统的检测精度与效率。

[0037] 2.所述反洗钱核查系统的方式为人工侦测,通过人工侦测方式,对反洗钱系统提供的可疑交易进行进一步地洗钱鉴别。

[0038] 3.通过将时序特征加工层与业务系统对接,业务系统能够实时访问反洗钱系统,反洗钱实时响应业务系统在线请求,实现了对银行业务交易的实时检测。

[0039] 4.时序特征加工层上接数据系统在业务系统发出请求后,时序特征加工层能够根据数据系统中的用户信息实时进行数据处理,保证了对实时请求处理的数据支撑。

[0040] 5.通过系统界面配置,工具化程度高,降低人力及时间成本。

反洗钱系统基于时序特征加工层、分布式模型运行层、实时策略层、决策层解耦串行的设计结构和运行方式,极大的降低了计算复杂度,其中通过时序特征加工层与业务系统的实时响应,与数据系统对时序特征加工层的实时数据支撑,实现了对银行交易的实施反洗钱监控,其中时序特征加工层通过对对用户信息进行提炼抽象,大大提升了模型识别的效果。

[0041] 6.业务系统、反洗钱系统、反洗钱查核系统与数据系统通过API接口对接,能够实现系统间的通信与数据共享,保证了各个系统之间的数据畅通性。

[0042]7.通过上述三种时序特征加工方法,能够显著提高反洗钱交易的识别,使转入分布式模型运算层的时序特征更加清晰与具有对可以交易的针对性,提高了反洗钱系统的侦测效率与准确性。

[0043]8.分布式模型运算层将各个模型写入分布式并行框架内进行计算,解决了传统技术中串行框架地下的计算效率,与在面对网络波动时,计算时间不足时出现的模块计算失败的技术缺陷。

附图说明
[0044]本发明将通过例子并参照附图的方式说明,其中:
[0045]图1是本发明的流程示意图;
[0046]图2是本发明的关联频次配置界面图;
[0047]图3是本发明的历史信息配置界面图;
[0048]图4是本发明的统计频次配置界面图;
[0049]图5是本发明的分布式模型框架设计图;
[0050]图6是本发明的实施策略层设计图;
[0051]图7是本发明的决策层设计图。

具体实施方式
[0052]本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。

[0053]下面结合图1、图2对本发明作详细说明。

[0054]实施例一:
[0055]一种基于机器学习的在线实时反洗钱系统,其特征在于,包括:
[0056]时序特征加工层:基于用户信息构建时序特征;
[0057]分布式模型运行层:基于时序特征数据,构建洗钱模型,并整合得到洗钱模型结果集;
[0058]实时策略层:基于洗钱模型结果集,构造洗钱策略集;
[0059]决策层:整合策略集新信息,进行反洗钱决策
[0060]时序特征加工层基于转入的用户信息与数据构建时序特征,并对时序特征进行三种模式的加工,并将加工后而定时序特征转入分布式模型运行层,分布式模型运行层基于时序特征进行模型计算,并将得到的模型结果集转入实施策略层,实时策略层基于洗钱模型结果集,构造洗钱策略集,并将洗钱策略集转入决策层,决策层整合洗钱策略集,进行反
洗钱决策。

[0061]以下实施例都是在实施例一的基础上优选得到的。

[0062]实施例二:所述决策层下接反洗钱核查系统,决策层下接的反洗钱核查系统能够对反洗钱系统提供的可疑交易进行人工核查,进一步地进行洗钱交易的侦测。

[0063]实施例三:所述反洗钱核查系统下接反洗钱核查数据系统,所述反洗钱核查数据系统下接反洗钱数据系统,所述反洗钱数据系统下接时序特征加工层。

反洗钱核查系统将人工核查的数据转入反洗钱核查数据系统,反洗钱核查数据系统再将反洗钱核查数据转入反洗钱系统,通过上述数据闭环,增加了反洗钱数据系统的覆盖度,使时序特征加工层的时序特征选择更加广泛并具有针对性。

[0064]实施例四:所述时序特征加工层上接业务系统,时序特征加工层通过API接口对接业务系统,当银行客户通过业务系统发出请求时,业务系统将请求实时传输给时序特征加工层,时序特征加工层通过从数据系统转入的用户信息对业务系统实时响应,并将时序特征传输给下一模块进行后续反洗钱系统流程。

[0065]实施例五:所述时序特征加工层上接数据系统,时序特征加工层通过API接口对接数据系统,当业务系统向时序特征加工层发出请求时,时序特征加工层通过数据系转入的用户信息进行时序特征加工,并将时序特征传输给下一模块进行后续反洗钱系统流程。

[0066]实施例六:
[0067]种基于机器学习的在线实时反洗钱系统的反洗钱方法,包括以下步骤:[0068]步骤A:将业务系统、反洗钱系统、反洗钱核查系统及数据系统形成闭环流程。

[0069]步骤B:时序特征加工层将数据系统中的数据集进行加工,构建时序特征,并将时序特征传入分布式模型运行层
[0070]步骤C:分布式模型运行层基于时序特征,构建洗钱模型,将洗钱模型计算集成为洗钱模型结果集,并将洗钱模型结果集转入实施策略层;
[0071]步骤D:实时策略层基于洗钱模型结果集,构造洗钱策略集,并将洗钱策略集转入决策层;
[0072]步骤E:决策层通过整合洗钱策略集,进行是否拦截与是否预警的决策结果,并将决策结果反馈至业务系统和转入反洗钱核查系统;
[0073]步骤F:反洗钱核查系统将数据转入反洗核查数据系统,反洗钱核查系统将数据进行筛分后转入反洗钱数据系统,反洗钱数据系统将数据传入时序特征加工层。

[0074]在上述实施例六中,业务系统、反洗钱系统、反洗钱核查系统与数据系统形成闭环流程,当业务系统向时序特征加工层发出请求时,时序特征加工层实时响应,并转入数据系通中的用户信息加工为时序特征,并将时序特征转入分布式模型运行层,分布式运行层基于时序特征,构建洗钱模型,并将洗钱模型写入设置好的框架中进行计算,得到洗钱模型结果集,并将洗钱模型结果集转入实施策略层,实时策略层基于洗钱模型结果集,狗仔洗钱策略集,并将洗钱策略集写入洗钱策略框架中进行计算,得到实时策略结果集,并将实时策略结果集转入决策层进行决策,决策层将产生三种决策,包括通过不预警、通过预警和拦截预警,如果通过不预警和通过预警,则决策层向业务系统前端反馈为成功,如果拦截预警,则向业务系统前端反馈为操作异常,同时,决策层将决策结果转入反洗钱核查系统进行人工核查,对可疑交易进行进一步地侦测,侦测结束后,反洗钱核查系统将反洗钱核查数据转入
反洗钱核查数据系统,反洗钱核查数据系统将反洗钱核查数据转入反洗钱系统,并在下一次时序特征加工层相应业务系统是,向时序特征加工层转入数据,完成数据闭环。

[0075]以下实施例都是在实施例六的基础上优选得到的。

[0076]实施例七:述步骤A的具体步骤为:
[0077]步骤A1:业务系统、反洗钱系统、反洗钱核查系统以及数据系统通过API接口访问和域名访问的方式形成闭环流程。

通过API接口对更系统之间对接能够实现系统间的通信与数据共享,保证了各个系统之间的数据畅通性。

[0078]实时例八:所述步骤B的具体步骤为:
[0079]B1:在时序特征加工层进行关联频次统计,计算设定时间段内满足条件A关联B的次数或人数;
[0080]B2:在时序特征加工层进行历史信息统计,计算设定时间段内满足设定条件的历史信息;
[0081]B3:在时序特征加工层进行统计频次,计算设定时间范围内满足设定条件的统计值。

[0082]在上述实施例八中,时序特征加工层可将转入的数据进行抽象加工,其加工方式可分为:
[0083] 1.关联频次:在关联频次配置页面中可选择用户信息的主维度A,包括:城市,家庭地址,手机号,其中B为用户信息的从维度,包括:身份证、IP,关联频次特征如:最近1天该用户关联的消费金额大于5000的消费交易次数。

[0084] 2.历史信息:计算某段时间范围内满足一定条件的历史信息。

如:最近7天内该用户在凌晨0点‑5点最近一次消费的金额。

[0085] 3.统计频次:计算某段时间范围内满足一定条件的统计值,包括:最大值、最小值、平均值、求和、标准差、1/4分位数、3/4分位数等。

如:将统计时间设置为最近一天,将统计方式设置为平均值,将统计字段设置为转出,则可以得到最近1天内该用户转账转出的平均交易金额。

[0086]实施例九:所述步骤B的具体步骤为:
[0087]B1:分布式模型运算层将多个模型写入分布式并行框架内进行计算,并将计算结果整合为洗钱模型结果集。

[0088]本发明中的分布式模型运算层采用分布式并行框架,在实际运行中,能够将多个模型写进分布式并行框架中分别运算,改善了传统技术中串行框架在面对网络波动时容易造成计算失败与效率低下的问题,如:用户在使用应用系统时,分布式模型运算层因为需要对应用系统的时效性,有1秒的计算时间计算十个模型结果,但由于用户的网络波动问题,只得到300 毫秒的计算时间,所以分布式并行框架能够只运算其中六个,而在对检测结果影响在阙值范围内,不产生计算错误,且在运算时间充足的情况下,处理的模型个数要优于传统串行框架。

[0089]以上所述实施例仅表达了本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。

应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

相关文档
最新文档