基于金融知识图谱的反欺诈实践
知识图谱如何针对金融领域开创反欺诈平台
知识图谱如何针对金融领域开创反欺诈平台在金融领域中,反欺诈平台的重要性不言而喻。
因为金融领域的欺诈行为极具危害性,不仅会导致金融机构遭受巨大损失,还会损害客户对金融行业的信任。
为了有效地应对欺诈行为,知识图谱成为了一种有力的工具。
本文将探讨知识图谱如何针对金融领域开创反欺诈平台。
首先,了解知识图谱的概念和原理对于理解如何应用于反欺诈平台至关重要。
知识图谱是一种基于图形数据库的知识表示形式,通过将实体、属性和关系组织成图形,可以更好地表达和推理知识。
在金融领域中,知识图谱可以用于表示各种金融实体,如客户、账户、交易等,以及它们之间的相关关系。
通过构建和分析这些知识图谱,我们可以发现潜在的欺诈行为。
其次,知识图谱可以通过多种方式开创反欺诈平台。
首先,它可以帮助金融机构建立完整、准确的客户信息。
通过将客户的个人信息、交易记录等整合到知识图谱中,金融机构可以更好地了解客户的信用和风险特征,从而找出潜在的欺诈行为。
其次,知识图谱还可以用于发现关联性。
通过分析知识图谱中实体之间的关系,我们可以找出不同账户之间的交叉持有、资金流动等模式,进一步发现可能的欺诈活动。
此外,知识图谱还可以通过机器学习和人工智能技术提供更精确的风险评估。
通过对知识图谱中的实体进行监控和分析,我们可以建立基于模型的预测,识别出潜在的欺诈行为。
同时,知识图谱还可以通过数据挖掘和规则引擎相结合,实现自动化的欺诈检测和风险管理。
这种结合能够根据规则和模式,实时监测和识别异常交易行为,及时采取措施避免金融损失。
除了以上应用,知识图谱还可以与外部数据源结合,进一步提升反欺诈平台的效果。
通过整合公共数据、社交媒体数据等等,我们可以获得更丰富的信息,对客户和交易进行更全面的分析。
此外,金融机构还可以与其他金融机构、执法机构等进行信息共享,通过共同建立知识图谱,增强对欺诈行为的识别和预防能力。
当然,要想成功应用知识图谱于金融领域的反欺诈平台,还需要面临一些挑战。
建设银行网络金融反欺诈运营实践与探索
特别关注Special Report8《中国信用卡》2023.12☐ 中国建设银行网络金融部副总经理 殷勇建设银行网络金融反欺诈运营实践与探索随着信息技术和移动互联网的快速发展,网络诈骗形势越发复杂严峻,欺诈团伙作案手段不断演变升级。
为有效打击网络金融欺诈,建设银行深入贯彻落实增强“三个能力”建设要求,积极践行数字化转型战略,组建专业化风控运营团队,通过加大生物特征识别、大数据、知识图谱、机器学习等新一代技术在金融风控领域的应用力度,加速建设以网络金融智能“风控大脑”为核心的大数据智能风控平台,构建全面、主动、智能的网络金融风险防控体系,增强数据驱动,加快运营整合,形成“风控策略—风险控制—欺诈侦测—核查处置—运营迭代”全流程闭环的反欺诈运营模式,推动反欺诈运营高质量发展。
特别关注92023.12《中国信用卡》二、增强数据驱动,助力反欺诈数字化转型数字经济时代的到来,推动全球银行业实施数字化转型,反欺诈能力将成为未来商业银行的核心竞争力,是同业竞争的主战场。
为适应数字经济时代发展的要求,建设银行努力探索新金融发展路径,坚持运用科技手段解决风险管理痛点问题,用数据思维理解反欺诈防控工作,通过拓宽线上线下、行内行外风控数据信息来源,形成全域数据集成整合,利用大数据处理技术对海量数据进行采集、存储、分类,搭建风控数据中台,打造数据与业务相互驱动的动态化防控体系,实现反欺诈防控从样本到全量、由模糊到精确、由因果到关联的转变,提升对欺诈风险的认知能力,将数据收集分析、数据驱动决策运用于反欺诈管理全过一、深化科技应用,推动反欺诈智能化发展2010年,建设银行在同业中率先建成覆盖网上银行、手机银行等多渠道多场景的网络金融交易风险监控平台,建立起覆盖网络金融业务的事前、事中、事后全流程安全与风险管控体系。
近年来,建设银行将新一代金融科技成果与网络金融反欺诈经验进行有机结合,从风控平台的应用层、功能层和基础层等维度,构建多层次、可扩展、快迭代的网络金融智能风控体系。
金融大数据反欺诈解决方案
降低风险:通过 大数据分析,提 前识别并预警风 险,降低客户资
产损失风险。
提高客户满意度: 通过保护客户资 产安全,提高客 户满意度,增强
客户忠诚度。
维护金融市场稳 定:通过大数据 反欺诈,维护金 融市场稳定,促 进金融市场健康
发展。
降低金融机构风险
01
及时发现并阻止 欺诈行为,降低 金融机构的损失
保险欺诈检测
01
保险欺诈类型: 包括虚假投保、 虚假理赔、重 复投保等
02
保险欺诈检测方 法:利用大数据 技术,分析投保 人、被保险人、 理赔人等信息, 发现异常行为
03
保险欺诈检测 效果:提高保 险欺诈识别率, 降低保险公司 损失
04
保险欺诈检测应 用:保险公司在 投保、理赔等环 节进行欺诈检测, 提高风险管理能 力
金融大数据反欺 诈解决方案
目录
01. 金融大数据反欺诈的重要性 02. 金融大数据反欺诈的技术原
理
03. 金融大数据反欺诈的应用场 景
04. 金融大数据反欺诈的未来发 展
1
金融大数据反欺 诈的重要性
保护客户资产安全
防止欺诈行为: 通过大数据分析, 及时发现并阻止 欺诈行为,保护 客户资产安全。
数据预处理:数据清洗、数据归一 03 化、数据标注等
数据整合:将不同来源、类型的数 04 据进行整合,形成统一的数据仓库
数据分析与建模
数据采集:从各种渠 道收集金融数据,包 括交易数据、用户行
为数据等
模型构建:根据分析 结果,构建反欺诈模 型,如分类模型、聚
类模型等
数据清洗:对数据进 行清洗、去噪、缺失 值处理等,保证数据
预警
法规与监管的完善
知识图谱在金融反欺诈场景中的应用二算法趣解
知识图谱在金融反欺诈场景中的应用二算法趣解知识图谱在金融反欺诈场景中的应用——算法趣解随着金融科技的发展,金融反欺诈成为了保障金融安全的重要一环。
而知识图谱作为一种关系型数据的模型,正逐渐被应用在金融反欺诈领域。
本文将为您介绍知识图谱在金融反欺诈场景中的应用,并对其中涉及的算法进行趣解。
一、知识图谱在金融反欺诈中的应用1. 数据标注与实体关系构建在金融反欺诈中,构建一个准确的知识图谱是非常重要的。
首先,需要对数据进行标注,将数据中的实体识别出来,并建立它们之间的关系。
例如,标注出银行卡号、身份证号等重要信息,并建立与客户账户之间的关系。
2. 欺诈模式识别与分析知识图谱可以帮助银行分析和识别欺诈行为模式。
通过对大量历史案例的分析,可以构建欺诈模式的知识图谱,并将其应用于新的案例中。
当有可疑交易或行为发生时,系统能够自动与已有的欺诈模式进行比对,以识别是否存在欺诈风险。
3. 欺诈风险评估与预警通过对知识图谱的建模和分析,可以对用户的信用风险进行评估,并及时发出预警。
如果用户的行为和历史数据存在异常,系统可以根据知识图谱的规则和算法,将其标记为高风险用户,并触发相应的预警机制。
二、算法趣解1. 实体识别算法在知识图谱的构建过程中,实体识别起着关键的作用。
实体识别算法可以通过分析文本、规则匹配等方式,从大量的数据中提取出所需的实体信息。
例如,在金融反欺诈中,可以利用实体识别算法从文本中提取出银行卡号、身份证号等重要实体信息。
2. 图分析算法图分析算法是知识图谱中的重要组成部分。
它可以发现节点之间的关系、挖掘隐藏的模式,并揭示出不同实体之间的联系。
在金融反欺诈中,图分析算法可以帮助银行发现欺诈行为的模式,并及时采取相应的措施。
3. 预测算法预测算法是金融反欺诈中常用的算法之一。
它可以通过对历史数据的分析和建模,预测未来的欺诈风险。
例如,可以利用预测算法对客户的信用风险进行评估,并提前采取措施,降低欺诈风险发生的可能性。
AIGC金融业务中智能客户反欺诈的实践案例
AIGC金融业务中智能客户反欺诈的实践案例金融业务发展迅猛,与此同时,金融犯罪也层出不穷。
为了保护客户利益和自身声誉,金融机构需要采取措施来解决这些问题。
AIGC作为一家国际知名的金融服务提供商,一直致力于进一步提升智能客户反欺诈能力。
本文将介绍AIGC金融业务中智能客户反欺诈的实践案例。
1. 情景描述在金融业务中,客户信息安全和防止欺诈行为是非常重要的。
随着技术的发展,AIGC研发团队利用智能技术,建立了客户反欺诈系统。
这个系统基于大数据分析和机器学习算法,能够实时检测和预防欺诈行为。
2. 系统架构AIGC智能客户反欺诈系统采用分布式架构,由数据收集、数据处理和欺诈检测三个模块组成。
2.1 数据收集模块数据收集模块负责从各个渠道和源头收集客户数据,包括个人信息、银行账户、交易记录等。
数据收集模块通过建立数据接口,实现数据的规范化和统一。
2.2 数据处理模块数据处理模块接收数据收集模块传来的数据,进行数据清洗和特征提取。
清洗后的数据将进行特征工程,提取出与欺诈行为相关的特征。
2.3 欺诈检测模块欺诈检测模块是整个系统的核心部分。
该模块通过机器学习算法,在实时性要求下进行模型训练和结果预测。
模型训练过程中使用已知的欺诈数据进行样本训练,以提高模型的准确率和可靠性。
一旦监测到可疑的交易或行为,系统会自动触发警报。
3. 实践案例为了验证该系统的有效性,AIGC在其分支机构进行了实践案例。
以下是一个实际案例的描述:3.1 案例背景AIGC在某分支机构监测到一名客户账户出现异常的转账行为。
该客户在短时间内频繁转账给不同的账户,且转账金额较大。
3.2 应对措施根据AIGC智能客户反欺诈系统的警报,该分支机构立即采取行动。
工作人员联系了该客户确认转账行为的真实性,并要求提供身份验证文件。
同时,系统针对该账户进行进一步的检测和分析。
经过初步调查,发现该客户是被盗用的账户,犯罪分子试图通过频繁转账来疏散资金。
3.3 结果与总结通过及时采取应对措施,AIGC成功阻止了资金被盗用的行为,并通知了相关的执法机构。
211244932_网络金融欺诈交易风险识别防控体系建设实践
☐ 中国工商银行远程银行中心(合肥)课题组网络金融欺诈交易风险识别防控体系建设实践据统计,我国每年因电信网络诈骗导致的国民财产损失已达数百亿元,对人民资金安全和商业银行社会声誉带来严峻挑战。
为落实维护金融安全的党中央决策部署,践行“以人民为中心”发展思想,应对网络金融风险新态势,各家商业银行不断探索,积极构建针对电信网络欺诈的风险防控体系。
工商银行通过金融科技与业务场景的深度融合,以AI 赋能驱动银行智能风控体系建设,基于网络金融欺诈交易特征,创新应用机器学习、知识图谱、流服务平台等前沿技术,综合运用系统、数据、模型和策略,构建了覆盖事前、事中、事后全流程的新型网络金融欺诈交易风险识别防控体系(以下简称“风控体系”),深化电信网络诈骗治理。
一、体系概述网络金融基于互联网为客户持续提供海量金融服务的同时,也带来复杂多变的线上渠道安全风险。
电信网络诈骗案件中的网络金融欺诈主要包括两种类型:一是非银行客户本人操作类欺诈,主要作案方式为不法分子利用钓鱼网站、电话或网络等渠道,骗取银行客户的个人信息、账户信息及登录支付等交易信息,登录银行客户的账户并进行相关资金操作;二是银行客户本人操作类欺诈,指不法分子通过电话、社交网络等渠道与银行客户取得联系,通过恐吓、诱导等方式从主观上骗取客户的信任,误导或诱使客户本人向其转账。
两种类型欺诈的主要区别是交易的操作者是否为银行客户本人。
针对上述两类欺诈交易进行监测,并对高风险交易进行实时阻断,是风控体系的核心目标,也是保障客户资金安全的关键所在。
风控体系基于对交易风险进行处理的顺序,形成动态回馈调优流程,分为风险感知、风险识别、风险控制、成效评价、风险回溯五个部分。
风控体系架构如图1所示。
风险感知是指对交易风险进行识别和控制前的准备阶段。
该阶段的主要工作是通过多种途径收集风险信息,包括舆情监测、新型诈骗手法研究、钓鱼网站处理等,进而为反欺诈策略的部署实施夯实基础,实现对风险预发趋势的动态感知和常态化监测,提高风险防控前瞻性、主动性和针对性。
电商反欺诈知识图谱系统设计与实现
电商反欺诈知识图谱系统设计与实现近年来,随着电商平台的不断发展,电商欺诈事件也逐渐增多。
如何加强对电商欺诈行为的防范,保障商家和消费者的权益,成为了电商领域亟待解决的难题。
为此,许多电商平台利用大数据技术和人工智能技术建立了反欺诈系统,但随着电商欺诈手段的不断升级,这些系统的效果已经不能满足现实需要。
因此,本文将介绍一种基于知识图谱的电商反欺诈系统的设计与实现方案。
一、知识图谱概念介绍知识图谱是一种以图谱的形式表示知识的结构化数据库。
它采用了图论的思想和结构,将各种实体和它们之间的关系用节点和边相连的方式表示出来,从而形成了一个复杂且高效的数据结构。
知识图谱包含了大量的实体属性和关系属性,可以从多个维度对实体和关系进行深度挖掘和分析,并将分析结果展示在图形化界面上,方便用户进行交互式查询和分析。
二、电商反欺诈知识图谱系统的设计思路1、数据采集数据采集是电商反欺诈知识图谱系统的第一步,也是最为重要的一步。
我们需要从各种数据源中采集尽可能多的数据样本,建立起电商欺诈行为的数据集。
这些数据样本包括各种欺诈行为的详细信息,如欺诈类型、欺诈手段、欺诈节点等,为后续的数据挖掘和关系分析提供基础数据。
2、数据清洗与预处理电商欺诈行为的数据集中可能存在着一些无用或者是冗余的信息。
为了提高数据分析的效率和准确性,需要对数据进行清洗和预处理。
在数据清洗和预处理的过程中,可以通过各种方式对数据进行筛选、去重、规范化、归一化等操作,使得数据更加符合分析和挖掘的需求。
3、数据挖掘与关系分析在完成数据清洗和预处理之后,可以利用知识图谱的技术和算法对数据进行挖掘和分析。
这里所说的数据挖掘包括了分类、聚类、关联规则挖掘、异常检测等多种技术手段。
而关系分析则主要是通过社会网络分析、路径分析、节点分析等方式,对欺诈行为中的关系进行全面深入分析。
4、知识图谱构建和应用在完成数据挖掘和关系分析之后,需要将分析结果用图谱的形式表示出来,并建立起知识图谱库。
金融反欺诈技术研究与实践
金融反欺诈技术研究与实践随着金融行业的快速发展,欺诈活动也在逐渐增加。
为了保护金融机构和客户的权益,金融反欺诈技术变得越来越重要。
本文将对金融反欺诈技术进行研究和实践,以探讨如何有效地应对金融欺诈行为。
一、背景介绍金融欺诈是指在金融业务活动中,以不实信息或非法手段获取不当利益的行为。
欺诈行为可以通过虚假身份、伪造文件、洗钱等手段实施。
这些行为不仅损害了金融机构和客户的利益,也破坏了金融市场的公平和健康发展。
二、金融反欺诈技术的分类1. 身份验证技术身份验证技术是防止身份欺诈的重要手段。
通过采集和比对客户的身份信息,可以有效识别虚假身份和伪造身份证、护照等欺诈行为。
常用的身份验证技术包括人脸识别、指纹识别和声纹识别等。
2. 交易行为分析技术交易行为分析技术是通过分析客户的交易行为特征,识别出异常交易和可疑行为。
这些技术可以通过建立合规模型和监测系统,实时监控客户的交易行为,并采取相应措施,防止欺诈行为的发生。
3. 数据挖掘和机器学习技术数据挖掘和机器学习技术可以通过大数据分析,揭示欺诈行为的规律和趋势。
通过构建反欺诈模型和算法,可以对异常交易、信用卡盗刷等欺诈行为进行预测和预警。
4. 智能风险管理系统智能风险管理系统是综合运用以上技术,对金融交易全流程进行监测和风险管理的一种综合应用。
该系统可以实时监测风险事件,并采取相应措施,防止和减少金融欺诈行为的发生。
三、金融反欺诈技术的实践案例1. 欺诈检测系统某银行建立了一套欺诈检测系统,通过分析客户的交易行为和使用习惯,及时发现可疑活动。
一旦系统发现异常,就会主动向客户发出警报并暂停相关交易,以保护客户的资金安全。
2. 多维度欺诈预警模型某支付平台利用数据挖掘和机器学习技术构建了多维度欺诈预警模型。
通过分析用户的交易数据、个人信息和行为特征,系统可以准确地预测潜在欺诈行为,并及时采取措施,防止资金损失。
3. 云计算和区块链技术云计算和区块链技术的应用也为金融反欺诈提供了新的解决方案。
基于知识图谱的小微企业贷款申请反欺诈方案
摘要:近年来,在各大商业银行竞相开展小微企业信贷业务的同时,贷款欺诈风险也随之产生。
针对小微企业信贷业务的特点,提出了一种基于全方位企业画像与企业关联图谱的贷前反欺诈模型。
通过整合多源信息,形成完整的企业属性特征,并结合从图谱中提取的关系网络结构特征,把特征共同输入模型,以定量评估小微企业客户的欺诈风险。
实验表明,使用隐含在关系图谱中的信息比单纯使用企业自身特征建模在测试集上的AUC提高了5%,有助于银行机构准确地对企业申贷欺诈行为进行评估。
关键词:反欺诈; 企业画像; 关联图谱1 引言随着我国经济发展步入新常态,小微企业快速发展,并逐渐成为我国市场经济中较活跃的主体。
据相关数据统计,目前我国约有近1亿户小微企业,这些小微企业广泛分布于实体经济的各行各业。
作为经济发展和社会稳定的重要支柱,小微企业在促进人才有序流动、维护市场活力、推动科技创新等方面发挥着不可或缺的作用。
然而相对于大中型企业而言,小微企业在市场竞争中仍处于弱势地位,融资问题导致其很难保证经营的稳定性与持续性。
银行贷款是企业融资的重要手段,为缓解小微企业的经营压力并满足强烈的融资需求,商业银行的小微贷款业务逐步扩张,各类信贷产品应运而生。
截至2018年第三季度,小微企业在银行机构的贷款总额达33.04万亿元,贷款授信户数超过1 800万户。
但由于小微企业在提供自身资讯上的天然弱势,“不透明”“内部化”的非对称数据信息使得银行难以在业务申请阶段把控小微客户实质性的信贷风险,对小微企业信贷产品的管理比大型企业也困难得多。
如今,欺诈风险已经成为消费金融业务面临的主要风险之一,反欺诈也对银行的风险控制技术提出了更高的要求。
科学合理地进行小微企业贷款欺诈风险管理已经成为商业银行亟须解决的问题。
小微企业贷款业务是近年来兴起的一种贷款手段,由于其“新”的特征,在金融行业内对小微信贷欺诈尚没有一个通用的定义。
商业银行在信贷申请欺诈风险的防范工作方面已经积累了很多经验,但是当前的工作多为面向大中型企业或面向个人信贷的反欺诈方案。
基于金融知识图谱的反欺诈实践
• 1.6亿个群 • 平均每个群7个节点 • 最大群4万节点
1->2->1->2…… 2->1->2->1……
1
2
2
1
LPA不收敛示例
图特征提取
• 群指标
• 群内各类型节点数量、比例 • 群内黑名单、灰名单数量、比例
• 群内用户特征分布
• 男女比例、年龄分布、平均消费水平 • 平均额度使用率、平均逾期天数
金融知识图谱示意图
实时流
Orientdb
实时建图与 存储
图数据
离线计算
Graphx 分群
N度邻居 查询
提取 群指标
规则 建模
建图
• 节点
• 用户账号 • 手机号,证件号,银行卡号,设备号 • 申请时点GPS、WIFI,收货地址
•边
• 账号与其属性节点的连接 • 账号与账号通过属性节点建立关系 • 边权重
基于金融知识图谱的反欺诈实践
概述
• 背景介绍 • 建图 • 分群 • 图特征提取 • 模型训练与效果
背景介绍
• 业务场景
• 唯品花(消费贷)在线申请时的欺诈识别
• 主要防范对象:团伙欺诈
• 中介自己实施欺诈 • 中介教大家实施欺诈
• 金融知识图谱
• 连接欺诈账号——发现背后的人 • 连接欺诈者——发现背后的团伙
• 结果
• 图特征为模型AUC带来约3%提升 • 模型整体效果:唯品花申请通过率降1%,坏账降20%
谢谢聆听!
• 唯品金融图规模
• 10亿节点
账号
账号
账号
• 挖掘账号背后的欺诈者
• 挖掘人背后的欺诈团伙
强连接
零售信贷客户知识图谱反欺诈应用研究
零售信贷客户知识图谱反欺诈应用研究在科技赋能金融与人工智能技术迅速发展的背景下,各大金融机构开始寻求前沿的科技手段来提高业务能力,尤其是在信贷领域。
目前,商业银行在信贷领域所面临的欺诈风险主要包括申请欺诈和交易欺诈,其中申请欺诈的鉴别和定义极为困难,是个贷风控的痛点。
传统的反欺诈体系已无法满足高维的用户特征以及复杂的欺诈模式,而知识图谱为银行解决信贷领域的用户欺诈问题提供了一种全新的视角。
一、行业信贷风控现状目前,商业银行风控依据的信息普遍以人行征信为主体,存在一定缺陷和问题。
首先,人行征信系统中的客户本身质量比较高,而对于那些未进入人行征信系统中的客户,仅以人行征信系统为主的风控手段便无法判断其优劣;其次,人行征信系统也依赖于银行系统上传的历史数据,而这类数据缺乏时效性,对于客户当前信用风险的评估也略显不足;最后,传统的风控方式(如评分卡模型)没有考虑到社群特征和客户之间的关联关系,难以识别团伙欺诈。
随着知识图谱技术的不断发展,越来越多的银行开始应用知识图谱进一步完善反欺诈系统,知识图谱开始在不同的反欺诈场景如盗卡盗刷、钓鱼诈骗、非法提现、套现洗单等场景发挥作用。
部分银行的知识图谱应用成果见表1。
表1 部分银行的知识图谱应用成果目前传统商业银行的零售信贷流程如图1所示。
图1 传统商业银行的零售信贷流程其中,审批阶段的评分卡模型是机器学习在整个信贷流程中运用的最为成熟的方法,评分卡分为A卡(申请评分模型)和B卡(行为评分模型)。
A卡用于客户进件审核;B卡用于预测客户的动态风险。
审批阶段所用的征信信息可以分为硬信息和软信息。
硬信息为直接量化客户还款能力和意愿的信息,如财务状况、信贷概要数据等;软信息为勾勒客户面貌,间接体现还款能力的信息,如居住地、社交信息等。
商业银行也常常会通过其他行为特征,亦或是第三方征信数据,来弥补“薄信用”客户信贷信息不足的问题。
商业银行通过引进知识图谱作为弥补“薄信用”客户信贷信息不足的手段之一,并加入到整个信贷流程的调查审批、催收环节中,增加客户信息的维度,进一步提高反欺诈能力。
基于知识图谱的银行反欺诈模型的研究与应用
基于知识图谱的银行反欺诈模型的研究与应用
魏永强
【期刊名称】《榆林学院学报》
【年(卷),期】2024(34)2
【摘要】针对传统的银行反欺诈模型已无法满足欺诈检测要求的及时性与准确性的问题,本文提出了一种基于知识图谱的反欺诈模型。
该模型基于多源信息和高维衍生特征的大数据,构建知识图谱,对信贷个体进行全方位画像,分析关联关系,并抽取网络属性。
从四大方面、两大维度挖掘风险特征,四大方面指个人基本信息、账户信息、征信和行为信息,两大维度指个人节点和网络结构。
最后将风险特征代入LightGBM,判断是否为欺诈类型,并得到对应概率。
实验表明,相比于仅使用个人自身特征的模型,使用个人特征加网络特征的模型效果更好,AUC和F1分数分别提升5.18%和5.71%。
因此,该方案能够有效地为银行对个人信贷进行欺诈评估。
【总页数】6页(P68-73)
【作者】魏永强
【作者单位】榆林学院信息工程学院
【正文语种】中文
【中图分类】TD353
【相关文献】
1.信用卡反欺诈的"道"与"术"——交通银行太平洋信用卡中心反欺诈理论及实践研究
2.基于知识图谱的小微企业贷款申请反欺诈方案
PAQ行业解决方案论坛
特别推荐欺诈与反欺诈谁比谁更厉害?——银行卡防欺诈应用解决方案4.基于lightGBM算法对银行账户反欺诈模型的应用
因版权原因,仅展示原文概要,查看原文内容请购买。
[实用参考]互联网金融-如何用知识图谱识别欺诈行为.doc
互联网金融如何用知识图谱识别欺诈行为导读知识图谱(KnowledgeGraph)是当前的研究热点。
自从20GG年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。
各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应。
比如在国内,互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。
那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业-互联网金融,知识图谱可以有哪方面的应用呢?目录1.什么是知识图谱?2.知识图谱的表示3.知识图谱的存储4.应用5.挑战6.结语1.什么是知识图谱?知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。
在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。
知识图谱是关系的最有效的表示方式。
通俗地讲,知识图谱就是把所有不同种类的信息(HeterogeneousInformation)连接在一起而得到的一个关系网络。
知识图谱提供了从“关系”的角度去分析问题的能力。
知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。
不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。
比如在Google的搜索框里输入BillGates的时候,搜索结果页面的右侧还会出现BillGates相关的信息比如出生年月,家庭情况等等。
另外,对于稍微复杂的搜索语句比如”WhoisthewifeofBillGates“,Google 能准确返回他的妻子MelindaGates。
这就说明搜索引擎通过知识图谱真正理解了用户的意图。
上面提到的知识图谱都是属于比较宽泛的范畴,在通用领域里解决搜索引擎优化和问答系统(Question-Answering)等方面的问题。
接下来我们看一下特定领域里的(Domain-Specific)知识图谱表示方式和应用,这也是工业界比较关心的话题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
金融知识图谱示意图
实时流
Orientdb
实时建图与 存储
图数据
离线计算
Graphx 分群
N度邻居 查询
提取 群指标
规则 建模
建图
• 节点
• 用户账号 • 手机号,证件号,银行卡号,设备号 • 申请时点GPS、WIFI,收货地址
•边
• 账号与其属性节点的连接 • 账号与账号通过属性节点建立关系 • 边权重
• 结果
• 图特征为模型AUC带来约3%提升 • 模型整体效果:唯品花申请通过率降1%,坏账降20%
谢谢聆听!
• 唯品金融群规模
• 1.6亿个群 • 平均每个群7个节点 • 最大群4万节点
1->2->1->2…… 2->1->2->1……
1
2
2
1
LPA不收敛示例
图特征提取
• 群指标
• 群内各类型节点数量、比例 • 群内黑名单、灰名单数量、比例
• 群内用户特征分布
• 男女比例、年龄分布、平均消费水平 • 平均额度使用率、平均逾期天数
基于金融知识图谱的反欺诈实践
概述
• 背景介绍 • 建图 • 分群 • 图特征提取 • 模型训练与效果
背景介绍
• 业务场景
• 唯品花(消费贷)在线申请时的欺诈识别
• 主要防范对象:团伙欺诈
• 中介自己实施欺诈 • 中介教大家实施欺诈
• 金融知识图谱
• 连接欺诈账号——发现背后的人 • 连接欺诈者——发现背后的团伙
图特征提取
• 群演化特征
• 群发展过程中的特征
某时刻的群
发展中的群
群内节点数随 时间增长曲线
t1 t2 t3 t4 群演化特征提取
群内黑名单数 随时间增长曲线
图特征提取
• 节点指标
• 度数 • 是否核心节点 • node2vector
模型训练与效果
• 反欺诈模型训练
• 标注:使用唯品花逾期90天以上不还 • 特征:用户画像类特征+图特征
分群
• Graphx离线分群
• 连通图适用于强连接图 • 社区发现适用于弱连接图 • 先划分连通图,再对大群
社区发现
图G=(V,E)
先连通图分群
再对大群社区发现
分群
• 社区发现
• LPA(Label Propagation Algorithm) • 算法原理:邻居属于哪个社区最多,
节点就属于哪个社区 • 不收敛问题
• 唯品金融图规模
• 10亿节点 • 9亿边
建图
• 分层级的关联挖掘
账号
账号
账号
• 挖掘账号背后的欺诈者
• 挖掘人背后的欺诈团伙
强连接
欺诈者
ห้องสมุดไป่ตู้账号
账号
欺诈者
弱连接
欺诈 团伙
分群
• 物以类聚,人以群分 • 群定义
• N度邻居 • 连通图 • 社区(community)
分群
• N度邻居
• 批量获取计算量大 • Orientdb实时查询 • 一般用于规则