互联网金融风控模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
互联网金融风控模型
一、市场调研
目前市面主流的风控模型
1、互联网金融前10名排行榜(数据截止日期2017-09-12)
互联网金融公司排名分别是蚂蚁金服、陆金所、京东金融、苏宁金融、百度金融、腾讯理财通、宜信、钱大掌柜、万达金融和网易理财。
1.1 蚂蚁金服
1.1.1 大数据技术
对接第三方征信公司芝麻信用分,通过用户信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度对海量数据行综合的处理评估,同时也给予阿里电商交易和蚂蚁金服互联网金融交易数据,对接公安系统和第三方数据公司建立联系。(这块就是用户画像的作用,投资人画像,融资企业/个人画像,这块的内容比较复杂。后面一定会展开分析,风险定价,推荐系统全部靠它了)
1.1.2 人脸识别技术
人脸识别技术核心算法分别是活体检测算法、图像脱敏算法以及人脸比对算法,国际公开人脸数据库 LFW 上,人脸识别算法准确率(99%)。(像这块的技术已经很成熟有百度都已经推出成型产品,可以通过人脸识别对融资企业/法人进行风险验证,是否存在风险欺诈,多头借贷等嫌疑)
1.1.3 云计算技术
是一个开放的云平台,它助力金融创新、助力金融机构的IT架构实现升级,去构建更加稳健安全、低成本、敏捷创新的金融级应用。(其实就高可用,可靠性等)
1.1.4 风控技术
历史交易数据进行个性化的验证,提高账户安全性。80%左右的风险事件在智能风控环节就能解决。除了事后审核,事前预防、事中监控也非常重要——事前,将账户的风险分级,不同账户对应不同风险等级;事中,对新上线的产品进行风险评审以及监控策略方案评审。(解决80%的问题因此这块才是真正的核心。贷前,贷中,贷后等方方面面的监控,贷前最为重要,如何去检测,抓取哪些数据,与哪些第三方平台合作)
1.1.5 人工智能技术
蚂蚁金服通过大数据挖掘和语义分析技术来实现问题的自动判断和预测。可以识别到用户的身份信息,总结在大的用户层面大家可能都会遇到的问题,100%的自动语音识别。智能质检能力与智能赔付能力,具备了品质的判断能力以及情感判断能力。(总结:公司 PC 的人工语言不完善,很多关键字无法识别。这块应该跟后台没有交互,数据都是写死。移动端也可以考虑在标的详情页介入 draglayout 控件进行智能语音服务,解答用户疑惑。技术核心应该是在数据挖掘,语义分析技术等方式)
1.2 陆金所风控调研
1.2.1 七步风控体系
1、风险政策制度框架体系:所有交易对手和产品引入都制定了明晰的风险政策指引,所有业务必须在制度框架内运行。(说白了就是自己风控业务流程,对于投资人者以及融资用户进行风险等级划分)
2、信用评级:交易对手和产品进行主体评级及债项评级。(对于投资人者、融资用户、产品进行风险等级划分)
3、信息披露:针对每一个不同的产品,将其内部评级、底层资产、主要风险、还款来源、保障措施。(就目前风险披露数据只是按照国家要求进行风险披露,但是并没有标地产品进行风险披露,融资企业进行风险披露,这个披露系统可以做成风险评估报告,后期也可以利用企业供应链关系库一定会用到(但是这部分数据都是针对上市而言,数据不全;))
4、投后预警监控:所有在售资产至少每三个月进行一次检视。(对于融资周期过长的企业可以每三个月进行企业经营状况的上报,重点在于资金用途,回款方式以及周期;如果我们企业够强大的话,可以利用大数据征信对于那些未按时回款融资企业用户的企业进入黑名单系统)
5、风险管理系统:陆金所的风险管理系统覆盖全产品线、整个产品生命周期,实现风控的标准化、智能化、模型化,大幅提升陆金所风险管理工作的效率和效果。(这些东西都太虚了)
6、风险评价体系:同的风险程度给予业务部门不同的业绩评价。
7、资产、资金的精准匹配:投资者进行风险分类,产品与投资者风险适配系统,确保投资者都能买到适合其投资风格与风险偏好的
产品。(个人认为这个才是风控的意义,还有我们平台本身存在的价值;具体的实现的方式,利用画像技术对于投资用户,融资用户,标的产品进行风险等级划分,通过数据挖掘进行实时推荐) 小结
风险评级分为三部分:投资人风险等级分类,融资企业信息等级分类,标的产品等级划分。
投资人等级划分:可以参考以往投资标的的利率,投资金额,投资人的站岗资金,投资人的提现金额,也可以通过投资人基本个人信息,例如移动设备Android 或 IOS,年龄,居住地,职业,评判投资人也可以调用第三方平台去综合判断投资的经济状况等方面维度融资企业等级划分:企业所在行业的整体现状,国家政策是否扶持,企业的纳税证明,银行流水,公司规模,注册资本等维度标的产品:项目所属行业,项目的整体周期,项目成本,利润率,项目的合作企业,项目合同,发票等内容等维度
投资用户与产品匹配度
根据风险评级系统去高度匹配融资用户,产品标的的内容信息。这部分用到的应该是数据挖掘,推荐系统。根据用户以往投资标的金额,利率进行离线推荐,也可以根据用户的点击流日志分析去进行实时推荐,在某个标的详情页的停留时间,标的的点击次数信息。
1.3 京东金融风控调研
1.3.1 用户支付瞬间需要做的事情
如判断用户的设备信息、登录行为、访问特征、信用状况、商品
信息、商家特征、配送区域、银行卡状态等。如建立信用、反欺诈、伪冒交易等一系列模型,其中多达近百项的模型需实时计算。这样庞大的运算量在一秒内,甚至几十毫秒内完成,不是易事。 (感觉这些内容任何一点都够我研究一段时间的)
1.3.2 风控的灵魂是数据,所有决策都以数据为驱动
1、业务系统产生的数据和点击流作为主要挖掘的素材来源;但是随着时间推移,恶意用户可以模仿真实用户。因此才会用设备指纹识别,生物探针,语音识别,人脸识别等。
2、风控模型
原始层数据:由于原始数据存在杂乱无章的现象,此处使用各种颜色来示意
数据原子化:数据原子化是经过整理后,把数据按业务归属分类,形成最原子的类别,比如账户,资金,投资,消费等数据抽象层:按风控关注的业务做数据整合,这层是最贴近业务的。每一块代表一类业务,一个原子数据类是可以被放入多个抽象数据块里的