基于用户行为数据的互联网征信可行性研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于用户行为数据的互联网征信可行性研究

摘要:随着网络的发展,互联网征信的优势日益突出,而传统征信业务的不足也限制了借贷业务的发展,因此互联网征信也就更具有必要性。本文详细介绍分析了互联网征信的可行性,并结合XX的实际数据,对齐征信模型的构建可行性做出了评估,并根据评估结果提出了互联网征信业务的优势,也发现了其问题和不足,并提出了改进的方向和建议。

关键词:征信;XX;数据;互联网

传统征信业务虽然已经历了较长的发展时间,但随着技术的进步和时间的推移,其征信方式的弊端和缺陷也不断显现出来。而在互联网技术飞速发展的今天,互联网征信模式应运而生。互联网征信集合了大数据、云计算和人工智能等技术的优点,将很好的解决传统征信目前存在的弊端。例如互联网征信手收集的是用户在互联网上的行为数据,这些数据是动态和即时的,并且数据来源十分广泛,从而解决了评估指标单一和传统征信的覆盖率有限的问题。

然而,尽管互联网征信可以解决传统征信的诸多弊端,但互联网征信尚处于起步阶段,因此还存在许多亟待解决的问题。主要表现在如何充分利用已有的数据,合理建立自己

的评估体系,以及这种综合性的评估方法是否能够更好的反映用户的信用情况。这对于我国互联网征信体系的发展和完善也将具有重要意义。

一、网络行为数据与个人应用的关系

(一)互联网用户行为

由于互联网产品的多样化,用户的行为也是多样化的。根据用户使用的功能,可以统计用户各互联网行为的市场规模。从下表中我们可以看到,大部分互联网应用的用户规模都是呈增长的趋势,网上支付、网上炒股或炒基金等金融相关业务更是具有较大幅度的增长。这说明互联网征信具有较大的可行性,也十分有必要进行互联网征信。

(二)网络行为对个人信用的反映

对于个人信用的定义,我们采用经济学中的定义,经济学中的信用是指授信方与受信方之间遵守契约的能力,当这种能力越高,意味着个人信用水平越强。而征信则是依法、合理的对用户行为等信息数据的收集、记录,并通过适当的模型,评估个人或企业的信用水平。

用户在互联网的使用过程中会留下许多可收集、记录的行为数据,并且这部分数据规模大、种类多,所以互联网征信的关键就在于建立合理的征信评估模型

二、信用5C分析法

西方银行在征信时,总结归纳出了5C模型,这也是在

正西体系中较为经典的一个模型。即通过品质(Character)、能力(Capacity)、资本(Capital)、抵押(Collateral)和境条件(Con-dition)五个方面对用户进行全方面的信用评估。

(一)品质

是指用户履行偿债义务的可能性,品质直接决定了账款的回收速度和回收数额。是评估顾客信用品质的首要指标,也是信用评估最为重要的因素。

(二)能力

指用户的偿债能力,主要是用户流动资产以及负债的情况,其判断依据通常是客户的偿债记录等信息。

(三)资本

指用户的财务实力和财务状况,表明顾客可能偿还债务的背景,如负债比率、有形资产净值等财务指标。

(四)抵押

指用户无法或拒绝偿债时能被用做抵押的资产,这对于首次交易或信用状况有争议的用户至关重要。

(五)条件

指可能影响用户付款能力的经济环境,如用户在困难时期的付款历史等信息。

三、互联网征信评估模型

互联网的用户行为在品质、能力、资本、条件等四个维度方面具有丰富的数据,但无法提供经济抵押等数据。实际

上,在现实的征信中,抵押物也是限制信贷业务发展的重要因素,很多人往往因为缺乏抵押物而无法进行信贷业务。但是互联网上的用户沟通交流更加密切,也就是具有更多的社交行为。而社交行为也可以反映出用户的个人品质,并且社交的成本也将影响用户偿债的可能性,因此我们可以引入新的维度“社交”替代“抵押维度”,构成新的征信模型。

四、XX征信

作为互联网征信机构,XX征信依据用户各种互联网行为数据,运用大数据分析技术呈现用户的个人信用情况。因此其信用报告的准确性在根源上取决于其征信数据的准确性与全面性,因此我们在本章将研究XX的用户行为数据,即征信数据能否支持其信用评价体系进行准确的信用评估。

(一)用户行为数据分析

1、数据来源

互联网应用是用户互联网行为数据的载体,因此我们将通过XX的产品线来分析XX征信可用的用户数据来源。总体来看,XX可能获得用户网络行为数据的业务可分为其自有业务,以及其入股或兼并的其他业务。

(1)自有业务。XX自有业务十分多元化,包括社交和通信服务AA,WX;社交网络平台AA空间,XX微博;娱乐业务XX游戏,文学,动漫,音乐,视频;支付平台CFT,WX支付以及浏览器,AA邮箱等,这些均在市场中有极强竞

争力,占据大量市场份额的业务是XX征信产品的主要数据来源。

(2)入股或兼并的其他业务。这些业务主要通过收购股权进入已获得市场地位的应用,或与其达成战略合作来实现。如YL,TC,JD等。

2、数据分类

根据CNNIC《第37次中国互联网络发展状况统计报告》对中国网民各类互联网应用的分类,将XX可用作个人征信数据的用户数据进行整理,同时统计其各类应用用户数/成交额/营收规模等指标市场份额,并将统计出的XX用户行为数据按照前文基于互联网的信用评价5C模型分类(市场份额小于1%的不计入统计):

可以看到XX产品线几乎覆盖5C模型中的所有维度,且在每个维度都能提供多种数据,在一定程度上能保证征信数据的全面性。

3、数据评价

为衡量这些数据在XX征信体系中的作用,可以从数据规模和数据多样性两个角度研究XX的用户行为数据。数据规模决定了数据的整体价值;数据的多样性决定了对用户信用评价的精确性,因此作出如下假设:(1)每位用户在每个应用上产生的可用于征信的数据量相等且对信用

评估同样重要;

为方便计算,将该值其简化为1数据/用户/应用,由此可得模型中每个维度的数据规模=∑该维度中某应用市场份额*该市场用户总数。

(2)每个应用上产生的数据都是结构化,可分析的;

4、数据规模评价

根据假设1,可得有统计数据的各行为用户规模如下:

通过对数据的描述,可以看出XX全面的战略布局,覆盖几乎各类主要应用市场的产品,与其他公司的深度合作都为其大数据征信提供了数据规模上的有力支持,使其无论从哪个维度上评价,都具有较高的数据整体价值,具体特征有:(1)WX和AA为XX征信提供了大量用户数据,使其在即时通信和社交方面具有巨大的数据规模优势;

(2)XX新闻,视频,AA音乐的高覆盖率为多维度扩充数据规模提供了支持;

(3)品质维度涵盖数据种类多,数据规模显著大于其他维度;

(4)由于缺少网上银行,互联网理财等方面应用,且WX支付及CFT的用户渗透率高,使用率低,资本及条件维度数据规模相对较小。

5、数据多样性评价

根据假设2,对各维度数据多样性进行评价。假设5个维度中数据规模最大的维度中的数据是完善且充分的,即数

相关文档
最新文档