基于Logistic回归模型的P2P借款人信用违约风险评估模型研究
基于logistic模型的P2P网贷借款人信用风险测度研究
基于logistic模型的P2P网贷借款人信用风险测度研究
截至2016年11月,从事P2P网络贷款的平台己经超过5879家,然而停业及问题平台竟累积高达3351家。
其快速发展中累积的风险成为了业内外最为关注的问题。
本文针对P2P网贷平台主要面临的借款人信用风险,从借款人信用风险在平台的现状和借款人信用风险测度这两个方面出发,分别做了详尽的说明,以期找到适合测度借款人信用风险的方法并缓释平台累积的风险。
文中通过对比几种成熟的信用风险测度方法,找出P2P网贷平台借款人信用风险测度的最佳方法是Logistic模型。
由于我国P2P网络贷款行业还不成熟,数据累积较少、数据披露还不透明,故本文的实证研究选用了5家数据披露较好、有代表性的P2P平台,并选取了借款金额、借款期限、借款利率、负债收入比等基础指标来测度信用风险。
本文的实证分析在变量的选择上和预测的准确度上可能会有所差异,但由于Logistic 模型应用条件相对地宽松,在理论上对P2P网络贷款平台借款人信用风险的测度是可行的,本文测度的结论将对P2P行业今后妥善处理借款人信用风险起着积极的作用。
基于Logistic回归模型的P2P网络借贷平台借款人信用风险评估研究
基于Logistic回归模型的P2P网络借贷平台借款人信用风险评
估研究
P2P网络借贷的流行和发展,是一种金融领域的创新。
网贷之家对中国网络借贷平台的发展进行了统计。
根据其统计数据,到2015年底,中国的P2P网络借贷平台已经有两千五百九十五家,而2014年只有一千五百七十五家。
网贷之家还统计了P2P网络借贷的成交量,在2015年底,已经达到了九千多亿元。
P2P网络借贷给人们投资和贷款带来的便利是可见的,这种新的增长模式也是引人瞩目的。
但是在P2P网络借贷飞速发展的同时,其管理是不完善、脱节、和有欠缺的。
P2P网络借贷平台对借款人信用风险的管理,主要是依靠风险控制人员的贷前审核。
对借款人信用风险控制的好坏很大程度上依赖于风险控制人员的主观判断,具有很大的随意性,不能够使投资人的资金安全得到保障。
因此,运用科学合理的方法建立符合P2P网络平台借款人信用风险特点的信用风险评估方法迫在眉睫。
基于此,本文首先梳理了国内典型P2P网络借贷平台运营模式,分析了P2P网络借贷平台借款人信用风险的成因。
其次,对比了国内外典型个人信用风险评估方法,选择适合P2P网络借贷平台借款人信用风险评估的Logistic模型。
再次,以人人贷为例进行实证研究,通过信息增益法进行指标筛选,结合Logistic回归模型建立借款人信用风险评估模型。
最后,对评估模型进行了Hosmer-Lemeshow拟合优度检验。
本文从P2P网络借贷平台借款人个人信息入手,建立信用风险评估模型,结合信息增益法进行影
响借款人违约因素的关键指标筛选,使得模型预测能力更好,以期提高对借款人偿债能力判别的准确度,降低投资者损失。
基于Logistic模型的P2P网络借贷个人信用评估研究
基于Logistic模型的P2P网络借贷个人信用评估研究P2P网络借贷是一种在互联网线上完成个人或中小微企业之间的借贷的新模式。
截至2015年12月31日,P2P网络贷款无论在平台数量方面,还是在全年贷款交易总额方面,都超过2010年全年数据上千倍,如此迅猛的发展速度必然会出现各种问题。
主要集中在以下四个方面:第一,法律的监管和审查跟不上发展的速度;第二,平台的征信途径五花八门,没有行业准则,导致出现信用风险;第三,由于借贷都是通过线上进行的,借款人无法得知贷款人借贷的真正用途,导致出现道德风险;第四,根据2015年“人人贷”全年P2P网络借贷数据,可以明显看出对于资本融资市场供远远小于求,仍不能满足大多数人的贷款需求。
针对以上四个方面,本文认为P2P网络借贷模式下的信用风险和投标预测是目前在客观上可以深入研究的领域。
通过查阅大量文献,在已有的5种个人信用评估模型中,唯有Logistic回归模型是可以同时预测借款人是否存在流标的可能以及在借到款后是否存在违约的可能。
同时,对于平台而言,也可以根据违约客户信息,建立大数据库,从而降低平台经营风险。
本文基于Logistic模型,分别建立了履约—违约Logistic回归模型和流标—满标Logistic回归模型。
从流标—满标Logistic回归模型上可以看出,在18个影响满标概率的变量中,性别、房贷、车贷、借款总额、借款利率、期限、信用评级、信用报告、工作认证、收入认证、实地认证这11项信息对借款人能否成功借款影响显著。
从履约—违约Logistic回归模型上可以看出,在22个影响违约概率的变量中,年龄、车贷、期限、信用评价、信用报告、工作认证、收入认证、实地认证这7项信息对借款人是否违约影响显著。
实证结果显示,流标—满标模型的预测效果达到97.9%,履约—违约模型的预测效果达到98.5%,同时针对P2P网贷行业出现的问题,提出了四点政策建议。
基于Logistic回归模型的P2P网贷平台新进借款人信用风险研究
2、数据处理
2、数据处理
在收集到借款人特征数据后,需要对数据进行预处理和清洗。具体包括数据 缺失值的填充、异常值的处理、数据标准化等。这些步骤有助于提高模型的准确 性和稳健性。
3、模型训练
3、模型训练
将预处理后的数据输入到Logistic回归模型中进行训练。通过训练模型,可 以学习到借款人特征与信用风险之间的映射关系。在模型训练完成后,可以利用 测试数据集对模型进行评估,以确定模型的准确性和稳定性。
四、结论
四、结论
本次演示基于Logistic回归模型,对新进借款人信用风险进行了研究。通过 收集和分析借款人特征数据,利用Logistic回归模型对数据进行训练和预测,可 以有效地识别出高信用风险借款人。在实际应用中,P2P网贷平台可以利用该模 型对新进借款人进行信用评估,以降低借款人的违约风险和提高投资者的收益稳 定性。此外,该模型还可以根据借款人特征的变化进行动态调整,以适应市场的 变化和借款人需求的变化。
三、新进借款人信用风险研究
1、借款人特征
1、借款人特征
在P2P网贷平台中,借款人的个人特征、历史信用记录、财务状况等都会对信 用风险产生影响。其中,个人特征包括年龄、性别、职业等;历史信用记录包括 信用卡使用情况、贷款申请记录等;财务状况包括收入、支出、资产负债情况等。 通过收集这些特征数据,可以全面了解借款人的信用状况。
四、结果分析
1、准确率:准确率是指模型正确预测借款人违约概率的百分比,准确率越高 说明模型越准确。
四、结果分析
2、召回率:召回率是指模型正确预测违约借款人的百分比,召回率越高说明 模型越全面。
3、F1值:F1值是准确率和召回率的调和平均数,用于综合评价模型性能。
五、结论
基于logistic回归的P2P网贷平台信用风险评估研究
基于logistic回归的P2P网贷平台信用风险评估研究
P2P(peer-to-peer)网络借贷是一种基于电子网络平台而进行借贷的互联网金融新型方式。
截至到2017年五月底,我国P2P平台累计交易量已达到45790.32亿。
但由于P2P行业缺乏有效的监管,导致各类问题平台层出不穷,信用风险的
爆发使投资者承受了巨大的损失,P2P的信用风险成为制约P2P行业发展的重要
因素。
P2P网贷平台信用风险具有长期性、潜藏性、破坏性的特点,因此对其进
行评估判定具有必要性。
主成分分析法能有效的降低变量间的共线性,利用该方法对选取的注册资金、平台背景、公司规模等十个指标进行降维,得到两个主成分M<sub>1</sub>、
M<sub>2</sub>,有效的降低了变量间的多重共线性。
Logistic回归模型对解释
变量要求极低,适用于分类变量的判别,利用该模型结合108个样本引入相关变
量后得到P与变量的关系式,以此对信用风险进行评估。
模型结果显示,平台信用风险与平台的预期收益成正比,与注册资本、平台背景等指标成反比,且银行存管指标系数最大,符合实际情况,模型的验证结果显示模型准确性达到了88%,说明模型对样本内网贷平台的信用风险评估能力较理性。
基于Logistic的P2P网络贷款信用风险测度研究
基于Logistic的P2P网络贷款信用风险测度研究P2P网络贷款是一种基于互联网思想并独立于正规金融体系之外的借贷交易模式。
截止到2015年3月底我国P2P网络贷款平台的运营数量已经达到1728家,累计成交量已达到5000亿元。
平台的过快增长,有效监管的缺乏,是导致P2P网贷平台风险事件频发和问题平台增多的重要因素。
加之国内经济结构持续深入调整,经济增速下滑,受经济下行压力增大的影响,P2P网贷行业的信用风险暴露持续上升。
P2P网络贷款平台靠经营风险获取利润,因此风险管理技术是P2P网贷平台的核心竞争力,也是今后一段时间内一直贯穿在P2P网贷行业发展的主线。
本文从P2P网络贷款产生信用风险的原因入手,并简单介绍了信用风险度量模型,结合P2P网贷的实际情况,选取Logistic回归模型对P2P网络贷款信用风险度量和预测。
借款人的违约率大小主要受借款人自身状况和贷款状况的影响,故文中选取借款人学历、年龄、贷款金额、贷款利率等指标并通过主成分分析,将解释变量的个数减小到4个。
通过Logistic模型实证分析,得出具体表达式,模型结果显示,借款人的违约概率与学历的高低等因素成反比和贷款金额、期限等四个指标都与借款人的违约风险成正比,符合实际情况,然后样本内数据组和样本外数据组也分别验证了模型较高的预测准确率,说明采用Logistic回归模型对P2P网络贷款信用风险进行度量是可行和可靠的。
基于logit 模型的P2P 公司的个人信贷风险评估
基于logit 模型的P2P 公司的个人信贷风险评估-经济基于logit 模型的P2P 公司的个人信贷风险评估陈鹿婧杨青骥孙超凡汪小燕摘要:以违约的概率作为信用评估风险衡量标准,构建P2P机构的借款人信贷风险的logit模型,并对模型进行实证分析。
结果表明,贷款金额,贷款期限,已还金额比,近期还款额这四个指标对借款人信贷违约风险的影响最为明显。
通过进一步验证,证明借款人信贷风险的logit模型在对P2P机构的借款者信贷评估上具有较高的准确性,可以作为P2P企业内部风险控制的根据。
关键词:P2P公司信用评估风险控制logit模型创新项目:上海金融学院推荐2015度年上海市大学生创新活动计划。
一、引言“P2P”是英文peer to peer的简写形式。
P2P的基本定义是一种依附于互联网信息平台和个体电子设备的新型金融中介服务模式。
这种借贷模式起源于英国,2005年之后迅速在全世界范围内推广.在中国,从2007年首家P2P公司拍拍贷成立,到2010年全国仅10家,再到现在全中国共有2595家P2P网络贷款公司。
随着我国P2P市场的不断壮大,问题平台的比重也随之逐步上升。
根据2015年的数据显示,全国的2595家网贷公司中有896家属于问题平台,占总数的34.5%,较2014年翻了一倍。
金融秩序也由此受到的不同程度上负面的影响,所以P2P公司内部的风险控制显得至关重要。
我国P2P公司的内部风险主要分为以下三种:由于借款者道德缺失而引发的信用风险、由于网络技术失控引发的操作风险、由于交易的局限性而导致的流动性风险。
而对内部风险影响最大的当属信用风险,信用危机的爆发与否将直接影响到P2P公司能否正常运作。
在识别和防治信用风险的过程当中,P2P企业如何对借款人进行筛选成为了重要的控制节点。
当前的P2P企业使用的借款人评估系统还很大程度上借鉴传统金融机构如银行的评估方法。
这就导致了对风险的误判,因为两者的目标客户群的信用特征存在较大差异。
基于逻辑回归的P2P网贷信用风险评估研究——以微贷网为例
分 类 模 型 ,分 类 效 果 明显 。Dinh和 Kleimeier(2007)【2] 的研究 结 果表 明 ,Logistic模 型 是传 统 信用 风 险 研 究 中预测精 度最高 的模 型 ,具备很 强 的稳健 性 。国 内 ,郑 昱 (2009)[31应 用 Probit模 型 对 传 统 借 贷 中 的个人 信用 风 险进 行评 估 。廖 理 等 (2014) 利 用 Probit模 型 实 证 研 究 ,指 出 非 完 全 市 场 化 利 率 部 分 地 反 映 了 借 款 人 的 违 约 风 险 ,但 是 仍 有 相 当 高 比 例 的 违 约 风 险并 未 能 够 被 反 应 在 利 率 中 。周 光 伟 (2009)f 5_,利用 5c分析 法评 价 个人 信贷 风 险 ,指 出评 判结 果会 受到外 界 的 因素 和个人 情感 因素 的 影 响 而 出 现 较 大 偏 差 。 杨 秀 云 等 (2016)[61使 用 KMV模 型来 评估 上市 企业 的信 用风 险 ,会 出现 违 约概率 不符合 实 际 ,说 明 KMV模 型识别其 信用 状 况 的 能 力 一 般 。 刘 小 丽 (2011)【 指 出 Credit Risk+ 适 用 于银 行对 零售 客户 的信用 风 险的度量 ,只需 违 约 概 率 、违 约 损 失 率 和 风 险 暴 露 等 风 险 因子 ,适 合 目前 我 国数 据 缺 乏 的 现 状 。 也 有 学 者 将 信 用 风
险 评 估 模 型 应 用 于 P2P网贷 平 台 借 款 者 的 信 用 风 险 评 估 中 ,如 李 淑 锦 、吕靖 强 (2016)[81采 用 BP神 经 网络模 型进行 P2P网贷 信用 风险评 估 ,提升 了 数 字 化 技 术 在 这 方 面 的 运 用 。
基于LightGBM的P2P借贷违约风险模型研究
摘要随着互联网金融的迅速发展与普及,P2P这一概念也在近年席卷全国各地。
然而,在迅猛发展的同时,P2P借贷业务也面临着诸多问题,尤其是极高的坏账率让P2P平台经营者与投资者付出巨大的代价。
因此,为了P2P 平台和行业健康长期地发展,建立一套高效的贷款业务风险识别模型有着重要的现实影响与价值。
本文基于机器学习算法,建立一个能够高效识别P2P 平台贷款业务违约情况的模型,降低P2P企业的违约风险,保障企业与投资人的收益情况,并提出有效建议,促进P2P行业健康持续发展。
目前对于P2P借贷违约模型的研究方法仍以逻辑回归、决策树等方法为主,然而这类方法在面对多维度的海量数据时分析乏力,模型拟合及预测效果欠佳,因此本文建立基于LightGBM算法的模型来解决上述问题,为企业创造经济利益。
本文首先对人人贷公开的数据进行收集,对收集到的样本依次进行描述性分析、数据清洗以及特征筛选等步骤。
之后,用处理完的样本数据构建多种机器学习模型,并通过准确度等评价指标来对各个模型的预测结果进行分析和比较。
最后,选择其中表现效果较佳的LightGBM模型作为基模型,利用Linear Blending进行模型集成,构建最优的违约风险识别模型。
本文最终的结果表明,LightGBM算法针对多维大量的数据样本来说,预测效果优于诸如逻辑回归、支撑向量机等传统机器学习模型。
通过Linear Blending进行模型集成后,预测效果能够得到有效提升,可以有效判断P2P 平台的用户违约风险,减少了对未违约用户的错误估计。
因此,本文的研究成果能够应用于P2P公司进行风险控制。
关键词:P2P借贷特征工程 LightGBM Linear Blending1AbstractWith the rapid development of Internet finance, the concept of P2P has also swept across the country in recent years. However, the extremely high bad debt rate has brought huge losses to the P2P platform operators and investors. Therefore, in order to improve the healthy development of the P2P industry, it is necessary to establish an efficient loan default risk identification model. This paper aims to build a model that can effectively identify the default risk of P2P lending based on the machine learning method. It can help to reduce the default risk of P2P companies, guarantee the profits of companies and investors, and provide suggestions to improve the development of P2P industry.At present, most research methods of P2P lending default model are based on logistic regression or decision tree. However, for high-dimensional and massive date, the prediction accuracy of these methods are not high. The LightGBM model helps to improve the prediction accuracy and gains profits for the P2P platform. This paper collects the data of Renrendai, performs descriptive analysis, cleans data and filters features. After that, a variety of machine learning models are established for the processed data sets, and the prediction performances of each model are evaluated and compared by the evaluation indicators such as accuracy. Finally, we select the LightGBM model as the base model, and use Linear Blending to integrate the model to establish the final model.The final results of this paper show that the LightGBM algorithm is superior to traditional models such as logistic regression or SVM for high-dimensional and large-scale data. After the model integration by Linear Blending, the prediction performances can be further improved, which is better than the traditional model. The integrated model can effectively identify the default risk of users so it could be applied to the P2P platforms for risk control.Keywords: P2P Lending;Feature Engineering;LightGBM;Linear Blending目录1 绪论 (1)1.1研究背景 (1)1.2研究意义 (2)1.3国内外研究进展 (3)1.3.1 传统金融行业的违约风险的研究 (3)1.3.2 P2P平台违约风险模型的研究 (4)1.3.3 对现有研究的评价 (5)1.4研究思路 (6)1.5论文框架 (6)1.6创新之处 (7)2 相关理论介绍 (8)2.1P2P借款业务分析 (8)2.2数据挖掘理论模型 (8)2.2.1 逻辑回归模型 (9)2.2.2 支持向量机 (9)2.2.3 决策树算法 (10)2.2.4 随机森林模型 (10)2.2.5 XGBoost模型 (11)2.2.6 LightGBM算法 (11)2.3L INEAR B LENDING模型集成方法 (12)3 数据收集与预处理 (14)3.1数据来源与概况 (14)基于LightGBM的P2P借贷违约风险模型研究23.1.1 数据来源 (14)3.1.2 数据概况 (14)3.2描述性统计 (14)3.3数据清洗 (19)3.3.1 对缺失值的处理 (19)3.3.2 对近零方差变量的剔除 (20)3.3.3 部分字段的转换 (21)3.4特征工程 (22)3.4.1 特征衍生 (22)3.4.2 对特征的再次处理 (24)4 实证分析 (27)4.1平衡数据集与评估指标 (27)4.2不同学习器的P2P网贷违约风险预测效果 (30)4.3基于L INEAR B LENDING的模型集成 (36)5 结论与建议 (40)参考文献 (42)致谢 (45)1 绪论1 绪论1.1 研究背景随着信息科技的不断发展和大数据浪潮的猛烈袭来,互联网金融(以下简称“互金”)这一概念也迅速得到普及。
基于Logistic回归分析的违约概率预测研究
基于Logistic回归分析的违约概率预测研究一、本文概述随着金融市场的不断发展和信贷规模的日益扩大,违约风险的预测和管理成为金融机构面临的重要挑战。
违约概率的准确预测不仅有助于降低信贷风险,还能为金融机构的决策提供科学依据。
因此,本文旨在探讨基于Logistic回归分析的违约概率预测方法,以期为金融机构的风险管理提供新的视角和工具。
本文将介绍Logistic回归的基本原理及其在违约概率预测中的应用。
Logistic回归是一种广义的线性模型,适用于因变量为二分类或多分类的情况。
通过构建Logistic回归模型,我们可以分析自变量与违约概率之间的非线性关系,从而更准确地预测违约事件的发生。
本文将详细阐述基于Logistic回归分析的违约概率预测模型的构建过程。
包括数据收集与预处理、变量选择与模型设定、参数估计与模型检验等步骤。
在数据收集与预处理阶段,我们将关注数据的来源、质量以及处理方法;在变量选择与模型设定阶段,我们将根据理论分析和实际情况选择合适的自变量,并构建Logistic回归模型;在参数估计与模型检验阶段,我们将采用适当的统计方法估计模型参数,并通过交叉验证、ROC曲线等方法评估模型的预测性能。
本文将通过实证研究验证基于Logistic回归分析的违约概率预测模型的有效性。
我们将选取某金融机构的信贷数据作为研究样本,运用构建的模型进行违约概率预测,并与实际违约情况进行对比。
通过实证分析,我们将评估模型的预测精度和稳定性,为金融机构的风险管理提供有益的参考。
本文旨在通过Logistic回归分析的方法研究违约概率预测问题,为金融机构的风险管理提供新的视角和工具。
通过理论分析和实证研究相结合的方法,我们将探讨如何构建有效的违约概率预测模型,为金融市场的稳健发展提供有力支持。
二、文献综述违约概率预测是金融风险管理领域的核心议题之一,对于银行、保险公司、投资公司等金融机构来说,准确预测违约概率是维护资产安全、降低风险损失的关键。
基于logistic模型的违约概率测算研究的开题报告
基于logistic模型的违约概率测算研究的开题报告一、题目基于logistic模型的违约概率测算研究二、背景随着经济全球化的深入发展,金融风险问题成为了各国市场监管部门、学者及金融机构共同关注的问题,而违约风险是其中的重要一环。
了解借款人的违约风险,可以更好地控制风险,保障金融机构及投资人的利益。
在这一背景下,建立一种可以较为准确测算出借款人违约概率的模型,对金融机构和投资人有着重要的意义。
而logistic模型作为一种经典的违约概率测算方法,在金融风险领域中被广泛应用。
三、研究内容本研究将对logistic模型进行深入研究,探索其在测算借款人违约概率方面的应用。
具体来说,将从以下几个方面展开研究:1. 研究logistic模型的基本原理和应用场景,深入了解其核心思想和数学模型。
2. 收集借款人相关数据,确定影响借款人违约的因素,并通过数据预处理、特征工程等方法,将数据转化为模型可以接受的形式。
3. 建立logistic模型,对收集到的数据进行训练和验证,评估模型的准确性和可靠性。
4. 针对模型的不足和局限性进行分析,并提出改进和优化策略。
四、研究方法1. 文献综述法:对logistic模型及其在金融风险领域的应用进行深入了解,在此基础上设计研究方案。
2. 数据分析法:通过收集借款人相关数据,确定影响借款人违约的因素,并进行数据预处理、特征工程等操作,将数据转化为模型可以接受的形式。
3. 模型建立与验证法:基于logistic模型,对收集到的数据进行训练和验证,并评估模型的准确性和可靠性。
4. 分析与优化法:对logistic模型的不足和局限性进行分析,并提出改进和优化策略。
五、预期成果本研究将建立一种基于logistic模型的违约概率测算方法,并对该方法进行验证和优化。
预计的成果包括:1. 研究报告:对logistic模型在违约概率测算中的应用进行深入研究,对模型的优缺点、应用前景等进行分析,并提出相应的改进策略。
基于Lasso-Logistic模型的P2P网络借贷信用风险度量
收稿日期:2017-11-29 基金项目:广东省教育厅“ 十三五” 规划项目( 粤教师函〔2017〕145 号) 作者简介:邹明芮(1991-) ꎬ女ꎬ山东淄博人ꎬ讲师ꎬ硕士ꎬ主要从事互联网金融研究ꎮ
第3期
邹明芮:基于 Lasso-Logistic 模型的 P2P 网络借贷信用风险度量
23
越大ꎬ违约风险越大ꎻ借款的利率越高ꎬ表明还款所 支付的成本越高ꎬ还款压力越大ꎬ违约的风险越大ꎻ 借款的期限 越 长ꎬ 还 款 期 间 的 不 确 定 性 越 大ꎬ 可 能
伴随着 P2P 行业的快速发展ꎬ借款人的信用风 险度量是 P2P 网贷平台亟待解决的问题之一ꎮ 国 内外学者对 P2P 网络借贷信用风险的度量做了诸 多研究ꎮ 但是ꎬ目前我国还存在以下两方面问题: 一是 P2P 网贷平台还沿用传统的信用评价方法ꎬ方 法过于简单ꎬ 不 能 准 确 反 映 个 人 的 信 用 风 险ꎻ 二 是 影响信用风险的因素众多ꎬ如何选取影响因素对信 用风险进行度量至关重要ꎮ 本文在 Logistic 模型的 基础上ꎬ引入 Lasso 算法来建立 P2P 网贷的信用风 险度量模型ꎬ从众多的影响因素中科学地选出度量 指标ꎬ以期 更 为 准 确 地 度 量 出 借 款 人 的 信 用 风 险ꎬ 为 P2P 网贷平台信用风险防范提供参考ꎮ
策树模型对 P2P 借款人的违约风险进行度量ꎬ发 现借款金额、期限、违约次数、年收入对违约有很 大影响ꎬ为投资者进行投资决 策 提 供 参 考[4] ꎮ 孙 同阳、谢朝阳通过抓取 P2P 网贷平台的借贷数据ꎬ 建立决策树模型ꎬ以信用等级作为其输出变量ꎬ得 到了很好的预测效果[5] ꎮ 方匡南、章贵军、张惠颖 在 Logistic 模型 的 基 础 上 引 入 Lasso 算 法ꎬ 利 用 银 行数据对影响个人信用风险的因素进行了实证研 究ꎬ发现模 型 能 够 抓 住 主 要 的 影 响 因 素 且 预 测 的 准确性更高[6] ꎮ
基于 logistic 回归模型的 p2p 网络借贷平台风险分析
资金投入到风险相对较小,投资回收快的股市,
B S.E. Wald df Sig. Exp(B)
进而从 P2P 网络借贷平台撤资投入股市,出现 平台无力对付的状况。
(3)监管不当。由于平台规章制度不明 确,缺乏相应的管理和规范会导致运营风Байду номын сангаас增 大,操作不当以及用户流失的状况,从而增加
平台,由需要钱的人发布需求,投资人参与竞 标,由平台撮合双方完成交易,并收取一定服 务费的一种网络借贷模式 [1]。
P2P 网络借贷特点: (1)低要求、低投入。P2P 网络借贷平 台所要求的门槛低,需要的投入也少,并且能 够审核用户信用,保证用户安全,使全民都可 以参与进来。 (2)风险最小化。P2P 贷款银行平台可 以资金分发给多个借款人同时提供小额贷款 使借款人风险最小化 [2]。 (3)信用辨别。在 P2P 借贷平台模型中, 可以根据每个人的信用等级来安排放贷次序, 信用等级高的用户也可以享受更高的利率有谁 政策。
一、P2P 网络借贷平台概况
系的区别。因为二元分类变量在逻辑上的因变
P2P 在中国起步较晚,但 P2P 贷款行业已 量,一个概率作为依赖变量的估计值范围为
经非常大。P2P 意为“个人对个人”或“点对点” 0-1,但是在值范围右边的方程是无穷大和无
借贷,简单说即是由某个企业搭建一个互联网 穷小所以我们引入了逻辑回归。
V3 -1.345 .889 14.612 1 .000 .031 步 骤 常量 1.050 .342 7.213 1 .007 2.786 1
V3 -.654 .921 8.645 1 .035 .063
V11 -1.678 .322 5.641 1 .006 .000
基于Logistic模型的网贷违约风险预测研究
基于Logistic模型的网贷违约风险预测研究作者:王飞祥吴礼好来源:《中国管理信息化》2021年第05期[摘要] 随着网络在人们生活中的普及使用,传统的借贷模式也跟着发生了改变,传统借贷模式逐渐被网络借贷模式所替代。
如今,网络借贷违约现象极大地制约了网络借贷的健康发展。
为减少网络借贷平台违约率,现对某一P2P网贷平台的贷款数据进行分析,结合网贷借款人的基础信息和借款信息的18个特征变量,建立逻辑回归违约风险评估模型,并通过混淆矩阵以及ROC曲线检验结果表明,模型具有较高的精度,可以有效预测借款人的违约风险。
[关键词] 网络借贷;Logistic模型;违约风险0 引言随着我国经济快速发展,越来越多的人接触到网络借贷,而如何从广大用户中有效识别出优质客户,降低客户的违约率对网络借贷平台来说,对其稳健发展至关重要。
据网贷之家数据显示近三年来网络借贷平台正常运营平台数量持续降低,究其原因,借款人的违约不乏为其中一个重要影响因素。
因此,能够精准甄别网贷风险、降低借款人违约率显得十分必要。
苏亚,成春林(2017)认为在对网贷借款人违约行为的影响分析中应多维综合考虑借款人的“软信息”和“硬信息”。
[1]丁岚,骆品亮(2017)提出Stacking集成策略来降低预测模型中的一、二类错误从而达到提升借款人违约风险预测的准确度。
[2]熊正德,刘臻煊,熊一鹏(2017)通过将“违约”与“不违约”两类细分为“提前结清”“当前正常”“可疑”“损失”四类,构造有序多分类logistic模型,得出“当前正常”和“可疑”两类客户的预测效果相对准确率更高。
[3]沈玉溪,徐浩(2018)运用Lending Club2017年第一季度的交易数据通过决策树模型对借款人的违约风险特征的重要性进行分析。
[4]谭中明,谢坤,彭耀鹏(2018)利用Logistic回归方程式的方法筛选变量建立梯度提升决策树模型来对借款人的信用风险进行评测,检验的结果表明GBDT模型的预测效果更好,但在特征变量的筛选中借款人收入多少与有无房贷等重要特征并不显著。
基于二元logistic模型的P2P违约分析
Financial View | 金融视线1065.缓解资金短缺危机,促进盈利能力改善。
由表可知,S 公司自2015年采用租赁资产证券化融资方式后,其盈利能力逐年改善提高,尤其是2018年此次产品融资过后,公司当年不仅净资产收益率有所上升,而且经营活动现金流量净额首次由负转正,由-41.68亿元到4.22亿元。
现金流的畅通有效地缓解了资金短缺危机,投融资战略的优化调整也增强了公司获取现金和偿还债务的能力,有利于未来公司盈利能力的进一步提升。
结合S 公司自2015年开始采用租赁资产证券化方式进行融资,以下对公司2015年之后整体的盈利能力情况进行分析。
1.盈利水平方面。
2015年~2018年,S 公司的净资产收益率一直保持较好的上升趋势。
通过杜邦分析拆解净资产收益率指标可以看出,首先,公司近三年总资产周转率一直保持在稳定的状态,没有剧烈的增减变动,说明公司全部资产利用效率较为稳定,经营资产质量稳定地为公司盈利积蓄能量。
其次,销售净利率有小幅的降低,原因在于公司处于业务快速扩张期,不仅管理费用逐年增长而且融资租赁业务发展较快,购买融资租赁资产、购买商品及接受劳务和支付工资等现金流出快速增长,且融资租赁业务收入周期较长,使经营性现金流持续净流出。
最后,权益乘数逐年增长趋势明显,表明公司负债程度不断增加,公司向外融资的财务杠杆倍数不断增加,出于融资租赁行业特殊性质,高财务杠杆是其显著的财务特征,且随着融资租赁公司业务规模不断发展壮大,这一特征将逐渐明显。
2.盈利持久性和稳定性方面。
S 公司自2015年开始采用租赁资产证券化的方式进行融资后,其盈利能力都在较为稳定地不断提高。
通过2018年初产品案例可以更加细致的看到,S 公司2019年中期较2018年中期营业收入同比增长34.36%,净利润同比增长97.83%,净资产收益率同比增长55.82%。
S 公司在实施租赁资产证券化后,近三年一直保持较快的发展速度,平均主营业务利润率较为稳定的保持在50%左右,主营的融资租赁业务营业收入持续增长,2018年较2016年同比大幅增长107.5%。
P2P网贷信用风险判别研究——基于二项Logistic分类模型
P2P 网贷信用风险判别研究—基于二项Logistic 分类模型谭中明,谢坤,丁国平(江苏大学财经学院,江苏镇江212013)基金项目:本文系国家社科基金项目(16BGL049)阶段性成果。
收稿日期:2018-06-24作者简介:谭中明(1963-),男,湖南安化人,江苏大学财经学院教授;谢坤(1991-),女,湖北黄冈人,江苏大学财经学院硕士研究生;丁国平(1976-),男,江苏镇江人,江苏大学财经学院讲师。
互联网科技的发展,推动了金融资本与信息技术的融合,P2P 网络借贷(以下简称P2P 网贷)是当代金融资本脱离商业银行等传统实体信用中介并依托现代信息技术流与“大数据”基础运动的结果,创新较好地解决了由信息不对称引发的资本供给与融资需求的结构性失衡,缩短了信贷资本周转时间,提升了资本循环效率。
然而究其本质,P2P 网贷依旧是一种资金融通的中介,无法消除金融借贷业务所固有的交易风险,尤其是脱离实体金融机构的纯线上信用审核以及行业监管不足的运作环境,这又加大了整个P2P 网贷行业的违约风险。
科学识别P2P 网贷信用风险,是有效管控和事前防范P2P 系统性风险的关键,也是推进P2P 网贷生态圈良性循环、稳健发展的核心环节。
摘要:传统借贷模式中,银行等金融机构拥有借款人较详细的信息和科学的信用评估方法,因而能有效控制信用风险。
而在P2P 网贷市场中,纯线上的信用审核机制因信息不对称,极易引发借款人违约行为。
本文立足于借款人视角,从影响P2P 网贷违约的因素出发,构建信用风险判别指标体系,运用二项Logistic 分类模型对P2P 借款人的信用风险进行实证分析,并基于实证结果,提出有效防范P2P 网贷主体信用风险的对策建议。
关键词:P2P 网贷;信用风险;判别;二项Logistic 分类模型DOI:10.3969/j.issn.1003-9031.2018.08.01中图分类号:F830.5文献标识码:A 文章编号:1003-9031(2018)08-0004-09一、文献综述国内学者对P2P网贷信用风险的研究主要是立足于平台和借款人两大维度,采用不同的分析方法,循着理论与实证两个方向进行研究。
基于Lasso—logistic模型的P2P网贷平台信用风险评价研究
基于Lasso—logistic模型的P2P网贷平台信用风险评价研究一、引言随着我国现代信息化的发展,“互联网+”的出现,P2P已经成为“互联网+金融”的主要发展模式之一。
在传统金融服务模式僵化造成投资渠道单一,个人、中小企业融资难等问题日益突出的背景下,P2P 网贷迅猛发展。
门槛低、回报较高,且以互联网为媒介实现快速买入和变现的投资交易模式,更适合于大众创业、万众创新时代的个人小额借贷,且为经济转型升级提供了有效途径。
截止2018年3月,因经营不善、携款跑路、黑客攻击等原因使网站无法正常运营而停业的平台就有151家,2017年有643家,2016年有1711家。
以上数据表明,在P2P 欣欣向荣发展的背后,潜在的风险日益明显。
信用风险是指平台上的借款者因种种原因,不愿或无力履行合同条件而构成违约,致使P2P 网贷平台遭受损失的可能性,这是P2P 平台最基本的风险之一。
平台作为中介为借贷双方提供直接的交易平台,无抵押、无门槛、申请程序方便易懂,为小微企业融资和个人贷款提供了便捷通道。
但是,对于投资者来说,其需要选择一个平台进行投资,在借款方的条件如此宽松的下,为保证投资者投资收益,对投资平台风险的研究是研究投资行为扩散研究的必然前提。
因此,本文通过构建Lasso-logistic模型对网贷平台的风险进行评估的研究具有一定的研究意义。
二、P2P 网贷平台信用风险评价实证分析(一)数据来源及处理网贷之家是我国首家P2P网贷理财行业门户网站,提供全方位、权威的网贷平台数据。
目前,P2P网贷在我国发展速度非常快,从网贷之家官网公布的数据可以看出其发展趋势与速度。
本文通过从网贷之家官方网站爬取网贷之家上的从业人员资质审查机制、设立投资人资格标准、贷款审查程序合理、完整性、对借款人进行身份审核及资信评估、制定借款违约应急计划的一些数据,截至2018年4月,共有网贷平台6114家,正常运营的平台有1887家,累计问题平台4237家。
基于Logit模型的P2P网络借贷平台的风险评估
台的资本雄厚与否袁实收资本少的 P2P 平台往往更易出问题袁风险
更高
平台背景
现阶段袁P2P 网络借贷平台主要有国资尧上市公司尧风投和民营遥 从
X
网贷之家收录的问题平台统计分析发现袁其中民营背景占比达 92% 以上遥可见袁P2P 平背景对其正常运营有巨大影响袁是平台风险的主
要因素之一
资金是否在银 行存管
三尧总结与建议 本研究通过整理创业意向的有效测
量方式袁对今后创业意向的测量有明确的 方向与理解遥 除此以外袁研究发现成就需 要尧自我效能感尧个人特质对创业意向的 形成具有重要性遥获得创业所需的技能和
能力的自信似乎是形成创业意向的关键 决定因素遥 然而袁制度环境影响学生的创 业意向袁有利的制度将会对创业意向产生 正向影响遥
in time:The emergence of the new venture
[J].Entrepreneurship Theory and Practice,
1992(01). [3] 张 楠 , 林 绍 福 , 孟 庆 国 现 行 科 技 政
策体系与自主创新企业反馈研究[J].中国 软科学,2010(03).
[7]段锦云,孙建群,简丹丹,田晓明.创 业特征框架对创业意向的影响要 要要创业 认知的视角[J].南开管理评论,2016(05).
元基金项目院2017 年贵州省研究生 教育教学改革重点课题野研究生培养创新 创业实践现状及变革研究冶渊项目编号院
基于Logistic的P2P网贷借款人信用风险评估研究
基于Logistic的P2P网贷借款人信用风险评估研究作者:徐慧婷来源:《中国石油大学学报(社会科学版)》2017年第06期Dec.2017Vol.33No.6DOI:10.13216/ki.upcjess.2017.06.0003摘要:从P2P平台信用风险角度出发,以借款人风险控制为研究目标,构建借款人信用评价指标体系,并利用美国P2P网络借贷平台Prosper上的数据建立基于 Logistic 回归的借款人信用风险评价模型。
实证分析表明:是否有房产、贷款创立时长、借款利率对借款人信用风险有着比较大的影响,而借款金额、信用评级、借款期限、借款用途对借款人信用风险没有特别明显的影响。
关键词:P2P网络借贷;信用风险;互联网金融;Logistic模型中图分类号:F832.4文献标识码:A文章编号:16735595(2017)06001605一、引言P2P网络借贷是随互联网和民间借贷兴起的一种新的金融模式,是最有活力和代表性的金融业务模式之一。
P2P网贷平台为借贷双方提供了诸如信息沟通、信用评价、投资咨询等交易促成服务,成为个人消费、小微企业经营在银行体系以外的重要融资渠道。
近几年,P2P借贷行业的资产拓展、产品演进、技术更新速度之快,令人应接不暇。
在快速成长之中,P2P借贷行业的诸多问题也日益凸显,层出不穷的倒闭、跑路乃至诈骗事件给行业留下沉重阴影。
2014年,中国银监会向银行业机构发布了关于某国知名P2P信贷服务中介公司风险提示,称其存在大量潜在风险,要求银行业金融机构采取有效措施,做好风险预警监测与防范。
在此背景下,对P2P实践中的借款人风险进行研究,建立P2P网络信贷风险评估模型具有非常重要的意义。
二、文献回顾目前国内外关于P2P 网贷信用风险的研究主要是从“软信息”和“硬信息”两个角度来考察。
软信息指的是某些无法诉诸纸面的信息,例如借款人的性格、借款人朋友圈的质量等等。
硬信息指的是能够用准确的指标或数值表示的信息,如债务收入比、有无违约记录、是否有房产以及借款者每月还款金额等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Abstract:BasedonthecreditriskcharacteristicsofP2Pnetworkcreditplatform,thispaperusesLogistic regression methodtoestablishacreditdefaultriskassessmentmodelforborrowerswhentakingthebor rowerdefaultsituationastheexplanatoryvariable.RawdataisobtainedfromthecrawloftheRenrenloan website.Thereare24originalevaluationvariablesselected.Throughtheinformationgain,theexplana toryvariablesarereducedto19.Throughfivestepsofregression,thefivefactorsincludinggender,over duenumber,overdueamount,identitycertificationandacademicqualificationsshouldbeusedasthemain basisforevaluatingpersonalcreditrisk,andthelogisticregression modelisestablished.Thediscrimina tiveaccuracyoftheregressionmodelindicatesthattheconstructedcreditriskassessmentmodelofthebor rowerhasabetterpredictioneffect. Keywords:P2Plending;creditdefaultrisk;Logisticregression model;informationgain
P2P 网 络 借 贷 全 称 是 “Online Peerto Peer Lending”,指的是 个 体 与 个 体 之 间 通 过 网 络 实 现 的 直接借贷。出借方 和 借 款 方 既 可 以 是 自 然 人,也 可 以是企 业。2005 年,世 界 上 第 一 家 网 络 贷 款 平 台 Zopa在英国成立,次 年 网 络 贷 款 平iManagementScience
第41卷第3期 2019年6月 Vol.41 No.3 Jun.2019
元 增 至 212 亿 元 。 随 着 社 会 经 济 的 不 断 发 展 以 及 大 众融资需求的增加,2012年后我国 P2P 网络借 贷得 到 快 速 发 展。2013 年,我 国 网 贷 平 台 数 达 到 800 家,成 交 额 达 到 1058 亿 元;2015 年,网 贷 平 台 数 达 到 2595 家 ,成 交 额 达 到 9823 亿 元 。2017 年 ,我 国 网 贷 平 台 数 量 达 到 了 6363 家 ,全 年 网 贷 行 业 成 交 量 达 到了28048.49亿 元,相 比 2016 年 全 年 网 贷 成 交 量 (20638.72亿 元)增 长 了 35.9%;预 计 2018 年 上 半 年网贷行业成交规 模 将 趋 于 稳 定,下 半 年 或 迎 来 成 交量新高,全 年 P2P 网 贷 成 交 量 大 概 率 突 破 3 万 亿元。
国 成 立 ,随 后 ,日 本 、西 班 牙 、韩 国 等 国 家 也 纷 纷 成 立 了自己的网络贷款平台。2007 年,中 国 最 早 的 网 络 贷 款 平 台 ——— 拍 拍 贷 成 立 ,此 后 ,其 他 网 络 借 款 平 台 陆续出现。2010—2012年,我国的 P2P 网络借贷平 台由10 家 增 长 到 200 家,网 络 借 贷 成 交 额 由 15 亿
ResearchontheCreditRiskAssessmentofPeertopeer LendingBorrowerBasedonLogisticRegressionModel
犆犎犈犖 犡狌犲犾犻犪狀 犘犃犖 犕犲犻狇犻狀 (SchoolofBusinessand Management,ShanghaiInternationalStudiesUniversity,Shanghai200083,China)
收 稿 日 期 :20190402 作者简介:陈雪莲(1994—),女,江苏淮安人,在读硕士生,研 究 方 向:数 据 挖 掘,Email:15021615561@163.com;潘 美 芹 (1972—),女,浙
江 仙 居 人 ,副 教 授 ,硕 士 生 导 师 ,研 究 方 向 :信 息 管 理 、决 策 分 析 、数 据 挖 掘 ,Email:panmqin@sina.com。
上海管理科学 ShanghaiManagementScience
文 章 编 号 :10059679(2019)03000704
第41卷第3期 2019年6月 Vol.41 No.3 Jun.2019
基于 Logistic回归模型的 P2P 借款人信用违约 风险评估模型研究
陈雪莲 潘美芹
(上海外国语大学 国际工商管理学院,上海 200083)