当前位置:大学毕业论文> 专科论文>材料浏览

有关风险评估毕业论文格式模板范文 和P2P网人违约风险评估基于决策树有关硕士论文范文

主题:风险评估论文写作 时间:2024-03-11

P2P网人违约风险评估基于决策树,该文是风险评估相关在职开题报告范文和决策树和风险评估和借款人有关在职开题报告范文.

风险评估论文参考文献:

风险评估论文参考文献 管理论文网期刊论文网文献网邮政报刊订阅网

摘 要:借款人违约风险是P2P网贷风险的核心.运用Lending Club2017年第一季度的交易数据,采用信息增益比率标准,对P2P网人违约风险的影响因素进行排序.结果显示,借款收入比、信用等级、借款期限、借款利率、住房情况,是前5个影响借款人违约风险的因素.据此,构建风险评估模型,对P2P网人的违约风险进行评估,分析其影响因素和风险评估模型的有效性,并为P2P网贷行业的风险控制和有效监管提出建议.

关键词:P2P网贷;违约风险;决策树;风险评估模型

一、引言

当前,我国P2P网贷发展迅速.2017年,我国P2P网贷成交额为6.23万亿元,与同期13.53万亿元新增人民币贷款之比为46.07%.然而,在P2P网贷迅速发展的同时,其风险也在行业内部不断集聚.

2014年至今,我国P2P网贷平台累计数量,从757家上升至6183家,而正常运营平台仅为1836家,大量平台破产、倒闭.在P2P网贷众多风险中,借款人违约风险及其控制是P2P网贷平台及行业今后健康发展的关键(王书斌等,2017).[1]

二、文献概述

(一)P2P网贷研究的热点

借款人违约风险评估,是目前国内外P2P网贷研究的热点之一.其实证研究大多利用分类器工具,算法主要包括决策树、Logistic模型、支持向量机、神经网络等.然而,国内外学者基于不同算法的借款人违约风险实证研究结果,却显示出较大的差异性.

唐剑琴(2016)认为,信用等级、借款利率、债务收入比、借款期限、收入认证等因素,对借款人的违约风险有较大影响.[2]

王程龙等(2016)则认为,借款人年龄、借款金额、借款人职业、担保及视频认证情况,是影响借款人违约风险的重要因素.[3]

(二)P2P网贷研究的趋势

不同算法的比较分析和集成策略模型构建,成为目前及今后的研究趋势.

Malekipirbazari(2015)通过比较不同的机器学习方法,认为随机预测在识别优质借款人方面,明显优于FICO评分和LC等级鉴定.[4]

阮素梅等(2017)利用“人人贷”的交易数据,分别构建基于决策树和支持向量机算法的借款人违约风险评估模型.结果显示,在考虑误差成本的情况下,决策树模型更优.[5]

丁岚等(2017)利用“人人贷”的交易数据,以Logistic回归、决策树、支持向量机为初级学习器,以支持向量机为次级学习器,构建基于Stacking的集成策略评估模型,预测P2P网贷中借款人的违约风险,显示出良好的效果.[6]

然而,目前基于分类器的借款人违约风险评估模型的变量设置尚有待进一步研究,这主要是因为在数据的预处理上存在分歧.本研究在数据预处理上区别于以往研究,在一定程度上改善了模型的预测效果.

三、实证分析

(一)模型选择

1.常用模型

目前,在P2P网人违约风险评估研究中,常用的模型主要包括,Logistic模型、支持向量机、神经网络、决策树等.然而,各模型均有不足之处.

2.决策树算法

决策树算法的基本思想,是按照一定的分割规则,自上而下对总体进行不断地分割,最后按照多数法原则确定分类结果.这种算法实质上体现的,是分类对象属性变量与分类结果之间的一种映射关系.决策树模型结合了传统统计分析和人工智能算法,在保留了非参数统计一些优点的同时,又克服了其不足之处.

总之,决策树算法具有自动选择变量、降维、充分利用先验信息,有效处理非同质数据关系等优点.其得到的违约分类结果,是一个树状结构,具有可解释性强、简单易懂的优势.基于此,本研究选择决策树为分类算法.

(二)数据来源与预处理

1.数据来源

成立于2007年的LendingClub,是美国规模最大的P2P网贷平台,其借款人信用等级采用FICO信用评分模型.由于在美国强监管的市场环境下,LendingClub中的借款人信息具有较高的质量,因此,本研究采用LendingClub的交易数据.

2.数据预处理

2017年第一季度,Lending Club共产生133887条交易记录.原始数据共有146个特征变量,去除无关变量与高度相关变量,选取的主要违约风险变量,涵盖借款信息和借款人信息共19个,具体如表1所示.

表1:违约风险变量与借款状态

表1中的loanstatus,即贷款状态分为:chargedoff(冲销)、current(流通)、default(违约)、fullypaid(全部付讫)、ingraceperiod(宽限期内)、late16~30days(超期16~30天)、late31~120days(超期31~120天)七类.鉴于超期意味着一定程度的违约,本研究视冲销、违约、超期16~30天、超期31~120天为违约,全部付讫视为未违约.

经过数据抽取和缺失值处理后,得到一个包含51360条记录的数据集.其中,违约记录15924条,占31%;未违约记录35436条,占69%.鉴于此数据集的不平衡性,需对其进行平衡处理.采用对少数样本的过抽样方法,将违约样本完整复制,得到31848条违约记录.此时,总样本为67284条记录.

(三)特征变量选择

在数据预处理中,P2P借款状态被划分为“违约”“未违约”两类,即模型的因变量.而该数据集的自变量(特征变量)较多,尽管这样信息更充分,但同时数据集的冗余,也会相对影响模型的分类效果.

根据最大表决原则,将最多计数的类别作为此叶子节点.利用机器学习软件Weka3.8(怀卡托智能分析环境),采用信息增益比,对特征变量进行选择.特征变量的排序结果,如表2所示.

根据表2的信息增益率指标排序结果,最后选择dti、grade、term、int_rate、home_ownership、verification_status、inq_last_6mths、revol_util、annual_inc、installment、purpose共11个特征变量作为建模变量.

(四)决策树模型的建立与模型的有效性检验在Weka软件中,选用J48决策树算法,建模时间为1.63秒,正确分类率为71%,错误分类率为28%,因此具有较强的预测能力.

在进行信用评估时,正确的预测既可降低风险又可扩大收益.而实际构建的分类模型,往往会把实际存在信用风险的借款人,错误预测成不存在违约风险的借款人;把实际不存在违约风险的借款人,错误预测成存在违约风险的借款人.因此根据每类错误的成本不同,混淆矩阵将各种预测结果都统一归入一个矩阵中,方便全面解读模型的预测能力.决策树模型混淆矩阵如表3所示.

从表3可看出,该模型测试了67282个样本,其中预测正确的48090条,实际违约而预测为未违约6767条,实际未违约而预测为违约12425条,即犯第一类错误的概率较小,犯第二类错误的概率较大.总体而言,该模型具有良好的预测效果,但同时反映出模型尚具有改善的空间.

四、结论与建议

(一)结论

采用信息增益比率标准,对P2P网人违约风险影响因素进行排序,利用决策树分类算法,对违约风险评估模型进行构建和评估.研究结果显示,借款收入比、信用等级、借款期限、借款利率、住房情况,是前5个影响借款人违约风险的因素,这与目前的研究结论大体相似.

同时,该模型也显示出良好的预测效果,准确率达到71%.值得注意的是,模型的预测准确率尚具有提高的空间和必要性,这需要对数据进行更深入的处理.

(二)建议

1.政府角度

为了提高P2P网贷的效率并降低违约率,应开放并完善征信系统,将借款人相关的信用信息录入互联网平台.具体措施是:

第一、要完善并贯彻实施信用档案登记制度,确保每一笔信用信息都记载在册,有据可查.

第二、要加强信用立法与执法,提高人们对信用的重视和关注程度.

2.P2P平台角度

第一、应准确录入和审核客户,以保证借款人信息的高质量和准确性.

第二、P2P平台之间应互通客户信用数据库,实现信息共享.

第三、加强技术建设,不断升级平台信息服务系统.一方面,要不断更新平台信息系统,为优化违约风险评估模型提供强有力的数据支持;另一方面,聘用高素质的数据挖掘和分析人才,以及风险控制和管理人才等技术人才,以更好地支撑P2P网贷平台业务的发展.

参考文献:

[1]王书斌,谭中明,陈艺云.P2P网贷违约风险及其传染性评估综述[J].武汉金融,2017(6):40-44,14.

[2]唐剑琴.基于决策树算法的P2P网人违约风险度量研究[D].长沙:湖南师范大学(硕士学位论文),2016.

[3]王程龙,陈程.基于决策树的P2P网贷平台信用评级体系研究[J].农村金融研究,2016(12):45-50.

[4]MalekipirbazariM.,AksakalliV..Riskassesentinsociallendiniarandom forests[J].ExpertSystemswithApplications,2015,42(10):4621-4631.

[5]阮素梅,何浩然,李敬明.P2P借贷中借款人的违约风险评估———基于“人人贷”数据的实证分析[J].经济问题,2017(12):45-50,99.

[6]丁岚,骆品亮.基于Stacking集成策略的P2P网贷违约风险预警研究[J].投资研究,2017(4):41-54.

作者简介:沈玉溪,湖北工业大学经济与管理学院,硕士研究生,研究方向为互联网金融;徐浩,湖北工业大学经济与管理学院,硕士研究生,研究方向为民间金融.

此文汇总:这是关于对不知道怎么写决策树和风险评估和借款人论文范文课题研究的大学硕士、风险评估本科毕业论文风险评估论文开题报告范文和文献综述及职称论文的作为参考文献资料.

基于改进风险矩阵方法的战储物资以厂代储风险评估
摘 要本文在对国外广泛采用的风险矩阵评估方法进行全面分析和系统总结的基础上,针对风险矩阵方法的不足,结合战储物资“以厂代储”风险评估的客观实际和需要,对其进行了适应性改进 运用.

P2P网贷机构退出经营风险的防控和应对
一、多家P2P网贷机构退出经营的背景及现状为整顿我国互联网金融行业的乱象,促进行业健康有序发展,和地方密集出台了一系列的行政法规和规范,仅层面自2016年至今已经累计出台了各类相关文件接近20份 其中.

我国食品安全风险评估制度实施与应用
李水红,李彦毅(湖南渔米之湘食品有限公司,湖南 岳阳 414000)摘 要本文阐述了食品安全的概念及风险评估制度实施的具体意义,通过分析我国现阶段食品安全风险评估现状,剖析了食品安全风险评估制度存在的.

食品安全监管风险评估体系的构建
构建食品安全监管风险评估体系的意义  食品安全问题是关系到国计民生的基本问题,在食品安全监管的整个体系中,构建食品安全监管风险评估体系是一项重要内容,它的价值和意义主要体现在四个方面  它有利于监管资.

论文大全