公务员期刊网 论文中心 正文

谈个人信用风险评估模型比较

谈个人信用风险评估模型比较

摘要:信用卡自20世纪60年代,在欧美发达国家出现至今已经成为主流支付手段之一。但由于信用卡持有人的极大的不确定性,可能出现违约或者坏账。针对这些问题,本文以台湾某银行客户的违约支付情况为基础,采用线性判别分析、CART分类树和AdaBoost算法建立个人信用风险评估模型,并从预测准确率、第二错误率和误判成本3个方面比较这3种模型违约概率的预测准确性。结果表明,AdaBoost算法预测效果最好,线性判别效果最差。

关键词:信用评估模型;线性判别分析;CART分类树;AdaBoost算法

在市场经济社会中,法律制度,信用,财产权和风险是市场经济的四个关键。信用对个人,社会和国家特别重要,是现代社会的基石[1]。尽管随着大数据、区块链、人工智能等金融科技的发展,征信业将面临新的发展机遇,但是信用卡市场仍然是中国个人金融服务市场成长最快的产品系列之一。因此,建立一个合理的个人信用评估模型对个人信用进行评估就十分必要。一个较好的信用评估模型能给银行的决策提供合理的建议,从而能降低信用卡的不良率,减少由于违约对银行造成的损失。个人信用评估主要分为两类,第一种是统计学的方法,如logistic回归方法、线性回归方法、决策树方法、最近邻方法等。第二种是人工智能的方法,如神经网络方法、遗传算法、支持向量机(SVM)方法等[2]。除此之外,在信用评估的领域依然很多方法。建立信用风险评估模型的过程,实质上是评估方法对信用预测效果的对比过程。然而,在进行对个人信用违规的情况预测时,对于商业银行而言,可以选择很多种的模型,选择的指标和建立模型的方法也大不相同。基于以上原因,本文在征信的基本理论和实践的基础上,建立不同的信用评估模型,并进行对比,明确各种模型的优劣情况,让商业银行在进行个人信用评估模型的构建时能够有所参考。

一、数据预处理

(一)数据来源与变量设置本文所用数据来自数据集来自Kaggle公开数据源平台,数据包括30000名贷款者及其相关人口特征和信用记录数据,其中,人口信息的特征主要是年龄、受教育程度、婚姻状况、性别,信用记录数据包括信贷金额(包括个人和家庭/补充信贷)、还款情况、账单金额和支付金额等相关信息(详见表1)。

(二)数据处理本文将原始数据中连续性数值变量进行标准化处理,消除各变量取值水平不同带来的量纲影响。并将样本划为测试集(25%)和训练集(75%)两部分,利用训练集的数据制作个人信用评价模型,使用测试集合数据评价模型的预测效果。本文采取留出法分割法分割数据,保证训练集和测试集中违约状况的比例基本一致,从而提高预测的精度。

(三)研究方法选择本文基于统计学和人工智能方法进行分析,选用线性判别方法,CART分类树和集成模型adaboost方法分别建立模型,并从预测准确率、第二类错误率和误判成本对建立的3个模型进行比较。本文使用R软件对数据进行描述性的分析,建立模型并得出实证结果,所用程序为R软件中自带程序包或自己编写的程序。

二、数据的描述性分析

通过数据分析发现,在30000人中,违约率高达22.12%,相当于每五个人中有一个人违约还款(一般而言大银行信用卡的违约率为1%~3%),表明当时台湾爆发的信用卡债务危机十分严峻。从信贷额度看,信用卡客户的信贷额度大多数集中在20万以下,并且随着信贷额度的提高,违约率降低。这是因为当时各大银行机构之间的竞争十分激烈,为了营销活动而放宽信贷标准,让一些信用水平和偿还能力低的人也能够轻松地获得贷款,从而增加了违约风险。从年龄上看,信用卡客户年轻的客户群体占比最大,21~40岁的客户比例超过了70%,但是随着年龄的增加,违约率也在增加。从性别上看,男性客户与女性客户的比例约为2:3,但是女性客户的违约率(20.78%)要比男性的违约率(24.17%)低。从受教育程度看,大学与研究生学历的客户群体占比最多,并且学历越高,违约还款的可能性越小。从婚姻状况看,单身人士多于已婚人士,并且单身客户的违约率低于已婚客户。

三、实证分析

(一)线性判别分析基于观察事物的特定数据特征,判别分析是对它们进行分类确定事物的类型,对各个类型的各种样本的分类规则进行总结并建立判别函数,用在未来出现的新事物上判断新事物所属的类型。判别分析也是第一个适用于个人信用评价的统计学模式,被认为是分类模型领域最广泛的统计技术之一[3]。其基本原理是根据特征变量的属性值,找出特征变量的最佳线性组合,建立判别函数。而且,通过这些函数来区分观察的样本特征,可以准确的划分为几种不同的类型。本文的建模思想如下:总体客户分为两类,一类是“履约客户”,另一类是“违约客户”。客户的特征变量在训练集中是知道的,并且每个客户的类别(即是履约客户还是违约客户)也是知道的。训练样本的作用是根据新申请人的特征变量,能够从中建立判别函数,并用其来判断申请人的信用等级,即履约客户还是违约客户。建模完成后,我们将使用已经建立好的模型对剩下的训练集进行验证,并确认该判别函数是否可用。本文使用R软件中MASS包中的Ida函数,参数均保持默认的设置,通过分析得出的训练集总体的预测准确度为81.08%。

(二)CART分类树分类树是一种非参数统计方法。其基本思想是:根据特征变量的数值,将样本分为两个组,最大限度地使同组的样本发生的概率一致,产生不同组的样本的概率最大,在这个过程中,连续重复上述过程,划分获得的子组,直到达到设置的要求为止,最终获得结果。最后,按照规则将所有的终端节点分为不同类型。在建立分类树模型时,首先要考虑如何将整体分为不同的子类(怎么分),以及何时停止划分(如何修剪),如何判断最终产品类型,最后如何判断最终节点类型。常用分支和剪枝的算法有:CART、ID3、C4.5等。本文使用CART算法,其判断界定信息的有序无序的方法是Gini系数。则概率分布的Gini系数的表达式如下:其中,K表示一共有几个类别,P_k表示第K个类别的概率。模型的不纯度用基尼系数反应,不纯度越低,基尼系数越小,特征也就越好。本文使用R软件中rpart包中的rpart函数,所得模型的训练集总体的预测准确度为81.83%。

(三)AdaBoost模型Boosting,也称为强化学习或增强方法,是一种相对重要的集成学习方法,可以将预测准确性仅比随机猜测稍强的弱学习者增强为具有较高预测准确性的强学习者。AdaBoost是英语中“AdaptiveBoosting”(自适应增强)的缩写。它的自适应性体现在:被先前的基本分类器误分类的样本的权重值将增加,而正确分类的样本的权重值将降低。并且将再次用于训练下一个基本分类器。在每轮迭代中添加新的弱分类器,直到达到预定且足够小的错误率或达到预先指定的迭代次数为止,最后形成一个强分类器。本文使用R软件中adabag包中的bosting函数,设置权重更新系数为Freund,其计算公式为α=ln((1-err)/err)所得模型的训练集总体的预测准确度为81.85%。使用上文的三个模型,对测试集的数据进行预测,预测结果如下(详见表2)。

四、模型比较

本文将从预测准确率,第二错误率和误判成本三个方面对信用评估模型进行评价。

(一)预测准确率对于一个分类模型,本文将样本数据分为训练集和测试集,而在训练集中,样本的预测能力体现了一个模型的精度,而测试集的预测准确率则反映了该模型除了对生成模型以外的样本进行预测的能力,即泛化能力[4]。并且从风险管理的角度来看,预测的违约概率的准确性可以用来对可信的或不可信的客户进行分类。三个模型的测试集的预测准确率均高于训练集的预测准确率,表明三个模型的稳健性或泛化能力比较好。从训练集预测的准确度来看,三个模型的预测精度差别并不大,但是从测试集的准确性看,AdaBoost方法建立的信用评估模型的准确度明显比其余两种方法要高,达到了82.61%。并且三个模型在测试集和训练集中的预测能力都比较接近,表明它们是较为均衡的模型。

(二)第二错误率本文将履约用户误判为违约客户定义为第一类错误,将违约客户误判为违约客户定义为第二类错误。对于银行机构而言,犯第二类错误的损失将远远大于第一类错误,因而较好的预测模型应该有较小的第二类错误率。从表2中可以看出AdaBoost建立的信用评估模型测试集对违约判定的准确率为36.48%,比其余两种模型高,也即第二类错误率较低。

(三)误判成本在信用贷款业务中,把违约客户误认为是履行合同的客户对银行造成的损失更大。因此,评价模型的预测效果时,应该考虑错误分类的成本。误判代价的计算公式如下:1表示客户履约,2表示客户违约;π1和π2分别表示客户履约和违约的先验概率;n1/N1表示第一类错误;n2/N2表示第二类错误的概率;c(2/1)和c(1/2)分别表示第一类错误和第二类错误对应的错误分类的成本。本文将使用West[5]文章中使用方式,将c(1/2)设置为1,c(2/1)设置为5,即第二类错误成本为第一类错误成本的5倍,同时将客户履约和违约的先验概率均设为0.5。从表2中可以看出AdaBoost建立的信用评估模型的误判成本最低为43.92%,明线由于线性判别(45.22%)和CART分类树(44.03%)。

五、结语

本文以台湾某银行客户的违约支付情况为基础,使用相同的训练集与测试集,分别使用线性判别分析、CART分类树和AdaBoost算法3种方法建立个人信用风险评估模型,对同一测试集测试客户违约率,并从预测准确性、第二错误率和误判成本三个方面比较这三个模型的预测能力。分析结果表明,无论是从预测准确率、第二错误率还是误判成本这三方面,AdaBoost算法的预测效果最好,线性判别预测效果最差。在我国,信用风险的研究还并不成熟,各方面仍有许多值得讨论的问题,但各方面条件的缺乏在一定程度上限制了这一领域的研究。由于缺乏条件,本文模型仍然存在一定的缺陷,有待于进一步完善和完善。首先,指标体系的建立有待进一步完善。由于没有完全开放的数据库,使得研究中样本的选择更加困难。其次,模型的算法还有进一步改进,虽然本文中AdaBoost算法的分类准确率比较高,但是可能存在由于数据不平衡导致分类精度下降,弱分类器的数目也不太好设定。最后,在实际中,由于我国是一个大国,各地的经济发展不均衡,区域特征有显著的差异,因而在构建个人风险评估模型时,应考虑到上述差异,针对不同地区的人群构建不同的模型。

参考文献:

[1]王富全.个人信用评估与声誉机制研究[M].济南:山东大学出版社,2010.

[2]谢霖铨,赵楠,徐浩.个人信用风险评估模型发展研究[J].河南科技,2018(02):13-16.

作者:熊梁程 单位:上海对外经贸大学