您的当前位置:首页个人信用风险评估模型发展研究

个人信用风险评估模型发展研究

2020-05-06 来源:爱问旅游网
龙源期刊网 http://www.qikan.com.cn

个人信用风险评估模型发展研究

作者:谢霖铨 赵楠 徐浩

来源:《河南科技》2018年第02期

摘 要:个人信用风险评估是我国商业银行信贷风险管理的重要内容。为了有效识别个人信用风险,规避由于借款者违约而给商业银行经营带来损失的风险,本文对个人信用风险评估的发展历程以及信用风险研究的模型进行了总结。个人信用风险评估的模型存在一定的缺点,还须进一步完善研究方法,得到更精准的模型,降低风险问题的发生概率。

关键词:信用评估;统计学方法;人工智能方法;信用指标体系;组合模型

中图分类号:TP391 文献标识码:A 文章编号:1003-5168(2018)02-0011-04

Analysis on the Development of Personal Credit Risk Assessment Model

XIE Linquan ZHAO Nan XU Hao

(School of Science, Jiangxi University of Science and Technology, Ganzhou Jiangxi 341000)

龙源期刊网 http://www.qikan.com.cn

Abstract: Personal credit risk assessment is an important content of our country commercial bank credit risk management, in order to effectively identify individual credit risk, avoid because borrowers default and bring the risk of loss to commercial banks, in this paper, the development of personal credit risk assessment and credit risk models of research were summarized. There are some shortcomings in the model of personal credit risk assessment, and we need to further improve the research method, get more accurate models and reduce the occurrence probability of risk problems.

Keywords: credit evaluation;statistical method;artificial intelligence method;credit index system;portfolio model

随着我国经济的快速发展,住房按揭、汽车贷款、商业贷款、教育贷款和信用卡消费等各种信用贷款的规模迅速扩大,信用消费也逐渐占据人们的生活。个人信贷作为银行正常运行的主要资产业务,对银行的未来发展具有较大影响。随着金融业的快速发展,银行信贷中的信用风险问题逐渐显现出来,如何加强信用风险的防范变得尤为重要;贷款系统中客户的资源信息增加,如何有效识别借贷者并预测其未来贷款偿还的意愿,降低借贷者违约事件的发生概率,已经成为当前银行业以及金融机构亟须解决的问题。

1 信用风险的内涵及研究现状

1.1 信用风险的内涵

龙源期刊网 http://www.qikan.com.cn

信用风险是指借贷者因信用违约而给放贷者造成损失的风险。从商业银行的视角来看,信用风险源于信贷风险,是借贷或交易承诺、资金使用以及资金偿还等各个环节所面临风险与市场风险相结合的结果。

1.2 信用评估的研究现状

自20世纪40年代以来,个人信用风险评估受到了专家学者的关注。个人信用评估的研究从早期的传统方法、统计学方法逐步发展为人工智能方法。

1.2.1 统计学方法。David Durand[1]把特性划分差异的方法运用在个人信用评估中,以区分贷款好坏。Orgler[2]把线性回归方法运用到商业银行个人信用风险评估中。Wiginton[3]最先把Logistic回归应用于信用评估的中。Makowski[4],Carter和Catlett[5],Lee[6]把决策树方法运用在信用风险评估中,且取得了满意的成果。Chatterjee和Barcun[7]最先将最近邻方法应用于个人信用风险评估中。Hand[8]用最近邻方法和决策树方法来识别贷款风险,结果显示:最近邻方法有更高的预测精度。Hsieh[9]的研究表明,贝叶斯网络能直观地表示属性和概率之间的关系,具有较好的解释性。

1.2.2 人工智能算法。20世纪90年代以后,人工智能算法成为个人信用风险评估研究的主要方法。Odom[10]最先把神经网络的方法用于个人信用评估中。Fogarty和Ierson[11]最先将遗传算法应用到个人信用评分中。而Michalewicz和Obas等[12]运用遗传算法对个人信用风险评估进行了更进一步的探讨。Baesens和Gestei[13]最早对信用评估使用支持向量机,结果表明:支持向量机明显优于线性回归和神经网络方法。

龙源期刊网 http://www.qikan.com.cn

1.2.3 组合方法。石庆焱[14]利用Logistic回归和神经网络对个人信用风险进行评估,组合模型具有更高的精度和稳定性,且对特征变量有较好的解释性。姜明辉等[15]通过改进的PSO算法对SVM中的参数进行优化,提高了模型的分类精度,有效降低了第二类错误率。向晖等[16]将判别分析、决策树等七种方法组合起来对信用进行评估,结果表明:组合模型能有效提高预测精度及稳定性。高尚等[17]将K-means和支持向量机结合起来,得到分类结果和具体的信用度,还有效提高了模型的预测精度。杨胜刚等[18]把决策树BP神经网络相结合,不仅增强了神经网络的可解释性,还提高了模型的预测精度和稳定性。林汉川[19]等提出将Logistic回归和随机森林组合起来运用到个人信用风险评估中。

2 信用评估指标体系分析

一般评估指标的识别能力采用以下3种方法。

2.1 T检验

T检验,判别评估指标数据在“信用正常”样本和“信用异常”样本中的均值是否相等,通过[P]值来判别评估指标的识别能力。

假设样本数据近似服从正态分布,其统计量为:

[t=DSn] (1)

式(1)中,[D]为平均差,[S]为样本方差。

龙源期刊网 http://www.qikan.com.cn

对评估指标进行独立样本T检验,取置信水平[α]为0.05。若[P]值小于给定的[α],说明评估指标识别能力较强;反之,则识别能力弱。

2.2 Wald检验

Wald检验可以解决T检验中评估指标数据不服从正态分布的问题。Wald检验的目的是判别非正态分布的评价指标数据在违约样本和非违约样本中的均值是否相等,对信用风险是否具有较好的识别能力,其识别过程类似于T检验。

2.3 Log(Odds)判别

Log(Odds)判别方法,首先对评估指标进行分栏划分,将其划分为[i]个栏位,然后根据违约和非违约样本将第[i]栏位中的样本划分为[Niy]、[Nib],违约样本和非违约样本分别有[Ny]、[Nb],那么在该栏位的应该表示为:

[LogOddi=NiyNyNibNb] (2)

根据公式得到结果,对这些结果进行分析,若[LogOddi]的值呈单调性,说明该指标有较强的识别能力;反之,则指标的识别能力较弱。

3 个人信用评估方法的发展

个人信用风险评估方法由定性转变为定量研究,早期信用评估以单一的统计方法为主,后来以非统计学方法作为主要的研究方式。单一的方法自身具有缺点,专家们把两

龙源期刊网 http://www.qikan.com.cn

种或多种方法组合起来研究个人信用风险评估,提高信用风险评估的精度。

3.1 专家判别法

商业银行最初进行信用风险评估采用的主要方法是专家判别法,常见的还有3C分析法,后来发展为5C分析法,其评价指标为品德(Character)、能力(Capacity)、抵押担保(Collateral)、个人条件(Condition)和资本(Capital)。

专家判别法主要是以定性为主,操作简单,但过于依赖行业专家及信贷从业人员的经验,具有较强的主观色彩。

3.2 统计学方法

3.2.1 判别分析法。线性判别分析法通过确定“信用正常”和“信用异常”两类客户的几何中心构建相应的线性判别函数,以对个人信贷客户进行分类。该方法的思路如下。

假设样本A由“信用正常”的好客户G和“信用异常”的坏客户B组成,则[AG]和[AB]分别表示样本中的“好”“坏”客户。用[PG]和[PB]分别表示样本中“好”客户和“坏”客户占的比例;[L]表示把一个“好”客户错分为“坏”客户造成的平均利润损失;[D]表示把一个“坏”客户错分为“好”客户带来的损失;[px|G]、[px|B]分别表示“好”“坏”客户的特征向量,取值为[x]的概率密度;[qG|x]、[qB|x]分别表示取[x]时一个“好”“坏”客户的概率;[qG|x]正比[px|GpG],[qB|x]正比[px|BpB]。为了减少错分,可以通过以下公式使期望损失达到最小化:

龙源期刊网 http://www.qikan.com.cn

[min Loss=Lx∈AGpx|GpGdx+Dx∈ABpx|BpBdx]

[=Lx∈AGqG|xdx+DqB|xdx] (3)

由于[px|GpGpx|BpB=qG|xqB|x],则可以求出式子(3)的最优解,即借贷者总体中的“坏”客户[AB]的数量为:

[AB=x|qG|xqB|x

3.2.2 线性回归法。把一般的线性回归模型运用到个人信用风险评估时可以这样来描述,假设某个借贷者的违约概率[p]与申请者的特征变量存在着如下关系:

[P=ω0+ω1X1+ω2X2+…+ωmXm+ε] (5)

式(5)中,[ε]是随机扰动项。我们可以利用样本数据对参数[ωi](i=1,2,… ,m)i和m进行估计,然后再估计出违约概率[p]的值。

3.2.3 Logistic回归法。先定义“信用正常”和“信用异常”样本,则[y=1]表示到期后违约状态,[y=0]表示按期偿还状态,主要是对违约概率[p]预测的研究。利用已有的样本数据建立如式(6)所示的Logistic回归模型:

[logp1-p=β0+β1X1+β2X2+…βkXk] (6)

其中,[p]表示[y=1],即“坏”贷款的概率;Xi(i=1,2,… ,k) 表示与违约概

龙源期刊网 http://www.qikan.com.cn

率有关的指标;[p1-p]被称为“发生比”。

可以用已有的样本对模型中的[βi]进行估计,对模型进行相关性检验。根据估测出来的[βi]得到较为稳定、预测精度较高的模型,把新的借款者的相关指标数据带入得到违约发生比,即可得到新的借款者的违约概率,最后考虑是否借贷给客户。

3.2.4 运筹规划方法。在运筹规划方法上利用数据挖掘技术扩展了线性规划模型,得到信用数据分类的多准则线性规划模型,模型的基本形式是:

[Mind+α+d-αp]

Subject to

[α∗+iαi=d-α-d+α]

[β∗-iβi=d-β-d+β]

[AiX=b+αi-βi,Ai∈G]

[AiX=b-αi+βi,Ai∈B] (7)

其中,[Ai]和[b]是常数;[αi]是错分样本点偏离分界面的距离;[βi]是正确分类样本点到分界面的距离;[d-α]和[d+β]是负、正偏差变量,且满足[d+α]和[d-β≥0];[α∗]和[β∗]是目标值。通过求得距离的和与目标偏离最小,解得最优的分类平面。

龙源期刊网 http://www.qikan.com.cn

3.2.5 决策树方法。设总样本[S]是样本数据的集合,指标属性具有[m]个不同类[Cii=1,…,m],[Si]是类[Ci]中的样本数。对一个给定的样本数分类的期望式子为:

[IS1,S2,…,Sm=-i=1mpilog2pi] (8)

式中,[pi]是任意样本属于[Ci]的概率,可以用[sis]来估计。

设属性[A]具有[v]个不同的值[a1,a2,…,av],可以用属性[A]将[S]划分为[v]个子集[Si,S2,…,Sv],包括[Sj]中这样一些样本,在[A]上的值为[aj]。设[Sij]是[Sj]中类[Ci]的样本数。由[A]划分成子集为:

[EA=i=1vS1j+…+SmjSIS1j,…,Smj] (9)

式中,[S1j+…+SmjS]充当第[j]个子集的权,等于子集中的样本与[S]中样本总数的比值。熵值越小,子集划分的精度就越高。对给定的子集[Sj]有如下表达:

[IS1j,…,Smj=-i=1mpijlog2pij] (10)

其中,[pij=SijSj],是[Sj]中样本属于[Ci]的概率。

在[A]上分枝将获得的信息增益是:

[GainA=IS1,S2,…,Sm-EA] (11)

龙源期刊网 http://www.qikan.com.cn

先分析影响信用的指标,然后将指标分为不同的属性,计算这些属性的信息增益值,下一步计算每个属性的熵值。通过计算属性的每个样本值在属性类别的分布及每个分布期望信息,得到属性的重要程度。最后计算属性的风险度量值,以给顾客进行评分,并对模型进行预测。

3.2.6 贝叶斯方法。本小节讲述引入“稀疏学习”在信用风险评估中的贝叶斯方法。稀疏学习的一般描述是:

[y=Dx+v] (12)

其中,[D]为[N×M]的感知矩阵;[y]为[N×1]维矩阵;[x]为[M]维待求解向量;[v]为噪声。通过一定的算法将[x]变为稀疏的。

求得(12)中的解向量[x]。对于一个测试样本[T],可以计算出观测值(自变量或者属性值)[A=a1,a2,…,aM]与因变量[r]之间的关系表达式:

[r=Ax=i=1Maixi] (13)

式中,[ai]是测试样本的第[i]个属性值;[r]是一个实数。在稀疏模型中,分别用1和-1表示正负类的标签,将正数和0映射为1,负数映射为-1,即:

[LabelT=signr=signi=1Maixi] (14)

其中,[signr]表示取数值[r]的符号,即:

龙源期刊网 http://www.qikan.com.cn

[ signr=1 , r≥0-1 , r

输入[N]个训练样本构成的训练集[D,y],则[DD1,D2,…,DNT∈RN×M]为训练样本的矩阵,[y=y1,y2,…,yN∈-1,1N×1]为样本的类标签构成的向量,测试样本[T]的向量为[A=a1,a2,…,aM];输出测试样本的类标签[LabelT]。具体步骤如下:先将训练样本属性矩阵[D]按列进行归一化处理,然后根据上述求解得到最优解向量[x]和测试样本类标签[LabelT]。

3.3 人工智能方法

3.3.1 神经网络。神经网络具有自组织性、自适应及较强的稳健性的优点,能够很好地用于个人信用风险评估。目前,神经网络模型的类型已经有不下十种方法,相较而言,BP神经网络的使用更成熟。

在个人信用风险评估中,BP神经网络模型的具体作用步骤如下。首先,将个人信用评价指标体系的信息作为神经网络的输入向量[R=r1,r2,…,rn];然后,将信用等级作为神经网络的输出[O];最后,利用样本,使不同的输入向量得到不同的输出值,则神经网络所持有的权重值为[wij],阈值就是神经网络经过自适应学习所得到的正确内部表示。若神经网络训练完毕,可以作为个人信用评价的工具,对不同的评估对象作出相应判断。

3.3.2 支持向量机(SVM)。支持向量机是一种二类分类模型,其模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使其有别于感知机。

龙源期刊网 http://www.qikan.com.cn

在个人信用风险评估问题中,对历史样本数据进行预处理,然后构建具有该函数的主持向量机模型,优化支持向量机模型参数;初始化样本个体的位置和速度,更新样本数据的位置和速度,直到输出全局最优样本,将最优样本个体分解为支持向量机模型的参数,完成模型训练,最后将支持向量机模型用于新样本的辨别,比较样本的误判率。支持向量机的评分精度较高,预测能力也强,且受变量限制少,具有很强的泛化能力。

3.4 组合模型

由于单一模型各有各的优势,因此学者们开始对组合模型进行研究。近年来,国内用组合的方法对个人信用风险评估进行研究,且取得了不少成果。Logistic回归和神经网络组合、K均值和支持向量机、BP神经网络和支持向量机等。在实际应用中,可以选择合适的组合模型来提高预测的精度和稳定性。

4 结论

对个人信用风险评估模型的发展进行了梳理总结,阐明了个人信用风险评估模型由传统评判方法和统计学方法到人工智能方法,由单一模型到组合模型的演变。

随着我国征信体系的不断完善,商业银行在进行个人信用风险评估模型开发时,可供选择的指标会越来越多,这些指标及衍生的指标会导致信用评估模型的训练时间冗长,无关指标和交叉指标还会降低模型的预测效果,因此对信用指标的选取有了更高的要求。我国信用评估的发展还不够成熟,样本数据难以获取,各银行的数据还没能实现共享,存在信息不平衡的问题。因此,还须寻找更加优秀的信用评分模型。

龙源期刊网 http://www.qikan.com.cn

参考文献:

[1]Durand D.Risk Elements in consumer Installment financing[M].New York:National Bureau of Economic Research,1941.

[2] YE Orgler.A credit scoring model for commercial loans[J].Journal of Money Credit & Banking,1970(4):435-445.

[3] JC Wiginton.A note on the comparison of logit and discriminant models of consumer credit behavior[J].Journal of Financial and Quantitative Analysis,1980(3):757-770.

[4]P Makowski.Credit scoring branches out[J].Credit Wbrld,1985(75):30-37.

[5]C Carter,J Catlett. Assessing credit card application using machine learning[J].IEEE Expert,1987(3):71-79.

[6]TS Lee, CC Chiu,YC Chou,et al.Mining the customer credit using classification and regression tree and multivariate adaptive regression splines [J].Computational Statistics & DataAnalysis,2006(4):1113-1130.

[7] S Chatterjee, S Barcun. A Nonparametric Approach to Credit Screening[J]. Publications of the American Statistical Association,1970(329):

龙源期刊网 http://www.qikan.com.cn

150-154.

[8] Hand D J. Discrimination and Classification[J]. Journal of the Royal Statistical Society Series A (General),1982(4):428.

[9] NC Hsieh, LP Hung. A data driven ensemble classifier for credit scoring analysis[J].Expert Systems with Applications,2010(1):534-545.

[10]M Odom, R Sharda. A neural network model for bankruptcy prediction[C]// IEEE .Proceedings of the international joint conference on neural networks. Alamitos,1990.

[11]TC Fogarty,NS Ireson. Evolving Bayesian classifiers for credit control-comparison with other machine-learning methods[J]. Ima Journal of Management Mathematics,1993(1):63-75.

[12]Z Michalewicz. Evolutionary Algorithms for Constrained Parameter Optimization Problems[J]. Evolutionary computation,1 996(1):l-32.

[13]Baesens B,Van Gestel T’Viaene S,et a1.Benchmarking state-of-the-art classification algorithms for credit scoring: An update of research[J].Journal of the Operational Research Society,2003(1):627-635.

[14]石庆焱.一个基于神经网络——Logistic回归的混合两阶段个人信用评分模型

龙源期刊网 http://www.qikan.com.cn

研究[J].统计研究,2005(5):45-49.

[15]姜明辉,袁绪川,冯玉强.PSO-SVM模型的构建与应用[J].哈尔滨工业大学学报,2009(2):169,171.

[16]向晖,杨胜刚.基于多分类器组合的个人信用评估模型[J].湖南大学学报,20l1(3):30-33.

[17]高尚,刘夫成.与k均值混合的支持向量机的个人信用评估[J].中南大学学报,2013(S2):169-173.

[18]杨胜刚,朱琦,成程.个人信用评估组合模型的构建一基于决策树一神经网络的研究[J].金融论坛,2013(2):57-61.

[19]林汉川,张万军,杨柳.基于大数据的个人信用风险评估关键技术研[J].管理现代化,2016(4):95-97.

龙源期刊网 http://www.qikan.com.cn

龙源期刊网 http://www.qikan.com.cn

龙源期刊网 http://www.qikan.com.cn

龙源期刊网 http://www.qikan.com.cn

因篇幅问题不能全部显示,请点此查看更多更全内容