河南科技
HenanScienceandTechnology
信息技术
个人信用风险评估模型发展研究
谢霖铨赵楠徐浩
(江西理工大学理学院,江西
赣州341000)
摘要:个人信用风险评估是我国商业银行信贷风险管理的重要内容。为了有效识别个人信用风险,规避由
于借款者违约而给商业银行经营带来损失的风险,本文对个人信用风险评估的发展历程以及信用风险研究的模型进行了总结。个人信用风险评估的模型存在一定的缺点,还须进一步完善研究方法,得到更精准的模型,降低风险问题的发生概率。关键词:信用评估;统计学方法;人工智能方法;信用指标体系;组合模型中图分类号:TP391文献标识码:A文章编号:1003-5168(2018)02-0011-04
AnalysisontheDevelopmentofPersonalCreditRiskAssessmentModel
XIELinquan
ZHAONan
XUHao
(SchoolofScience,JiangxiUniversityofScienceandTechnology,GanzhouJiangxi341000)
Abstract:Personalcreditriskassessmentisanimportantcontentofourcountrycommercialbankcreditriskmanagement,inordertoeffectivelyidentifyindividualcreditrisk,avoidbecauseborrowersdefaultandbringtheriskoflosstocommercialbanks,inthispaper,thedevelopmentofpersonalcreditriskassess⁃mentandcreditriskmodelsofresearchweresummarized.Therearesomeshortcomingsinthemodelofpersonalcreditriskassessment,andweneedtofurtherimprovetheresearchmethod,getmoreaccuratemodelsandreducetheoccurrenceprobabilityofriskproblems.Keywords:creditevaluation;statisticalmethod;artificialintelligencemethod;creditindexsystem;portfoliomodel
随着我国经济的快速发展,住房按揭、汽车贷款、商业贷款、教育贷款和信用卡消费等各种信用贷款的规模迅速扩大,信用消费也逐渐占据人们的生活。个人信贷作为银行正常运行的主要资产业务,对银行的未来发展具有较大影响。随着金融业的快速发展,银行信贷中的信用风险问题逐渐显现出来,如何加强信用风险的防范变得尤为重要;贷款系统中客户的资源信息增加,如何有效识别借贷者并预测其未来贷款偿还的意愿,降低借贷者违约事件的发生概率,已经成为当前银行业以及金融机构亟须解决的问题。
1
信用风险的内涵及研究现状
失的风险。从商业银行的视角来看,信用风险源于信贷风险,是借贷或交易承诺、资金使用以及资金偿还等各个环节所面临风险与市场风险相结合的结果。
1.2信用评估的研究现状自20世纪40年代以来,个人信用风险评估受到了专家学者的关注。个人信用评估的研究从早期的传统方法、统计学方法逐步发展为人工智能方法。
1.2.1统计学方法。DavidDurand[1]把特性划分差异的方法运用在个人信用评估中,以区分贷款好坏。Or⁃[2]
gler把线性回归方法运用到商业银行个人信用风险评估中。Wiginton[3]最先把Logistic回归应用于信用评估的中。Makowski[4],Carter和Catlett[5],Lee[6]把决策树方法运用在信用风险评估中,且取得了满意的成果。Chatterjee和Barcun[7]最先将最近邻方法应用于个人信用风险评估
1.1信用风险的内涵
信用风险是指借贷者因信用违约而给放贷者造成损收稿日期:2018-01-01
基金项目:国家自然科学基金资助项目(61762047)。
作者简介:赵楠(1992—),女,硕士,研究方向:数据挖掘方面。
通讯作者:谢霖铨(1962—),男,博士,江西理工大学理学院教授,研究生导师,研究方向:数据挖掘、机器学习、粗糙集理论及其应用、概念格。
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.·12·
个人信用风险评估模型的发展研究
第1期
中。Hand[8]用最近邻方法和决策树方法来识别贷款风险,结果显示:最近邻方法有更高的预测精度。Hsieh[9]的研究表明,贝叶斯网络能直观地表示属性和概率之间的关系,具有较好的解释性。
1.2.2Odom
[10]
分,将其划分为i个栏位,然后根据违约和非违约样本将Nib,第i栏位中的样本划分为Niy、违约样本和非违约样Nb,本分别有Ny、那么在该栏位的应该表示为:
NiyNy
Log(Odd)i=
NibNb
人工智能算法。20世纪90年代以后,人工智
(2)
能算法成为个人信用风险评估研究的主要方法。
最先把神经网络的方法用于个人信用评估中。
[11]
根据公式得到结果,对这些结果进行分析,若Log(Odd)i的值呈单调性,说明该指标有较强的识别能
Fogarty和Ierson最先将遗传算法应用到个人信用评分
中。而Michalewicz和Obas等[12]运用遗传算法对个人信用风险评估进行了更进一步的探讨。Baesens和Gestei[13]最早对信用评估使用支持向量机,结果表明:支持向量机明显优于线性回归和神经网络方法。
1.2.3
组合方法。石庆焱[14]利用Logistic回归和神
经网络对个人信用风险进行评估,组合模型具有更高的精度和稳定性,且对特征变量有较好的解释性。姜明辉等[15]通过改进的PSO算法对SVM中的参数进行优化,提高了模型的分类精度,有效降低了第二类错误率。向晖等[16]将判别分析、决策树等七种方法组合起来对信用进行评估,结果表明:组合模型能有效提高预测精度及稳定性。高尚等[17]将K-means和支持向量机结合起来,得到分类结果和具体的信用度,还有效提高了模型的预测精度。杨胜刚等[18]把决策树BP神经网络相结合,不仅增强了神经网络的可解释性,还提高了模型的预测精度和稳定性。林汉川[19]等提出将Logistic回归和随机森林组合起来运用到个人信用风险评估中。
2
信用评估指标体系分析
力;反之,则指标的识别能力较弱。
3
个人信用评估方法的发展
个人信用风险评估方法由定性转变为定量研究,早期信用评估以单一的统计方法为主,后来以非统计学方法作为主要的研究方式。单一的方法自身具有缺点,专家们把两种或多种方法组合起来研究个人信用风险评估,提高信用风险评估的精度。
3.1
专家判别法
商业银行最初进行信用风险评估采用的主要方法是专家判别法,常见的还有3C分析法,后来发展为5C分析法,其评价指标为品德(Character)、能力(Capacity)、抵押担保(Collateral)、个人条件(Condition)和资本(Capital)。
专家判别法主要是以定性为主,操作简单,但过于依赖行业专家及信贷从业人员的经验,具有较强的主观色彩。
3.23.2.1
统计学方法
判别分析法。线性判别分析法通过确定“信
用正常”和“信用异常”两类客户的几何中心构建相应的线性判别函数,以对个人信贷客户进行分类。该方法的思路如下。
假设样本A由“信用正常”的好客户G和“信用异常”的坏客户B组成,则AG和AB分别表示样本中的“好”“坏”客户。用PG和PB分别表示样本中“好”客户和“坏”L表示把一个客户占的比例;“好”客户错分为“坏”客户
一般评估指标的识别能力采用以下3种方法。2.1
T检验
T检验,判别评估指标数据在“信用正常”样本和“信用异常”样本中的均值是否相等,通过P值来判别评估指标的识别能力。
假设样本数据近似服从正态分布,其统计量为:
ˉt=D(1)Snˉ为平均差,DS为样本方差。式(1)中,对评估指标进行独立样本T检验,取置信水平α为0.05。若P值小于给定的α,说明评估指标识别能力较强;反之,则识别能力弱。
2.2
Wald检验
Wald检验可以解决T检验中评估指标数据不服从正态分布的问题。Wald检验的目的是判别非正态分布的评价指标数据在违约样本和非违约样本中的均值是否相等,对信用风险是否具有较好的识别能力,其识别过程类似于T检验。
2.3
Log(Odds)判别
Log(Odds)判别方法,首先对评估指标进行分栏划
造成的平均利润损失;D表示把一个“坏”客户错分为“好”客户带来的损失;p(x|G)、p(x|B)分别表示“好”“坏”客户的特征向量,取值为x的概率密度;q(G|x)、q(B|x)分别表示取x时一个“好”“坏”客户的概率;q(G|x)正比可以通p(x|G)pG,q(B|x)正比p(x|B)pB。为了减少错分,过以下公式使期望损失达到最小化:
minLoss=L=L
x∈AG
∫
p(x|G)pGdx+D
x∈AB
∫
p(x|B)pBdx
x∈AG
∫q(G|x)dx+D∫q(B|x)dx
(3)
由于p(x|G)pGp(x|B)pB=q(G|x)q(B|x),则可以求出式子(3)的最优解,即借贷者总体中的“坏”客户AB的数量为:
AB=x|q(G|x)q(B|x)
3.2.2线性回归法。把一般的线性回归模型运用到
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.第1期
个人信用风险评估模型的发展研究
·13·
个人信用风险评估时可以这样来描述,假设某个借贷者的违约概率p与申请者的特征变量存在着如下关系:
P=ω0+ω1X1+ω2X2+…+ωmXm+ε
(5)
ε是随机扰动项。我们可以利用样本数据式(5)中,
对参数ωi(i=1,2,…,m)i和m进行估计,然后再估计出违约概率p的值。
3.2.3
Logistic回归法。先定义“信用正常”和“信用
y=0表示按期异常”样本,则y=1表示到期后违约状态,
数。由A划分成子集为:
v
S1j+…+Smj
E(A)=∑I(S1j,…,Smj)(9)
Si=1
S1j+…+Smj
式中,充当第j个子集的权,等于子集
S中的样本与S中样本总数的比值。熵值越小,子集划分的精度就越高。对给定的子集Sj有如下表达:
I(S1j,…,Smj)=-∑pijlog2(pij)i=1m
(10)
偿还状态,主要是对违约概率p预测的研究。利用已有的样本数据建立如式(6)所示的Logistic回归模型:
æpö
logç÷=β0+β1X1+β2X2+…βkXk
1-pèø
其中,pij=SijSj,是Sj中样本属于Ci的概率。在A上分枝将获得的信息增益是:
Gain(A)=I(S1,S2,…,Sm)-E(A)(6)
(11)
先分析影响信用的指标,然后将指标分为不同的属性,计算这些属性的信息增益值,下一步计算每个属性的熵值。通过计算属性的每个样本值在属性类别的分布及每个分布期望信息,得到属性的重要程度。最后计算属性的风险度量值,以给顾客进行评分,并对模型进行预测。
3.2.6
贝叶斯方法。本小节讲述引入“稀疏学习”在
y=Dx+v
其中,p表示y=1,即“坏”贷款的概率;X()ii=1,2,…,k表示与违约概率有关的指标;p1-p被称为“发生比”。
可以用已有的样本对模型中的βi进行估计,对模型进行相关性检验。根据估测出来的βi得到较为稳定、预测精度较高的模型,把新的借款者的相关指标数据带入得到违约发生比,即可得到新的借款者的违约概率,最后考虑是否借贷给客户。
3.2.4
运筹规划方法。在运筹规划方法上利用数据
挖掘技术扩展了线性规划模型,得到信用数据分类的多准则线性规划模型,模型的基本形式是:
-Min(d+α+dα)p
信用风险评估中的贝叶斯方法。稀疏学习的一般描述是:
(12)
D为N×M的感知矩阵;y为N×1维矩阵;x其中,
v为噪声。通过一定的算法将x变为M维待求解向量;
为稀疏的。
求得(12)中的解向量x。对于一个测试样本T,可以计算出观测值(自变量或者属性值)A=(a1,a2,…,aM)与因变量r之间的关系表达式:
r=Ax=∑aixi
i=1M
Subjecttoα+∑αi=d-d
∗
-α
ii
+
α
(13)
+
β∗-∑βi=d-β-dβ
式中,ai是测试样本的第i个属性值;r是一个实数。在稀疏模型中,分别用1和-1表示正负类的标签,将
(7)
-α
+
β
AiX=b+αi-βi,Ai∈GAiX=b-αi+βi,Ai∈B
αi是错分样本点偏离分界面其中,Ai和b是常数;
d和d的距离;βi是正确分类样本点到分界面的距离;
-α∗和β∗是目标是负、正偏差变量,且满足d+α和dβ≥0;
正数和0映射为1,负数映射为-1,即:
æMö
Label(T)=sign(r)=signç∑aixi÷èi=1ø
sign(r)表示取数值r的符号,其中,即:
sign(r)=
≥0
{1,r-1,r<0
(14)
值。通过求得距离的和与目标偏离最小,解得最优的分类平面。
3.2.5
决策树方法。设总样本S是样本数据的集
Si是类Ci合,指标属性具有m个不同类Ci(i=1,…,m),
(15)
输入N个训练样本构成的训练集{D,y},则D[D1,D2,…,DN]∈RN×M为训练样本的矩阵,
T
中的样本数。对一个给定的样本数分类的期望式子为:
I(S1,S2,…,Sm)=-∑pilog2(pi)i=1m
y=[y1,y2,…,yN]∈{-1,1}N×1
为样本的类标签构成的向量,
(8)
测试样本T的向量为A=[a1,a2,…,aM];输出测试样本的类标签Label(T)。具体步骤如下:先将训练样本属性矩阵D按列进行归一化处理,然后根据上述求解得到最优解向量x和测试样本类标签Label(T)。
3.33.3.1
人工智能方法
神经网络。神经网络具有自组织性、自适应
式中,pi是任意样本属于Ci的概率,可以用sis来估计。
设属性A具有v个不同的值(a1,a2,…,av),可以用属性A将S划分为v个子集(Si,S2,…,Sv),包括Sj中这样一些样本,在A上的值为aj。设Sij是Sj中类Ci的样本
及较强的稳健性的优点,能够很好地用于个人信用风险
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.·14·
个人信用风险评估模型的发展研究
1941.
第1期
评估。目前,神经网络模型的类型已经有不下十种方法,相较而言,BP神经网络的使用更成熟。
在个人信用风险评估中,BP神经网络模型的具体作用步骤如下。首先,将个人信用评价指标体系的信息作然后,将信用等为神经网络的输入向量R=(r1,r2,…,rn);
级作为神经网络的输出O;最后,利用样本,使不同的输入向量得到不同的输出值,则神经网络所持有的权重值阈值就是神经网络经过自适应学习所得到的正确为wij,
内部表示。若神经网络训练完毕,可以作为个人信用评价的工具,对不同的评估对象作出相应判断。
3.3.2
支持向量机(SVM)。支持向量机是一种二类
分类模型,其模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使其有别于感知机。
在个人信用风险评估问题中,对历史样本数据进行预处理,然后构建具有该函数的主持向量机模型,优化支持向量机模型参数;初始化样本个体的位置和速度,更新样本数据的位置和速度,直到输出全局最优样本,将最优样本个体分解为支持向量机模型的参数,完成模型训练,最后将支持向量机模型用于新样本的辨别,比较样本的误判率。支持向量机的评分精度较高,预测能力也强,且受变量限制少,具有很强的泛化能力。
3.4
组合模型
由于单一模型各有各的优势,因此学者们开始对组合模型进行研究。近年来,国内用组合的方法对个人信用风险评估进行研究,且取得了不少成果。Logistic回归和神经网络组合、K均值和支持向量机、BP神经网络和支持向量机等。在实际应用中,可以选择合适的组合模型来提高预测的精度和稳定性。
4结论
对个人信用风险评估模型的发展进行了梳理总结,阐明了个人信用风险评估模型由传统评判方法和统计学方法到人工智能方法,由单一模型到组合模型的演变。
随着我国征信体系的不断完善,商业银行在进行个人信用风险评估模型开发时,可供选择的指标会越来越多,这些指标及衍生的指标会导致信用评估模型的训练时间冗长,无关指标和交叉指标还会降低模型的预测效果,因此对信用指标的选取有了更高的要求。我国信用评估的发展还不够成熟,样本数据难以获取,各银行的数据还没能实现共享,存在信息不平衡的问题。因此,还须寻找更加优秀的信用评分模型。
参考文献:
[1]DurandD.RiskElementsinconsumerInstallmentfi⁃nancing[M].NewYork:NationalBureauofEconomicResearch,
[2]YEOrgler.Acreditscoringmodelforcommercialloans[J].JournalofMoneyCredit&Banking,1970(4):435-445.
[3]JCWiginton.Anoteonthecomparisonoflogitanddiscriminantmodelsofconsumercreditbehavior[J].JournalofFinancialandQuantitativeAnalysis,1980(3):757-770.
[4]PMakowski.Creditscoringbranchesout[J].CreditWbrld,1985(75):30-37.
[5]CCarter,JCatlett.Assessingcreditcardapplicationusingmachinelearning[J].IEEEExpert,1987(3):71-79.
[6]TSLee,CCChiu,YCChou,etal.Miningthecustom⁃ercreditusingclassificationandregressiontreeandmultivari⁃ateadaptiveregressionsplines[J].ComputationalStatistics&DataAnalysis,2006(4):1113-1130.
[7]SChatterjee,SBarcun.ANonparametricApproachtoCreditScreening[J].PublicationsoftheAmericanStatisti⁃calAssociation,1970(329):150-154.
[8]HandDJ.DiscriminationandClassification[J].Jour⁃naloftheRoyalStatisticalSocietySeriesA(General),1982(4):428.
[9]NCHsieh,LPHung.Adatadrivenensembleclassi⁃fierforcreditscoringanalysis[J].ExpertSystemswithApplica⁃tions,2010(1):534-545.
[10]MOdom,RSharda.Aneuralnetworkmodelforbankruptcyprediction[C]//IEEE.Proceedingsoftheinterna⁃tionaljointconferenceonneuralnetworks.Alamitos,1990.
[11]TCFogarty,NSIreson.EvolvingBayesianclassifiersforcreditcontrol-comparisonwithothermachine-learning.ImaJournalofManagementMathematics,1993methods[J](1):63-75.
[12]ZMichalewicz.EvolutionaryAlgorithmsforCon⁃strainedParameterOptimizationProblems[J].Evolutionarycomputation,1996(1):l-32.
[13]BaesensB,VanGestelT’ViaeneS,eta1.Benchmark⁃ingstate-of-the-artclassificationalgorithmsforcreditscoring:Anupdateofresearch[J].JournaloftheOperationalResearchSociety,2003(1):627-635.
[14]石庆焱.一个基于神经网络——Logistic回归的混合两阶段个人信用评分模型研究[J].统计研究,2005(5):45-49.
[15]姜明辉,袁绪川,冯玉强.PSO-SVM模型的构建与应用[J].哈尔滨工业大学学报,2009(2):169,171.
[16]向晖,杨胜刚.基于多分类器组合的个人信用评估模型[J].湖南大学学报,20l1(3):30-33.
[17]高尚,刘夫成.与k均值混合的支持向量机的个人信用评估[J].中南大学学报,2013(S2):169-173.
[18]杨胜刚,朱琦,成程.个人信用评估组合模型的构建一基于决策树一神经网络的研究[J].金融论坛,2013(2):57-61.
[19]林汉川,张万军,杨柳.基于大数据的个人信用风险评估关键技术研[J].管理现代化,2016(4):95-97.
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.
因篇幅问题不能全部显示,请点此查看更多更全内容