基于Logistic模型的商业银行个人消费信贷风险评估研究
2022-04-13
来源:爱问旅游网
【问题探讨】 基于Logistic模型的商业银行 个人消 费信贷风险评估研究 张国政。陈维煌。刘呈辉 (湖南农业大学商学院,湖南长沙410128) 摘要:在消费者“贷款消费”意识不断增强的今天,伴随而来的风险问题也不断显现出来,特别是 个人信用风险首当其冲。基于商业银行个人消费信贷的实际操作数据和Logistic回归模型,利 用SPSS17.0统计软件构建个人信用评分模型。通过实证,测得借款人的年龄、婚姻状况、受教育 程度等六项指标是影响个人信用风险的关键因素。最后,提出了防范个人消费贷款风险的相关 建议。 关键词:个人消费信贷;信用评分;风险评估;Logistic回归 文章编号:1003—4625(2015)o3—0053—05 中图分类号:F832.479 文献标识码:A Abstract:In recent years,consumers of“consumer loans”growing awareness,and the risk has become increasingly,the mainly problems is personal credit risk.In this paper,based on the actual operation data of personal consumption credit of commercial bank and the Logistic regression model,By using the statistical software SPSS17.0 to constructed the personal credit measurement mode1.After empirical, measured the borrower’S age,marital status,level of education,etc are the key factors influencing the personal credit risk.Finally,this article also puts forward the preventing the risks of personal consump- tion loans. Key words:consumer credit;credit ratings;risk assessment;Logistic regression 一、引言 情况下,个人信贷风险凸现,银行个人信贷中的不良 随着中国经济的快速发展,国民消费能力的不 资产率上升 1。从我国四大国有商业银行的情况来 断提高,各种形式的信用消费规模迅速扩大,各商业 看,个人消费贷款的不良率维持在2%一3%左右,一 银行都将个人消费信贷视为自身的优质资产和未来 直高于国际1%左右的平均水平,可见我国缺乏科学 发展的重点。个人消费信贷是国家为了刺激和提高 的个人消费贷款信用风险评估体系。 消费者对耐用消费品的消费需求,在居民现有的收 个人信用评分主要针对个人借贷违约可能性的 入水平下,通过金融机构抵押、保证、担保、信用等方 预测,以被评估者相关指标的历史数据为依据,运用 式,向个人消费者提供的信用贷款。个人消费贷款 统计方法对被评估者的还贷能力和违约行为进行预 用途多样,几乎涵盖居民生活的各个方面,贷款灵 测和分析。其目的在于得出借款人在未来特定时间 活,使用方便。此外,消费贷款的出现也有利于银行 内违约的可能性,将贷款申请者的信用级别分类,对 资产业务的多元化,但消费贷款仍不可避免作为一 信用评估者的潜在违约行为做出预测,为信贷决策 种借贷行为面临种种风险。我国个人消费贷款业务 提供依据。 起步较晚,呈现出起步晚、发展快、发展不平衡,个人 经过一个多世纪的发展,国外对于个人信用风 住房贷款占绝对比例,信用卡、助学贷款违约率高等 险评估技术的研究已经相当成熟。沃格勒(1970)首 特点。随着个人信用消费的不断扩大,消费信贷的 次将线性回归模型引入个人消费贷款风险评估研究【2]。 比重不断提高,在整个市场个人信用制度不完善的 同时,洛克(1984) 、奥德格莱(1987) 等国外学者也 收稿日期:2014—12—22 基金项目:本文为2012国家社科青年基金(12CGL046);2012年度教育部人文社科青年基金(12YJC790259)。 作者简介:张国政(I976一),男,湖北浠水人,湖南农业大学商学院副教授,博士,硕士生导师,研究方向:投资风险控制;陈维煌 (1989一),女,湖南常德人,湖南农业大学研究生,研究方向:投资风险控制;刘呈辉(199o__),男,湖南涟源人,湖南农业大学研 究生,研究方向:投资风险控制。 2015年第3期(总第428期) 53 金融理论与实践 【问题探讨】 曾先后使用线性回归法、判别分析法、LR模型、神经 网络法对个人信用进行评分。国内的研究起步相对 较晚,曹鹏(2008)提出商业银行防范个人消费信贷 之比。 所以: ln(odds)=Logit(P)=po+p1 Xl'[-82 x2+…+Bk xk+£ 风险的具体方法有:主观判断法、消费贷款计分法、 收入水平微观模拟法 。陈春香(2009)认为我国个 则当xi增加一个单位: ln(odds/x +t)=In(odds/x,)+B ln(odds/xj+】)-In(odds&。)=Bi ・.. 人消费贷款的风险主要有信用风险、银行操作风险、 合作方风险、保证风险和市场风险 。张成虎、李育 林(2008) ̄用BP神经网络算法建立了个人信用评 n l 分模型,其研究结果表明:BP神经网络预测精确度 较高并且有较强的判别预测能力,但稳健性较差 。 周黎(2012)提出把保险和个人消费信贷结合起来, 当出现不良贷款时,保险公司就要给商业银行支付 笔赔偿金,这样可以减少银行损失,又可以推动保 一由此,可以得到逻辑回归关于P{Y=llx}的预 测。通常以0.5为界,若P的估计值大于0.5,Y取1; 若P的估计值小于O.5,则Y取0。 3.极大似然估计 设Y是0—1变量,X。,X:,…,Xk是与Y相关的自 险业的发展 。 变量,n组观测数据为x X∞…,X y。)(i=1,2,…,n), 国内外专家学者有关个人消费贷款及其风险研 则Y ,Y ,…,y 的似然函数为: 究对个人信用风险评估的实际应用起到了重要的参 L=Ⅱp(yi)=Ⅱp(xi) [1一p(X1)】卜 考作用。但是,从国内的研究来看,在个人信用评分 上还缺乏一个比较成熟全面的评估机制,中国目前 等式两边同时取自然对数: 还没有制定出一套规范的个人信用评分指标体系和 InL= 方法,各种信用评分模型还未真正普及到个人消费 EEy 0+ xI1+B2x谊+…Gkx|k)一In(1+e 。 。 … 瞄 )] 贷款风险评估体系中,用传统的风险评价方法进行 等式两边分别对p。,p ,p ,…,8 求偏导数, 个人信贷风险管理评估很难达到满意的效果 。因 得到p。,p ,8。,…,p 此,本文通过对比分析以及构造回归分析的统计学 使得似然函数的取值最大,。,B , 。,…,B 。 方法,结合某商业银行提供的个人消费贷款数据,对 的估计值6(二)构建评分模型 数据进行统计处理,得出个人信用中的关键指标和 1.候选指标 套较为科学的信用评分方法,并提出防范个人消 在个人消费贷款中,我们把因变量Y定义为: 费信贷风险的具体措施,以期为我国商业银行个人 Y=I违约客户,Y=0非违约客户,在模型中,如果某 消费贷款的风险管理提供一点借鉴。 5,则该客户被认为是 二、基于Logistic回归方法的个人信用评分模 客户得到的P的估计值大于0.违约客户,即Y=I,反之则Y=0。调查中发现,商业 型构建 银行在进行客户的贷款申请录入时,比较重视借款 (一)Logistic回归模型原理介绍 Logistic回归模型是研究因变量非连续型变量 人的基本情况有:年龄、婚姻状况、受教育程度、个人 情况的分析模型。其中,解决这个问题的核心方法 月收入等基本信息。为构建信用评分模型,通过调 查得到了长沙市某国有大型商业银行200个个人消 称为极大似然估计法㈣: 费贷款相关数据,剔除一些由于操作人员失误而明 1.建立一般线性模型 显错误的数据,例如月收入的银行流水反映的情况 E(Y)=p0+B1 Xl4'-B2 X2+…+pk Xk 大大少于其每月还款额,得到198个有效数据。其 对于0—1变量Y(此处为Y取0或者1), 中履约客户数为117,违约客户数为81。候选指标 E(Y)=P(Y=1)=P 包括年龄、婚姻状况、受教育程度、个人月收入、职 P=Bo+p1Xl+p2x2+…+pk Xk+£ 务、贷款年限、贷款金额、还款方式、担保方式,共9个。 2.为简化模型,对P进行Log-it变换 2.变量指标初步筛选 Logit(P)=ln(P/1一P)=po+B1 Xi+82 X2+…+Bk xk+£ 在应用统计学中,通常用交叉表来初步分析自 P= 变量和因变量的关联性,下面将使用该工具进行初 1+epo B1Xl-- … 一1+e 。 plXl+口2X2+-., ) 步统计,计算优势(odds)。 优势=。dds=丁 是事件发生与不发生的概率 如表1,可以看出,随着年龄的增大,优势比呈 一金融理论与实践 54 2015年第3期(总第428期) 【问题探讨】 现增长趋势,这可能说明年龄越小,个人违约风险越 高,年龄越高,违约风险越低。 表1年龄分布优势 指标项 履约客户 违约客户 履约客户 违约客户 履约客户优势 频数 频数 频率 频率 ≤25岁 26—30 31—35 的贷款。这说明贷款年限越长,违约风险越大。贷 款年限是一个考虑因素。 表5职务优势比 指标项 履约客户 违约客户 履约客户 违约客户 履约客户优势 频数 频数 频率 频率 管理人员 53 职员 36 其他 28 17 40 24 0.757 0.243 0.474 0.526 0.538 0.462 3.12 0.90 1.16 2 1l 17 5 l1 13 0.286 0.5 0.567 0.714 0.5 0.433 0.40 1.00 1-31 36—40 4 1-45 46—5O 33 18 20 2l l2 13 0.6l1 0.6 0.606 0.389 0.4 0.394 1.57 1.5 1.54 合计 ll7 81 0.591 0.409 1.44 表6贷款年限优势比 指标项 履约客户 违约客户 履约客户 违约客户 履约客户优势 50以上 16 6 0.727 0.273 2.66 合计 117 81 0.591 0.409 1.44 频数 l~5年 6—10年 频数 频率 频率 39 26 如表2,履约客户的优势已婚客户明显高于未 婚客户。这说明已婚家庭还款风险要小于未婚或者 离异的贷款个人,具有一定的说服能力。 表2婚姻状况优势 指标项 履约客户 违约客户 履约客户 违约客户 履约客户优势 频数 频数 频率 频率 已婚 86 29 0.748 0.252 2.97 未婚 31 52 0.373 0.627 O.60 合计 1l7 8l 0.591 0.4o9 1.44 60 41 0.606 0.394 0.612 0.388 1.54 1.58 1l一15年 16 l6 0.5 0.5 1.0 合计 117 81 0.591 0.409 1.44 如表7,显示的结果并没有显现明显的关系,由 于贷款金额是个人消费信贷风险的重要指标因素, 这可能是因为样本的局限性导致,所以在建模中仍 然将其纳入回归模型。 袁7贷款金额优势 指标项(元) 履约客户 违约客户 履约客户 违约客户 履约客 频数 频数 频率 频率 户优势 ≤10万 22 10万一30万 67 30万一50万 18 50万以上 10 13 55 13 0 0.629 0.549 0.581 1 0.371 0.451 0.419 0 1.70 1.22 1.39 ∞ 如表3,受教育程度的优势比可以看出,受教育 程度越高,个人信用违约风险越小,反之越大,所以 受教育程度是一个重要因素。 表3受教育程度优势 指标项 履约客户 违约客户 履约客户 违约客户 履约客户优势 频数 频数 频率 频率 合计 l17 81 0.591 0.409 1.44 高等教育 85 中等教育 27 初等教育 5 合计 117 21 32 28 81 0.802 0.458 0.152 0.591 0.198 0.542 0.848 0.409 4.05 0.85 0.18 1.44 如表8,结果显示选择等额的还款方式的客户 违约风险要高于等本金还款方式的客户。所以,还 款方式应该纳入回归模型。 表8还款方式优势 指标项 履约客户 违约客户 履约客户 违约客户 履约客户优势 频数 频数 频率 频率 等额 109 74 O.596 0.404 1.48 等本金 8 7 0.533 0.467 1.14 合计 l17 81 0.591 0.409 1.44 如表4,看出个人月收入越高,履约客户的优势 比是增大的趋势,这说明借款人的月收入越高,还款 风险越小。所以,个人月收入是个有说服力的因素。 表4个人月收入优势 指标项(元 履约客户 违约客户 履约客户 违约客户 履约客户优势 频数 频数 频率 频率 ≤3000 3000—8000 8o00~130o0 18 57 18 28 44 6 0.391 0.564 0.75 0.609 0.436 O.25 0.64 1.29 3.o0 因此,在初步筛选中,由于担保方式全部都为抵 押,可判断担保方式可以排除到考虑范围之外。所 以,进入模型的指标为年龄、婚姻状况、受教育程度、 职位、月收入、贷款年限、贷款金额、还款方式。 3.指标进入Logistic回归模型 130o0以上 24 3 0.889 0.111 8.00 合计 l17 81 0.591 0.409 1.44 如表5,明显管理人员的优势比要高于其他职 根据以上的结论,本次模型应该引入年龄、婚姻 状况、受教育程度、个人月收入、职务、贷款年限、贷 情况是应该考虑的情况。 款金额、还款方式这8个指标。 如表6,年限较长的贷款优势比要低于年限短 (1)指标量化。引入模型中的指标,是数值型变 2015年第3期(总第428期) 55 金融理论与实践 务。这说明职务越高,还款风险越小。个人的职务 【问题探讨】 量的直接引入模型,非数值变量的指标应该事先进 行量化以便进入模型。量化过程如表9。 表9虚拟指标体系 指标项 量化前(实际指标) 量化后(虚拟指标) 婚姻状况 已婚 婚姻状况1 未婚(离异) 高等教育 受教育程度 中等教育 初等教育 ≤3000元 月收入 3000—8000元 8000—13000元 13000元以上 表10结果显示,总体数据违约情况的百分比预 测值和实际情况的相符率为78.3%,准确性较高。 通过显著性水平检验(如表1 1),发现通过检验 的指标为年龄、婚姻状况、受教育程度、职位、月收入 和贷款金额六个指标,在本次实验中,剔除出方程的 指标是“还款方式”和“贷款期限”,所以最终进入方 程的虚拟变量和系数为(如表12): 表11方程中的变量 虚拟变量 B S.E Wais df Sig Exp(B) 年龄 一0.053 0.025 4.404 1 0.036 0.949 婚姻状况(1) 1.698 0.423 16.140 l 0.000 5.462 受教育程度1 受教育程度2 月收入1 月收人2 月收入3 职位1 职位2 职位 管理人员 职员 其他 还款方式 等额 等本金 还款方式1 受教育程度1(1) 2.634 0.594 19.642 1 0.000 13.928 受教育程度2(1) 1.201 0.597 4.44 l0 0.44 3.0324 月收入1(1) -3.507 1.012 12.018 1 0.001 0.030 月收入2(1) 一2.305 0.870 7.017 l 0.008 0.100 月收入3(1) 一1.491 0.967 2.377 l 0.123 0.225 步 职位1(1) 0.816 0.521 2.451 1 0.1l7 2.262 骤 职位2(1) 一0I204 0494 O.17l l 0.Ol1 0.815 .在使用SPSS软件进行Logistic归回分析中,为 了避免“虚拟变量陷阱”,虚拟变量个数比该项总指 标数要少一个。每个虚拟变量赋值为0或1。若某 借款人为已婚、高等教育、月收入4000元、其他职 务、等额还款,则赋值为:婚姻状况1=1,受教育程度 1=1、受教育程度2=0,月收入2=1,职务1=0、职务2= 0,还款方式1=1,其他都等于0. (2)使用SPSS17.0(中文版)统计软件进行Lo— gistic回归分析。 1)指标进一步筛选方式。 1a 贷款期限 -0.007 0.056 0.0l5 1 0.90l 0.993 贷款金额 0.041 0.017 6.090 1 0.0l4 1.042 还款方式(1) 1.193 0.731 2.664 l 0.103 3.298 常量 一0.368 0.145 6.472 1 0.011 12.058 a.在步骤1中输入的变量:年龄,婚姻状况。 b.受教育程度1,受教育程度2,月收入1,月收入2, 月收入3,职位1,职位2,贷款期限,贷款金额,还款 方式。 表12虚拟变量和系数 虚拟变量名称 年龄 婚姻状况1 系数B -0.053 1.698 指标变量之间的联系共同影响结果的准确性。 为了降低“多重共线性”的影响,还需要利用SPSS进 行进一步的筛选。 2)回归系数的显著性检验。 若给出的P值在临界值(一般为0.05)以内,显 著性强,应该进入方程。 4.SPSS运算结果 受教育程度1 受教育程度2 月收入1 月收入2 2.634 1.201 -3.507 -2.305 月收入3 —1.491 在实际操作中,选用ENTER方法使变量强制进 入回归方程来筛选变量,步骤为1步。结果如表lO: 表10分类表a 已预测 职位1 0.816 职位2 -0.204 贷款金额 常量 5.个人信用评分结果 0.041 -0.368 已观测 违约情况 步骤1 0.00 1.00 违约 育况 0.00 1.00 百分比校正 100 17 26 55 85.5 67.9 78-3 根据以上结果,可以得到Logistic回归方程为: In[p/(1-p)]=Logit(P)=一0.368-0.053 年龄+1.698 婚姻状况1+2.634*受教育程度1+1.201"受教育程度 2-3.507*月收入1-2.305*月收入2—1.491 月收入3+ 0.816"职位1-0.204*职位2+0.041 贷款金额 在模型中,得到Logit(P)的方式为客户所属的虚 56 2015年第3期(总第428期) 总计百分比 a.切割值为0.500 金融理论与实践 【问题探讨】 拟变量为1时则用1代入,为0时则用0代入,数值变 量直接带人方程。基准分的评定:具体方法是设履 约客户发生比为1:1时的分数为50,当履约客户发 生比为2:1时信用分数增加20分。 信用分数=5o+20%ln[p/(1一p)]/ln2 各项指标信用分数(如表13): 表13各项指标和信用分数 额),并统计出了每个因素在影响个人信用程度中所 占的权重和分数,有利于对办理商业银行贷款业务 指标 年龄 已婚 未婚 虚拟指标项 系数B 信用分数=50十 20 ln[p/(1一p)]/ln2 年龄 一0.o53 49.5 婚姻状况1 1.698 67.0 0 50 高等教育 中等教育 初等教育 受教育程度1 2.634 受教育程度2 1.201 0 76-3 62.O 50 l4.9 27.0 35.1 50 的个人进行信用评分。 针对我国当今商业银行个人消费贷款的现状, 可以提出以下防范个人消费贷款风险的相关建议: 建立和完善科学的个人信用评估体系;对风险程度 不同客户进行针对性管理;从银行自身来说,加强银 行从业者管理,加强行行合作,完善公共信息体制; 以社保为突破口,从银行内部建立有效的内控体系 及风险转移渠道;建立银行内部消费信贷的风险管 理体系,建立消费贷款的风险管理制度,逐步试点个 人破产制度;同时可以让二级市场参与进来,将消费 月收入≤3000元 月收入1 —3.507 月收入3000--8000元 月收入2 —2.305 月收入8000--13000元 月收入3 一1.491 月收入>13000元 0 贷款证券化,降低或转移贷款风险。我国的消费信 贷市场还有很大的发展空间,本文对于商业银行个 人消费信贷风险评估的研究希望能在抵御风险方面 提供一定的参考价值。 参考文献: 【1]杨大楷,俞艳.中国个人消费信贷状况及风险 防范研究fJ].金融论坛,2005,(7):45—50+63. 【2]Lyn Thomas.A Survey of Credit and Behavioral Scoring:Forecasting Financial Risk of Lending to Con—- 管理人员 职员 其他职位 贷款金额 常量 职位1 0.816 职位2 —0.204 0 贷款金额 0.041 一0.368 58-2 48.0 50 50.4 46.3 sumer[J].University of Edinburgh Whrkpaper,200 1(9): 39-40. 个人信用评分公式=46.3+49.5 年龄+67.O 已 婚+50:Ic未婚+76.3:Ic高等教育+62.0 中等教育+5O 初 等教育+14.9,cl月收入≤3000+27.0 月收入 3000—8000+35.1;l:月收人8000—13000+50*月收入> [3]Lock J.Consumer and Business Credit Manage- ment[M].Irwin,1984:120-121. [4]Augrade L B.Regression and Ordered Categori- cal Variables[M].J R.Static Sic,1987. 13000+58.2 管理人员+48.0 职员+50 其他职位+ 【5】曹鹏.商业银行个人消费贷款风险的防范与 50.4 贷款金额。个人信用评分公式的评分方法是 控制fJ1.银行在线,2008,(2):69—70. 某借款人的以上指标为真时,则取1;为假时,则取0 [6]陈春香.浅论商业银行个人消费贷款风险管 带人上式。 6.实证结果 理fJ1.金融保险,2009,(10):61—63. 由以上结果可以得出,影响个人信用风险的主 要因素是借款人的年龄、婚姻状况、受教育情况、收 【7】张成虎,李育林.基于神经网络的个人信用评 分模型研究[J].云南师范大学学报(哲学社会科学 版),2008,(6):87-93. 入情况和贷款金额,“还款方式”“贷款期限”指标对 于个人信用风险没有显著影响。 三、结论及建议 [8]周黎.商业银行个人消费信贷风险控制的探 讨fJ].商业现代化,2012,11(2):184-185. [9]廖绚,李兴绪.基于Logit模型的银行个人信 伴随着个人信贷业务的快速发展,个人信贷业 贷风险管理评估fJ].统计与决策,2008,(21):50—52. 务已经成为我国商业银行一项重要的资产业务项 【10]张铮烁.我国商业银行个人消费信贷风险评 目,商业银行个人信贷业务在总量和结构上的变化, 估研究[D].北京:北京交通大学硕士学位论文,2007: 已成为金融机构信贷风险的重要组成部分 ”。本文 15—17.通过对商业银行个人消费贷款的实际数据进行实证 [11]颜剩勇,王小玉.商业银行个人信贷风险识 研究,借用稳定性较高的Logistic回归模型,得出了 别及其模糊测度【J】.湖南科技大学学报(社会科学 影响个人消费贷款中个人信用的主要因素(借款人 版),2008,(5):59—62. 的年龄、婚姻状况、受教育情况、收入情况和贷款金 (责任编辑:王淑云) 2015年第3期(总第428期) 57 金融理论与实践