銀行機構不良資產分類研究
時間:2022-07-10 10:04:43
導語:銀行機構不良資產分類研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
【摘要】商業銀行信用風險管理一直是全面風險管理(ERM)的重要組成部分,對于地方法人銀行機構而言,不良資產的識別和分類是信用風險管理的重點和難點。針對我國中小法人銀行面臨的不良貸款信用風險問題,引入一種基于數據挖掘技術的KNN分類算法進行建模,對不良資產信用風險進行識別分類,并選取湖南S農商行和B農商行2017年末全部信貸數據進行實證。
【關鍵詞】KNN算法;風險管理;不良資產
一、引言
金融是現代經濟的核心,銀行市現代金融的核心,現代商業銀行在經營和發展過程中,因為籌集融通資金,中間環節會積累大量不良資產。由于歷史上和現實上的原因,我國農信系統的地方法人金融機構累積了大量的不良資產,雖然經過央行票據置換和農商行改革已經置換、清收了大量的不良資產,但是由于地方法人銀行機構信用風險管理能力較差,人才隊伍培養滯后,故對不良資產的事前識別能力極弱[1]。目前國內銀行業對不良資產信用風險評估方法主要是采用古典分析法和多元統計法。古典分析法是指銀行經營者依賴一批訓練有素的專家主觀判斷,對信貸項目進行判斷打分,審貸會以此決策。多元統計分析的基本思路是根據歷史積累的樣本建立統計模型,對新樣本發生的某種事件的可能性進行預測的方法,包括線性概率和判別分析法等[2]。以上所述方法雖然被廣泛應用,但是他們只是針對某一方面如財務進行分析和統計,不能充分利用銀行搜集的全面信息,尤其是一些邊緣信息。大量的數據挖掘研究結果表明,很多邊緣信息和側面指標可以很好地補充單一財務指標的缺陷,使借款項目的特征更加鮮明,故本文引入K近鄰算法建模,試圖用新辦法解決信用風險識別、評估的舊問題[3]。
二、模型設計
K近鄰(K-NearestNeighbors,KNN)算法是一種基于實例的數據挖掘分類算法,最初是由Cover和Hart于1968年提出,是一種非參數的分類技術。通過計算每個訓練樣例到待分類樣品的距離,取和待分類樣品距離最近的K個訓練樣例,K個樣品中哪個類別的訓練樣例占多數,則待分類元組就屬于哪個類別。KNN算法具體步驟如下:(1)初始化距離為最大值,包涵全部樣本。(2)計算每個位置樣本和每個訓練樣本的距離dist。(3)得到目前K個近鄰樣本中的最大距離MD。(4)如果dist小于MD,則將該訓練樣本作為K近鄰樣本。(5)重復步驟(2)、(3)、(4),掃描樣本庫,直到未知樣本和所有訓練樣本的距離都計算完。(6)統計K個近鄰樣本中每個類別出現的次數。(7)選擇出現頻率最大的類別作為未知樣本的類別。(8)利用前7步訓練得出的模型進行預測。KNN方法在類別決策時,只與極少數的相鄰樣本相關,因此采用該種方法可以較好地樣本的不平衡的問題。由此可見,KNN算法對K值即近鄰種類的數量依賴較大,如果K值較小,預測目標容易產生變動性,K值太大,模型的預測誤差可能會過大。為防止樣本密度差異過大,故K值選取須反復驗證,根據前人研究經驗推定K值的有效途徑是通過有效參數數目這個概念,有效參數數目是與K值相關的,約等于n/K,其中n是這個訓練數據集中實例的數目[4]。
三、實證分析
本文選取湖南永州境內S農商行和B農商行全部信貸數據作為實證樣本。首先對數據進行處理,對缺損數據和重復數據進行了清洗,選取12450個樣本,13個特征值作為有效數據。將數據庫的英文字符和中文字符全部轉化為雙精度浮點型數據,然后利用虛擬變量函數對雙精度浮點型數據全部進行編碼,樣本屬性標簽正常貸款和不良貸款分別用0和1表示。在實證環節,隨機選取40%的樣本作為測試樣本,共進行40次交叉驗證。在交叉驗證環節K值選取6時,預測和訓練效果最佳。40次交叉驗證預測標簽為1的不良貸款結果如下表。K值為4時,準確率為0.732;K值為5時,準確率為0.772;K值為6時,準確率為0.862;K值為7時,準確率為0.753;K值為8時,準確率為0.604。全部40次隨機交叉驗證的準確率均值為0.745,標準誤差為0.116。透過該模型的實證結果,我們還可以看到B農商行和S農商行存在如下幾個現象:一是個別信貸經理不良貸款筆數奇高,占到全部不良貸款的15.63%,而貸款“三查”制度執行未見差錯,內部審計也未發現嚴重問題,當是與該信貸經理能力和素質有關。二是存在不良貸款在某些區域集中分布的情況,普遍存在居委會的不良貸款筆數超過以村為名的行政聚居區,經過實地調查發現是純農業地區(村)授信筆數少于工商業為主的聚居區(居委會)。分屬同一支行,有別個行政聚居區(村、居委會)不良貸款筆數明顯超過其他行政聚居區,該個別居委會民風較為拖沓,習慣性欠息[5]。三是貸款投向劃分不準確,導致該項聚類出現偏差,在農商行的樣本中,95.4%的貸款投向均是農林牧漁業,原因是為了獲得再貸款、再貼現支持,人民銀行信貸考核需要涉農貸款比例達標,實際導致信用風險識別不準確[6]。
四、結論和建議
利用KNN算法構建的不良資產分類模型的準確率較高,穩定性較強,在多次交叉驗證后,可以選擇合適的K值,獲得較好的預測效果,故模型實用價值很高。但法人銀行機構的關聯交易和流動性狀況是該模型不能識別的,股東的高額關聯貸款給法人銀行帶來的信用風險是極大的,極端情況的流動性短缺會讓法人銀行機構經營困難,結合聲譽風險,可能會被處置當局警告、早糾甚至接管[7]。
作者:劉翔鵬 單位:中國人民銀行永州市中心支行
- 上一篇:商業銀行零售業務轉型路徑分析
- 下一篇:商業銀行法律風險防范研究