人工智能在支付清算風險管理中的設計
時間:2022-07-07 11:26:18
導語:人工智能在支付清算風險管理中的設計一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
內容摘要:央行支付清算系統是國家重要金融基礎設施,是社會資金流動的“大動脈”,系統安全高效運行事關金融穩定及經濟發展。近年來,隨著金融科技的蓬勃發展,以人工智能為主要代表的創新技術正逐步深入到金融風險管理的核心領域,推動著行業監管向智能化方向發展。本文通過對人工智能技術在支付清算風險管理工作中的應用設計,以探索實現運用人工智能技術對支付清算系統進行智能化監控及預警,從而提高支付清算系統安全運行的管理效能。
關鍵詞:人工智能;支付清算;風險管理;研究
一、人工智能在支付清算領域的發展現狀
人工智能是指對人類智能的模擬、延伸和擴展,其在金融領域的主要應用方向為機器學習、生物特征識別、語音語義識別及知識圖譜等,在支付清算領域可應用于智能賬戶、智能支付工具、智能清算系統、智能監管等。人工智能技術不僅可以輔助支付清算主體提供便捷、高效的服務,還可以在風險監管等方面為支付清算工作提供保障。
(一)國外人工智能技術在支付清算領域的應用
印度CiCl銀行、HDFC銀行已在行內反洗錢、支付交易管理等不同領域引入人工智能技術。新加坡星展銀行利用生物識別及人工智能集成等技術開創了純數字銀行DigBank,創造了新的支付方式,開啟了支付銀行的創新革命。意大利尤克利德利用人工智能技術試圖獲得用戶支付體驗,以實現業務自動化。摩根大通將人工智能技術應用于投行、交易和清算股票。Fraugster是德國和以色列的合作伙伴,使用人工智能來檢測支付欺詐和準確預測欺詐行為。Yandex利用深度學習計算技術對安全和惡意網站進行分類,以確保網絡支付的安全性。英國銀行NatWest通過iPhone應用程序中的人臉識別實現了使用人臉識別登錄銀行APP的能力。
(二)國內人工智能技術在支付清算領域的應用
在“金融科技”興起的大環境下,國內銀行和非銀行支付機構采用的人工智能技術按照降低成本和提升效率兩條路線,正重塑著支付行業。平安銀行通過手機銀行首創“智能語音”支付功能,實現“語音支付”、“語音取現”等操作,同時實現“智能錢柜”,完成系統記賬與出納分離的現金自動處理模式。交通銀行開發的“能聽、會說、能思考、會判斷”的智能理財機器人,能夠為客戶提供專業的金融服務。與此同時,非銀行支付機構也加快了人工智能在支付業務的融合。支付寶利用人臉識別技術,完成了支付流程的身份認證工作,還利用人工智能技術對轉賬行為進行評估,用以判斷是否有詐騙風險。財付通、支付寶等支付機構還推出了“無感支付”業務。
(三)內蒙古自治區人工智能技術在支付清算領域的應用
內蒙古自治區五家地方性法人銀行支付系統直接者中,自治區農村信用社聯合社自2019年7月起,陸續對自助設備、智能柜員機、手機銀行等交易渠道加入人臉識別技術進行了相關系統開發,截至2020年共有自助柜員機試運行機構93家、接入設備3958臺,智能柜臺試運行機構93家、接入設865臺,手機銀行網貸服務平臺全面加入人臉識別技術;蒙商銀行于2015年將指紋識別技術應用于柜員登錄業務系統,隨后將OCR識別技術應用于手機銀行App中,并使用廳堂智能機器人與客戶進行簡單對話、傳遞物品、查詢等互助功能,除此之外,智能投顧系統、貸款審批輔助分析系統等智能創新系統也已陸續在分支機構推廣應用。內蒙古支付系統呼和浩特城市處理中心CCPC,以首府生產系統運行主中心和旗縣災備系統運行副中心的系統架構設計,并在兩地兩中心雙活模式下生產運行,供配電系統、消防系統、暖通系統以及動環系統等支付系統基礎環境的運行監控,不同程度地運用了智能化,支付系統的輔助系統實現異常情況下的自動預警提示,支付系統清算風險科技管理手段得以應用。綜上所述,作為與信息技術融合最深的行業之一,金融業積極推動人工智能應用落地,在確保業務連續性、提升業務效率、優化成本控制、完善風控體系、推動產品創新等方面取得了明顯突破。
二、人工智能在支付清算風險管理中應用探析
風險是指某一特定危險情況發生的可能性和后果的組合。對于應用系統而言,風險的發生主要是指由于各種確定或不確定的因素導致的應用系統沒有按照設定方式運行,以至于運行結果沒有達到預期效果的各種情況。支付系統風險不僅對其運行構成威脅,還會對支付業務連續性有一定影響,甚至可能引發系統性金融風險。
(一)人工智能應用的路徑選擇
1.利用系統日志進行風險檢測。系統日志是記錄系統中硬件、軟件和系統問題的信息,是系統性能以及異常監控的重要數據來源。在系統風險管理中,異常檢測是構建安全可靠系統的重要一步。實踐中,通常會使用安全軟件對系統進行風險檢測,而安全軟件提示的問題時常會提及系統日志信息,一般情況下的處理方式是按照軟件指示進行刪除操作,但系統管理者并不了解問題的根源。使用安全軟件雖然可以在一定程度上對系統進行保護,但同時也為風險的發生添加了新的可能。而直接對日志信息加以利用不僅可以解決系統運行中存在的問題,還可以預防潛在風險的發生。
2.系統日志檢測方法選擇。因系統日志具有非結構化、強時效性和出現異常類型較多的特點,所以在選擇日志檢測方法時應重點考量以下幾個方面的因素:一是因日志信息在各式和語義方面與系統之間均有著較大的差異,故不可普遍使用基于規則的檢測方法。二是對日志信息的監測必須要及時,但日志數據是以數據流的形式進行輸入和傳輸,意味著對全部數據進行分析的方法不適用。三是可以對系統所產生的全部異常信息進行捕捉和分析,且對未知的異常信息也要有一定的判定能力?;谏鲜隹剂?,本文選擇了基于深度學習的日志異常檢測方法,該方法通過對執行路徑進行異常檢測、對參數和性能進行異常檢測、對工作流進行異常檢測三個步驟進行,然后綜合其判斷結果最終對系統異常進行確定。
(二)人工智能應用于日志檢測的模型構建
面對現代系統正在以每小時約50Gb的速度生成大量日志以及大規模并行使得現代系統行為日漸復雜等問題,針對系統日志信息所做的自動異常檢測方法就顯得尤為重要。計算機技術就是為幫助使用者解決重復且大量的工作,而人工智能技術的目的則是使得計算機技術在解決重復且大量工作的基礎上,可以學習之前工作過程中的經驗,完成計算之外的“判斷”和“決定”,甚至可以為使用者“提出建議”等一系列操作。從而幫助工作人員實時監控支付系統運行情況,為技術人員提供更多的參考信息,以此保障支付清算系統平穩運行。
1.日志信息異常檢測的步驟。針對系統日志信息的異常檢測主要分為四個步驟:一是日志信息的搜集。搜集的方式有多種,可以利用系統運行本身所產生的日志信息,但由于日志信息一般不輕易用作他處,故通常實驗所使用的日志信息來源于互聯網的公開數據集或者通過程序模擬生成相關日志信息。二是日志信息的解析。解析的目的是將日志信息按一定模板進行提取,使得日志信息可以按照統一格式進行存儲,從而構造模型訓練所需的原始日志信息。三是日志信息特征提取。由于模型所識別的信息是數字信息,所以日志信息解析為單獨的事件之后,需要將文本信息轉化為數字特征向量,使得機器學習模型可以利用日志信息。四是日志信息異常檢測。檢測方法可以分為有監督異常檢測和無監督異常檢測。有監督異常檢測是指模型通過數據的標記來“學習”日志信息的正常和異常狀態,訓練模型時所得到的訓練數據越多,模型的精確度就越高;而無監督異常檢測則是指模型訓練時所得到的訓練數據沒有人為的數據標記,通常在模型訓練過程中通過歸一化、聚類等方式進行多次修正,使模型在訓練過程中自主學習日志信息所包含的正常和異常狀態。有監督模型中常用且成熟的有LR、決策樹和支持向量機(SVM);無監督模型有LOF、IsolationForest、PCA、InvariantsMining(不變量挖掘)、CLustering(聚類)、DeepLog和AutoEncoder(自動編碼器)。
2.模型模擬訓練。(1)訓練環境。模型訓練所使用的HDFS數據和BGL數據基本都來源于生產系統并由相關領域的專家手動標記,共有15923592條日志信息,同時其中也包含365298條異常日志信息,用于模型訓練和模型驗證時的訓練數據和測試數據。HDFS數據集中包含11175692條數據,其來源于AmazonEC2平臺,這一數據集中的數據記錄每項操作,是唯一表示某一時刻的特定操作,因為可以很容易地被分為日志序列,經過處理將日志序列進行特征提取,生成575061個向量,其中被標記為異常數據的數據樣本有16838個。BGL數據集中包含4747963條數據信息,由LawrenceLivermore國家實驗室的BlueGene超級計算機記錄,這些數據沒有標識符,所以通過固定大小將數據按特定長度切位日志序列,然后進行向量提取,其中包含348460條異常信息。本文中所使用的方法是在python環境下實現的檢測方法,對于使用有監督的方法,利用機器學習中常用的Scikit-learing實現Logistic回歸、決策樹和SVM的學習模型。模型中所使用的參數是在實驗過程中多次手動調節得到的最優值。其中,SVM中還嘗試了核函數和相關參數,發現線性核函數支持向量機與核函數進行比較精確度高。同時,對于Logistic回歸進行了不同參數的嘗試,并對其進行了調整以便獲得模型的最佳性能。(2)模型訓練及結果評估。關于模型的性能,使用精確度、召回率及F-measure(這一系列實驗中常用的度量標準)來對模型性能進行評估,精確度測量的是異常數量與正常數量的百分比(如2-1),召回率測量的是實際異常的百分比(2-2),F-measure測量精度與召回率的諧波率(2-3)。根據現有數據集,我們將其中的80%作為訓練集,剩余的20%作為測試集。由于時間及模型訓練所需的環境等問題,本文只進行了一個方法的調試和測試。由于不同方法所使用的的原理及算法本身的側重點不同,所以結果會有不同。從圖1中表示日志數據的聚類可視化解析結果,大類表示準確的日志數據,小類表示準確率不太高的日志數據,但也表示數據集中一部分日志數據的走向,而零星分散的點表示異常的日志信息。在訓練過程中,將圖中小圈標記位置的數據進行剔除后再次進行聚類操作,得到最終的分類標準。同時,由于數據的稀缺,還可以將位置較為異常(小圈標注的數據)標記為異常數據,以供后續工作的開展。從圖2中可以看到在訓練的不同階段,不同規模的數據集在準確率的評估條件下的表現結果??梢钥闯?,數據量大的數據集相較于小規模的數據集表現搖號,比較符合人工智能模型在訓練過程中數據集越大,模型的訓練效果越好的特點。500M和100M的數據集在訓練的不同階段有著不一樣的表現,但整體趨勢可以看到,隨著訓練迭代的進行,模型的訓練結果逐漸趨近于平穩,但不同數據集所訓練的模型效果還是有所差異。型使用三個判斷標準得到的相應的結果。100M數據集所訓練的結果相較于500M和1G的數據集結果要好,通過觀察訓練集和測試集發現,由于所用數據集屬于同一來源,所以類型相似,同時小規模數據集的測試集也較小,訓練時所劃分的分類也更細更小,所以小規模數據集所得到的結果更好,但是使用1G的數據集所得到的模型更加穩定。
三、人工智能在支付清算風險管理中的策略展望
通過人工智能在支付系統清算風險管理中的應用驗證,基于支付清算系統日志檢測方法,分析日志信息的異常檢測結果,得出系統日志異常檢測支持支付系統風險研判的理論依據。
(一)深度論證
本文所嘗試實現的模型論證數據是基于互聯網公開的數據以及爬蟲的相關結果,由于支付清算系統運行所產生的日志信息較為敏感,所以不能在實驗階段進行使用,這樣也會導致模型無法直接應用于系統中進行模型性能驗證。同時,基于深度學習的日志異常檢測方法分為有監督和無監督兩種方法,本文所驗證的實驗使用的是有監督的方法,從兩種方法的原理來看,無監督方法更適用于訓練數據和驗證數據較少的實驗中。但是,無監督方法的不確定性、可失敗的可能都比較大,需要通過多次訓練進行糾正誤差來調整模型,通常使用無監督方法的基于深度學習的模型訓練所需時間是使用有監督方法的一倍甚至更多,但所需數據是有監督模型所需數據量的一半甚至更少,數據量與模型訓練時間成反比。兩種方法各有其優勢,也有其劣勢,可以嘗試通過不同的方法對系統日志檢測模型進行建模、訓練以及驗證,使其實現最優選擇。
(二)應用展望
人工智能模型的訓練需要大量的真實數據輸入進行模型構建,為了保證實驗所得出的模型適用于支付系統清算風險防控,可以根據支付清算系統所產生的日志信息進行數據構建,或者可以在安全的情況下使用支付清算系統所產生的日志信息進行模型構建,這樣訓練所得到的模型會更具針對性且在更短的時間內得到實際應用。但需要關注的是,人工智能技術應用研究必然會需要海量數據的收集與處理,這樣就可能造成數據安全隱患,同時存在信息泄露的風險,支付清算系統日志信息對于支付系統安全穩定有著重要作用,所以對于數據的使用應慎之又慎。人工智能、大數據、云存儲、區塊鏈等技術持續推進金融體系的數字化轉型,金融科技的進步為支付清算行業的發展注入了強大的動力,隨著相關技術的逐漸成熟,未來支付清算風險管理也會更加智能化,不斷減少人工大量成本,逐步提高科技管理投入,從而降低支付系統風險發生的可能性。
作者:范玉民 單位:中國人民銀行呼和浩特中心支行
- 上一篇:談國際主流跨境貿易營商環境評價方法
- 下一篇:鄉土文化和美術課程融合思考