多信息融合技術在故障診斷的應用
時間:2022-02-16 09:00:05
導語:多信息融合技術在故障診斷的應用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
摘要:船舶動力裝置工作過程中會產生大量多域故障信號,通過收集、挖掘隱藏的關聯信號,可以解決船舶動力裝置在故障診斷中面臨的診斷時長問題。文章采用K-均值聚類算法(K-means)對數據進行聚類,聚類結果輸入BP神經網絡進行模型訓練,并在此基礎上,設計了主成分分析法(PCA)對模型進行優化。結果顯示,2種算法都能有效降低網絡診斷時長,而且經PCA優化的算法更能有效地提升神經網絡診斷的收斂速度和準確性。說明PCA能為智能故障診斷算法提供可行的優化方案。
關鍵詞:K-均值聚類算法;數據挖掘;主成分分析法;BP神經網絡;故障診斷
信息技術的發展,促使船舶動力系統變得復雜,基于多信息融合的智能診斷技術已經成為現代船舶故障診斷領域一個新的分支。目前,國內外學者在船舶智能故障診斷領域中多采用的是BP神經網絡算法。陳興權等[1]將主成分分析法(PCA)和改進的BP神經網絡相結合,用于形變監測數據處理,有效提升了神經網絡的收斂性。本文采用K-means和BP神經網絡訓練診斷模型,并利用PCA對樣本進行優化,從而建立更精確的診斷模型。
1基于數據挖掘技術的故障診斷
本文基于數據挖掘技術,結合K-means和BP神經網絡這2種算法,以MANB&W5L23/30H型主機為實驗對象構建診斷模型,并利用PCA優化模型。智能診斷流程如圖1所示。
1.1K-means算法
假設訓練樣本集為{x1,x2,…,xn},第i個樣本xi的特征矢量有m個特征值,即xi={x1i,x2i,…,xmi},xi∈Rn,Rn為實數,算法過程如下。1)隨機選取第j類聚類中心為zj,j為自然數,zj∈Rn,Rn為實數。對zj進行初始化。2)計算樣本xi與zj的歐式距離dj。dj=‖xi-zj‖。(1)3)根據最小歐氏距離Dj對xi歸類,假如Dj=min{dj},則xi∈j'。4)更新原有聚類中心第j'類聚類中心為zj'。zj'=1Nj'∑j'i=1xi,(2)式中,Nj'為第j'類所含樣本數。然后,返回公式(1)進行下一樣本的分類。5)n個樣本全部分類完成時,計算各樣本到其所屬類別中心的距離平方和為J,J為畸變函數。J=∑ji=1∑nj=1‖xi-zj‖2。(3)K-means算法要將J值調整到最小,來終止分類。如果沒有,返回步驟1)重新初始化值和聚類中心。
1.2BP神經網絡
BP神經網絡的拓撲結構如圖2所示。圖2中,P1,P2,…,Pn為網絡訓練的輸入,wnm為輸入層、隱含層神經元間的連接權重,wmk為隱含層、輸出層神經元間的連接權重,bm為隱含層第m個神經元,θk為輸出層第k個神經元,a1,a2,…,ak為網絡的預測值。圖2中,輸入信號Pn經隱含層傳遞出的結果y與經輸出層傳遞出的結果a的計算公式分別為:
1.3基于K-means和BP神經網絡的PCA優化算法
在動力系統智能故障診斷中,經常會遇到一種裝置故障表征的背后有多種故障原因的情況。多種故障之間會存在冗余,而PCA可以有效減少樣本數據的冗余和噪聲,避免過擬合問題的出現。算法優化流程示意圖如圖3所示。1.42種算法的比較第1種算法,即BP神經網絡算法,先進行K-means聚類,其結果直接作為BP神經網絡的輸入量,進行模型訓練。第2種算法,即基于K-means和BP神經網絡的PCA優化算法,先用PCA對高維度征兆數據進行降維,使其變為兩兩不相關的主成分,再K-means聚類。上述2種算法的最終結果都輸入BP神經網絡,分別對柴油機進行工況識別,對比輸出結果,判斷診斷精度是否提升。
2實例分析
本文以MANB&W5L23/30H型柴油機為主要研究對象,收集了柴油機在89%負荷時的5種常見工況(正常、燃油霧化不良、排氣閥漏氣、進氣閥滯后開啟、活塞缸套磨損)下測得的數據。每種工況收集了5組數據,每組數據設置了8個征兆參數,分別為:燃油消耗率,g/(kW·h);排氣總管溫度,℃;爆發壓力,MPa;壓縮壓力,MPa;排氣氣管壓力,MPa;進氣氣管壓力,MPa;轉速,r/min;平均有效壓力,MPa,用集合{S1,S2,S3,S4,S5,S6,S7,S8}來表示。
2.1數據預處理
進行預處理的目的是為了降低噪聲,以此加快網絡收斂速度。先將數據標準化,然后進行K-means聚類,K值的選取通過J函數的計算來獲取。初始聚類中心選取結果見表1。限于篇幅,僅列出每種工況經K-means算法聚類后的2個樣本結果,樣本聚類結果(部分)見表2。表2中,A、B、C、D、E分別代表工況正常、燃油霧化不良、排氣閥漏氣、進氣閥滯后開啟、活塞缸套磨損。
2.2BP神經網絡診斷故障
本系統利用MATLAB2016b神經網絡工具箱進行過擬合訓練。具體實現過程為:選取K-means聚類后的樣本征兆作為神經網絡的輸入量,反復訓練,以工況模式輸出矩陣為目標向量,即正常為[1,0,0,0,0]T、燃油霧化不良為[0,1,0,0,0]T、排氣閥漏氣[0,0,1,0,0]T、進氣閥滯后開啟[0,0,0,1,0]T、活塞缸套磨損[0,0,0,0,1]T。接著,選定BP神經網絡的結構數為8-9-5,即對應的輸入節點數為8,隱含層數為9,訓練迭代數為5。然后進行多組實驗,得到PCA優化前的網絡訓練誤差曲線如圖4所示。由圖4知,當訓練次數達到8次時,已滿足目標誤差的要求,此時模型訓練精度高。選取每種工況下的隨機一組數據構成訓練樣本集來檢驗訓練模型,主機分析預測結果見表3。分析表3知,正常工況下,燃油霧化不良、活塞缸套磨損,神經網絡的訓練精度接近期望值。而排氣閥漏氣和進氣閥滯后開啟2種工況,隸屬度分別為0.581和0.792,較其他工況,期望結果誤差過大,要求診斷精度進一步提高。
2.3算法優化處理
PCA降維通過使一部分非線性相關數據丟失,能有效減少信息冗余和降低數據噪聲。PCA的實質是保留主要成分和剔除非必要部分,所以通過計算主成分的累計方差貢獻率來選取主成分的個數。數據標準化后,計算得到各組數據的特征值、方差貢獻率和累計方差貢獻率,見表4。由表4知,前4組特征值對應的累計方差貢獻率超過0.95。一般要求累計方差貢獻率大于0.95,才能保證計算后的變量包含原始數據的絕大多數數據特征,故前4個變量能最大限度包含樣本中95%的數據特征。然后依次計算前4組特征值的主成分。對計算后的主成分樣本進行K-means聚類,主成分新樣本K-means聚類結果見表5。K值依據類之間明顯的區別和類別的數量來確定。經過PCA優化后的數據結果作為BP神經網絡的輸入,選定網絡結構數為5-7-4,得到PCA優化后的網絡訓練誤差曲線如圖5所示。由圖5知,當訓練次數達到7次時,已滿足目標誤差的要求。選取各工況下隨機一組數據作為訓練樣本集,來檢驗訓練模型,主機分析預測結果見表6.分析表6知,PCA優化后的新樣本輸入神經網絡時,預測精度明顯提高。
2.4實驗結果分析
分析2種算法的實驗結果,PCA在降低樣本間關聯性和復雜性和改善網絡神經元間的訓練誤差方面有顯著作用。2種算法對比結果見表7?;谏鲜霰容^結果,PCA在優化樣本網絡結構和維度上有顯著作用,同時還能提升模型精度,減少平均誤差和迭代數,使系統的總體性能得到發揮。
參考文獻
[1]陳興權,王解先,谷川.基于主成分分析的BP神經網絡在形變預測中的應用[J].大地測量與地球動力學,2008(3):72-76.
作者:葉樹璞 孫俊 單位:武漢理工大學 能源與動力工程學院
- 上一篇:精神疾病現狀及醫療保障制度分析
- 下一篇:古代藝術歌曲長相知音的韻之美