網絡故障管理告警分析論文
時間:2022-03-30 03:30:00
導語:網絡故障管理告警分析論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
1故障管理是現代電信網管理的5大功能之一,故障管理是網絡管理的一個重要組成部分,故障管理的智能化是故障管理追求的目標,也是復雜、高速網絡高可靠性、高生存性的必然要求。
網絡管理員面對通信網絡中產生的大量告警信息,往往很難從中找出故障的真正原因,從而無法快速實施故障修復和障礙排除。對于故障管理來講,其難點就在于故障診斷和定位。為了更好的解決故障診斷定位問題,需要對所接收的告警信息進行分析和處理,以便能更好地完成故障管理的任務。
為了更好的把故障管理的智能化的思想運用到通信網絡中,以解決大型通信網中大量的告警信息,本文將首先介紹幾種具有代表性的故障管理告警關聯技術,并通過對比分析這幾種方法,選擇將基于規則和實例的關聯分析方法相結合,進而來分析告警信息,從而使故障的定位更加準確。
2基本概念
在網絡管理領域,故障是人們對服務中出現問題的感知,尤其是用戶的感知。故障是產生告警事件的原因。告警是當檢測到錯誤或異常狀態時產生的特定類型的通知。但它只是表明可能有故障發生,并不一定有故障發生。當網絡中出現故障時,會引發一系列告警,但并不是所有告警都表明故障原因,所以需要對網絡中發生的告警事件進行相關性分析,確定產生故障的根本原因。
告警相關性分析是指對告警進行合并和轉化,將多個告警合并成一條具有更多信息量的告警,確定能反應故障根本原因的告警,準確定位故障[1]。
3幾種告警關聯技術
3.1基于規則的推理
基于規則的推理又稱為基于規則的專家系統、專家系統、產生式系統和黑板系統等,它是最早出現的一種事件關聯技術。
這種方法的特定領域的知識包含在一組規則集中,而與特定情況相關的知識構成了事實。每個基于規則的系統都有一個控制策略,決定應用規則的次序。例如,當結束條件已經被滿足,則停止計算[1]。
3.2基于事例的推理
基于事例的推理是通過直接利用過去的經驗和方法,來解決給定的問題。事例是以前遇到并已經解決的特定問題。基于事例的推理是將過去成功的事例存入事例庫;遇到新問題時,在事例庫中尋找類似的過去事例,利用類比推理方法得到新問題的近似解答;再加以適當修改,使之完全適合新問題。事例庫的維護主要是按著名的遺忘曲線理論,即長期不用的信息將會被遺忘,所以要刪除長期不用的事例。
3.3基于模型的推理
在基于模型的推理系統中,每個被管對象都有一個模型與之相對應。一個模型實際上就是一個軟件模塊。處于網絡管理系統中的事件相關器建立在面向對象的模型之上,模型之間的協作形成事件關聯。網絡管理系統和被管網元之間的通信是通過事件關聯器和每個被管網元的模型之間的通信實現的,被管網元和被管網元之間的通信是通過被管網元的模型之間的通信實現的。這樣,模型之間的關系反映出它們所代表的被管網元之間的關系[2]。
每個模型通過與自身所表示的被管網元以及與其它模型之間進行通信,分析自身所表示的網元是否發生故障。因此,網元的故障首先由模擬該網元的模型識別出,然后報告給網絡管理系統。
3.4貝葉斯網絡
貝葉斯網絡[3]提出處理不確定性的新方法。通過這些方法即使在信息不完全和不精確的情況下,也可以進行推理。通信網絡中發生的告警事件,可能會發生丟失,收集到的具有相關性告警事件是不確定的。而且激發相關性告警的故障原因也是不確定的。所以通過貝葉斯網絡來分析通信網絡中告警相關性,可以克服告警事件的不確定性。
3.5神經網絡
神經網絡是模仿人類神經系統的工作原理,又相互聯結的神經元組成的系統。各神經元之間是簡單的輸入/輸出的關系。通過學習待分析數據中的模式來構造模型,而這個模型本身相當于一個“黑箱”,我們并不了解“黑箱”內部的東西,而只要求我們在已經訓練好的神經網絡中輸入端輸入數據,就可以在輸出端直接得到預期的結果。
3.6數據挖掘
數據挖掘是在數據中發現新穎的模式。它是基于過去事例的泛化的一種歸納學習。數據挖掘在通信領域中的典型應用是基于歷史告警數據,發現告警相關性規則。根據發現的規則,來分析和預測網絡元件可能出現的故障。
3.7模糊邏輯
由于通信網絡結構十分復雜,幾乎不可能建立關于這些網絡的精確模型,所以需要用模糊邏輯方法來處理一些具體問題。而且實際上由于網絡配置經常發生變化,網絡模型越詳細,那么它過時的速度會越快。并且在故障和告警之間的因果關系通常是不完全的,如由于路由故障,一些告警事件發生丟失。因此可以通過模糊邏輯描述出不精確網絡模型,用于分析不完全的告警相關性[1]。
由通信專家所提供的知識經常是不精確的,很難直接用于網絡管理。模糊邏輯中最根本的概念是模糊集合。模糊集合中任何一個元素歸屬于某個集合,不再是從True或False的兩者選擇其一,而是在區間[0,1]之間的一個值。所以通過模糊邏輯來描述網絡模型,采用模糊推理來確定出相關性規則。
4分析和比較
下面對上述幾種告警關聯技術的優缺點進行分析和比較。
基于規則的推理系統結構簡單,比較容易實現。但對于基于規則的系統來說,當規則數目達到一定量時,規則庫的維護變得越來越困難。而且知識的獲取是基于規則系統的一個很大瓶頸,因為規則獲取主要從專家那里獲得,且無自學習的功能。而且在這種演繹推理過程中,沒有充分利用過去經驗并且缺乏記憶。
基于事例的推理克服了基于規則的推理的許多不足:前者知識的單元是事例,檢索是基于對事例的部分匹配,而對于后者知識的單元是規則,檢索是基于對規則的完全匹配。但是在基于事例的推理系統剛開始運行的時候,一般很少能找到完全匹配的事例,隨著事例庫的增長,系統的效率也會逐漸提高。并且系統具有自學習的能力。缺點是它總是與某一個特定應用領域緊密相關,而不存在一個通用的事例方法。它對于網絡變化處理反應不敏感,處理過程較復雜而且費時,這對于要求實時性高的告警處理是一個問題。
基于模型的推理通過模型間的互操作來達到事件關聯的目的,這對降低網絡管理系統的網絡負載有一定的好處。但是它需要為每個網元建立一個模型軟件,當網絡規模逐漸增大時這一任務的復雜性就會越來越高。
對于貝葉斯網絡來說,計算出每一個節點相關概率是一個NP-hard的問題。雖然通過采用恰當的啟發式算法,可以在可接受的時間內算出幾千個節點的計算,但貝葉斯網絡邊界概率的計算效率仍是一個有待解決的難題。
基于神經網絡的方法具有良好的自學習能力,而且對輸入的數據具有較好的容錯性。但神經網絡需要過多的訓練,在通信網絡中很難找到較好的訓練數據。
數據挖掘方法不需要知道網絡拓撲結構關系,因此當網絡拓撲結構發生變化時,可以通過告警的歷史記錄進行分析,自動發現新的告警相關性規則,這減輕了網絡管理員的工作強度,提高了工作效率。因此基于數據挖掘告警相關性系統可以很快地調整適應一些變化快的通信網絡,解決通信網絡中出現的新問題[1]。
5結論
隨著通信網絡的迅速發展,對網絡的維護變得越來越困難,對告警處理愈顯重要。
傳統上人們傾向于采用某一種方法對告警事件進行分析,但是通過上面介紹,我們可以得知,每一種方法都有其優缺點。如果僅僅采用一種方法,那么其效果在網絡規模較小的情況下,還可以滿足實際要求。當通信網絡規模越來越大時,顯然已經無法滿足網絡維護的要求。因此我們可以選用其中的兩種或以上方法同時對告警事件進行分析。
從上面的介紹中,我們可以得知,基于規則的推理和基于事例的推理這兩種方法的具有一定的互補性。基于規則的推理算法最大優點是它更符合人的思維,便于人們的理解,系統結構簡單,比較容易實現。所有知識都采用“if-then”或者“condition-action”規則集的形式。基于事例推理的系統具有自學習的能力,通過直接利用過去的經驗和方法,來解決給定的問題。該方法還可與神經網絡和遺傳算法相結合,進一步完善其學習能力。針對通信網絡的特點,我們以這兩種推理方法為主要手段對網絡故障進行分析。
- 上一篇:柵格圖像矢量化研究論文
- 下一篇:動物防疫狀況調研報告