網絡故障處理方案范文

時間:2024-01-15 18:09:48

導語:如何才能寫好一篇網絡故障處理方案,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

網絡故障處理方案

篇1

關鍵詞:電力通信;故障;解決方案

中圖分類號:F407.61文獻標識碼:A 文章編號:

0 引言

電力通信網絡是為了保證電力系統的正常安全穩定運行從而誕生的。它同電力系統的安全穩定控制系統、調度自動化系統被人們合稱為電力系統安全穩定運行的三大支柱。目前,它更是電網調度自動化、網絡運營市場化和管理現代化的基礎;是確保電網安全、穩定、經濟運行的重要手段;是電力系統的重要基礎設施。由于電力通信網對通信的可靠性、保護控制信息傳送的快速性和準確性具有及嚴格的要求,并且電力部門擁有發展通信的特殊資源優勢,因此,世界上大多數國家的電力公司都以自建為主的方式建立了電力系統專用通信網。電力通信網絡是現代化電網安全、穩定、控制系統和調度自動化系統的基礎條件,網絡出現故障應及時查找原因,并迅速、妥善做出處理故障的措施。通信網絡故障問題的原因復雜、多樣,如早期建設光纖網架結構不合理,運行穩定性和安全性較差,SDH邏輯系統結構復雜、管理難度大等問題,處理起來相對較難。電力通信網絡的結構日益復雜,通信方式多樣,隨著得到不斷的建設發展和優化,對電力通信網絡業務質量的可靠性要求越來越高。簡單的的故障監控預警或處理已經很難適應電力通信網絡的大量日常運行和維護的要求。

1 目前我國電力通信網絡的現狀和存在的問題

由于我國科技的快速發展,電力通信網絡技術也在迅速進步,越來越多的電力系統業務都需要通過電力通信網絡來進行傳輸,電力系統對電力通信網絡的依賴性在很大程度上有所增強,所以電力通信網絡的故障問題對電力系統的不利影響越來越嚴重,所以,電力系統業務部門對電力通信網絡的質量要求也越來越高,不但要求電力通信網絡能夠提供足夠的通信能力,還要求電力通信網絡具有很高的安全性、可靠性及穩定性。至今為止,我國各個地區的電力通信業務部門已經通過對網絡進行升級、擴展,很好地解決了電力通信網絡系統對于通信能力的需求。但是通信網絡的設計水平較低,設計深度、強度還不夠,在如何提高通信網絡的質量方面的相關研究較少;沒有建立起較為健全的可靠性電力通信網絡管理體系;缺乏系統的通信網絡質量的檢測手段及方法;較少提出對通信網運行安全、高效的評估檢測及改進創新的有效方法。

2 通信網絡運行問題

2.1 網絡通信性能低

雖然我國現在的電力通信網絡技術發展的很快,可是現有的電力通信網絡結構的可靠性較低、資源共享能力較差。如果電力網絡通信中心系統及其站點出現了故障問題,那么,整個電力通信系統都有可能會趨于癱瘓,很多通信設備經過長期的運行,會進入設備的護理期、維修期,甚至是老化期,如此需要護理、維修甚至是更換的不良情況將直接阻礙著電力通信網絡的整體穩定發展。

2.2 管理結構模式復雜

按照電力通信網絡運行管理層面上一般分為1級、2級以及3級通信網絡,電力通信線路的結構和規劃都較為復雜,隨著各個地區的變電站不斷增加,各變電站內新增的SDH設備節點也不斷串入原有的SDH環網中, SDH網絡拓撲結構缺乏優化,越來越復雜。不少電力通信業務需要跨環甚至是跨多環進行傳輸,導致無法滿足傳輸時的要求。

2.3 傳輸質量差

目前,很多變電站通信線路大都采用5類網線或超5類網線作為485通信線,普通網絡線作為通信線存在以下問題:普通網線沒有屏蔽層,不能防止共模干擾;網線只有0.2mm2,線徑太細,會導致傳輸距離降低和可掛接的設備減少;網絡線為單股的銅線,相比多芯線而言容易斷裂;485收發器在規定的共模電壓-7~+12V之間時,才能正常工作,如果超出此范圍會影響通訊,嚴重的會損壞通訊接口。站內通信線為了走線的美觀而與電源線并行,而又無屏蔽接地線,致使通信傳輸受到一定的影響。

3 通信網絡出現故障的解決方案

3.1建立電力系統通信網可靠性管理體系

按照不同區域或地區的具體通信網規劃與要求,提出是何當地發展建設及運用的通信網絡設計可靠性標準、規范,確保通信網絡的可靠性措施實施,并組織、監督、評估通信網建設的可靠性實施效果;制定規范、嚴格的電力通信網絡維護管理體制和規程;制定恰當的電力通信網絡維護、管理的任務、要求和措施;提出通信網絡系統及具體通信設備的可靠性設計水平與技術指標要求;在通信網可靠性指標下進行通信網規劃設計,在有限的系統建設投入的前提下,對建設的通信網進行試驗和鑒定。分析、評價網絡運行的可靠性水平,對各種電力通信網絡的故障規律進行分析、研究,提出相應的可靠性實施措施;制定對重大異常故障的應急通信制度和措施,并監督各種制度和措施的嚴格執行。

3.2 加強光纜線路設計、施工和維護工作

光纖使用中引起的傳輸損耗主要有接續損耗和非接續損耗2類。因此在工程設計、施工和維護工作中應做到以下幾點:第一,應選用特性一致的優質光纖,一條線路上盡量采用同一批次的裸纖,以求光纖的特性盡量匹配,使模場直徑對光纖熔接損耗的影響降到最低程度,盡量減少接頭數量。第二,光纜接續人員應嚴格按照光纖熔接工藝流程進行接續,嚴格控制接頭損耗,熔接過程中時刻使用儀表進行監測,不符合要求的應重新熔接。第三,機房、設備內尾纖

和光纖跳線綁扎、盤繞不規范,出現交叉纏繞等現象造成損耗。應避免光纖受到較大的彎折。使用支架托起纜盤布放光纜,不要讓光纜受到扭力。在拐彎處等有可能損傷光纜的地方一定要小心并采取必要的保護措施。第四,在光纜敷設施工中,宜采用“前走后跟,光纜上肩”的放纜方法,嚴禁光纜打小圈及彎折、扭曲。機房內盡量整潔,尾纖應該有圈繞帶保護,或單獨給尾纖使用一個線,不使尾纖之間或與其他連線之間交叉纏繞,光纜終端時注意避免跳線在走線中出現直角,特別是不應用塑料帶將跳線扎成為直角,否則光纖因長期受應力影響引起損耗增大。

3.3 優化485通訊問題

(1)通信線必須采用國際上通行的屏蔽雙絞線,采用屏蔽雙絞線有助于減少和消除2根485通信線之間產生的分布電容以及來自于通訊線周圍產生的共模干擾。(2)485通訊線的屏蔽層應用作地線,將電腦等網絡中的設備連接在一起,并由一點可靠地接入大地。(3)通信線盡量遠離高壓電線,不要與電源線并行,更不能捆扎在一起。在同一個網絡系統中,盡量使用同一種電纜,減少線路中的接點。保證一條單一的、連續的信號通道作為總線,從而提高通訊網絡的安全性和穩定性。

4 結論

只有長期不斷的分析和總結日常運行情況,才能發現現有網絡中存在問題或潛在的隱患,及時進行合理優化并消除這些問題及隱患,才能保障電力通信系統的安全,從而進一步保障電網的安全運行。

參考文獻:

[1]趙子巖,陳希,劉建明.建立電力系統通信網可靠性管理體系相關問題的探討[J]/電力系統通信,2006,27(10):58-61.

[2]唐云善,張剛.電力通信故障防御軟件的研究與應用[J].電力系統通信,2010,31(4):32-35.

[3]肖瀟,唐艷冰.電力通信系統維護中幾例故障分析與處理[J].中國高新技術企業,2010(15):126-127.

篇2

【關鍵詞】TXP;分散控制系統;網絡;工廠總線;終端總線

1.TELEPERM XP控制系統簡介

TELEPERM XP分散控制系統(以下簡稱TXP),是德國西門子電站自動化有限公司專門為電廠開發設計的控制系統。該分散控制系統主要由五大部分組成,分別是:實現過程自動控制的自動控制系統(AS620);實現操作和監視的中央過程控制和信息處理系統(OM650);實現系統組態和設計的工程師系統(ES680);用于系統狀態診斷和故障分析的診斷系統(DS670);以及連接所有設備的SINEC總線系統。

圖1 TXP分散控制系統結構圖

2.TELEPERM XP總線系統介紹

TXP總線系統包括工廠總線和終端總線,均為通過光纜建立的局域以太網,采用標準的TCP/IP協議。傳輸速率為100M/秒。工廠總線擔負AP控制器之間及AP控制器與PU服務器之間的通訊任務,它為工業以太網,遵循ISO/OSI的七層結構建立起來的國際標準通訊協議。終端總線負責操作員站OT、工程師站ES與PU服務器、SU服務器之間的通訊。

工廠總線和終端總線的網絡裝置采用西門子公司生產的OSM光纖轉換模件,每個模件配置有2個100Mb等級的光纖接口及6個10Mb的Sub-D接口,其中2個光纖接口用于OSM間的互聯,使多個OSM組成高速以太網絡,其中必須有一個OSM設置RM冗余管理模式。

圖2 網絡結構圖

圖3 工廠總線與終端總線結構圖

RM冗余管理模式是指正常狀態時RM模式下的OSM裝置兩光纖接口處于斷開狀態,網絡成為虛擬環(網絡不能是真正的環路)。當網絡中其它地方因故障出現斷點時,RM模式的OSM裝置兩光纖接口自動閉合(閉合時間小于0.3s,無擾閉合),此時網絡上仍只是一路斷點,使網絡上的設備通訊始終保持鏈路上的正常連接。當故障斷點恢復時,RM模式的OSM裝置光纖接口重新斷開進入監視狀態,通過此方式構成冗余的網絡結構。當網絡中出現兩處或以上的故障斷點時,總線上的通訊才會受影響。

TXP分散控制系統的總線網絡具有高傳輸容量、高可靠性、單故障冗余等特點。以下將分別介紹工廠總線和終端總線的故障方式、故障現象及故障處理。

3.工廠總線網絡冗余失去處理

3.1 故障現象

(1)操作員站ASD報警畫面出現工廠總線網絡故障報警;DCS運行狀態正常,不影響運行人員對機組的監視和操作。

(2)工廠總線虛擬冗余開關設置的OSM網絡裝置RM燈亮,總線網絡冗余失去;單個或多個OSM網絡裝置FAULT故障燈亮;

3.2 故障原因

(1)OSM網絡裝置故障;

(2)OSM網絡裝置總線光纖接口故障;

(3)總線單路光纖損壞,此路通訊中斷。

3.3 故障后果

(1)DCS工廠總線網絡冗余失去,系統可靠性降低;

(2)單路網絡保持正常工作,不影響網絡上所有設備的正常運行。

3.4 故障處理

(1)檢查工廠總線各OSM網絡裝置工作指示燈狀態,確定故障OSM或光纖;

(2)在作檢查處理前,做好隔離措施,避免影響另一路網絡的正常工作;

(3)檢查FAULT燈亮的OSM,FAULT燈亮表示OSM中有網絡端口通訊中斷或OSM故障;查看兩個總線光纖端口狀態指示燈,指示燈滅表示端口無數據通過,通訊中斷,優先考慮更換此端口連接的光纖;

(4)更換光纖后,FAULT燈仍然亮著,則考慮OSM裝置故障;對此OSM上所有連接設備進行分析,評估更換OSM時影響機組正常運行的程度,如果風險太高,建議維持單路網絡運行,待機組停機時再作更換工作;

(5)如評估可在線更換,則更換前務必做好保護措施和隔離措施,避免影響另一路網絡的正常工作;注意更換前先斷開故障OSM的供電開關再進行更換,新的OSM跳線設置應與舊的一致;

(6)新OSM更換后,接入其所有端口的通訊接線,重新送電恢復OSM正常工作,確認FAULT故障燈和RM指示燈均已熄滅,工廠總線恢復冗余狀態。

4.工廠總線網絡癱瘓處理

4.1 故障現象

(1)機組跳閘;操作員站畫面變紅,失去監視。

(2)工廠總線OSM網絡裝置電源指示燈滅或FAULT燈亮;工廠總線OSM網絡裝置流量指示燈全黃。

4.2 故障原因

(1)外部設備接入,引起工廠總線網絡風暴;

(2)OSM網絡裝置供電失去;

(3)OSM網絡裝置故障。

4.3 故障后果

(1)工廠總線網絡癱瘓,各AP控制器間通訊中斷,保護誤動機組跳閘;

(2)操作員站畫面變紅,運行人員對機組參數和設備失去監視和控制。

4.4 故障處理

(1)工廠總線OSM網絡裝置供電失去時,檢查網絡裝置OSM的供電回路,查找故障點,恢復供電;當DCS全部電源失去時,參考《DCS全部電源失去應急處置方案》進行處理;

(2)當工廠總線網絡裝置故障時,檢查事件歷史記錄,查找網絡故障原因;檢查OSM網絡裝置指示燈,FAULT燈亮表示故障,RM燈亮時表示網絡中斷,冗余失去;當OSM故障時,更換OSM網絡裝置;當網絡中斷故障時,查找故障點,更換連接光纖;

(3)當網絡風暴引起網絡癱瘓時,檢查工廠總線是否有外部設備接入,斷開外部設備;檢查控制柜CP1430通訊模件指示燈,RUN燈亮表示正常,STOP燈亮表示故障;檢查工廠總線各網絡接線是否有虛接、松動現象,確定其連接牢固、接觸良好;斷開工廠總線所有OSM網絡裝置供電電源,然后逐臺送電重啟。

5.終端總線網絡冗余失去處理

5.1 故障現象

(1)操作員站ASD報警畫面出現終端總線網絡故障報警;DCS運行狀態正常,不影響運行人員對機組的監視和操作。

(2)終端總線虛擬冗余開關設置的OSM網絡裝置RM燈亮,總線網絡冗余失去;單個或多個OSM網絡裝置FAULT故障燈亮;

5.2 故障原因

(1)OSM網絡裝置故障;

(2)OSM網絡裝置總線光纖接口故障;

(3)總線單路光纖損壞,此路通訊中斷。

5.3 故障后果

(1)DCS終端總線網絡冗余失去,系統可靠性降低;

(2)單路網絡保持正常工作,不影響網絡上所有設備的正常運行。

5.4 故障處理

(1)檢查終端總線各OSM網絡裝置工作指示燈狀態,確定故障OSM或光纖;

(2)在作檢查處理前,做好隔離措施,避免影響另一路網絡的正常工作;

(3)檢查FAULT燈亮的OSM,FAULT燈亮表示OSM中有網絡端口通訊中斷或OSM故障;查看兩個總線光纖端口狀態指示燈,指示燈滅表示端口無數據通過,通訊中斷,優先考慮更換此端口連接的光纖;

(4)更換光纖后,FAULT燈仍然亮著,則考慮OSM裝置故障,更換前務必做好保護措施和隔離措施,避免影響另一路網絡的正常工作;注意更換前先停止與該OSM連接的計算機,斷開故障OSM的供電開關再進行更換,新的OSM跳線設置應與舊的一致;

(5)如冗余服務器兩臺計算機都與故障OSM連接,則先將其中一臺計算機的通訊線接至別的正常工作的OSM空余端口上,更換OSM的過程中,必須保持至少單路服務器正常工作,不少于兩臺操作員站供運行人員使用;

(6)新OSM更換后,接入其所有端口的通訊接線,重新送電恢復OSM正常工作,確認FAULT故障燈和RM指示燈均已熄滅,終端總線恢復冗余狀態。

6.終端總線網絡癱瘓處理

6.1 故障現象

(1)操作員站全部畫面顯示變紅,畫面上測點無法正常顯示數值,失去監視;畫面上設備無法點擊操作,相關設備無法控制,設備就地運行狀態不變;

(2)OSM網絡裝置電源指示燈滅或FAULT燈亮;OSM網絡裝置流量指示燈全黃。

6.2 故障原因

(1)外部設備接入,引起終端總線網絡風暴;

(2)總線上計算機故障,引起終端總線網絡風暴;

(3)OSM網絡裝置供電失去;

(4)OSM網絡裝置故障。

6.3 故障后果

操作員站全部畫面變紅,運行人員對機組參數和設備失去監視和控制。

6.4 故障處理

(1)終端總線OSM網絡裝置供電失去時,檢查網絡裝置OSM的供電回路,查找故障點,恢復供電;當DCS全部電源失去時,參考《DCS全部電源失去應急處置方案》進行處理;

(2)當終端總線網絡裝置故障時,檢查事件歷史記錄,查找網絡故障原因;檢查OSM網絡裝置指示燈,FAULT燈亮表示故障,RM燈亮時表示網絡中斷,冗余失去;當OSM故障時,更換OSM網絡裝置;當網絡中斷故障時,查找故障點,更換連接光纖;

(3)當網絡風暴引起網絡癱瘓時,檢查終端總線是否有外部設備接入,斷開外部設備;檢查SU服務器MOD磁光驅是否處于工作狀態,斷開磁光驅與SU服務器連接;

(4)短時間內無法確認網絡風暴的源頭時,采用停止和重啟所有OM計算機的方法。重啟的順序為:

1)PU1a、PU2a、PU3a,PU服務器為SU服務器與操作員站的數據服務器,優先重啟單側;

2)PU1b、PU2b、PU3b,重啟另一側PU服務器;

3)SU1a、SU1b,SU服務器也是操作員站的服務器;

4)操作員站OT1、OT2、OT3、OT4、OT5、OT6,操作員站為客戶端計算機,需在服務器啟動完后才啟動;

(5)重啟過程中如發現有計算機無法正確啟動,在保證至少單側服務器運行、操作員站畫面恢復后再對故障計算機進行檢查處理;

(6)系統恢復后,查看各OM計算機的診斷文件,查看網絡癱瘓的原因,制定措施,避免同類故障再次發生。

篇3

關鍵詞:GSM-R光纖直放站;故障處理方法

1.概述

GSM-R(Globle System of Mobile for Railway)是基于公共無線通信系統GSM平臺實現移動話音和數據傳輸的鐵路專用數字式無線通信系統, 典型的GSM-R系統采用基站對鐵路沿線進行覆蓋,較好地解決了區間通信問題。但是我國鐵路線總里程長,通車地形復雜,山區、丘陵地帶存在弱信號場區,隧道、涵洞為信號盲區。為保證GSM-R信號的全程覆蓋,根據鐵路沿線光纖資源豐富的有利條件,采用了大量的光纖直放站,主要應用于隧道內GSM-R的信號覆蓋,同時兼顧外部空間場強GSM-R信號收發。光纖直放站是擴大網絡覆蓋,提高網絡質量和設備利用率的有效手段,保障了列車高速運行的安全。

2.光纖直放站的工作原理

光纖直放站主要由以下幾個部分組成:光近端機、光傳輸部分、光遠端機、天饋線或漏纜。光近端機和光遠端機都包括射頻單元(RF單元)和光單元。無線信號從基站耦合出來后,進入光近端機,通過電光轉換,電信號轉變為光信號,從光近端機輸入至光纖,經過光纖傳輸到光遠端機,光遠端機把光信號轉換為電信號,進入RF單元進行放大,信號經過放大后送入發射天線,覆蓋目標區域。上行鏈路的工作原理一樣,移動臺信號通過遠端天線輸入到遠端機,把移動臺信號放大到-30~0 dBm后送到光遠端機,轉換為光信號通過光纖傳送到近端機。近端機把信號耦合到基站。

每一臺直放站遠端機都同時連接兩個近端機,從兩個近端機(基站)獲取信號。遠端機根據距離兩端近端機的距離,各自選用不同的主用信號,且主用信號比從信號高6dB,即在相鄰兩個RU之間的漏纜上,同時有兩路信號在工作,實現隧道內信號交織覆蓋。當單點基站故障時,整個系統仍然能夠正常工作。如下圖所示:

3. 典型故障及解決方法

3.1直放站近端機脫管故障

在聯調聯試及開通運行之初,某直放站近端機出現脫管故障:網管上顯示某一近端機(MU02)為黑色,與MU02連接的主、從光纖均為黑色,無法連接到該近端機。

原因分析

① 在網管上出現網管不到某個近端機的情況(脫管),而其他近端機網管狀態正常,則可以排除網管服務器及終端設備出現故障的情況。

② Comlab直放站網管采用雙網卡服務器,擁有A、B兩個網段,經網線分別連接至傳輸設備的2個以太網口,而近端機內的交換機經網線和基站的622M傳輸設備的以太網口連接。所以傳輸側故障和MU內放置的小交換機、網線障礙都可能造成網管通道障礙。

處理方法

① 故障現場需要配備一臺筆記本電腦并將筆記本網卡IP地址設置為近端機地址,從基站傳輸設備上直接用網線ping網管的IP地址,如果可以ping通,則判斷網管傳輸通道正常。

② 檢查MU內放置的小交換機和網線,用網線測試儀測試網線正常;經排除法得出:只有MU內置的小交換機可能有故障,更換小交換機后故障恢復,網管能對該近端機正常監控。

小結

本例是由于近端機內放置的小交換機故障導致直放站近端機脫管。在日常維護中當直放站近端機/遠端機脫管時,可以按照下面的流程進行故障排查:

① 現場檢查設備電源頭是否掉落或接觸不良,查測電源線是否有電壓(指標為:220V左右);

② 在網管服務器上ping故障近端機或遠端機的IP地址(若是遠端機則A、B兩網段均需要ping)是否連通;

③ 現場檢查遠端機內部網線是否接觸不良,檢查近端機連接基站傳輸設備的網線以及機柜內網線是否接觸不良;

④ 檢查MU內放置的小交換機工作是否正常。

3.2直放站光路故障

某高鐵線路直放站采用主、備、從3塊光模塊的方案,遠端機(RU)從兩個近端機(MU)獲取信號,RU到主用MU連接有主、備用兩根光纖,主、備用光纖徑路不同,相互起到保護作用。RU與從MU之間采用單纖收發信號。當直放站發生光路故障時,通常網管上會上報兩種告警:主鏈路網絡故障、從鏈路網絡故障,發生主/從鏈路網絡故障告警時,從網管可以看到RU與MU連接的主/從光纖顯示為紅色。其示意圖如下:

原因分析

當直放站網管上報主鏈路網絡故障告警時,則表示主備光鏈路中有1路斷開或者主、備光鏈路2路均斷開;從鏈路網絡故障告警,則表示從鏈路斷開。直放站發生光路告警的可能原因有:

① 設備光纖或尾纖故障。

② 近端機或遠端機收光故障。

③ 設備光模塊發光故障。

處理方法

① 網管必須確定故障光路,即主、備光路故障或從光路故障。

② 到達發生光路的近端機(MU),觀察MU光模塊指示燈:TX綠色表示發光正常,紅色則有告警;RX綠色表示收光正常,紅色則有告警。

③ 用光功率計測試近端機及遠端機收、發光功率(MU發光為1550nm、收光1310 nm;RU收光1550nm、發光1310 nm)。若不在門限值內,則檢查尾纖和光纜。

④ 若光路沒有問題,可以采用替換法來確定為近端機或遠端機光模塊故障,更換故障模塊即可。

小結

處理直放站光路故障可分別從近端機、遠端機的光路、尾纖開始排查,進而可用替換法來確定是近端機或遠端機的光模塊故障。即可按如下流程進行一一排查:

① 檢查設備光纖連接;

② 查測設備光路是否通暢,近端機、遠端機收光光衰是否符合直放站工作要求(指標為:>1dBm);

③ 檢查設備光模塊發光是否符合要求。

3.3 MU接收BTS的信號電平指標異常

某日檢測車測試,發現01/R1、R2的主用信號及02/R1、R2的從信號都高于直放站近端機輸入電平門限值。信號偏高容易造成切換點位置偏移,從而引起通話中掉話。

原因分析

當測試發現直放站近端機輸入電平過高,可能原因就是BTS的輸出電平過高。如示意圖所:01/R1、R2的主用信號及02/R1、R2的從信號都是01/MU提供的,當4臺RU接收到的信號均偏高時,可以判斷出故障點為其共同的信號源,即01/MU提供的信號偏高。

           

處理方法

故障現場測試基站設備輸出到直放站近端機的電平為35dBm。而直放站近端機輸入電平要求為30 dBm,故高出5 dBm。有兩種解決措施:

① 降低基站設備輸出電平,但是會降低本基站信號對其他方向的覆蓋。

② 在饋線上增加衰減器,但是會增加故障隱患點。

為了保證本基站信號對其他方向的覆蓋,采取在基站至直放站近端機的饋線上增加5 dBm衰減器的措施后,4臺RU的接收電平符合要求,故障排除。

小結

排查此類故障應掌握的知識點: 直放站近端機輸入電平要求為30 dBm,基站到近端機的饋線連接包括功分器、衰減器等,所以一般情況下基站的輸出信號約為42 dBm,經過功分器、衰減器及接頭等衰減后,到達直放站近端機的電平值應略高于30 dBm。這樣就不會因信號偏高而導致掉話了。

4.總結

     本文例舉了幾個GSM-R光纖直放站日常維護中比較典型的故障。在GSM-R光纖直放站日常維護中,經常會遇到各種故障現象并伴隨著不同的告警指示,甚至同一種告警現象卻是由不同的原因導致。只有透過故障的表象找到其本質,才能實現故障的準確定位并迅速排除。這就需要我們了解故障定位的基本原則,明確故障處理的思路,掌握常見的故障處理方法,才能從容應對各種異常現象,提高日常維護的能力,更好地為鐵路運輸安全生產服務。

參考文獻:

[1] 鐘章隊等. 鐵路綜合數字移動通信系統[M]. 北京:中國鐵道出版社,2003.

篇4

關鍵詞 綜合網絡技術;計算機體系結構;網絡故障管理方法

中圖分類號:TP393 文獻標識碼:A 文章編號:1671—7597(2013)041-160-01

隨著計算機網絡技術的不斷發展,本身特點也發生了很大的變化,最明顯的特征體現在以下方面:接入網、匯聚網、骨干網與數據中心的相互連接;移動網與固定網相互連接等。綜合網絡的發展給網絡管理的操作性以及動態性帶來了更大的挑戰,也使得綜合網絡管理變得更加廣泛。

想要對網絡進行有效的監管,需要運用委托的方式對運行中的通信技術進行收集和分析。然而,這種模式有著一定的缺陷性:在使用對象上缺乏普遍性,因為這種網絡管理的對象只能局限于協議棧底層,不能對高層系統進行有效的管理,尤其是一些跨Internet的大型應用系統就不能使用這種系統軟件來進行操作;另外就是這種管理系統缺乏一定的智能性,不具備較強的自動功能,并且還缺乏一定的實時性。

本文對綜合網絡管理體系結構進行了論述,并研究了系統管理技術、策略服務方案等一系列故障性問題。

1 管理體系結構

綜合網絡管理結構技術由四層模式組成:第一層是被管對象層,網管在對信息資源進行搜集整理的時候,可以通過其自身的網管進行整合并對故障發出警告。其中它支持的協議有TCP、SNMP、CLI、OSI、CMIP等;第二層網絡管理層包括很多網元服務器,網絡信息通過每一個網元服務器對資源進行轉發和控制;第三層網絡管理服務器的最大功能就是可以控制下層的網元結構,另外還可以提供信息服務;第四層系統服務器由多個應用系統管理(System Management SMA)和資源庫組成。SMA能夠查詢資源列表和資源信息。

通過上述結構層次可以發揮網絡管理多種特點,實現其可伸縮性以及相互操作性的特點。

2 綜合網絡核心技術分析

2.1 綜合網絡中的應用系統管理技術

大型網絡應用系統具有信息資源豐富、用戶多等特點,在使用這些網絡系統的時候一定要有安全系統做保證,其中服務SMA可以快速查詢資源信息列表。其中的網絡網元服務器能夠對相關資源信息進行搜集,然后通知網絡管理服務器,最后將這些網絡信息傳至應用服務,將其過濾和注冊,最終完成資源信息的搜集和應用。

2.2 基于資源依賴性分析的故障管理技術

隨著應用系統資源復雜程度的提高,故障處理的難度也相應加大。在網絡管理結構中,網絡管理的中心節點經常要處理大量的事件信息,這樣會出現網絡阻塞問題,浪費大量的網絡資源,還無法適應對故障處理速度要求較高的系統。充分發揮網元服務器的作用,可以實現局部網絡故障智能處理的目的。智能處理故障具體工作流程如下:首先在網絡對象工作出現故障時,網元服務器要盡快獲取離故障最近處的事件信息,并及時地清除多余事件信息,然后再根據資源依賴性關系圖和方法,對故障信息的關聯性進行相應的分析和過濾,過濾后的信息交給網絡管理服務器進行處理;或者采取有效措施對某些故障進行修復。通過以上信息搜集程序可以及時有效的查處資源信息發生故障的原因所在,并進行準確修復,不但可以節約了網絡管理信息的流量,還能有效提高處理網絡故障的效率。

2.3 策略服務方案

在策略服務的支持下,應用管理系統可以有效提高智能處理能力,并能系統性地解決問題,系統的擴展性也會增強。策略的產生、刪除、修改、管理以及分發都屬于策略服務的范疇。根據策略管理的作用可以將策略服務分為:

1)策略控制入口PEC(Policy Entry Console),可以提供一些關于策略及相關信息的存貯、瀏覽、刪除、輸入等工具供管理管理人員使用。網絡管理員可以瀏覽并修改PEC讀取的策略與策略信息,如果修改或刪除了一條策略,CPC就會從PEC得知策略變化,并根據這些資源信息來對相關策略和結果做出判定,網絡管理員能夠利用這些結果對網絡進行更好的控制,并對CPC做出指示,從而顯示出及時更新的信息。

2)策略應用程序接口PAPI(Policy API),使用戶在制定存貯、編輯、刪除以及管理策略方面,通過自己編寫的程序就能夠直接完成。PAPI具有的接口功能,這些作用主要體現在:對網絡客戶的身份進行正確驗證,同時將策略系統進行仔細配置,并將信息傳接口的各個功能構造進行及時修改、儲存等,PAPI實現了網絡自動化管理的目的。

3)中心控制器CPC(Central Policy Controller)的主要作用是對策略辯護進行處理和分析,可以通過網絡信息對策略進行準確檢測,以確定出現了多少條變化的策略,在條件允許的情況下,中央控制器可以做出相應的操作。當發現某條策略變化時,中央控制器就能及時地將出現的相關情況告訴PDP(Policy Decision Point),并使其對變化策略的有效性進行檢測。從物理角度來說,如果中心控制器處在一種分布式的環境之中,或許它是分散的,但是如果從邏輯方面的作用上來講,中央控制器就是一個完善的整體。

4)策略決策點PDP(Policy Decision Point),能在對網絡策略進行檢測的時候,還能將其資源進行重新配置,并對網絡對象進行溝通,處理PEP(Policy Enforcement Point)提出的不同策略的服務請求。也可以對現有網絡資源對象中的策略與后來修改或增加的策略之間的矛盾進行檢測,并告知PEP檢測結果,由PEP對策略的實施情況及有效性進行檢測。

參考文獻

篇5

關鍵詞:故障 工具 命令 分析 排除

中圖分類號:TP3 文獻標識碼:A 文章編號:1674-2117(2014)16-00-01

隨著國家網絡信息化建設的深入,針對網絡的維護變得越來越復雜多樣,網絡故障也隨之日益增多。如何診斷網絡系統所發生的故障、如何預防故障問題的發生、如何建立有效的管理網絡、如何檢測網絡運行狀況等問題,已經成為網絡管理員面臨的重要任務。當然,為了更好地分析與排除網絡中的常見故障,對網絡的安全進行基本的檢測與維護、對網絡環境下的常見操作系統進行檢測與維護、掌握常用工具以及常用命令、掌握網絡故障診斷的方法是網絡管理員首先必須要做到的。

1 常見的網絡故障排除技術

(1)參照法。參照法是一種比較快速解決網絡故障的方法,它不需要懂太多的網絡故障排除經驗。但前提是只有當正常工作設備與故障設備具有相同的情況下才可以使用參照法。

(2)試驗法。試驗法就是不明確故障原因,通過不同的方法解決問題,從而最終得出解決故障的方法。但它并不能準確地對故障現象作出判斷。

(3)替換法。替換法也是常見的故障檢測方法。采用該方法,網絡管理員首先要知道故障的大概原因,并且恰好手邊有正常的設備可以讓其選擇。

2 網絡故障排查的常用命令

(1)Ping命令。Ping命令是一個測試程序,正常情況下通過Ping命令可以縮小問題的范圍,容易排除網卡、網絡訪問層、電纜和路由器等故障。常用的參數:Ping n 連續Ping N個包;Ping t 持續地Ping直到人為地中斷;Ping l 指定每個Ping 報文的所攜帶的數據部分字節數0-65500。

(2)Netstat命令。Netstat是控制臺命令,是一個監控TCP/IP網絡的非常有用的工具。它可以顯示路由表、實際的網絡連接以及每一個網絡接口設備的狀態信息。Netstat用于顯示與IP、TCP、UDP和ICMP協議相關的統計數據,一般用于檢驗本機各端口的網絡連接情況。

(3)Ipconfig命令。Ipconfig命令可用于顯示當前的TCP/IP配置的設置值。這些信息一般用來檢驗手動配置的TCP/IP設置是否正確。如果是DHCP動態獲取的IP地址,Ipconfig可以讓網絡管理員看到是否成功地獲取到IP地址,查看計算機當前的IP地址、掩碼和網關。

(4)跟蹤網絡連接的Tracert命令。Tracert命令用來顯示網絡數據包到達目標主機所經過的路由信息,它能把數據包所走的全部節點的IP地址、路由信息、所用的時間都顯示出來。

3 網絡排查的各種工具

3.1 硬件工具

(1)網絡萬用表。網絡萬用表是一種定位于解決網絡中單個節點不能上網的問題的設備。可以測試網線線纜的長度、接線圖,幫助網絡管理員迅速檢修和診斷該節點至網絡的連通性問題。

(2)網線測試儀。網線測線儀是一種對8根雙絞線逐對(根)進行自動掃描,快速測試雙絞線或同軸電纜的設備,可以用來快速測試網絡的通斷以及線序。

3.2 軟件工具

超級網管(Super LAN admin)。Super LAN admin軟件是相當實用的網絡工具軟件,功能強大且簡單易用。其操作方式簡單直觀、程序界面友好,在局域網內的任何一臺計算機上都可以使用。

4 常見網絡故障分析實例

4.1 做好故障排查工作

在開始故障排查工作時一定要注意細節,排除大型網絡故障如此,一般十幾臺計算機的小型網絡故障也如此。因為一些最小的細節問題能使整個問題變得明朗化。一般故障排除模式如下。

第一步,當分析網絡故障時,首先要清楚故障的現象。應該詳細說明故障的現象和可能的原因。第二步,收集有關的信息。向用戶、管理者和其他關鍵人物提一些和故障有關的問題。第三步,根據收集到的情況判斷潛在的故障原因。第四步,根據最后可能的故障原因,建立一個診斷計劃。第五步,執行診斷計劃,認真做好每一步測試和觀察,直到故障癥狀消失。第六步,及時記錄改變參數后的結果。從結果分析問題是否得到解決,如果沒有,就要繼續下去,直到問題解決為止。

4.2 故障現象及分析案例一

(1)故障現象:筆者鄰居家里的計算機有一次無法拔號上網,在寬帶連接時跳出錯誤提示用戶和密碼無效,可是重復檢查密碼和賬號信息并沒任何錯誤的現象。

(2)故障分析:錯誤691是寬帶adsl撥號上網用戶常常遇到的故障提示。寬帶adsl撥號上網使用pppoe協議連接,通過電話線傳輸數據,使用adsl專用modem實現數據的調制解調,提示錯誤691真正意義上來講可能是以下原因: ①域名出現錯誤(用戶名或密碼輸入錯誤); ②電話或寬帶到期欠費造成;③服務器無反映(機房用戶端口錯誤或賬號未被激活);④硬件故障。

(3)故障解決:筆者詢問得知電話費沒有欠繳,這應該是網卡驅動的問題,所以把網卡驅動重新裝了一下,重啟計算機后,拔號上網,問題得到解決。

4.3 故障現象及分析案例二

(1)故障現象:學校機房最近總是間斷性出問題。 不能上網、不能上QQ,QQ游戲能玩兒,且不止一臺計算機出現這個問題。

(2)故障分析:綜合分析,QQ游戲能玩,說明機房網絡還是通的,如果只是一臺機器出現這種情況,網頁打不開時只要把IE設置修復下就可以。QQ上不去,修復下QQ或重裝一下就可以。如果是整個機房局域網都是這個問題的話,那就可能是局域網內有機器中了ARP欺騙病毒。

(3)故障解決:用SuperLANadmin掃描軟件找到源頭,果然有一個學生使用U盤,使該臺計算機中了病毒,把這臺計算機斷開網絡后,網絡才恢復正常。

計算機網絡技術發展迅速,網絡發生故障復雜性是不可避免的。網絡建成運行后,網絡故障診斷、分析、排除是網絡管理的重要技術工作。為了更好地提高網絡管理水平,網絡管理人員應該認真了解有關網絡的技術,清楚網絡的基本運作與系統參數設置及有關網絡工具軟件的使用。

(江蘇省鹽南中等專業學校,江蘇 鹽城 224005)

參考文獻:

篇6

關鍵詞:動車組;空調系統;應急處理手冊

1 問題描述

動車組的應急處理手冊是動車組隨車機械師處置突發故障的作業依據,因此指導書中的描述明確與否可以直接影響到隨車機械師處置故障響應的快慢,也可以影響應急指揮人員對隨車機械師的指導是否及時與正確。筆者在哈爾濱動車段從事CRH5型動車組的空調系統故障處理工作近3年時間,尤其擅長處理空調控制系統故障,在本文中筆者將結合自己的工作經驗和理論知識,討論CRH5動車組應急處理手冊中一部分內容的正確性與明確性與否,具體地說就是:更加明確地指出了一些機械師需要操作的按鈕的名稱和它的位置,同時也指出了手冊中的少量錯誤、遺漏或者沒必要的操作并進行改正,下面筆者就分類介紹一下。

2 具體改進方案

2.1 全列車空調故障的處理

應急手冊中處理過程描述:檢查動車組司機臺上的空調集控開關是否處于工作位置,司機室的QCA柜空調系統相關空開是否閉合正常;若集控開關關閉,則將其開啟后故障自動排除;若集控開關開啟,則進行下一步驟;檢查電氣柜內的K25有沒有亮起,若K25不亮,可以將K25打到手動強制吸合。

原方案只是說了操作旋鈕,并未明確是哪個操作旋鈕,筆者認為應該在原方案基礎上明確具體操作旋鈕的名稱S5及QCA柜中空開的名稱36Q101,這樣就讓筆者們的應急手冊所描述的操作有了明確的指向性,縮短機械師應急操作的時間,提升應急處置故障過程的效率,減少了誤操作的可能性。

2.2 單車空調故障

(1)手冊原處理過程:若K25繼電器不亮,則進行復位操作以重新構建網絡。通過空調E版圖分析,E版圖當中K25繼電器由35Q01空開、35Q02空開供電,如果K25網絡信號確失,則按照故障點發生的概率應首先檢查最容易存在問題的地方,首先檢查該車35Q01,35Q02空開,單車故障一般不是網絡故障,不用進行網絡修復(RIOM故障可能性極?。?,如果沒有什么異常,此時考慮K25繼電器自身是否有故障,可以將K25與其他型號相同繼電器進行對調使用(不影響其他系統正常工作的前提)。

(2)手冊原處理過程:若QEL柜內接觸器K25工作正常,檢查QEL柜面板上35系列空開35Q01和35Q02是否工作正常。同理,通過上一條分析能夠知道若QEL柜內接觸器K25顯示網絡信號正常,35Q01空開、35Q02一定是處于閉合狀態,因此沒有必要進行此項多余的檢查操作。若QEL柜內接觸器K25顯示網絡信號正常時,應該首先檢查QRK柜S1旋鈕是否置于自動位,只有當旋鈕處于自動位時空調才可以自動對客室內的溫度進行調節,但是旋鈕S1處于何種位置并不會影響K25繼電器的吸合,K25繼電器為空調的網絡啟動信號。S1旋鈕,處于手動位或通風位時和K25繼電器的工作狀態都得是正常的。若S1旋鈕位置正常,下一步應觀察動車組是否有中壓電,若動車組有中壓電而且擴展正常,則應檢查35Q04空開和空調控制柜內的Q1,F12,F4 3個空開。

(3)手冊原處理過程:若廢排風機不工作導致車輛在站臺上塞拉門無法關閉時,可暫時停止本車空調機組工作,待塞拉門關閉后開啟空調。

改進建議:主要是對該條故障進行一個補充,修改后為廢排風機不啟動中:若K12不吸合,用萬用表交流電壓檔測量K12上口405對1283有無AC24V,如AC24V正常,K12不吸合可斷定為接觸器故障,可斷開F11短接K12接觸器1214-402,1215-403,1216-404處理,同時短接其常開觸點1004-1155線,閉合F11。如AC24V不正常,應急時可將1018號線(AC24V)與405短接。(此方法可能造成廢排風機燒損)。 若廢排風機不工作導致車輛在站臺上塞拉門無法關閉時,可暫時停止本車空調機組工作,待塞拉門關閉后開啟空調。

(4)手冊中的原描述為,檢查QEL柜內的接觸器K6是否吸合(見圖1)。如果繼電器K6動作,在中壓供電和動車組網絡都正常的時候,視情況對動車組進行小復位操作,看一看能否清除空調應急通風狀態。

手冊中說明的是應急通風繼電器K6吸合情況下的應急處理過程指的是動車組的應急通風啟動,通過分析和經驗總結,筆者認為該檢查及處理的過程整體存在錯誤,不能夠達到經過應急處理后使動車組恢復正常的目的,該故障發生時并不是網絡故障,小復位也不會起到任何的作用。

修改后的方案,綜合檢查,不僅僅檢查K6,要檢查QEL柜內的接觸器K5,K6,K7是否吸合。如果是K6吸合,K7吸合,K5不吸合,如果出現該現象,那就是啟動了應急通風,最先檢查應急通風按鈕,看一看應急通風是否被人為誤啟動,如果誤啟動將按下的按鈕彈起;如果不是,還需要檢查K6接觸器是否被燒損。另外如果K5不吸合,K6吸合,K7不吸合。代表本節車空調系統沒有3X400VAC電壓,首先檢查動車組的空調系統主電路是否有3X400VAC電壓,若正常,首先檢查F12是否閉合(可能性最大首先檢查),F12為中壓轉換和檢測空開,若該空開不閉合,閉合后故障可以消除。

(5)手冊原始描述為,若壓縮機不工作,檢查電氣柜內的保護繼電器F1,F2 接線是否存在松脫、是否有焦味等。若出現上述現象,需進行修復。若無上述現象,檢查 電氣柜內保護繼電器K27和K28 是否工作正常,若果不正常,則可以判斷為網絡故障,修復動車組網絡。若 K27和K28繼電器工作正常,如圖2所示,檢查 K30繼電器工作亮不亮,如果不亮,首先判斷動車組的通風系統有沒有啟動,如果啟動了,是檢測風壓的開關發生了故障現象,這時需要短接 K30繼電器。

篇7

【關鍵詞】EOC 故障分析

【中圖分類號】TN929.1【文獻標識碼】A【文章編號】1672-5158(2013)02-0427-01

引言

隨著三網融合方案的確定,為了滿足用戶對雙向業務的需求,EOC寬帶上網方式在廣電行業中得到不斷地推廣,利用EOC技術進行有線電視網絡寬帶、雙向化改造,可以有效發揮有線電視網頻帶寬、成本低、易普及的優勢,有利于有線電視網絡建設的快速發展,同時滿足廣大居民的多方面需求,由于有源EOC是一個全新的事物,在改造網絡和發展用戶的時候,經常碰到了一系列的故障那是不可避免的,只有順利解決各種問題,保證網絡的正常運行,才能順利開展業務。

1.EOC技術簡介

EOC (Ethernet over Coax)是用于在同軸電纜上傳輸寬帶數據信號的一種技術,就是將寬帶信號經過調制后與電視信號混合在CATV同軸電纜上傳輸,然后在用戶終端通過Cable model 解調分離出數據信號。可以在不增加布線、不改變原同軸電纜及設備、不需要有線電視雙向改造的情況下,實現了有線電視雙向改造的功能,可以在不影響有線電視信號傳輸和收看的同時通過同軸電纜實現高速上網。

2.常見故障分析

目前廣電在城區及鄉鎮基本上都開展了寬帶上網業務及相關增值業務,而采用EOC技術在廣電行業中占的比例最高,特別在面廣的農村,因此如何有效的做好有線寬帶網中的日常維護工作,確保其安全穩定的運行,這是網絡維護人員的一項非常重要的工作,也是寬帶業務能否順利發展的關鍵工作,下面就本人在維護中遇到的常見EOC網絡故障分析如下。

2.1 用戶時常掉線、速度慢、丟包嚴重

此現象一般是由于該EOC終端至局端之間的衰減接近了臨界值(65dB左右)。為此,維護人員用場強儀確認終端至局端之間的分支分配網絡的衰減在是否在EOC正常工作范圍之內(低頻建議衰減控制

2.2 距離近的用戶能上,距離遠的用戶不能上

此現象一般是由于該EOC局端故障或內部模塊問題, 鏈路衰減比較嚴重,導致距離近的用戶在EOC正常工作范圍之內,距離遠的用戶超出了范圍。

2.3 某個局端下多個用戶經常掉線

出現這種現象有兩種可能:

(1) 源于噪聲,這些噪音出自于某些非EOC用戶使用的家用電器,尤其是某些劣質設備的高頻頭會產生較強的低頻噪音恰好落入EOC工作頻帶,導致EOC系統工作不穩定,此時需要排查和處理噪聲源,通過采用逐級排查方法,排查到噪音源后,在噪音源接入處加一個高通濾波器以阻斷低頻噪音,再重新接入局端。

(2) 局端下接入用戶數太多,超出了一定數量,因帶寬限制,也會造成用戶經常掉線現象。解決方法是增加頭端數量,分散單一頭端下所帶用戶數,減少出問題的可能。

2.4 用戶Cable modem的cable燈不亮

這種現象可能由以下原因引起:

(1)用戶面板處連接不緊密,從而造成了虛頭連接,檢查用戶面板與Cable modem連接;

(2)從EOC終端至EOC局端衰減值太大,超過了Cable modem的接收閥值,可檢查此段線路,調整分支分配器配置。

2.5 用戶Cable modem的cable燈全亮,就是不能上網

這種現象此種情況首先看用戶家里是否有家用放大器,然后看鏈路上的放大器是否調整好(單向放大器需要安裝橋接器,雙向需要反向直通):

(1)如果此時用戶的cable燈間隙性閃爍,說明鏈路上某個分支分配器的接頭沒有接好,使它一直處于虛通狀態,一般由于用戶家的接頭引起。

(2)如果用戶終端的cable燈很暗的時候,很大的可能就是鏈路的衰減過大。衰減過大的可能原因一是因為有有用戶家私拉亂接而引起來的,第二個可能就是鏈路上的分支分配接的太多,需要調整網絡線路。

2.6 用戶能上網,數字電視有馬賽克

針對這種現象,一般為線路接頭分支分配與用戶家的面板是否接觸正常或者在貓前面加高低通隔離,以及用戶線是否存在干擾,還有檢查用戶CATV電平相對低了的話需要調整線路分支分配或者增加光機電平。

2.7 用戶新裝能上網,指示燈全正常,過一段時間后不能上

這種現象表現為重啟EOC局端后,用戶又能上一會兒,過后又獲不到地址,一般是幾個EOC局端之間發生了串擾,通過EOC網管你會發現不能上的EOC終端顯示在其他的EOC局端下面,這時你要調整網絡結構或在上聯設備上做端口隔離。

2.8 其他故障類型

不在上面幾種故障之例的故障, 比如光功率不滿足要求,導致EOC局端上聯ONU掉線,光纜故障、電源故障、用戶家電腦故障、衛星電視串接入有線電視分配網絡等都比較容易處理。

3.結束語

總而言之, EOC網絡就是最后的四百米同軸網絡。做為一個EOC網絡維護人員我們所要做的其實就是保證這最后四百米信號傳輸與設備運行的穩定可靠。對于EOC網絡的故障處理都是基于對故障的了解及多方面分析,由于廣電有線寬帶網絡規模越來越大,也越來越普及,故障的發生是正常的,對于業務的開展是基于網絡穩定的前提下, EOC網絡故障類型很多,本文只簡單介紹了幾種常見的故障分析方案,對于其他一些要在平時網絡維護中經過不斷的實踐攢積經驗與學習新的知識,才能得心應手地去解決問題,保證網絡的正常運行。

參考文獻

[1] 許俊國;EPON+EOC寬帶故障理由和排查思路策略畢業論文《有線電視》;2011年

篇8

關鍵詞:網絡通訊技術;軟件故障;原因;措施

網絡通訊技術的發揮需要借助計算機,這項技術在應用的過程中會因為計算機硬件或者軟件問題而出現故障,其中軟件故障的產生也說明軟件系統結構存在漏洞,還不夠完善,軟件故障產生的原因較為復雜,可以分為內部原因以及外部原因,如果不及時對軟件故障進行處理,可能會導致軟件系統失效等嚴重問題。本文對軟件故障的類型以及具體的解決措施進行了詳細的介紹,希望可以有效的解決網絡通訊技術的軟件故障。

一、軟件故障產生的原因

軟件故障產生的原因可分為兩種類型,一種是內部原因,另一種是外部原因。內部原因指的是計算機內部軟件設計存在一定問題,計算機在人們的生活中比較常見,而且計算機的功能也隨著設計的改進不斷增多,在科技不斷發展的影響下,計算機處理數據的過程也越來越復雜,處理的數據也不斷增多。這些技術的改進使得網絡通訊越來越方便,但是通訊軟件規模在擴大的同時,軟件設計的難度也增大了。計算機軟件設計的難度越來越大,這也考驗了設計人員的能力與技術,有的設計人員由于經驗不足,使得軟件結構存在很大漏洞,造成軟件故障。外部原因指的是軟件在使用的過程中,由于軟件測試缺乏實際性而出現的軟件故障,軟件測試是一項比較重要的工作,其可以檢測出軟件在使用過程中可能存在的問題,并對其進行改進,但是有軟件開發公司,在測試軟件的過程中選用的是開發環境,這與軟件的使用過程并不符合,無法有效的測試出軟件的問題,所以,也無法及時處理軟件的故障。

二、軟件故障診斷

軟件故障的診斷需要遵循一定原則,在診斷的過程中,要在軟件正常運行的狀態下進行故障查找,還要觀察軟件在未使用情況下的表現形式,這樣才能診斷出軟件故障的源頭,并找出具體的應對措施。在當前計算機軟件規模不斷擴大的背景下,軟件開發與設計越來越復雜,在這一過程中,由于設計人員的疏忽出現失誤的情況在所難免,所以,一定要做好軟件的檢測工作,這樣才能使軟件在投入市場后,發揮其應有的功能與效用。軟件故障的診斷需要貫穿其整個設計與使用的過程,要對軟件設計方案、維護技術以及軟件檢測進行故障排查,在這一過程中,需要經歷故障檢測、確定、處理以及交付四個階段,在實際操作的過程中,還需要根據不同的要求對故障檢測進行改進。

軟件故障檢測是一項基礎的工作,其對軟件的處理有著重要的影響作用,在檢測的過程中需要用到很多技術與方法,其中常用的有靜態軟件技術、動態檢測技術、模擬技術等等。在實際檢測的過程中,首先要了解故障的表現形式,對其進行識別與定位,要掌握故障出現的細節問題,在什么進程中出現故障的頻率最高,軟件的操作是否存在不規范的問題等等,只有了解這些細節問題,才能有效的找到處理措施。

軟件定位與確認的階段,需要利用計算機的存儲系統,通過歸納總結、數據分析以及代碼檢測等方法對故障的形式進行診斷,這一過程可以確定故障存在的位置,是故障處理的準備階段。做好定位工作縮小故障范圍越來越小,確定故障位置,盡快制 定出排除計劃。

軟件故障消除是通過分析故障原因和故障定位,對故障 以及故障可能影響到的范圍進行修改、糾正。具體包括消除 的申請與審核、排除計劃的制定、排除計劃執行、復查軟件、軟件回歸測試、審核與交付。具體見下圖。

三、軟件故障的維護措施

要想減少網絡通信故障,使網絡更加穩定可靠,需要對網絡進行全面的維護。對于網絡維護人員,在軟件方面,常見的維護有以下幾個方面:

1、對網絡安全性的維護。對網絡安全性的檢測主要包括。對服務器上安裝的防病毒軟件進行定期升級和維護,并對系統進行定期的查殺毒處理;對服務器上安裝的防火墻做不定期的的系統版本升級,檢測是否有非法用戶入網入侵行為;對聯網計算機上的數據庫做安全加密處理并對加密方式和手段進行定期更新,以保障數據的安全性。

2、網絡通暢性維護。在進行網絡維護的過程,經常會遇到網絡通訊不暢的問題,其具體表現為網絡中的某一結點的其他主機,顯示一個很小的數據包,需要幾百甚至幾千毫秒,傳輸文件非常慢,遇到這種情況 應首先看集線器或交換機的狀態指示燈,并根據情況進行判斷。

3、對交換機 、路由器 以及集線器等 網絡設備進行檢 查,要重點關注其運行狀態以及設備的系統配置。

4、檢查網絡設置,注意服務器是否正常,是否能正常訪問,還要查看協議是否正常。

5、檢測網絡的通暢性 。網絡不通暢是網絡維護中經常出現的問題,具體表現在網絡中的某一點Ping其他的主機,顯示 數據包需要花費幾百甚至幾千毫秒,此時文件傳輸非常緩慢, 這種情況下要查看集線器和交換機的狀態,根據情況做出判斷。

6、網絡安全性的檢測。這方面的維護具體包括:對系統進行定期的查毒殺毒,消滅病毒和木馬;對服務器開通防火墻,保持版本的時常更新,檢測是否有用戶入侵行為;對計算機上 的數據庫做安全加密,保障數據的安全性。

四、結語

網絡通訊技術是一項先進的技術,其在人們的生活中應用比較廣泛,而且給人們的交流與溝通帶來了很大的方便。隨著計算機各項功能的增多,計算機軟件的規模在不斷擴大,各項軟件的設計難度也越來越大,在設計過程中稍有紕漏就會造成軟件故障問題。計算機軟件在投入使用前,需要先對其進行檢測,在這一過程中需要選擇正確的檢測環境,否則會影響檢測的結果,有的軟件開發公司在開發環境下進行使用檢測,這種檢測結果是缺乏實際意義的,容易造成軟件缺陷。為了避免這些問題,相關人員一定要采取通過學習,不斷的提高自己的技術水平,從而使網絡通訊技術越來越發達。■

參考文獻

[1]包東飛.計算機網絡通訊技術故障分析與處理[J].信息系統工程. 2010(12)

[2]黃望宗,楊建軍,彭東.IP網絡故障診斷與排除方法探討[J].計算機工程與設計. 2007(14)

篇9

論文摘要:可信網絡已經成為下一代網絡研究的新趨勢,可信網絡中如何保證網絡可用、可生存是可信網絡研究的重要組成部分。該文對可信網絡的研究內容及網絡可生存性的研究現狀進行了簡介,概述了網絡可用、可生存性是一個綜合管理信息。通過對網絡服務可用性、鏈路生存性、IP網絡生存性及網絡帶寬測量的總結,對可信網絡中如何保證網絡可用進行了展望。

1 研究背景

隨著互聯網規模和應用的快速增長,互聯網已經融入了我們日常生活,成為最大的管理信息系統,但是互聯網的快速發展也帶來了日益突出的網絡安全問題,如網絡病毒、惡意攻擊、垃圾郵件等,導致網絡用戶對網絡的可信度下降。網絡正面臨著嚴峻的安全和服務質量保證等重大挑戰,保障網絡可信成為下一代網絡正常發展的重要保證。“高可信網絡”已被正式寫入國家中長期科學和技術發展規劃綱要,為可信網絡的發展確定了發展目標[1]。

目前可信網絡主要研究的內容包括三個方面:服務提供者的可信,網絡信息傳輸的可信,終端用戶的可信[2]。而可信網絡需要解決的問題包括四個方面:一是建立網絡和用戶的可信模型,二是可信網絡的體系結構,三是網絡服務的可生存性,四是網絡的可管理性[3]。為整個系統建立可行的身份可信和行為可信評估模型,解決了傳統的網絡安全檢測只能針對局部進行檢測的局限。由于單個網絡技術或產品在功能和性能上都有其局限性,以及網絡安全的發展趨勢由被動檢測向主動防御方向發展,需要重新設計一種可信的網絡體系,整合多種技術并在多個平面上進行融合。網絡服務的可生存性是可信網絡研究的一個基本目標,也是網絡基本服務可用性的保障,通常采用容錯、容侵、面向恢復的計算等方式來保障網絡基本服務,同時也可以將網絡服務可生存性理解對冗余資源的調度問題,即為某服務關聯的冗余資源設計合理的調度策略,借助實時監測機制,調控這些資源對服務請求做出響應。

可信網絡中網絡可用、可生存性是一個包含服務可用和資源可用的多方面的綜合要求,不同的用戶群體對網絡可能提出不同的要求,關注不同的重點。網絡用戶和服務提供商主要關注網絡服務的可用性,網絡運營商更關注物理鏈路和IP網絡的可用性。

2 保證網絡可用的研究方面

網絡可生存性指對網絡系統基本服務可用性的保障,即在系統發生故障或者遭受惡意攻擊時仍按照要求及時完成任務的能力,或者重新配置基本服務的能力。網絡可用、可生存性是可信網絡的基礎。

2.1 網絡服務可生存性

網絡服務是下一代互聯網的中心,造成網絡服務失效的原因可歸納為軟硬件故障或網絡攻擊破壞用戶行為。網絡服務可用、可生存性主要指在軟件系統的設計,使用和評估過程中,保證提供服務的安全可靠性和可用性。目前這方面的研究主要包括網絡信息系統可生存性,p2p網絡可生存性,Ad hoc網絡可生存性,網絡態勢分析中服務可用性這幾個方面,研究的熱點在AD hoc網絡和信息系統的可生存性評估。

2.2 網絡鏈路可生存性

網絡鏈路可生存性主要包括對故障的抵抗能力,故障發生后業務的恢復能力,引入了路由機制,可用性評估機制來增強網絡生存性,提高網絡可用性。

傳統的生存機制只考慮一種網絡中發生單一故障的情況,并多采用某種單一的技術實現幫故障鏈路的重新選路,文獻[4]等人針對傳統子網路由法存在的問題,在子網路由法中考慮了對共享分享鏈路組的恢復問題,并引入了選路原則,提出了具有多重故障恢復能力的光網絡生存性機制,提高了網絡的恢復效率同時解決了二次故障的生存性問題[4]。

為了公正的評估網絡生存性,文獻[5,6]定義網絡可用性概念為可用性與阻塞率的平衡點對應的可用性值,設計了動態業務下的網絡可用性算法DNAA來得到網絡可用性值,并定義了網絡的運行性能等于網絡的業務接受率乘以業務要求的可用性,算法在保證網絡具有最好的運行性能下獲得最高的網絡可用性[5-6]。

為了能夠使網絡在出現流量變化和鏈路故障時有效避免鏈路擁塞,增強網絡的生存性,文獻[7]提出了一種通過優化鏈路權值來增強網絡生存性的方案。該方案在選擇鏈路權值時考慮了所有可能的鏈路故障情景和網絡流量的變化,通過引入費用函數對過載鏈路賦以高費用的方法來避免鏈路過載,并利用遺傳算法在所有可能的鏈路權值組合中尋找使鏈路費用之和最小的組合[7]。

2.3 IP網絡可生存性

IP網絡中IP路由具有較好的魯棒性,可以在復雜的網絡故障場景中提供相應的保護和恢復機制,IP網絡的生存性是網絡生存性研究的一個子集,常用的方法為多路徑路由和快速重路由等方式。

隨著交互式應用和各種實時業務的增長對網絡生存性要求的提高,IP網絡的生存性研究受到了越來越多的關注,文獻[8]對IP網絡生存性進行了總結,首先對IP網絡生存性面臨的問題以及影響因素作了概括,并且對目前有關純IP網絡生存性、MPLS網絡生存性、IP網絡與底層的生存性協調研究作了歸納總結,尤其對純IP網絡的生存性研究現狀從多方面進行了比較詳細的介紹,最后指出IP網絡的快速重路由機制具有很好的實際應用潛力,保護恢復能力和服務質量在MPLS網絡中的結合、動態多層保護則是未來IP骨干網生存性維護的發展方向[8]。 轉貼于

多路徑路由機制也是提高IP網絡效率、保障網絡安全的主要方式,也是安全路由機制的重要手段。多路徑策略能夠在局部節點或鏈路因失效而不能進行數據傳輸的情形下,使用備用路徑保證通信的可靠性。針對現有的針對多路徑路由機制的研究大多數是基于實驗觀察和仿真研究,且大多是針對特定應用場景而提出的啟發式算法,缺乏普遍意義。文獻[9]從理論上分析多路徑策略與網絡性能及生存性之間的關系,從點到點網絡入手提出了多路徑機制下的網絡干擾影響模型,對干擾環境下網絡性能的上限進行了探討[9]。

同時為了解決極端環境下的故障處理、故障處理中的負載均衡、關聯故障的處理,文獻[9]定義網絡的可生存性為,系統在受到攻擊、故障、意外事件等情況的影響時能夠及時完成任務的能力,建立了一種基于性能的網絡生存性評估模型,提出了一種基于偏轉路由的故障處理技術,以實現對節點故障以及鏈故障的快速處理,并研究故障處理過程中對負載均衡以及對服務質量的支的問題。提出了兩種極端環境下的故障處理技術,分別針對節點可靠、鏈路不可靠和節點、鏈路均不可靠的情況。提出了基于連通支配集合的重路由技術,應用于節點可靠而鏈路不可靠的情況。

2.4 網絡可用帶寬測量

網絡測量可用于評估網絡的可用性,是重要的網絡性能參數之一,可用帶寬測量在路由選擇,服務質量,流量工程等方面具有重要的作用。一類是基于探測間隔模型PGM,另一類是基于探測速率模型PRM。

為了對網絡可用帶寬進行探測,文獻[10]在參考BFind和PathLoad的基礎上, 針對端到端的網絡、基于包排隊方式的雙向雙步長網絡路徑可用帶寬的探測方法[10]。該探測方法由時延監視和UDP發送兩個進程組成,基于包的排隊時延來獲取路徑的可用帶寬,并通過采用雙向雙步長的方法來遞增或遞減UDP包的發送速率。和PathLoad相比實現更加簡單,可以縮短探測次數和運行時間,和BFind相比降低了探測帶來的開銷。

3 總結

可信網絡已經成為下一代網絡研究的新趨勢,可信網絡中如何保證網絡可用、可生存是可信網絡的重要組成部分。本文對可信網絡的研究內容及網絡可生存性的研究現狀進行了簡介,進一步發現了網絡可用、可生存性是一個綜合管理信息。通過對網絡服務可用性、鏈路生存性、IP網絡生存性及網絡帶寬測量的分析,可以得出對于網絡可用、可生存性的研究一方面需要從可信網絡的體系結構中歸納相應的模型,對網絡可用進行定量測量,同時需要從網絡源端進行保證和完善可信網絡中網絡可生存性的目標。網絡可生存性的研究還可以從資源調度角度出發,為同某服務關聯的冗余資源設計合理的調度策略,調控這些資源對服務需求做出的響應。

參考文獻:

[1] 林闖,田立勤,王元卓.可信網絡中用戶行為可信的研究[J].計算機研究與發展,2008(12):2033-2043.

[2] 林闖,彭雪海.可信網絡研究[J].計算機學報,2005(5).

[3] 林闖,任豐原.可控可信可擴展的新一代互聯網[J].軟件學報,2004(12):1815-1821.

[4] 曲樺,李增智.具有多重故障恢復能力的光網絡生存性機制[J].北京郵電大學學報,2006(S1).

[5] 林蓉平,王晟,李樂民.一種考慮阻塞率的WDM網絡可用性算法[J].電子科技大學學報,2007(1).

[6] 林蓉平,王晟,李樂民.一種基于運行性能的網絡可用性算法[J].電子與信息學報,2006(11).

[7] 于濤,陳山枝,李昕. 一種通過優化鏈路權值來增強網絡生存性的方案[J].高技術通訊,2008(7).

[8] 吳靜,郭成城,晏蒲柳.IP網絡生存性研究綜述[J].計算機科學, 2007(5).

篇10

關鍵詞:移動通信;備份技術;網絡容災

網絡安全是近年來人們最為關心的話題之一,是影響移動通信服務質量的首要因素。在目前的工作中,為了提高網絡傳輸水平和運營商工作效率,移動通信運營商在工作中必須要為用戶提供一個穩定、安全、高質的服務,但是由于在工作中受到工作人員錯誤操作、設備本身故障、自然災害等因素的影響,造成了移動通信網絡節點故障往往都是不可以避免的。尤其是交換設備故障,更是經常產生的一種移動通信網絡故障現象,這主要是由于其設備位置較高、其故障損害較大而引起的?;谶@種社會發展現狀,在目前的移動通信網絡中,各運營商提出了容災備份技術,且經過多年的工作實踐已經趨于成熟。目前常見的容災備份技術主要有以下幾種。

一、HLR設備的容災備份技術

HLR作為目前GSM移動網絡中最為常見的容災設備,是網絡內部所有業務開展的基礎支撐依據,負責著全網用戶數據的搜集和儲存。在目前的一定通信網絡工作中,對HLR設備進行備份是極為關鍵的,其主要的目的在于當HLR在發生重大安全事故且無法在短時間內恢復的時候,則可以在規定的時間內啟動另外一個HLR設備來代替已經發生故障的設備,從而為用戶提供可靠的通信服務,以保證移動通信網絡的服務質量、服務安全。在目前的工作中,對于HLR設備的容災備份技術常采用的方法主要包含有1+1臨時備份方案、N+1實時備份方案和N+1臨時備份方案三種。

1、N+1實時備份方案

這一方案的制定是在網絡系統中每一個HLR設備上配置一個容量、型號、性能相同的備份HLR設備,其中在設置的過程中兩個設備之間的軟件、硬件以及配置功能都是完全相同的。一般來說,在工作中,備份的HLR與主HLR設備之間是通過有關線路進行連接的,并且對于各種數據都是時時刻刻的進行自動備份,這就避免了在設備發生故障之后網絡出現中斷現象,從而滿足了目前人們對網絡環境的穩定、高質和安全要求。但是這種設備備份技術在應用的時候由于方案投資成本大、后期運營成本高,新建HLR的時候必須要對已經建成的設備進行分析,且利用率極低,因此在目前的工作中這種方法只適用于那些故障多發地區。

2、N+1實施備份方案

這種方案是基于N臺主HLR設備的基礎上,采用1臺備份設備作為臨時數據的貯存器。這一臺HLR設備在運行的過程中是針對附近N臺HLR所產生的數據進行備份、分析的過程。在這種基礎上,當N臺HLR設備中其中任何一臺在發生故障的時候,備份的HLR設備能夠及時的接管這一區域的網絡資源和控制工作,保證故障的存在不對全網服務造成影響。其中,在工作的時候是一個發揮效益最好的一種方案。但是由于在工作中受到HLR備份設備容量和能力的限制,造成了在工作中經常會出現一些故障處理不合理、處理不科學的現象,這就給網絡運輸帶來了一定的難題。

3、N+1臨時備份方案分析

這種方案的選用是采用1臺備份HLR設備對N臺主用的HLR設備做服務的。其中備份的HLR設備需要存儲由它在工作中認為需要存儲的數據,從而實現設備效率的最大發揮。在這種基礎上如果是采用N臺設備中存在有1臺HLR設備,那么其設備中的靜態數據很難及時的得到優化,從而造成了設備在使用中存在一定的問題。這就需要對于備用設備的容量給予高度重視,并且對其安裝位置、業務恢復時間進行明確的規定。N+1臨時備份方案的應用對于HLR設備出現故障較低、區域環境災害較少的條件下有著重要的意義和作用,而對于一般區域而言,其在工作中卻是一個極難發揮出應有功能的模式,因此在應用中存在著一定的制約性。

二、軟交換MSC服務器設備容災備份

MSC服務器作為軟交換設備的控制面實體,是移動網中所有業務的基礎支撐網元,負責全網業務的移動性管理和呼叫控制,MSC服務器應急容災系統應遵循最大程度地減少對業務的影響及減少業務中斷時間,提高用戶感知度的總原則,保障移動通信網業務的順利運行。

2.1.N+1主備方案

多個MSC服務器配置一個備份MSC服務器。備份MSC服務器具有所有N個主用MSC服務器的數據。正常情況下Ⅳ個主用MSC服務器承擔各自的業務,備份MSC服務器沒有業務。當某個主用MSC服務器故障時,備份MSC服務器激活該故障MSC服務器相關的靜態配置數據(和動態用戶數據),MGW重新注冊到備份MSC服務器,備份MSC服務器接管故障MSC服務器的、世務。其中備份軟交換擁有主用軟交換相同的信令點和MSC號。此方案倒換時間基本為分鐘級(10min以內)中斷,可以實現自動決策自動倒換。為防止乒乓倒換,應采用人上決策倒換。同時倒換過程不需要其他網元設備配合修改數據。

2.2 1+1互備方案

1+l互備容災方案中,兩個MSC服務器正常時都有自己的業務,并且同時作為對方的備份MSC服務器,當對方故障時,則接管對方的業務,本設備就相當于兩個虛擬MSC服務器。

2.3 MSC池互備方案

多個MSC服務器組成一個池,池內MSC服務器共同工作。池內多個MGW/BSC對多個MSC服務器節點之間是資源共享關系;控制邏輯關系全連接:正常情況下MGW/BSC基于用戶標識以一定算法決定核心網路由,以NRI編號并作為后續尋址方式。MSC服務器故障時,MGW/BSC改變算法將“歸屬”該服務器節點的用戶調整到池內其他服務器節點。MSC池實現了無損、多故障點的資源池容災。并且滿足自動決策自動倒換。但是該種方案倒換以后,用戶必須發起一次主叫或者進行位置更新,才能正常被叫。

三、交換網絡容災備份技術的缺點及對策

1、目前傳統MSC和BSC基于TDM技術,網元容災無法做到快速接管。

2、容災備份大大增加了設備的數據備份和同步維護工作,需運維建立柑關維護制度,投入一定人力。為解決以上問題.需要逐步史換TDM—MSC和BSC來支持VoIP的軟交換設備,把現有MSC/MGW的容災方式向未來的池方式發展,納入到統一維護管理中來。

四、結束語

為降低移動通信網絡核心網元重大故障劉業務的影響,消除單點隱患,各通信運營商已在制定并實施容災方案。由于不同的容災解決方案適用的環境不同、容災的效果不同、對用廣的影響不同、投資效果不同.因此運營商只有綜合考慮各種因素,結合實際情況有選擇地進行容災,才能達到最理想的容災斂果。

參考文獻

[1] 吳成林,景建新. PDSN的容災備份方案和應用分析[J]. 移動通信. 2009(Z1)