網絡故障范文
時間:2023-03-26 08:01:00
導語:如何才能寫好一篇網絡故障,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
本文簡述了作者在維護網絡過程中,遇到的網絡故障及處理方法,希望對大家的網絡維護工作起到促進作用。
計算機網絡的組成
計算機網絡就是利用通訊線路和通信設備,用一定的連接方法,將分布在不同地點的具有獨立功能的多臺計算機系統相互聯結起來,在網絡軟件的支持下進行數據通信,實現資源共享的功能。除了計算機外,用于連接網絡的硬件設備有光纜、光收發器、雙絞線、路由器、交換機、網絡適配器(網卡)等。一般造成網絡不通的大部分原因都是這些設備出了故障。下面我們將對它們出現的故障進行簡要的分析。
光纜和光纖
光纜的故障主要是光纜折斷,由于光纜內部有用于抗拉伸力量的鋼絲,所以光纜自然折斷的可能性不大,但由于道路施工等多種原因,光纜被鏟車挖斷或汽車掛斷的事情還是時有發生。例如,去年四月,我臺的外網光纜被施工的汽車掛斷,幾周后,內網光纜又被其他車輛掛斷。另外,由于傳輸光信號的光纖十分細微,在檢修ODF柜時要特別小心,防止折斷尾纖。工程中對光纖和光纜的彎曲度都有嚴格的要求,實用光纖最小彎曲半徑一般為20~50mm,光纜最小彎曲半徑為200~500mm,等于或大于光纖最小彎曲半徑,光輻射引起的附加損耗可以忽略,若小于最小彎曲半徑,附加損耗則急劇增加。
測量光纜、光纖跳線是否中斷的簡便設備是光功率計。如果察看到光收發器上的RX指示燈滅掉,或用光功率計測量接在光收發器上RX口上的光纖跳線沒有光功率,即可斷定光纜或尾纖折斷,通知網絡公司進行搶修。
尾纖或者光纖跳線出現故障的另一個現象是由于長時間使用,它們的纖芯端面可能會比較臟,對光信號會產生折射或散射作用,造成網絡傳輸速度下降或丟包現象。處理該故障的方法是用醫酒精輕輕擦拭光纖纖芯的端面,稍等一下,待酒精蒸發完畢后恢復連接就可以了。
光收發器
光收發器的作用是將在光纜中傳輸的光信號轉變為適于在電纜中傳輸的電信號。我們在維護網絡工作中遇到的光收發器的故障主要是其電源故障和過熱故障。
電源故障主要是其內部變壓器的線圈燒毀或者整流電容爆裂。線圈燒毀造成變壓器次級電路無法得到電源,而整流電容爆裂造成后面的電路得不到直流供電。如果我們發現正在使用的光收發器的電源指示燈熄滅了,則肯定是其電源部分出了故障。
光收發器的維護還要注意其工作溫度問題。光收發器多位于樓房的單元門口網絡設備箱內,通風不暢,有的網絡設備箱甚至直接被太陽曝曬,造成光收發器工作過熱而死機。表現為用手觸摸光收發器有發燙的感覺,其TX、RX指示燈閃爍緩慢,在連接的計算機上上網時,無法正常瀏覽網頁,有嚴重的丟包現象。這樣,當光收發器的溫度下降以后,該故障會自動解除。
網線
網線分為直連線和交叉線?,F在國際上通用制作網線的標準為T568A和T568B兩種。T568A的標準線序為:綠白、綠、橙白、藍、藍白、橙、棕白、棕,T568B的標準線序為:橙白、橙、綠白、藍、藍白、綠、棕白、棕,兩端的RJ-45頭中的線序一致的雙絞線稱為直通線;而一端為T568A,另一端為T568B的網線稱為交叉線。雖然雙絞線有4對8條芯線,但實際上在網絡中只用到了其中的4條,即水晶頭的第一、二、三和六腳,它們分別起著收、發信號的作用。網線的故障主要表現在以下兩個方面:第一,雖然很多網絡設備都有自適應功能,但有些特殊設備對網線的連接有著特殊要求,例如要求連接兩個設備的網線為交叉線,而我們習慣上大多都做成了直通線。第二,水晶頭制作得不好。水晶頭在制作以前,網線需剝去約1.5cm,不熟練的同志制作時,不是剝去得太長了就是太短了,致使壓下去的水晶頭卡不住網線或網線不能完全插到水晶頭底部與插針良好接觸。事實上,網絡硬件不通的大多原因在于網線的不通。遇到這樣的故障,處理的方法是:1、按照網絡設備的要求,規范制作網線。2、用網線測試儀測試一下網線,若發現不通,重新制作一下水晶頭就可以了。
交換機
交換機的作用是為連接在同一個網絡中的計算機提供信息交換的途徑。家庭用的一般都是沒有管理功能的交換機,其中以桌面交換機居多。例如我臺職工平房宿舍和公寓樓,居住人數不多,使用的多是8換機。維護過程中,發現光纖和網線測試沒有問題,光收發器工作亦正常,但整排平房用戶依然不能上網,后來發現把8換機的電源關閉一下,重新開啟,然后網絡恢復正常。分析原因,可能是該交換機內部有少量的內存,估計是否是交換機遇到網絡風暴死機所致。此種故障在我臺不同的8換機發現了有多次,均用此方法處理,網絡故障均得以很快解決,其詳細原因待查。
光纖耦合器
光纖耦合器,俗稱法蘭盤,在網絡中的作用是定位上一級尾纖或光纖跳線的纖芯與下一級尾纖或光纖跳線的纖芯準確對接,使傳輸的光信號按照設計的路徑繼續向下一級傳輸。我們在維護網絡的過程中,經常遇到光纖耦合器的故障是耦合器中間的塑料套圈發生了變形。
我臺乙機房距離臺區大約有十公里,乙機房與臺區通過光纜進行通信。在維護乙機房網絡的過程中,發現了一個奇怪的現象:乙機房的內網計算機能夠正常瀏覽網頁,但是無論如何使用FTP服務傳送不了數據。沒有辦法,我們從中心交換機到光收發器、光收發器到ODF柜、ODF柜到乙機房光纜終端盒、乙機房光纜終端盒再到內網計算機,一級一級展開查找故障,最終發現是ODF柜上到乙機房的兩芯光纖中的一芯的光纖耦合器中間的塑料套圈發生了變形,影響了光信號的正常傳輸,更換光纖耦合器后故障解除。分析原因可能是塑料套圈變形導致了耦合器定位前后兩條光纖跳線纖芯對接不準,造成光纖傳輸數據率降低,從而出現了網絡不能實現FTP業務但能正常瀏覽網頁的怪異現象。
網卡
網卡簡稱網絡接口卡(Network Interface Card,NIC),是計算機局域網中重要的連接設備之一,計算機通過網卡接入網絡。在計算機網絡中,網卡一方面負責接收網絡上發送給本機的數據包,解包后,將數據傳輸給本地計算機,另一方面將本地計算機上的數據打包后送出網絡。我們在網絡維護工作中遇到的網卡問題是網卡的自適應功能。
我們在維護職工宿舍網絡時,發現有位同事的計算機不能上網,而連接在同一交換機上的其他同事的計算機均能正常上網,測量交換機至故障計算機的網線正常,因而懷疑連接該網線的交換機的端口有問題,隨后將該網線插在交換機的另一端口上,仍然不能上網。后來,修改網卡的屬性,將其“鏈路速率和全雙工模式”由“自適應”修改為“10兆/全雙工模式”,故障計算機上網正常。分析可能是一般的計算機的網卡均支持自適應功能,而該計算機的網卡不支持自適應功能,而我臺的外網開口帶寬速率恰是10Msps。
篇2
某日清晨,一些教師反映不能上網了,網關都Ping不通,仔細觀察,電腦的網絡設置正確,連接指示也沒有大量的數據收發,網關ARP也未被修改,重啟后故障依舊。
教師機的軟件方面似乎沒有問題,也不像被攻擊,是網卡損壞?但昨天還都正常工作,今天不應該數臺同時壞。擬先抓包分析,再定對策。
將教師機網線插入,啟動科來網絡分析系統,不到一分鐘,就抓到很多數據。
可以看出,網絡內充斥著大量的廣播數據,高峰時每秒近4萬個包,這是一個不正常的 地方,第一反應是很有可能被DDOS攻擊。
但看到協議統計后發現,量最大的是一種平時流量很少的NetBIOS廣播數據,這種協議常見于WIN2K以前的網絡應用中,現在的網絡程序一般采用WinSOCK接口,很少使用NetBIOS接口了,許多網絡中甚至都禁用了NetBIOS。這又是一個不正常的地方。是可能有古老的NetBIOS程序在進行拒絕攻擊嗎?
由于校園網已經劃分了VLAN,而VLAN的主要作用就是隔離這種廣播數據包,所以可以肯定這種數據包出自本地子網節點中,查看數據包內容,發現數據均為同一臺電腦所發送,根據MAC,輕易定位到問題源,將其關機。
本以為問題將暫時解決,待隨后再分析原因。但此時竟然發現子網內還是不通,頻密的數據包仍源源不斷地流通,將帶寬耗盡。是有程序在利用虛構的MAC地址進行攻擊嗎?如果這樣就很難定位數據源了。仔細分析數據包,終于發現了問題所在,有大量IP標識相同的數據。IP標示為5618和5616的NetBIOS名字服務廣播包重復出現了2次。這意味著什么呢?
我們知道,在IP協議中,每個數據包IP數據頭內第一個標識位的值應該是唯一的,即系統在發出數據時,對每個數據包連續遞增編號,用來讓對方以正確的順序重組數據。數據包的標識相同,說明某些廣播數據包完成使命后沒有正常消失,而是重新被發回到了網絡中,致使類似數據越來越多,阻塞了網絡。這種現象一般是由于網絡環路所引起,應檢查交換機是否存在環路。
仔細檢查該VLAN的交換機及上聯的交換機,終于發現在上聯的交換機中除了原有的級聯線外又被接了一
根級聯線。拔掉后重啟交換機,網絡故障排除,大家又可以正常上網了。
網絡環路是一種技術很低級、后果很嚴重的錯誤。校園網以前一直能正常運行,怎么會突然出現這種錯誤呢?
后經詢問得知,電腦公司工人前一日為一臺新入網電腦做網線頭,做完后發現有一根網線頭垂在外邊,以為是交換機上的網線意外脫離了,就好心地找了個空口插了進去,其實那是根備用網線。
目前可網管的較高檔交換機均支持STP(生成樹協議),在該協議作用下,即便交換機間形成復雜的環路,交換機仍會自動選擇一條通路,而封閉其他冗余路徑,這樣就不會出現廣播風暴,仍能正常工作。但絕大多數交換機的STP協議狀態缺省是關閉的,需手工打開方起作用。
措施:將所有交換機上連接的網線進行全面排查,暫時用不到的多余線一律妥善收好;凡是支持STP協議的交換機,將其協議狀態打開,避免類似情況再次發生。
經過一番努力,網絡終于又恢復正常,但回頭一想,頗生感慨:布網時,為防萬一,大家都喜歡留根備用線,但平時不用時把它收好了嗎?交換機支持STP協議嗎?開啟了嗎?如果沒有,趕快想對策吧。投資幾十萬、上百萬的網絡,但卻頂不住一根小小的線頭。
參考文獻
篇3
關鍵詞:工業以太網 網絡故障 雜波過濾 電磁屏蔽 網絡結構優化
中圖分類號:TP273 文獻標識碼:A 文章編號:1674-098X(2013)02(c)-00-03
Ethernet/IP工業以太網作為一種新興的行業技術,目前已成為下一代工業產品中最具發展潛力和特點的技術,廣泛應用于采礦、食品生產、污水處理等工業領域,在濟南、廈門、武漢等多家國內卷煙生產廠得到實際應用[5-7],在煙草行業中,Ethernet/IP工業以太網主要應用在煙草制絲的自動化控制環節[7-8]。不同于DeviceNet、ControlNet等傳統的現場工業總線[1],以太網采用帶有沖突檢測的載波偵聽多路訪問協議(CSMA/CD),實時性較差,加上其特有的超時重發機制,使得網絡中單點的故障容易擴散[2-4],給整個網絡通訊帶來沉重的負擔,因此網絡故障對工業以太網的穩定運行造成較大影響。在目前國內外的相關研究中,對于網絡故障發生的具體成因尚無明確的定論,對于應用實例中的網絡故障源頭缺乏有效的排查手段,少數的工業以太網故障排除案例[9]由于網絡構架、硬件設備等與煙草行業應用存在較大差別,其經驗無法得到有效推廣,至今缺少切實有效的方法應對工業以太網的網絡故障。嘗試使用網絡構架優化、傳輸介質改進、現場雜波過濾屏蔽等方法,降低網絡故障的發生頻次。
1 改造前網絡狀況概述
武漢卷煙廠兩條黃鶴樓淡雅香生產線(A線、B線)均使用洛克韋爾自動化公司(Rockwell Automation)的工業以太網,實現“一網到底”的思路[7][10]。整條生產線葉片處理線、葉絲處理線、混絲處理線和加香處理線4個控制工藝段。其中、葉片段的設備構架最為復雜、網絡故障的發生最為頻繁,以葉片處理段為例,嘗試使用多種方法進行改進研究。
黃鶴樓淡雅香生產線葉片段共包含切片、回潮、加料、儲葉共4個工序段。其主要設備包括:1塊Logix5555 CPU、2塊內網網卡、1塊外網網卡、1個遠程IO、3臺交換機、20個分布式子站、32臺變頻器。其網絡構架如圖1。
工業以太網數據傳輸采用競爭機制,在數據通訊量過大時,容易造成網絡阻塞,無法滿足工業控制領域對實時性的要求;從原有的網絡構架中可以看出,所有的20個子站及32臺變頻器組均通過內網網卡1這一通道進行通訊,巨大的數據量造成了沉重的通訊壓力,通訊不暢造成的網絡阻塞常有發生。另由于工業以太網“呼叫―應答”機制的作用,一旦某一網絡節點通訊不暢,會一直發送數據包尋找該節點直到網絡收到該節點的應答響應為止,這種機制會加重網絡負擔,在武漢卷煙廠也片段原有的網絡架構中,一旦某一節點的通訊不暢,則會對整個網絡產生影響。例如一條生產線保養中分斷變頻器電源,則另一條生產線會發生網絡故障中斷生產。
2 改進方法
2.1 對網絡構架進行優化
將黃鶴樓A線、B線以及加料段分離:增加1塊CPU控制A線設備、原有CPU僅作B線控制,并將原有CPU內部控制程序按A/B線進行分離;A/B線加料CPU從原有機架獨立出來自成一體,并使用光纖替代以太網線與原有機架上的CPU通訊;每塊CPU均配置一塊以太網網卡,每塊網卡相互之間不交聯,僅與各自的CPU進行通訊;將所有通訊節點(子站、變頻器)按照A/B線及A/B線加料劃分為4個部分,分別接入獨立的交換機通過各自CPU對應的網卡通訊;A線與B線CPU之間利用機架背板通訊、A/B線加料CPU之間使用光纖通訊。改造后的網絡構架如圖2。
改造后,原有的網絡節點被劃分成4個部分:A/B線及A/B線加料。每個部分通過獨立的通訊通道與CPU通訊。整個網絡由改造前的1個通訊通道連接52個節點變為改造后的4個通訊通道連接52個節點,節點分布狀態如表1。
2.2 對網絡傳輸介質進行改進
由于工業以太網良好的兼容性,武漢卷煙廠從企業信息層到現場控制層采用以太網“一網到底”的思路[7],因此葉片段的網絡傳輸介質以普通以太網的通用8芯網線為主,而這種常規的通用屏蔽雙絞線其內阻、線間電容等參數無法與工業交換機匹配,抗電磁干擾能力較差,傳輸距離上存在限
制[2],網線水晶頭的制作要求高,通訊質量不理想。
西門子原裝Profinet 4芯網線,支持TCP/IP通訊協議,采用雙層屏蔽,抗干擾性好、通訊質量優秀,且配有FC(快速連接)工具,接頭制作質量有保障。將葉片段原有的通用8芯雙絞線統一更換為西門子Profinet 4芯網線,網絡抗干擾能力有明顯增強,網絡報警頻次進一步減少。
3 對于環境雜波干擾進行屏蔽和過濾
在對葉片段的網絡進行了網絡構架的重組和傳輸介質的更換后,網絡故障報警次數大幅減少,但兩條生產線同時生產時偶爾還會出現I/O子站的通訊故障。
①考慮到I/O子站內動力電源以及電機單元頻繁啟動/停止對網絡傳輸造成的影響,將子站通訊網線重新走線,與動力電纜分離,并用金屬管進行屏蔽。
②交換機本身具有過濾雜波和減少沖突域的功能,因此在每個子站中增加一個濾波交換機(在武漢卷煙廠應用中選用帶接地功能的菲尼克斯5換機),由電柜總交換機布放而來的西門子Profinet 4芯網線首先接入子站的濾波交換機,而后通過另一段網線接入I/O子站的網卡。由濾波交換機接入子站網卡的這段網線,最初選用的是同型的西門子Profinet 4芯網線,實際使用效果不好,網絡故障仍時有發生,而當使用非屏蔽的普通8芯安普網線替代西門子Profinet 4芯網線后,網絡通訊質量大大改善,在生產過程中未再發生I/O子站通訊故障。
采用上述多種方法對原有網絡進行改進后,分別統計改進前后5個月的網絡故障報警次數并進行對比,統計結果如表2。
上表數據表明,改進后,網絡通訊質量得到明顯改變,極大降低了工業以太網網絡故障的發生頻次,達到改進的預期效果。
4 結語
應對工業以太網使用過程中頻繁發生的網絡故障,使用多種方法改進原有網絡,基本思路如下:
(1)優化網絡結構,減少單個網絡通道中的數據通訊量;不同生產線、甚至部分重要主機設備實現網絡隔離,避免相互影響。(2)網絡介質選用屏蔽良好、通訊質量優秀的西門子原裝Profinet 4芯網線替代通用8芯雙絞線。(3)注意網絡布線的外界環境,使其遠離動力電源、變頻器等干擾源,并進行良好的電磁屏蔽。在網絡故障發生較高的節點,可增加子交換機進行雜波
濾波。
經過改造,Ethernet/IP工業以太網的網絡故障發生頻次大大降低,網絡通訊質量得到明顯改善,間接提高了生產過程的連續性、一定程度上保證了過程工藝質量。上述經驗可用于所有Ethernet/IP工業以太網應用場合,具有良好的推廣和借鑒意義。
參考文獻
[1] 安淑玉;鄭路;李曉荃.現場總線通信協議分析及現場總線技術應用[J].煙草科技,2004(9):23-26.
[2] 陳昕光,許勇.以太網應用于工業控制系統的實時性研究[J].自動化儀表,2005,26(8):10.
[3] 徐皚冬,王宏,邢志浩.工業以太網實時通信技術[J].信息與控制,2005,34(1):60-65.
[4] 吳愛國,梁瑾,金文.工業以太網的發展現狀[J].信息與控制,2003,32(5):458-461.
[5] 李武杰,鄭晟,陳文輝.Ethernet/IP工業以太網的研究及應用[J].電子設計工程,2011,19(9):26-29.
[6] 高麗,林里,孔若英.EtherNet/IP在工業控制領域的應用研究[J].電腦知識與技術,2007(2):423-455.
[7] 賴林,萬鈾,王建新,等.Ethernet/IP工業以太網在制絲線控制系統中的應用[J].煙草科技,2007(7):14-17.
[8] 普永金.Ethernet/IP工業以太網在煙草行業的應用[J].國內外機電一體化技術,2009(2):10-11.
篇4
【關鍵詞】網絡故障;故障診斷;接口故障
1.計算機網絡故障的分類
一般而言,計算機網絡故障按照排除的難易程度來分,可以分為常規和非常規的;按照故障的性質來分,可以分為計算機硬件故障、計算機軟件故障;根據網絡故障的具體情況又可以分為:物理類故障和邏輯類故障兩大類。
2.計算機網絡故障的分類分析
計算機網絡常規故障是指那些很容易處理的,類似DHCP地址出錯等不用很專業人士都可以進行檢修和修復的故障類型;而計算機非常規故障是指那些不易識別或排除的問題,是需要專業的網管人員通過一定方法進行排除的。
2.1 常規問題
①當我們打開計算機和網絡的時候,有時候會看到網絡連接的圖標已經運行,但是卻打不開網頁,當我們點開圖標,會看到圖標上有數據包無法接收的現象,查看原因就知道是網關出現了障礙,這個時候可以對IP地址或DNS進行重新設置:這些地址是由網管統一設置的,所以在進行設置時更要注意字段和符號問題,必須按照IP地址的分配原則去進行。因為在網絡地址的配置中從1開始到254結束的任意整數都可以成為獨立計算機的IP,每臺計算機的地址無法重復的。還有一種是網絡給出了提示,這樣的障礙是可以這樣來排除的:建立鏈接之后,使用工具從服務器申請DHCP地址,通過從交換機獲得的Cisco發現協議(CDP)報告,檢查工具所連接的交換機端口,并確認子網配置。
②電纜的問題,有些交換機上連接有多臺電腦,在不小心有物品擠壓或是推搡的過程中可能會損害網絡的插口,所以在有時發現計算機上不了網,連圖標也沒有的時候,可以先去觀察下網絡插口處的燈是否是亮的,然后再檢查計算機與插口之間的電纜是否有斷開或是破裂的痕跡,還要看看計算機電攬兩邊的接口是否松動。如果有適當的一點行動就可以使計算機恢復到上網的狀態。一般情況下,端口故障是某一個或者幾個端口損壞。所以,在排除了端口所連計算機的故障后,可以通過更換所連端口,來判斷其是否損壞。遇到此類故障,可以在電源關閉后,用酒精棉球清洗端口。如果端口確實被損壞,那就只能更換端口了。
③有時候在網管進行網絡配置和檢查的時候會發生斷網,可以嘗試著用其他的計算機去連接到辦公室線路,檢查是否可以建立鏈路。如果大家都不可以,說明計算機主機端口可能被網管關閉,所以計算機才無法連接。還要檢測下端口配置以確保端口可用且已按正確的VLAN進行配置。這樣的問題只能與網管取得聯系,請他打開端口并保持配置正常。
④交換機出現短暫的不能工作。因為交換機是由很多模塊組成,任何一個模塊如果發生了情況,哪怕是一些小問題,就有可能使得計算機出現大的損失。所以在正常情況下,注意在搬運交換機時千萬小心,不能使之發生碰撞,然后在電源不穩定等情況下不能使用交換機等等,都能夠有效的保護此類故障的不發生。
2.2 非常規問題
一般來說網絡故障的情況都不會太嚴重,但是也有可能發生大的故障,以下我們可以來看下如何排除大的網絡故障。
最大的故障可能就是遭遇入侵的問題,這是網管覺得最頭痛的地方,也就是安全性故障。通常包括主機資源被盜、主機被黑客控制、主機系統不穩定等。通常情況下,攻擊者可以通過這些進程的正常服務或漏洞攻擊該主機,甚至得到管理員權限,進而對磁盤所有內容有任意復制和修改的權限。但是通常情況下,網管會發現此類故障的查找一般比較困難,一般可以通過監視主機的流量、掃描主機端口和服務、安裝防火墻和加補系統補丁來防止可能的漏洞。舉個例子,某公司突然發現網絡經常不穩定,在網絡不是很多人使用的時候出現了網絡斷掉的情況,一天有三十次之多,于是在網管的盤查下,發現是主機上帶有病毒,才使得經掉線這種情況會出現。于是清除病毒,當然實際上這種情況比我們這里分析的要復雜的多,通常要通過一臺臺計算機的查詢才能找到帶毒的根源。
第二就是主機邏輯發生故障,主機邏輯故障所造成網絡故障率是較高的,通常包括網卡的驅動程序安裝不當、網卡設備有沖突、主機的網絡地址參數設置不當、主機網絡協議或服務安裝不當和主機安全性故障等。在這種情況下,首先要去觀察網卡的驅動程序是否安裝不當。任何使得網絡不兼容的情況都會導致網卡無法正常工作。在觀測一下是否網卡設備有沖突。網卡設備與主機其它設備有沖突,會導致網卡無法工作。磁盤大多附有測試和設置網卡參數的程序,分別查驗網卡設置的接頭類型、IRQ、I/O端口地址等參數。若有沖突,只要重新設置(有些必須調整跳線),或者更換網卡插槽,讓主機認為是新設備重新分配系統資源參數,一般都能使網絡恢復正常。
3.網絡故障診斷及排除
3.1 故障診斷步驟
第一步,首先確定故障的具體現象,分析造成這種故障現象的原因的類型。例如,主機不響應客戶請求服務??赡艿墓收显蚴侵鳈C配置問題、接口卡故障或路由器配置命令丟失等。
第二步,收集需要的用于幫助隔離可能故障原因的信息。從網絡管理系統、協議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。
第三步,根據收集到的情況考慮可能的故障原因,排除某些故障原因。例如,根據某些資料可以排除硬件故障,把注意力放在軟件原因上。
第四步,根據最后的可能故障原因,建立一個診斷計劃。開始僅用一個最可能的故障原因進行診斷活動,這樣可以容易恢復到故障的原始狀態。如果一次同時考慮多個故障原因,試圖返回故障原始狀態就困難多了。
第五步,執行診斷計劃,認真做好每一步測試和觀察,每改變一個參數都要確認其結果。分析結果確定問題是否解決,如果沒有解決,繼續下去,直到故障現象消失。
3.2 接口故障排除
路由器接口的典型故障問題是:帶寬的過分利用;碰撞沖突次數頻繁;使用不兼容的幀類型。使用show interface ethernet命令可以查看該接口的吞吐量、碰撞沖突、信息包丟失、和幀類型的有關內容等。
①通過查看接口的吞吐量可以檢測網絡的帶寬利用狀況。如果網絡廣播信息包的百分比很高,網絡性能開始下降。光纖網轉換到以太網段的信息包可能會淹沒以太口?;ヂ摼W發生這種情況可以采用優化接口的措施,即在以太接口使用no ip route-cache命令,禁用快速轉換,并且調整緩沖區和保持隊列的設置。
②兩個接口試圖同時傳輸信息包到以太電纜上時,將發生碰撞。以太網要求沖突次數很少,不同的網絡要求是不同的,一般情況下發現沖突每秒有三五次就應該查找沖突的原因了。碰撞沖突產生擁塞,碰撞沖突的原因通常是由于敷設的電纜過長、過分利用、或者“聾”節點。以太網絡在物理設計和敷設電纜系統管理方面應有所考慮,超規范敷設電纜可能引起更多的沖突發生。
③如果接口和線路協議報告運行狀態,并且節點的物理連接都完好,可是不能通信。引起問題的原因也可能是兩個節點使用了不兼容的幀類型。解決問題的辦法是重新配置使用相同幀類型。如果要求使用不同幀類型的同一網絡的兩個設備互相通信,可以在路由器接口使用子接口,并為每個子接口指定不同的封裝類型。
參考文獻:
[1]梁西陳.計算機網絡安全技術與管理措施[J].皖西學院學報,2007(05).
[2]陳積慧.高校局域網的組建過程[J].海南廣播電視大學學報,2006(01).
篇5
故障1
關鍵詞:電子穩定控制系統(VSES)
故障現象:一輛2010年產別克昂科雷運動型多功能車,行駛里程3萬km,搭載3.6 L發動機和全時四驅系統。車輛在行駛過程中間歇性出現電子穩定控制系統(VSES)故障燈點亮。檢查歷史故障碼,分別是:DTC U2100——控制器局域網(CAN)總線通信;DTC U2142——與橫向偏擺率傳感器(YRS)失去通信:DTCC0710——向盤位置信號:DTC C0186——橫向加速計電路(有時);DTC C0196——橫向偏擺率電路(有時)。
該車此前進行過2次維修:第1次來廠,VSES故障燈間歇點亮,清除故障碼后試車,故障未再現,于是交車,但不久后故障燈又再次點亮。第2次進廠檢修,維修人員調取故障碼,與上次一樣且都為歷史碼。通過檢查發現2后輪在外更換過,大小與前輪不一致,懷疑這會影響車輛穩定控制系統工作,于是要求更換輪胎,更換輪胎后反復試車,故障未出現,于是再次將車交換客戶。不幸的是,不久后車輛因此問題第3次進廠了。
檢查分析:筆者接車后首先用專用診斷儀TECH2查看故障碼,有以上故障碼。通過分析故障碼可以發現:首先故障是與網絡通信有關,其次是出現網絡故障的范圍主要集中在底盤高速網絡上(圖1)。它們的信息是通過高速網絡傳遞給其他控制單元及診斷接口DLC的6號和14號針腳(圖2),電子制動控制單元(EBCM)同時處在這2個網絡中。最后,底盤高速網絡中轉向盤位置信號、橫向加速計信號以及橫向偏擺率信號可作為突破口。查看TECH2數據,很快發現一個明顯異常:“轉向盤位置”一直為86°(圖3)不動,正常情況下隨著左右轉動轉向盤數值有正負值的變化。
是否因為這些信號出現異常影響到底盤高速網絡,于是重點檢查轉向盤位置傳感器線路,拆開轉向盤位置傳感器插接器測量:5號腳點火電壓12V正常,6號腳搭鐵良好。測試底盤高速CAN—H串行數據線3號和37號腳:2.5~3.5 V,CAN-L串行數據線2號和24號腳:1.5~2.5 V(無短路、斷路)。斷開EBCM控制單元插接器測量通斷也是良好的,測試線路未見異常。
筆者決定更換轉向盤位置傳感器,進行對中學習后查看數據流:“轉向盤位置”在-525°~+525°變化,完全正常。沒有直接證據表明轉向盤位置傳感器存在故障,并且再次裝回舊的轉向盤位置傳感器,數值變化也正常了。為防止再次返工,于是利用TECH2監控連續試車,重點捕捉顛簸路面試車數據。試車結束后仔細查看和比對捕捉的數據流,結合實際試車路況發現了異常:在轉彎路口過一個較大減速帶時,數據流中“轉向盤位置”瞬間保持在53。不變,數據流中的“VSES失敗”也由否變為是,但很快又恢復正常(圖4)。雖然未能馬上點亮故障燈,但已經足夠表明故障依然未排除。
根據以上檢查分析可能原因:線路因振動接觸不良、短路或控制單元因振動出故障。故障又是間歇性出現,因簡易程度及可能性下一步重點還是檢測線路。為了驗證這一假想且更直接地把故障再現出來,排查相關線路和控制單元的過程中,當一人用手晃動EBCM線束插接器,另一人邊轉方向邊看TECH2內數據時,發現相關數據出現異常。嚴重時儀表中擋位信息也無顯示,這是因為擋位信號是變速器控制單元(TCM)接收到擋位開關信號后,通過相關的CAN網絡串行數據線送給儀表的,而因為CAN網絡鏈中EBCM處出現異常,導致整個網絡鏈中故障的出現。而其中“轉向盤位置”信號也是因為類似原因導致故障。
故障排除:基本故障點已確認,處理EBCM線束插接器,分解端子注入導電膠并固定(圖5)。反復試車、查看數據流及交車給客戶使用故障末再出現,至此故障完全排除。
故障2:
關鍵詞:偏擺及側向加速度傳感器控制單元
故障現象:一輛2011年產別克GL8豪華商務車,行駛里程6萬km。因ABS故障燈亮、電子穩定系統故障燈亮進廠維修。讀取故障碼,有多個C類故障碼:DTC C056D——電子控制單元硬件;DTC C0121——閥繼電器電路故障;DTC C0800——控制模塊電源回路等。還有網絡通信故障:DTC U0121——發動機控制單元(ECM)與電子制動控制單元失去通信;DTC U0121——變速器控制單元(TCM)與電子制動控制單元失去通信:DTC U0140——ECM與車身控制單元失去通信;DTC U0100——車身控制單元(BCM)與發動機控制單元失去通信等多個u類故障碼。EBCM有時用專用診斷儀GDS+MDI無法通信,于是更換EBCM,但更換后,嘗試模塊編程,不能成功進行(因為還是有時不能通信),還多了DTC C056E——電子控制單元軟件(圖6),并且故障依舊。
檢查分析:筆者接車后了解到情況:更換EBCM前后DTC基本一樣,之前維修人員更換EBCM依據是EBCM內的DTCC056D——電子控制單元硬件,維修手冊對此故障碼的說明是“硬件、內部故障、不涉及外部電路等”(圖7),并且檢查EBCM控制單元的電源、搭鐵無異常。分析DTC又是有關網絡通信的故障,范圍也是縮小到底盤高速網絡以及底盤高速網絡中的主要控制單元EBCM有時不能通信。
筆者根據電路圖(圖8)先對這明顯單一網絡(也是雙線高速一種)故障進行測量,通過診斷接口DLC的12及13號腳測量其網絡靜態終端電阻,約為60.1Ω(圖9)正常;測試CAN-H和CAN-L線路的電壓,無對搭鐵或電源短路,也無開路。通過簡單的以上測量可以說明在這個網絡中連接線路通信是沒問題的,于是接下來主要針對EBCM進行測量。
再次檢查影響EBCM控制單元工作的電源、搭鐵和喚醒線。查看EBCM內的數據流發現有異常:“系統電壓”在0~11 V不停跳動,正常應是穩定的蓄電池電壓,(圖10中為8.27 V)。對照“防抱死制動系統電路圖(控制單元電源、搭鐵和子系統參考)”(圖11)測量線路,電源1號腳、25號腳電壓12 V且用試燈測試明亮,搭鐵13號腳、38號腳與負極電阻為0.5 Ω正常,處理各搭鐵點也未發現異常;EBCM控制單元啟用的喚醒線35號腳,在休眠狀態時為0 V,喚醒時為12 V,也非常正常;線插接器也未發現接觸不良等異?,F象。
是什么原因導致數據流中的電壓不穩定,這應正是間歇產生U類碼、診斷儀GDS+MDI無法通信的原因,但實際測試似乎相關電源和搭鐵都沒有問題。再次仔細閱讀所有EBCM電路圖,發現EBCM還為轉向角傳感器(B99)及偏擺及側向加速度傳感器(B119)提供電源及搭鐵,16號腳為它倆提供搭鐵,打開點火開關32號腳提供12 V電源(圖12)。分別斷開轉向角傳感器B99、偏擺及側向加速度傳感器B119插接器進行測試,結果搭鐵線路正常,但電源線路2087在連接著B119測B99的電源時有異常,只有2.75 V且不穩定(圖13);但連接著B99測B11g的電源就是正常的12 V。測量EBCM、B99和B11g問的12 V電源線2087無接觸不良、短路等異常?;謴途€路,但不連接B11g插接器,然后再次查看EBCM控制單元內數據“系統電壓”為穩定的12 V電壓,至此故障已基本明了。
故障排除:更換偏擺及側向加速度傳感器控制單元(B119),故障完全排除。由于EBCM、B99、B119是共用2087電路,B119傳感器內部故障造成此電路電壓不穩定,進而影響到EBCM的正常工作,相應的網絡通信在此電路電壓過低時就會出現中斷。
回顧總結:車輛網絡故障通常會有包括U類在內大量的故障碼,面對大量的故障碼和故障現象,可能會使人茫然,不知從何下手。對于處理此類故障我認為首先應通過診斷儀讀取全車故障碼,并分析維修方向:全車網絡通訊故障;單個網絡有通訊問題;只有一個控制單元問題。然后根據以上方向來制定具體檢測方法。
(1)全車網絡通訊情況都有問題的,主要檢查診斷儀的連接狀態、DLC(X84數據鏈路連接器)的針腳連接狀態和電源及搭鐵線路、DLC至網關BCM的連接線束及BCM本身狀態、電源及搭鐵等。
(2)單個網絡無通訊主要是對該網絡連接具體的測量。剛好這2個案例都是底盤高速網絡出現問題,就此說明如下:首先要通過DLC測量高速網絡靜態終端電阻,正常值約為60Ω;其次測量CAN-H和CAN-L線路的電壓,是否對搭鐵或電源短路、是否開路等,如有必要可以用示波器去觀察、對比故障車與正常車波形信號的差異(正常情況是CAN·H為2.5~3.5 V和CAN-L為1.5~2.5 V的方波信號),并加以分析判斷。
(3)只有一個控制單元無通訊,首先查看相關電路圖,然后考慮以下問題。
①網絡通信線出現斷路、短路或者信號電壓異常。
②控制單元故障:控制單元電源、搭鐵或控制單元內部故障。如故障2中所有的外部電源無任何問題,但網絡中各元件問的電源線路同樣須注意,否則就會產生像之前更換EBCM的誤判。
③t喚醒線故障,因為控制單元如處在休眠狀態,就談不上通信了。
篇6
【關鍵詞】網絡故障 物理故障邏輯故障 維修方法
【中圖分類號】TP393.01 【文獻標識碼】A 【文章編號】1672-5158(2013)04-0169-01
研究背景
計算機網絡是由計算機各種軟硬件和通信相關設備組成的系統,即利用各種通信手段,把空間上分散的計算機連在一起,達到相互通信而且共享軟件、硬件和數據等資源的系統。隨著計算機網絡的發展,人們的生活得到了巨大的便利,但計算機網絡的連接多樣性、終端分布不均勻性和網絡的開放性、互連性等特征,網絡故障也越來越多,目前在各單位的網絡中都存儲著大量的信息資料,幾乎所有是工作也依賴于網絡,一旦網絡被破壞造成信息的丟失將帶來巨大損失。加強因此怎樣解決網絡故障是我們要面對和解決的重要問題,本文就是通過計算機網絡故障進行分析并提出相應的對策,最后達到更好的運用計算機網絡的目的。
常見網絡故障
連通故障
連通故障又可以稱為物理故障一般,即物理層中物理設備相互連接失敗或者硬件及線路本身的問題:一是線路的連接故障,由于網線在使用過程中的損壞老化,或者接口處的松動等造成的網絡連接故障。二是由于接口配置問題的物理故障,即由于接口的松動或者其他因素的損壞,使網線無法正常接入以及此類相關設備損壞導致故障。三是網卡的物理故障,主要是指由于網卡松動,使網絡連接失效。
邏輯故障的種類
計算機網絡的邏輯故障又稱軟件故障,主要是指軟件安裝或網絡設備配置錯誤所引起的網絡異常,其中最常見的是網絡設備配置錯誤。邏輯故障與連接故障相比復雜得多。常見的網絡邏輯故障有:主機邏輯故障、進程或端口故障、路由器邏輯故障等。主機邏輯故障通常包括網卡驅動程序、網絡通信協議安裝錯誤、網絡地址參數配置不正確等。進程或端口故障是指進程或端口由于受到病毒或系統的影響而無法啟動。路由器邏輯故障是指因為端口的配置錯誤而導致的網絡故障,如路由器CPU利用率高和路由器內存余量太小以及SNMP進程意外關閉而造成的故障。另外網絡地址的安全問題,也是計算機網絡故障之一。網絡用的TCP/IP協議本身就是一種安全風險,大量重要程序都以TCP為傳輸層協議,因此TCP的安全性問題會給網絡帶來嚴重的后果。四是網絡結構的安全問題?;ヂ摼W由無數個局域網組成,通常情況下計算機之間互相傳送的數據流要經過重重轉發,因此,攻擊者只要接入任一節點就可以捕獲所有數據包從而竊取關鍵信息。
計算機網絡安全的相關技術
雖然計算機網絡面臨著諸多的安全問題,但是目前已有比較成熟的網絡安全技術,包括防病毒軟件、防火墻、入侵檢測、安全掃描等多個安全組件組成,主要有防火墻技術、數據加密技術、入侵檢測技術、防病毒技術等。
防火墻技術:
“防火墻”既可以阻止外界對內部網絡資源的非法訪問同時也可以防止系統內部對外部系統的不安全訪問,其主要技術包括:數據包過濾、應用級網關、服務和地址轉換。
數據加密技術:
加密的目的是保護網絡節點之間的鏈路信息安全,可以進行數據加密、身份鑒別、訪問控制、數字簽名、數據完整性驗證、版權保護等,用戶可根據網絡情況選擇對稱密鑰密碼體制和非對稱密鑰密碼技術等不同的加密方式。信息加密過程操作簡單,但是意義重大,在多數情況下,信息加密是保證信息機密性的唯一方法。
入侵檢測技術:
分別基于網絡和基于主機。由于網絡的入侵檢測系統主要采用被動方法收集網絡上的數據。目前,在實際環境中應用較多的是基于主機的入侵檢測系統,它可以不受網絡協議、速率和加密的影響直接針對主機和內部的信息系統同時還具有檢查木馬等功能。
防病毒技術:
網絡防病毒軟件則主要注重網絡防病毒。嘗試利用360安全衛士等具有殺毒和軟件修復功能的瀏覽器或Firefox瀏覽器,可以清除病毒,防止病毒軟件對計算機網絡系統的破壞。
安全對策以及維護方法
對計算機網絡的維護包括對硬件的維護和對軟件的維護。對硬件的維護包括檢測聯網電腦網卡、網線、集線器、交換機、路由器等故障、計算機硬盤、內存、顯示器的維護。首先要仔細檢查計算機網卡是否運行正常,檢查網線以及網卡指示燈,如果出現故障,應及時更換網線,集成器等部件。檢查網絡插口股,在網絡連接過程中,會因為物品擠壓以及不小心造成的損壞,以及接口處的松動,而導致計算機無法聯網,此時應對計算機與插口間的電纜線進行檢查。利用測線儀等工具測試網線、接口、網卡以及交換機端口是否正常。對由于路由器配置錯誤會導致的故障,方法就是重新配置路由器端口的靜態路。如果是由,只有對路由器進行升級、擴大內存。
對計算機軟件的維護包括計算機網絡設置的維護,對網絡安全l生的檢測,以及對網絡通暢性的檢測。多為瀏覽器本身故障或被惡意軟件篡改破壞,導致無法瀏覽網頁,對網絡設置的維護。首先,檢查Ping線路近端的端口是否處于關閉的狀態,若是因為端口處于關閉狀態,只需重新啟動該端口即可。檢查lP地址,TCP/IP選項參數是否正確,當所填參數有誤時,可以通過lP地址,TCP/IP選項參數進行修改核對。對網絡安全性的維護包括安裝殺毒軟件,經常性的進行查殺毒處理,安裝的防火墻,設置高密的防治網絡安全入侵的加密處理,定期的對網絡加密設置進行更新。例如及時查殺病毒并,避免使用非正規的磁盤,不要打開垃圾郵件,不要隨意點擊非法網站。
篇7
網絡故障管理是網絡管理的一個重要組成部分。故障管理的有效與否和功能強弱直接關系到被管理網絡的可用性和可靠性。傳統的基于SNMP的網絡故障管理模型是以Client/ Server 技術為核心的集中故障管理方式。它通過不斷輪詢被管對象 Agents (Servers) 和接收 Agents 的報告(Trap)兩種機制獲得故障信息。該機制主要存在兩個方面的問題:(1) 缺乏靈活性、可擴展性和本地處理能力,難以適應現代網絡的故障管理的需要;(2)冗余信息過多,網絡管理效率低下。
解決以上問題的基本思想是使管理智能和移動性盡可能地靠近被管設備資源。移動Agent本質上是一種可以從異構網絡環境中的一臺主機移動到另一臺主機并可與其它Agent或資源交互的軟件實體。因此,移動Agent成為網絡故障管理的理想選擇。故障檢測在故障管理中具有重要的地位,本文提出了一種基于移動Agent的故障檢測系統。
2 移動Agent簡介
軟件Agent是運行于動態環境的、具有高度自治能力的實體,它能夠接受其它實體的委托并為之服務。移動Agent是一類特殊的軟件Agent,它除了具有軟件Agent的基本特性――自治性、響應性、主動性和智能性外,還具有移動性,即它可以在網絡上從一臺主機自主地移動到另一臺主機,代表用戶完成指定的任務。雖然目前不同移動Agent系統的體系結構各不相同,但幾乎所有的移動Agent系統都包含移動Agent(簡稱MA)和移動Agent服務設施(簡稱MAE)兩個部分。
移動Agent是一個全新的概念,雖然目前還沒有統一的定義,但它至少具有如下一些基本特征:
身份唯一性
移動Agent必須具有特定的身份,能夠代表用戶的意愿。
移動自主性
移動Agent必須可以自主地從一個節點移動到另一個節點,這是移動Agent最基本的特征,也是它區別與其他Agent的標志。
運行連續性
移動Agent必須能夠在不同的地址空間中連續運行,即保持運行的連續性。具體說來就是當移動Agent轉移到另一節點上運行時,其狀態必須是在上一節點掛起時那一刻的狀態。
3 基于移動Agent的網絡故障檢測體系結構
故障檢測是故障管理的基礎,目前對數據包的監測是獲取有關節點、應用程序和故障類型等信息的最有效的方法。在傳統的集中式的檢測模式中,大量的無用數據包發送到管理器。這種無用的數據包大大增加了網絡管理器的負擔。另外,由于所有的故障判定都是由網絡管理器完成的,對于實時性較強的故障有時就很難檢測,因為它不能在本地進行處理,必須送到網絡管理站之后才能進行判定。
為了解決這些問題,我們將移動Agent技術引入到故障檢測中。它能夠提高網絡故障檢測的靈活性和分布性。對于集中式模式的信息交換,管理器可以將多個能完成特定任務的移動Agent發送到需要任務處理的設備上,這些Agent能夠從一個節點移動到另一個節點。這樣,平時許多原始的管理信息可以就地處理,這就大大減輕了網管平臺的開銷。
3.1 基于移動Agent的網絡檢測系統模型
基于移動Agent的網絡檢測系統模型如圖1所示,模型由網絡管理工作站、MA和具有移動Agent執行環境(MAE)的被管理節點這3個部分組成。網絡管理站根據管理任務生成并派遣移動Agent,處理它所返回的數據。移動Agent可以按照管理站預先規定的路線和策略在各被管節點間遷移并收集數據和進行網絡管理操作。被管理節點上存在移動Agent執行環境,執行環境接受移動Agent并且提供對本地資源的訪問。網絡管理站根據不同的管理任務,派遣相應的移動Agent到各個被管理節點執行管理任務。這些移動Agent在每一個被管理節點完成管理任務后攜帶相關的信息返回管理站,或者依次遷移到多個被管理節點,分別完成相應的管理任務后返回管理站。
由移動Agent來實現故障檢測具體包含以下步驟:
(1) 給移動Agent加載實現故障檢測所需的智能,此過程又稱為功能委托。
(2) 移動Agent按照它的通信特性與管理者互相作用。此過程的主要目的是從管理者收到的消息中獲得相關狀況的本地信息。
(3) 移動Agent過濾掉告警中重復發生的告警,并將余下告警代替與某一特殊模式相匹配的一系列告警和一個新的告警相互關聯。隨后,移動Agent完全自主地移動到產生告警的網元。這一過程充分體現了Agent自治性和智能性的本質。
3.2被管節點(網元)結構模型
移動Agent執行環境(MAE)是支持Agent系統的關鍵部分,移動Agent與系統的交互、網管操作的完成以及對本地資源的訪問均由它來控制和支持,它包括認證服務、資源管理和通信模塊。
在簡單網絡管理協議(SNMP)中,管理應用與SNMP進行通信來完成各種網管操作。我們保留了傳統網管系統對網元的成熟技術(數據采集技術),設計移動Agent(MA)與SNMP的交互接口。
在基于移動Agent的網絡管理中,我們希望Agent實現其完備的自主性和自學習性,實現其真正的智能化,即對于那些曾經成功處理過的案例將被記錄下來,在下次遇到此類故障時,Agent就可以直接從策略庫中提取出來進行處理。因此我們設計了處理策略數據庫。
4 仿真實驗和數據分析
為了對系統的性能進行測試,我們在局域網上進行了實驗。此局域網是由10個節點組成的以太網。管理站配置為P4 2.8G Hz CPU和1G Ram,操作系統為windows2000 Advanced Server,100Mbit/s帶寬接入局域網;其他節點配置為P4 750M Hz CPU和512M Ram,操作系統為windows 2000 professor ,我們采用將部分節點仿真為路由器,每個節點的網絡帶寬缺省為l0Mbit/s,每條鏈路的帶寬變化服從均值為8Mbit/s的高斯分布。
為了測試系統對網絡故障的檢測能力,我們與傳統的SNMP網絡檢測的性能進行了比較。兩個系統設置合適的過濾器,以獲得事件信息用來捕獲數據包,兩個系統都分析了捕獲的數據流量,識別出故障特征。實驗結果如圖3所示。
從圖中可以看出,采用傳統的SNMP網絡故障檢測帶來的網絡流量要遠大于基于移動Agent結構的網絡故障檢測產生的流量。
5 結束語
本文提出的基于移動Agent的網絡故障檢測是一種新型的故障檢測方法,它摒棄了傳統的網絡檢測中管理站在某一位置的固定處理方式,利用了移動Agent的智能性、移動性和自主性優點,從而減輕了管理站的計算負載,同時還提升了網絡檢測系統的主動性、靈活性和重構性。移動Agent的遷移策略和安全性問題,包括移動Agent的合法性驗證和攜帶數據的保護是我們下一步的研究目標。
參考文獻
[1]楊家海,任憲坤,王沛瑜.網絡管理原理和實現技術[M].北京:清華大學出版社,2000.
[2]李治文,孟洛新,元峰.網絡管理環境下移動技術應用研究的現狀、問題與展望[J].電子學報,2002,30(4):564-569.
[3]周偉,王汝傳,徐小龍.基于移動的網絡故障管理的研究[J].微型機與應用,2004,(2):29-32.
[4]陳志,王汝傳.基于移動的網絡故障管理模型的研究[J].通信技術,2004,2 85-86,98.
篇8
關鍵詞:網絡 故障 排除
0 引言
如今因特網是極其龐大和復雜的,盡管其形式和內容都在發生巨大的變化,但是網絡在初期設計和建造中,都采用分層次的結構,這種體系結構使得各種不同硬件和軟件快速連接到網絡,網管員在分析和排查網絡故障時可充分利用這種分層結構,快速準確的定位并排除故障,達到事半功倍的效果,本文就對如何分層排除網絡故障作以介紹。
1 系統化排錯策略
網絡故障排除是一門綜合性技術,涉及到網絡技術的方方面面,所以當聽到“網絡癱瘓了”,對于網絡管理員來說,首先應該是鎮定,其次開始第一步,分析網絡故障時,首先要清楚故障現象,應該詳細說明故障的現象和潛在的原因,然后確定造成這種故障現象的原因的類型。例如,主機不響應客戶請求服務??赡艿墓收显蚴侵鳈C配置問題、接口卡故障或路由器配置命令丟失等。第二步,收集需要用于幫助隔離可能故障原因的信息,如向用戶、網絡管理員、管理者和其他關鍵人物提一些和故障有關的問題。廣泛的從網絡管理系統、協議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。第三步,根據收集到的情況考慮可能的故障原因??梢愿鶕嘘P情況排除某些故障原因。例如,根據某些資料可以排除硬件故障,把注意力放軟件原因上。對于任何機會都應該設法減少可能的故障原因,以至于盡快的策劃出有效的故障診斷計劃。第四步,根據最后的可能的故障原因,建立一個診斷計劃,開始僅用一個最可能的故障原因進行診斷活動,這樣可以容易恢復到故障的原始狀態。如果一次同時考慮一個以上的故障原因,試圖返回故障原始狀態就困難的多了。第五步,執行診斷計劃,認真做好每一步測試和觀察,直到故障癥狀消失。第六步,每改變一個參數都要確認其結果。分析結果確定問題是否解決,如果沒有解決,繼續下去,直到解決。網絡故障的發生時很常見的事情,而對于網絡管理員來說,就是去解決這種網絡故障,恢復網絡運行,改善和優化網絡的性能。因此部署一種能夠排除不同可能性并一步一步朝網絡問題的真實原因前進的技術方案是非常關鍵的步驟,一個較好的故障排查方案圖如下:
2 分層排錯
網絡的故障到底出在什么地方?這對于很多初級網絡管理者來說是一件麻煩的事情,但是對于網絡來說,為了降低設計的復雜性,增強通用性和兼容性,計算機網絡都設計成層次結構。這種分層體系使多種不同硬件系統和軟件系統能夠方便地連接到網絡。管理員在分析和排查網絡故障時,應充分利用網絡這種分層的特點,即根據OSI七層結構的定義和功能逐一的分析和排查這是最好最快的方法。OSI的層次結構為管理員分析和排查故障提供了非常好的組織方式,由于各層相對獨立,按層排查能夠有效地發現和隔離故障,因而一般使用逐層分析和排查的方法。在應用分層思想的可以有不同的思路,可以采用自下而上的方法,也可以采用自上而下的方法,自下而上是指從物理層開始檢查直到應用層;自上而下是指從應用協議中捕捉數據,分析數組統計數據和流量統計信息以獲得有價值的信息。OSI把網絡分成了七層,從下至上(1層到7層)分別為物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層、應用層,這七層模型描述了信息如何通過網絡介質從一臺計算機的軟件應用傳輸給另一臺計算機的軟件應用,這七個層次相對獨立,完成相應的網絡功能。OSI的上層(5至7層)處理應用問題,并且通常只實現在軟件中。應用層最靠近終端用戶。OSI的下層(1至4層)處理數據傳輸問題。物理層和數據鏈路層實現在硬件和軟件中。網絡層和傳輸層一般只實現在軟件中。①在查看物理層時,此時應該做的第一件事情就是檢查網絡線路。計算機后面的網卡綠色指示燈是否亮?很多情況下,你會發現這僅僅是線路存在問題。你可能也遇到過比較罕見的情況,由于線路接口比較松,加上用戶的經驗不足,所以看上去是插著的,但實際上并沒有接觸。因此應注意連接電纜是否正確,Modem、CSU/DSU等設備的配置及操作是否正確,確定路由器、交換機、防火墻等設備接口是否完好的主要通過show interface命令,檢查每個端口是否UP,查看傳輸模式、傳輸速度、協議建立狀態等。②在確保物理層完好的情況下,應特別注意數據鏈路層,因為所有網絡層及網絡層以上的應用都建立在數據鏈路層的正常工作。數據鏈路層主要關注于相連設備的互連參數,比如封裝協議、信令格式等。③網絡層是計算機通信的關鍵層,因此網絡層檢查時要注意利用Ping命令和Traceroute命令檢查網絡的連通性。網絡層提供建立、保持和釋放網絡層連接的手段,包括路由選擇、流量控制、傳輸確認、中斷、差錯及故障恢復等。排除網絡層故障的基本方法是:沿著從源到目標的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現,應該通過檢查來確定是否已經輸入適當的靜態路由、默認路由或者動態路由。然后手工配置一些丟失的路由,或者排除一些動態路由選擇過程的故障,包括RIP或者IGRP路由協議出現的故障。④在協議層的高層涉及到協議故障比較多,故障處理起來越來越困難,因此管理員需要懂得協議之間如何工作。首先管理員應清楚有那些程序可用,可以利用Telnet終端模擬應用程序,它可以提供對大型主機、UNIX系統、路由器、交換機等的應用程序和相關配置的命令行訪問方式。同時可以使用端口掃描器判斷哪些端口正在使用,以及借助協議分析儀(如微軟提供的網絡監視器)捕捉相應的RIP信息和UDP報頭,大多數傳輸層錯誤主要表現在ACL和NAT上面。另外日志對于網絡安全來說非常重要,記錄了系統每天發生的各種各樣的事情,你可以通過日志來檢查錯誤發生的原因,或者受到攻擊時攻擊者留下的痕跡。路由器的一些重要信息可以通過syslog機制在內部網絡的Unix主機上作日志。在路由器運行過程中,路由器會向日志主機發送包括鏈路建立失敗信息、包過濾信息等等日志信息,通過登錄到日志主機,網絡管理員可以了解日志事件,對日志文件進行分析,可以幫助管理員進行故障定位、故障排除和網絡安全管理。當網絡故障排除后,管理員應及時做好記錄,以便日后查看和使用。⑤而對于應用層來說,可以使用程序本身進行調試和排錯。
3 總結
企業網絡是個復雜而龐大的體系,任何一個細小的錯誤都可能導致整個網絡的癱瘓,對于網絡管理員來說,要從故障現象出發,以各種手段收集更可能多的信息,確定故障點,制定各種排錯的計劃并執行,直至排除故障。隨著計算機網絡體系的不斷壯大,也會越來越復雜,但是萬變不離其宗,那就是按照分層次結構去排查,同時將所掌握的知識有條理的系統的方式應用到診斷和排除網絡故障中去,就可以達到事半功倍的效果。
參考文獻
[1]秦東.企業網絡故障.電子工業出版社.2007.6.1.
篇9
Abstract: With the development of the times, the computer network is becoming more and more porpular ,network various faults also emerge as the times require. According to the practical case, this paper makes a preliminary discussion on how to handle network failures,which has certain help to network maintenance staff.
關鍵詞: 網絡;故障處理;實際案例
Key words: network;fault processing;typical case
中圖分類號:TP31 文獻標識碼:A 文章編號:1006-4311(2013)08-0183-02
0 引言
在信息化快速發展的今天,網絡已經滲透到社會生活的各個領域,已經成為人們日常工作和交際中的重要組成部分。而隨著網絡重要性的日益凸顯,網絡的安全高效運行更加重要。這就要求網絡維護人員在網絡出現異常時,盡快查明故障點,及時消除故障,確保網絡的順利運行。
1 具體案例分析計算機網絡故障
那么當我們真正遇到一個故障時,應該怎么做呢?下面通過具體的案例來與大家探討。
1.1 案例一 當遇到一個實際的網絡故障時,應該根據網絡拓撲結構,首先查明物理鏈路是否暢通,最簡單的辦法就是先登到客戶端設備上,進行最基本的三步驟,首先PING一下兩端地址,看兩端地址是否能夠互PING成功,如果兩端地址互PING成功,則說明線路沒有問題。如果無法PING通對端地址。接著使用Tracert命令,來顯示數據包到達目標主機所走的全部路徑、節點的IP以及花費的時間都顯示出來??纯吹侥膫€節點,數據包通不過去,從而判斷故障點具置。進而根據實際情況定制解決方案處理具體故障。從Tracert到的故障IP地址,查出具體的故障設備,進而再一步步查明原因,循序解決。
1.1.1 實際案例:
故障描述:客戶A到客戶P端核心路由器FTTP文件無法正常傳送。
故障現象:各分支節點客戶B,C,D到客戶A無法發送FTTP文件,客戶A內部局域網設備a,b,c,d不能互相發送FTTP文件。
處理步驟及分析原因:
①本網絡的拓撲結構如圖1所示。從客戶A到核心客戶端p兩端互PING,網絡收發包正常。從客戶p端網管可直接登錄客戶A端路由器正常,從客戶A端設備可以正常登錄核心客戶端主頁地址。判斷網絡線路正常,(此處由于兩端互PING正常,所以不用再使用TRACERT命令來具體分析故障節點),分析判斷所經設備配置故障。
②查客戶p端核心路由器配置,客戶B端核心路由器配置針對客戶A已開通FTTP協議。查客戶A端路由器,客戶A端路由器FTTP協議開通。判斷為兩端防火墻配置原因。
③斷開客戶A客戶端防火墻,重新發送FTTP文件進行驗證??蛻舳朔阑饛姅嚅_后,客戶A內部局域網可以正?;グlFTTP文件,但是各分支點到客戶A依然不能正常發送FTTP文件。查客戶p端核心路由器前所置防火墻配置,FTTP協議配置正常。但是從客戶p端終端設備無法登錄客戶A的FTTP文件服務器。決定甩開客戶p端防火墻,驗證是否可以正常登錄客戶A的FTTP文件服務器。
④甩開客戶p端防火墻后,從客戶p可以正常登錄客戶A端的FTTP文件服務器,判斷故障原因依然是核心客戶p端防火墻原因,將備用防火墻替換主用防火墻后,依然不能正常收發FTTP文件;查備用防火墻數據配置,發現備用防火墻未開通FTTP文件協議,開通備用防火墻FTTP協議,從核心客戶p端可以正常登錄客戶A端的FTTP服務器。在客戶A端試收發FTTP文件,收發正常。判斷主用防火墻壞。
⑤兩端防火墻都重新配置FTTP協議后,各分支點到客戶A端收發FTTP文件正常,客戶A內部互相發送FTTP文件正常。
1.1.2 案例總結:
FTTP文件不能正常發送應從如下原因分析:①網絡物理鏈路故障;②中間設備故障;③網絡中間所經設備配置錯誤;
在網絡維護中,善于總結,善于搜集案例,也是提高網絡維護水平的重要步驟。當我們每次處理完一個故障,不能簡單的處理完了就不管了,我們還要做好后續的總結分析工作,將遇到的障礙處理過程及處理中遇到的難點和疑點及問題記錄并總結,為今后的維護工作搜集材料,以便在隨后的障礙處理中少走彎路,縮短處理時間奠定基礎。
1.2 案例二 在具體處理故障過程中,應根據實際情況仔細甄別,不能盲目判斷。
1.2.1 實際案例:
故障描述:兩次掉電后某市直單位無法正常登錄省級核心主頁。
故障現象:該市直單位客戶端NE40的16口以太網板RUN燈不亮,內部網絡全部中斷。
處理步驟及分析原因:
篇10
關鍵詞:計算機機房;維護;網絡故障
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2012)33-7891-02
校園機房是學校進行計算機專業教學、多媒體學科教學及考試的重要教學場所和教學工具,機房的運行情況直接影響學校的教育教學工作。為保證教學工作的順利進行,機房的維護和網絡故障排除極其重要。
1 校園機房維護的意義和結構
校園機房維護是指對學院計算機機房及設備的管理和養護,是對整個機房電子教學系統的一種保養。科學合理的機房維護可以保證機器的正常運行、優化計算機的性能、提高計算機使用者的工作效率、教學效率和學習效率。機房缺乏維護將會影響機器的正常運行,可能造成配件損壞或硬盤數據丟失,甚至是整個計算機機房系統的崩潰,嚴重影響學校的正常教學秩序。計算機機房的維護包括的外部環境、計算機單機、網絡三個方面。計算機機房維護結構如圖1所示:
圖1 計算機機房維護結構圖
2 機房環境的維護
計算機機房放置的計算機、網絡設備等電子設備易受環境條件、人為因素的影響。合適安全的機房環境包括以下幾個方面。
1)自然環境
計算機機房應安裝空調,溫度控制在15~35 ℃,以保證計算機正常運行時所需的環境溫度。機房應保持通風良好,房間的相對濕度在20%-80%之間,有條件可以安裝通風設備、濕度調節設備。保持機房的干凈清潔,定期整理機箱內部的衛生。
2)電源
機房的用電設備密集,包括計算機、網絡設備、空調等,首先要保證用電安全,其次應配備穩壓器,保證機器工作所需的穩定電源,配備不間斷供電電源UPS,防止突然斷電,造成系統數據破壞。
3)防止干擾
機房內部及附近要避免干擾。主要是避免電磁波干擾、靜電干擾、振動和噪音干擾。計算機正在工作時,應避免附近存在強電設備的開關動作;避免使用電爐、電視或其它強電設備;防止用戶帶靜電接觸計算機的配件;防止較強的噪音和振動。
4)正確操作
計算機使用者是機房環境的一部分,用戶是否正確的進行計算機操作將直接影響計算機的性能,錯誤的操作如開機順序錯誤、開關機間隔時間不夠、非法關機等,容易造成系統損害,甚至造成物理傷害。
5)建立健全計算機機房各項規章制度,明確管理職責,執行上機登記制度,遵守計算機機房開放時間,嚴禁帶食物與飲料進入機房等。
3 計算機單機的維護
對每臺計算機單機建立檔案,包括計算機的配置信息,上機情況登記,維修記錄等。
3.1 硬件維護
計算機硬件的維護主要是主機主要部件的維護。使用主板時,插拔外部接口部件或主板上各板卡時注意垂直插拔,不要用力過猛,否則可能造成板卡變形、接口損壞,甚至是主板線路板的斷裂、元器件脫落等故障。使用CPU時要注意防高溫、防震動,一般不要超頻。對于內存條,要定期用橡皮或酒精擦拭清洗,避免內存條金手指氧化造成接觸不良。機器盡量放在平穩的地方,少搬動。尤其是硬盤在工作時盤片高速旋轉,不要移動機箱,其次要做好硬盤的散熱。
3.2 軟件維護
計算機維護,主要是對計算機軟件和數據的維護。
1)系統軟件
及時備份系統、進行系統維護、修復系統漏洞,必要時可以還原系統或重裝系統。對有特殊要求的機房可是設置為每次重啟自動還原,可以是軟件還原也可以用還原卡還原。
2)應用軟件
最重要的軟件是電子教室,其他應用軟件可根據教學的需要進行安裝。選擇軟件注重夠用、實用的原則。對于同一功能的軟件,不要重復安裝,節約系統資源,避免軟件沖突。應用軟件的使用過程中要及時打補丁或下載某些插件。
3)數據整理
隨時或定期做好機房數據的整理、備份工作。即防止硬盤中冗余數據影響計算機性能,又避免系統軟件或硬件的損壞而導致數據丟失。
4)防毒和殺毒
安裝正版的反病毒軟件并進行設置,確保使用前先查病毒,及時對反病毒軟件進行升級。及時查殺病毒,以免感染、直接或間接傳播病毒,危害網絡上其他機器的安全和網絡的運行。
4 網絡故障排除
計算機房的網絡是否連通決定了電子教室軟件的使用,決定了是否能順利的完成教學工作。校園計算機機房一般是由計算機、網卡、網線、網絡設備等組成的局域網。局域網的網絡故障主要是指計算機之間不能相互連通,網絡故障的判斷可以通過網絡命令如Ping、Ipconfig命令、查看設備管理器、使用測試儀器等方法確定,常見的機房故障及排除方法見表1。
表1 常見網絡故障排除
[故障原因\&故障現象\&排除故障的方法\&連接故障\&網卡、網線、集線器、路由器等設備之間連接松動或錯誤\&正確連接個部件\&網絡設置\&資源沖突,IP沖突、禁用網絡等\&正確配置計算機網絡\&驅動故障\&網卡驅動程序不正常\&重裝驅動程序\&硬件故障\&網卡、網線、水晶頭或集線器等設備故障\&更換發生硬件故障的部件\&]
根據網絡故障的嚴重程度可初略判斷故障原因和大概位置,然后遵循“先軟件后硬件,先本機后網絡”的原則,逐步檢查并排除網絡故障。
5 結束語
加強對機房設備的維護,及時排除機房的網絡故障,可以提高機房計算機的使用效率,提升使用者的學習效率,確保機房教學工作的順利開展。
參考文獻:
[1] 田嘯.局域網組建與維護[M].北京:人民郵電出版社,2001.