網絡監控故障常見問題范文

時間:2024-03-07 17:47:15

導語:如何才能寫好一篇網絡監控故障常見問題,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

網絡監控故障常見問題

篇1

關鍵詞 電廠;熱控自動化系統;穩定性

中圖分類號TM7 文獻標識碼A 文章編號1674-6708(2015) 153-0057-02

熱控自動化系統作為電廠機組控制重要組成部分,其運行穩定性與可靠性,決定了設備生產效率。以提高熱控自動化系統運行穩定性為目的,結合我國電廠機組容量不斷加大的現狀,需要從技術角度出發,結合系統自身特點,爭取在現有基礎上對自動化技術進行更新完善??偨Y以往生產管理經驗,確定熱控自動化系統管理優化要點,選擇合適措施對其進行改造,爭取在根本上提高其運行穩定性。

1 熱控自動化技術分析

社會生產生活均離不開電力資源的支持,為滿足發展現狀需求,電廠生產面對的挑戰更大,逐漸投入更多機組.提升機組容量,對生產體系自動化管理系統有著更高的要求,爭取持續提高電阻運行效率。同時,還需要遵循低碳經濟理念,將節能降耗原則貫徹到底,積極應用熱控自動化技術,對傳統生產與管理體系進行改造優化。即利用編程語言,來實現對系統操作的控制,從根本上來提高電能生產自動化水平。通過對電廠生產體系中溫度變化進行有效控制,以相同燃料來獲取更多電力資源產量,在提高生產效率的同時,保證生產活動開展的安全性。

2 電廠熱控自動化系統技術分析

2.1 分散控制系統

分散控制系統為電廠熱控自動化系統的主要組成部分,包括網間通信接口、開發維護接口、現場過程控制接口以及運行操作接口四個相互獨立部分,采取集中顯示與分散控制的方式。此子系統能夠與內熱控自動化系統整體內部通信網絡有效結合在一起,組合成為過程控制系統。在對此模塊進行設計時,應以應用模塊為主,通過合理配置與靈活組態來保證各項功能的順利實現。

2.2 實時監控系統

電廠生產系統復雜性比較高,在生產過程中經常會因為各項因素影響而出現故障,為保證生產設備運行可靠性,就需要設置實時監控系統,爭取及時發現存在的各類問題,將問題扼殺在萌芽中,減少各類故障的發生。實時監控系統的存在.可以在檢測到故障隱患時,及時告警并采取自動保護動作。電廠實時監控系統分為信息管理系統與廠級實時監控系統兩部分,利用控制器與數據連接口實現連接,來達到數據共享的目的。

2.3 視頻網絡監控系統

視頻網絡監控系統對提高電廠生產安全性具有重要意義,對此子系統進行設計優化,便于實現電廠生產全過程的監控,尤其是可以將此技術應用到危險程度高,且無人值班操作管理難度大的區域,可以隨時掌握生產系統運行狀態。視頻網絡監控系統在實際應用中,需要與輔助系統中通信接口進行結合,來實現對整個電廠運行的實時監控,同時也可以對工作程序與工作工程進行監控。積極應用數字化技術,建立數字視頻網絡監控系統,實現與廠級管理信息系統、通信接口的連接,利用共享信息來對各類問題進行綜合分析。

2.4 輔助控制系統

輔助控制系統在電廠熱控自動化系統中占據重要位置,通過合理設計可以實現在無人控制狀態下運行。此子系統在運行時,能夠通過可編程控制器來設置自動控制指令,并利用數據交換機以及其他數據接口來保證系統能夠安全、穩定運行,并通過綜合數據的傳輸來達到信息共享的目的。另外,可以通過中央控制室來實現對輔助控制系統的集中控制,確保電廠生產系統可以在無人控制狀態下完成相應工作。

3 電廠熱控自動化系統常見問題與原因分析

3.1 熱控元件故障

常見熱控元件故障即元件信號失真,生產過程中設備拒動或誤動,是影響電廠生產安全性與穩定性的主要因素。如果出現故障的元件是FSSS或者ETS等相關設備,將會造成生產系統直接跳閘,甚至會造成設備損壞,不但會降低生產安全性,同時也會造成巨大的經濟損失。導致熱控元件出現故障的原因比較多,尤其是電廠生產環境相對特殊,受到環境因素、元件安裝因素、設備服務時間因素以及系統電源故障因素等影響,再加上管理不及時,最終會出現運行故障。想要減少熱控元件故障的發生,需要總結以往管理經驗對各項影響因素進行綜合分析,重點預防系統容量與系統負荷超載。

3.2 DCS系統故障

即集散控制系統,其綜合性比較高,涉及到的專業學科包括計算機技術、網絡技術、CRT技術以及過程控制技術,不同技術功能不同,通過組合應用,可以實現遠程遙控現場設備、數據記錄、數據采集以及狀態監控等功能。其中,中央處理器與組態監控畫面為兩個主要部分,其中中央處理器作用于控制板、電源、1/0模件以及底板等部分。而組態監控畫面則主要實現數據顯示、操作員站監控以及歷史數據查詢等功能。對于DCS系統來說,其還可以通過網絡實現監控數據與各服務器的交換,一旦其出現故障,勢必會影響數據的收集效果,影響監視質量。對誘發故障原因進行分析,常見有操作站問題、輔助DPU切換失敗、主DPU死機以及服務器死機等,降低生產系統運行安全性,情況嚴重時甚至會出現機組停機、設備損壞等問題。

3.3 系統邏輯故障

常見于新投入設備,因其投入運行時間較短,很容易因為邏輯設計不完善因素而導致系統故障,出現判斷失誤、信號發送錯誤以及錯誤動作等問題,最終造成發電機組非正常機組。一般對于電廠新投入機組,在正式投入運行前均需要進行試運行操作,會多次出現系統邏輯缺陷問題,延誤正常投產時間,降低設備運行安全性。因此,在試運行階段,需要重點做好熱控系統設計合理性的分析,并根據試運行結果來確定系統邏輯設計優化方案,對存在的漏洞進行修復,避免因為邏輯缺陷而導致電廠機組設備非正常停機。

4 電廠熱控自動化系統穩定性優化措施分析

4.1 系統控制單元設計優化

對熱控系統控制單元DCS系統進行設計優化,提高單元控制的智能化與響應性,在根本上提高DCS系統運行智能化與靈敏度,對系統監控能力進行完善。基于此需要積極應用各項新型技術,做好與計算機技術、電子技術的聯系,對傳統技術體系進行更新,形成高智能、現代化分散控制系統,如利用DEH控制系統。同時,還需要對自動控制過程控制軟件進行優化,即在對控制程序模塊進行設計時,需要對系統控制范圍內以及控制指標進行優化,提高系統整體抗干擾性能。其中要求自動控制過程優化設計,爭取提高系統過程控制處理能力,在每個過程控制中實現軟件服務,最大程度上來滿足電廠生產監控需求。

4.2 系統硬件管理優化

硬件設施是熱控系統重要組成部分,如果其出現故障勢必會降低熱控自動化系統運行穩定性,因此需要以其為對象建立完善管理體系。將功能質量為前提,采取措施對系統設備進行管理,提高其耐老化性能,可以適應生產環境,避免因為外界因素的而影響而出現故障。在對硬件選型時,需要對設備運行環境進行綜合考察,保證所選硬件型號、質量以及性能合適,能夠較強的適應環境。同時,還需要做好質量驗收工作,將日常管理落實到位,重點做好機房溫度、系統電源、終端工作狀態、通信狀況等方面維護工作,嚴格落實各項管理措施,做好各個細節的養護管理工作,減少硬件故障發生的概率。

4.3 系統邏輯設計優化

電廠熱控系統邏輯設計的合理性是生產穩定性的基礎,應通過措施優化來減少誤動、拒動等故障的產生。要求在邏輯設計初期階段進行性能測試,選擇用三取二保護邏輯,通過質量碼對每個測點質量進行判斷。此種測量方式具有較高的可靠性,可以保證取樣信號的邏輯判斷,減少誤動作的產生。同時,在滿足系統功能運行條件下,通過邏輯優化,來降低運行人員勞動強度與操作風險,尤其通過對單點保護邏輯的優化,來減低故障發生的概率。

4.4 APS技術應用優化

即順序控制系統,對其進行優化,可以在提高操作人員技術水平的同時,實現對操作行為的有效控制,提高行為實施的規范性,減少違規操作行為的發生。對順序控制系統進行優化,還可以減少機組啟停時間,在整體上提高電廠熱控自動化系統運行性能,提高其反應能力。另外,還可以對熱控設備維護工作進行加強,建立設備故障、檢修與更換臺帳,做好各項故障的記錄分析,提高熱控設備運行穩定性。

篇2

關鍵詞:集中維護;組網設計

中圖分類號:TN929.5 文獻標識碼:A 文章編號:1000-8136(2011)36-0033-02

隨著人們對通信業務的不斷需求,推動了PSTN網絡的快速發展,促使網絡規模逐步擴大,各地市長途局、關口局、匯接局、端局、模塊局數量巨增,相應的對網絡監控的實時性、準確性;對故障處理的快速性、及時性;對全程全網的統一監管;杜絕信息倒流等方面都提出了更高的要求,各大運營商摒棄傳統的維護組織架構,盡快改革運維模式勢在必行。目前,建立省級網管中心、地市級網管中心,采取維護工作“三集中”原則,即“集中管理、集中監控、集中維護”,則是優化維護手段、提高維護水平和降低市分公司運維成本的優選方案。針對中興ZXJ10B型交換機機型,搭建交換集中維護網管系統,普及集中維護終端的安裝及維護技巧是保障網絡安全的必要前提。

1交換集中維護系統組網設計

集中維護終端一般安裝在地市或者省級的網管中心,遠程集中監控各地交換局。搭建省級交換網管,可利用省DCN網(計費網)網絡,集中維護終端通過路由器等相關網絡和傳輸,連接到各地ZXJ10交換局的后臺局域網129服務器上。保證集中維護終端與各監控局的網絡和路由暢通。接入的監控局包括各地市關口匯接局、端局(包括專網)、SSP局等,見圖1。

集中維護終端與本地維護終端通信機制基本相同,可以實現的維護、操作功能與本地終端完全相同。不同的只是通過網絡將集中維護終端置于網絡遠端,并可以在1臺遠程維護終端上切換不同交換局實現多個局的維護。

圖1交換集中維護系統組網

2交換集中維護系統終端安裝

可選擇中興公司開發的交換集中維護系統軟件,安裝終端時要求各維護交換局版本必須一致。涉及終端命名、IP地址指配配置,以及客戶端安裝BDE、ODBC通信系統、應用測試。也可選擇目前功能比較強大的NetView交換網綜合網管系統軟件安裝。

(1)命名和IP地址規劃可充分利用各局在DCN網絡內的命名和IP地址段。

(2)數據庫連接方式對于中興V304B3040303版本及以前版本,是命名管道方式,可以打開129等服務器的共享目錄且開放相應端口。對于V304B3(041013)、V311新版本,使用TCP方式。對于V304B5新版本,采用TCP方式或者命名管道。

(3)安裝通信系統,運行\INSTALL\INSTALL.EXE。選擇windows2000server+SqlServer2000。出現“初始化后臺程序運行環境”界面。選擇需要安裝的子系統,開始后臺通信系統安裝,選擇[集中維護終端],增加需要維護局的區號和局號。有名節點設置中的服務器節點設置根據實際情況修改。如果終端通過路由或在局域網內通過TCP方式連接到維護局129服務器上,則選擇[通過網關與交換局連接]即可,[網關節點號]必須不能與本機節點號相同,范圍在134~253之間。如果沒有設置該網關的IP地址則單擊下一步,此時無論是通過路由連接還是局域網訪問對程序運行都沒有影響。填寫網關節點號,

(4)測試:①與129服務器、話務統計服務器通信正常。②與計費服務器通信正常。③前臺版本升級,探針等維護功能正常。

(5)選擇安裝綜合監控平臺體系架構――NetView交換網綜合網管系統。安裝Pcanywhere軟件,通過Pcanywhere連接管理各地市。實現24 h全天候監控交換機,每日監控內容可按照網元名、網元英文名、網元類型、IP地址、是否ping通、23端口通否、6688端口通否、8866端口通否、是否有告警、是否有話務逐項進行采集數據,可實現在時間、地域、網元等各種維度上的數據匯總,提供不同維度和粒度的預處理數據,呈現來自拓撲圖中各個網元的告警和狀態信息,提供告警根源定位,對故障實時、準確、有效的統一管理和集中控制;提供預防式的運維管理,為網絡規劃和調整提供強大的報表分析。注意,需要對各地市中興交換機的Pcanywhere的登陸的用戶名密碼統一設置。如:①Pcanywhere登陸的用戶名、密碼均為:jhwg;②中興計費前置機機器的用戶名:administrator,密碼設為:zxsys。

(6)在各地市的網管前置機上須配合完成軟件加載、IP地址核配修改、網線鋪設連接等工作。首先安裝中興網管前置機軟件,放在交換機版本根目錄下\netfor2000\Netfront和Tserver。先運行Netfront\netfront3.5.2\DISK1\install,在“交換局代碼”

中需填入事先規劃好的各局不同的3位數字;第二運行Tserver\ Chinese V3.6t\Tserver\144mb\DISK1\setup,全按缺省設置點擊下一步,完成后重啟。重啟后需要運行C:\ZXJ10\Winnttcp.exe和接口執行程序(Program Files\ZTECOPRORATION\Interface Application\Interface.exe)。登陸后臺網管,打開行式人機命令;運行新安裝的網管前置機3個程序。注意:將1、3加到啟動中,電腦重啟后可自動運行。登記各端局的話務和告警。話務統計報告要TA0、TA2、TA4,統計項全選,周期為一個小時。其中涉及事先調查各局的目的碼信息。還需安裝PC anywhere軟件的被控端。

(7)可以從省交換網管上連線至地市,建立市交換網管。亦稱反牽終端。需要操作步驟是使用FTP命令下載程控交換網管系統安裝軟件,打開“我的電腦”;在地址欄內輸入核配的IP地址,如“ftp:\\10.116.31.234”或“ftp:\\10.116.31.237”;輸入用戶名:jhwg,密碼:jhwg;下載安裝軟件并安裝。包括Netview軟件包及Pc anywhere主控端軟件,并添加管內各局所為主控端。

3常見問題維護處理技巧

(1)如果采用路由器組網開通,遇到路由器調測、配置故障可以先檢查路由安裝、配置。注意:超級權限口令絕對不能丟失,更不能隨意設置。配置應雙方本局域網內的機器能夠ping到對方,否則逐步檢查串口所連轉換器撥碼開關、同步串口狀態、轉換器指示燈狀態,可更換路由察看是否為路由的故障。可自環確認是否為傳輸的問題,檢查機器的網關,網內的計算機、網線或網口的狀態。

(2)如果啟動WINNTTCP程序,連接某局,無法執行該程序,網絡檢測確認正常,則說明通訊系統安裝時參數配時錯誤,需要重新安裝通訊系統;程序運行后按組合鍵Ctrl+Alt+F12檢查各局向連接通訊狀態,察看該局向129與2號模塊連接狀態是否為True。查看129等服務器的IP地址與實際是否相同。

(3)通訊正常后,雙擊后臺維護系統,如果沒有彈出登陸界面,則進入WINDOWS的任務管理器選擇進程,找到ZXLOGIN.EXE、ZDE.EXE與WINNTTCP.EXE 3個進程強行關閉后再雙擊即可。

(4)如果不能通過機器名稱訪問到129,須分析是否正確開放集中維護終端所使用的端口,通過路由器等組網,路由器需要開放TCP:5000、1433、1723、500、1701、135-139,UDP:135-138端口。

(5)如果通信觀察出錯,須分析集中維護終端將各局的IP地址設置是否出現重復,導致TCP建鏈出問題。

(6)如果集中維護終端顯示切換后觀察部分模塊通信中斷問題,須分析是否在切換時沒有將前一個監控局的所有程序退出。

(7)如果中興網管系統出現告警監控不上報,多次處理均無效,須考慮重新安裝中興網管,版本目錄下進行網管前置機安裝、通用接口程序安裝,然后中興網管系統告警上報需要在以下目錄中配置一項參數:網管系統安裝盤(默認安裝在C盤):\datain\datain.ini文件中需要配置POWERENABLE=ON才可以上傳告警信息,然后重新啟動網管前置機即可。

Exchange Network Design, Terminal Maintenance

on Installation and Maintenance Skills

Shen Mei

篇3

關鍵詞:教育信息化;運維服務;信息系統;服務管理

中圖分類號:G203 文獻標志碼:B 文章編號:1673-8454(2014)22-0031-05

一、 人大附中信息化的現狀與挑戰

1.現狀分析

人大附中教育信息化建設一直走在全國前列,始終致力于教育信息化的超前探索。2012年6月,人大附中成為教育部教育信息化試點校之一。教育部、北京市和海淀區的領導對人大附中的信息化建設給予了高度評價。

成熟的IT組織中,項目后期的系統運維及服務管理的投入一般占總項目投入的70%,遠高于系統建設成本,現在學校教育信息化建設也從早期的硬件建設為主演進為管理能力提升、服務能力提升階段。人大附中信息中心以為教職員工提供最優質的IT服務,探索最精益化的IT管理水平為工作重心,從管理能力和管理手段上不斷創新,不斷發展。人大附中于2004年開始嘗試采用運維服務外包模式為教職員工提供技術支持服務,不斷引入先進的IT服務管理技術和工具提升信息系統管理水平,為學校的教育信息化發展提供了堅實的保障。

2.存在的問題和挑戰

人大附中數據中心現有教育教學系統30余個,服務器、網絡設備數量已經接近400臺,內部數據累計100T、IT支持服務日均30個服務事件。面對越來越多的應用系統、網絡設備、主機、數據庫、安全設備,運行維護的工作內容和復雜度隨之大幅度增加,對信息系統運維保障的質量要求也越來越高。原有運行維護手段的局限性就愈見突出,具體表現為如下幾點。

(1)缺少業務系統監控手段,服務響應被動

學校一直未部署系統管理軟件,當系統發生故障,工程師需要到達現場連接設備查看運行情況。缺乏對關鍵設備的監控手段,缺乏集中的主動式故障預警能力。不能全面分析系統運行的性能狀況和提前發現系統的潛在隱患。往往是業務中斷了很久之后管理員才被通知故障發生,此時已經產生了嚴重影響。

(2)信息系統的安全性挑戰日益增加

IT系統的安全平穩運行不僅關系到學校,而且聯系著社會上的多個行業、部門及個人,為此學校網絡的運行質量和效率、IT資源的安全性、穩定性顯得更加重要和突出。而與之相對應的是IT運維管理工作多年來一直處于手工處理維護的狀況,各種服務工作始終處于一種被動的狀態之中。

(3)信息技術服務沒有統一的服務平臺

隨著近年來信息化的投入不斷增加,越來越多的業務系統上線,信息中心可以為教職員工提供的服務越來越豐富,但是新教師沒有一個界面能夠全面了解信息服務,用戶需要撥打多個電話才能找到一個人,辦好一件事,嚴重影響工作效率,降低了用戶的服務體驗和滿意度。

(4)日常運維工作占用了大量的人力資源

學校現有約30個業務系統,100臺服務器,完成對其運行情況和系統日志檢查需要10個小時,任務執行起來難度較大。由于缺乏系統化運維手段,需要較多的運維工時才能完成對關鍵信息系統的運行監控和維護操作,運維人員的數量會隨著信息系統的增加而不斷增加。

(5)無法有效管理外包服務商

人大附中于2004年開始采用運維服務外包模式為教職員工提供技術支持服務,外包服務團隊承擔了絕大部分的日常維護和支持工作,現階段IT服務中心已經入駐多家公司的服務團隊,在多年的運維服務外包合作中,信息中心已經摸索出一套針對外包服務商的管理和考核辦法,但是依然缺乏工具支撐,如何有效衡量其工作量,準確評價供應商服務效果,及時掌握供應商的服務質量達成情況,避免由于供應商的服務質量而導致運行風險是信息中心服務管理中面臨的一項挑戰。需要對用戶、信息中心教師和服務商工程師的服務過程進行全面且科學的管理。

二、 人大附中信息服務系統管理模式及特點

隨著人大附中信息系統的不斷豐富,管理復雜度要求不斷提高,促使運維服務工作也要從傳統技術管理向服務管理轉化,結合ITIL和ITSS等國內外先進的運維服務理念,建立了統一的運維服務管理體系。

根據人大附中的業務規模以及人員結構特點,建立包括事件管理、問題管理、配置管理、變更管理在內的運維服務管理流程,通過設置SLA服務級別和標準化服務報告管理,實現服務管理的兩個閉環,不斷更新和持續改進。通過采用先進的運維服務工具軟件實現運維服務的電子化,標準化和體系化。服務管理體系設計如圖1所示。

1.統一服務中心的概念

人大附中為全體教職員工提供的信息服務包含信息、電教、圖書信息服務,由三個子部門和一個專職的IT服務中心進行交付,其中人大附中信息中心是承擔學校教育信息化建設和計算機教學職能的部門,是教學與服務相結合的部門。我們的信息服務組織架構如圖2所示。

人大附中IT服務中心是面向教職員工的接口,由外部服務商派駐工程師提供技術支持服務,也就是說用戶首先接觸的是IT服務中心,IT服務中心判別無法處理或者需要資源申請的事情,升級至信息中心或者電教中心。

人大附中電教中心主要承擔了各級各類活動現場拍攝、數字化音視頻資料采編和管理、現代化教學環境的技術支持服務、學校宣傳資料設計制作、大型綜合會議與重大活動技術支持與保障工作。

圖書館為讀者提供書刊借閱、數字資源查詢、圖書館知識培訓、閱讀指導、教學參考資料等服務。統一服務中心的概念如圖3所示。

2.建設集中、統一的服務中心

人大附中IT服務中心通過呼叫中心系統實現類似10086的統一服務熱線,通過熱線接入自動彈出呼入人員信息,在服務管理系統內進行記錄、處理和關閉。通過統一服務中心接入服務申請,科學地分派和升級,極大縮短故障處理時間,提升IT服務臺預處理能力和減少現場服務次數。利用搭建起來的呼叫平臺進行高效的數據統計、分析和智能預警。

用戶也可以通過自助服務平臺提交服務請求,當請求被受理和關閉時將自動發送相關活動信息至用戶校內郵箱,簡化了用戶服務請求過程,提高了溝通效率,提升了用戶服務體驗。通過服務管理系統將故障信息采集和統一處理。即將網絡管理、系統管理、機房環境管理等功能整合在一起,實現統一的監控數據采集、一體化的報警數據處理、統一的故障流程處理。

3.服務外包商的質量管理

人大附中于2004年開始采用運維服務外包模式,經過多方的合作交流,人大附中信息中心總結出一套供應商支持的合作模式。

信息中心統一供應商的服務管理活動,建立以服務級別達成率為主要依據的評價和考核策略,結合乙方項目考核指標,將供應商的服務過程記錄在服務管理平臺上,促使多個供應商的服務視角一致。要求供應商按照合同約定定期提交統一格式的運維服務報告。

信息中心定期發起對部門內部員工和外部供應商工程師的服務意識與服務能力培訓,在信息中心的倡導下,IT服務中心的絕大部分服務工程師已經通過了ITIL(服務管理方法論)的培訓和認證,這也是服務流程可以被很好執行的重要原因。

對乙方的服務質量進行統計和監督,同時信息部門也需要知道自己的信息資產的容量和可用性信息,傳統方法是在事件記錄表中增加一列用以記錄你關注的事件類別的故障次數、無故障時間、故障數量、平均修復時間,單位時間內的可用性是多少,這一列信息就是我們的技術服務目錄,作為供應商付款依據,也同時是信息中心所管理的信息資產的可用性監控、資金投入分析決策的數據支撐。

4.服務可視化管理

對于全體教職員工來說,談到信息化的價值一定是以給用戶提高了什么、增加了什么、減少了什么為依據的。這時需要有一個目錄來列出信息中心可以為用戶提供的服務,這些服務是否收費,獲取服務的流程,在申請服務后多久可以獲得服務,服務的可用性指標怎么承諾的,服務的支持時間是怎樣安排的,為用戶總結出這樣的一份表單就是IT服務目錄。通過服務目錄的梳理驅動IT組織內部變革,梳理內部服務的流程,梳理信息部門與供應商直接的關系;梳理出清晰的業務服務目錄,是未來服務計費等精細化管理的前提條件。通過服務臺、自助服務網站有效記錄服務目錄內服務項的使用頻率,使用習慣,不斷優化服務目錄內容和展現方式。

人大附中的信息服務目錄覆蓋信息、電教和圖書館等部門共計57項服務,教職員工可以通過目錄了解到自己可以享受到那些資源和服務,尤其對于新入職的教職員工價值尤為突出。人大附中IT運維管理頁面如圖4所示。

5.信息設備監控管理

通過部署全面的監控管理系統可以實時了解信息資產的使用情況,監控系統覆蓋機房溫度和濕度等環境信息,管理服務器、網絡設備、安全設備、存儲設備和業務服務。當監控對象發生故障或者超出設定閾值時將根據策略通過郵件、短信等通知到指定聯系人。關鍵服務中斷將直接生成事件記錄自動導入到服務管理平臺,由服務臺工程師按照流程進行處理或上報。服務管控示意如圖5所示。

通過監控管理系統規范了運行管理,有序開展系統維護窗口。將管理數據電子化,管理過程規范化。通過監控系統生成性能分析報表、資源統計報表;為運維服務提供分析報表,如統計業務系統的平均無故障運行時間,運行維護的事件、發生故障的原因,技術人員根據報表及時將經常發生的事件上升為問題。通過運維服務管理體系的不斷完善和固化。

6.服務管理平臺

隨著IT系統的發展及內部用戶數量的增加,人大附中信息中心通過部署服務管理平臺實現了服務臺、事件管理、問題管理、知識庫管理等運維流程工具并固化流程,使運維工作能夠實現標準化、流程化、自動化。量化運行質量和服務水平,提高IT系統的運行效率。

使用規范化的流程管理辦法,使以往繁雜無序的運維服務管理工作變得標準有序,實現IT運維服務管理工作從被動管理向主動服務的轉化,為信息中心管理人員和IT服務支持人員提供一個靈活、易于量化的管理平臺。服務管理平臺結構如圖6所示。

通過服務管理平臺與呼叫中心系統和信息監控管理系統接口,實現了從用戶自服務申請、電話呼入申請、系統監控事件等多種方式發起了服務請求,對服務范圍內事件進行全生命周期的跟蹤,監控和報告管理。

7.服務支持過程管理

人大附中信息系統管理參照ITIL(信息服務管理方法論)管理思想,結合實際情況進行信息系統服務管理流程的設計和執行。服務支持過程包括事件的記錄、支持、升級、關閉、變更和知識管理等活動。事件管理流程概覽如圖7所示。

(1)事件記錄和初始支持

事件記錄和初始支持是事件管理流程的起點。所有教職員用報告或系統監控產生的IT事件都必須從這個步驟開始。該步驟的目的是快速、準確地探測和捕捉所有在IT生產環境中發生的事件,并在其他管理流程中幫助確定問題和解決問題。同時及時將信息通知到相關的部門。在本活動中,將收集創建一個事件單所需要的信息。重點是準確、完整地記錄必要的信息。該步驟的一項重要任務是對每個事件進行正確的分類,隨即在現存的解決方案中查詢與該事件相匹配的方案。

(2)事件調查和診斷

這個步驟階段的目標是進行深入的調查,以解決事件。各個技術水平的運維工程師將會參與尋找一個解決方案或變通方案。如果還是不能解決事件,可能需要問題管理流程也參與進來進行更加深入的分析研究。

(3)事件解決與升級

這個步驟嘗試使用解決方案和變通方法來解決事件。某些情況下,需要升級的二線或者其他部門協調處理。

部分需要投入資源或者設計基礎架構變化的操作需要引入變更審批活動,對過程的風險和業務窗口進行批準和評估。對于某些事件,即使得到了解決,仍然需要創建問題單以進一步尋找其根源。

(4)事件關閉

這個步驟確保客戶對事件的處理情況感到滿意,建議用戶在系統內直接填寫滿意度反饋信息,默認7個工作日滿意度自動生效為“滿意”。同時需要確認事件單的信息是正確、完整的,以便于以后生成報表。另外,處理過程中的經驗認為是有分享價值的需要升級到知識管理流程,以形成可重用的知識。

三、實施中容易遇到的問題與對策

1.無法監控到所需對象,未能實現預警功能

服務管理項目立項初,會擔心監控效果不理想,經實際考察市場已經有很多可以提供IT運維服務管理咨詢及其工具的公司,網絡監控管理系統經過十幾年的發展已經趨于成熟,解決方案提供商數量豐富,有較大選擇空間,在學校實施可以先對其監控功能進行測試,滿足所需監控和告警功能點后再進行采購。

2.服務管理系統使用不起來

很多組織針對IT服務管理立項后,項目實施效果不理想,缺少事件記錄,或者記錄得不詳細,無分析價值。針對這種情況在信息中心和IT服務中心組織了多次服務管理及工具的培訓,并且要求乙方供應商對員工進行管理考核,通過乙方個人績效指標與現有ITSM系統指標結合的方式共同推進系統的使用。

要求用戶在申請資源類服務時必須進入系統填報信息,不斷總結常見問題的解決方法更新到知識庫中,系統在受理服務請求和關閉服務請求都會給申請用戶發送郵件通知,在用戶的使用中慢慢體會到系統的便利性,系統的用戶參與度將不斷提高。

3.服務臺推廣不起來,用戶習慣找熟人

服務臺的建立改變了用戶申報服務需求的方式,用戶在服務臺剛建立之初由于缺乏直接感知,會對服務臺的功能和效果提出質疑甚至是抵制,對于此類情況:

首先,加強宣傳和引導,使用戶了解自助服務臺的職能和功能,逐漸提升用戶感知。通過知識庫的建立,不斷完善各種應用系統配置手冊和解決辦法,系統支持個人服務過程查詢,如資源申請的審批情況和進展情況,提高系統的利用率。

其次,采用循序漸進的方式,加強用戶服務體驗,逐步建立用戶與服務臺之間的信任關系。當服務臺方便、快捷、有效的價值逐漸展現時,有問題找服務臺的意識行為將形成用戶的一種習慣。

最后,在通過管理規定要求所有用戶向自助服務臺申報服務需求,將收到較好的效果。通過信息系統各種資源,可以在門戶中進行虛擬機申請,賬戶申請,電教資源申請等活動,不斷提高系統的利用率。

四、信息服務系統的管理對人大附中信息化發展的價值

通過信息服務系統管理能力的提升,提高了服務工程師的服務意識,提高了IT部門主動服務的能力,從技術手段和管理手段上保證信息系統性能指標的可視性,真正實現統一管理、集中監控,全面提升信息系統管理水平和用戶的服務體驗。

1.從技術上保證IT系統穩定運行

信息中心可以全面、深入地對數據中心機房IT基礎支撐系統(如網絡、網絡設備、服務器、數據庫系統、中間件系統、安全設備等)和業務系統進行全面的了解,實現信息系統綜合管理的目標,根據采集的各類數據,集中、形象、快速地展現網絡、系統、應用以及業務的狀態及變化,并快速地發現、定位網絡系統的各種問題、變化和隱患,方便有效地對其進行分析研究,快速地隔離、解決這些問題。從而提高業務系統的可靠性,改善系統性能,提高處理效率。

通過一系列高效深入的監控手段不但能保證各項業務系統的穩定運行,還保證了數據的安全。通過對網絡性能進行監控,建立性能處理的基線,定期提供性能報表和趨勢表,可以根據趨勢分析,提出性能優化的建議,并通過歷史性能指標對網絡狀況和設備運行狀況進行分析,及時發現和解決潛在問題,規避風險,優化網絡,最終使網絡處于良好的運行狀態,保障整體網絡及應用系統的穩定運行。

2.整合技術和管理流程、提高業務系統的穩定性

改變以往系統管理員手工操作復雜(如查找故障問題、數據統計等),顧此失彼、事倍功半的工作方式,通過建立和規范運行維護流程,建立系統故障處理的工作流,減少出錯,不斷跟蹤流程和充實維護知識經驗,提高運行維護的效率。

從被動響應式工作方式轉變成主動服務,提高信息中心的工作質量和服務能力,保障包括各項系統在內的各項IT系統的安全、穩定和高效運行,全面提升信息系統的服務質量。

3.用戶服務獲取更簡單快捷

建設統一服務臺和熱線接收服務申請,避免找不到運維人員的情況發生;同時由服務臺負責對用戶各種服務需求處理進度進行跟蹤和督促,用戶通過服務管理平臺查詢處理進度,減少了溝通成本,提升了服務處理的效率和滿意度。

4.信息化手段與教育教學活動相融合,提升核心競爭力

IT服務管理強調IT與業務需求的有效融合,IT服務管理需要針對學校業務和用戶真實的可用性需求,對業務系統支持能力進行合理的安排和設計;通過事件管理、問題管理等流程的穩定、規范運行全面支持IT基礎架構和學校業務的穩定持續運行,保證IT資源的有效利用和業務系統運行的高可用性和高安全性。

為了保證IT系統穩定、可靠、高效、安全地運行,在充分利用已有資源并持續優化資源配置,全面支撐學校發展規劃和需要,最終實現IT和業務目標的統一。

5.信息系統管理水平引領行業發展,樹立行業典范