設備投資決策數據挖掘策略

時間:2022-05-29 11:07:00

導語:設備投資決策數據挖掘策略一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

設備投資決策數據挖掘策略

由于目前我國大多數貨運中心、貨運企業對企業設備的投資管理缺乏實用的全面綜合的決策評價體系和強有力的手段,因而使得企業對設備的投資決策僅僅停留在設備的技術性能和價格上,而完全沒有充分考慮設備壽命期內的綜合性能。企業對設備的投資管理關系到設備在壽命期內的實際利用效率和產生的經濟效益,是設備管理的基礎,投資管理的質量和決策水平也就關系到了整個企業的經濟效益。而企業在進行投資管理決策時所使用的數據也很少具備直接實用性,因此,引進其他行業相對較成熟的方法對本企業現有條件、數據進行處理、挖掘就顯得尤為重要。

1數據挖掘

CRM(CustomerRelationshipManagement,客戶關系管理)數據挖掘為各投資行業的中長期發展提供戰略性、決策性的技術支持;為企業的客戶(設備)管理、降低成本、增加收入、業務發展、增強國際國內的競爭力等各方面都起到舉足輕重的作用。CRM是由美國的計算機技術咨詢和評估集團GartnerGroup提出的。從管理功能上來說,主要是通過采用信息技術等手段,使企業在市場營銷、客戶服務與支持等經營流程信息化,實現客戶資源有效利用的管理思想。其核心是以“客戶為中心”。目前,CRM系統已普遍運用于銀行、保險、證券等各類投資行業中。擁有大量的客戶數據,如何有效地利用這些數據,分析出對于行業有用的知識,進而采取有效的市場行為來實現利潤的最大化,則是每個投資行業所面臨的問題。在大型物流運輸企業同樣面臨這樣的問題。數據挖掘(DataMining)數據挖掘是一類深層次的數據分析方法。就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在的有用的信息和知識的過程。對現代企業來說,數據挖掘是一種新的現代信息處理技術,通過對企業數據庫中的大量業務數據進行簡化、分類、抽取、轉換等技術分析處理,從中提取輔助商業企業決策的關鍵性數據。也可定義為為:按企業既定的業務目標,對大量的企業數據進行探索和分析,揭示隱藏的、未知的或驗證的規律性,并進一步將其模型化的先進有效的方法。

2數據挖掘的步驟

Step1:數據準備階段。具體包括:數據選取、數據預處理和數據變換。數據選?。菏歉鶕髽I用戶的挖掘目的從數據源中提取與挖掘相關的數據。數據預處理:是對選取出的數據進行初加工,主要包括檢查數據的完整性及數據的一致性,對其中噪音數據進行處理,消除重復的記錄,從而達到初步簡化數據庫。數據變換:通過投影或數據庫的其它操作來降低數據的維數,從而減少數據挖掘時數據的數量。提高挖掘算法效率。Step2:數據挖掘數據挖掘階段首先確定挖掘的任務和目的,其次是根據數據集的特征,選定合適的數據挖掘算法進行數據挖掘。數據挖掘算法是整個數據挖掘系統的核心部分,也是數據挖掘效果和質量的保證。Step3:挖掘結果的表述和評價結果表述:數據挖掘的結果要用企業用戶能夠理解和接受的方式呈現給企業用戶。結果評價:對數據挖掘所獲得的結果和模型進行解釋,對決策支持信息的適用性做出評價,從而對樣本數據和模型進行檢驗,確定是否有必要重新進行挖掘,直到用戶滿意為止。

3數據挖掘的方法

數據挖掘技術的方法主要有:聚類分析、決策樹、神經網絡、粗糙集數據挖掘等方法。聚類分析(clusteringanalysis)數據挖掘方法聚類是將所研究的數據劃分為若干組或類,在同一個類中的數據之間具有較高的相似度,而不同的類中的對象差別較大。在進行聚類分析時,不僅要考慮對象之間的距離,同時還要考慮劃分結果的現實意義。聚類分析主要集中在基于距離的聚類分析,可細分為劃分方法、層次方法、網格方法和密度方法等。決策樹(Decisiontree)數據挖掘方法決策樹方法是用來表示決策規則的樹的結構,是一種由內部結點、分叉及葉結點構成的。其中,內部結點表示某種檢驗屬性,分叉表示檢驗的結果,葉結點表示類或某一類的分類,而頂點稱為根結點。通過構造決策樹來發現訓練集中分類知識的數據挖掘方法。決策樹的算法包括樹的構造和剪枝。通常可分為回歸決策樹和分類決策樹。

神經網絡方法(NeuralNetwork,NN)數據挖掘方法神經網絡即人工神經網絡是一種復雜的分類和回歸方法,1943年,美國心理學家W.S.Mcculloh與數學家W.H.Pirst合作,用邏輯數學工具研究客觀事件在形成神經網絡中的數學模型表達,從此開創了對神經網絡的理論研究。神經網絡主要是由大量的、簡單的處理單元廣泛地互相連接而形成的復雜網絡系統,它反映人腦功能的許多基本特性,是一個高度復雜的非線性動力系統。它適應處理需要同時考慮許多因素和條件的、精確和模糊的信息處理問題。粗糙集(RoughsetRS)數據挖掘數據挖掘方法粗糙集理論是波蘭數學家Z.Pawlak在1982年提出的一種分析數據、處理模糊和不確定性問題的新型數學工具。其主要思想是在保持分類能力不變的前提下,通過知識約簡,刪除其中冗余或不重要的知識信息,導出問題的決策或分類規則,達到提高對有效數據的處理分析的速度和準確度。在數據挖掘中,主要利用粗糙集來實現數據的分類、簡化、規則提取。利用粗糙集理論來進行數據挖掘有著較傳統數據挖掘工具所不具有的優點。粗糙集理論處理數據不需要對數據的了解,也就是說不需要數據的先驗信息,比如統計學中的概率分布、模糊集理論中的隸屬度或概率值等。粗集的這一優點對于現資行業,這種處理數據的客觀性非常重要,因為隨著信息技術的飛速發展、經濟的快速增長、國內國際競爭日趨激烈,客戶的不確定性、模糊性特點顯著增強,無法找到有價值或價值長久的先驗信息。粗集數據挖掘技術可以幫助企業管理客戶(設備)生命周期的各個階段。利用粗糙集理論不僅可以從大量的客戶(設備)數據中,挖掘出潛在的,有價值的知識,對海量數據進化簡化;而且還可以挖掘數據間的內在規律,得到數據的最簡規則表達,幫助企業業確定客戶(設備)的特點,進而能為客戶(設備)提供針對性的服務。

粗糙集理論具有以下幾個鮮明特點:具有很強的客觀性:用粗集處理不確定信息不需要提供任何先驗知識,具有很強的客觀性,從信息庫本身就可以挖掘數據之間的聯系,如權重系數,粗糙隸屬函數等,而其他處理不確定信息的理論工具如模糊集和概率統計方法等都需要提供一些數據以外的附加信息或先驗知識,具有一定的主觀性。具有很強的數據挖掘處理能力:粗集能表達和處理不完備信息;通過知識約簡,在能保留關鍵信息的前提下對海量數據進行挖掘得到知識的最小表達;能識別評估數據之間的依賴關系、權重系數;能得到易于證實的決策規則。