機器學習技術在數據挖掘中商業應用
時間:2022-11-06 05:17:52
導語:機器學習技術在數據挖掘中商業應用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
【摘要】現如今,數據挖掘中機器學習技術的應用非常廣泛,遍及金融、醫療等領域,這就要求企業應該提升自身辨別方法和技術優劣的能力,面對不同的環境,選擇應用與任務相匹配的數據挖掘技術。本篇文章首先對機器學習技術的界說作了簡述,其后對機器學習技術在數據挖掘任務的商業應用作了兩點詳細的研究,以期促進企業的可持續發展。
【關鍵詞】機器學習技術;數據挖掘;商業應用
隨著科學技術的發展,存在于數據挖掘領域的機器學習技術憑借其強大的數據處理能力和在商業領域上巨大的應用潛力越發得到數據挖掘領域學術界以及商界的廣泛關注。因此,對機器學習技術在數據挖掘中的商業應用進行探究有著十分重要的現實意義。
1機器學習技術的界說
通過自動化的計算方法來獲取知識的學習就是機器學習。人工智能研究中,機器學習占據著十分重要的位置??杀环Q作真正的智能系統,一定具有非常強悍的學習能力,由此可得出,以往的大多數系統都不能稱作智能系統。比如,不能進行錯誤的自我校正;不能經過經驗改良系統性能;不能自發的取得和找尋系統所需的大量知識。這些系統的推理都是演繹推理,缺少歸納推理,這使得僅能在最大程度上證明已知的定理和事實,不可能有新的發現。這個局限隨著人工智能發展的逐漸深化變得更加明顯。在此種情況下,機器學習技術已然是人工智能的研究重心之一。其應用廣布人工智能領域的智能機器人、自然語言理解等分支。
2機器學習技術在數據挖掘任務的商業應用
2.1機器學習技術的分類
機器學習可依據不同的推理方法,劃分為歸納、分析式以及非符號這三種學習方式。在例子存在的空間中,歸納學習的系統利用一般操作和特殊操作的方法對給出的正、反這兩種有關于某個概念的集合例子進行在空間中的搜查和檢索,還要進行經過學習傾向標準的抉擇過程,最終得到這個關于某概念的一般描述。這是從特殊到一般的推理,可稱做從事實出發來進行理論的最終建立過程。學習進程一般由大量的專業領域知識的運用來驅動,是分析式學習的一個特點。此時實力已在特定的知識背景環境中得到大量的考察,不再是無關特征的、單純的幾何,對學習結果進行了傾向影響的消除。其還可劃分為類比、基于案例以及解釋這三種學習方式。網絡神經與算法基因都屬于非符號學習的范疇,將學習行為在數值層次中體現是其主要的特點。博斯和馬哈帕特拉將機器學習技術在數據挖掘中的應用,作了下述五種歸類。
2.1.1歸納推理
依據各不相同的特征,應用決策樹進行數據分類。應選擇一個可作為因變量的變量在數據源中,再應用組間差別擴大與組內差異差別縮小的統計方法進行變量的分組,找尋對因變量影響最大的預測變量,此時可將該變量作為決策樹中的一個節點來設置。決策樹的優點是直觀,缺點是其分支隨著數據復雜向的提升會逐漸增多,這使管理變得困難。強大的大數據集處理能力,任務的適于預測和分類性,解釋簡易的結果,技術實施的簡易性于一體。
2.1.2神經網絡
由與人腦神經元類似的節點來構成,是一個多層的網絡結構,通過隱藏節點將輸入和輸出這兩個節點連接起來而構成。將凡是通過和到達該節點進行信號輸入的進行加權所得出的加權和該節點的信號輸入總量。該網絡的學習方式是將樣本的歷史數據進行大量和反復性的訓練,在此期間,可通過數學方法——學習規則使節點進行數據的匯總與轉化,并進行鏈接節點權值的調節。其有互相間相連的輸入、中間以及輸出這三種層次構成,網絡工作中的絕大部分由多節點構成的中間層來完成。對分析數據的執行結果進行輸出是輸出層的主要工作??蛇M行復雜性問題的精確性預測是該網絡的優點。但是其存在著大數據集的處理效率過低的缺點,使用該方法的用戶需具備大量的專業知識。
2.1.3事例推理
關于問題的描述和解決辦法是每個事例都具備的內容。問題提出之后,學習系統會進行匹配性事例和解決辦法的尋找。較強的污染與缺失數據處理能力是其優點,常適用于存有大量數據的領域。
2.1.4遺傳算法
是一種優化組合方法,基于生物進化的適者生存思想,有繁殖、雜交以及變異這三個基本的操作過程。個體適應度的計算都源于繁殖操作過程。進行信息某一部分的交換過程稱為變異操作過程。通過某一部分信息隨機改變得到的新個體屬于變異操作過程。最有個體的特色,往往得益于重復性的變異操作。易于集成較強的污染與缺失數據處理能力是其優點,但使用該方法的用戶需具備大量的專業知識。
2.1.5歸納性邏輯程序
用一級邏輯屬性來進行概念的描述與定義。先對正、負兩面的例子進行定義,其后對新例子的等級進行劃分。強大的大數據集處理能力和理解容易的模型是其優點,但使用該方法的用戶需具備大量的專業知識。這五種方法由上到下依次是商業應用最廣泛的歸納推理方法。
2.2機器學習技術在數據挖掘任務的應用
博斯和馬哈帕特拉將機器學習技術在數據挖掘中的商業應用歸結為下述四種任務類型:
2.2.1分類
比如,從商業數據庫中,應用數據挖掘進行有效信息的挖掘,依據統一偏好或是年貢獻估計額等標準來進行全部客戶的分類。
2.2.2預測
比如,當顧客有貸款的需要時,銀行系統應在第一時間對其的信用狀況進行審查,應用機器學習技術,就可在日常中對存在于數據庫中的源數據進行不斷的學習和修正,得出的信息也就是最具參考性的。
2.2.3關聯
潛存于實體間或屬性間的聯系規律進行關聯性的分析。第四,偵察。進行異?,F象、模式以及離群數據的尋找,并對決策給出起支持作用的解釋,是其主要目的。
3結束語
總的來說,很多領域都應用到了數據挖掘中機器學習技術,這就要求企業應該知曉不同方法和技術的優劣,面對不同的環境,選擇應用與任務相匹配的數據挖掘技術。本篇文章首先對機器學習技術的界說作了簡述,其后對機器學習技術在數據挖掘任務的商業應用中機器學習技術的分類和機器學習技術在數據挖掘任務的應用這兩點作了詳細的研究,以期促進企業的可持續發展。
參考文獻
[1]朱天元.機器學習算法在數據挖掘中的應用[J].數字技術與應用,2017(03):166-166.
[2]張紹成,孫時光,曲洋等.大數據環境下機器學習在數據挖掘中的應用研究[J].遼寧大學學報(自然科學版),2017,44(01):15-17.
作者:張昊澤 單位:大連海事大學
- 上一篇:淺談大數據挖掘與數據處理方法
- 下一篇:云計算電力大數據分析技術