數據挖掘在網絡病毒預防的應用
時間:2022-02-22 08:33:14
導語:數據挖掘在網絡病毒預防的應用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
摘要:在網絡不斷普及的過程中,其逐漸被應用于金融、財產、人際關系等多種領域,在網絡的應用過程中所產生的大量數據會造成網絡病毒,因此,對海量網絡數據進行挖掘不僅能夠幫助用戶更好使用數據,同時能夠預防使用過程中的網絡病毒。數據挖掘技術在網絡病毒預防中的應用,首先提出挖掘原理,建立數據開采模型和挖掘過程,同時在挖掘過程中建立數據倉庫,利用貝葉斯算法預防病毒,幫助提高網絡安全性。
關鍵詞:數據挖掘;網絡病毒預防;貝葉斯
1引言
隨著數據庫、數據倉庫等數據倉儲技術的發展,信息系統逐漸被金融、財產、人際關系等多種領域運用。數據化時代的來臨,給人們帶來便利的同時,如此海量的數據也讓人難以消化。從表面來看,海量數據中蘊含著許多有用信息,但是這些數據不能運用到實際工作中。同時隨著數據的增加,負面作用也越來越明顯[1]。巨大的信息量難以處理,同時真偽難辨,為信息安全帶來威脅。在這種情況下,人們開始意識到數據挖掘的重要性。信息挖掘技術能夠被應用于網絡防護、危險評估等,有效檢測網絡病毒和入侵行為。挖掘是一門混合型的學科,其中涉及數據庫技術、統計學知識、可視化、信息學科等。數據挖掘技術能夠將已有的數據進行整理,同時對其中隱藏數據進行提取。數據挖掘技術能夠有效監測出網絡病毒的活動并進行預防[2]。數據挖掘技術能夠實現病毒的預防與檢測,對入侵病毒的數量和形式進行反饋。數據挖掘技術對數據起到重要的保護作用,在實際生活中得到廣泛應用。
2數據挖掘技術在網絡病毒預防中的應用原理
數據庫在數據挖掘過程中被作為數據管理系統廣泛使用,隨著數據庫中數據的不斷儲存,數據分析處理技術需要不斷發展。數據庫中,人們能夠利用的數據僅僅是其中的一小部分,其中大部分有用數據,由于使用工具的局限性不能被人們很好利用。數據庫中的數據被人們所利用的僅僅是很小一部分,但是這些信息在決策生成的過程中具有重要的參考價值。為此,研究數據挖掘技術在網絡病毒預防中的應用[3]。數據挖掘就是“對數據庫中蘊涵的、未知的、有潛在應用價值的、非平凡的模式的提取”。數據挖掘基本原理可分為六個過程,具體如下。(1)明確任務:了解應用領域與知識背景,并且明確所要完成的數據挖掘任務;(2)數據選擇:從大數據中提取需要的數據,對其進行數據挖掘;(3)數據預處理與轉換:對數據進行挖掘,提取所需要的數據,處理后轉變成為有效數據,方便后期進一步進行數據挖掘;(4)數據挖掘:根據數據挖掘的任務要求,選擇合適的數據挖掘方式,將挖掘結果轉變成為易理解的形式;(5)模式解釋:對發現的模式進行解釋與評估,需要精確數據時,重復以上步驟處理數據;(6)知識評價:將挖掘處理過后的數據,轉變成為用戶能夠理解的方式,方便使用。
3網絡數據挖掘目標和方法
在網絡信息數據挖掘過程中,根據挖掘任務和目標的不同,在挖掘數據過程中,將主要能夠將發現的典型知識分為以下幾類。(1)關聯規則(AssociationRule):根據數據之間的關聯,從數據庫中發現那些確信度(Confidence)和支持度(Support)都大于給定值的強壯規則。目前,從數據庫中發現關聯規則的概念已從單一概念層次發展到多個概念層次[4]。在實際的網絡數據中,需要用到的相關規則數量都較大,并且其中一些規則會影響用戶的判斷。(2)分類(Classification):分類作為網絡數據挖掘中最基本的認知形式,就是對網絡數據庫中的每一項數據進行分類。通過數據庫的建立,作為數據挖掘的重要基礎。(3)聚類(Clustering):聚類方法區別于機器學習中將數據分類的監督學習,被稱為非監督學習[5]。數據聚類通常會采用將對象分成幾個群體的方法,每一個群體中都存在較高相似度,不同群體中相似度較低。
4數據挖掘技術在網絡病毒預防中的應用
數據挖掘在網絡病毒預防中的應用有著多變、需要管理、信息豐富、需要進行決策等領域特點[6]。所以首先需要對網絡數據建立數據倉庫,利用數據挖掘和分析工具,將網絡數據中需要的信息進行挖掘。通過對系統中相關數據的抽取、加工、整理以及加載到數據倉庫中,形成數據庫中基礎的數據。在建立數據倉庫后,利用貝葉斯算法,它可以很好地從任務的分類中進行區劃,能夠很好地對網絡數據進行挖掘和檢測保護。在計算過程中,以A1,A2,A3,A4,A5,…,Am作為m的屬性,屬性分類為V,讓每個屬性A,有一個領域(a1,a2,a3,a4,a5,…,ad)和分類V領域(v1,v2,v3,v4,v5,…,vd),其中的分類數據點更加傾向于(a1,a2,a3,a4,a5,…,Am+v1),得到公式:()1111arg()miv=manPv∏Pav=丨(1)()()()11111#,arg##miavvmanvv=∏=(2)這個方法能夠有效應用于數據挖掘的網絡病毒預防中。
5結語
隨著互聯網的發展,網絡逐漸被應用到生活的各個領域中。網絡信息安全變得尤為重要,這不僅關系到網絡安全,更關系到各個領域的隱私問題。利用信息挖掘技術能夠有效提高互聯網信息安全系數,做到更加具有針對性的網絡信息安全保護和病毒預防。在數據挖掘技術在網絡病毒預防中的應用過程中,首先建立開采模型,并且提出數據挖掘過程,建立網絡數據倉庫,通過關聯工具和解構對計算機數據進行挖掘,對數據挖掘算法進行描述,利用貝葉斯算法預防網絡病毒的入侵,解決網絡病毒防御中的問題,有效提高網絡安全性。
參考文獻
[1]錢維揚,王俊義,仇洪冰.基于Hadoop的數據挖掘技術在測光紅移上的研究[J].電子技術應用,2016,42(9):111-114.
[2]張子昂,黃震方,靳誠,等.基于微博簽到數據的景區旅游活動時空行為特征研究——以南京鐘山風景名勝區為例[J].地理與地理信息科學,2015,31(4):121-126.
[3]張加余,蔡偉,李云,等.HPLC/LTQ-OrbitrapMSn結合MDF數據挖掘技術快速鑒定藏白蒿綠原酸類似物[J].質譜學報,2015,36(4):321-327.
[4]和敬涵,劉琳.基于冗余信息的智能變電站協同后備保護及故障預判算法研究[J].電力科學與技術學報,2015(2):3-8.
[5]萬祥,胡念蘇,韓鵬飛,等.大數據挖掘技術應用于汽輪機組運行性能優化的研究[J].中國電機工程學報,2016,36(2):459-467.
[6]潘鴻,王洪峰,王宇峰,等.基于數據挖掘技術探究治療糖尿病周圍神經病變的針灸取穴規律[J].中國針灸,2016,36(10):1111-1114.
作者:張凱斐 王翠娥 單位:呂梁學院
- 上一篇:數據挖掘服裝銷售研究
- 下一篇:出租車GPS軌跡數據挖掘研究