Web數據挖掘在信息管理的運用

時間:2022-07-10 04:09:27

導語:Web數據挖掘在信息管理的運用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

Web數據挖掘在信息管理的運用

1信息管理的現狀和發展趨勢

信息管理是國家經濟建設、人才培養以及學科發展的必要途徑,科研創新、高校圖書館、企業管理、電子商務等多領域離不開信息管理。如何從廣大的數據信息中,快速檢索出需要的信息,需要web數據挖掘技術。為做到高效率高精度的提供教學、科研、企業等的個性化需要,快速檢索海量信息資料,其算法及在信息管理中的應用是一個值得研究的課題。Web數據挖掘技術是信息管理這一課題的前沿技術,綜合多種信息手段,大大提升了信息資源的組織管理的優勢,強化科技信息服務質量,拓展了更廣泛的服務方式和應用方式。信息管理不僅僅是信息的載體管理,同時針對信息內容的外在特征深化管理也是信息管理的重要組成部分。對原信息內容加以深入分析,整體提供海量數據的內在聯系和規則,消化、辨識消息,保證消息安全,有效運用數據挖掘技術等尖端計算機技術,提高整體信息管理水平是信息管理的要求。

2數據挖掘技術的基本概念和特質

數據挖掘技術是綜合統計學、計算機技術數據庫等研究內容,吸收人工知識和機器學習的專業知識,進行知識獲取和數據挖掘的一門學科,能夠快速準確、方便快捷的獲取有價值的信息。目前數據挖掘技術仍是信息管理研究的熱點,代表性的數據挖掘系統有Enterpriseminer,IntelligentMiner等。通過模型化、歸納、聚類、偏差等技術重點進行數據挖掘,其技術難點是要實時的綜合數據庫進行智能化的數據挖掘。近年來隨著數據庫技術的發展,基于異構數據源等多種技術不斷發展,移動計算的數據挖掘技術的研究也日益深入。值得一提的是,關聯規則代表算法是Apriori,該算法通過識別頻繁項目集,發現數據庫中各項目的關聯關系,即發現可信度強的規則。在這一算法的基礎上,為了不斷提高技術效率,采用增量更新技術,進行并行化挖掘數據。在上述算法的基礎上,強調形象規則,即有關客戶興趣度等外在信息,快速學習相似性行為模式索引技術,通過在線多維索引,強調結構化有向的構建等是數據挖掘技術的研究熱點。隨著復雜數據不斷海量化,研究將優化智能算法結合目前數據挖掘技術,從而大幅度提高數據處理效率和質量。信息管理數據復雜海量,有著多種信息類型,用戶檢索的自由度很高,用戶個性化需求多樣,Web數據挖掘技術應運而生。具體技術包括文件內容描述、人為鏈接結構和存取模式用法的挖掘。Web數據挖掘技術是利用進化算法、粗集等信息處理方法,使用檢索工具檢索形成信息文本集、選取合適的典型特征,分析、修剪、歸納異質信息,精簡子集。檢索功能的逼近能力反映了該技術的檢索質量?;趦热莸奈谋就诰蚍椒ㄈ鏦ebwatcher,Musag,Letizia等。通過關鍵字定位,或是使用近義詞典擴充關鍵字,或者基于瀏覽行為而無需關鍵字,形成客戶形象信息、興趣模型,對客戶提供評價和鏈接以及相似信息獲取,更新搜索方式,并反饋客戶申請。目前技術運用效果佳,實現更柔性精確的信息管理是該技術前進的方向。利用基于問題的技術代表有Antagonomy,In-ternetFish等,是一定約束的自然語言的界面通過存取分布交互系統,學習器學習客戶喜好情況,以及少許特征向量,對信息快速分類,在數據庫基礎上,使用自組織映射等技術,集成人工智能,最終成為個性化搜索助理的信息管理技術。上述技術一般適用于特定用戶,協同即公眾學習方法是分析一組客戶中客戶間相似程度關聯規則,而非分析信息內容。優點在于可以平等處理各種內容信息,但少數用戶的評價級不足,會影響信息管理系統性能。強調客戶間的信息交流,傳送響應信息,依據信息選擇學習算子,大大的提高了信息管理效率和質量。在強調機器學習和統計方法的基礎上,體現了分布協同處理的信息管理新思路,有著柔性智能的特點,在信息管理中應用前景廣大。

3數據挖掘在信息管理中的具體應用

以科技信息平臺中的數據挖掘為例。數據可分為結構化數據、半結構以及非結構化數據,如表一所示。表一數據分類如今非結構化、個性化、隨機數據、海量數據的檢索需求日漸提高,促進了科技信息檢索平臺及相圖一科技文獻信息平臺應軟件的研發,這一課題是當前熱點。Web數據挖掘技術共享信息獲取檢索管理的模式改革,強調了科技信息平臺系統智能化,通過分析功能的添加,增強用戶管理,提供個性化的解決方案,利用數據存儲客戶喜好,對客戶數據庫進行分析,研究知識挖掘的領域,提供多目標的信息管理:改進系統性能、設計、理解用戶需求等等。通過統計學方法分析檢索量、頻率、次數、空間時間分布,路徑模式發現算法,在移動通信的支持上,進行進一步的科技文獻信息平臺的搭建是主要發展趨勢。具體平臺如圖一所示,一方面客戶端綜合用戶間聯系、用戶歷史紀錄、分析用戶圖形,交由數據中心處理。另一方面,各分節點在總節點的指揮下,反饋信息。具體過程有:數據挖掘、任務結構化解析、挖掘算法、智能模型、調度計算資源、綁定挖掘任務,最終將數據挖掘結果進行可視化展示。分析Web的頁面內容、結構和用戶信息,最終提供高效信息管理服務,是現有數據處理技術的有效補充。如圖二所示。在科技信息管理領域,拓寬Web數據挖掘技術的應用個,如Web數據挖掘技術和高校圖書館綜合,可以優化資源建設。在有限的經費下,充分發揮載體優勢,拓展文獻存儲,一方面優化電子信息檢索存儲,另一方面還可以提高高校圖書館的應用效率。統計文獻引用率、瀏覽率、下載率等等,分析文獻自身特點如時間空間分布、引用下載曲線、文獻間關聯比例、用戶借閱喜好,最終優化信息管理布局。收集整理用戶興趣模式。采用合適的挖掘算法查缺補漏,調整方向,優化資源分配。還可以評判科技信息資源的利用率,立足人本需求,拓展智能化信息服務。搜集用戶閱讀瀏覽集合,對集合進行關聯規則挖掘,匹配瀏覽模式,形成相似用戶組,對訪問頻率高于閾值的,預先連接,提高速度效率。利用WEB數據挖掘技術,分析用戶訪問數據,預測傳輸用戶界面。最終做到智能化信息服務。支持多樣檢索方式,聚類結果分析,結構化條理化呈現信息,用戶個性篩選,進行科學假設,最終做到智能化、交互式檢索。提高傳統被動服務模式的反應速度,適應飛速發展的知識信息,主動提供用戶信息。如:用戶喜好相關數據及時推送,訪問時優先推薦專題,跟蹤客戶形象變化,提供動態分析,如個人主頁等服務或是相關定制服務就可以較好的完成這一功能。真正將數據挖掘具體到客戶需求,提高信息管理的主動性和高效率。同時,還可以分析商業客戶,反饋一手數據給相關部門,切實制定發展戰略,提高信息管理收益成本比,促進多方合作共贏。Web數據挖掘技術減少人力和物力成本,加速信息映射,是提供信息管理服務的強有力保障。Web挖掘技術可以豐富頁面內容,以及相關頁面,如該專業的規范權威頁面,是信息資源的有效補充。

4結束語

在統計學的基礎上,綜合人工智能、機器學習、可視化、并行計算等多門領域,融合多種技術提高數據挖掘的效率和質量,深入研究Web數據挖掘在信息管理中的應用,如和圖書館的結合等,最終應用于實踐產出創新性產品。為科技文獻管理等多領域提供全局觀,在傳統查詢報表的基礎上,借數據倉庫技術的東風,數據挖掘技術勢在必行。數據挖掘是要對數據進行抽取,進而分析數據,轉換模型化處理數據,最終提取輔助決策的關鍵性數據。不僅得到傳統的事件結果,更對事件的本質和信息間關系進行挖掘,通過置信度預測評價,最終支持決策行為。Web數據挖掘算法和應用研究基礎。Web數據挖掘具體研究Web頁面內容結構,以用戶信息為基礎,研究用戶和頁面互動的內在聯系,分析包括用戶界面、商務等多領域Web數據,應用上述挖掘技術,優化客戶檢索體驗,改進信息平臺設計,在電子商務等多領域應用于改進信息管理服務,體現了數據挖掘技術的優越性。在信息管理領域,綜合智能和數據挖掘技術,分析用戶特征、文獻知識是知識信息管理的重要組成,顯示出強大的生命力。

作者:葉蓉 單位:江西省科技情報研究所

參考文獻

[1]陳卓民.基于HITS算法改進的Web數據挖掘方法研究應用[J].自動化與儀器儀表,2016,(07):255-257.

[2]吳雷.網絡信息安全防范和Web數據挖掘技術的有效整合[J].網絡空間安全,2016,(06):62-64.

[3]鄭亦梁.Web數據挖掘和個性化搜索引擎研究[J].通訊世界,2016,(05):240.

[4]李娟.淺析Web數據挖掘[J].福建電腦,2011,(11):72-73.

[5]張倩.應用Web數據挖掘技術捕獲網絡檔案信息資源個性化服務研究[J].檔案與建設,2008,(07):15-17.

[6]白慧.基于Web數據挖掘的數字圖書館個性化信息服務[J].圖書情報導刊,2008,(15):38-39.

[7]李平.網絡安全防范與Web數據挖掘技術的整合研究[J].信息安全與技術,2016,(08):63-65.