數據挖掘技術在高校圖書館中運用

時間:2022-10-08 05:44:38

導語:數據挖掘技術在高校圖書館中運用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

數據挖掘技術在高校圖書館中運用

[摘要]闡述了數據挖掘技術的概念,提出了數據挖掘技術在高校圖書館中應用的必要性,并對數據挖掘在高校圖書館四個方面的應用進行了分析,旨在為高校圖書館個性化信息服務拋磚引玉。

[關鍵詞]數據挖掘;高校圖書館

1數據挖掘技術

1.1數據挖掘技術概念

隨著科技日新月異的發展,信息加工和處理也成為信息化的主要技術支撐,目前,許多領域的問題都是通過數據挖掘來解決的,數據挖技術在人們日常生活中應用也越來越廣泛。數據挖掘技術幫助人們對各個領域的信息處理。數據挖掘是什么?目前,人們對信息需求遠遠大于過去任何一個時代,傳統的統計工具無法滿足現階段人們的需求,數據挖掘技術也隨著數字化、信息化的飛速發展應運而生。數據挖掘就是根據已有的不清晰、雜亂無章的海量信息,提取出所需信息的過程。通過數據挖掘,大量無規范的數據通過統計進行數據分類管理,從而將數據的規律和數據模式挖掘出來,并對未來數據的走向進行有效分析和預測。數據挖掘技術與很多學科領域相互交叉應用,涉及的知識面比較廣泛,相比傳統的信息處理方法,從表面上沒有任何相互關聯的數據中,挖掘出事情的關聯原因,找出事物發展的規律,并用數據作為支撐,為決策者提供切實可靠的參考。

1.2數據挖掘類型

按照數據結構的方式來劃分,通??梢苑譃槲谋緮祿诰?、Web數據挖掘和數值數據挖掘。

1.2.1文本數據挖掘

文本數據挖掘,顧名思義就是從文本數據中通過計算機處理技術挖掘出有效、有價值的信息。文本信息挖掘主要包含兩類,一是文本信息;二是文檔類信息挖掘。數據挖掘的對象均為文本信息數據。文本信息挖掘方法主要有:文本分類、文本聚類、信息抽取、摘要及壓縮。挖掘文本數據,主要包含對文本信息特征提取與文本信息分類、分析文本數據等。在對文本數據挖掘進行應用時,主要是以詞串表示法、貝葉斯分類算法、詞集合算法等技術手段為輔助,以便于完成信息數據相關工作。

1.2.2Web數據挖掘

Web數據挖掘,從字面上來解讀,是挖掘技術在Web頁面上的應用。包括針對Web數據等信息,如Web頁面結構、用戶信息等等信息數據,進行提取、優化頁面設置,掌握訪問用戶的內容和行為。為用戶提供更多優質服務,根據服務目的和內容的差異,對不同個體進行差異性的挖掘,具體包括挖掘Web日志、內容和結構。

1.2.3數值數據挖掘

數值數據挖掘,從字面上來看,主要是對數值數據的挖掘。主要的任務有描述數值數據和預測數值數據兩種。數值數據挖掘功能為概念描述,重點進行分類分析和預測分析。常見的方法,有歸納法、模糊數學方法、遺傳算法等。

2數據挖掘技術在高校圖書館建設中的必要性

2.1館藏建設的需要

圖書館作為高校科研和知識的前沿陣地,它不僅擁有濃郁的書香文化氛圍,豐富的館藏資源也是必不可少的?,F代圖書館,不光需要滿足讀者用戶翻閱紙質書籍的需求,也需要滿足數字資源的需求?,F代科技和互聯網的發展,改變了人們的閱讀模式,便利、快捷的碎片化閱讀成為人們首選的閱讀方式。數字化閱讀越來越受廣大讀者用戶喜愛,人們可以通過搜索引擎迅速查閱到所需圖書的相關信息,具有時效性和便捷性。計算機應用技術的發展在數據挖掘技術領域,結合圖書館原有的館藏資源,分析館藏已有資源,將紙質書籍做可視化處理,挖掘出信息數據中館藏建設的優勢和劣勢,良好結合圖書館現有館藏情況進行分析,將分析結果進行評估,這對豐富館藏建設有著建設性意義。高校圖書館館藏必須滿足科研和學科需要,學生用戶處于積累知識階段,所需要的信息資源也是各種各樣,對讀者信息的挖掘,能夠有效有針對性的節省開支,館藏內容都通過數據挖掘技術來推算和評估,以供指導未來采購書籍和學科建設。

2.2滿足用戶多樣化需求

高校圖書館的用戶類型,主要是教師讀者和學生讀者。讀者用戶的不同,需要提供的信息也大不相同。這就要求圖書館對讀者多樣化需求進行數據挖掘,并根據讀者用戶的個性化需求來推送信息。首先,根據已知基本讀者信息,得出不同讀者的個性化需求。其次,分析不同讀者信息需求和獲取信息的多樣化途徑。最后,根據已有信息內容和信息獲取方式,進行數據挖掘分析對比,從而實現因人而異的服務方式,提升圖書館信息服務質量。根據讀者信息和訪問等數據挖掘,可以反映出讀者用戶的需求,從而更好地服務讀者。

2.3符合圖書館未來發展

現代高校圖書館的重要競爭力是數字圖書館,這一點符合“互聯網+圖書館”的發展。高校圖書館的應用信息系統擁有大量數字資源,并通過網絡技術等資源進行組織和整合,滿足用戶的需求。只有將大量數據資源和互聯網關聯信息進行有效的數據挖掘,才能挖掘出其中的最大價值,數據挖掘技術在圖書館信息化發展和信息服務建設方面有著無可替代的優勢。

3數據挖掘技術在高校圖書館中的應用

3.1數據挖掘技術在文獻推薦中的應用

文獻利用率是考核高校圖書館服務質量的一項重要的指標,如何為讀者用戶提供可參考有價值的圖書文獻,做好文獻推薦工作是高校圖書館個性化服務的重要組成部分。數據挖掘技術在圖書館借閱率中的應用,主要是根據讀者用戶進出圖書館的數據與借閱、瀏覽圖書數據、進行分類分析與關聯分析。通過數據分析,得出讀者用戶所借閱的數據與相關類別圖書,呈現出一定的關聯性,根據其中的規律,可以用于后臺熱點推薦和個性化推送。如讀者在借閱卡耐基的《人性的優點》時候,又借閱了相關心理學書籍,說明這個讀者喜歡書籍類型,具有一定關聯,那么適當推薦心理學相關書籍、勵志書籍給該讀者,可以幫助讀者節約查閱書籍的時間,提高對圖書館的利用率。

3.2可視化信息服務

數據挖掘技術比傳統數據統計和表格更加清晰地體現出直觀效果。人工智能技術和可視化設備大量引進圖書館后,圖書館不僅僅可以將讀者借閱數據、館藏數據、個性化偏好等數據,用直觀可視化的圖表清晰表現出來。還為圖書館建設提供一些參考。通過收集數據-數據挖掘-數據評價,將圖書館各項數據指標,實時記錄高校圖書館各個部門人員圖書借閱情況、到館情況、讀者密集度和習慣,用圖表方式展現出來,為圖書館管理者提供服務和管理重要依據。

3.3閱讀推廣服務

高校圖書館閱讀推廣服務,為保證廣大讀者用戶更加充分利用圖書館資源,激發讀者興趣,推廣校園讀書文化有重要意義。數據挖掘技術結合圖書館閱讀推廣活動,首先對讀者用戶的瀏覽圖書館界面和借閱記錄進行數據采集,根據讀者偏好,結合圖書館現有館藏資源,篩選讀者用戶可能感興趣的內容,并通過網絡手段推送給讀者用戶;其次,根據搜索數據進行統計,如將熱門關鍵詞與館藏資源進行數據信息匹配,以評價最好、熱度最大等排列組合推薦給讀者,如熱門當紅讀者、出版社、話題最熱等內容。再次,根據深度挖掘信息數據,找到相關規律,如世界讀書日等熱門節日,以這些為指標為讀者推廣工作提供一些依據。

3.4學科信息服務

高校圖書館的資源具有豐富的學術性特點,數據挖掘技術應用于圖書館,為學院發展、學科建設和服務提供了特色化服務。高校圖書館應主動結合用戶的實際需求和專業特色,進行信息服務。如根據熱點專業、精品課程、課堂研究等已有的內容,進行深度挖掘,使其具有更高價值,為讀者用戶提供的前沿研究領域和熱點動態。如建筑行業高校圖書館,重點關注建筑設計、建筑工程、建筑設備、橋梁等相關領域前沿研究信息和動態,通過熱點和館內資源進行深度數據挖掘,為讀者用戶從海量數據中挑選出隱含的知識信息,為研究提供正確方向,實現學科信息服務功能。

4展望

數據挖掘技術在高校圖書館中除了在文中提到的文獻推薦、可視化信息、學科信息服務、閱讀推廣工作中應用,在其他圖書館管理工作和建設中也應用得相當廣泛。在圖書館未來發展中,數據挖掘技術還將進一步應用于信息服務中,服務于高校讀者用戶。如何做好數據挖掘工作關系到高校圖書館信息化的發展。

主要參考文獻

[1]馬婷婷,李濤.基于數據挖掘的高校圖書館信息服務.[J].信息與電腦,2017(22):145-151.

[2]楊建明,劉芳.基于數據挖掘的高校圖書館服務優化研究[J].情報與探索,2014(4):25-32.

作者:李雅 單位:湖南城建職業技術學院