圖書館個性化服務數據挖掘論文
時間:2022-05-21 09:11:41
導語:圖書館個性化服務數據挖掘論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
1圖書館應用數據挖掘技術的必要性與可行性
1.1數據挖掘技術
關聯分析即找出兩個或以上變量之間同時出現的規律、因果結構,即通過其他事物可對某個與之相關的事物做出預測。數據挖掘關聯分析的主要作用就是分析海量數據中潛在的關聯規則,對于高校圖書館個性化服務而言,即從圖書館數據庫中發現相關的關聯規則,針對用戶的信息需求做出準確預測,提高信息推送的針對性,便于用戶獲取所需的信息。聚類即將數據庫中的一組個體按照相似性歸結為若干類型,應用于圖書館系統中,就是將相似的文獻集中在一起,用戶在搜索相關文獻時可以查閱更多其他相關內容,便于其總結、歸納;在個性化服務中還可以通過聚類匯總用戶所需的特定信息。分類與聚類相似,是按照分析對象的屬性建立類組,用戶查閱資料的過程中,每種信息的重要程度有所不同,通過分類可以將用戶所需求的知識分為高度需求、中度需求及低度需求。在高校圖書館個性化服務中要對用戶的使用規律做出預測,即根據用戶歷史查閱記錄對用戶所需的文獻種類、特征等做出預測。時序模式主要是通過時間段對用戶的訪問記錄、檢索過程做出標志,再通過時間序列將重復率較高的內容挖掘出來,以預測其下個信息需求,提高用戶查閱資料的便利性。
1.2圖書館中應用數據挖掘的必要性與可行性分析
圖書館應用數據挖掘技術的必要性體現在以下幾個方面:首先,信息化需求。用戶的借閱記錄、檢索記錄均存儲于圖書館數據庫中,需要利用數據挖掘技術將這些海量數據轉換為有用的知識信息,以便于館員做出決策。其次,圖書館的管理需求。傳統圖書館系統僅能為用戶提供簡單的訪問、檢索等功能,這些功能無法滿足圖書館個性化的技術要求,因此要利用數據挖掘技術將用戶借閱數據中隱含的關聯性發掘出來,從中發現有用的知識信息。最后,用戶服務的需求。數字化圖書館的發展越來越迅速,用戶通過圖書館獲得的資源也越來越豐富,如何從海量的信息資源中發掘出對用戶有用的知識信息,僅依靠傳統的圖書館管理系統無法解決這一問題,因此要利用數據挖掘技術對用戶的借閱記錄進行分析,從中獲得更多有價值的信息,以提高圖書館的服務質量及館藏利用率。而在圖書館個性化服務中應用數據挖掘技術也是可行的,一方面很多圖書館已具備比較好的物質條件及人才條件,這些均是圖書館個性化服務中應用數據挖掘技術的必要條件,而且政府在經濟方面、政策方面也為數據挖掘的應用提供了更多保障;另一方面,近年來數據挖掘技術也有了長足的發展,其足以為圖書館的個性化服務提供必要的技術支持。圖書館數字化發展過程中需要采集、購置更多的數據資源,而利用數據挖掘技術可以為圖書館資源建設提供指導作用,挖掘圖書館的歷史借閱記錄,可進一步了解用戶的借閱習慣、閱讀興趣及信息需求,并且可以對不同圖書之間的關聯性進行深入分析,圖書館員根據這些信息記錄、分析結果等提供指導,可以提高圖書資源分配的合理性,對館藏布局進行優化。由此可見,數字化圖書館個性化服務中應用數據挖掘技術十分必要。
2圖書館個性化服務的具體體現
高校圖書館個性化服務是指根據每個用戶的專業、愛好、研究方向、探索領域及特殊服務為其提供更具針對性的信息服務,幫助用戶查閱更加完整的信息資料,便于其學習、研究。高校圖書館個性化服務具體體現在以下3個方面:
①用戶可根據自己的需求定制相關信息,以保證其在圖書館中能夠查閱到相關資料;圖書館利用數據挖掘技術發現用戶的興趣愛好,為其定制個性化的訪問空間。用戶訪問圖書館數據庫時會將其興趣愛好間接地反映出來,如果用戶不感興趣,在頁面停留的時間會較短,停留時間較長則說明比較感興趣;利用用戶的瀏覽路徑信息時間即可將用戶對信息資源的感興趣程度發掘出來。
②提高圖書館資源利用率。利用數據挖掘技術可以識別圖書館網站內頻繁訪問的路徑及用戶訪問次數較多的頁面,可以將新書信息、重要的分類信息放在這些路徑上,從而向用戶主動推送其所需要的信息資源,提高圖書的利用率。
③優化鏈接結構,提高用戶應用的便利性。對Weblog進行挖掘,可以發現用戶訪問頁面的相關性,增加聯系比較密切的網頁之間的關聯性;發現用戶的期望位置,如果用戶訪問期望位置的頻率高于對實際位置的訪問頻率,則可在二者之間建立導航鏈接,優化站點。
④查新服務與定題服務。傳統圖書館主要通過查詢光盤數據庫、文獻數據庫等進行查新服務,而隨著網絡技術的不斷發展與應用,外部網絡信息及更新的速度遠遠超過圖書館內部網絡,因此要加強網絡平臺的建設,以保證服務結果的真實性與可靠性。數字圖書館在進行查新與定題服務過程中,可以利用可視化技術為用戶提供在線即時信息分析。
3圖書館個性化服務中數據挖掘技術的應用
圖書館個性化服務數據挖掘技術的應用流程如下:建立讀者數據倉庫——數據收集——挖掘算法的選擇——挖掘結果的顯示——對結果的評價。
3.1建立讀者數據倉庫
數據挖掘過程中,在確定了挖掘目標后,即開始進行數據準備,從大量數據中選擇一個與需挖掘目標相關的樣板數據子集。此時需要建立一個數據倉庫,其主要作用是將所有挖掘目標所需的數據保存其中,如果未建立數據倉庫直接進行數據挖掘,可能會導致挖掘失敗,因此數據挖掘的前期工作大部分用于準備數據,因此建立數據倉庫是一個至關重要的準備工作。高校圖書館個性化服務中應用數據挖掘技術,第一步就是建立用戶的興趣庫及圖書館自身的特色資源數據庫。用戶使用圖書館的過程中,必然會產生大量的借閱記錄,訪問圖書館網站會留下訪問記錄,這其中均潛藏了大量有意義的信息。
3.2數據收集
在建立用戶興趣庫及特色資源數據庫后,必須對這兩個數據庫中的數據進行分析、調整,以保證原始數據的質量,從而保證數據挖掘結果的質量。數據收集即數據的分析與調整可以分為數據抽取、數據清洗及數據轉換等3個步驟。其中數據抽取的主要作用是將與挖掘目標相關的數據信息搜索出來;數據清洗則是對數據進行噪聲消除、重復記錄的消除及推導計算缺值數據等。圖書館每天會產生大量的用戶相關的數據,并非所有的數據均對整個挖掘處理過程有正面作用,有些數據可能會對挖掘效果產生負面影響,因此剔除這些無用的數據十分必要。數據轉換的主要作用是精減數據維數,從初始特征中分析出真正有用的特征,通過數據轉換可有效減少數據挖掘時需要考慮的變量數。
3.3選擇算法及建立模型
數據挖掘過程中不同的算法可能會實現同一個任務,但過程卻大相徑庭,因此要根據數據的特點、實際運行系統的要求選擇適用的算法。有些用戶比較傾向于獲取描述型的、容易理解的知識,有些用戶則希望獲取預測型知識,因此要針對不同的用戶選擇對應的算法,之后就要進行數據挖掘模型的建立。通過對用戶分類、聚類及時間序列的分析,將每類用戶的普遍性需求及個性化需求抽象出來,從而建立一系列的關聯規則模型。一個模型完成后不一定可以立刻解決問題,需要對其進行反復驗證,如果可以解決問題證明模型有效;如模型存在缺陷,則要通過反饋對模型進行修改、調整,或者選擇新算法,建立新模型,對不同的模型進行全面考察。
3.4結果解釋與知識表示
在建立數據挖掘模型后,可利用建立挖掘模型時所用的算法規則進行運算,即可產生數據挖掘結果,圖書館只需對挖掘結果進行可視化、可理解化處理即可。要將抽象的數據解釋成易讀、易懂的結果,圖書館決策者及管理者即可根據可視化的挖掘結果進行決策。比如圖書館新引進了一批考古專業的學術論文,由數據挖掘模型分析結果可知,該批論文的查閱者90%均為考古專業的老師與學生,其他專業的師生查閱率不到10%,根據這一結果,即可將論文信息傳遞給考古專業的相關用戶,以提高信息推送的針對性。
3.5結果的驗證、應用及評價
產生挖掘結果后需要進一步實踐,以驗證結果的有效性與可用性,及對模型的實用性進行評價,并且挖掘結果還具備預測未來數據的功能。上一步的結果解釋經過實踐后,可對應用過程進行跟蹤了解,獲得用戶的反饋信息,對結果的實用性進行驗證。需要注意一點,即一個數據挖掘的模型與已有數據完全相符比較困難,且并非所有的環境、每個時間節點均適用于同一個數據挖掘模型,因此要對挖掘結果做出評價,如經過用戶的反饋,數據挖掘出來的結果可以解決問題,實現了最初的挖掘目標,滿足了用戶需求,則可判定該模型是合理的。挖掘結果可以滿足用戶的要求,用戶就會做出滿意的反饋,將這一反饋信息提供給決策者即可做下一步的實施,完成該階段后,圖書館就基本上實現了以用戶為中心的個性化服務的數據挖掘過程。不過某些情況下模型的評價結果可能不盡如人意,即數據挖掘的結果無法滿足用戶的要求,這種情況就要由系統進行重新處理,重復上述步驟,重新抽取數據、選擇另外一種數據轉換方法、設定新的數據挖掘參數值、選擇另外的挖掘算法等。由此可見,數據挖掘的過程是一個不斷反饋的過程,體現出反復性的特點。
4結語
從某種程度上講,個性化服務模式是圖書館傳統被動服務的變革,其遵循“一切以用戶為中心”的服務理念,真正實現了“用戶需要什么,圖書館就提供什么”的主動的服務模式,可以預見,個性化服務模式必將成為數字圖書館技術發展的主要趨勢?,F階段,我國網絡用戶數量呈幾何倍數增加,用戶的需求也呈現多樣化、復雜化的特點,圖書館只有向其提供更具針對性、個性化的信息服務,才能滿足其越來越高的信息服務要求。在海量的信息資源中,數據挖掘技術可以提供極具智能化的個性服務,因此已逐漸成為數字圖書館建設中非常重要的技術支持與保障。當然,數據挖掘技術還屬于一種新興技術,尚存在一些不足與缺陷,比如數據的可視化、數據挖掘語言的標準化、多層次、多種類知識的高效挖掘方法等,這些均是后續需要不斷探索與研究的課題。但是我們相信,未來的數字圖書館建設過程中,數據挖掘技術的作用將越來越不可替代。
作者:孫燕單位:泰州職業技術學院圖書館
- 上一篇:中學政治課多媒體教學論文
- 下一篇:高血壓病案數據挖掘論文
精品范文
10圖書館論文