科技信息資源平臺創建
時間:2022-07-20 08:59:41
導語:科技信息資源平臺創建一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
1.1科技信息資源共建共享平臺研究現狀
由于國家的政策性扶持及引導,我國科技信息資源平臺建設與應用發展迅速,并逐漸滲透到科研活動中。從全國來看,當前絕大部分省份已建設并使用科技信息資源共享平臺。江蘇、福建、廣東三省的數字資源共建共享平臺整合的范圍不斷擴大,已擴展到應用程序與服務等方面,同時,也開始逐步注重人們的個性化信息需求,并通過各種信息資源聯合體、互助協作等形式,統一購買電子文獻資源,促進了研究所、圖書館的發展。但資源重復建設嚴重、缺乏統一的規劃與協調、數字圖書館標準不一、合作建設少等問題也越發突出,急需一個共建共享平臺來解決目前的困境。
1.2科技信息資源共建共享平臺建設存在的問題
1.2.1區域發展不同,導致其建設的不均衡經濟發達的地區或省份,借助國家政策的支持,利用其底子厚、起步早、發展快、技術手段先進等有利條件,積極開展科技文獻平臺建設工作。比如國家科技圖書文獻中心和清華大學等,對全國性的文獻平臺進行了研究和開發。加之這些平臺的后期建設有資金支持,技術裝備先進,服務條件好,他們的科技文獻平臺建設和服務走在全國前列。其他地區的科技信息資源共建共享平臺建設無法與其相比,其發展有一定的相對性和局限性,無論是建設情況還是使用情況,都有待提高。
1.2.2共建共享協調機制不完善共享平臺建設缺乏統一規劃和協調,處于各自為戰狀態,或者是非常松散的簡單合作,僅僅靠一個合作協議和理事會章程等自我約束,沒有強制性的義務也沒有法理層的權利,導致科技信息資源的收藏分散、重復,難以形成服務的整體優勢。
1.2.3平臺標準化水平、服務層次有待提高實現科技信息資源共享的前提就是平臺標準化。但就目前的現狀來說,標準化程度相當低,規范標準不一致,各平臺從總體設計框架到具體實現的底層技術手段大相徑庭,自建數據庫五花八門,不具備和其他平臺數據庫互聯的功能,制約了科技信息資源共享的發展。
2科技信息資源共建共享平臺建設的必要性及意義
2.1科技信息資源共建共享平臺建設的必要性
2.1.1科技信息資源的高速增長目前每個資源中心的數據庫少則幾十個,多則幾百個。隨著整體教育水平的提高、人們對信息資源利用水平的提高,資源中心需要向人們提供更多、更專業的學術資源信息。一些專業的資源商也開始提供一些更細致的學術信息,比如經濟類、法律類、標準類、教育類、醫藥類等資源。越來越多的科技信息資源在檢索利用過程中必然帶來學術資源利用率低、檢索效率低下等問題,這無論對于科技信息資源來講還是資源中心情報服務來說都是一種效益浪費。受采集資源的專業局限性影響,無論是以上哪一類信息,沒有一家資源商能夠囊括它所關注的那一類資源的所有學術信息。因此,資源中心為提供完善的信息服務,需要購買多家數據庫提供商的資源。而信資源中心向人們展示這些資源的時候,因商家不同,其使用界面和檢索方式均不相同,登錄認證方式也不一樣,所以不得不向人們分別提供這些信息,常見的方式就是在一個或多個頁面里列出各個資源的鏈接和登錄信息。人們在復雜繁多的科技資源中徘徊,要找到自己真正需要的資源往往需要熟悉各個不同的科技信息資源的檢索方式、文獻分類方式、檢索結果設置等,要耗費精力時間卻往往檢索結果不盡如人意。
2.1.2檢索期望的日益提高現在的學術研究需要的不再是龐雜的文獻的堆砌,而是精確的數據、事實的支持佐證。所以科研工作者在浩瀚的學術海洋里面尋找符合自己需求的文獻資源越來越難。各資源中心所提供的科技信息資源之間互相獨立,列表顯示,需要人們分別登錄訪問,并在訪問這些資源的時候,不得不點開一個個資源鏈接,登錄,輸入關鍵詞后進行搜索,由于各資源系統界面不一樣,搜索方式不一樣,搜索的效率很低。另外,數據量快速膨脹,逐步由找不到內容變成找到的太多太雜,耗費幾倍的時間用于查找。因此,人們對數據檢索的要求越來越高,希望在最快的時間內以最簡單的檢索方式找到自己的目標知識。隨著學科交叉滲透的不斷發展,學科間的聯系越來越緊密,簡單的檢索文獻已經不能滿足人們的學習與科研要求,人們需要從繁多的學術文獻中找到關聯,如何利用簡單快捷的檢索挖掘發現深層次的知識、整合文獻內容從而爆發新的知識點才是未來學術發展的熱點。
2.1.3圖書館角色的升級與轉變全新網絡時代的來臨使資源中心的服務理念、管理理念及相應的用戶體驗都發生了全新的變化。在信息與知識日益豐富的今天,這種變化已在迅速影響著圖書館,不斷推動圖書館向網絡虛擬型圖書館方向發展,逐步實現了無縫的用戶體驗,允許人們互動參與、以論壇社區為基礎的形式來設計程序、開源軟件的應用等。
2.2科技信息資源共享平臺建設的研究意義
資源中心可以通過各種信息資源聯合體、互助協作等形式,統一購買電子文獻資源,促進各資源中心的協調發展。但資源重復建設嚴重、缺乏統一的規劃與協調、數字圖書館標準不一、合作建設少等問題也越發突出,急需一個共建共享平臺來解決目前的困境。共享平臺的建設以CAILS的設計模式和運行機制為基礎,構建輻射的共建共享運行機制和模式,全面提升各科技信息資源建設和服務的整體發展質量和輻射帶動能力,逐步形成覆蓋各學科的科技信息資源保障網絡,實現資源的共建共享、互惠互利,實現共同參與、按比例投入、共同建設、共同受益、共同管理的建設目標??萍夹畔①Y源共享平臺是資源中心在信息時代滿足學術需求、體現“讓大眾公平自由地獲取知識信息”這一理念的必由之路。此平臺的實現具有一定的理論意義。信息資源共享平臺建設有助于提高自然資源的開發利用水平和效率,減少資源浪費和能源消耗,減少對環境的污染和危害等,具有較好的經濟效益。資源中心構建科技信息資源共建共享平臺可以加快推進節約型社會建設,實現信息資源的合理配置,成為推動社會發展、經濟繁榮和科技進步的助推器,具有良好的社會效益。
3科技信息資源共享平臺的總體架構設計
科技信息資源共享平臺的總體架構可分為門戶層、管理層、數據層、硬件層四個部分。各個成員單位的系統相對獨立,由共享平臺的各個子系統,如統一認證系統、聯合編目系統、統一檢索系統等組成,并建立了統一的綜合服務門戶,將每個系統、服務和資源整合起來。各層面說明如下:
3.1硬件層面
包括網絡平臺、服務器和大容量存儲設備等,是共建共享平臺的硬件設施,是賴以提供服務的硬件基礎。
3.2數據層面
包括館藏資源(圖書、期刊等)、數字資源(數字期刊、數據庫等)、各種自建和引進的特色數據庫、共建資源庫(如聯合目錄等)、統一認證中心數據庫等,是實現共享的內容基礎。
3.3服務層面
服務各個層次,是共享體系的組織保證,是共享平臺特殊服務層。包括元數據的加工與管理、數字對象的加工與管理、聯機編目、用戶權限管理和服務評估等,分別服務于數據層、技術層、服務層等,通過有效地組織管理和運行機制保證共享體系的實施。該層通過跨越分在不同地點的所有數字資源,提供分布式數據訪問、資源聚合和過濾、數據挖掘等。
3.4應用標準與協議層面
應用標準與協議層是共建共享平臺面向用戶的統一服務的窗口,是共享平臺最重要的一層,為共享平臺服務提供了方便的接口。通過信息集成和服務集成,綜合門戶平臺整合了各類文獻服務和專業信息服務;通過統一認證,支持成員單位用戶的訪問控制和個性化定制,從而為各服務節點和用戶提供數字資源共享的環境。
4科技信息資源共享平臺建設整合內容
4.1規范化建設研究
各資源中心的采購、編目、查詢和提供信息服務等必須采取統一的模式進行。這一點幾乎不可能實現,只有從不同的信息系統平臺中提取標準化的信息數據,建立合作的館藏資源,統一科技信息資源的合理配置與協調,有選擇、有重點地建設科技信息資源,才能為整個共享網絡提供信息服務,發揮群體效益。在數字資源整合方面,采取的措施有2種:一種是研究各個資源中心的管理系統、數字資源的底層設計,抽取關鍵字段,進行標準化處理,由平臺開發人員整合各個成員單位的館藏數據,形成統一館藏資源,可以實時進行更新數據,但比較費時麻煩,甚至需要各個軟件的開發部門的配合才能得以完成。另一種就是利用CALIS整合文獻資源的模式,由成員單位定期上傳或提交數據,實時整合資源,這樣更新速度慢,簡單方便,但需要成員單位密切配合,容易實現。在實際操作中,2種方法的結合,達到了較好的預期效果。為了強調數字資源的標準化,館藏圖書目錄方面,我們采用第二種方法———CALIS整合文獻資源模式,要求成員單位及時提供標準的MARC編目數據,定期上傳,建立和完善書目數據庫,形成聯合目錄以實現數據庫的轉換、交換、兼容和不同系統資源的共享;并由專門人員負責收集整理,實現起來比較容易。對于非標準化的數字資源,針對各種資源的特點,采用同構跨庫檢索技術基本能實現非標準化數據的檢索問題。這一技術的應用將在下面的技術層面進行詳解。
4.2技術支撐平臺建設研究
通過信息規劃、信息采集、信息加工處理、信息管理、信息、信息服務、用戶權限、信息傳輸交換,實現了各種文獻資源采集、整合、加工處理、管理、和對外開展文獻資源檢索服務、原文傳遞服務的技術支撐平臺的建設。同構跨庫檢索是資源整合系統的新理念與發展趨勢。單純的跨庫檢索與數字資源整合,不能體現學術文獻間的互相聯系。在Lib2.0環境下,基于發現與傳遞服務的一站式同構跨庫檢索系統,則較好地解決了上述矛盾,給資源整合提供了一種新的發展思路。利用同構跨庫檢索技術使用先進的數據萃取技術,可以把多種標準、多種格式或非標準自建的數據庫,比如常見的中外文數據庫,如書生、超星、方正、同方、維普、萬方、SpringLink、AIAA、Proquest、Open-Access等,以及資源中心的自建數據庫、網絡數據庫、光盤數據庫等在內的分布、異構和多樣化的數字信息資源進行整合。同構跨庫檢索技術無視源數據庫使用何種標準、何種格式,只要能夠以網頁的形式展現給人們,就可以獲得技術支持。同時,也支持各種外部系統的溝通協議,支持標準或非標準的數據交換格式,包括ISO2709(例如MARC21、UNIMARC、CMARC等)、NISO?ANSIZ39.85(DublinCore)、XML等;支持標準檢索協議規范包括Z39.50、HTTP、Z39.88等。資源門戶支持開放的體系結構,遵循信息描述、組織和資源互操作的國際標準,甚至支持以非標準協議進行的整合檢索。因此,根據各個資源中心的實際情況,可以對各種獨有的自建數據庫進行整合,最大限度地發揮擁有的數據庫資源,為人們提供更加便捷的服務。
4.3科技信息資源共享平臺建設整合研究
將平臺各聯合體的數據庫資源在科技信息資源共建共享平臺上實現整合,包括書目數據庫、網絡數據庫、電子出版物和自建特色數據庫等,整合為統一的檢索平臺。
4.3.1平臺建設目標要求(1)完成各種信息資源的一站式檢索數字資源按照資源類別分:圖書、期刊、學位論文、會議論文、視頻、報紙、標準等,人們可以在所有這些自然分類中同時進行搜索,也可以選擇在某個分類中進行搜索,無論使用哪種搜索方式,能更方便地找到自己所需要的信息資源至關重要。使用跨庫檢索技術檢索資源,被訪問資源正文仍然在各個資源庫,同構跨庫檢索同各個資源數據庫做了相應接口。人們訪問資源正文的時候無需再單獨登錄,即一站式登錄,登錄同構跨庫檢索系統,既是登錄了以往的各個數據庫。人們只需在檢索口輸入目標檢索詞,例如主題、關鍵詞、全文、題名、摘要、作者、文獻來源、時間、刊號、刊名等,就可以同時在不同類型文獻資源中快速檢索目標文獻,不會受限于某個數據庫的網絡鏈接狀況。一站式檢索平臺使人們的檢索更加快捷、高效和全面。(2)實現不同信息資源檢索智能跳轉為方便人們訪問各個數據庫,不需要在各個數據庫間不斷重復輸入關鍵詞、不斷地打開、關閉數字資源等操作,實現了不同信息資源檢索的智能跳轉。人們只需要輸入一次關鍵詞,點擊自己關心的不同資源類型,目標檢索詞就能夠在多類型文獻資源中跳轉檢索,快速定位檢索目標,而且提供中文語義化搜索西文功能,智能分析與拆分檢索句段。(3)高級檢索方式同構跨庫檢索支持二次檢索與高級檢索,可以限定檢索詞出現的位置,如題名、作者、簡介、ISBN、ISSN、DOI等;可以限定資源的年代,以實現更精確地檢索,為專業的資源中心專家、科研人員提供深層次的學術檢索服務。(4)檢索結果自動去重融合傳統的學術文獻的檢索是以不同資源商提供的系統為基礎的,人們根據各個數據庫固有的檢索方式與功能檢索文獻,檢索結果可能會有很多重復的結果,由于系統間沒有關聯,常常需要靠人工的方法去重,這種檢索模式割裂了不同類型資源相關學科、主題的學術關聯,對人們來說是一種學術浪費,降低了學術研究的互補性與全面性。共享平臺把各種資源做了技術性的融合和去重,不是簡單的資源羅列,比如同一個資源的元數據,可以把多家資源商提供的元數據互補得到一個更全面的描述,檢索出來的結果是自動去重后的結果,大大提高了檢索的效率,并能為人們提供全面的學術文獻。(5)語義化中文直接檢索西文大部分中國人習慣使用中文進行搜索,利用同構跨庫檢索技術可以讓人們使用中文關鍵詞搜索到相應的外文期刊或者外文論文,并能做更進一步的智能優化處理。比如搜索“美國”可以搜索到含有“America”、“USA”、“National”等外文關鍵詞的文獻,搜索“高速公路”可以搜索到含有“Highway”、“Freeway”、“Superhighway”、“Motorway”等外文關鍵詞的文獻。(6)檢索結果優化聚類利用同構跨庫檢索技術為人們提供精確全面的檢索結果優化處理。比如:系統根據文獻出版時間、所屬學科、相關度、文獻檢索字段、文獻來源等對檢索結果提供精確的聚類導航分析,進一步縮小和精確檢索結果;系統還可以針對每一種文獻資源的屬性設置相匹配的檢索字段檢索,對中文資源系統支持基于中圖分類的四級類別的學科分類;人們可以逐步縮小檢索的范圍以實現更精確地篩選檢索,協助用戶挖掘信息,從而做出更深入的專題研究。
4.3.2共享平臺建設整合方法采用同構跨庫檢索模式,通過對本地各類鏡像數據庫、館藏印刷型資源、遠程數據庫建立超級統一索引,可以使人們根據檢索需要進行檢索,進行一站式發現與傳遞,為人們提供一站式解決方案,簡化了從資源發現到獲取的檢索過程,使人們能夠快速找到和獲得準確、高質量的信息。同構跨庫檢索技術的技術原理如圖1所示:這樣通過數據融合,可以得到一個元數據信息最豐富最全面的頁面,包括題名、作者、分類、時間、摘要、參考文獻、關鍵詞、主題詞等。可以為用戶提供統一的界面設置,提供多字段匹配,并且檢索結果匹配率高、全面,能合并95%以上的重復文獻。能夠將前端人們服務和后端各類圖書館的資源管理連成一體,能夠為圖書館向新的信息系統架構轉型提供可靠的技術支持。資源整合的過程是自動化的,對各種頁面類型內容智能識別和抽取結構數據。沒有開放接口的數據庫能像具有openurl的系統一樣互聯互通,為同構跨庫檢索提供了有力的技術支持,實現了資源的統一共享。
4.4知識產權保護技術研究
對于每個成員單位購買的科技信息資源的全文可以直接下載閱讀,也可以跳轉到原數據庫的詳細頁面。成員單位全文鏈接提供兩種解決方式:一種方式為服務器獲取方式,成員單位內安裝服務器和相應的全文系統,當人們點擊獲取正文請求時,直接由全文系統處理返回全文的下載或者閱讀頁面。另一種方式為客戶端控件獲取方式,通過文獻元數據頁面內嵌的一個控件,模擬人們登錄原文數據庫和搜索原文的過程,返回文獻正文的鏈接地址。這兩種方式完成的目標是一樣的,區別在于任務是由服務器端來處理還是由客戶端來處理。非自己購買的科技信息資源為避免版權問題,可以采用各種文獻資源的搜索服務和元數據同構展示,需要全文服務的,利用自動文獻傳遞的方式獲得,以避免版權糾紛,保證人們的利益最大化。
5科技信息資源共建共享平臺建設的建議
將平臺各聯合體的數據庫資源在科技信息資源共建共享平臺上實現整合,發揮各協作館印刷性文獻、電子型文獻和網絡信息資源的優勢,加強交流和合作,按統一的標準加以整合,建立起互惠互利的信息資源共享關系,構建印刷型資源和數字化資源并存的信息資源共建共享體系。通過1年的建設,基本建成覆蓋科技信息資源領域的、較完整的、適應科技創新要求的、具有區域特色的科技信息資源保障體系。
5.1建立共享組織體制和工作機制
加強對科技信息資源共建共享的協作機制的建設,建立分布式數字資源加工、集中元數據存儲檢索服務、分布式全文提供和原文傳遞的共建共享組織體制和工作機制,成立科技信息資源共建共享協會,共同組織實施。
5.2建立分類科學、配置合理的科技信息資源保障體系
整合全省各種來源、各種媒體、各種類型的科技信息資源,建立與各資源中心發展相適應的、各學科文獻資源相對齊全、文獻類型覆蓋期刊、圖書、專利、標準、學位論文、會議論文、檢索數據庫等的共享的、分布式的大型科技信息數據庫群,建立分類科學、配置合理、共建共享、服務于科技的信息資源保障體系。
5.3建立共建共享的科技信息服務技術支撐平臺
建立軟件技術支撐平臺,實現各科技資源成員單位的本地數據標引、加工與全文電子資源制作;完成集中元數據管理、資源整合與統一服務;實現元數據、全文信息的無障礙傳遞;形成統一的、安全的資源管理、整合和信息服務平臺。
5.4建立完善的平臺標準規范體系
(1)規范平臺的建設標準制定合理的平臺總體框架、技術標準規范、平臺擴展規范、數據庫接口規范等,規范跨平臺的數據共享。(2)對平臺的信息資源進行規范制定平臺元數據標準,以便建立相應的基本元數據規范,包括格式定義、語義定義、開放標記規范、擴展規則等。(3)規范平臺的服務標準制定平臺的應用服務規范、檢索服務規范等,規范平臺提供的查新、檢索以及科技咨詢等服務,提高信息服務水平。
5.5建立資源共建共享協調機制
要實現跨系統、跨區域的科技資源共享,就要成立由政府部門牽頭或指定的跨系統、跨區域的協調機構,解決管理體制帶來的障礙。這樣不僅能解決資金緊張問題,而且可避免資源的重復建設。
- 上一篇:銀行科技服務規范化實踐
- 下一篇:互聯網視野下網絡群體性事件