檔案結構數學模型論文

時間:2022-07-31 11:04:00

導語:檔案結構數學模型論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

檔案結構數學模型論文

【摘要題】理論探討

【正文】

1檔案結構

馬克思主義哲學認為,事物都是以特定的結構形式存在的。每一種事物都有其特有的結構特征,事物若失去其自身的結構形式,該事物也就必然失去其自身的功能和屬性。事物的結構是由組成它的各個要素(或因素)按照一定的規則(即要素之間的相互聯系、相互作用、相互制約的內在聯系)有秩序、分層次地結合成一定的組成形式而實現的。人們認識事物,其實就是要弄清事物組成要素、結構、功能與價值及其本質屬性,其中結構具有非常積極的意義。對于檔案結構的認識,檔案學教材已有所涉獵,主要從檔案的實體構成和檔案的構成要素兩條途徑進行闡述。“文件是檔案的因素,檔案是文件的組合”[1]屬于前者,“檔案的信息和載體是構成檔案的兩個基本要素”[2]屬于后者。前者主要的目的在于說明檔案館、室的檔案與單份文件的區別,強調檔案的實體結構,可以為文件的整理和檔案館(室)藏提供理論依據。后者是對檔案或文件自身構成要素的概括,雖然它并不說明文件和檔案實體的館藏意義,但這一認識對檔案的信息整理和信息分類提供了理論依據,特別是電子文件的出現,文件信息可以自由地游離于原有的文件載體,使得電子文件的整理幾乎完全成為文件的信息整理,所以檔案文件的載體和信息的二元劃分,為電子文件的整理提供了強有力的理論武器。

近年來,對檔案結構已有人發表文章進行專門的探討,一種觀點認為“檔案的結構是以知識單元的歷史聯系為依據的文件載體排列方式”。[3]劉新安等在文章《檔案物質實體的雙重構成》中認為,檔案是由“文件實體集合”和“檔案歷史聯系的記錄”共同構成。[4]本文是在過去檔案界對檔案結構認識的基礎上,對該問題的進一步的探討,給出數學模型的基本形式,并以此為基礎解釋檔案學理論和檔案工作中的相關問題。

2檔案結構的數學模型

檔案的結構是一個比較復雜的問題,而且隨著檔案實踐的發展日趨復雜,尤其電子文件的出現,使得檔案信息與載體既可合二為一,又可一分為二,因此檔案的構成也必然要考慮到檔案的信息和載體兩個方面。我們可以將其歸納為:A=F(C+I)。

其中,A代表檔案,C代表文件的載體,I代表文件載體所承載的信息,“+”表示文件載體與文件信息之和。F是檔案工作者賦予文件載體和文件信息的整理行為,即整理的原則和方法。以上公式告訴我們,檔案是我們按照特定的原則將文件的信息和載體進行有效組合生成的物質。其基本含義可從以下幾方面理解和分析。

2.1任何一種文獻,都是由載體C和信息I而構成的,檔案是文獻中的一種,是文獻的下位類概念,它也應該由信息和載體構成,充分揭示了檔案與文獻的從屬關系。檔案與一般文獻(圖書、期刊、報紙等)的主要區別在于兩點:其一,公式中C和I嚴格界定為文件的載體和信息,文件是人類社會活動的伴生物,它具有原始的歷史記錄性,將文件進行整理生成檔案以后,這種屬性不但沒有削弱,反而得到了進一步的加強,這是一般文獻不可比擬的。其二,就一般文獻而言,整理過程不是構成文獻的必要條件,即經過整理的和沒有經過整理的文獻都是文獻,但就檔案而言,我們知道文件轉化為檔案必須具備三個必要條件,其中之一即是對文件的整理。正如《檔案管理學》教材所論述:“檔案的特點和優點之一,就在于它已經不是一份份孤立的文件,也不是一批批雜亂的文件的堆積,而是具有內在聯系的文件體系,它反映了各種活動和事件的原貌。所以未經整理的、雜亂無序的零散歷史文件,雖然也屬于檔案,但從檔案的一般特點來說,它并不是典型的、科學意義上的檔案?!盵5]換言之,孤立和雜亂的文件經過整理才成為具有結構特征的檔案。

2.2A=F(C+I)中的F是文件轉化為檔案的基本條件,依上所述,主要指對文件實體和文件信息的整理原則。在數百年的檔案實踐過程中,整理原則也隨之發生過幾次重大變化。從最早的二元主義的序列原則(即在收文和發文二元下以時間先后進行文件排序)到事由原則,再到后來的來源原則、自由來源原則,一直到上個世紀80年代中后期,我國檔案學者何嘉蓀、馮惠珍教授提出主、客體全宗的理論,可以說都是對檔案整理理論的探討。由此可見,F隨著檔案實踐的不斷發展和人們對檔案實踐認識的深化而變化,使之具有新的內涵。文件和檔案的整理是檔案實踐的核心內容,貫穿于文件運動的全過程(單份文件→卷→類→全宗→館藏),它使散亂的文件具備了有機的結構特征。所以公式中的F不是檔案的結構自身,但它是搭建檔案結構的基本原則和方法。

A=F(C+I),F是一種法則,文件實體和文件信息的有機組合經過F法則變換成為“典型的、科學意義上的”檔案。F變換以建立檔案文件之間的內在聯系、搭建檔案文件的有機結構為目的。荷蘭手冊的作者認為:“一個全宗是一個有機整體,……它按照一定的規則成長著、形成著、并且變化著……”。[6]英國檔案學家詹金遜也認為:“它是一種生長的結果,正像一棵樹一頭動物一樣,也是一種有機體?!虼耍母鞑糠种g,也有著對它本身的意義不可或缺的結構、關節和自然聯系”。[7]

2.3A=F(C+I)中的C+I對于新的檔案實踐,尤其是電子文件、檔案實踐,具有非常重要的意義。在傳統的以紙質檔案為主導的檔案實踐活動中,一份文件的載體與信息是不可分的,文件信息相對于它的載體,其“貞節”程度可謂“從一而終”,所以文件、檔案的整理也是載體和信息一并進行的,不可能各自獨立進行。這一時期,實際上C+I可以用一個字母表示。但自上個世紀80年代中期《中國檔案分類法》問世以后,對傳統的文件的結構和整理理論提出挑戰?!吨袊鴻n案分類法》雖然名為檔案分類法,但它卻不能直接用于檔案室和檔案館實體的分類,《中國檔案分類法》實質上是對檔案信息的組織方法,而不是對檔案室和檔案館實體檔案的分類方法。由此人們第一次認識到,檔案實體的整理和檔案信息的組織是可以分離的。正是由于這一原因,在上個世紀80年代中后期的檔案管理學教材中,提出檔案由文件載體和文件信息兩大要素構成,順理成章,將檔案的分類也劃分為實體分類和信息分類。何嘉蓀教授在他主編的教材和與傅榮校博士合作的專著中將檔案的實體整理和信息整理稱之為“實體控制”和“智能控制”。

近年來,電子文件的大量涌現直接影響到檔案的整理理論和技術。電子文件的信息對載體的依賴不比當年,電子文件的信息相對獨立,以至于電子文件在線傳輸時,其載體往往是不被考慮的,非到文件信息脫機保存時文件的載體才被重視。實際上,電子文件的整理過程已經演化為以著錄為依托,以檢索為手段的情報信息處理過程,它與電子文件脫機以后的實體保存并沒有必然的內在聯系,它們可以分別獨立進行。因此文件C+I的兩元表現形式,對于新的檔案實踐具有特殊的積極意義。對于脫機以前的電子文件的整理可表示為A=F(I),而脫機以后的實體的分類保管亦可表示為A=F(C),它們允許遵循不同的整理原則F,而且可以各自具有不同的結構。在目前以紙質文件為主導的檔案整理中,實體整理(即檔案室、館的整理)以載體的排列為目的,按照歷史原則(即檔案文件之間的歷史聯系)進行,實現由文件→案卷→全宗→館藏的實體結構;按照《中國檔案分類法》對檔案信息的分類,則遵循邏輯原則,形成與檔案實體不同的檔案信息的特殊結構。

3A=F(C+I)的異化及其意義

A=F(C+I)概括了一般檔案室和檔案館的紙質檔案的結構關系,它具有普遍的適用性,但它也可以出現以下幾種異化形式,并且與檔案工作實踐中的特殊情況相對應。

3.1A=(C+I):即在特殊條件下,沒有經過任何整理(公式中F不存在)的文件依然可以成為檔案,而不能再將它們稱為文件。盡管沒有經過整理的文件不是“典型的、科學意義上的”檔案,但畢竟還是檔案,而且在檔案實踐中也是可能出現的。例如,檔案征集是檔案收集工作的組成部分,檔案室和檔案館征集到的零散文件,雖然它們沒有經過必要的整理,我們依然將它們稱之為檔案。檔案的征集雖然在檔案的收集工作中不占主流,但卻是檔案館的經常性的業務活動,以至于大多省級檔案館都設有專門機構來進行檔案征集工作。A=(C+I)是A=F(C+I)異化后的特殊形式,也對應著一定的檔案實踐活動。在何嘉蓀教授和傅榮校博士合著的《文件運動規律研究》一書中,將這一現象概括為“文件運動過程中的跳躍”現象。

其實這一現象在以往的檔案學研究中一直沒有給予科學解釋。在檔案學教材中,我們一方面強調文件轉化為檔案的三個必要條件,必要條件之一就是沒有經過整理的文件不是檔案,另一方面又認為文件一經歸檔進入檔案室和檔案館就成為檔案,那么征集到檔案館、室的零散文件沒有經過必要的整理,我們將它稱為檔案呢,還是文件呢?如果依照必要條件判斷,它未經整理是文件,可是它又是檔案館的日常業務之一,而且我們將這項活動不叫做文件征集,而稱為檔案征集,在檔案學教材中也將這部分內容設在檔案工作的收集環節講授,因此形成悖論。我們給出的檔案結構模型的異化形式可以給它適當的解釋。

3.2A=F(C+X)是檔案結構模型的另一種異化形式,即在文件形成檔案的過程中側重于考慮文件載體,而淡化其中信息之間的有機聯系及其表現形式(信息I異化為X),這種現象在現實的檔案實踐中也時而顯現。例如:織布廠的樣品室中的產品樣本,其本身就具有檔案的性質,它以實物的形式記錄企業的產品開發和生產活動。據筆者調研,甚至有不少企業干脆將布的樣本裁減成照片大小裝入像冊保存在檔案室中,將其視為樣品檔案。如果將這些布的樣品視為檔案,樣品中的信息就已經發生了異化,它不再是一般意義上的文件信息,其中信息的表現形式既不是文字的,也不是圖表的,甚至也不是聲相的,但是這些樣品仍然具有檔案屬性。其實這些樣本與開發它們時所形成的產品檔案相互對應,換言之,二者所含的信息盡管表現形式不同,但實質上具有同一性,它們是以不同的信息形式表現同一個產品的信息,共同記錄和反映企業的產品開發和生產活動,應該說二者所包含的信息具有內在的必然聯系,但是對樣品“檔案”和產品檔案卻采取了不同的整理方式,且分別保管。這種情況屬于重視載體的特殊性,淡化信息之間的有機聯系。此種情況在檔案工作實踐中絕非個別現象,檔案室和檔案館中將不同載體的檔案淡化它們信息之間的相互聯系,各自整理分別保管習以為常。特殊載體的檔案尤其是實物檔案往往需要特殊的整理方法,同時形成它們的特殊結構。

3.3A=F(X+I)與以上討論的問題相反,即重視檔案文件信息的結構而淡化文件的載體。當我們對檔案的處理重點針對它的信息,而很少關注它的載體形式時,則檔案結構的模型異化為A=F(X+I)(此時載體C已經異化為X)。這個表達式最為典型的現實意義是我們目前最為關注的虛擬檔案和檔案的虛擬整理。在虛擬檔案和檔案的虛擬整理中,整理的對象主要是針對文件的信息,使之能更好的適應人們的需求,至于電子文件的載體,在文件脫機保管以前,其載體只具有技術方面的意義,幾乎與整理沒有關系。電子文件即使是脫機以后,它的整理保管與紙質文件的整理原則也不會完全一致,甚至大相徑庭。

值得注意的是,對電子文件的整理由于主要是針對它的信息而忽略其載體,所以整理的原則和整理以后所形成的檔案結構(信息結構而非實體結構)都將發生重大變化。歷史性原則(即按文件的來源、內容、時間和形式等建立的文件之間的歷史聯系)和邏輯性原則今后會成為電子文件整理并重的兩大原則,由此引發電子檔案的結構也必將突破紙質的實體檔案結構的固有模式。例如,根據“電子文件真實性的永久保管國際研究項目”(IflterPARES)研究成果,一份完整的電子文件構成要包括:載體、內容、物理和智能格式、活動、人員、檔案鏈、背景等7個基本要素,[8]與傳統的紙質文件相比,顯然文件的微觀結構發生了重大變化。從宏觀上講,傳統的全宗也不一定再是檔案結構中的最高層次。美國檔案學者塞繆爾斯(Samusls)提出的“文獻戰略”應用于傳統的檔案實踐中顯然是困難的,但在電子文件領域的應用前景是樂觀的。塞繆爾斯(Samusls)的“文獻戰略”觀念對傳統的檔案的收集、整理、鑒定、檢索以及檔案的結構形式等方面從理論到實踐都將產生深刻的影響。

綜上所述,A=F(C+I)概括了一般情況下檔案結構的基本模型,F表示使文件轉化為檔案的手段、方法和原則,它具有明顯的時代特征。檔案的實體整理從最早的序列原則到事由原則、來源原則、歷史性原則以及電子文件出現以后各國檔案學者提出的新的原則和方法,都是對F的時代特征的注釋,我們應該相信,隨著檔案實踐的發展,F還會有新的含義。另外,F與文件的載體C和文件信息I明顯存在對應關系,文件的載體不同(往往表現為I異化)整理的原則和方法也不同;同理,當載體C發生異化,只對文件的信息I進行整理時,也應該采取新的整理原則和方法。更值得注意的是,F、C、I中任何一個要素的變化都會直接影響到檔案的結構,因此,不同文件載體和不同文件信息表現形式的檔案實踐將會直接導致檔案結構的多元化。

對檔案結構較為系統的研究,目前尚未引起檔案界應有的重視,成果較少,將檔案結構模型化就更顯得困難,本文僅作為對該問題的初步探索,拋磚引玉,希望得到檔案界同仁的批評指正。

【參考文獻】

1、2陳兆吳,和寶榮.檔案管理學基礎(修訂本).北京:中國人民大學出版社,1996:14

3桑毓域,翟惠媛.論檔案的結構及其在實踐和理論上的作用.天津檔案,2002;1

4劉新安等.檔案物質實體雙重構成.檔案學通訊,2003;5

5馮惠玲.檔案管理學.北京:中國人民大學出版社,1999:6

6、7何嘉蓀,傅榮校.文件運動規律研究.北京:中國檔案出版社,1999:123-125

8馮惠玲.電子文件管理教程.北京:中國人民大學出版社,2001