學術期刊PDF文件處理方法
時間:2022-02-25 08:25:00
導語:學術期刊PDF文件處理方法一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
網絡出版具有傳播速度快、傳播范圍廣、檢索方便、閱讀便利等優點[1-2],已成為傳播研究成果的重要方式。網絡出版主要有期刊網站和第三方數據庫平臺等模式。目前,已有越來越多的期刊自建網站,并通過期刊網站及時發布稿件全文,以便于讀者閱讀和作者下載,提高期刊的影響力。在第三方數據庫平臺提供商中,中國知網在2017年推出了網絡首發出版平臺[3],通過該平臺可進一步縮短出版時滯,且該平臺支持增強出版的新型數字出版模式[4],允許期刊在上傳稿件根文獻的同時提交相關的附加材料,這極大有助于讀者對稿件的理解。PDF格式文獻可保持電子文獻與紙質印刷的一致性,同時具有跨平臺、體積小、安全性高等優點,目前仍然是我國學術期刊實現數字出版的主要模式[5]。在整期定稿后進行中國知網網絡首發及在期刊網站發布時需要對整期pdf文件進行繁瑣的單篇拆分操作,對含有附錄的稿件,還需定位出是哪些稿件含有附錄以提醒稿件責編準備附錄材料,在期刊網站發布時,為便于讀者閱讀可將含附錄的稿件與相應附錄進行合并再上傳至后臺系統。這涉及一系列重復性操作,非常耗費編輯的時間,也影響了稿件的及時網絡發布。VBA作為一種強大的編程語言,有助于實現重復工作的自動化,已在編輯工作中有所應用,并取得了較好的效果[6]。目前,暫未見到關于VBA處理整期PDF文件的文獻報道,為此,筆者根據在《電力自動化設備》雜志社的工作實踐,建立稿件處理窗口,采用VBA編程分別實現一鍵整期PDF文件單篇稿件的拆分、在組稿單中含附錄稿件的標注及單篇稿件與附錄的合并功能,以節省編輯工作時間,加快稿件的網絡發布,提高期刊的影響力。
1準備工作
采用OfficeWord和AdobeAcrobat這2種常用辦公軟件,并在WordVBA編輯器中,將AdobeAcrobat9.0TypeLibrary和MicrosoftScriptingRuntime加入工具菜單的引用中。原始文件為組稿單Word文件和整期稿件PDF文件,以《電力自動化設備》2021年第2期為例,組稿單如表1所示。
2功能實現
2.1窗口建立
在WordVBA編輯器的Normal工程下建立如圖1所示用戶窗體。其中,輸入單篇稿件的名稱前綴,再點擊“整期拆分及標注含附錄稿”按鈕,可將整期PDF文件拆分為單篇稿件,并在組稿單中對含附錄的稿件進行突出顯示,以提醒相應責編準備附錄。一方面,可將準備好的附錄文件與拆分的單篇稿件進行中國知網網絡首發,另一方面,無需輸入,直接點擊“單篇合并附錄”按鈕可實現含附錄的稿件與相應附錄文件夾中附錄文件的合并,并將合并后的文件在期刊網站進行發布。
2.2整期拆分及標注含附錄稿
整期期刊通常由數十篇稿件構成,若對照每篇稿件在組稿單中的頁碼采用PDF軟件的提取頁面功能一一提取并命名保存將極其繁瑣耗時,尤其在含有轉頁時還需單獨提取轉頁,再將單篇稿件與相應轉頁進行合并。此外,由于整期文件中并非每篇稿件都有附錄,若對每篇稿件進行一一查看是否含附錄將會浪費時間。為此,筆者開發了整期PDF文件的拆分及標注含附錄稿程序。表1組稿單中“頁碼”列采用符號“-”連接不含轉頁稿件的起止頁或含轉頁稿件主體部分的起止頁,以符號“→”后頁碼表示轉頁。整期PDF文件拆分的實現思路為:遍歷表1組稿單中“頁碼”列,以“*#[→]#*”Like運算判斷該行是否為含轉頁稿件信息,如果是,則分別創建整期PDF文件中該單篇稿件的主體部分PDF文件和轉頁部分PDF文件,并將這兩部分合并存儲,如果不是,則以“*#[-]#*”Like運算判斷該行是否為不含轉頁稿件信息,如果是,則創建一個PDF文件存儲整期PDF文件中該單篇稿件部分即可,依此循環完成對所有單篇稿件的拆分。需說明的是,在對各篇稿件創建新的PDF文件時,PDF文件以0為起始頁,則其在整期文件中起始頁為組稿單中起始頁+正文前的頁數-1,《電力自動化設備》期刊正文前包括4頁目次和1頁宣傳內容,因此,程序中各篇稿件在整期文件中的起始頁為組稿單中起始頁+4。此外,本程序的輸入為單篇稿件名稱的前綴,《電力自動化設備》期刊采用“年+期+0+序號”的命名方式,序號不足10的在前面補0,如2021年第2期稿件的名稱前綴為202102?!峨娏ψ詣踊O備》期刊在包含附錄的稿件中以“附錄見本刊網絡版(http:∥www.epae.cn)?!睂Ω戒涍M行鏈接和標注,基于此,標注含附錄稿程序實現思路為:將整期拆分后的單篇PDF稿件另存為txt格式臨時文件,遍歷圖1組稿單中“序號”列,以“*#*”Like運算判斷是否為稿件序號,即該行是否為稿件信息,如果是,則讀取該稿件對應的txt文件,判斷是否包含附錄標志,如果包含,則對組稿單中該序號所在單元格以黃色填充突出顯示,依此循環完成整期文件中所有包含附錄稿件的突出顯示,同時刪除臨時txt文件。
2.3單篇合并附錄
在責編準備好稿件附錄后,即可將整期拆分文件與附錄一并上傳至中國知網網絡首發平臺進行發布。在期刊網站,為方便讀者閱讀,可將含附錄稿件與附錄合并后再上傳。附錄按照中國知網的格式要求以“根文獻名稱_附加材料”的方式命名并放置于相同名稱的文件夾中,若將附錄從文件夾中取出并與相應稿件一一合并較為繁瑣費時。筆者開發出一鍵合并程序,實現思路為:遍歷附錄文件夾,將文件夾中附錄與相應稿件合并替換原稿件,依此循環直到遍歷完所有附錄文件夾即完成所有附錄與相應稿件的合并。該功能的具體操作方法為:在文件夾中放入準備好的附錄文件夾,點擊“單篇合并附錄”按鈕即可。
3實例展示
以《電力自動化設備》2021年第2期為例,將表1組稿單與整期PDF文件放置于同一文件夾中,在窗口中輸入名稱前綴“202102”并點擊“整期拆分及標注含附錄稿”按鈕,得到結果如圖2、表2所示。在文件夾中放入準備好的附錄文件夾,點擊“單篇合并附錄”按鈕,圖2中含附錄的單篇稿件即被單篇稿件與相應附錄的合并文件所替代。
4結論
在整期稿件定稿后進行中國知網網絡首發及期刊網站發布時需要對整期PDF文件進行繁瑣的重復操作,為此筆者開發了稿件處理程序,實現整期稿件的拆分、含附錄稿件的標注及單篇稿件與附錄的合并功能。實際應用表明該程序功能有效,可幫助編輯解脫繁瑣的PDF文件操作。
- 上一篇:綠色開采技術對采礦工程的運用
- 下一篇:技師學院德育教學的挑戰與發展