國內期刊論文特征研究

時間:2022-03-30 04:00:34

導語:國內期刊論文特征研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

國內期刊論文特征研究

期刊論文是科研成果發表和傳播的重要方式之一,單個區域期刊論文的產出數量與質量能夠在一定程度上反映該地區的科研能力,而對期刊論文的時空分布及演化特征進行可視化探索與分析,則可以揭示各區域在學術生產力和科研活躍度方面的差異,分析結果對宏觀層次的科研管理決策具有一定的參考價值。因此,對期刊論文產出的區域差異性分析成為學者們的研究內容。ESDA方法是空間統計學中較為成熟的方法,通過對現象或事物空間分布格局的描述與可視化能夠發現空間分布、空間差異、空間集聚等方面的特征。將ESDA方法引入圖書情報領域,可以作為傳統計量方法的補充,拓展圖書情報領域計量研究的深度與廣度。國外研究者進行期刊論文產出的研究較早,如Matthiessen等1999年以SCI的文獻為數據源,對歐洲城市的研究能力進行劃分,如歐洲超級科學聯盟、初等研究中心以及小型研究中心等各等級[1];BornmannL等基于Scopus和Wos數據庫中的高質量論文,通過構建密度地圖來研究科研產出“熱區”[2]。近年來,國內學者對于期刊論文產出的時空維度的研究主要可以概括為以下幾個方面:1)從時間視角對期刊論文產出的研究:馮凌等選取國內旅游類期刊論文為例,以中文核心、CSSCI、CSCD為數據源,對我國改革開放30年來的旅游類期刊論文進行時序分析[3];高曉培等以SCIE收錄1920年、1960年、2000年的1118199篇論文為數據源,分析了其首次被引時間間隔的分布規律,發現不同出版年論文首次被引時間間隔服從冪律分布[4];俞立平等以CSSCI(2014-2015)收錄的圖書館、情報與文獻學期刊為例,研究了期刊被引頻次的時間分布規律[5]。2)從空間視角對期刊論文產出的研究:張立菊認為學術期刊論文的區域分布,對區域學術影響力差異及學術活躍程度具有重要影響,故而以圖書館學、情報學的核心期刊為例,以作者的發文量及總被引頻次排名前100位的機構為數據源,對發文量和被引頻次所在區域進行統計分析,探究該學科的區域學術活躍度與區域學術影響力的規律[6];劉兵紅以數學學科為例,以SCIE收錄的1997-2016年高影響力期刊論文為數據源,利用Citespace可視化工具,對學科高影響力作者、時空演化特征、國家和機構的分布等內容進行研究[7]。綜上所述,目前國內外學者對于期刊論文的時空維度做了一定的研究,但是現有研究期刊論文的數據源大都基于某一視角的數據做的研究,而較少從我國整體期刊論文產出的宏觀視角進行探索分析;其次,在研究方法上,現有的探索期刊論文產出空間維度的研究方法主要為Citespace及中國知網自帶的計量可視化分析等工具方法,這些方法只能做簡單的空間分布及演化研究,而無法進行深層次的空間差異及集聚性等方面的研究。在此背景下,本文運用探索性空間數據分析等方法,對我國2008-2017年31個省、市、自治區、直轄市的期刊論文產出進行空間分布與演化的探索研究,從我國期刊論文產出的全局分布、空間差異及集聚性,再到區域間的差異演化、極化及空間集聚等層面進行逐層展開研究,對圖書情報領域時空維度的深入研究具有一定的理論與實踐意義。

1數據來源及研究方法

1.1數據收集。綜合考慮數據的全面性與可得性,本文選取數據的數據庫來源為中國知網(CNKI)的期刊數據,中國知網數據庫作為我國的主要數據庫,涵蓋國內大部分期刊,因而對該數據庫的數據進行空間特征的探索研究能在一定程度上反映我國期刊論文產出的分布及演化規律。為了真實反映區域期刊論文產出,也為了消除區域重復計數,在后期的數據處理中,本文只收集文章第一作者的所在機構。在時間節點上,選擇2008-2017年,在時間層面上縱向覆蓋10年。在空間方面,本文依照《中國統計年鑒2018》劃分標準,除去港澳臺,我國大陸共有31個省市自治區及直轄市等,從空間層面上覆蓋我國大陸31個省市自治區及直轄市等區域。在地址匹配識別階段,本文為了數據的客觀性,對于一些無法準確識別歸屬地的機構,一律做無效數據處理,如中國石油大學在北京和山東都有校區,故而只能識別類似于“中國石油大學(北京)”“中國石油大學(華東)”及一些延伸形式,而“中國石油大學”這個名稱確實無法準確識別其歸屬地,故而作無效數據處理。最后經過人工篩選、地址字符截取、地址匹配等數據處理清洗過程,剔除數據中的重復數據及會議通知、征稿啟事、新聞報道等無關數據以及地址無法準確識別匹配的無用數據,共得到13867106條有效數據。故而本文以2008-2017年我國31個省、市、自治區、直轄市的科研人員以第一作者在中國知網數據庫的發文數量為數據源來研究我國期刊論文產出時空分布與演化特征。1.2研究方法。定量研究區域差異的常用指標為極差、標準差、變異系數、基尼系數等,極差、標準差、變異系數等指標計算相對簡單,主要衡量期刊論文產出的絕對差異和相對差異;而基尼系數計算相對復雜,但可分解為組內差異和組間差異進行進一步的探索研究。近些年,探索性空間數據分析(ES-DA)方法也逐漸用來研究區域差異空間分布及演化規律。本文在前人研究基礎上,結合本文研究的具體問題及數據,主要采用的方法為標準差、變異系數、基尼系數及探索性空間數據分析等。1.2.1ESDA探索性空間數據分析。探索性空間數據分析(ESDA)是空間統計學中較為成熟的方法,其本質是以空間關聯測度為核心,通過對現象及事物空間分布格局的描述與可視化,發現空間集聚、空間異常等現象,揭示研究對象之間的空間規律[8-9]。目前,ESDA已在空間數據挖掘[10]、自然災害[11]、數字圖像處理[12]、區域經濟[13]等研究領域受到重視。ESDA的核心是空間相關性分析,主要包括全局空間自相關及局部空間自相關分析這兩個部分。在進行探索性空間相關性分析過程中,首先要設置空間權重,主要通過設置空間矩陣來實現,GeoDa工具有兩種定義空間矩陣的方式,分別為基于距離關系和基于鄰接關系,本文在國家尺度范圍下對中國區域期刊論文產出進行研究,且考慮到各研究區域之間并不是簡單的鄰接關系,故而本文采用基于距離的空間關系的空間矩陣定義方式來進行空間自相關分析,且該方式下計算的全局莫蘭指數都通過了顯著性檢驗。1)全局自相關分析全局自相關分析主要探索期刊論文產出在區域中總體的空間差異及關聯。一般采用莫蘭指數I來表征[14],公式如下:I=N∑ni=1∑nj=1Wij*∑ni=1∑nj=1Wij(xi-x珋)(xj-x珋)∑ni=1(xi-x珋)2(1)其中,N是區域數目,xi和xj分別是i、j地區的期刊論文產出數量,Wij是i、j地區的空間權重矩陣。莫蘭指數的取值在-1~1之間,當I小于0時,表明期刊論文呈現空間分散態勢,反之,期刊論文產出呈集聚態勢,若I等于0則說明期刊論文產出在空間上遵從隨機分布。2)局部自相關分析大多數情況下,區域存在空間異質性,故而引入局部空間自相關統計量來探究期刊論文產出的局部空間變化。一般用局部指標LISA來表征,用莫蘭散點圖來直觀展示,計算公式如下:LISAi=Zij∑Nj=1WijZj(2)式中,N為區域數量,Zi和Zj是區域i和j上期刊論文產出的標準化,Wij是空間權重,其中∑Nj=1Wij=1。本文主要借鑒蔡芳芳等研究者的觀點,將局部自相關的局部空間變化分為下述4種情況:HH(高值集簇區)、HL(高低孤立區)、LH(低高空心區)、LL(低值蕭索區)[15],通過這4種局部空間變化類型來描述局部自相關的空間分異。1.2.2變異系數變異系數(CV)是由樣本的標準差與均值之比來得出,計算公式如下:CV=1x珋*∑Ni=1(xi-x珋)2槡N(3)其中,xi是第i地區的期刊論文產出,x珋是全國期刊論文產出的平均值,N是地區總數,其中,變異系數越大,反映地區期刊論文產出越離散[16]。1.2.3基尼系數本文根據DagumC提出的基尼系數及其子群分解的方法對我國期刊論文產出的空間差距進行研究[17],該方法不僅能從整體上描述我國期刊論文產出發展的空間差距及其演變趨勢,還可以對我國期刊論文產出的地區內和地區間差距進行分解,更深入地研究我國期刊論文產出的空間差異問題?;嵯禂档挠嬎愎綖槭?4),在對基尼系數分解時,首先依據地區內期刊論文數量的均值對地區排序,如式(5)所示。

2我國期刊論文產出差異的總體特征

2.1我國期刊論文產出地理分布特征。本文以31個省、自治區及直轄市等為觀測點,運用GeoDa軟件的自然間斷點地圖將2008-2017年10年間的期刊論文產出(以期刊論文數量平均值計算)繪制中國期刊論文產出分布圖(如圖1所示),其中,自然間斷點地圖是基于數據中固有的自然分組,對相似值進行最恰當地分組,并使各個類間的差異最大化。從圖1可直觀看出,我國期刊論文產出呈現東多西少的空間差異格局,其中,兩個期刊論文產出最高的區域分別為江蘇省和北京市,而西藏自治區、青海省、海南省及寧夏回族自治區這4個地區則為最低產區域。因而,從各地區的總體分布格局來看,我國期刊論文產出存在明顯的不均衡性。2.2我國期刊論文產出絕對差異增大,相對差異減小。本文選取2008年、2010年、2012年、2014年、2016年以及2017年6個時間橫斷面數據來展開研究,并將這6年數據的標準差、變異系數及全局莫蘭指數計算并呈現如表1及圖2所示。由表1可看出,2008-2017年我國期刊論文產出的標準差一直處于上升態勢,2017年標準差為30490.56,比2008年增加了5000,反映了我國期刊論文產出的絕對差異增大。由圖2可看出,2008年以來,我國期刊論文產出的變異系數不斷下降。由表1可得,2017年的變異系數是0.5941,與2008年相比下降8.16%,由上文可知,變異系數這個指標反映期刊論文產出的離散趨勢,指標變小說明我國期刊論文產出呈現趨同態勢,即我國期刊論文產出相對差異正在逐步減小,我國期刊論文產出的不平衡正在不斷降低。2.3期刊論文產出集聚性呈現先上升后下降趨勢。為了進一步了解我國期刊論文產出的空間集聚性,本文借助GeoDa軟件計算2008-2017年我國區域期刊論文產出的莫蘭指數統計量(Moran'sI)(如表1所示),表1中各年份的莫蘭指數統計量均通過顯著性檢驗(P<0.05)。根據表1、圖2可知,2008-2017年莫蘭指數均大于0,表現為各地區期刊論文產出存在空間正相關關系,說明在期刊論文產出較高的區域,其周邊區域的期刊論文產出也較高,即期刊論文產出水平相似的地區存在明顯的空間集聚態勢,空間集聚程度越高也表明期刊論文產出空間存在明顯的不平衡,這也與我國期刊論文產出空間分布圖(如圖1所示)的結論一致。由圖2可看出,2008-2017年莫蘭指數的變化趨勢為先上升后下降,可見我國期刊論文產出集聚性呈現先上升后下降趨勢。其中,2008-2014年,莫蘭指數不斷上升,從0.2321增大至0.2663,雖然增幅不夠明顯,但是也能反映此階段我國期刊論文產出集聚狀態的加強。2016年以來,莫蘭指數一直下降,2017年降至0.2211,說明該階段我國期刊論文產出集聚趨勢雖存在但程度變弱。

3區域期刊論文產出空間格局演化

3.1期刊論文產出區域內及區域間差異縮小。為了進一步了解我國期刊論文產出在東、中、西三大地區的空間差異,本文根據DagumC的基尼系數及其子群分解方法,對我國期刊論文產出的地區差距進行深入研究。本文根據需要只計算我國期刊論文產出基尼系數的地區內差異及地區間差異兩部分,本文運用R語言計算的結果見表2?;嵯禂颠@個指標反映期刊論文產出的離散程度,由表2可得,我國期刊論文產出總體基尼系數呈下降態勢,指標變小說明我國期刊論文產出呈現趨同態勢,我國期刊論文產出的不平衡正在不斷降低。圖3進一步描述了我國期刊論文產出在三大地區內部分布的差距特征。由圖3可直觀看出,西部地區期刊論文產出的地區內差距最大,東部次之,中部地區期刊論文產出的地區內差距最小。由圖3可看出東部期刊論文產出的地區內差異較為穩定,一直在0.27左右波動,而中部和西部地區的基尼系數水平也一直在向東部地區靠近,可見東部地區的期刊論文產出區域內的差異水平是一個相對穩定的狀態。從圖4可看出,中部—西部期刊論文產出的地區間差異的基尼系數最大,處于圖4的最上面一條線,而東部—中部的區域間基尼系數最小,且較為穩定,可見中部—西部之間期刊論文產出的差異最大,而東部—中部地區之間期刊論文產出的差異最小??傮w而言,我國期刊論文產出的地區間差距整體上呈現下降態勢,以2008年為基期,2017年東部—中部、東部—西部以及中部—西部地區間的基尼系數分別下降了2.62%、0.83%以及10.61%,可見,中部—西部地區的區域間基尼系數下降明顯,中部—西部期刊論文產出的地區間差異明顯縮小。3.2區域期刊論文產出的極化現象減弱。為了更形象直觀地展現我國區域期刊論文產出水平的空間變化,本文以2008-2017年的平均數據為基礎,結合GeoDa的自然間斷點法將期刊論文產出水平分為低水平、較低水平、較高水平、高水平4個等級,并選取2008年、2012年及2017年這3年為橫截面數據進行研究,繪制出2008年、2012年以及2017年中國期刊論文產出空間分異圖(如圖5),其中區域顏色越深表明區域期刊論文產出水平越高。從圖5可看出,2008年低水平、較低水平、較高水平、高水平的數量分別為9、13、7、2;2012年各水平下的數量分別為7、11、11、2;2017年各水平下的數量分別為4、13、10、4;由此可知,期刊論文產出的高水平區域變多,而期刊論文產出的低水平區域變少,2008-2017年,期刊論文產出低水平區域個數從9個減少至4個,高水平區域個數由2個增加到4個。其中,北京市以及江蘇省這2個區域一直處于期刊論文產出的高水平區域,廣東省及山東省逐漸邁入高水平區域,而新疆維吾爾自治區、內蒙古自治區、甘肅省、云南省以及貴州省慢慢脫離低水平區域??偠灾?,中國區域期刊論文產出的兩極分化現象趨于減弱態勢,區域期刊論文產出整體的離散程度降低,故而區域期刊論文產出水平的差異降低,這也與上述的結論具有一致性。3.3區域期刊論文產出空間集聚格局較為穩定。為了描述空間自相關的演化趨勢,本文選取2008年、2012年及2017這3個時間橫斷面數據,運用GeoDa的局部自相關方法來分析中國期刊論文產出空間相關性及空間聚類演變趨勢,結果如圖6,表3所示。象限的變化在一定程度上反映了這些區域期刊論文產出的變化,由圖6,表3可看出,2008-2017年,位于各個象限的區域較為穩定,只有少部分的區域所處的象限發生了改變,如黑龍江省由第四象限(高低類型)進入了第一象限(高高類型),說明跟黑龍江省的周邊區域的期刊論文產出都有了一定的提高。由圖6,表3可看出,多數區域位于第一、三象限內,均表現出正的空間自相關。其中,2017年,位于HH區(高值集簇區)的區域數量為13個,占區域總個數的41.94%,主要為北京市、河北省、上海市、江蘇省、浙江省、山東省等區域及其周邊地區,這些區域的期刊論文產出較高,且帶領周圍區域期刊論文產出的增加,反映了該區域本身及其鄰近區域的期刊論文產出均處于較高水平且較為穩定。

本文以我國31個地區為研究對象,以CNKI的期刊論文數量為測度指標,綜合運用探索性空間分析等方法分析了我國2008-2017年期刊論文產出的時空分布及演化特征,得出的特征如下:從2008-2017年的數據可看出,國內期刊論文產出差異的總體產出呈現東多西少的空間差異,其中,兩個高產的地區分別為江蘇省和北京市,這與區域經濟有一定的聯系,但是與區域生產總值并不完全重合,2017年我國區域生產總值最高的4個區域分別為;廣東省、江蘇省、山東省以及浙江省,北京市的地區生產總值排在第12位,但是其期刊論文產出卻排在前列。由此可見,經濟水平不是期刊論文產出總量的決定性影響因素,是否是區域的經濟水平、高校及科研院所數量、各區域對教育的重視程度(即科研投入)以及區域人口等因素綜合作用的結果,有待后續研究進行探討。在全國將論文作為硬性指標來考核高校及科研工作人員的科研能力的大趨勢下,全國期刊論文數量都處于快速增長狀態,導致我國期刊論文總體產出絕對差異增大;在這種大趨勢下,各個區域普遍注重期刊論文產出,導致我國期刊論文總體產出相對差異減小,區域的極化現象呈減弱態勢。20世紀以來,隨著核心高校及科研院所的歸屬地的確定,全國的科研能力大格局已定,期刊論文產出空間格局近些年都沒有大的變化,較為穩定。2017年江蘇省在核心期刊發文數量占核心期刊總發文量的23.59%,而青海省僅占10.98%,可見期刊論文產出高的區域,期刊論文的質量也會相對應高一些(一般認為核心期刊文章的質量高于普通期刊的質量)。我國期刊論文產出差異不斷縮小,其中,西部地區期刊論文產出的地區內差距最大,東部次之,中部地區期刊論文產出的地區內差距最小,這與三大區域劃分有一定的關系,如西部地區部分省市的科研院所及高校較少,科研條件較差,期刊論文數量低,與西部其他省市的期刊論文數量差距較大,故而拉高了西部地區的期刊論文產出地區內差距水平。而期刊論文產出的區域間差異與區域內差異相關,西部地區期刊論文產出的地區內差距最大,中部地區期刊論文產出的地區內差距最小,故而中部—西部期刊論文產出的地區間差異最大,而東部—中部地區期刊論文產出的地區間差異最小。期刊論文產出高水平區域向高水平區域集聚靠攏,高水平相似區域的集聚營造了更好的區域間學術交流與學術發展環境,進而會進一步吸引學術資源的集聚,故而我國期刊論文產出集聚性呈現先上升的趨勢;而近些年,某些區域期刊論文產出遠高于周圍其他區域,成為期刊論文產出的高值孤立區,如北京、江蘇等地區,而有些區域期刊論文產出遠低于周圍其他城市,成為期刊論文產出的低值空心區域,如江西省等。有必要根據不同地區科研產出空間集聚現狀及發展情況建立相對應的學術研究互補及合作機制,發揮期刊論文產出的高值區域對周邊區域的幫助帶動作用,實現全國各地區期刊論文的持續高質量增長。且隨著各區域對期刊論文產出的重視,處于較低水平區域逐步邁入更高的等級,如廣東省及山東省逐漸邁入高水平區域,而新疆維吾爾自治區、內蒙古自治區、甘肅省、云南省以及貴州省慢慢脫離低水平區域,故而我國期刊論文產出集聚性呈現下降趨勢。

本文運用探索性空間數據分析(ESDA)等方法,對我國十年來區域的期刊論文產出進行空間分布與演化特征探索具有一定的理論與實踐意義。然而,本文主要不足在于地址解析不完全,原因主要為研究時間跨度較長,機構可能存在機構重組、名稱變更等,且有些機構在很多地方有分機構等很多不確定因素,如中國礦業大學校區在北京和江蘇兩地都有校區,因而若作者沒有標明地區,則無法準確識別機構所在的區域。

作者:許林玉 楊建林