論科學計量學六大文獻分析定律

   要:科學計量學文獻計量學和情報計量學),除了洛特卡定律、布拉德福定律、齊普夫定律、普賴斯定律、加菲爾德定律還應加上沈氏文獻均衡分析定律。這六大定律構成了科技文獻分析模式的基本結構框架。多年來前五大定律一直是科學計量學、文獻計量學、情報計量學工作者必須掌握的基本知識,并受到學術界的高度重視。值得指出的是,它們之間既存在著高度的一致性,又存在著一定的聯(lián)系和區(qū)別。但現(xiàn)在在我們看來,還有一個重要定律也必須加以重視,那就是我們提出的科技文獻均衡分析定律。研究科技文獻情報流量的特性時,既要集中注意研究文獻及其基本特征總和的各種不同的統(tǒng)計學規(guī)律,又要探索這些總和中規(guī)律對指導實踐有用的統(tǒng)計學參數(shù)。本主要介紹科學生產(chǎn)率的分布規(guī)律;科學技術文獻的集中與分散規(guī)律;各種詞匯、術語在科學文獻中的分布規(guī)律;科學技術文獻的老化規(guī)律;科學技術文獻的相互引用規(guī)律和它們的實際應用;科技文獻均衡分析規(guī)律及其應用;并對它們之間的相互關系作進一步做出研究和探討。

關鍵詞:科學計量學;洛特卡定律;布拉德福定律;齊普夫定律;普賴斯定律;加菲爾德定律;沈氏文獻均衡分析定律

中文分類號:                 文獻標識碼:                    文章編號:

 

在科學計量學文獻計量學和情報計量學),除了洛特卡定律、布拉德福定律、齊普夫定律、普賴斯定律、加菲爾德定律還應加上沈氏文獻均衡分析定律。這六大定律構成了科技文獻分析模式的基本結構框架。多年來前五大定律一直是科學計量學、文獻計量學、情報計量學工作者必須掌握的基本知識,并受到學術界的高度重視。值得指出的是,它們之間既存在著高度的一致性,又存在著一定的聯(lián)系和區(qū)別。但現(xiàn)在在我們看來,還有一個重要定律也必須加以重視,那就是我們提出的科技文獻均衡分析定律。下面我們就這大科學計量學分析定律展開討論。科學技術情報流一般是指科技文獻出版物和未發(fā)表的材料的總和。它們以交流科技情報為目的而產(chǎn)生并應用于社會實踐之中?萍嘉墨I情報流在整個情報系統(tǒng)中表現(xiàn)出一系列的規(guī)律,這些規(guī)律可以通過對科技文獻本身的基本特征(包括作者、術語、雜志名稱、引文、出版年月等等)進行排序和統(tǒng)計分析加以揭示。研究科技文獻情報流量的特性時,既要集中注意研究文獻及其基本特征總和的各種不同的統(tǒng)計學規(guī)律,又要探索這些總和中規(guī)律對指導實踐有用的統(tǒng)計學參數(shù)。本主要介紹科學生產(chǎn)率的分布規(guī)律;科學技術文獻的集中與分散規(guī)律;各種詞匯、術語在科學文獻中的分布規(guī)律;科學技術文獻的老化規(guī)律;科學技術文獻的相互引用規(guī)律和它們的實際應用;科技文獻均衡分析規(guī)律及其應用;并對它們之間的相互關系作進一步做出研究和探討。

 

一、洛特卡定律

 

洛特卡定律(Lodka’s law)是由美國學者A.J.洛特卡(A.J.Lodka,1880-1949)20世紀20年代率先提出的描述科學生產(chǎn)率的經(jīng)驗規(guī)律,又稱“倒數(shù)平方定律”。描述科學生產(chǎn)率的經(jīng)驗規(guī)律它描述的是科學工作者人數(shù)與其所著論文之間的關系:寫兩篇論文的作者數(shù)量約為寫一篇論文的作者數(shù)量的1/4;寫三篇論文的作者數(shù)量約為寫一篇論文作者數(shù)量的1/9;寫N篇論文的作者數(shù)量約為寫一篇論文作者數(shù)量的1/ n2……,而寫一篇論文作者的數(shù)量約占所有作者數(shù)量的60%。該定律被認為是第一次揭示了作者頻率與文獻數(shù)量之間的關系,描述科學生產(chǎn)率的頻率分布規(guī)律。1926年,在美國一家人壽保險公司供職的統(tǒng)計學家洛特卡經(jīng)過大量統(tǒng)計和研究,在美國著名的學術刊物《華盛頓科學院報》上發(fā)表了一篇題名為“科學生產(chǎn)率的頻率分布”的論文,旨在通過對發(fā)表論著的統(tǒng)計來探明科技工作者的生產(chǎn)能力及對科技進步和社會發(fā)展所作的貢獻。這篇論文發(fā)表后并未引起多大反響,直到1949年這一成果才引起學術界關注,并譽之為“洛特卡定律”。洛特卡定律是對兩組數(shù)據(jù)統(tǒng)計的推廣,是對信息生產(chǎn)的一般理論估計,而不是一個精確的統(tǒng)計分布,因而有其局限性。

洛特卡定律的一般表達公式:

 

f(n)= c/na

 

其中,n為單個作者發(fā)文數(shù)且1≤n≤T;

T為單個作者最大發(fā)文數(shù);

f(n)為發(fā)表n篇論文的作者的比例;

a與c為常數(shù)。

 

   若把每個來源看成是科學論文作者,相應的項目為期刊論文。如果撰寫n篇論文的作者出現(xiàn)的頻率(即占作者總數(shù)的比例)為f(n),c為常數(shù),表示作者取樣總數(shù)的比例,則有:f(n)=c/n2這就是著名的洛特卡平方反比分布定律。下面我們來求常數(shù)c。

n=1,2,3......,則兩邊取累積和:

 

由于f(n)表示撰寫n篇論文的作者出現(xiàn)的頻率顯然就有:

二、布拉德福定律

 

布拉德福定律(Bradford’s law)是由英國著名文獻學家S.C.Bradford于二十世紀1934年代率先提出的描述文獻分散規(guī)律的文獻計量學經(jīng)驗定律。

 

(一)布拉德福定律產(chǎn)生的背景

 

1.文獻的分散是普遍的客觀現(xiàn)象。在科學研究和文獻工作中,布拉德福深深感到科學文獻的分散。他發(fā)現(xiàn):一個學科的論文分散在其他學科的雜志期刊上是屢見不鮮的。

2.科學統(tǒng)一性原則?茖W統(tǒng)一性原則是布拉德福定律產(chǎn)生的思想基礎。布拉德福認為:按照科學統(tǒng)一性原則,科學技術的每一個學科都或多或少、或遠或近地與其他任何一個學科相關聯(lián)。

3.文獻統(tǒng)計研究是布氏定律產(chǎn)生的基礎。布拉德福本人在長期的文獻工作中,對科學文獻進行大量的統(tǒng)計研究,掌握了文獻分散的特點,發(fā)現(xiàn)了其中的某些規(guī)律性;并在文獻統(tǒng)計的基礎上經(jīng)過數(shù)學推導,得出了與上述理論推導一致的結論,為布拉德福分散定律的正式確立奠定了基礎。

 

(二)布拉德福定律的形成及其基本原理

 

1、布拉德福定律的提出

 

布拉德福在《文獻學》中寫道: 如果將科技期刊按其刊載某學科專業(yè)論文的數(shù)量多少,以遞減順序排列,那么可以把期刊分為專門面對這個學科的核心區(qū)、相關區(qū)和非相關區(qū)。各個區(qū)的文章數(shù)量相等,此時核心區(qū)、相關區(qū),非相關區(qū)期刊數(shù)量成 1:n:n2……的關系。布拉德福定律的文字表述結論是建立在將等級排列的期刊進行區(qū)域分析的方法之上的。

 

2、布拉德福定律的確立

 

維克利(Vickery)是英國的文獻學家。他還創(chuàng)造性的提出了自己的修正和補充。指出

了布拉德福在論證過程中的某些自相矛盾之處,提出了新的見解:1.布拉德福分布圖形是曲線,不是直線; 2.布拉德福不只局限于劃分為三個區(qū),而同樣運用于多個區(qū)的情形;3.布拉德福定律的實際組成為語言描述和圖像描述;

維克利的論證和補充,使布拉德福文獻分布的圖像與定律在結構上得到了統(tǒng)一,豐富了布氏分布理論的內(nèi)容,使其在形式上趨于完整,為布拉德福定律的確立和發(fā)展做出了重要貢獻。后來布拉德福定律獲得了國際圖書館學情報學界的普遍承認并被人們廣泛接受,維克利的工作無疑起了決定性的作用。除了維克利之外,還有許多文獻學家和情報學家對布氏定律進行了深入研究,如布魯克斯(Brookes),布魯克斯以數(shù)學公式描述了這一定律,發(fā)展圖像分析方法,為其實際應用開辟了新的道路。

 

3、布拉德福定律的基本原理及其適用性

 

布拉德福定律的基本原理是由其區(qū)域描述、圖像描述、數(shù)學推導三個部分組成的。關于布拉德福定律在網(wǎng)絡環(huán)境中的適用性,國外學者在1997 年Almind 提出網(wǎng)絡計量學這一概念后就進行了相關的研究。Bar-Ilan 通過將學位論文及其發(fā)布新聞與期刊及其論文的分布進行比較分析,然后根據(jù)布氏定律確定了以瘋牛病”為主題的核心新聞組,發(fā)現(xiàn)布氏定律同樣適合于網(wǎng)頁環(huán)境,但此研究是針對某一主題且數(shù)據(jù)具有一定局限性,不具備廣泛適用性。Cui 通過對美國排名前25 位的醫(yī)學院網(wǎng)頁進行鏈接分析,他發(fā)現(xiàn)了網(wǎng)址鏈接的集中離散分布現(xiàn)象且網(wǎng)址數(shù)之間的比值為78:452:1201,接近1:4:42,這一結果表明醫(yī)學院網(wǎng)頁鏈接符合布拉德福定律,由于數(shù)據(jù)選取的局限性,對于這一定律是否適用于所有的網(wǎng)絡環(huán)境則有待進一步驗證。Tsay MY,yang YH 對MEDLINE 數(shù)據(jù)庫中關于RCT的文獻作了文獻計量分析,發(fā)現(xiàn)通過區(qū)域分析可知第四區(qū)的期刊數(shù)明顯大于預測值,但是四個區(qū)的期刊數(shù)之比較接近于l:2.5:2.52(6.25):2.53(15.6),符合傳統(tǒng)的布氏定律,但又有明顯的不同,文中對布氏定律的驗證方法具有單一性,不能從多方面證明這種適用性。Behrens H 和Luksch P 對無機晶體結構數(shù)據(jù)庫晶體學主題的文獻進行分析,利用萊姆庫勒函數(shù)對樣本數(shù)據(jù)進行擬合分析,驗證得知晶體學主題的文獻符合布氏定律的分布,這一研究主要針對數(shù)據(jù)庫數(shù)據(jù)且只對數(shù)據(jù)進行了單一方法的分析,并不能代表所有網(wǎng)絡信息的分布。Cristina Faba-Perez 通過對網(wǎng)絡空間被鏈情況的圖像分析發(fā)現(xiàn),所得圖像并不符合典型的布氏定律分布且通過區(qū)域分析可知各個分區(qū)的比例數(shù)也都不滿足1:n:n2 的關系。

 

三、齊普夫定律

 

齊普夫定律(Zipf's Law)文獻計量學基本定之一1948年美國哈佛大學語言學教授G.K.齊普夫(George K. Zipf )對英語文獻中單詞出現(xiàn)的頻次進行大量統(tǒng)計以檢驗前人的定量化公式而提出的。該定律指出文章中單詞的頻次(f)與其排列的序號(r)之間存在著下述定量的關系,齊普夫認為:如果有一個包含n 個詞的文章,將這些詞按其出現(xiàn)的頻次遞減地排序,那么序號r和其出現(xiàn)頻次f之積fr,將近似地為一個常數(shù)。fr=C(為常數(shù)),(式中r=1,2,3.…),即詞頻分布定律最普通而又最典型的表達。此后, 許多工具書大都采用類似觀點和說法 。如英國著名的語言學著作《語言與語言詞典》 中的釋義是:“(詞頻分布定律) 是指談話者或?qū)懽髡呤褂玫脑~的分布和頻次的總描述。Fr=C,方程式中F=頻次,r=序號,即頻率表上的位置;C=常數(shù)。方程式表示詞使用的總次數(shù)和詞頻表上的位置之間有一個固定比率。”但是齊普夫的表達僅適宜于中頻詞的情況,高頻與低頻詞與該表述偏差較大。于是對詞頻分布規(guī)律又有許多補充和深化的研究。

詞頻分布原因的假說。詞頻分布規(guī)律是有較為豐富內(nèi)涵的,學術界認為正態(tài)分布是描述自然科學的典型分布,而齊普夫分布將成為揭示社會科學規(guī)律的典型分布,所以社會科學界一直很重視這個定律。討論詞頻分布何以呈現(xiàn)那種特殊的形狀,對其成因提出假說,建立適當?shù)睦碚撃P兔枥L其分布過程是當前研究工作的熱點,目前較重要的假說有2個:①“省力法則”假說。提出這一假說的是齊普夫。他認為,在語言交流過程中,“省力法則”同時體現(xiàn)在說話人和聽話人身上。說話人希望組成語言的詞少,而且一詞多義,以節(jié)省其精力。聽話人認為最好是一詞一義,使聽到的詞與其確切涵義容易匹配,減少他理解的功夫。這2種節(jié)省精力的傾向最后平衡的結果,便是詞頻的那種雙曲線型分布。②“成功產(chǎn)生成功”假說。這方面以H.A.西蒙的研究最為著名。西蒙構造了一個概率模型,他所作的一個重要假說是:在文獻中,一詞使用的次數(shù)越多,則再次使用的可能性越大。該模型最后導出的分布與齊普夫分布相當接近,普賴斯后來建立了一個相類似的模型,又明確地提出了“成功產(chǎn)生成功”的假說。齊夫定律已經(jīng)在語言學、情報學、地理學、經(jīng)濟學、信息科學等領域有了廣泛的應用,而且取得了不少可喜成果。中國數(shù)學家和語言學家周海中曾經(jīng)指出:齊夫定律是描述詞頻分布規(guī)律的強大數(shù)學工具;作為經(jīng)驗定律,它仍有不足之處,有待進一步完善。研究詞頻分布對編制詞表,制定標引規(guī)則,進行詞匯分析與控制,分析作者著述特征具有一定意義。經(jīng)驗表明,中頻詞往往是包含大量有檢索意義的關鍵詞。而一篇文獻全文輸入計算機后,計算機是很容易檢出中頻詞的。因此,詞頻分布也是文獻自動分類自動標引的研究對象。

如果將一篇較長的文章(約5000字以上)中每個詞按其出現(xiàn)頻次遞減排列起來(高頻詞在前,低頻詞在后),并用自然數(shù)給這些詞編上等級序號,出現(xiàn)頻次最高的為1級,其次為2級……這樣一直到D級,如果用f表示詞在文章中出現(xiàn)的頻次,用r表示詞的等級序號,則有:fr=C(C為常數(shù))

   如果等級r與頻次f都取對數(shù),則圖4-4中的雙曲線變成一條直線(圖4-5)。與之等價的數(shù)學表達式為:ln(r)+ln(f)=ln(C)

   4-5中的虛線表示理想化形式,一般地,斜率k的任一直線可表示為:

這條直線由圖4-5中實線表示。如果將這一方程改寫可得:kfr=C

如果說fr=C是齊夫定律的一般形式,這便是齊夫定律的修正形式。

1 齊普夫詞頻分布曲線示意圖

 

如果等級r與頻次f都取對數(shù),則圖4-4中的雙曲線變成一條直線(圖4-5)。與之等價的數(shù)學表達式:lnr+lnf=lnc

    4-5中的虛線表示理想化形式,一般地,斜率為k的任一直線可表示為:Klnr+lnf=lnc

這條直線由4-5中實線表示。

巴塞羅那自治大學數(shù)學研究中心的研究者最近使用數(shù)學和統(tǒng)計學的專業(yè)知識,對齊夫定律(Zipf's law)進行了嚴格的研究。他們使用了古登堡計劃(the Project Gutenberg)的數(shù)據(jù)庫——古登堡計劃是一項將版權過期的英語書籍電子化的互聯(lián)網(wǎng)計劃,包含3萬多篇英語文本,可以免費獲取。這么大規(guī)模的研究在該領域前所未有,此前的研究大多只采用幾十篇文本的數(shù)據(jù)集。分析結果表明,如果除去少數(shù)只出現(xiàn)了一兩次的詞語,有55%的文本完全地符合齊夫定律,而如果考慮所有的詞語,仍然有40%的文本完全符合齊夫定律。該研究的負責人科拉爾(á.Corral)稱,如果進一步忽略只出現(xiàn)3至5次的詞語,符合齊夫定律的文本數(shù)還會更多。

 

四、普賴斯定律

 

普萊斯(Price)是著名的科學家與科學史學家,他在其代表名著《小科學,大科學》一書中曾有如下的論述:“在同一主題中,半數(shù)的論文為一群高生產(chǎn)能力作者所撰,這一作者集合的數(shù)量上約等于全部作者總數(shù)的平方根”。普賴斯定律是衡量各個學科領域文獻作者分布規(guī)律,因為科技情報學起源于文獻計量學,科學計量學和文獻計量學有很多的研究方法似乎類似的,所以普賴斯定律也成了研究科技情報學的方法之一。

 

(一)普賴斯定律

 

     普賴斯(1922.1.22~1983.9.3)Derek John de Solla Price,美國科學家、科學計量學奠基人和情報科學創(chuàng)始人之一。猶太人。 1942年畢業(yè)于倫敦大學物理系,1946年獲物理學博士學位。歷任耶魯大學教授、皮博迪博物館的歷史科技儀器館館長等職。主要是發(fā)現(xiàn)了科學文獻指數(shù)增長規(guī)律,繪制了著名的普賴斯曲線。普賴斯所取得的成就基本上奠定了科學學的核心分支學科——科學計量學的誕生,理所當然成為“科學計量學之父”。著名學者Belver Griffith曾這樣頌揚他:“普賴斯在科學文獻方面的理解和成就促使了在文獻計量領域的一場革命,也使得我們對科學學理解取得了飛躍性的進展。”現(xiàn)在國際《科學計量學》雜志和美國科學史學會都設有D.普賴斯獎。 (Price)是著名的科學家與科學史學家,他在其代表名著《小科學,大科學》一書中曾有如下的論述:“在同一主題中,半數(shù)的論文為一群高生產(chǎn)能力作者所撰,這一作者集合的數(shù)量上約等于全部作者總數(shù)的平方根。

在洛特卡定律的基礎上,普賴斯進一步研究了科學家人數(shù)與科學文獻數(shù)量,以及不同能力層次的科學家之間的定量關系,提出了著名的普賴斯定律和一些其他重要結論。在《小科學,大科學》一書中,普賴斯寫道:“科學家的總?cè)藬?shù),大致是按杰出科學家人數(shù)的平方增長的。”所謂普賴斯定律(Price ’sLaw)即平方根定律:科學家總?cè)藬?shù)開平方,所得到的人數(shù)撰寫了全部科學論文的50%。

式中:n(x)為撰寫x篇論文的作者數(shù),I= n max 為該學科規(guī)定時期內(nèi)最高產(chǎn)的作者數(shù);N為該學科領域全部作者總數(shù)。

如果設最高產(chǎn)的那位科學家所發(fā)表的論文數(shù)為n max,將科學家們發(fā)表論文的總數(shù)記為x(1, nmax),則普賴斯定律可用下式表示:

 

(1/2)x(1, nmax) = x(m, nmax) = x(1,m)

 

式中,m為普賴斯假定的這樣一個數(shù),即個人的論文數(shù)大于m的科學家們所發(fā)表的論文總數(shù)恰好等于全部論文總數(shù)的一半,而式中x(m, nmax)的意義恰好表征了這一半論文。  

這里的關鍵是如何確定m的數(shù)值?普賴斯根據(jù)洛氏定律,借用數(shù)學結論,經(jīng)推導得出:m≈0 .749(nmax 1/2)。這是洛特卡定律的一個重要推論。這說明,發(fā)表了0.749(nmax 1/2)篇以上論文的科學家們所發(fā)表的論文總數(shù)等于全部論文總數(shù)的一半;或者說,杰出科學家中最低產(chǎn)的那位科學家所發(fā)表的論文數(shù),等于最高產(chǎn)科學家發(fā)表論文數(shù)的平方根的0.749倍。普賴斯還曾試圖找出全體科學家總數(shù)中杰出科學家的比例關系。經(jīng)過進一步推導和計算,得出:R≈0.812/nmax 1/2式中,R是杰出科學家人數(shù)與全體科學家總數(shù)之比。這是普賴斯得出的洛特卡定律的又一個重要推論。普賴斯定律和普賴斯指數(shù)是促進情報學發(fā)展的定律之一,情報學主要是根據(jù)實際的信息來做出總結,是一門分析的藝術,而普賴斯定律是情報學分析的方法和參考標準,尤其是在文獻作者的整理和數(shù)據(jù)的分析方面。

 

(二)普賴斯指數(shù)

 

1971年普賴斯提出了一個衡量各個學科領域文獻老化量度指標——普賴斯指數(shù)。即指在一個具體學科內(nèi),把對年限不超過5年的引文數(shù)量與引文總數(shù)之比當做一個指標,用以量度文獻的老化速度與程度。自然,普賴斯指數(shù)越大,文獻老化越快。普賴斯根據(jù)《科學引文索引》(SCI)的分析,發(fā)現(xiàn)科技領域前沿的那些文獻的平均年齡,F(xiàn)在一年中被引用文獻中的一般,其年齡不超過5年。為此,普賴斯把受引的文獻分成兩個部分:其一是“有現(xiàn)時作用的文獻”;其二是“檔案性”文獻。前者是在其出版5年內(nèi)被引用的文獻,后者則是出版5年后仍被引用的文獻。這里表明文獻的被引用行為有一個變化,出版5年后仍被引用,說明“有現(xiàn)時作用”的文獻已轉(zhuǎn)變成“檔案性”文獻了。檔案性文獻數(shù)量多寡,是受學科自身性質(zhì)決定的。

 

普賴斯指數(shù)=近五年的被引用的文獻數(shù)量 / 被引用的文獻總量 ×100%

 

普賴斯本人認為,普賴斯指數(shù)要優(yōu)于半衰期和引文中值年齡,它即可用于某一領域的全部文獻,也可用于評價某種期刊、某一機構、有一作者和謀篇文章。半衰期與普賴斯指數(shù)者兩個指標,系按不同方式反映了影響老化因素的相關關系。把半衰期作為一個常量來計算時,采用的是某一年中所有的引文一半,并以其出版的年度作為引文年齡。當把普賴斯指數(shù)作為一個常量計算時,采用的是不超過5年的引文,并計算這部分引文占全部引文的百分比。普賴斯指數(shù)的數(shù)值范圍大概是這樣劃分:22%-39%為檔案性文獻區(qū)間,75%-80%為有現(xiàn)時性作用的文獻區(qū)間。一般而言,物理和生物化學方面的期刊的指數(shù)為60%-70%,x射線學和放射學為55%-60%,社會科學為40%-45%,植物學20%左右,語言學和歷史學少于10%。

 

(三)普賴斯科學地形圖譜

 

1965年,借助費城《科學引文索引》普賴斯又發(fā)表了一篇著名的論文:《科學論文的網(wǎng)絡》。后來普賴斯又將這篇論文發(fā)表在science雜志(1965)。在這篇論文中他祥細而又創(chuàng)造性地研究了科學論文之間的引證和被引證關系。以及由此形成的所謂“引證網(wǎng)絡”。普賴斯研究證明。每篇論文平均引證參考文獻數(shù)目是15篇,除評論性文章之外,凡每年被引證四次以上的論文,即可列為“經(jīng)典文獻”。按此標準,在數(shù)學、地質(zhì)學和植物學中,大多數(shù)是經(jīng)典之作。在化學工程、機械工程、冶金工程和物理學中,大多數(shù)“曇花一現(xiàn)”之作。在化學和生理學中,則兩者各半。根據(jù)網(wǎng)絡分析的原理,他進而提出了能指明科學研究前沿的定量模型。普賴斯最后強調(diào)指出,第一流的科學家都應密切注視他的同事和同代人的工作。因為科學研究前沿依賴近期的研究成果。在網(wǎng)絡圖上,必有密集分布的小條或小塊。,如果把這些小條小塊研究清楚,我們就可以繪制出當代科學的“地形圖”。著隨著這門“科學地形圖學”的建立,人們就可以指出各類期刊、各個國家、各國科學家、各種科學論文等等在科學地形圖上所占的位置。他們之間的相互聯(lián)系和相對重要性。這樣對科學技術評價方面的應用研究將會發(fā)揮著很大的理論指導作用。美國德雷克塞爾大學的格里菲思認為,《科學論文的網(wǎng)絡》同樣是科學計量學奠基之作。“字里行間看來更令人信服”,因為這篇論文“第一次富有意義地用原始資料,編織出一個明析的科學模型,其結論是驚人的漂亮和富有睿智”。這篇論文奠定了現(xiàn)在的知識圖譜學。

 

                              五、加菲爾德定律

 

   尤金·加菲爾德(Eugene Garfield 1925.9.16—),是美國著名的情報學家和科學計量學家,SCIScience Citation Index,即科學引文索引)及ISIInstitute for Scientific Information,即美國科學信息研究所,現(xiàn)為湯森路透科技集團的創(chuàng)始人,1955,Science發(fā)表論文“Citation Index es for Science”提出“引文索引”的設想,即提供一種文獻計量學的工具來幫助科學家識別感興趣的文獻。他提出了引文索引和引文技術的概念,從而打破了分類法和主題法在檢索方法中的壟斷地位,開創(chuàng)了從引文角度來研究文獻及科學發(fā)展動態(tài)的新領域。

   1961年在賓西法尼亞大學獲得結構語言學博士學位。 加菲爾德科學交流與信息科學生涯始于1951年。一個偶然的機會,在美國化學家協(xié)會100周年慶典上,他結識了韋爾奇醫(yī)學索引項目負責人,并加入該項目做兼職工作。正是這份工作給他帶來了巨大影響,改變了他的人生軌跡。加菲爾德發(fā)現(xiàn)他真正感興趣的不是化學實驗,而是查詢化學文獻。參與韋爾奇醫(yī)學索引項目的經(jīng)歷激發(fā)了他的靈感,他將在項目完成過程中遇到的問題作為自己一生的工作方向。參加該項目的三年中加菲爾德才思泉涌,完成了一生中最重大的理論發(fā)現(xiàn)和構想的雛形。由于他的化學知識背景,使得他始終以一個文獻檢索用戶的眼光發(fā)現(xiàn)問題,以一個科學家的嚴謹態(tài)度解決問題,以一個文獻信息學門外者視角思考問題,因此,其思想遠比一個學院派理論家的觀點深刻。

(一)加菲爾德定律

加菲爾德定律是在二十世紀六十年代由美國《引文索引》主編E.加菲爾德提出,加菲爾德通過對一些綜合性和專業(yè)性檢索工具中所摘用的期刊數(shù)量及收錄論文的數(shù)量的比研究指出:“一個學科文獻的尾部,很大程度上是由其它學科文獻的核心部分所組成。事實上學科之間交叉如此之大。以至于所有科學技術學科的核心文獻僅僅有1000多種期刊。也可能少于500種。”加菲爾德定律旨在反映科技期刊中的科學論文的交叉程度,論文交叉是嚴重的。以至數(shù)量上相對較少的期刊就集中包括了全部論文數(shù)量的大部分。因此,也被稱之謂加菲爾德文獻集中定律(Garfield’s Law of Concentration)。它與前面介紹的布拉德福文獻分散定律描述的情況正好相反。

 

(二)影響因子

 

影響因子(Impact Factor,IF)是湯森路透Thomson Reuters)出品的期刊引證報告(Journal Citation Reports,JCR)中的一項數(shù)據(jù)。即某期刊前兩年發(fā)表的論文在該報告年份(JCR year)中被引用總次數(shù)除以該期刊在這兩年內(nèi)發(fā)表的論文總數(shù)。這是一個國際上通行的期刊評價指標。影響因子現(xiàn)已成為國際上通用的期刊評價指標,它不僅是一種測度期刊有用性和顯示度的指標,而且也是測度期刊的學術水平,乃至論文質(zhì)量的重要指標。影響因子是一個相對統(tǒng)計量。E·加菲爾德1972年提出。查詢外文期刊影響因子,可使用外文數(shù)據(jù)庫Web of Science中的JCR(Journal Citation Reports),其中JCR Science Edition用于查詢自然科學類期刊,JCR Social Sciences Edition用于查詢?nèi)宋纳鐣茖W類期刊。 它隸屬于湯森路透集團。該網(wǎng)站需要授權才可訪問,需要用大學代理賬號。

 

1、計算方法

   

影響因子,許多著名學術期刊會在其網(wǎng)站上注明期刊的影響因子,以表明在對應學科的影響力。如,美國化學會志、Oncogene等。中國大陸各大高校(如清華大學、中國科學技術大學、南開大學、中國農(nóng)業(yè)大學、吉林大學哈爾濱工業(yè)大學、浙江大學上海大學、大連理工大學等)都以學術期刊的影響因子作為評判研究生畢業(yè)的主要標準。影響因子是以年為單位進行計算的。以1992年為例,計算某期刊在該年的影響因子:

   X=以1992年為基點、某期刊于1990和1991年在1992年全部被引用之論文總次數(shù)

   Y=以1992年為基點、某期刊1990和1991年全部論文發(fā)文量的總和

IF1992年 =(X(1990年,1991年) / Y(1990年,1991年))

1998年,美國科技信息研究所所長尤金·加菲爾德(Eugene Garfield)博士在《科學家》(The Scientists)雜志中敘述了影響因子的產(chǎn)生過程。說明他最初提出影響因子的目的是為《現(xiàn)刊目次,Current Contents》評估和挑選期刊。人們所說的影響因子一般是指從1975年開始,《期刊引證報道》(Journal Citation Reports,JCR)每年提供上一年度世界范圍期刊的引用數(shù)據(jù),給出該數(shù)據(jù)庫收錄的每種期刊的影響因子。JCR是一個世界權威性的綜合數(shù)據(jù)庫。它的引用數(shù)據(jù)來自世界上3000多家出版機構的7000多種期刊。專業(yè)范圍包括科學、技術和社會科學。JCR是世界上評估期刊唯一的一個綜合性工具,因為只有它收集了全世界各個專業(yè)的期刊的引用數(shù)據(jù),JCR光盤版有許多很好的界面,顯示了期刊之間引用和被引用的關系?梢愿嬖V人們,那些是最有影響力的期刊,那些是最常用的期刊,那些是最熱門的期刊。除影響因子外還給出:期刊最新排序(Current Rank)、刊名縮寫(Abbreviated Journal Title)、國際統(tǒng)一刊號(ISSN)、總引用數(shù)(Total Cites)、及時性索引(Immediacy Index)、總文章數(shù)(Total Article)、被引半衰期Cited Half-Life)。

近年來,隨著人們對引文分析研究的深入,開始認識有多種科技期刊的引文峰值區(qū)域不一定都集中于論文發(fā)表的第一、二年,有些學科或地區(qū)的期刊的引文峰值區(qū)域可能會延至第三年、第四年......。因此有人提出更一般的影響因子定義:

其中nk-i代表第k年對期刊在k-i年發(fā)表論文的引用次數(shù);Nk-i則代表該刊在k-i年發(fā)表的論文數(shù)量。

 

2、影響因子的決定因素

 

   從計算公式看,影響因子雖然只和被引次數(shù)和論文數(shù)直接相關,但實際上,它與很多因素有密切聯(lián)系。決定影響因子大小的因素現(xiàn)主要有以下5個方面:(1)論文因素。如論文的出版時滯、論文長度、類型及合作者數(shù)等。出版時滯較短的刊物更容易獲得較高的影響因子。若刊物的出版周期較長,則相當一部分的引文因為文獻老化(超過2年)而沒有被統(tǒng)計,即沒有參與影響因子的計算,從而降低了影響因子。大量統(tǒng)計資料表明,刊載論文如果是熱門課題,且篇幅較短,發(fā)表較快,則被引率將很快達到高峰,進而使期刊的影響因子上升很快,然后又迅速下降;刊載完整研究性論文的期刊,持續(xù)被引用時間長,影響因子升高較持久。也有資料表明,論文的平均作者數(shù)與論文的總被引頻次呈顯著的正相關。(2)期刊因素。如期刊大。òl(fā)表論文數(shù))、類型等。在計算影響因子時,刊載論文數(shù)僅統(tǒng)計論文、簡訊和綜述,而對評論、來信、通訊和其他一些常被引證的欄目的文章則不進行統(tǒng)計。根據(jù)經(jīng)驗判斷,期刊發(fā)表論文數(shù)量與影響因子和總被引頻次的大小有密切聯(lián)系。在多數(shù)情況下,論文量少的期刊容易得到高影響因子,并且這部分期刊的影響因子在年度之間會有較大的波動;而論文量多且創(chuàng)刊年代久的期刊往往容易得到較高的總被引頻次。此外,還與其他引證指標如:即年指標、期刊被引用半衰期、地區(qū)分布數(shù)、基金論文比以及期刊發(fā)行范圍和發(fā)行量等指標有密切關系。期刊的規(guī)模和結構不同會造成期刊影響因子的不同。一般來講,同種類型的期刊形成的規(guī)模越大,這些期刊的影響因子總的來講就越大;期刊中所含的“熱門”課題或“熱門”專業(yè)的文章越多,總被引頻次就越高,同時這種期刊的影響因子也就越大。(3)學科因素。如不同學科的期刊數(shù)目、平均參考文獻數(shù)、引證半衰期等都會對期刊的影響因子和總被引頻次產(chǎn)生影響。期刊的影響因子和總被引頻次均以論文的引證與被引證的數(shù)量關系為基礎。一個學科的引文數(shù)量,總體水平取決于兩個主要因素:一是各學科自身的發(fā)展特點;二是該學科期刊在數(shù)據(jù)庫來源期刊中所占的比例。從總體上來說,某學科來源期刊越多,該學科期刊的總被引頻次和影響因子就越大。這兩大因素決定了學科影響因子和總被引頻次分布的不均衡性。生物學期刊一直是SCI期刊中比較引人注目的一類期刊,它不僅在期刊數(shù)量上明顯多于其他學科,而且在總被引頻次和影響因子的數(shù)量上也有顯著優(yōu)勢,從而說明生物科學在當代科學中所處的重要位置。此外,影響因子還受期刊所涉及的學科在專業(yè)意義上的社會覆蓋面的影響,如果某個科技期刊在專業(yè)意義上的社會覆蓋面非常小,而且同類期刊又很少,那么它的影響因子就不可能很高 。不同的學科由于其內(nèi)在的科研規(guī)律不同,在做研究時所需引用他人的科研成果情況就不盡相同。這些區(qū)別至少在兩個方面會影響到影響因子的大小,一方面的區(qū)別是需要引用他人成果多少的情況,另一方面的區(qū)別是引用他人成果的時間情況。由于影響因子一般都只按近兩年內(nèi)的期刊中所引用的文獻計算,可以看出按近兩年內(nèi)的引文年限分布情況做的排序結果和通過用影響因子方法對雜志的排序結果同樣也具有一致性,這同樣說明了影響因子不能正確地反應出不同學科期刊之間影響力的大小。由于歷史的原因,一個國家不同學科的建設和發(fā)展都是不平衡的,甚至同一學科中的不同分支也存在這種情況。有的學科規(guī)模很小,但從事這一學科的科研人員多,而且對這一學科的資金投入也大,相關的學科雜志也較多,這樣就會形成一種規(guī)模優(yōu)勢。而往往那些規(guī)模較小的學科就不具備這種規(guī)模優(yōu)勢,從而這類期刊的影響因子和總被引頻次也不會高。就學科規(guī)模發(fā)展速度的快慢而言,不同的學科有“冷”、“熱”之分。“熱”門學科由于時代的需要其規(guī)模發(fā)展速度是很快的,這種學科的文章在其規(guī)模迅速發(fā)展的期間將具有很高的被引用率;而“冷”門學科則正好相反。但是,這種“冷”與“熱”的劃分往往并不是出于科學本身的發(fā)展需要,而經(jīng)常是由于經(jīng)濟、社會等一些非科學因素的制約而造成的。還有一些學科包含了許多熱門的課題,這些“熱門”課題的文章雖有較高的被引用率,但并不具備多大的科學價值。據(jù)以上分析可以認為:這種僅僅因為學科規(guī)模的大小和發(fā)展速度的快慢而造成的論文被引用率高低的不同,或者是引起相關雜志和機構的影響因子大小的不同,從而造成在重要性的排序上的不同,不是科學木身發(fā)展造成的,是其他的一些經(jīng)濟的、歷史的和社會的非科學因素造成的,因此對規(guī)模小或是“冷”專業(yè)的學科進行的這種評價是極為不公平的,也是不合理的。(4)檢索系統(tǒng)因素,如參與統(tǒng)計的期刊來源、引文條目的統(tǒng)計范圍等。對于特定刊物來說,在中外的檢索系統(tǒng)中,由于其所收錄的期刊群體組成的差異較大,因而所計算的影響因子值有較大的差異,并且同一刊物在不同語種的檢索系統(tǒng)中具有明顯不同的影響因子和總被引頻次。(5)名人效應的影響,名人效應常表現(xiàn)為:一方面人們常引用名人的文章來增加自己文章的權威性,即便是在還有別的更適合自己文章引用的文獻時也是這樣;另一方面是署有名人名字的文章或被名人所推薦的文章很容易在所謂的高檔次的雜志上發(fā)表,因而也容易被SCI或CSCD所收錄,且有時文章本沒有名人科研成果,卻為了能在高級刊物上發(fā)表署上了名人的名字,所以過分地強調(diào)被引用或收錄情況,將給文章的總被引頻次和影響因子帶來人為的偏差。

 

(四)引文分析

 

  引文分析Citation Analysis)是利用數(shù)學及統(tǒng)計學的方法和比較、歸納、抽象、概括等邏輯方法,對科學期刊、論文、著者等各種分析對象的引證與被引證現(xiàn)象進行分析,進而揭示其中的數(shù)量特征和內(nèi)在規(guī)律的一種文獻計量分析方法。引文分析方法的數(shù)學基礎是概率論數(shù)理統(tǒng)計。在進行分析比較時,已將其作用排除在測度結果之外了。科技文獻的引證與其被引證現(xiàn)象進行研究的過程。使用的方法有圖論、模糊集合、數(shù)理統(tǒng)計等數(shù)學方法和邏輯思維方法,目的在于揭示文獻所蘊含的情報特征和相關關系,F(xiàn)代科學論文的一個重要特征是,在“參考文獻”標志下依序列出所援引文獻的著錄事項。參考文獻 (被引用文獻)與正文(引用文獻) 的簡單邏輯關系就是引文分析的基礎和背景。致力于引文分析理論和技術研究的文獻學家主要有格羅斯、.布朗等。普賴斯1956年發(fā)表重要著作《科學論文的網(wǎng)絡》,為引文分析奠定理論基礎,E.加菲爾德于1953年受法律業(yè)務工具書《謝潑德引文》的啟發(fā),于1961~1963編成《科學引文索引》(SCI),使引文分析具備了實用的工具。引文分析適于探索科學的微觀結構,便于超越時間空間,跨學科組織文獻,同傳統(tǒng)的分類法和主題法截然不同,使文獻有序化,有利于對文獻由表及里地深入展開分析,更易于量化。引文分析中還有一些輔助概念,運用也較普遍:①文獻耦合。一篇參考文獻被兩篇文獻引用便構成一個引文偶,引文偶愈多,說明兩篇文獻關系愈密切。②同被引。兩篇論文共同被后來的一篇或多篇論文所引用的現(xiàn)象,其量度是同被引強度,即兩篇(或多篇)文獻同被后來的文獻所引用的頻次,顯然,同被引頻次愈高,兩篇論文相關性愈強。③自引。作者引用自己以前發(fā)表的獨撰與合撰論文的現(xiàn)象,自引還可以擴展到雜志、學科、地區(qū)、團體乃至國家對文獻的反身自用。引文分析主要用于指導編制各種新型檢索工具,為科學管理提供量化的依據(jù),探討科學的結構,評價與選擇期刊,考察科學著作及科學家的社會影響等。關鍵是開發(fā)或引進更為有效的分析方法。

 

1、引文分析的類型

   

   從不同的角度和標準來劃分,引文分析方法有著不同的類型。如果從獲取引文數(shù)據(jù)的方式來看,有直接法和間接法之分。前者是直接從來源期刊中統(tǒng)計原始論文所附的被引文獻,從而取得數(shù)據(jù)并進行引文分析的方法;后者則是通過科學引文索引”(SCI)、“期刊引用報告”(JCR)等引文分析工具,查得引文數(shù)據(jù)再進行分析的一種方法。若從文獻引證的相關程度來看,則有自引分析、雙引分析、三引分析等類型。如果從分析的出發(fā)點和內(nèi)容來看,引文分析大致有三種基本類型:(1)引文數(shù)量分析:主要用于評價期刊和論文;研究文獻情報流的規(guī)律等。(2)從引文間的網(wǎng)狀關系或鏈狀關系進行研究:科學論文間存在著一種引用關系網(wǎng),如A被B引, B被C引, C又被A引等。研究這種關系主要用于揭示學科的發(fā)展與聯(lián)系,并展望未來前景等。(3)從引文反映出的主題相關性方面進行研究:主要用于揭示科學的結構和進行文獻檢索等。

 

2、引文分析的主要內(nèi)容

 

   從不同的角度或從各種基本要素出發(fā),對科學引文的分布結構進行描述和分析,便形成引文分析的基本內(nèi)容,一般包括:

  1)引文年代分析。一般來說,隨著年度的由遠而近,引文量呈增長趨勢,即時間愈近,被引用的文獻愈多;文獻被利用的峰值是該文章發(fā)生以后的第二年。如果以引文年代為橫軸,各年引文量為縱軸,在坐標圖上描繪各年數(shù)據(jù)點,然后用一條線連接起來,便可得到一條引文年代分布曲線。通過對該曲線的分析,不僅可以了解被引文獻的出版、傳播和利用情況,而且可以研究科學發(fā)展的進程和規(guī)律,特別是在文獻老化和科技史的研究中,引文年代分析更是一種廣泛應用的有效方法。

  2)引文量分析引文量是某一主體對象含有的參考文獻數(shù)量。它是引文鏈的基本特征之一。通過引文數(shù)量的分析,不僅可以揭示文獻引證與被引證雙方的相互聯(lián)系,而且還可以從定量的角度反映出主體之間的聯(lián)系強度。如果兩篇論文或兩種期刊之間的引文數(shù)量大,就可以認為它們之間的引證強度大,說明其聯(lián)系較緊密。引文量的分布規(guī)律可從下列幾個方面分析:

    A、引文量的理論分布:我們將一定量的論文的引文量數(shù)據(jù)進行分析比較,發(fā)現(xiàn)其變化規(guī)律表現(xiàn)為以平均數(shù)為中點,接近中點的頻數(shù)最多,離平均數(shù)遠的頻數(shù)趨于減少,形成中間高兩極低的正態(tài)理論分布。

    B、引文篇數(shù)分布:即每篇研究論文平均占有的引文篇數(shù)的分布。它不僅反映了論文作者引用文獻的廣度和深度,而且還能說明引文與被引文的學科內(nèi)容之間的聯(lián)系強度。

  3)集中與離散規(guī)律分析引文分布的集中性與離散性是相對于一定的測度指標而言的。引文按來源期刊的分布,引文篇數(shù)的頻數(shù)以平均數(shù)為中心的分布,引文按年度、語種、文獻類型等的分布,都表現(xiàn)出這種集中與離散的趨勢。

  4)引文類型分析。科學研究中引用的文獻很廣,有期刊論文、圖書和特種文獻。對被引文獻的類型進行分析,將有利于確定文獻情報搜集的重點。

  5)引文語種分析。引用文獻是由不同語種的文獻構成的。某一語種的文獻被引用量愈大,則說明該語種比較常用和重要?疾旌头治鲆恼Z種的分布,對于人們有計劃地引進外文文獻、譯文選題、外語教育等,頗有參考價值。

  6)引文國別分析。對引文的國別分析,特別是各國文獻互引情況的統(tǒng)計分析,可以探明各國互引文獻的狀況,弄清國際文獻交流的數(shù)量和流向。

 

3、引文分析的限性

 

   著者引用文獻是一個人為控制的思維和判斷過程,而作為其表現(xiàn)形式的引用文獻,僅僅是宏觀的、表面的測度,受到許多限制因素的影響。

  1)關系上假聯(lián)系的影響。引用文獻的原因多種多樣,兩篇論文可能出于完全不同的原因或從不同的角度引用同一篇早期文獻,一篇可能是引用其方法,另一篇可能是引用其結果,那么這兩篇文獻在內(nèi)容上的聯(lián)系就有可能是虛假的。引文有些是發(fā)生在前言和篇名中;有些是發(fā)生在正文中;有些發(fā)生在結論或討論中。在這些情況下,作者對原著的引用內(nèi)容和程度是不相同的。引文對原著的關系和重要性也各不相同,但在的引文分析中,對它們都是同等看待,不加區(qū)分的。這樣也容易造成成假關系。新刊的論文得不到大量引用;小型期刊被引率往往低于大型期刊;引而未用或用而未引的情況也時有發(fā)生。文獻引用中的這些現(xiàn)象都會影響引文分析方法的應用和效果。

  2)馬太效應的影響。有的研究者認為,在文獻引用方面也存在著馬太效應的影響。人們往往以“名著”、“權威”作為選擇引文的標準,有的確是出于需要,也有的則是為了裝飾門面,抬高自己論文的身價。一種期刊因為發(fā)表名人的文章而為眾人所引用,以至引起連鎖反應,結果其引文率很高。這種馬太效應的心理作用,掩蓋和影響著文獻引用的真實性。

 

六、沈氏科技文獻均衡分析定

 

我本人在學習和研究《經(jīng)典經(jīng)濟學》理論時由于受阿爾弗雷德·馬歇爾(Alfred Marshall,1842—1924)供需價格均衡理論啟發(fā),2003年在《科學學研究》雜志發(fā)表了《科技創(chuàng)新一般均衡理論--對科技成果創(chuàng)新度評價的科學計量學分析》一文,在這篇文章里,首次提出科技文獻均衡分析理論。后來又在此理論的基礎上提出它的應用性前景。并于2014年又在《教育科學博覽》雜志發(fā)表了《科技創(chuàng)新指標體系的構建及其科學意義--基于科技創(chuàng)新一般均衡理論的應用性研究》。這兩篇論文構成了我提出的整個科技文獻分析方法的核心內(nèi)容。下面就這方面情況進一步分析介紹如下:

 

(一)科技創(chuàng)新的一般均衡現(xiàn)象

   

   科學研究表明,科學家科技成果的科技創(chuàng)新程度往往與其科研成果發(fā)表前論文檢索的重復率和發(fā)表后論文檢索的引用率之間具有一定的相關性。這種相關性主要表現(xiàn)為論文檢索重復率越大,其創(chuàng)新性越。恢貜托栽叫,其創(chuàng)新性越大。論文檢索引用率越大,其創(chuàng)新性越大;引用率越小,其創(chuàng)新性越小。因此,在數(shù)學坐標系里,科技成果的論文檢索重復率曲線和論文檢索引用率曲線之間必然存在一個交叉點,并在一定的狀態(tài)下形成一種均衡。這個均衡點即為科技創(chuàng)新的均衡點,這個均衡狀態(tài)即為科技創(chuàng)新的一般均衡狀態(tài)或稱科技發(fā)展的一般均衡狀態(tài)。據(jù)此,我們可以根據(jù)這個均衡點確定科技成果創(chuàng)新的程度?萍紕(chuàng)新現(xiàn)象是科技工作者的創(chuàng)造性智力勞動現(xiàn)象。科學家和工程師從事于科學發(fā)現(xiàn)與技術發(fā)明都可以看成是一種科技創(chuàng)新現(xiàn)象。對科技創(chuàng)新的評價一直是科學技術學界或科學計量學界的研究重點。過去人們對科技創(chuàng)新的評價主要是從定性的角度進行研究,并為此已做了大量的工作。但從定量的角度評價科技創(chuàng)新還只是近幾十年隨著科學計量學的興起而開始的事情,F(xiàn)在人們對科技創(chuàng)新評價的計量分析主要是從科技成果的引用率上進行探討,并形成了諸如SCI、SSCI、EI等多種評價體系和評價模型。我認為,這些評價體系和評價模型存在一定的片面性。不能全面準確地反映科技成果創(chuàng)新的實際程度,因此有必要對其進行重新認識,并尋找更新的評價體系和評價模型,只有這樣才能更好地揭示科技創(chuàng)新的本質(zhì)及其規(guī)律。根據(jù)科技創(chuàng)新與科技成果的重復率和引用率的相互關系及其形成的均衡狀態(tài),提出科技創(chuàng)新的一般均衡理論。該理論不僅把科技成果的引用率納入科技創(chuàng)新評價體系和評價模型,而且把科技成果的重復率也納入科技創(chuàng)新評價體系和評價模型,并找到它們之間的相互均衡關系。從而在科學計量學上重新揭示了科技創(chuàng)新的本質(zhì)及其變化發(fā)展規(guī)律。從科學計量學角度研究科技創(chuàng)新的一般均衡現(xiàn)象盡管是一項非常復雜而艱難的科研工作,但從某種意義上講,它更能全面的把握科技創(chuàng)新全過程。因此,我們認為從科技創(chuàng)新的一般均衡現(xiàn)象入手,揭示科技創(chuàng)新的本質(zhì)及其變化發(fā)展規(guī)律,將成為未來科技創(chuàng)新問題研究的一個非常重要的研究方向。只有沿著這個方向認識下去,才能更準確、更全面地把握科學技術創(chuàng)新的本質(zhì)及其變化發(fā)展規(guī)律。

 

1、評價科技創(chuàng)新的兩大重要指標體系

 

1)科技論文重復率及其重復率定理

 

我們知道,科技人員在從事于科研活動的一開始就要進行科研立項,為了了解該研究課題的創(chuàng)新性,管理部門都要對其科研課題進行檢索,了解其研究工作開展之前有多少相同的和相類似的研究課題或研究成果。并就此對其科研項目的創(chuàng)新性進行評估。如果通過檢索發(fā)現(xiàn)其研究項目重復率大,就說明其科研項目創(chuàng)新度小,反之則創(chuàng)新度大。創(chuàng)新度大就給予資助,創(chuàng)新度小就不給予資助?蒲姓撐闹貜吐实拇_定,就是根據(jù)這一做法對某位科學家科研論文重復的情況進行檢索,看看有多少與其科研論文內(nèi)容一致和類似的論文。通過相同或相似論文的數(shù)量統(tǒng)計,了解其科研論文的重復率。如果相同或相似的論文多,就說明其重復率大,如果少就說明重復率小。所謂科研論文重復率就是通過對某位科學家發(fā)表科研論文之前的一定時間年限里其它科學家發(fā)表的相同或相似論文數(shù)量的統(tǒng)計,所確定的與其論文相同或相似的變化率。也可以說,科技論文重復率是指在不同的年限內(nèi)與其相同科研論文相同或相類似論文發(fā)表數(shù)量的變化率。利用科研論文重復率或相同率的多少就可以了解某位科學家某項科研成果的創(chuàng)新程度。因此,科研論文重復率或相同率的確定對評價科研成果的創(chuàng)新度無疑是一個非常重要的科學計量學指標?蒲谐晒貜吐室部梢詮膮⒖嘉墨I中獲得,即科技人員發(fā)表論文時,其論文后面的參考文獻多少也可以判斷其重復率大小。參考文獻數(shù)量越多,就說明其論文的創(chuàng)新性越小,反之就越大。參考文獻是判斷科技成果重復率的重要指標。

科學家的科研論文創(chuàng)新度與科學家科研論文發(fā)表前的論文檢索重復率(參考文獻數(shù)量)具有非常重要的關系。這種關系表現(xiàn)為論文檢索重復率(參考文獻數(shù)量)越大,其科技創(chuàng)新度越低,論文檢索重復率(參考文獻數(shù)量)越小,其科技創(chuàng)新度越大;科技創(chuàng)新度與檢索出的重復論文數(shù)(參考文獻數(shù)量)表現(xiàn)出如下曲線(圖1所示)。科技創(chuàng)新度與重復論文數(shù)(參考文獻數(shù)量)之間表現(xiàn)出來的這種普遍規(guī)律現(xiàn)象我們稱之謂科研論文檢索重復率定理。

 

2 科技創(chuàng)新度與論文重復率的關系示意圖

 

以縱軸OP表示科技論文的創(chuàng)新度,橫軸OQ表示檢索出的重復論文數(shù),論文重復率曲線DD就是按照不同創(chuàng)新度下相對應的重復論文數(shù)而描繪出來的曲線。曲線上的各點都表示在不同創(chuàng)新度狀態(tài)下的重復論文數(shù)。例如,論文重復率曲線上的E點就是表示,當論文的創(chuàng)新度為Pe時,重復論文數(shù)為Qe。

 

2)科技論文引用率及其引用率定理

 

我們知道,為了了解某位科學家的科技成果創(chuàng)新度、影響度的大小,通常可以采取檢索的方式,看看他的科研成果被別人引用的情況。引用的越多說明其科研成果越有創(chuàng)新,越有科技價值,反之則沒有創(chuàng)新,沒有科技價值。如果有價值就支持他進一步研究,如果沒有價值就減少或取消對其科研工作的資助?蒲姓撐囊寐实拇_定,就是根據(jù)這一做法對科學家科研論文引用的情況進行檢索,看看有多少其它科學家的科研論文引用了它的內(nèi)容。通過引用論文數(shù)量的統(tǒng)計,就可以了解其科研論文的引用率。如果引用的論文多,就說明其引用率大,如果引用的論文少,就說明引用率小?蒲姓撐囊寐实拇_定,就是通過對科學家發(fā)表科研論文之后的一定時間年限里其它科學家引用率的論文數(shù)量的統(tǒng)計,了解其論文被引用的程度。用科研論文所引用的數(shù)量變化情況來確定某位科學家的科研論文的影響度大小、創(chuàng)新性強弱是衡量其科技成果創(chuàng)新性的一個非常重要的方法。所謂科研論文檢索引用率是指科學家的某些科研論文發(fā)表后,通過檢索,其在一定的時間年限里被其它學者發(fā)表論文所引用的論文數(shù)的變化率?蒲姓撐臋z索引用率在某種意義上講代表了這篇論文發(fā)表后的影響程度,也反映了這篇論文的創(chuàng)新度的大小。因此,其無疑也是確定科技成果創(chuàng)新度的一個非常重要的科學計量學指標。

科技創(chuàng)新度與科學家所發(fā)表論文的檢索引用率具有一定的相關性,這種相關性表現(xiàn)為論文檢索引用率越大,其科研論文的科研成果創(chuàng)新度越大,其論文檢索引用率越低,其科研成果的創(chuàng)新度越小。科技創(chuàng)新度與檢索出的引用論文數(shù)之間表現(xiàn)出如下曲線(圖2所示)?萍紕(chuàng)新度與引用論文數(shù)之間表現(xiàn)出來的這種普遍規(guī)律現(xiàn)象我們稱之謂科研論文檢索引用率定理。

3 科技創(chuàng)新度與論文檢索引用率的關系示意圖

 

縱軸OP表示科技論文的創(chuàng)新度,橫軸OQ表示論文引用數(shù)。論文引用率曲線SS就是根據(jù)在每一創(chuàng)新度下相應的引用論文數(shù)而描繪出來的曲線。曲線上的各點表示在這一創(chuàng)新度上的引用論文的數(shù)量。例如,論文引用率曲線上的E點就是表示,當科技創(chuàng)新度為Pe時,引用論文的數(shù)量為Qe。

 

2、科技創(chuàng)新均衡的形成

 

1)科技創(chuàng)新均衡

 

科技創(chuàng)新均衡是一種科技成果的論文檢索重復率與論文檢索引用率之間相一致時的科技創(chuàng)新度。用圖形來表示就是這一科技成果的論文檢索重復率曲線與論文檢索引用率曲線相交之點的科技創(chuàng)新度。如圖3所示。在圖中,縱軸OP表示科技創(chuàng)新度,橫軸OQ表示重復論文的數(shù)量和引用論文的數(shù)量。曲線DD代表論文重復率曲線,曲線SS代表論文引用率曲線。論文重復率曲線與論文引用率曲線的相交點E就是均衡點。E點所確定的科技創(chuàng)新度Pe就是該科研成果的均衡科技創(chuàng)新度。而E點所確定的論文數(shù)量Qe就是該科技成果達到均衡狀態(tài)的均衡論文數(shù)。因此,E這個均衡點既確定了均衡科技創(chuàng)新度,也確定了均衡論文數(shù)。

                                   

 

4  科技創(chuàng)新的一般均衡曲線

 

2)科技創(chuàng)新度均衡的形成

 

科技創(chuàng)新均衡是科技成果的論文檢索重復率(參考文獻數(shù)量)曲線和論文檢索引用率曲線的相互作用及科技創(chuàng)新度本身的波動而形成的。這可以從以下兩方面來理解。

一方面,科技創(chuàng)新度過高的情形(如圖4所示)。如果科技創(chuàng)新度過高,其論文引用率就會增加,而其論文重復率則會減少。論文重復數(shù)量就會少于論文引用數(shù)量。出現(xiàn)引用率大于重復率。這樣該項研究就會獲得進一步支持。隨著后繼者的不斷引用,后繼者的同類研究將會增加,隨之論文重復率就會不斷上升,這樣就必然導致同類研究的科技創(chuàng)新度下降,最后降至一個新的均衡狀態(tài)。

另一方面,科技創(chuàng)新過低的情形(如圖4)。當科技創(chuàng)新度過低時,其論文重復率就會增加,而其論文引用率則會減少。論文引用數(shù)量就會少于論文重復數(shù)量,出現(xiàn)重復率大于引用率。這樣該項研究就得不到進一步的資助。此類創(chuàng)新度低的研究項目就會被自然淘汰。更新的、更具有創(chuàng)新性的科研項目就會產(chǎn)生出來,從而促進其創(chuàng)新度不斷上升,最后升至一個新的均衡狀態(tài)。

從以上兩種情況的分析,無論是科技創(chuàng)新度過高的情況,還是科技創(chuàng)新度過低落情況,都有動力導致科技創(chuàng)新度趨向新的均衡。因此,科技創(chuàng)新度的一般均衡過程的形成是具有其內(nèi)在必然規(guī)律的,這種內(nèi)在必然規(guī)律我們稱之謂科技創(chuàng)新的一般均衡定律。

如圖4所示,縱軸OP表示科技創(chuàng)新度的大小,橫軸OQ表示重復論文數(shù)或引用論文數(shù)的多少。DD'和SS' 分別是論文重復率曲線和論文引用率曲線。

                                         

 

5  均衡科技創(chuàng)新度的形成示意圖

 

第一種情形是:當科技創(chuàng)新度為P1時,論文的引用數(shù)為Q1,而論文的重復數(shù)為Q2,形成論文引用率大于論文重復率。即OQ1>OQ2。因此,從均衡理論上講,這必然導致科技創(chuàng)新度下降的壓力增大。(如由P1下降到Pe)促使論文的重復率數(shù)量和引用率數(shù)量趨向均衡以及其科技創(chuàng)新度趨向均衡點E。形成均衡科技創(chuàng)新度Pe和均衡論文數(shù)量Qe。

第二種情形是:當科技創(chuàng)新度為P2時,論文的重復數(shù)為Q3,而論文的引用數(shù)為Q4,形成論文重復率大于論文引用率。即OQ3>OQ4。因此,從均衡理論上講,這必然導致科技創(chuàng)新度上升的壓力增大。(如由P2上升到Pe)促使論文的引用率數(shù)量和重復率數(shù)量趨向均衡以及其科技創(chuàng)新度趨向均衡點E;形成均衡科技創(chuàng)新度Pe和均衡論文數(shù)量Qe。

根據(jù)以上科技創(chuàng)新的一般均衡曲線我們可以看出以下幾種情況:

第一、從一般均衡曲線上我們可以看到,E點以上部位的科研成果,由于其論文檢索重復率小、論文引用率大,因此,其科技創(chuàng)新性就強,科技價值就大。而在E點的以下部位,由于其論文檢索重復率大、論文引用率小,因此,其科技創(chuàng)新性就弱,科技價值就小。

第二、當某項科研成果其論文檢索重復率為零時,其論文檢索引用率即反映出其科技創(chuàng)新程度;當其論文檢索引用率為零時,其論文檢索重復率即反映出其科技創(chuàng)新程度。

第三、當某項科技成果的論文檢索重復率和論文檢索引用率都為零時,表明此項科技成果的創(chuàng)新度為零。

第四、衡量科技成果創(chuàng)新度(科技價值)的大小既取決于其科研論文的檢索重復率大小,也取決于其論文檢索引用率大小。重復率和引用率可以看成是科技研究領域非常重要的兩種基本力量它們的相互作用決定了科技研究創(chuàng)新性的大小。而科技研究的創(chuàng)新性則決定了科研工作的實際價值的大小,因此,科技創(chuàng)新度不僅自動調(diào)節(jié)著科技工作的決策方向,同時也促進著科研資源的不斷優(yōu)化配置。

總之,在我們看來,科技創(chuàng)新均衡的形成具有其本身的內(nèi)在動力機制。這種內(nèi)在動力機制是科學技術創(chuàng)新本身發(fā)展規(guī)律的反映?萍紕(chuàng)新均衡現(xiàn)象的發(fā)生與發(fā)展無時不受科技創(chuàng)新發(fā)展規(guī)律的控制和調(diào)節(jié)。根據(jù)論文檢索重復率曲線和論文檢索引用率曲線相互作用關系,我們發(fā)現(xiàn),科學家科技成果的科技創(chuàng)新程度與其科研成果發(fā)表前的論文檢索重復率(參考文獻數(shù)量)和發(fā)表后的論文檢索引用率具有確定性的相關性。這種相關性表現(xiàn)在論文檢索重復率(參考文獻數(shù)量)越大,其創(chuàng)新性越小,論文檢索重復性(參考文獻數(shù)量)越小,其創(chuàng)新性越大;同時,論文檢索引用率越大其創(chuàng)新性越大,論文檢索引用率越小,其創(chuàng)新性越小?萍汲晒恼撐臋z索重復率和論文檢索引用率曲線之間也同樣存在確定性的交叉聯(lián)系現(xiàn)象,并在彼此之間的交叉點上形成一種均衡,我們把這種均衡稱之謂科技創(chuàng)新的一般均衡。而將這一均衡理論稱之謂科技創(chuàng)新的一般均衡理論。

 

3、科技創(chuàng)新均衡對科技資源配置的調(diào)節(jié)

 

科技創(chuàng)新均衡的形成過程表明,科技創(chuàng)新均衡是科學技術發(fā)展的必然趨勢和正常的發(fā)展狀態(tài)。而脫離均衡點的科技創(chuàng)新必然導致科技創(chuàng)新過強或過弱、過熱或過冷的失衡狀態(tài)。通過均衡科技創(chuàng)新度的形成,促進科學技術創(chuàng)新不斷地由失衡狀態(tài)轉(zhuǎn)向均衡狀態(tài)。形成科學技術發(fā)展的均衡協(xié)調(diào)進步的機制。這就是科學技術發(fā)展過程中的均衡科技創(chuàng)新機制。通過這種均衡科技創(chuàng)新狀態(tài)的形成過程,科技競爭的創(chuàng)新機制對科技資源的配置發(fā)揮著積極有效的調(diào)節(jié)作用。

首先,科技創(chuàng)新均衡的形成是論文重復率與論文引用率波動的結果,同時也是科技創(chuàng)新給予兩者雙方的控制信號,是用來調(diào)節(jié)論文重復率與論文引用率之間相互關系的杠桿。當科技創(chuàng)新處于失衡狀態(tài)時,表明科學技術體系出現(xiàn)了科技創(chuàng)新過強或過弱的狀況,這樣就會對論文引用者或論文重復者的行為產(chǎn)生影響,也會對科學技術管理者(科技政策制定者)和科研人員的行為產(chǎn)生影響。使他們對科技創(chuàng)新過程中產(chǎn)生的調(diào)控信號做出相應的反應。并調(diào)整各自的行為,進而促使重復論文數(shù)和引用論文數(shù)以及科技創(chuàng)新度向均衡狀態(tài)轉(zhuǎn)變。

其次,科技創(chuàng)新過強或過弱,過熱或過冷都意味著科技資源配置的不合理。存在著論文重復率和論文引用率過度現(xiàn)象。造成科技資源的浪費或利用不足。通過科技創(chuàng)新均衡的形成過程,科技創(chuàng)新機制對于科技資源的配置不合理的狀態(tài)可以發(fā)揮有效的調(diào)節(jié)作用。使科學技術的發(fā)展趨勢向科技創(chuàng)新的均衡狀態(tài)轉(zhuǎn)化,實現(xiàn)科技資源的合理配置。

論文引用率和論文重復率是科學技術創(chuàng)新過程中兩大基本力量,它們的相互作用決定了科技創(chuàng)新均衡的形成。而科技創(chuàng)新均衡則是科技創(chuàng)新的基本調(diào)節(jié)信號和杠桿,調(diào)節(jié)著論文引用率和論文重復率的平衡,促進著科技資源的優(yōu)化配置的實現(xiàn)。論文引用率和論文重復率以及科技創(chuàng)新度的變化相互依存,相互影響,構成了科學技術發(fā)展過程中的核心機制—科技創(chuàng)新調(diào)節(jié)機制,這一機制貫穿于整個科技發(fā)展的始終。這一機制就好象一個無形之手,控制和調(diào)節(jié)著科技創(chuàng)新的整個過程。但這個無形之手也不是萬能的,政府有形之手也將對其進行適當補充和調(diào)節(jié)。就象經(jīng)濟市場規(guī)律一樣,供給與需求曲線均衡不是萬能的,這個無形之手調(diào)控著市場,但也要受到政府之有形之手的干預和控制。

綜上所述,我們認為科學家科技成果的創(chuàng)新度與其科研成果發(fā)表前論文檢索的重復率(參考文獻數(shù)量)和發(fā)表后論文檢索的引用率具有一定的相關性。這種相關性主要表現(xiàn)為論文檢索的重復率越大,其創(chuàng)新性越小,重復性越小,其創(chuàng)新性越大;論文檢索的引用率越大,其創(chuàng)新性越大,引用率越小,其創(chuàng)新性越小。因此,科學家科技成果論文檢索的重復率曲線和論文檢索的引用率曲線之間在坐標系里必然存在一個交叉點,并形成一定的均衡狀態(tài)。這個均衡點即為科技創(chuàng)新的均衡點,這個均衡狀態(tài)即為科技創(chuàng)新的一般均衡狀態(tài)。據(jù)此,從科學計量學上,我們可以根據(jù)這個均衡點和均衡狀態(tài)評價科技成果創(chuàng)新的程度?萍紕(chuàng)新均衡的形成對我們更好地揭示科學技術創(chuàng)新的本質(zhì)及其發(fā)展規(guī)律具有十分重要的意義?萍紕(chuàng)新問題是一個非常重要的學術問題。近年來引起了很多學者的高度關注,但大部分的研究主要還是從定性方面進行描述,而進行定量分析則是近十多年來隨著科學計量學、信息計量學和文獻計量學的興起而出現(xiàn)。但目前對科技創(chuàng)新工作的評價主要是采用科學文獻引用率這個指標來進行分析。諸如,IF(SCI、SSCI、EI)等等。我們覺得光從引文率指標體系來確定科技創(chuàng)新度的大小是不全面的,而應該將科技論文的檢索重復率也作為衡量其創(chuàng)新度的指標之一,并找出它們之間的相關性,確定其均衡點,只有這樣才能更準確地認識科技創(chuàng)新。在我們看來科技創(chuàng)新的一般均衡理論則比較好地解決了這一問題。

 

4、科技成果創(chuàng)新評價指標體系的構建

 

1)科技創(chuàng)新度定律

 

   根據(jù)科技創(chuàng)新的一般均衡規(guī)律,科技人員的科技成果創(chuàng)新度與其科技成果重復率和科技成果引用率之間具有一定的相關性。這種相關性主要表現(xiàn)為科技成果重復率越大,其創(chuàng)新性越。恢貜托栽叫,其創(chuàng)新性越大?萍汲晒寐试酱,其創(chuàng)新性越大;引用率越小,其創(chuàng)新性越小。根據(jù)這個規(guī)律,我們提出:科技創(chuàng)新度定律(S&T innovation law)。就是:“科技成果創(chuàng)新度(P)與科技成果引用率(S)成正比;與科技成果重復率(D)成反比”。用數(shù)學公式表述如下:

   這個定律是“科技創(chuàng)新一般均衡規(guī)律”的數(shù)學化表達,它對我們充分認識科技創(chuàng)新一般均衡具有一定的重要作用和意義。根據(jù)這個定律,我們還可以分析科技成果創(chuàng)新度的大小,建立科技創(chuàng)新因子(S&T Innovation factor,STIF),科技創(chuàng)新指數(shù)(S&T innovation index,STII)科技創(chuàng)新評價指標體系。

 

2)影響因子、創(chuàng)新因子、創(chuàng)新指數(shù)

 

A、影響因子及其計算公式

   

   影響因子Impact Factor,IF)是美國ISI(科學信息研究所)的JCR(期刊引證報告)中的一項數(shù)據(jù)。 即某期刊前兩年發(fā)表的論文在統(tǒng)計當年的被引用總次數(shù)除以該期刊在前兩年內(nèi)發(fā)表的論文總數(shù)。這是一個國際上通行的期刊評價指標。影響因子(Impact factor,縮寫IF)是指某一期刊的文章在特定年份或時期被引用的頻率,是衡量學術期刊影響力的一個重要指標,由美國科學情報研究所(ISI)創(chuàng)始人格里菲爾德Eugene Garfield)在1960年代創(chuàng)立,其后為科學(文獻)計量學的發(fā)展帶來了一系列重大革新。自1975年以來,每年定期發(fā)布于“期刊引用報告”(Journal Citation Reports)。影響因子是以年為單位進行計算的。其數(shù)學公式與計算方法:

 

IF=A/B

   

1992年為例,計算某期刊在該年的影響因子:

    A=以1992年為基點、某期刊于1990和1991年在1992年全部被引用之論文總次數(shù)

    B=以1992年為基點、某期刊1990和1991年全部論文發(fā)文量的總和

    IF1992年 =A(1990年,1991年) / B(1990年,1991年)

    許多著名學術期刊會在其網(wǎng)站上注明期刊的影響因子,以表明在對應學科的影響力。如,美國化學會志、Oncogene等。

 

B、科技創(chuàng)新因子及其計算公式

     

   科技創(chuàng)新因子(S&T Innovation factor,STIF): 又叫創(chuàng)新因子(Innovation factor,IF)。我們把某期刊前兩年發(fā)表論文的被引用總次數(shù)(他引論文總數(shù))除以該期刊在這兩年內(nèi)發(fā)表論文的參考文獻總數(shù)(引他論文總數(shù))。為了和影響因子發(fā)布時間同步,科技創(chuàng)新因子(創(chuàng)新因子)也是以年為單位進行計算的。其數(shù)學計算公式與計算方式:

   1992年為例,計算某期刊在該年的科技創(chuàng)新因子(STIF):

     X=以1992年為基點,某期刊于1990和1991年全部論文的被引用總次數(shù);

     Y=以1992年為基點,某期刊1990和1991年全部論文的參考文獻總和;

     STIF(1992年) = X(1990年,1991年) / Y(1990年,1991年)。

 

C、 科技創(chuàng)新指數(shù)及其計算公式

 

科技創(chuàng)新指數(shù)(STII),又叫創(chuàng)新指數(shù)(II)。什么是科技創(chuàng)新指數(shù)(S&T innovation index,STII)?所謂科技創(chuàng)新指數(shù),簡單說就是指科技人員在科技創(chuàng)新過程中,科技成果創(chuàng)新度的大小與引用率(他引率)成正比;與重復率(引他率)成反比。這樣就形成了一個比值,這個比值再乘一個100%所形成的一個數(shù)值就是科技創(chuàng)新指數(shù)。用數(shù)學公式表述如下:

 

 

    STII((S&T innovation index)表示科技創(chuàng)新指數(shù);

    

    說明:科技人員論文發(fā)表一年,二年,三年,四年,五年......若干年后,所形成的數(shù)據(jù),可采用相同方式處理。即首先確定基點年份,然后將這個基點年份發(fā)表論文所有的歷年引用文獻數(shù)相加,形成這個基點年份歷年引用文獻數(shù)總和。通常的做法是確定一個基點年(論文發(fā)表年),然后向后推二年,將這兩年的引用文獻數(shù)相加。例如:將2012年做為某科技人員發(fā)表論文的基點年(論文發(fā)表年),那就向后推2013年,2014年的引文數(shù)據(jù)(他引文獻數(shù)),并將這兩年的引用文獻數(shù)相加,形成這兩年的引用文獻總數(shù)。這兩個年份的引用文獻數(shù)據(jù)(他引文獻)就是被統(tǒng)計年數(shù)據(jù)。

    

說明:科技人員論文發(fā)表一年、二年、三年、四年、五年......若干年后,所形成的數(shù)據(jù),可采用相同方式處理.即首先確定基點年份,然后將這個基點年份發(fā)表論文所有的參考文獻數(shù)相加,形成這個基點年份參考文獻數(shù)總和。通常的做法是確定一個基點年(論文發(fā)表年),然后將這個基點年份的參考文獻相加。例如將2012年做為某科技人員發(fā)表論文的基點年(論文發(fā)表年),并將這個基點年份所產(chǎn)生的參考文獻數(shù)(引他文獻數(shù))相加,形成這個年份的參考文獻總數(shù)。這個基點年份發(fā)表論文的參考文獻數(shù)據(jù)(引他文獻)就是被統(tǒng)計年數(shù)據(jù)。這只是重復文獻數(shù)據(jù)產(chǎn)生的一種方式之一,還有其它方式。

 

科技創(chuàng)新因子(STIF)與科技創(chuàng)新指數(shù)(STII)對科技人員的創(chuàng)新度是相對準確的數(shù)值。就象影響因子(IF)相對準確反映科技人員科研成果的影響程度和創(chuàng)新程度一樣。但我們認為它們比影響因子(IF)更能全面準確反映科技人員的創(chuàng)新能力。因為這個指標體系比影響因子(IF)指標體系多了一個指標,即重復率(引他率)指標。這個指數(shù)就是將引用率(他引率)指標體系與重復率(引他率)指標體系進行均衡處理,形成一個均衡指標體系。但這個指數(shù)數(shù)據(jù)不是一成不變的,他可以形成波動。正是這種波動性,表明其動態(tài)性,持續(xù)性,發(fā)展性,創(chuàng)新性。

 

3)科技創(chuàng)新評價指標體系數(shù)據(jù)庫的構建

 

根據(jù)影響因子(IF)、科技創(chuàng)新因子(STIF)與科技創(chuàng)新指數(shù)(STII)概念及其計算結果,我們可以建立相應的數(shù)據(jù)庫體系。影響因子數(shù)據(jù)庫現(xiàn)已有多種文獻可查,在此不再贅述。以下主要談談對科技創(chuàng)新因子(STIF)、科技創(chuàng)新指數(shù)(STII)數(shù)據(jù)庫的構建與大量數(shù)據(jù)采集方式的一些構想:

   第一,任何一個科研人員發(fā)表論文時,都要引用他人的文獻,即在他論文上會留下參考文獻數(shù),他引用的參考文獻越多相對說明他的論文重復率越高,反之就越低。創(chuàng)新度與重復率(引他率)成反比。即“科技創(chuàng)新度越高,論文重復率就越低,科技創(chuàng)新長越低,論文重復率就越高”。重復率指標體系可以通過以下幾種方式建立:(1)論文參考文獻數(shù);(2)情報人員通過論文關鍵詞檢索重復論文數(shù);(3)參考文獻加論文關鍵詞檢索重復論文數(shù);(4)通過計算機文獻數(shù)據(jù)庫自動檢索查出相似論文數(shù);(5)通過論文題目進行相似文獻檢索;等等。

   第二,任何一個科研人員發(fā)表論文時,論文都要被別人引用。別人引用的越多,相對來說他的論文的創(chuàng)新度就越高,反之就越低。創(chuàng)新度與引用率(他引率),即與別人對他論文的引用文獻數(shù)成正比。

   第三,任何一個科研人員發(fā)表論文,可以形成兩組數(shù)據(jù):一組為重復率(引他率);另一組為引用率(他引率)。因此,這樣我們就可以對其兩組數(shù)據(jù)進行相關性處理。發(fā)布這位科技人員的論文創(chuàng)新度評價報告。與此類推,任何一個科研人員他會發(fā)表一系列論文,我們可以對其一系列論文產(chǎn)生的兩方面的數(shù)據(jù)進行處理,就可以得到兩組數(shù)據(jù)。然后對這兩組數(shù)據(jù)進行相關處理,發(fā)布這位科技人員系列論文成果的科技創(chuàng)新度評價報告。

   第四,任何一本雜志都有科研人員發(fā)表論文,因此,每類雜志都能產(chǎn)生兩組數(shù)據(jù),然后對它們進行相關性處理,即可形成這個雜志的科技創(chuàng)新評價報告,就象IF,SCI,SSCI,EI一樣。每年都可以發(fā)布一次。每個雜志的科技創(chuàng)新度是不一樣的。發(fā)布雜志的科技創(chuàng)新評價報告,可以引導雜志的發(fā)展方向,促進雜志水平的提高和進步。

   第五,全世界科研人員的創(chuàng)新程度與科技創(chuàng)新因子,科技創(chuàng)新指數(shù)呈一定的相關性。不同時間的科技創(chuàng)新度也不一樣,這樣表現(xiàn)在科技創(chuàng)新因子,科技創(chuàng)新指數(shù)上也不一樣。不同時間,不同地點,不同國家,不同地區(qū),在科技創(chuàng)新方面都表現(xiàn)出差異。因此,反映在科技創(chuàng)新因子,科技創(chuàng)新指數(shù)指標上的數(shù)據(jù)都會有變化。這種變化說明全世界科技發(fā)展的不平衡。有先進,有落后?傊,科技創(chuàng)新因子,科技創(chuàng)新指數(shù)指標體系的建立,對了解全世界各國、各地區(qū)、各個科研人員的科技創(chuàng)新度都是有幫助的。我們還可以將這些不同國家,不同地區(qū)的創(chuàng)新度大小范圍連接起來,這樣還可以建立一個系列圖譜,這就是科技創(chuàng)新圖譜(S&T Innovation Pattern,STIP),這樣還可以發(fā)布全世界科技創(chuàng)新圖譜信息報告。

   以上就是我們對科技創(chuàng)新因子(STIF)和科技創(chuàng)新指數(shù)(STII)數(shù)據(jù)庫建立的一些設想和理論探討。我們認為現(xiàn)在已經(jīng)進入了一個大數(shù)據(jù)時代,計算機處理技術又是如此之發(fā)達,這對數(shù)據(jù)庫建立問題的解決已經(jīng)不是什么大問題?墒沁@將是一個龐大的系統(tǒng)工程,這個系統(tǒng)工程是需要更多人參與完成的。

 

4、構建科技創(chuàng)新評價指標體系的實用價值和科學意義

 

科技創(chuàng)新均衡的形成過程表明,科技創(chuàng)新均衡是科學技術發(fā)展的必然趨勢和正常的發(fā)展狀態(tài)。而脫離均衡點的科技創(chuàng)新必然導致科技創(chuàng)新過強或過弱、過熱或過冷的失衡狀態(tài)。通過均衡科技創(chuàng)新度的形成,促進科學技術創(chuàng)新不斷地由失衡狀態(tài)轉(zhuǎn)向均衡狀態(tài)。形成科學技術發(fā)展的均衡協(xié)調(diào)進步的機制。這就是科學技術發(fā)展過程中的均衡科技創(chuàng)新機制。通過這種均衡科技創(chuàng)新狀態(tài)的形成過程,科技競爭的創(chuàng)新機制對科技資源的配置發(fā)揮著積極有效的調(diào)節(jié)作用。

第一,科技創(chuàng)新均衡的形成是科技成果重復率與科技成果引用率波動的結果,同時也是科技創(chuàng)新給予兩者雙方的控制信號,是用來調(diào)節(jié)科技成果重復率與科技成果引用率之間相互關系的杠桿。當科技創(chuàng)新處于失衡狀態(tài)時,表明科學技術體系出現(xiàn)了科技創(chuàng)新過強或過弱的狀況,這樣就會對科技成果引用者或科技成果重復者的行為產(chǎn)生影響,也會對科學技術管理者(科技政策制定者)和科研人員的行為產(chǎn)生影響。使他們對科技創(chuàng)新過程中產(chǎn)生的調(diào)控信號做出相應的反應。并調(diào)整各自的行為,進而促使重復科技成果數(shù)和引用科技成果數(shù)以及科技創(chuàng)新度向均衡狀態(tài)轉(zhuǎn)變。

第二,科技創(chuàng)新過強或過弱,過熱或過冷都意味著科技資源配置的不合理。存在著科技成果重復率和科技成果引用率過度現(xiàn)象。造成科技資源的浪費或利用不足。通過科技創(chuàng)新均衡的形成過程,科技創(chuàng)新機制對于科技資源的配置不合理的狀態(tài)可以發(fā)揮有效的調(diào)節(jié)作用。使科學技術的發(fā)展趨勢向科技創(chuàng)新的均衡狀態(tài)轉(zhuǎn)化,實現(xiàn)科技資源的合理配置。

   第三,科技人員發(fā)表論文時隨意注加參考文獻。為此,有什么辦法可以防止此類事件發(fā)生?我們認為通過發(fā)布科技人員論文的科技創(chuàng)新因子(STIF)科技創(chuàng)新指數(shù)(STII)就可以防止科研人員隨意注加參考文獻。因為他的論文參考文獻越多就說明其論文的創(chuàng)新度越低。這時隨意標明參考文獻不僅對其自己不利,對他人也不利。因為參考文獻不準確可以影響到影響因子等(IF,SCI,SSCI,EI)指標體系的權威性,準確性。進而影響對科技成果創(chuàng)新度的評價出現(xiàn)偏離。

   第四,科技創(chuàng)新因子(STIF)與科技創(chuàng)新指數(shù)(STII)數(shù)據(jù)庫的構建對建立一套科技均衡評價體系具有一定的學術價值,其對彌補美國著名科技情報專家E.格里菲爾德(Eugene Garfield) 他提出的影響因子(IF、SCI、EI、SSCI)評價體系之不足具有重要意義。這個評價體系完全具有中國特色,如果我國今后建立了這樣一個評價體系,那么就會形成一個科技創(chuàng)新評價產(chǎn)業(yè)群,用來帶動我國信息情報事業(yè)的發(fā)展。到時候,我國可以發(fā)布各種各樣的科技創(chuàng)新因子(STIF)科技創(chuàng)新指數(shù)(STII)報告。用來認識我國各個不同時期,不同地區(qū)科技發(fā)展狀況,科技發(fā)展水平,最終有效指導我國科技資源配置。

總之,我們認為,從“科技創(chuàng)新的一般均衡規(guī)律”到“科技創(chuàng)新度定律”的提出再到“科技創(chuàng)新因子”、“科技創(chuàng)新指數(shù)”、“科技創(chuàng)新圖譜”指標體系的構建。構成了科技創(chuàng)新的一般均衡理論及其應用研究的全部內(nèi)容,這是一個符合邏輯的過程。科技成果引用率(他引率)和科技成果重復率(引他率)是科學技術創(chuàng)新過程中兩大基本力量,它們的相互作用決定了科技創(chuàng)新均衡的形成。而科技創(chuàng)新均衡則是科技創(chuàng)新的基本調(diào)節(jié)信號和杠桿,調(diào)節(jié)著科技成果引用率和科技成果重復率的平衡,促進著科技資源的優(yōu)化配置的實現(xiàn)?萍汲晒寐屎涂萍汲晒貜吐室约翱萍紕(chuàng)新度的變化相互依存,相互影響,促使科學技術創(chuàng)新過程從均衡走向非均衡再走向新的均衡。從而構成了科學技術發(fā)展過程中的核心調(diào)控機制,即科技創(chuàng)新均衡調(diào)控機制,這一調(diào)控機制則貫穿于整個科技發(fā)展的始終。這一調(diào)控機制的揭示對我國科技事業(yè)的發(fā)展,特別是對科技創(chuàng)新成果的評價以及科技資源的合理配置具有非常重要的指導意義。這個調(diào)節(jié)機制好似“無形之手”,不斷地控制和調(diào)節(jié)著科技創(chuàng)新事業(yè)的發(fā)展,但這個無形之手也不是萬能的,它也將受到來自政府“有形之手”的干預和調(diào)節(jié)。

綜上所述,作者認為科技成果創(chuàng)新度與其科技成果重復率和科技成果引用率之間具有一定的相關性。這種相關性主要表現(xiàn)為科技成果重復率越大,其創(chuàng)新性越小,重復性越小,其創(chuàng)新性越大;科技成果引用率越大,其創(chuàng)新性越大,引用率越小,其創(chuàng)新性越小。因此,科技成果重復率曲線和科技成果引用率曲線之間在數(shù)學坐標系里必然存在一個交叉點,并形成一定的均衡狀態(tài)。這個交叉點即為科技成果創(chuàng)新的均衡點,這個均衡狀態(tài)即為科技創(chuàng)新的一般均衡狀態(tài)。據(jù)此,從科學計量學上,我們可以根據(jù)這個均衡點和均衡狀態(tài)評價科技成果創(chuàng)新的程度?萍紕(chuàng)新及科技成果創(chuàng)新度評價問題不僅是一個非常重要的學術理論問題,而且也是一個非常重要的管理實踐問題。對科技成果創(chuàng)新度的評價,不僅要重視其引用率問題,而且還要重視其重復率問題,只有將這兩方面有機結合起來考慮才能更全面、更深刻地解決上述問題。目前,在我國盡管對科技成果創(chuàng)新的評價已做了大量的理論和實踐工作。諸如開展了對科技項目的立項的查新和對科技人員科研成果的引用情況進行引文分析等等,但在這些理論與實踐工作中,更重視對科技人員科技成果引用率(他引率)這個指標的觀察(諸如:SCI、SSCI、EI等),而忽視對科技人員科技成果重復率指標的分析。同時也很少從理論和實踐上將這兩項指標結合起來綜合考慮。因此,我們覺得現(xiàn)在的科技創(chuàng)新評價體系還存在一定的不足之處,即光從科技成果引用率指標體系來確定科技創(chuàng)新度的大小是不全面的,而應該將科技成果重復率(引他率)也作為衡量其創(chuàng)新度的指標之一,并找出它們之間的相關性,確定其均衡點,只有這樣才能更準確地認識科技創(chuàng)新。在我們看來科技創(chuàng)新的一般均衡理論則比較好地解決了這一問題。我們認為,科技創(chuàng)新一般均衡理論的建立對我們今后更好地揭示科學技術創(chuàng)新的本質(zhì)及其發(fā)展規(guī)律具有一定的學術意義,同時還將對今后科技資源配置優(yōu)化問題的解決產(chǎn)生一定的重要影響。因此,在我們看來建立科研人員科技成果重復率數(shù)據(jù)庫是非常重要的,它可能比建立引用率數(shù)據(jù)庫更重要,因為這是源頭,源頭不搞好,科技資源的浪費就無法得到遏制。這樣一來對整個國家科技創(chuàng)新事業(yè)的發(fā)展是極為不利的。作者認為,科技創(chuàng)新一般均衡理論及其科技創(chuàng)新評價指標的構建對我們今后更好地揭示科學技術創(chuàng)新的本質(zhì)及其發(fā)展規(guī)律,同時對今后科技創(chuàng)新成果的科學評價以及科技資源配置優(yōu)化問題的解決產(chǎn)生一定的重要影響。這個規(guī)律告訴我們,科技人員是如何通過認識世界和改造世界,并獲得大量科技知識信息。如何從一個均衡走向一個均衡過程的,不斷取得突破性進展。

這個科技創(chuàng)新一般均衡理論主要參考了阿爾弗雷德·馬歇爾(Alfred Marshall,1842—1924)的均衡價格理論,我是將科技創(chuàng)新一般均衡與一般價格均衡理論進行了類比。我們認為在科學技術文獻界也存在一個供求關系,不過這不是商品的供求關系,而是知識信息的供求關系。一方面有人供給(引用率);另一方面有人需求(重復率)。這兩者必然要形成一個均衡,這個均衡就是科技創(chuàng)新的一般均衡。這兩個均衡均在不同階段對科技創(chuàng)新以及創(chuàng)新后形成商品(科技產(chǎn)品)產(chǎn)生無形之手調(diào)節(jié)影響。但這種影響都不是萬能的,它們都要受到政府有形之手的控制和調(diào)節(jié)。因此,這兩者之間存在著緊密的聯(lián)系。科技創(chuàng)新成果,在形成的第一個階段受科技創(chuàng)新一般均衡規(guī)律無形之手的調(diào)節(jié)和控制。因為這是一個無實體的創(chuàng)新過程。在形成商品(科技產(chǎn)品)后,進入市場,就要接受市場價格供求均衡第二個無形之手的調(diào)節(jié)和控制。所以,這兩個均衡在科技創(chuàng)新過程中發(fā)揮著同等重要的作用。這個均衡分析理論我認為是繼E.加菲爾德引文分析理論之后的又一科學計量學(文獻計量學)重要分析理論,它將開辟科學計量學(文獻計量學)均衡分析的新時代。這個理論還包括需求彈性問題、科技創(chuàng)新性度彈性問題、科技文獻交叉分布問題等等。總之,經(jīng)濟學(經(jīng)濟計量學)方面遇到的問題,在科學技術學(科學計量學、信息計量學、情報計量學)中都能遇到。因此,我認為這個理論將開創(chuàng)一個科學技術學(科學計量學、信息計量學、情報計量學)新紀元。隨著全球科技化(信息化、知識化)社會的到來,科學技術學與經(jīng)濟學將會實現(xiàn)統(tǒng)一,科技計量學與經(jīng)濟計量學將會由此實現(xiàn)統(tǒng)一。因此,這也預示著一門真正意義上的嶄新學科:科技經(jīng)濟計量學(信息經(jīng)濟計量學、情報經(jīng)濟計量學)時代的到來。

 

 

  

   

總之,從洛特卡定律、布拉德福定律、齊普夫定律、普賴斯定律到加菲爾德定律再到沈氏均衡分析定律。以上這些定律并不是獨自不相關的,而是互有聯(lián)系。是科技期刊流通和管理過程研究的發(fā)展。這一發(fā)展過程與科學技術發(fā)展過程是基本一致的?茖W技術從早期的綜合混合,到中期的分散細分,再到現(xiàn)在的相互滲透、相互交叉,相互綜合,相互均衡?萍计诳陌l(fā)展過程也是這樣,從早期的綜合,到中期的專業(yè)細分化,再到現(xiàn)代的內(nèi)容相互交叉,相互滲透,相互均衡。因此,從科技期刊的管理和流通工作研究的發(fā)展上看,也是符合從集中到分散再到集中規(guī)律,從均衡到非均衡再到新的均衡。所以這些過程也是符合科學技術發(fā)展規(guī)律的。從洛特卡科學生產(chǎn)率分布定律到我的科學文獻均衡分析定律。前后兩者之間存在的必然聯(lián)系我認為都是在把科學技術活動過程當作生產(chǎn)過程來進行分析和定量的。科技文獻的生產(chǎn)過程就會遇到生產(chǎn)過剩和生產(chǎn)不足的問題和它們之間如何走向均衡問題以及科技文獻均衡如何對科技文獻生產(chǎn)過程進行有效調(diào)節(jié)。過去人們研究科技文獻的生產(chǎn)過程是局部的,非均衡的,F(xiàn)在我就是要建立一個整體性的,均衡的理論來改變這種現(xiàn)狀?茖W技術文獻均衡分析方法的建立和應用就是這方面的一種嘗試。

 

參考文獻

 

[1嚴怡民等.情報學基礎(M). 武漢:武漢大學出版社,1987.

[2] 龐景安編著.科學計量研究方法論(M).北京:科學技術文獻出版社,1999.

[3梁立明、武夷山等.科學計量學:理論探索與案例研究(M).北京:科學出版社,2006.

[4] 布勞溫等.科學計量學指標-32國自然科學文獻與引文影響的比較分析(M)趙紅洲,蔣國華譯,北京:科學出版社,1989

[5] A.馬歇爾.經(jīng)濟學原理(M.北京:商務印書館,1964.

[6] .科技創(chuàng)新的一般均衡理論--關于科技成果創(chuàng)新度評價的科學計量學分析J.科學學研究.2003年第2.

[7沈 律 沈豪.科技創(chuàng)新指標體系的構建及其科學意義--基于科技創(chuàng)新一般均衡理論的應用性研究.(J)教育科學博覽.2014(11)

[8沈 律 沈 豪.科技創(chuàng)新一般均衡理論及其應用研究對構建科技成果創(chuàng)新評價指標體系的初步探討.(J)科研雜志,2015年第25.

[9] D.Price.Science Since Babylon[M]. Now haven.1961.

[10] D.Price.Little Science,Big Science[M],Columbia University Press,1963.

[11] D.Price.Neteworks of scientific Papers[J],science,149(3683):510-515,july30,1965.

[12] D.Price .A general theory of bibliometric and other cumulative advantage processes[J]. Journal of the American Society for Information Science, 27: 292-306.1976.

[13] E.Garfield.Citation indexes for science: A new dimension in documentation through association of ideas[J]. Science. 122: 108–11.1955.

[14E.Garfield.Citation analysis as a tool in journal evaluationJ.science,178:471-479,1972.

 

作 者 說 明:

 

 《論科學計量學六大文獻分析定律--對科技文獻幾種分析理論模式研究與探討》一文是我將我的《科學計量學經(jīng)典五大定律》和《科技創(chuàng)新一般均衡理論及其應用研究》兩篇論文有機相結合寫的一篇論文。做了些刪減,也增加了一些內(nèi)容。不過很多內(nèi)容還是與上述兩篇文章有重復。

   我為什么要寫作這樣一篇論文?

   第一、我認為我的文獻均衡分析理論可能是繼經(jīng)典科學計量學理論之后又一重要理論。

   第二、我認為二十一世紀我們中國的學者也應該在科學計量學占有一席之地。

   第三、我認為我的文獻均衡分析理論可以解決一些長期被人們所忽視的科技創(chuàng)新指標問題。

 

 

責編:微科普網(wǎng)

分享到:

>相關科普知識

日本女v片一区二区,公侵犯人妻一区二区,国产亚洲中文日本不卡2区,91久国产成人在线观. www.sucaiwu.net