【李貝的回答(8票)】: 如何確定某一(學(xué)科)領(lǐng)域的核心作者?我覺(jué)得每一個(gè)科技工作者都有一套自己獨(dú)特的方法和經(jīng)驗(yàn)法則。在這里,我主要是想介紹一下涉及到的“文獻(xiàn)計(jì)量學(xué)”這門(mén)學(xué)科的概念、一些主要理論、方法以及它在確定核心作者方面的應(yīng)用。 1.文獻(xiàn)計(jì)量學(xué)的由來(lái)和概念 最早的文獻(xiàn)計(jì)量研究始萌于20世紀(jì)初,以1917年由文獻(xiàn)學(xué)家科爾(F.T. Cole)和伊爾斯(N. B. Eales)所進(jìn)行的文獻(xiàn)統(tǒng)計(jì)研究為起點(diǎn)的。1922年,英國(guó)圖書(shū)館學(xué)家休姆(E. W. Hulme)在其編著的《統(tǒng)計(jì)目錄學(xué)與現(xiàn)代文明增長(zhǎng)的關(guān)系》一書(shū)中首次使用了“統(tǒng)計(jì)目錄學(xué)”(Statistical Bibliography)的名稱(chēng)。它代表的是:為了探明圖書(shū)資料的特性,常使用統(tǒng)計(jì)方法,從而產(chǎn)生的書(shū)目學(xué)的一個(gè)新的分支學(xué)科。1969年,英國(guó)著名情報(bào)學(xué)家阿倫·普理查德(Alan Pritchard)首次提出用術(shù)語(yǔ)Bibliometrics取代“統(tǒng)計(jì)目錄學(xué)”的名稱(chēng)。他的建議很快得到圖書(shū)館學(xué)、情報(bào)學(xué)界的普遍承認(rèn)。這一術(shù)語(yǔ)的出現(xiàn)標(biāo)志著文獻(xiàn)計(jì)量學(xué)的正式誕生。 在這里,我們對(duì)“文獻(xiàn)計(jì)量學(xué)”定義的概念的是:以文獻(xiàn)或文獻(xiàn)相關(guān)媒介為研究對(duì)象,采用數(shù)學(xué)、統(tǒng)計(jì)學(xué)等的計(jì)量方法,研究文獻(xiàn)和文獻(xiàn)工作系統(tǒng)的規(guī)律與科學(xué)管理,以及探討科學(xué)技術(shù)動(dòng)態(tài)特征的一門(mén)科學(xué)。(邱均平,1985) 2.文獻(xiàn)計(jì)量學(xué)中主要的理論和方法 ①文獻(xiàn)作者分布規(guī)律——洛特卡定律 洛特卡定律(Lotka’s Law)揭示了科學(xué)生產(chǎn)率,以及作者與論文之間的數(shù)量關(guān)系。 20世紀(jì)是人類(lèi)歷史上輝煌的一頁(yè),這不僅表現(xiàn)在科學(xué)發(fā)展的快速,同時(shí)體現(xiàn)在科學(xué)領(lǐng)域更為深廣的方向發(fā)展。20世紀(jì)初以來(lái),全世界的科學(xué)文獻(xiàn)呈現(xiàn)倍增態(tài)勢(shì),科技期刊的增長(zhǎng)也在加劇??萍计诳脑鲩L(zhǎng)造成了文摘雜志的相應(yīng)增加。文摘雜志為適應(yīng)這一發(fā)展,其結(jié)果是出版日益規(guī)范化,如普遍設(shè)立作者索引,這一變化引起學(xué)者對(duì)文獻(xiàn)規(guī)律研究的廣泛興趣。1926年,當(dāng)時(shí)供職于保險(xiǎn)公司的洛特卡,在美國(guó)著名期刊《華盛頓科學(xué)院學(xué)報(bào)》上,發(fā)表了題為《科學(xué)生產(chǎn)率的頻率分布》(The Frequency Distribution of Scientific Productivity)一文。在該文中,洛特卡從科學(xué)文獻(xiàn)作者與其撰寫(xiě)的論文的紛亂現(xiàn)象中發(fā)現(xiàn)了“平方反比”的數(shù)量關(guān)系,提出了至今被人稱(chēng)為“經(jīng)典的”洛特卡定律,從而成為文獻(xiàn)計(jì)量學(xué)中最早的一個(gè)著名定律。 在收集數(shù)據(jù)的過(guò)程中,洛特卡采用了化學(xué)和物理兩個(gè)領(lǐng)域文獻(xiàn)載體中的數(shù)據(jù)。這是因?yàn)榛瘜W(xué)和物理學(xué)是20世紀(jì)發(fā)展速度最快、最全面的兩個(gè)學(xué)科,他們能夠全面地反映科學(xué)發(fā)展的整個(gè)過(guò)程。洛特卡選擇美國(guó)《化學(xué)文摘》和德國(guó)奧爾巴赫《物理學(xué)史一覽表》為數(shù)據(jù)源研究科技工作的論著數(shù)量分布。他統(tǒng)計(jì)分析了《化學(xué)文摘》1907-1916年10年累積索引中的部分作者,即姓氏以字母A和B開(kāi)頭的6891位作者。分別列出發(fā)表過(guò)1篇,2篇,一直到346篇論文的人數(shù)?!段锢韺W(xué)史一覽表》包括了1900年前物理學(xué)領(lǐng)域內(nèi)出現(xiàn)的1325位物理學(xué)家及其論著,取其全部數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。 利用上述數(shù)據(jù),洛特卡以論文數(shù)(
)和作者數(shù)(
)的對(duì)數(shù)為橫坐標(biāo)和縱坐標(biāo)作圖,兩組數(shù)據(jù)都是直線(xiàn)(如圖1所示)。圖中虛線(xiàn)表示《化學(xué)文摘》數(shù)據(jù),實(shí)線(xiàn)代表《物理學(xué)史一覽表》的數(shù)據(jù)。用最小二乘法計(jì)算擬合直線(xiàn)的斜率,近似為-2。
洛特卡分布曲線(xiàn)圖 根據(jù)洛特卡分析,在論文數(shù)
和作者數(shù)
之間,存在著下列一種關(guān)系:
上式中,
是發(fā)表了論文
篇的作者數(shù),n和c是對(duì)應(yīng)于這一典型數(shù)據(jù)集合而估計(jì)出來(lái)的兩個(gè)常數(shù),n的數(shù)值在2上下波動(dòng)。具體到洛特卡統(tǒng)計(jì)的實(shí)例,指數(shù)n近似為2.0。于是上式可改為:
因此,洛特卡定律的最原始表述是:在某一時(shí)間段內(nèi),寫(xiě)了篇論文的作者數(shù)量占作者總數(shù)的比例與其所撰寫(xiě)的論文數(shù)的平方成反比。這也就是文獻(xiàn)計(jì)量學(xué)中經(jīng)典的“平方反比定律”。早期的洛特卡定律對(duì)于高產(chǎn)作者數(shù)據(jù)采取的是刪除處理,同時(shí)也不能反映合作者與科學(xué)論文之間的關(guān)系。后來(lái)的學(xué)者們?cè)诼逄乜ǘ傻幕A(chǔ)上對(duì)其做了深度和廣度的拓展。 美國(guó)著名的科學(xué)史學(xué)家普賴(lài)斯(PriceD.S.)首先注意到,文獻(xiàn)作者分布領(lǐng)域內(nèi)高產(chǎn)作者研究的重要性。他在研究中發(fā)現(xiàn),有75%的科學(xué)家一生只發(fā)表了一篇論文,而另有10%的科學(xué)家在其一生中所發(fā)表的論文占所有論文的一半。這有些類(lèi)似于管理學(xué)領(lǐng)域常說(shuō)的“二八定律”或者“二八分布”。普賴(lài)斯在1969年發(fā)表的《小科學(xué),大科學(xué)》一書(shū)中指出,撰寫(xiě)全部論文一半的高產(chǎn)作者的數(shù)量,等于全部作者總數(shù)的平方根。 ②引文分析與h指數(shù) 在科學(xué)文獻(xiàn)體系中,科學(xué)文獻(xiàn)之間并不是孤立的,而是相互聯(lián)系的??茖W(xué)文獻(xiàn)的相互關(guān)系突出地表現(xiàn)在文獻(xiàn)之間的相互引證方面。 首先,應(yīng)明確“參考文獻(xiàn)”和“引證文獻(xiàn)”兩個(gè)術(shù)語(yǔ)在概念上的區(qū)別。普賴(lài)斯在論及引證及被引證關(guān)系時(shí)曾建議:每一篇被引文獻(xiàn),對(duì)于引證者(論文作者)來(lái)說(shuō),就是有了一篇參考文獻(xiàn)(Reference),而對(duì)于被引證者(引用作者),則是有了一篇引證文獻(xiàn)(Citation)例如,本文引證了普賴(lài)斯的一篇文章中的一段話(huà),那么我們便有了一篇參考文獻(xiàn);而對(duì)于普賴(lài)斯來(lái)說(shuō),就是有了一篇引證文獻(xiàn)。 所謂引文分析(Citation Analysis),就是利用各種數(shù)學(xué)及統(tǒng)計(jì)學(xué)的方法和比較、歸納、抽象、概括等邏輯方法,對(duì)科學(xué)期刊、論文、著者等各種分析對(duì)象的引證與被引證現(xiàn)象進(jìn)行分析,以便揭示其數(shù)量特征和內(nèi)在規(guī)律的一種文獻(xiàn)計(jì)量分析方法。(邱均平,1988) 2005年,美國(guó)科學(xué)家Hirsch提出用h指數(shù)來(lái)測(cè)評(píng)核心科學(xué)家,開(kāi)創(chuàng)了學(xué)術(shù)評(píng)價(jià)新指標(biāo),立即引起了學(xué)術(shù)界的廣泛興趣和高度關(guān)注。Hirsch將h指數(shù)定義為:一位作者的h指數(shù)等于其發(fā)表了h篇至少被引h次的論文,即一個(gè)作者的h指數(shù)表明其至多有h篇論文被引用了至少h次。一般認(rèn)為,h指數(shù)越高的科學(xué)家在其學(xué)科領(lǐng)域的影響力越大。 h指數(shù)的計(jì)算方法是:將作者發(fā)表的所有科學(xué)論文按被引次數(shù)從高到低排序,從前往后查找排序后的列表,直到某篇論文的序號(hào)大于該論文被引次數(shù),所得序號(hào)減1即為h指數(shù)。需要注意的是,h指數(shù)的計(jì)算依賴(lài)于引文數(shù)據(jù)庫(kù)的選擇,由于不同引文數(shù)據(jù)庫(kù)的來(lái)源期刊數(shù)量和期刊的學(xué)科結(jié)構(gòu)差異較大,因此某個(gè)科學(xué)家的h指數(shù)會(huì)因?yàn)樗x取的數(shù)據(jù)庫(kù)的不同而有所變化,不同學(xué)科間的學(xué)者的h指數(shù)也有較大差異。 3.文獻(xiàn)計(jì)量在確定核心作者方面的一些應(yīng)用 美國(guó)《基本科學(xué)指標(biāo)》(EssentialScience Indicators, ESI)是由世界著名的學(xué)術(shù)信息出版機(jī)構(gòu)美國(guó)科學(xué)情報(bào)研究所(Institute For Scientific Information, ISI)“研究服務(wù)組”于2001年推出的衡量科學(xué)研究績(jī)效(現(xiàn)為國(guó)際著名的學(xué)術(shù)信息出版提供商“湯森-路透集團(tuán)”)、跟蹤科學(xué)發(fā)展趨勢(shì)的基本分析評(píng)價(jià)工具,是基于SCI(科學(xué)引文索引數(shù)據(jù)庫(kù))和SSCI(社會(huì)科學(xué)引文索引數(shù)據(jù)庫(kù))而建立的計(jì)量分析數(shù)據(jù)庫(kù)。ESI從引文分析的角度,針對(duì)22個(gè)專(zhuān)業(yè)領(lǐng)域,分別對(duì)國(guó)家、研究機(jī)構(gòu)、期刊、論文以及科學(xué)家進(jìn)行統(tǒng)計(jì)分析和排序。 在科學(xué)家排名中,運(yùn)用的是引文排位(CitationRankings)的思想。被引頻次是同行認(rèn)知的一種形式,通常反映的是科研群體對(duì)于科學(xué)家的依賴(lài)程度。所以可以理解為:高被引科學(xué)家形成科研群體的實(shí)質(zhì)核心。 4.文獻(xiàn)計(jì)量的一些問(wèn)題 引用行為是一種社會(huì)心理過(guò)程的反映,文獻(xiàn)被引與否不完全取決于文獻(xiàn)本身對(duì)知識(shí)的貢獻(xiàn),而是必然地受到作者學(xué)術(shù)地位和發(fā)表平臺(tái)的學(xué)術(shù)聲望等社會(huì)因素的影響。因此,目前學(xué)術(shù)界對(duì)引用關(guān)系能夠取得的共識(shí)是:引用關(guān)系體現(xiàn)的是文獻(xiàn)之間的相關(guān)關(guān)系,被引次數(shù)可以反映出文獻(xiàn)的被關(guān)注程度。被關(guān)注的文獻(xiàn)就像新聞熱點(diǎn)一樣,在一個(gè)時(shí)間段內(nèi)會(huì)被廣泛述及、討論、引用,該文獻(xiàn)的質(zhì)量及其對(duì)知識(shí)的貢獻(xiàn)度仍然有待歷史的檢驗(yàn)。
5. Reference [1]王崇德. 科學(xué)論文作者的研究[J]. 情報(bào)學(xué)報(bào), 1982, 2: 220-224. [2]邱均平. 關(guān)于“文獻(xiàn)計(jì)量學(xué)” 術(shù)語(yǔ)及其定義[J]. 圖書(shū)情報(bào)知識(shí), 1985,3: 007. [3]邱均平.文獻(xiàn)計(jì)量學(xué)[M].北京:科技文獻(xiàn)出版社,1988. [4]葉鷹. h 指數(shù)和類(lèi) h 指數(shù)的機(jī)理分析與實(shí)證研究導(dǎo)引[J]. 大學(xué)圖書(shū)館學(xué)報(bào), 2008 (5): 2-5. [5]姜春林, 劉則淵, 梁永霞. H 指數(shù)和 G 指數(shù)——期刊學(xué)術(shù)影響力評(píng)價(jià)的新指標(biāo)[J]. 圖書(shū)情報(bào)工作, 2007, 50(12): 63-65. [6]ESI簡(jiǎn)介:http:///ESI[EB/OL].檢索時(shí)間:2014年9月9日. [7]中國(guó)134名科學(xué)家入選全球“高被引科學(xué)家”: http://news.sciencenet.cn/htmlnews/2014/8/302417.shtm[EB/OL].檢索時(shí)間:2014年9月9日. [8]劉宇.引文首先是一種修辭工具.檢索時(shí)間:2014年9月9日. [9] 張曉林:如何看待全球高被引用率排名: http://news.sciencenet.cn/htmlnews/2014/8/301497.shtm. [EB/OL].檢索時(shí)間:2014年9月9日. 原文地址:知乎 |
|