高壽仙
中國的人文社會科學評價正在矛盾中向前行進:一方面,出現(xiàn)了越來越多的評價機構,推出了越來越多的評價體系,而且這些評價體系被越來越多的學校和科研單位視為決定刊物等級和論文水平的最重要甚至唯一的標準;另一方面,圍繞各種評價體系的爭議和質疑持續(xù)不斷,而且批評和否定的聲音似乎有越來越強的趨勢。其實,任何一種評價方法和指標體系,都各有優(yōu)勢又各有局限,盡管可以不斷加以改進,但永遠也不可能盡善盡美,關鍵是要對這些方法和指標有一個客觀準確的認識,用其所長而不求全責備。
評價對象 :文、刊、人、機構
在職稱評定中,科研成果的計量指標當然十分重要,但未必是決定性的,主要還是以專家評議為核心的定性評價,是對一位學者學術水平和素質的綜合考量。
筆者認為,就人文社會科學的評價對象而言,大致可以分為四類,即文、刊、人、機構,評價不同對象需要不同的方法。學術機構評價涉及因素較多,本文暫不討論,只針對前三類對象略作述評。“評文”,即對某一論文或專著的評價。這種評價應用場合最為廣泛。如學術期刊審閱遴選稿件,就是其中之一,過去主要依靠專職編輯,近年越來越重視發(fā)揮同行專家的作用。有的期刊建立了雙向匿名評審制度,這種制度雖然不能保證所用稿件都是優(yōu)秀的,但可以有效防止人情稿、關系稿,保住質量底線。各種類型的科研成果評獎,大多也是采用同行評議的方式。“評文”的具體標準,各個單位和場合不盡相同,但大致原則是相通的。同行評議指標又分為主要指標和輔助指標,前者包括學術創(chuàng)新程度、論證完備程度、社會價值、難易程度四項,后者包括課題立項、發(fā)表載體兩項;文獻計量指標包括三項,即Web下載頻次、被他引頻次、被轉載次數。這套指標體系較為合理,可操作性較強,雖為評價論文設計,實際也適用于專著。例如,期刊選用稿件時,可參用同行評議的四項主要指標;科研成果評獎時,則可以定性評價與定量評價相結合,完整使用這個指標體系。
“評刊”,即對某一學術期刊的評價。國內現(xiàn)有的幾種核心期刊的評價方法均以定量評價為依據、專家定性評審為補充,定量指標有繁有簡,但大同小異,包括被引率、轉摘率、Web下載率、影響因子等。CSSCI來源期刊則主要以“他引影響因子”和“總被引頻次”這兩個定量數據為依據。前不久中國社會科學院中國社會科學評價中心發(fā)布的《中國人文社會科學期刊評價報告(2014)》,將入選期刊分為頂級、權威、核心、擴展四個等級,評價指標分為“吸引力”、“管理力”、“影響力”三大系列,幾乎囊括了學術期刊所能涉及的所有方面,有望成為一種最具影響力的評價體系。此外,政府相關部門遴選的幾種期刊名單,如教育部的“高校哲學社會科學名刊”、國家哲學社會科學規(guī)劃辦公室的“國家社科基金資助學術期刊”、新聞出版廣電總局的“百強社科期刊”,以及全國高等學校文科學報研究會評出的“社科名刊”、“精品社科期刊”等,也是對期刊的評價,評定時均參考了核心期刊和來源期刊的數據。
“評人”,即對某一學者的評價。在各種學術機構或學術圈子里,這種評價是一種日常性的存在,但大多是印象式的。某學者得到的同行評價的高低,與其發(fā)表的論著數量,以及發(fā)表刊物的檔次和出版單位的級別,肯定會有一定關系,但并非都是正相關的。制度化的評人,在職稱評定中表現(xiàn)得比較典型。目前,不少單位要求申報者提交兩三種“代表成果”,然后請相關專家進行匿名評審,最后由本單位的職稱評審委員,根據專家評審意見和本人素質綜合考量,投票產生晉升者。在職稱評定中,科研成果的計量指標當然十分重要,但未必是決定性的,主要還是以專家評議為核心的定性評價,是對一位學者學術水平和素質的綜合考量。此外,像中國人民大學“吳玉章人文社會科學終身成就獎”那樣的獎項,旨在表彰在人文社會科學領域作出卓越貢獻的學者,是對一位學者的學術成就和貢獻的綜合性評價,也屬于“評人”的范疇。
評價過程
根據目的選用適宜的方法和指標
盡管學術評價多種多樣,就評價手段而言,無外乎兩種,即依靠“人腦”的“專家評議”和依靠“電腦”的“文獻計量”。
各種學術評價的目的不同,評價指標和方法自然有異。學者們在評論各種評價體系時,也應首先把握其特點和功能。比如,“核心期刊”是一個文獻計量學概念,其功能是以學科分類為基礎,篩選出一批發(fā)表學科論文較多、使用率較高、學術影響較大的期刊,但“不具備全面評價期刊優(yōu)劣的作用,不能作為衡量期刊質量的標準,更不能作為學術評價的標準”;而CSSCI則是一個引文數據庫,“用來檢索中文人文社會科學領域的論文收錄和被引用情況”,顯然也不是對期刊的全面綜合評價。有些批評者指責某核心期刊或來源期刊中的某些論文質量不高,要求這些評價機構能夠甄別低質量的學術論文,甚至全盤否定這些評價體系存在的價值,這就是不顧它們的本來功能,要求它們發(fā)揮不可能做到的作用。順便說明,因為受到諸多批評,各評價機構紛紛表示要增強學科專家作用,但在這種以計量為核心的評價體系中,學科專家只能起到有限度的、輔助性的矯正作用,否則就會削弱這些體系的客觀性和科學性,也影響其原本功能的發(fā)揮。目前,只有中國社會科學院中國社會科學評價中心設計的指標體系,可以算得上是對期刊的全面綜合評價,但其中有些指標,如“編輯人員的創(chuàng)新水平、敬業(yè)精神”,“名譽顧問、編委會成員等關系網絡圖”,等等,怎樣準確測量和評估,還需要下大力氣研究。
目前最受人詬病的,可能是科研管理部門“以刊評文”,一些對核心期刊和來源期刊的批評也是由此連帶引起的。這個問題也要分不同層面來看。首先,科研管理部門針對科研成果制定的計分標準和激勵政策,實際上只是常規(guī)性的科研管理,而并非對成果質量的評價。因為一個單位的科研成果,往往分屬多個學科,形式多樣,數量眾多,由任何人、通過任何程序,都不可能給所有成果確定一個準確的分值,科研管理部門只能確定一個大致合理的標準,而核心期刊和來源期刊無疑是最為合適的參照依據。其次是“評文”場合,有些單位機械地以發(fā)表刊物是否核心、入選幾個核心為依據,確定論文獲獎檔次,這才屬于對核心期刊的誤用,因為核心期刊上也會有劣文、非核心期刊上也會有良文,這種場合應以專家的定性評議為主。再次是“評人”的場合,現(xiàn)在很多單位都規(guī)定,必須在某檔次的核心期刊發(fā)表若干篇論文才具備申報某級職稱的資格。在“僧多粥少”的情況下,這種限制并非全無道理,但實際上也是對核心期刊的誤用,最好還是不預設門檻,通過專家評議確定申報者的學術水平。
盡管學術評價多種多樣,就評價手段而言,無外乎兩種,即依靠“人腦”的“專家評議”和依靠“電腦”的“文獻計量”。兩種方法各有利弊:“人腦”的長處在于“專業(yè)性”,由具有相近專業(yè)背景的同行進行評議,對成果的創(chuàng)新程度可以做出更加準確的判斷,而其短處在于“主觀性”,個人的知識儲備、價值觀、情感等,都可能影響到評價結果;“電腦”的長處在于“客觀性”,只要設定了相應的檢索條件,就可以得到一系列客觀數據,而其短處在于“機械性”,它能統(tǒng)計數量卻無法判斷質量,被引用或摘轉頻次相同的兩篇文章可能學術含量差別很大。因此,在進行學術評價或者對學術評價體系進行評價時,必須根據評價目的選用適宜的方法和指標,不能“以驢唇去對馬嘴”,也不能“把牛頭安到馬身上”。
(文章來源:《中國社會科學報》2015年03月11日 第712期 作者系北京行政學院校刊編輯部主任、《新視野》主編 )