中國網/中國發展門戶網訊 破“四唯”后如何立“新標”,這是當前科技評價改革的熱點和難點問題,迫切需要有好的理論和方法支撐。對此,文章主要針對科研人員成果評價提出 BRIDGE 理論,即將要“破”的以 SCI 論文為主的量化評價中合理的要素結合進要“立”的以同行評議為主的“新標”里,從而架起了定量分析與定性評價之間的“橋梁”。BRIDGE 理論的實際應用表達為“六步法”;其汽車零件報價中,第二步(recode)與第三步(insight)兩個關鍵步驟實現了以定量分析為基礎的分層的專家評保時捷零件議。BRIDGE 理論是對定量定性相結合評價理論與方法的重要發展,應用前景廣泛。
問題的提出
破“四唯”是 2018 年以來我國科技評價改革的重大舉措。一方面,破“四唯”受到科研人員的歡迎。另一方面,科研人員也有擔心,“破”完之后“立”什么?同行評議中的人情關系會不會又回來了?目前,“四唯水箱精”狀況還沒有根本扭轉。原因有多種Skoda零件,有科研文化、誠信、科研水平等方面原因,也有科技評價方法上的原因,即現在還沒有建BMW零件立起行之有效且適用性好的“新標”。相對而言,代表作制是破“四唯”以來被廣為提倡的一種比較有效的“新標”。但是,該方法作用也有限。代表作制本質上是一種同行評議方法,是在同行評議中限定了科研人員提交的作為評價對象的成果的數量。總的來說,單一的同行評議方法還無法在科技評價實踐中全面推廣。例如,高校和科研機構通常以年為周期的科研人員績效評價就難以直接采用同行評議方法——除了成本過高,更主要是難以保證公正性。
以“唯論文”為主體的“四唯”集中表現在高校和科研機構的科技人才成果評價上。可以說,科技人才的成果評價是“三評”改革和破“四唯”的“牛鼻子”。因此,當前科技評價改革的關鍵是在科技人才的成果評價上立“新標”,使得這場包括科技界在內的各界期盼的破“四唯”行動的目標能夠真正落實。對此,2021 年《國務院辦公廳關于完善科技成果評價機制的指導意見》(國辦發〔2021〕26 號)印發,并部署 50 余家單位開展試點。隨后,2022 年 6 月中央全面深化改革委員會第二十六次會議審議通過《關于開展科技人才評價改革試點的工作方案》。不難看出,這 2 項最新的科技評價改革文件的結合點恰好是科技人才成果評價。2022 年 6 月 27—28 日賓士零件,中國科學院召開全院人才工作會議,布局了在院層面和研究所層面共同推動以解決“唯論文”為重點的科技人才評價改革,亦即以科技人才成果評價汽車零件貿易商為重點。
兵馬未動,糧草先行。如何攻克高校和科研機構科技人才成果評價改革這個關鍵堵點?本文試圖就此問題提出一套理論與方法;基本思路是從要“破”的方法中尋找合理要素,并將這些合理的要素結合進要“立”汽車空氣芯的“新標”里,從而架起“破”與“立”的橋梁來。
破“四唯”:破什么和留什么
兩種不同觀點
毫無疑問,論文、人才稱號(包括學歷、職稱等)、獎勵等指標都是科研活動,因而也是科技評價中的重要指標。“四唯”的問題關鍵在“唯”,即簡單地以這些指標加和計算得到的分值代表科研人員的績效。在高校和科研機構的科技評價中,論文指標起著基礎性作用,人才稱號、獎勵等往往也是對論文優勝者的認可。因此,“四唯”評價可以被稱為以 SCI 論文為主的量化評價福斯零件,而破“四唯”主要就是破以 SCI 論文為主的簡單量化評價。
從 SCI 起源看,20 世紀 60 年代,在布拉德福(Bradford)文獻離散律理論、加菲爾德(Garfield)引文分析理論等的基礎上,美國科學信息研究所(ISI)推出科學引文索引(SCI)期刊。SCI 論文就是指刊登在 SCI 期刊上的論文。在我國,SCI 論文作為評價科研人員績效的指標興起于 20 世紀 90 年代初,并很快被高校、科研機Porsche零件構、政府管理部門等廣泛采用,以替代 20 世紀 80 年代興起的在科技成果評價中出現較大爭議的同行評議。
目前,以 SCI 論文為主的量化評價問題日益顯現,破“四唯”成為共識。但是,如何破?目前大致有兩種不同觀點。第一種觀點為“全盤否定論”,認為現有以 SCI 論文為主的量化方法根本上就錯了,無藥可治,應立刻廢止。第二種觀點為“謹慎否定論”,認為現有量化方法在當時歷史條件下是起了積極作用的,有其合理性,不能全盤否定。
以上兩種觀點的差異主要在于,如何看待文獻計量方法等量化方法在科技評價中的作用,即:文獻計量方法等量化方法在科技評價中是被用錯了?還是本藍寶堅尼零件來就不能用?
誠然,基礎科學研究成果“只有第一,沒有第二”,其原創性成果的價值難以量化,只有同行評議才是“科研評價黃金法則”。例如,德國馬普學會等頂尖科研機構的評價一般是直接采用同行評議方法。從這個角度看,“全盤否定論”是對的。但是,這種觀點過于理想主義,與我國國情不符。我國目前還難以Audi零件滿足大規模直接采用同行評議所需要的前提條件,原因包括高水平同行專家數量有限、評價文化中人情因素較重、科研成果原創性水平整體普遍較低等。貿然采用,可能重回 20 世紀 80 年代問題叢生的同行評議的老路。從現實主義角度看,“謹慎否定論”承認文獻計量學方法在科技評價中的作用,有一定合理性。
基于以上分汽車材料報價析,本文的觀點是:以 SCI 論文為代表的量化方法是被用錯了,簡單量化評價的方法必須要破;但是,量化方法特別是文獻計量學方法有其自身合理性,如果使用得當,仍然可以在科技評價中發揮重要作用。文獻計量方法在科技評價中的合理性主要表現在 3 個方面:①盡管文獻計量方法存在缺陷,但該方法是具有斯柯達零件統計學意義的。②文獻計量學作為一門學科本身也在發展,有望為科技評價提供更好的支撐。③有可能在已有文獻計量方法基礎上探索出一條定量與定性評價有效結合的新路。
科技評價中應用文獻計量方法的已有探索
從 20汽車冷氣芯 世紀 90 年代初到現在,國內外高校、科研機構和政府科研管理部門在科技評價中應用文獻計量方法的探索已有近 30 年,這些探索仍然是有價值的。以下介紹 5 種在科技評價中用到的以影響因子為主遴選得到的主要期刊目錄體系。
中國科學院文獻情報中心在 2004 年推出期刊分區表。通過對近 3 年平均影響因子進行降序排列,結合專家評議,對 ISI 發布的自然科學版(SCI)、社會科學版(SSCI)期刊引證報告(JCR)中收錄的中國期刊進行 1—4 區的劃分。該期刊分區表目前在國內高校和科研機構內部評價中應用較為普遍。
中國科學院評估研究中心在 2003 年構建了研究所評價中的高影響因子期刊目錄。在 JCR 劃分的 170 余Benz零件個小學科中,遴選出前 15% 的 SCI 期刊作為高影響因子期刊。在研究所評價中,刊登在高影響因子刊物上的論文記為高影響力論文。每篇高影響力論文的分值為:該篇高影響力論文所在期刊的影響因子與所在 JCR 小學科中 SCI 期刊的平均影響因子的比值。該期刊目錄主要應用于中國科學院知識創新工程時期的研究所評價。
《中文核心期刊要目總覽》(北大中文核心期刊)。始于 1992 年,由北京大學圖書館聯合眾多學術界權威專家鑒定,主要采用定量評價和定性評審相結合的辦法。目前,其定量評價指標采用了被摘量(全文、摘要)、被摘率(全文、摘要)、被引量、它引量(期刊、博士論文)、影響因子、它引德系車材料影響因子、5 年影響因子、5 年它引影響因子、特征因子、論文影響分值、論文被引指數、互引指數、獲獎或被重要檢索系統收錄、基金論文比(國家級、省部級)、Web 下載量、Web 下載率等 16 個評價指標。北大中文核心期刊是國內最早的核心期刊體系之一,在國內高校的應用較為普遍。
美國得克薩斯大學達拉斯分校(The University of Texas at Dallas)界定的 24 本運籌管理學頂級期刊目錄(UT-Dallas24)。該目錄包含了目前國際上運籌管理學最高科研水平的頂級期刊。該目錄也是國家自然科學基金委員會管理科學部、教育部管理學科等人才計劃項目評選的參考依據。
英國商學院協會(ABS)出版的《高質量學術期刊指南》(Academic Journal Quality Guide)。該指南綜合了出版物的審稿意見、編輯和專家評估意見,以及引文相關的統計信息,被認為是商業和管理學者發表研究期刊的范圍和質量的指南。通常獲評 3星及以上的期刊,稱得上“高質量期刊”。事實上,在 3 星及以上期刊上發表論文,是在英國高校擔任senior lecturer(類似副教授)的條件之一。
以上介紹的只是國內外在科技評價中應用文獻計量方法的幾個影響較大的案例。事實上,我國各高校、科研機構及其下屬研究單元在這方面還有大量結合自身特點的探索。如何吸收這些實踐經驗、用好這些資源,在破“四唯”、立“新標”中物盡其用至關重要。
立“新標”:BRIDGE 理論及其六步法
BRIDGE 理論的提出
“新標”如何立?是將原有以 SCI 論文為主的量化評價完全舍棄后,另辟蹊徑嗎?單一的同行評議方法會是正確的選擇嗎?這些問題迫切需要在理論上給出解答。基于前文分析,本文提出了 BRIDGE 理論(或稱“橋理論”),作為如何立“新標”的理論之一。BRIDGE 理論的核心思想有 4 點。
(1)單一的同行評議方法不是最有效的方法。尤其對于我國而言,由于高水平同行專家資源有限且人情關系過多,單一的同行評議方法不可能是合適的“新標”。如強行采用,可能重回 20 世紀 80 年代問題叢生的同行評議的老路。
(2)以 SCI 論文為代表的文獻計量方法是被用錯了,必須“奧迪零件破”。但是,以 SCI 論文為主的量化評價有可以留用的合理要素;在科技評價中,應用文獻計量方法的 30 多年的實踐探索仍然可以在科技評價中發揮重要作用。
(3)立“新標”就是將已有量化方法的合理要素結合進要“立”的同行評議方法中。形象地講,就是架起定量評價與定性評價之間的“橋梁”,從而逾越科技評價改革“汽車材料破”與“立”的“鴻溝”,也實現了同行評議的理想需求和現實供給之間的平衡。
(4)BRIDGE 理論本質上是關于如何在定量分析基礎上開展定性評價的理論,是對定量與定性相結合評價方法的發展。BRIDGE 理論的一端聯結定量評價方法,強調評價要將采集到的數據、證據、信息等材料按一定規則轉化為可比較、可使用的數據表單,盡量約束單一的定性評價中利益關系的干擾,從而體現了循證決策理念。BRIDGE 理論的另一端聯結定性評價方法,強調研究的質量,強調戰略研究目標的達成,一方面避免定量評價簡單、機械的缺點,另一方面發揮已有量化方法的合理要素的作用。
BRIDGE 理論的六步法
BRIDGE 理論不僅僅停留在理念上,更主要是可以應用在實際操作上,其在實際科技評價中的應用主要包括 6 個步驟,稱為“六步法”。即,保持績效評價體系的平衡性(balance)、按照編碼體系得到成果的量化分析結果(recode)、實行高階成果的同行專家評價(insight)、設立申訴和異議處理機制(dissent)、發揮 A+ 的成果的榜樣作用(guide)、各司其職形成優秀人員名單(ecology),這 6 個步驟的英文關鍵詞首字母構成“BRIDGE”。以高校和科研機構科研人員績效評價(一般稱為年度考核)中的成果評價為例,對六步法簡介如下。
第一步:保持績效評價體系的平衡性(balance)。科研人員績效評價體系要符合單位的使命和戰略,要保持評價體系及其標準在長期目標和短期目標之間、單位自身發展與外部競爭之間、科研成果的多元價值屬性之間,以及科研水平上的平衡。可參考“平衡記分卡”的管理理念。
第二步:按照編碼體系得到成果的量化分析結果(recode)。構建不同類型科研成果不同的編碼體系,編碼體系從高階到低階有不同等級標準和對應數值。論文的編碼體系一般是由基于文獻計量方法分析得到并被單位科研人員共同認可的期刊目錄。例如,有的單位采用中國科學院文獻情報中心的期刊分區表作為論文編碼體系之一。根據科研人員填報的成果信息或單位評價工作小組自行搜集到的成果信息,將每一項成果在相應的編碼體系中轉化為分值,得到定量分析結果。
第三步:實行高階成果的同行專家評價(insight)。通過編碼體系得出從高階到低階的成果排序;將排序中高階成果(A 級成果)交由專家評議,經專家評議遴選出 A+ 級成果名單。在開展高階成果專家評議時,單位評價工作小組還應盡量提供科研成果在學術影響、經濟效益、社會效益等方面的非編碼體系的信息,以增加專家評議的客觀性。為節約使用專家資源,排序中非高階的成果可不進行專家評議。
第四步:設立申訴和異議處理機制(dissent)。考慮到科學研究原創性成果難以計量,以及科學研究的不確定性等特殊性,允許科研人員對按照編碼體系得出的定量分析結果為非高階但科研人員認為質量影響達到高階的成果提出申訴;經單位評價工作小組審核通過后,可與高階成果一起納入同行專家評議。
第五步:發揮 A+ 的成果的榜樣作用(guide)。采用臺北汽車零件網上宣傳報道、組織學術會議報告、在宣傳欄張貼等多種形式,公開展示被評為A賓利零件+的成果;從而在體現評價透明性的同時,發揮 A+ 成果的榜樣和導向作用。
第六步:各司其職形成優秀人員名單(ecology)。開展科研人員績效評價需要同行專家、單位管理專家等利益相關方構成有序分工的良好生態:前者負責把握學術質量,后者負責把握管理需要。以此,同行專家評價得到的 A+ 結果可作為評優的必要條件;再根據管理需要,確定評優需要具有的 A+ 的數量、A+ 成果背后的指標權重關系,以及需要考慮的其他相關汽車零件因素,最終得出優秀人員名單。另外,在前步成果評級基礎上,可由單位評價工作小組根據管理需要形成科研人員績效評價的其他結果名單。
六步法的每步都很重要,相得益彰。要做好科技評價,每步都不應該缺。但是,對 BRIDGE 理論獨特優勢而言,不同步驟之間是有差別的。其中,最體現 BRIDGE 理論優勢的是第二步(recode)和第三步(insight)。這 2 步體現了以定量分析為基礎實行分層的專家評議,使定量與定性相結合評價得以實現。因此,在 BRIDGE 理論的六步法中,中間(第二、三步)是“核”,兩頭(第一、四—六步)是“殼”。
結論與討論
水箱水結論
科技評價一直是我國科技體制改革的熱點和難點問題。2018 年以來,國家圍繞“三評”、破“四唯”密集出臺了一系列改革政策和措施。雖然改革受到廣泛歡迎,但是效果不彰——“破‘四唯’、立什么”的問題并沒汽車零件進口商有得到有效解決。究其深層原因,還是對科技評價規律認識不清晰,尚未提出有效的理論指導改革實踐。在探索“新標”時,容易陷入前文提到在破“四唯”中的“全盤否定論”與“謹慎否定論”這 2 種觀點的對立爭論之中而難有作為。
為破解以上困局,本文試圖從要“破”的方法中尋找合理要素,并將這些合理的要素結合進要“立”的新標里,并循此思路主要針對科研人員成果評價提出了 BRIDGE 理論及其六步法。關于 BRIDGE 理論及六步法可概括為以下 4 點。
BRIDGE 理論主張,以 SCI 論文為主的量化評價有可以留用的合理要素;如果使用得當,近 30 年來科技評價在文獻計量方法上探索積累的經驗仍然可以在立“新標”中發揮重要作用。
BRIDGE 理論的核心是將已有量化分析的合理要素有效地結合進要立的以同行評議為主的“新標”里,本質上是對定量與定性相結合評價德系車零件理論的發展。
BRIDGE 理論可以通過六步法應用于實際操作中。在六步法中,第二步(recode)和第三步(insight)是最為關鍵,這 2 步實現了以定量分析為基礎的分層的專家評議。
BRIDGE 理論適合我國國情,實現了同行評議的理想需求和現實供給之間的平衡。通過在定量分析基礎上開展同行評議,限制了同行評議過于寬泛的裁量權,在相當程度上可以規避人情關系對同行評議的干擾,也節約了高水平的同行專家資源。同時,能夠發揮已有量化方法中合理要素的作用,物盡其用。
討論
BRIDGE Bentley零件理論是對定量與定性相結合評價理論的發展。在科技評價實踐中,出現過一些比較重要的理論,包括:評價原則方面的理論,如分類評價理論、分層評價理論(也稱為角馬理論);操作性強一些的理論,如定量與定性相結合評價理論、代表作制、國際評估理論、負責任評價理論等。顯然,BRIDGE理論是在定量與定性相結合評價理論基礎上的拓展。雖然定量與定性相結合評價理論被廣泛認同,但是,定量評價與定性評價如何結合一直沒有很好解決,特別是沒有臺北汽車材料找到普遍共識的支撐定性評價的定量分析方法。BRIDGE 理論通過吸納以 SCI 論文為主的量化評價中的合理要素,找到了解決辦法,如將文獻計量方法用作編碼體系進行定量分析。這可以算是我國在定量方法上 30 多年的探索對科技評價理論產生的一油氣分離器改良版個貢獻。
BRIDGE 理論可以說是直接來源于科技評價實踐。很多單位或多或少存在定量與定性評價相結合的實踐。例如,在進行科研人員績效評價乃至招聘評審、職稱晉升評審時,對科研人員提供的論文(有時是代表作)按中國科學院文獻情報中心的期刊分區表、北大中文核心期刊或單位自身的期刊目錄等編碼體系進行量化分析,供同行專家評議參考。這其實類似 BRIDGE 理論六步法中關鍵的第二步(recode)和第三步VW零件(insight),只是沒有六步法規范。因此,可以說,BRIDGE 理論及其六步法根植于實踐,應該有廣泛的應用前景。
BRIDGE 理論雖然適用面較廣,但也不能包打天下。例如,BRIDGE 理論作用的發揮最為關鍵的是構建能夠進行量化分析的指標編碼體系,這在不同類型的成果中難度不一。從已有實踐看,論文、專利、項目、獎勵、人才等指標都有其編碼體系。但是,有一些指標,如科研成果的社會效益則暫時難以找到合適的編碼體系。又如,科學研究具有不可預測性,有些好的研究成果可能需要數年甚至更長時間才能產生,其年度工作有時無法在編碼體系中得到體現。在這 2 種情況下,應用 BRIDGE 理論時要“打補丁”,汽車機油芯如:將類似如上的例外納入 BRIDGE 理論的第四步(dissent)之中,由同行專家委員會另行評價。另外,有些評價工作因為有條件直接采用國際評估等定性評價方法或者因為特殊原因不方便開展定量分析,則不適合應用 BRIDGE 理論。
總之,BRIDGE 理論及其六步法在定量評價與定性評價之間架起了一座橋梁,有望實現科技評價改革“破”與“立”之間的逾越。同時,BRIDGE 理論還需要在科研人員成果評價,以及機構、項目等其他方面的成果評價實踐中不斷豐富完善,進一步明晰適用邊界和條件。
(作者:徐芳、李曉軒,中國科學院科技戰略咨詢研究院、中國科學院大學 公共政策與管理學院;《中國科學院院刊》供稿)
發佈留言