
摘要:知網(wǎng)查重系統(tǒng)(AMLC)的成功開發(fā)和免費(fèi)推廣,為學(xué)術(shù)期刊抵制學(xué)術(shù)期刊中的學(xué)術(shù)不端行為提供了銳利的武器;但在多種學(xué)術(shù)不端行為中,AMLC僅能檢測一稿多投(或多發(fā))、重復(fù)或抄襲、不正當(dāng)署名等。本文檢測了178篇來稿和2期共55篇已發(fā)表論文,發(fā)現(xiàn)約有40%的醫(yī)學(xué)論文存在或多或少的文字重復(fù)現(xiàn)象,其中重復(fù)文字比>30%者達(dá)16.7%。分析發(fā)現(xiàn),醫(yī)學(xué)論文方法”和討論”部分重復(fù)文字較多、AMLC對數(shù)字和符號不敏感等,也發(fā)現(xiàn)了一些較易重復(fù)的論文或項(xiàng)目。提出了AMLC的一些改良建議和期刊編輯部在使用過程中的一些對策。
關(guān)鍵詞:學(xué)術(shù)不端行為;知網(wǎng)查重系統(tǒng);醫(yī)學(xué)論文;AMLC
學(xué)術(shù)不端行為由來已久,國內(nèi)外皆有之;但國內(nèi)這些年來,這種行為有愈演愈烈之勢,甚至有學(xué)術(shù)不端行為者反告揭露其行為者竟而勝訴的事件。這種趨勢促使學(xué)術(shù)界、學(xué)術(shù)管理界和高等教育界皆呼吁——要堅(jiān)決反對和打擊學(xué)術(shù)不端行為。2008年10月,武漢第7屆全國綜合類人文社會科學(xué)期刊高層論壇一致通過了由50家期刊共同簽署的《關(guān)于堅(jiān)決抵制學(xué)術(shù)不端行為的聯(lián)合聲明》。2009年3月,教育部發(fā)出《關(guān)于嚴(yán)肅處理高等學(xué)校學(xué)術(shù)不端行為的通知》,并聲明年底前教育部會對該通知的執(zhí)行情況進(jìn)行專項(xiàng)檢查。2008年底,中國學(xué)術(shù)期刊光盤版電子雜志社與同方知網(wǎng)(北京)技術(shù)有限公司合作成立的CNKI科研誠信管理系統(tǒng)研究中心成功開發(fā)出旨在檢測學(xué)術(shù)文獻(xiàn)當(dāng)中不端行為的AMLC系統(tǒng),包括科技期刊知網(wǎng)查重系統(tǒng)(AMLC)、社科期刊知網(wǎng)查重系統(tǒng)(SMLC)和學(xué)位論文知網(wǎng)查重系統(tǒng)(TMLC),這無疑是學(xué)術(shù)期刊界反對學(xué)術(shù)不端行為的銳利武器。我們自2009年初開始使用該系統(tǒng),對來稿和已發(fā)表文獻(xiàn)進(jìn)行了檢測,發(fā)現(xiàn)該系統(tǒng)對醫(yī)學(xué)論文學(xué)術(shù)不端行為的檢測有一定幫助,本文對醫(yī)學(xué)期刊編輯部使用該系統(tǒng)提出了一些建議,也對該系統(tǒng)提出了一些改進(jìn)建議。
1、AMLC對學(xué)術(shù)不端醫(yī)學(xué)文獻(xiàn)的劃分
學(xué)術(shù)不端行為的種類很多,概念的界定也不盡一致,其共同特點(diǎn)是涉及學(xué)術(shù)領(lǐng)域的、違反基本學(xué)術(shù)規(guī)范、違反學(xué)術(shù)道德的行為。教育部關(guān)于嚴(yán)肅處理高等學(xué)校學(xué)術(shù)不端行為的通知沖列舉了6種外加其他學(xué)術(shù)不端行為,而在綜合類人文社科期刊高層論壇簽署的〈關(guān)于堅(jiān)決抵制學(xué)術(shù)不端行為的聯(lián)合聲明》 則列舉了學(xué)術(shù)期刊中的5種學(xué)術(shù)不端行為。馬勇進(jìn)等認(rèn)為學(xué)術(shù)成果低水平重復(fù)也是一種學(xué)術(shù)不端行為。潘淑君等更進(jìn)一步認(rèn)為學(xué)術(shù)期刊的編委頭銜及增刊和加大頁碼也屬于學(xué)術(shù)不端行為。可見,學(xué)術(shù)不端行為在學(xué)術(shù)期刊中的表現(xiàn)多樣,不局限于期刊論文本身。AMLC在用戶說明中明確提出,用戶稿件的檢測主要檢測是否存在抄襲、一稿多投和已發(fā)表文獻(xiàn)的不正當(dāng)署名等學(xué)術(shù)不端行為,并依嚴(yán)重程度給出一個權(quán)值進(jìn)行度量。可見,AMLC難以檢測和防止其他類型的學(xué)術(shù)不端行為。該系統(tǒng)按照重復(fù)文字的相似比例,以10%、30%、50%為界劃分為輕度句子抄襲(< 10%且各連續(xù)重合文字均<200)、句子抄襲(>10% 且各連續(xù)重合文字均<200)、輕度段落抄襲(>10% ~<30%且存在連續(xù)重合文字>200)、段落抄襲(> 30%~<50%且存在連續(xù)重合文字>200)和整體抄襲 (>50%,重復(fù)文字大于總字符數(shù)的1 /2),并有相應(yīng)的綠、黃、橙、紅等顏色醒目提示。該系統(tǒng)按是否有部分作者相同判斷是否自我抄襲,如有且文字重合度> 75%則認(rèn)為是一稿多投,若<75%且>50%則認(rèn)為是 自抄,若<50%且>30%則認(rèn)為是輕度自抄。系統(tǒng)比 對參考文獻(xiàn)部分,從而確定被檢測文獻(xiàn)是否引用了被重復(fù)的文獻(xiàn)。系統(tǒng)還對被重復(fù)文獻(xiàn)是來自于某1篇或多篇而將重復(fù)的性質(zhì)劃分為單源和多源。
2、AMLC檢測醫(yī)學(xué)論文的總體情況
我們檢測了2009年前幾個月來稿的178篇文獻(xiàn),發(fā)現(xiàn)73篇文獻(xiàn)存在一定的問題,同時檢測了已發(fā)表文獻(xiàn)2期共55篇論文,發(fā)現(xiàn)有21篇存在一定的問題。可見來稿中約有40%的文獻(xiàn)存在或多或少的文字重復(fù)現(xiàn)象,有個別文獻(xiàn)的重復(fù)文字比甚至達(dá)到81%,與單篇文獻(xiàn)的重復(fù)文字比達(dá)77%,被判斷為“整體抄襲來源”檢測文獻(xiàn)與重復(fù)文獻(xiàn)間沒有引證關(guān)系。也有不少文獻(xiàn)重復(fù)文字比<10%:在我們檢測出的73篇可能有問題的來稿中,重復(fù)文字比>10%的文獻(xiàn)占48篇,另25篇為重復(fù)文字比<10%。在所有來稿和已發(fā)表的2期的233篇文獻(xiàn)中,總重復(fù)文字比>30%的文獻(xiàn)有39篇,占16.7%,其中重復(fù)文字比>50%的文獻(xiàn)18篇,占7.7%。然而,該系統(tǒng)并不能對所有文獻(xiàn)都給出明確的診斷。在我們的檢測結(jié)果中,只有后4種診斷才有顯示,即句子抄襲、輕度段落抄襲、段落抄襲和整體抄襲,分別為13(5.6%)、5(2.1%)、8(3.4%)和3(1.2%)篇,另有11篇(4.7%)輕度自抄和2篇(0.9%) 自抄??梢姡兄貜?fù)文字的醫(yī)學(xué)論文中,句子抄襲現(xiàn)象和輕度自抄現(xiàn)象比較多,整體抄襲則少見,而段落抄襲反而多于輕度段落抄襲的結(jié)果可能與抽樣有關(guān)。
3、AMLC檢測醫(yī)學(xué)論文的一些特點(diǎn)
為了解知網(wǎng)查重系統(tǒng)AMLC檢測醫(yī)學(xué)論文的特點(diǎn),以便醫(yī)學(xué)期刊編輯部有針對性地使用,我們對每一篇總重復(fù)文字比>20%且與單篇文獻(xiàn)重復(fù)文字比>10%的文獻(xiàn)進(jìn)行了全文比對,發(fā)現(xiàn)AMLC檢測醫(yī)學(xué)論文有以下特點(diǎn)。
1)總體上,醫(yī)學(xué)論文的重復(fù)文字在“方法”和“討論”部分較多,而在“摘要”“引言”“結(jié)果”部分較少, 說明多數(shù)有重復(fù)文字的論文是參照了其他論文方法的寫法,而有自己的結(jié)果,但討論的大部分內(nèi)容卻沒有新意。這與醫(yī)學(xué)科研的現(xiàn)狀是吻合的方法沒有創(chuàng)新,僅用他人方法重復(fù)自己的實(shí)驗(yàn);因此結(jié)果的數(shù)據(jù)略有不同,但討論和結(jié)論卻是類似的。
2)AMLC不僅比對公開發(fā)行的科技期刊,還比對學(xué)位論文、內(nèi)部刊物、重要會議論文、報(bào)紙、年鑒、工具書等,因?yàn)锳MLC以CNKI收錄的9000余種國內(nèi)刊物和其他資料為基礎(chǔ)進(jìn)行文字重復(fù)的檢測。
3)AMLC對數(shù)字和符號不敏感,因此,同一句話即使其中的數(shù)據(jù)或符號不同,也會被認(rèn)為文字重復(fù)。如一個課題的系列研究中需要研究多個因子的狀況時,則容易被認(rèn)為文字重復(fù),甚至被認(rèn)為句子抄襲或段落抄襲。
4)AMLC對重復(fù)段落的劃分與自然段沒有關(guān)系, 有可能發(fā)生不同自然段甚至不同層次被劃分為同一重復(fù)文字段的現(xiàn)象。如醫(yī)學(xué)論文的第1層次通常為“材料與方法”臨床研究的論文在該層的上面通常以“現(xiàn)報(bào)告如下”結(jié)尾,而該層下則常以‘研究病例選自XX 院自X X年一 X X年的患某病的住院病例”由于AMLC對數(shù)字不敏感,因此,這個地方的文字較易被認(rèn)為文字重復(fù),且在全文比對的重復(fù)文字標(biāo)記時被認(rèn)為是同一個重復(fù)段落。
5)AMLC的檢測結(jié)果有幾種不一致的情況。
①方法與討論部分的重復(fù)段落通常較長,而在引言與結(jié)果部分則重復(fù)段落較短;因此,出現(xiàn)方法部分與討論部分標(biāo)記的重復(fù)文字段落數(shù)還可能不如結(jié)果部分的標(biāo)記段落數(shù)多。
②與上一條相關(guān),總體文字復(fù)制比可能與標(biāo)記的重復(fù)段落數(shù)不成正比。
③中英文摘要的重復(fù)文字可以不一致,有些論文中文摘要與某論文重復(fù),而英文摘要卻可能沒有重復(fù)。
④單篇文獻(xiàn)比對時發(fā)現(xiàn),重復(fù)句子或段落的順序可與被重復(fù)的論文出現(xiàn)的順序不一致。
⑤僅與單篇文獻(xiàn)重復(fù)時,總體的文字復(fù)制比與列出的該單篇文獻(xiàn)的重復(fù)文字比常常不同,多數(shù)為稍大于單篇文獻(xiàn)的重復(fù)文字比,可能是因?yàn)榕c未列出的文獻(xiàn)仍有小部分重復(fù)。
6)AMLC不僅僅比對題名、摘要和正文,還比對作者單位及參考文獻(xiàn)。我們在檢測的過程中發(fā)現(xiàn)作者單位相同也可被認(rèn)為是文字重復(fù)。引用相同參考文獻(xiàn)也可被認(rèn)為是文字重復(fù)。
7)幾種較易出現(xiàn)重復(fù)文字的論文。
①不同作者研究同一批資料的不同方面時,較易發(fā)生抄襲資料描述,如同一批病例,醫(yī)生撰寫了有關(guān)資料的臨床效果的論文,則護(hù)士可能抄襲有關(guān)資料描述。
②同一課題組的系列研究時,后續(xù)論文可能抄襲已發(fā)論文的引言、方法和討論等內(nèi)容。曾有一篇論文重復(fù)文字比為34%,經(jīng)仔細(xì)比對,發(fā)現(xiàn)大部分都是在方法部分重復(fù)了課題已發(fā)表的論文。
③研究性論文在討論部分容易抄襲綜述性文章。
④博士畢業(yè)后發(fā)表的論文容易抄襲博士生答辯的畢業(yè)論文。
⑤論文在內(nèi)部刊物上發(fā)表后,相同主題正式發(fā)表時,會有較多重復(fù)內(nèi)部刊物論文的現(xiàn)象。
⑥由于AMLC對數(shù)字和符號不敏感,因此,會把類似的圖題表題和注釋認(rèn)為是文字重復(fù)_這也是結(jié)果部分較多見的重復(fù)文字標(biāo)記。
⑦統(tǒng)計(jì)方法部分,多有重復(fù)統(tǒng)計(jì)軟件和一般統(tǒng)計(jì)方法的描述。
⑧較長的并列名稱較易被發(fā)現(xiàn)重復(fù),如我們曾檢測出眼科學(xué)“全周RNFL厚度、上方RNFL厚度和下方RNFL厚度……”在同一文章的討論中被標(biāo)記重復(fù)10次之多,實(shí)際不應(yīng)算是重復(fù)。
8)醫(yī)學(xué)論文的遣詞造句比較簡單和通用,因此, 在各個部分都容易出現(xiàn)文字重復(fù)的現(xiàn)象;但大多數(shù)被 認(rèn)為有較大重復(fù)文字比例的文章都是“多源”重復(fù),即 與多篇文獻(xiàn)有類似的文句,而不是抄襲某一篇的句段。我們曾檢測到一篇文獻(xiàn)總體復(fù)制比大于50%,但經(jīng)仔細(xì)比對,發(fā)現(xiàn)與單篇文獻(xiàn)的重復(fù)文字比最大也僅為17%,其他多數(shù)為10%以下。這篇論文未被判斷為‘整體抄襲”可能是由于沒有某段連續(xù)的重復(fù)文字>200字。
9)大多數(shù)論文不引用被抄襲的論文,僅少數(shù)抄襲較輕者有引用。我們檢測的73篇有抄襲嫌疑的文獻(xiàn)中,僅有2篇引用了被重復(fù)文字的論文,一篇被判為句子抄襲”另一篇為作者自己的論文,因重復(fù)文字較少,系統(tǒng)尚未判斷為學(xué)術(shù)不端行為類型。
10)短文章容易導(dǎo)致重復(fù)文字比例偏大,如僅輸入某發(fā)表文獻(xiàn)的摘要時,常被判斷為“一稿多投”。
4、關(guān)于AMLC檢測醫(yī)學(xué)論文的一些建議
馬勇進(jìn)認(rèn)為,學(xué)術(shù)不端行為在學(xué)術(shù)期刊中大量存在,主要有社會與個人的原因,缺乏有效懲戒措施,以及學(xué)術(shù)期刊自身的問題(如把關(guān)不嚴(yán)、自律缺失),因此,抵制學(xué)術(shù)不端行為是學(xué)術(shù)期刊的神圣職責(zé)。曹亞軍等也認(rèn)為,出版與編輯環(huán)節(jié)存在的漏洞及某些新聞媒體的推波助瀾為科研不端行為揺旗吶喊,助長了學(xué)術(shù)造假之風(fēng)。在AMLC開發(fā)以前,要鑒別來稿是否重復(fù)或抄襲他人文章,多采用文獻(xiàn)檢索的方法,但是,檢索出來的相關(guān)文章較多,編輯難以逐句逐段地對照每一篇文章。AMLC的開發(fā)成功,對學(xué)術(shù)期刊編輯鑒別這些學(xué)術(shù)不端文獻(xiàn)提供了強(qiáng)有力的武器。我們建議,所有具備條件的編輯部都應(yīng)在收到稿件之時就利用AMLC進(jìn)行知網(wǎng)查重系統(tǒng)的檢測;但是,在使用過程中,我們發(fā)現(xiàn)AMLC自身還難以完全替代編輯的鑒別,并且其自身也還存在一定的問題,某些問題不僅是對醫(yī)學(xué)論文,而且對所有學(xué)術(shù)期刊的論文都可能存在。鑒于上述的AMLC檢測醫(yī)學(xué)論文的一些特點(diǎn),我們對AMLC系統(tǒng)和醫(yī)學(xué)期刊編輯部使用該系統(tǒng)時提出如下建議。
1)對于AMLC系統(tǒng),我們建議:
①由于醫(yī)學(xué)研究性論文(綜述與講座除外)都是按照‘引言”材料與方法”結(jié)果”討論”的章節(jié)層次撰寫的,因此,AMLC系統(tǒng)應(yīng)提供入口使得醫(yī)學(xué)論文可以分層次進(jìn)行重復(fù)文字比例的計(jì)算,關(guān)鍵的“結(jié)果”部分是編輯必須特別注意的,而“方法”與‘討論”部分的少許重復(fù)并不要緊。
②標(biāo)記重復(fù)文字段落時同時考慮論文自然段的劃分,不要將不同自然段甚至不同層次的內(nèi)容混合在一起統(tǒng)計(jì)和標(biāo)記,層次標(biāo)題不計(jì)入重復(fù)文字比例。
③AMLC系統(tǒng)不要將作者單位和參考文獻(xiàn)列入重復(fù)文字的檢測范圍,因?yàn)椴煌撐氖强梢砸孟嗤墨I(xiàn)的 。
④系統(tǒng)增加對圖表與數(shù)字和符號的識別功能。
⑤在給出總結(jié)性數(shù)據(jù)時,同時給出與某單篇文獻(xiàn)重復(fù)文字比的最大比例,以方便期刊編輯考察可疑論文與某單篇文獻(xiàn)的最大重復(fù)比例。
2)對于醫(yī)學(xué)期刊編輯部,我們建議:
①對所有來稿,在登記前就應(yīng)進(jìn)行學(xué)術(shù)不端文獻(xiàn)的檢測,而將檢測出的學(xué)術(shù)不端文獻(xiàn)即行退稿,以避免人力物力浪費(fèi)。
②在每一期發(fā)稿之前再行一遍學(xué)術(shù)不端文獻(xiàn)的檢查;因?yàn)閺膩砀宓桨l(fā)稿,國內(nèi)大部分期刊都要經(jīng)過約半年的時間,檢測過的文獻(xiàn)有可能半年后發(fā)現(xiàn)有重復(fù)或抄襲行為。這一次檢測可采用將所有發(fā)稿論文壓縮后打包而進(jìn)行批處理的方法檢測。
③編輯在檢測文獻(xiàn)時,不要單純按照AMLC給出的總體復(fù)制比對來稿進(jìn)行學(xué)術(shù)不端行為的判斷,而應(yīng)深入分析其與某幾篇單篇文獻(xiàn)的重復(fù)文字情況,如僅是方法上的重復(fù),可以建議作者大力精簡方法部分,僅引用文獻(xiàn)即可。
④編輯部應(yīng)制訂統(tǒng)一標(biāo)準(zhǔn),以便各編輯按照相同的標(biāo)準(zhǔn)處理來稿。
⑤使用了遠(yuǎn)程采編系統(tǒng)的編輯部可與采編系統(tǒng)設(shè) 計(jì)部門協(xié)商,看是否可以將來稿在AMLC的比對設(shè)計(jì)成自動化程序。
⑥編輯在處理重復(fù)文字的稿件時,應(yīng)慎重對待,如退稿,則退稿理由不可過于武斷地認(rèn)為作者是抄襲;因?yàn)獒t(yī)學(xué)論文的遣詞造句確實(shí)比較通用,容易發(fā)生重復(fù)現(xiàn)象。
⑦學(xué)術(shù)不端行為的檢測不可替代文獻(xiàn)查新,經(jīng)AMLC檢測出來沒有多少重復(fù)文字比例,并不說明論文具有新穎性或創(chuàng)造性。
⑧編輯部還應(yīng)注意對其他類型學(xué)術(shù)不端行為的防范,如人情審稿、低水平成果、掛著編委頭銜不愿承擔(dān)編委的責(zé)任等。
5、結(jié)束語
AMLC的成功開發(fā)為學(xué)術(shù)期刊抵制一稿多投(或多發(fā))、重復(fù)抄襲、不正當(dāng)署名等學(xué)術(shù)不端行為提供了有力的武器;但是,我們也應(yīng)當(dāng)看到,AMLC并不能防止學(xué)術(shù)期刊中所有類型的學(xué)術(shù)不端行為,因此,AMLC之外的功夫仍不可忽視。即使是在AMLC檢測文獻(xiàn)過程中,編輯的鑒別作用也是不可替代的。建議編輯部及時修改相應(yīng)規(guī)程,統(tǒng)一編輯行為,與學(xué)術(shù)界和學(xué)術(shù)管理界一起共同維護(hù)學(xué)術(shù)界的誠信和純潔。