
摘要:知網(wǎng)查重系統(tǒng)(AMLC)的成功開發(fā)和免費推廣,為學術期刊抵制學術期刊中的學術不端行為提供了銳利的武器;但在多種學術不端行為中,AMLC僅能檢測一稿多投(或多發(fā))、重復或抄襲、不正當署名等。本文檢測了178篇來稿和2期共55篇已發(fā)表論文,發(fā)現(xiàn)約有40%的醫(yī)學論文存在或多或少的文字重復現(xiàn)象,其中重復文字比>30%者達16.7%。分析發(fā)現(xiàn),醫(yī)學論文方法”和討論”部分重復文字較多、AMLC對數(shù)字和符號不敏感等,也發(fā)現(xiàn)了一些較易重復的論文或項目。提出了AMLC的一些改良建議和期刊編輯部在使用過程中的一些對策。
關鍵詞:學術不端行為;知網(wǎng)查重系統(tǒng);醫(yī)學論文;AMLC
學術不端行為由來已久,國內(nèi)外皆有之;但國內(nèi)這些年來,這種行為有愈演愈烈之勢,甚至有學術不端行為者反告揭露其行為者竟而勝訴的事件。這種趨勢促使學術界、學術管理界和高等教育界皆呼吁——要堅決反對和打擊學術不端行為。2008年10月,武漢第7屆全國綜合類人文社會科學期刊高層論壇一致通過了由50家期刊共同簽署的《關于堅決抵制學術不端行為的聯(lián)合聲明》。2009年3月,教育部發(fā)出《關于嚴肅處理高等學校學術不端行為的通知》,并聲明年底前教育部會對該通知的執(zhí)行情況進行專項檢查。2008年底,中國學術期刊光盤版電子雜志社與同方知網(wǎng)(北京)技術有限公司合作成立的CNKI科研誠信管理系統(tǒng)研究中心成功開發(fā)出旨在檢測學術文獻當中不端行為的AMLC系統(tǒng),包括科技期刊知網(wǎng)查重系統(tǒng)(AMLC)、社科期刊知網(wǎng)查重系統(tǒng)(SMLC)和學位論文知網(wǎng)查重系統(tǒng)(TMLC),這無疑是學術期刊界反對學術不端行為的銳利武器。我們自2009年初開始使用該系統(tǒng),對來稿和已發(fā)表文獻進行了檢測,發(fā)現(xiàn)該系統(tǒng)對醫(yī)學論文學術不端行為的檢測有一定幫助,本文對醫(yī)學期刊編輯部使用該系統(tǒng)提出了一些建議,也對該系統(tǒng)提出了一些改進建議。
1、AMLC對學術不端醫(yī)學文獻的劃分
學術不端行為的種類很多,概念的界定也不盡一致,其共同特點是涉及學術領域的、違反基本學術規(guī)范、違反學術道德的行為。教育部關于嚴肅處理高等學校學術不端行為的通知沖列舉了6種外加其他學術不端行為,而在綜合類人文社科期刊高層論壇簽署的〈關于堅決抵制學術不端行為的聯(lián)合聲明》 則列舉了學術期刊中的5種學術不端行為。馬勇進等認為學術成果低水平重復也是一種學術不端行為。潘淑君等更進一步認為學術期刊的編委頭銜及增刊和加大頁碼也屬于學術不端行為??梢姡瑢W術不端行為在學術期刊中的表現(xiàn)多樣,不局限于期刊論文本身。AMLC在用戶說明中明確提出,用戶稿件的檢測主要檢測是否存在抄襲、一稿多投和已發(fā)表文獻的不正當署名等學術不端行為,并依嚴重程度給出一個權值進行度量。可見,AMLC難以檢測和防止其他類型的學術不端行為。該系統(tǒng)按照重復文字的相似比例,以10%、30%、50%為界劃分為輕度句子抄襲(< 10%且各連續(xù)重合文字均<200)、句子抄襲(>10% 且各連續(xù)重合文字均<200)、輕度段落抄襲(>10% ~<30%且存在連續(xù)重合文字>200)、段落抄襲(> 30%~<50%且存在連續(xù)重合文字>200)和整體抄襲 (>50%,重復文字大于總字符數(shù)的1 /2),并有相應的綠、黃、橙、紅等顏色醒目提示。該系統(tǒng)按是否有部分作者相同判斷是否自我抄襲,如有且文字重合度> 75%則認為是一稿多投,若<75%且>50%則認為是 自抄,若<50%且>30%則認為是輕度自抄。系統(tǒng)比 對參考文獻部分,從而確定被檢測文獻是否引用了被重復的文獻。系統(tǒng)還對被重復文獻是來自于某1篇或多篇而將重復的性質(zhì)劃分為單源和多源。
2、AMLC檢測醫(yī)學論文的總體情況
我們檢測了2009年前幾個月來稿的178篇文獻,發(fā)現(xiàn)73篇文獻存在一定的問題,同時檢測了已發(fā)表文獻2期共55篇論文,發(fā)現(xiàn)有21篇存在一定的問題??梢妬砀逯屑s有40%的文獻存在或多或少的文字重復現(xiàn)象,有個別文獻的重復文字比甚至達到81%,與單篇文獻的重復文字比達77%,被判斷為“整體抄襲來源”檢測文獻與重復文獻間沒有引證關系。也有不少文獻重復文字比<10%:在我們檢測出的73篇可能有問題的來稿中,重復文字比>10%的文獻占48篇,另25篇為重復文字比<10%。在所有來稿和已發(fā)表的2期的233篇文獻中,總重復文字比>30%的文獻有39篇,占16.7%,其中重復文字比>50%的文獻18篇,占7.7%。然而,該系統(tǒng)并不能對所有文獻都給出明確的診斷。在我們的檢測結(jié)果中,只有后4種診斷才有顯示,即句子抄襲、輕度段落抄襲、段落抄襲和整體抄襲,分別為13(5.6%)、5(2.1%)、8(3.4%)和3(1.2%)篇,另有11篇(4.7%)輕度自抄和2篇(0.9%) 自抄。可見,有重復文字的醫(yī)學論文中,句子抄襲現(xiàn)象和輕度自抄現(xiàn)象比較多,整體抄襲則少見,而段落抄襲反而多于輕度段落抄襲的結(jié)果可能與抽樣有關。
3、AMLC檢測醫(yī)學論文的一些特點
為了解知網(wǎng)查重系統(tǒng)AMLC檢測醫(yī)學論文的特點,以便醫(yī)學期刊編輯部有針對性地使用,我們對每一篇總重復文字比>20%且與單篇文獻重復文字比>10%的文獻進行了全文比對,發(fā)現(xiàn)AMLC檢測醫(yī)學論文有以下特點。
1)總體上,醫(yī)學論文的重復文字在“方法”和“討論”部分較多,而在“摘要”“引言”“結(jié)果”部分較少, 說明多數(shù)有重復文字的論文是參照了其他論文方法的寫法,而有自己的結(jié)果,但討論的大部分內(nèi)容卻沒有新意。這與醫(yī)學科研的現(xiàn)狀是吻合的方法沒有創(chuàng)新,僅用他人方法重復自己的實驗;因此結(jié)果的數(shù)據(jù)略有不同,但討論和結(jié)論卻是類似的。
2)AMLC不僅比對公開發(fā)行的科技期刊,還比對學位論文、內(nèi)部刊物、重要會議論文、報紙、年鑒、工具書等,因為AMLC以CNKI收錄的9000余種國內(nèi)刊物和其他資料為基礎進行文字重復的檢測。
3)AMLC對數(shù)字和符號不敏感,因此,同一句話即使其中的數(shù)據(jù)或符號不同,也會被認為文字重復。如一個課題的系列研究中需要研究多個因子的狀況時,則容易被認為文字重復,甚至被認為句子抄襲或段落抄襲。
4)AMLC對重復段落的劃分與自然段沒有關系, 有可能發(fā)生不同自然段甚至不同層次被劃分為同一重復文字段的現(xiàn)象。如醫(yī)學論文的第1層次通常為“材料與方法”臨床研究的論文在該層的上面通常以“現(xiàn)報告如下”結(jié)尾,而該層下則常以‘研究病例選自XX 院自X X年一 X X年的患某病的住院病例”由于AMLC對數(shù)字不敏感,因此,這個地方的文字較易被認為文字重復,且在全文比對的重復文字標記時被認為是同一個重復段落。
5)AMLC的檢測結(jié)果有幾種不一致的情況。
①方法與討論部分的重復段落通常較長,而在引言與結(jié)果部分則重復段落較短;因此,出現(xiàn)方法部分與討論部分標記的重復文字段落數(shù)還可能不如結(jié)果部分的標記段落數(shù)多。
②與上一條相關,總體文字復制比可能與標記的重復段落數(shù)不成正比。
③中英文摘要的重復文字可以不一致,有些論文中文摘要與某論文重復,而英文摘要卻可能沒有重復。
④單篇文獻比對時發(fā)現(xiàn),重復句子或段落的順序可與被重復的論文出現(xiàn)的順序不一致。
⑤僅與單篇文獻重復時,總體的文字復制比與列出的該單篇文獻的重復文字比常常不同,多數(shù)為稍大于單篇文獻的重復文字比,可能是因為與未列出的文獻仍有小部分重復。
6)AMLC不僅僅比對題名、摘要和正文,還比對作者單位及參考文獻。我們在檢測的過程中發(fā)現(xiàn)作者單位相同也可被認為是文字重復。引用相同參考文獻也可被認為是文字重復。
7)幾種較易出現(xiàn)重復文字的論文。
①不同作者研究同一批資料的不同方面時,較易發(fā)生抄襲資料描述,如同一批病例,醫(yī)生撰寫了有關資料的臨床效果的論文,則護士可能抄襲有關資料描述。
②同一課題組的系列研究時,后續(xù)論文可能抄襲已發(fā)論文的引言、方法和討論等內(nèi)容。曾有一篇論文重復文字比為34%,經(jīng)仔細比對,發(fā)現(xiàn)大部分都是在方法部分重復了課題已發(fā)表的論文。
③研究性論文在討論部分容易抄襲綜述性文章。
④博士畢業(yè)后發(fā)表的論文容易抄襲博士生答辯的畢業(yè)論文。
⑤論文在內(nèi)部刊物上發(fā)表后,相同主題正式發(fā)表時,會有較多重復內(nèi)部刊物論文的現(xiàn)象。
⑥由于AMLC對數(shù)字和符號不敏感,因此,會把類似的圖題表題和注釋認為是文字重復_這也是結(jié)果部分較多見的重復文字標記。
⑦統(tǒng)計方法部分,多有重復統(tǒng)計軟件和一般統(tǒng)計方法的描述。
⑧較長的并列名稱較易被發(fā)現(xiàn)重復,如我們曾檢測出眼科學“全周RNFL厚度、上方RNFL厚度和下方RNFL厚度……”在同一文章的討論中被標記重復10次之多,實際不應算是重復。
8)醫(yī)學論文的遣詞造句比較簡單和通用,因此, 在各個部分都容易出現(xiàn)文字重復的現(xiàn)象;但大多數(shù)被 認為有較大重復文字比例的文章都是“多源”重復,即 與多篇文獻有類似的文句,而不是抄襲某一篇的句段。我們曾檢測到一篇文獻總體復制比大于50%,但經(jīng)仔細比對,發(fā)現(xiàn)與單篇文獻的重復文字比最大也僅為17%,其他多數(shù)為10%以下。這篇論文未被判斷為‘整體抄襲”可能是由于沒有某段連續(xù)的重復文字>200字。
9)大多數(shù)論文不引用被抄襲的論文,僅少數(shù)抄襲較輕者有引用。我們檢測的73篇有抄襲嫌疑的文獻中,僅有2篇引用了被重復文字的論文,一篇被判為句子抄襲”另一篇為作者自己的論文,因重復文字較少,系統(tǒng)尚未判斷為學術不端行為類型。
10)短文章容易導致重復文字比例偏大,如僅輸入某發(fā)表文獻的摘要時,常被判斷為“一稿多投”。
4、關于AMLC檢測醫(yī)學論文的一些建議
馬勇進認為,學術不端行為在學術期刊中大量存在,主要有社會與個人的原因,缺乏有效懲戒措施,以及學術期刊自身的問題(如把關不嚴、自律缺失),因此,抵制學術不端行為是學術期刊的神圣職責。曹亞軍等也認為,出版與編輯環(huán)節(jié)存在的漏洞及某些新聞媒體的推波助瀾為科研不端行為揺旗吶喊,助長了學術造假之風。在AMLC開發(fā)以前,要鑒別來稿是否重復或抄襲他人文章,多采用文獻檢索的方法,但是,檢索出來的相關文章較多,編輯難以逐句逐段地對照每一篇文章。AMLC的開發(fā)成功,對學術期刊編輯鑒別這些學術不端文獻提供了強有力的武器。我們建議,所有具備條件的編輯部都應在收到稿件之時就利用AMLC進行知網(wǎng)查重系統(tǒng)的檢測;但是,在使用過程中,我們發(fā)現(xiàn)AMLC自身還難以完全替代編輯的鑒別,并且其自身也還存在一定的問題,某些問題不僅是對醫(yī)學論文,而且對所有學術期刊的論文都可能存在。鑒于上述的AMLC檢測醫(yī)學論文的一些特點,我們對AMLC系統(tǒng)和醫(yī)學期刊編輯部使用該系統(tǒng)時提出如下建議。
1)對于AMLC系統(tǒng),我們建議:
①由于醫(yī)學研究性論文(綜述與講座除外)都是按照‘引言”材料與方法”結(jié)果”討論”的章節(jié)層次撰寫的,因此,AMLC系統(tǒng)應提供入口使得醫(yī)學論文可以分層次進行重復文字比例的計算,關鍵的“結(jié)果”部分是編輯必須特別注意的,而“方法”與‘討論”部分的少許重復并不要緊。
②標記重復文字段落時同時考慮論文自然段的劃分,不要將不同自然段甚至不同層次的內(nèi)容混合在一起統(tǒng)計和標記,層次標題不計入重復文字比例。
③AMLC系統(tǒng)不要將作者單位和參考文獻列入重復文字的檢測范圍,因為不同論文是可以引用相同文獻的 。
④系統(tǒng)增加對圖表與數(shù)字和符號的識別功能。
⑤在給出總結(jié)性數(shù)據(jù)時,同時給出與某單篇文獻重復文字比的最大比例,以方便期刊編輯考察可疑論文與某單篇文獻的最大重復比例。
2)對于醫(yī)學期刊編輯部,我們建議:
①對所有來稿,在登記前就應進行學術不端文獻的檢測,而將檢測出的學術不端文獻即行退稿,以避免人力物力浪費。
②在每一期發(fā)稿之前再行一遍學術不端文獻的檢查;因為從來稿到發(fā)稿,國內(nèi)大部分期刊都要經(jīng)過約半年的時間,檢測過的文獻有可能半年后發(fā)現(xiàn)有重復或抄襲行為。這一次檢測可采用將所有發(fā)稿論文壓縮后打包而進行批處理的方法檢測。
③編輯在檢測文獻時,不要單純按照AMLC給出的總體復制比對來稿進行學術不端行為的判斷,而應深入分析其與某幾篇單篇文獻的重復文字情況,如僅是方法上的重復,可以建議作者大力精簡方法部分,僅引用文獻即可。
④編輯部應制訂統(tǒng)一標準,以便各編輯按照相同的標準處理來稿。
⑤使用了遠程采編系統(tǒng)的編輯部可與采編系統(tǒng)設 計部門協(xié)商,看是否可以將來稿在AMLC的比對設計成自動化程序。
⑥編輯在處理重復文字的稿件時,應慎重對待,如退稿,則退稿理由不可過于武斷地認為作者是抄襲;因為醫(yī)學論文的遣詞造句確實比較通用,容易發(fā)生重復現(xiàn)象。
⑦學術不端行為的檢測不可替代文獻查新,經(jīng)AMLC檢測出來沒有多少重復文字比例,并不說明論文具有新穎性或創(chuàng)造性。
⑧編輯部還應注意對其他類型學術不端行為的防范,如人情審稿、低水平成果、掛著編委頭銜不愿承擔編委的責任等。
5、結(jié)束語
AMLC的成功開發(fā)為學術期刊抵制一稿多投(或多發(fā))、重復抄襲、不正當署名等學術不端行為提供了有力的武器;但是,我們也應當看到,AMLC并不能防止學術期刊中所有類型的學術不端行為,因此,AMLC之外的功夫仍不可忽視。即使是在AMLC檢測文獻過程中,編輯的鑒別作用也是不可替代的。建議編輯部及時修改相應規(guī)程,統(tǒng)一編輯行為,與學術界和學術管理界一起共同維護學術界的誠信和純潔。