學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng) - 學(xué)術(shù)論文檢測系統(tǒng)
學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)(簡稱“AMLC”)以《中國學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫》為全文比對數(shù)據(jù)庫,實(shí)現(xiàn)了對抄襲與剽竊、偽造、篡改等學(xué)術(shù)不端行為的快速檢測,可供用戶檢測論文,并支持用戶自建比對庫。
技術(shù)
AMLC采用CNKI自主研發(fā)的自適應(yīng)多階指紋(AMLFP)特征檢測技術(shù),具有檢測速度快,準(zhǔn)確率,召回率較高,抗干擾性強(qiáng)等特征。支持篇章、段落、句子各層級檢測;支持文獻(xiàn)改寫,多篇文獻(xiàn)組合等各種文獻(xiàn)變形檢測;支持研究生論文、圖書專著等超長文獻(xiàn)的學(xué)術(shù)不端檢測。
對任意一篇需要檢測的文獻(xiàn),系統(tǒng)首先對其進(jìn)行分層處理,按照篇章、段落、句子等層級分別創(chuàng)建指紋,而比對資源庫中的比對文獻(xiàn),也采取同樣技術(shù)創(chuàng)建指紋索引。這樣的分層多階指紋結(jié)構(gòu),不僅可以滿足我們對超長文獻(xiàn)的快速檢測,而且,因?yàn)槲覀兊淖钚≈讣y粒度為句子,因此,也滿足了系統(tǒng)對檢準(zhǔn)率和檢全率的高要求。原則上,只要檢測文獻(xiàn)與比對文獻(xiàn)存在一個(gè)相同的句子,就能被檢測系統(tǒng)發(fā)現(xiàn)。
功能
系統(tǒng)主要功能包括:已發(fā)表文獻(xiàn)檢測、論文檢測、問題庫查詢、自建比對庫管理等。
已發(fā)表文獻(xiàn)檢測:指檢測系統(tǒng)能夠自動(dòng)將屬于用戶的已正式發(fā)表的論文檢索出來,并對每一篇已發(fā)表文獻(xiàn)進(jìn)行實(shí)時(shí)檢測,快速給出檢測結(jié)果。
論文檢測:主要實(shí)現(xiàn)論文實(shí)時(shí)在線檢測功能。
問題庫查詢:指用戶可以將檢測結(jié)果中確認(rèn)有問題的文獻(xiàn)放入到問題庫,便于用戶集中管理。
自建比對庫:指管理人員可以選擇將檢測文獻(xiàn)放入個(gè)人比對庫或者批量上傳文獻(xiàn)作為個(gè)人比對庫,該個(gè)人比對庫即可作為以后學(xué)術(shù)不端文獻(xiàn)檢測的比對數(shù)據(jù)庫,該自建個(gè)人比對庫完全屬于用戶,其他用戶無權(quán)使用。
目的
中國知網(wǎng)學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)我們習(xí)慣叫他“中國知網(wǎng)論文查重檢測系統(tǒng)”。由CNKI科研誠信管理系統(tǒng)研究中心同方知網(wǎng)出版集團(tuán)旗下從事科研誠信管理產(chǎn)品研發(fā)的一款在線論文查重軟件。CNKI科研誠信管理系統(tǒng)研究中心主要從事學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)、科研誠信檔案管理系統(tǒng)等軟件研發(fā)。同時(shí)也承擔(dān)相關(guān)機(jī)構(gòu)委托的科研誠信監(jiān)測、管理等事務(wù)。還為各單位的學(xué)術(shù)評價(jià)提供科研誠信方面的參考數(shù)據(jù),?輔助進(jìn)行學(xué)術(shù)評價(jià)。
AMLC的目的是提供辨別和處理學(xué)術(shù)不端文獻(xiàn)的能力,為審查論文提供技術(shù)服務(wù)。檢測系統(tǒng)在對論文進(jìn)行檢測之后,生成檢測報(bào)告,為判斷論文性質(zhì)提供相關(guān)依據(jù)。
支撐
CNKI擁有強(qiáng)大的技術(shù)研發(fā)隊(duì)伍,已經(jīng)擁有了具有國際或國內(nèi)領(lǐng)先水準(zhǔn)的全面的數(shù)字出版的相關(guān)技術(shù),包括資源采集技術(shù),文本數(shù)據(jù)庫加工技術(shù),文本數(shù)據(jù)庫技術(shù),?數(shù)字資源版權(quán)保護(hù)技術(shù),?知識挖掘技術(shù),自然語言處理技術(shù)、快速比對技術(shù)等。在海量的全文數(shù)據(jù)的基礎(chǔ)上實(shí)現(xiàn)快速準(zhǔn)確的檢測,上述技術(shù)是基本的保證。
支撐資源
AMLC需要一個(gè)盡可能完備的全文數(shù)據(jù)比對資源庫,而CNKI的《中國學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫》則正好滿足這一要求。到目前為止,CNKI擁有學(xué)術(shù)期刊7000余種,期刊全文文獻(xiàn)2480萬篇,期刊期數(shù)和文獻(xiàn)收錄完整率都大于99.9%,文獻(xiàn)量居國際國內(nèi)同類產(chǎn)品之首;出版503家碩士學(xué)位點(diǎn)的72萬篇優(yōu)秀碩士論文,368家博士學(xué)位點(diǎn)的9.6萬篇博士論文;
1286家重要會議論文106萬篇;515家重要報(bào)紙500多萬篇;1376種重要年鑒787萬篇;600多種工具書220多萬條;學(xué)術(shù)引文索引數(shù)據(jù)600多萬條;這些出版物做到平均日更新20000條記錄;國家標(biāo)準(zhǔn)、專利、SPRINGER數(shù)據(jù)庫也集成到CNKI網(wǎng)絡(luò)出版平臺中;另外,出版平臺還集成整合出版了各類第三方數(shù)據(jù)庫資源1020種。
在收錄資源種類上,CNKI在國內(nèi)具有明顯優(yōu)勢,收錄了期刊、論文、會議論文、報(bào)紙、年鑒、工具書、專利、外文文獻(xiàn)、學(xué)術(shù)文獻(xiàn)引文等與科學(xué)研究、學(xué)習(xí)相關(guān)的主要資源。在資源收錄數(shù)量上,CNKI明顯優(yōu)于同類產(chǎn)品,各個(gè)資源庫收錄年限長,期刊等主要資源庫回溯到創(chuàng)刊。在資源更新速度上,CNKI產(chǎn)品除了第三方合作的外文文獻(xiàn)以外,其他資源都做到了日更新,單日更新數(shù)量大,這是推行產(chǎn)業(yè)化、標(biāo)準(zhǔn)化運(yùn)作的結(jié)果。
