論文查重系統(tǒng)的技術局限有哪些?

論文查重系統(tǒng)雖然能快速比對目標論文與已發(fā)表文獻中的重復內容,但查重系統(tǒng)受到系統(tǒng)設計、技術實現(xiàn)等因素的限制,在查準率、查全率方面存在系統(tǒng)缺陷,不能準確判別重復內容在學術上的關系。
1)查重系統(tǒng)通常融合多種語義相似度算法來檢測目標論文是否存在重復,采用這種相似度算法盡管有利于檢測文字表達形式不同但語義相同的內容,但是也會造成誤檢,導致查全率不是百分之百。
2)相似度算法的閾值設置過低可能會造成誤判,如表達含義完全不同的對比文字存在多個相同詞語或語義相近詞語時,會因相似度過高而被判為重復。
3)圖表、公式等類似具有特定文字結構和表達形式的內容,即使內容不同?也會被誤判為重復。
4)預處理過程中,如果目標論文的組成部分識別不準確,可能會導致作者單位、參考文獻等內容被誤判為重復內容。
5)查重系統(tǒng)的主要功能是檢測剽竊行為,對于剽竊行為的界定,其比對的對象應當是整個人類知識。盡管查重系統(tǒng)開發(fā)公司掌握了海量的文獻數(shù)據(jù),但是受版權、數(shù)據(jù)獲取技術和收納時滯等因素的限制,查重系統(tǒng)的文獻數(shù)據(jù)庫中的數(shù)據(jù),相對于整個人類知識而言畢竟是少數(shù)。
6)查重系統(tǒng)對未收錄的外文著作和小語?種期刊等、沒有及時收錄的文獻以及圖像和音視頻等?非文本內容,都不能進行有效對比?。
7)在相似度計算時,語義相同的改寫因“相似度”不高而被判為不重復;
8)對研究思路、方法等較為抽象的內容,查重系統(tǒng)也不能進行有效檢測;
9)相同內容的圖表、公式等非文本數(shù)據(jù)轉化為文字時,往往不能被準確識別 。
從技術原理上看,查重系統(tǒng)是通過比對文本的某些特征或規(guī)律實現(xiàn)的,但查重結果不能自動判斷目標論文中的重復內容與已有文獻在學術上的關系,因此它就不能從科學規(guī)范、作者學術動機以及內容重復造成的后果危害上作出作者學術行為的判定,這是查重系統(tǒng)在技術上的本質局限。
論文查重降重綜合平臺:checkvvip.com?
(checkvvip論文查重系統(tǒng)有萬方、維普、源文鑒、Turnitin、iThenticate、早降重等十多個系統(tǒng),官方授權,權威檢測?。?/p>