目前已投入約20余家單位測(cè)試和使用,反應(yīng)良好,一定程度杜絕了有抄襲可能的論文發(fā)表問(wèn)世。優(yōu)點(diǎn)當(dāng)設(shè)為50個(gè)字一塊時(shí),可以在較低信息粒度上查找出可能抄襲或相似的文獻(xiàn)。反剽竊系統(tǒng)是通過(guò)比對(duì)源文檔和目標(biāo)文檔相似性給出相似度結(jié)果的一種信息處理系統(tǒng)。我們把這個(gè)比例作為剽竊(相似)程度衡量指標(biāo)。規(guī)范引文及參考文獻(xiàn)去除,降低誤判可能性。由此軟件統(tǒng)計(jì)出相似度≥95%(基本原封不動(dòng)抄襲)與相似度≥80%(略作修改后抄襲)的字?jǐn)?shù)所占總字?jǐn)?shù)比例。低于此值可以完全無(wú)視。本軟件檢測(cè)結(jié)果存在一個(gè)小的誤差,用更小的文檔塊進(jìn)行檢測(cè),可以減少誤差,但需要的時(shí)間會(huì)相應(yīng)增加,經(jīng)過(guò)我們?cè)诙嗉揖庉嫴康脑囉们闆r,塊數(shù)大小定為200字較為合適,此時(shí)誤差率也是可以接受的,文檔相似率一般是比實(shí)際的要低。 ...