時間:2017-09-18 編輯整理:早檢測網 來源:早檢測網
這個問題的答案是,沒有一個“神奇的數字”能夠告訴你一篇文章是否包含有問題的內容。相似率只是為你提供一個粗略的“標題”,以確保你能夠直接注意到那些有大量重復的文章,而快速忽略掉幾乎沒有重復的文章。除此之外,相似率本身不會給你確切的答案,也絕對不能告訴你這篇文章是否有抄襲的情況。
為什么會這樣呢?
其實,當評估一篇文章的整體相似率時要考慮到若干因素。
首先,需要注意的是相似率告訴你的是一篇文章中和其他文章相同 (即所謂的匹配)的文字的總量。這個總量可能是由許多較小的匹配組成的。相似率30%有可能是指30%匹配同一篇文章,但更有可能的情況是,這30%是由許多較小的匹配相加而成,這些小的匹配最大都不超過4或5%。這只有在看詳細的論文查重報告時才能看出來。
當然,一篇有6個5%匹配的文章可能和一篇30%都抄自同一篇文章的文章一樣有抄襲的問題。不過不看查重報告就沒法確定了。
其次,匹配出現在文章的哪一部分有時比到底有多少文字匹配更重要。例如,某些學科領域的編輯可能不太在意方法部分的重復,因為要描述一個過程也只有那么多的方式。而另一方面,在討論或結論部分的匹配,盡管它可能只占手稿的一小部分,如果沒有適當的引用,也會引起編輯的懷疑。
同樣的,一類文章的可接受的閾值未必適合另一類型的文章:綜述文章相似率通常會比研究文章高一些。
同樣需要記住的是在未編輯的手稿中可能存在一些簡單地錯誤而導致查重軟件錯誤地標出存在匹配的部分。查重軟件的排除書目功能是依賴于在文章的參考文獻部分有一行是reference這個標題。如果這個標題在手稿中被省略,參考文獻部分將不被排除在外。
同樣,排除引文功能是通過查找引號。如果作者沒有使用引號或是在開頭或結尾漏掉一個引號時,系統不會識別出引用的文字,即使編輯們可以通過文章布局和參考文獻一眼看出是引用的文字。