学位论文查重的一点经验

高校毕业生想拿到学位,必须完成学位论文,而提交学位论文后面临的第一道关卡就是重复率检测。据说这是预防学术不端的第一道防线。高校学位管理部门一般使用知网系统查重,不同学校对重复率的要求各异,大部分学校规定去除引用后重复率不得超过10%对总复制比一般要求在30%以下,有的学校甚至更低。


(重复率检测对比数据库)

(学校查重主要看方框中的指标)


部分学校今年新政策规定,学校检测的论文版本直接取自系统中的学生上传的盲审版论文,格式必须为pdf版本。根据大家自行检测的结果对比发现,使用pfd版本检测,知网检测系统无法识别注释与正文的区别,注释会计算在重复率的范围内,而word版本检测,系统则可以识别注释,注释中的所有内容都不计算在重复率之内。因此,用word版本测即使重复率符合学校要求的论文,当格式转换为pdf之后,其重复率也容易超过学校的标准。


比如,某篇硕士论文的检测报告显示,该论文总字数为29136,重复字数为4771,总文字复制比为(4771/29136)16.4%。其中引用部分为4.5%,即重复字数中有(29136*4.5%)1311个字是引用,剩下的(4771-1311)3460个字符为重复部分,据此算出的去除引用文献复制比为(3460/29136)11.9%。根据该报告,发现论文中注释部分中有2277个字符被标注成意为存在文字复制现象的红色。若去除该部分重复的文字,全文重复字数应为(3460-2277)1183字。据此算出去除引用文献复制比应为(1183/29136)4.1%。而该篇论文注释全文共计2801字,删去该部分,进行检测的论文正文总字数为(29136-2801)26335字,重复字数共计1183字。据此算出去除引用文献复制比应为(1183/26335)4.5%。但正是由于采用pdf版本检测,该篇论文去除引用的复制比为11.9%而高于要求。因此建议大家自己在进行论文检测之前,先问清楚学校要求的检测版本,然后用相应版本进行检测。


对于降重或者其他一些规避重复率检测的技巧,如图片法、改写法、翻译法,早就在查重的江湖上热传,本人并未尝试,不便发表评论。但从规范的角度而言,只要认真完成论文,全文均属原创,重复率一般会在可控的范围之内。即使重复率略高于10%的规定,也不难降低。知网查重时,绿色的部分属于“引用”,红色的部分则“涉嫌剽窃”。降重,主要就是减少红色的部分。引用他人观点务必使用引号,否则同样会标红。


(加引号,便可以识别为引用)


尽管加了注释,标明了出处,但从查重的角度看依然不属于引用的范围。该部分重复率会计算在去除引用后的重复率之中。正如前所述,pdf检测难以识别注释与正文的区别,因此注释只能尽可能规范,同时降低正文中的重复比重,剩下的便是拼人品。


(注释也会标红)


学法律的同学在论文中引用法条,为了降低重复率,会把法条放在注释中,但注释中如不用引号对法条内容进行标识,依然会标红该部分仍然会计算在重复率之中。


(注释中的法条,未加引号而识别为抄袭部分)


对于学生而言,查重的确是一项经济负担,论文提交学校检测的前几天,我多次听到很多同学围在一起计算淘宝商家在毕业季的收入。每篇硕博论文在3月底4月初的要价在360—390元左右,平均按照每人检测三次计算,每个检测者就需要花费大概1080—1170元,据说有同学前后检测过十次(?)。此外,因为重复率的限制,导致花费大量的时间在降低重复率工作上,对于论文本身质量的提高并无多大助益。尽管如此,似乎也没有更好的方法取代重复率检测这第一道防线,重复率检测的要求在短期内依然会存在。因此建议在学位论文提交学校查重前,先在网上自费查重,直到低于学校要求的重复率。多花点钱,少流点泪。


预计今年各校论文检测工作已经结束,希望此篇简单的查重分享能对后来者有所帮助。