毕业论文查重如何过?献上良策,拿走不谢!

这是“师生活”的第168篇原创文章,欢迎转发分享。这里有一群正在做教育和准备做教育的人,分享对职业和生活的点滴灵光。



又是一年毕业季,关于论文查重,毕业生们是很有话说的:

  • 我明明自己写的,为什么还是有重复率?

  • 我论文写的是小白鼠实验,怎么会和一篇论述某某经济体制的论文有复制关系?

  • 我引用的文字会算进重复文字里吗?

  • 为何不同学院的重复率会不同?

  • 转述会影响重复率吗?

  • 我可以大量引用自己已发表的文章吗?


论文牵涉到学术专利权,一直也是媒体关注的热点:


当然,论文查重已产业化,还养活了一批在线商人:


今天,我们就系统地聊聊论文查重这件事情。

论文查重的原理是什么


论文查重,就是论文相似度查询,如果某篇论文与已发表的论文的重复度太高,则该篇论文视为抄袭。那么问题就来了,重复率是怎么计算出的?已发表的论文指哪些论文?重复率多高算作是抄袭?以中国国家知识基础设施(中国知网)为例进行说明。


1.参照数据库


每个查重系统都有供参照的数据库,数据库数量及质量会影响查重率。中国知网检查某篇文章是否为抄袭的参照数据库有很多:


  • 中国学术期刊网络出版总库

  • 中国博士学位论文全文数据库

  • 中国优秀硕士学位论文全文数据库

  • 中国重要会议论文全文数据库

  • 中国重要报纸全文数据库

  • 中国专利全文数据库

  • 互联网资源

  • 英文数据库(期刊、博硕、会议、Springer、Taylor&Francis等众多数据库)

  • 港澳台学术文献库

  • 优先出版文献库


由此,我们也可以看出,中国知网的参照数据库多而全,想要投机取巧,抄袭前人的研究成果,几乎不太可能。


2.计算重复率


系统会按论文目录的章节自动将论文分为几段,一段一段地与上述数据库中已有的论文进行对比。有以下运行机制:


  • 连续10~15字与已有文献相似或者相同,系统会识别;

  • 句意检测,识别句子的主、谓、宾、形容词等,将其与数据库中论文句子的主、谓、宾、形容词等进行比较;

  • 段落扫描,识别段落中首句或者尾句等关键句,将其与数据库中论文的关键句进行对比,若发现有类似的文章,再将被检测论文与相似论文进行全篇幅对比。


不过,上述情况并非一定就会被系统标注出来,超过了系统灵敏度阈值的重复情况才会暴露。系统检测的阈值为3%,即系统划分的某一段中,与某单篇文章相似率大于等于3%,则该段中,全部的重复会被标记出来。比如,某一大段总共有6000个字,如果在这一大段中,单篇重复超过180个字,则会被检查出来,但如果低于3%,则系统检查不出来。


3.学校要求


学校对学生重复率的要求会根据学校、专业、学历不同而不同。比如,本科毕业论文的重复率可高达30%,而研究生则要求10%左右。重复率还与专业有关,若是自然科学类,有的要求5%以下,社会科学类,可放宽到20~30%。重复率也不是越低越好,该引用则要引用,只要坚持原创自己写就不用担心查重


看了原理仍会迷糊的问题



问:英文数据库能查英文重复率,那如果将英文翻译成中文,或者将中文翻译成英文,写在自己的文章里,会被发现吗?


答:就目前的检测技术来说,只能英文对比英文,中文对比中文。但有种情况是,如果某篇英文已经有人翻译引用了,则当再次有人翻译是,若翻译的关键信息一致,会被视为重复。


问:抄袭数据库中没有的作品,是不是就不会被检测出来?


答:理论上是,如果某一著作或者论文未在数据库的搜罗范围内,则抄袭不会被检测出来。但因为中国知网对信息的搜罗范围很广,很难确定某君打算大肆引用的某些文字不在其中。其次,如果某著作的文字已被其他的论文大量引用,则依然会被计算重复率。


 问:引用和转述对重复率有影响吗?两者有何区别?


答:引用其他论文中的原话,即便是有所标注,也会被系统计算为重复。转述是否会计入重复,要看转述语言的句式结构、主谓宾与论文原话之间的差异大小。如果不是刻意要降低重复率,小编认为是别人的观点就要标注出来,这不会影响到整体上的原创。当然,有时引用有可能也查不出来,这要看系统检测出的某段中的重复率,如果单篇低于3%,是不会被标注出来的。

 

问:引用自己的文章算不算作弊?


毕业论文中,存在引用自己已发表文章中的观点这种情况,检测系统会进行区分。在检测报告中有“总文字复制比”和“去除本人发表文献复制比”项目,至于是以哪个复制比作为评判标准,这就要看学校的相关要求。


 问:市面上现有的论文查重平台的优缺点有何差异?


答:现在市面上的论文查重平台有很多,包括paperpass、大雅、万方、中国知网、维普等。各大查重平台的基本原理都一致,但在数据对比库、最小对比单位等方面具有差异。最准确的是中国知网,这也是高校普遍使用的查重系统。使用别的查重系统,切记只能作为参考!!!


如果论文是自己书写的,除在那种明显存在过度引用的地方进行修改外,切不可一味为了降低重复率而胡乱修改自己的文章,毕竟各系统的查重还是有差别,只要各位年轻学者秉承原创,是没有问题的。

良策献上


如果确实需要刻意降低重复率,可有以下几种方式。

 

1.将不重要但又重复的语言删除

 

一篇文章中,恰恰是那些不怎么重要非核心的语言最容易重复了。所以,当系统显示出那些不重要又重复率高的文字,可调整论文逻辑,直接删除,别那么啰嗦,简洁明了将话说清楚就可以了。

 

2.关键性语言重复了,就只有换一种说法

 

对于同一类文章,有些关键性语句也有可能重复。这时,就只有换种说法,但不能仅仅加点了、的、好、不错等词汇,因为整句话的句式和主谓宾都没有发生实质性的变化。如,一日之计在于晨,应改为一天当中,早晨是最适合学习、工作的时光。

 

还有一种方式是,既然是引用,某一中文文献中的观点在外文文献中应该也有,可引用外文文献中的观点,这样,经过自己翻译之后(一定是自己翻译),会大大降低重复率。

 

3.将文字转化为图片或者表格


目前,系统对图片、表格的检测还没有相关要求,将重复的文字进行总结,制作成概念图、表格等,可降低重复率

 

4.引用不要集中于一篇


要引用某些观点,若某一篇论文中恰好包含了多种可供引用的观点,建议不要单纯只引用某一篇论文,而是寻找存在某一观点的另一篇论文,因为单篇引用不能超过3%。同时,万不得已的时候,也只好转述某些观点,用自己的话进行说明。

 

PS.只要是自己认真书写的论文,一般是不会存在因重复率不通过的情况。本文不针对希望抄袭论文而毕业的童鞋,上述那些降低重复率的办法也是供大家万不得已的情况下使用,如,社会科学学科用自然科学学科的标准来要求毕业论文,就不得不为降低复制比而头疼了。



  • 研究生期间最重要的关系...怎么处?

  • 三年青春换得一纸硕士文凭,值么?

  • 毕业论文排版宝典1:前期准备

  • 毕业论文排版宝典2:自动编号

  • 毕业论文排版宝典3:快速排版

  • 核心期刊?CSSCI?还在傻傻分不清 III(文末有投稿指南)

  • 核心期刊?CSSCI?还在傻傻分不清 Ⅱ(文末有投稿指南)

  • 核心期刊?CSSCI?还在傻傻分不清 Ⅰ(文末有投稿指南)