你不可不知的论文查重,纯干货!



导读
关于论文抄袭,一直是一个热门的话题,但是,我们在写毕业论文的时候,尤其是前言,总是避免不了各种引用,如果你大段的复制粘贴,那么,在最后查重的时候。。。你懂得。今天,灵感君带大家来了解一下论文查重的那些事儿!






各大查重引擎介绍




目前中国大学所采用的主要查重引擎有这些:
知网:


检测对比库:

  • 中国学术期刊网络出版总库

  • 中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库

  • 中国重要会议论文全文数据库

  • 中国重要报纸全文数据库

  • 中国专利全文数据库

  • 个人比对库

  • 其他比对库,部分书籍不在知网库,检测不到。


  知网论文检测的条件是13字单位以上的相似或抄袭都会被红字标注,但是必须满足如下前提条件:即你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到3%(3%是知网灵敏度的阈值,以段落计,低于3%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念)。


万方

与知网数据库绝大多数相同,价格低廉。是一些大专、三表本科、升本二表、部分在职硕士所经常采用的一种查重引擎。相对而言,万方查重是最松的。

PAPERPASS

       号称“最变态、最严格”,其实它外强中干。由于其数据库相对知网万方不全,故为了追求所谓“严格性”,经常性的用旁征博引的方法,肆意拉高其抄袭率。
       比如:曾经写过一篇关于中外文学英雄人物对比的核心期刊论文,PP显示抄袭了一篇香菇预防黄曲霉菌的论文;肖学弟写过一篇关于提高广东发展银行支付效率的MBA毕业论文,结果被PP标注抄袭了一篇肌肉运动与康复的论文;陈学妹有一次写了一篇幼教的硕论,结果PP查重标注抄袭了南京理工大学一篇电磁炮弹道的硕论……
       难道小孩子喜欢拿电磁炮的弹头当玩具?
       然而一些“特殊学校”,则为PP的宣传所信,要求学生要用PP查重,于是各种扫红、各种悲剧。
       最关键的是:PP的扫红,往往与知网扫红大相径庭!因为它们数据库不同,PP是靠旁征博引硬拉抄袭率才显得“严格”,就像两个女孩减肥,一个是用健康的有氧训练法,减掉的都是脂肪;另一个是为了追求体重轻而拼命喝泻药,结果减掉的是水分和纤维、肌肉,最后变成了一个满身脂肪和骨头的“怪胎”……
       其他的查重引擎,像维普、PR等,以及一些学校自己开发五花八门的查重引擎,除了PR拥有比PP还要严格的查重率要求外,并无很多学校采用,故在此不予更详细介绍了。


Turnitin

       这是一种专门用于查英文论文的查重引擎,它是以单词为标准,但是并不是机械的查重,而是如果仅仅是人称时态等简单变化的句子,连续8个单词还是会被扫红。







查重规律揭秘





“我明明每句话都改动了,为什么还是被扫红?”
“我明明每句话都标注引用了,为什么还是被扫红?”
“我明明改的非常多了,为什么还是被扫红?”
……
这是因为没有了个各个查重引擎的规律。
下面我分别介绍一下:


知网

      早期的知网是每20个字连续相同即判定为抄袭。几次升级后,知网查重已经变得越来越变态,现在不但连续6个字符相同就算是抄袭,哪怕一些句子中的主语和名词出现相同,即使连接词和虚词不同,也一样会被扫红。唯一的好处是:一些数学公式、定理是不会被扫红的。且基本不会对参考文献扫红。
       然而知网比较吝啬,证据是它是根据目录进行查重,如果它发现你上传的文档里有一个目录,而后面又出现一个目录,那么就认定是“合并查重”,就只会对第一个目录下的文档查重,后面的不闻不问。


万方

比较松的一种,基本是每10个字连续相同即为抄袭,且很少出现关键字相同连词不同也被扫红的问题。但是万方有一个问题:喜欢对公式定理与参考文献扫红。因此万方适合论文写作初期、大段大段抄袭并修改时期。


PP

      很变态的一种。它不但连续4个字就算抄袭,而且不管神马公式定理名人名言参考文献,一律标红;只要出现一句话2个关键词相同,或是一句话的语法句式一样,哪怕风马牛不相及的两个专业的论文也被标红;


其他

       像PR、维普等,更为变态,例如它们查数字和外文时,是以字母连续出现,而不是单词连续出现为标准的……


Turnitin

        关于该查重引擎的详细规律介绍,将由英语硕士张学妹在后面的第39章“九大专业论文写法之八:外语论文的特别书写经验”环节详细介绍。

       关于本节之处的“全文标注引用还是被扫红”这个问题,实际上就是:除了极少数公式、定理(理工类的)之外,哪怕引用名人诗词,99%也是要被扫红的。连参考文献名字都经常被扫红,何况参考文献里的内容?
       相对来说,理工科的论文可以通过变换模型、改变数字解决查重问题,但文科呢?悲催的文科学弟学妹们……


所以,写论文的时候,要记住:

  • 如果是引用,在引用标号后,不要轻易使用句号,如果写了句号,句号后面的就是剽窃了(尽管自已认为是引用),所以,引用没有结束前,尽量使用分号。有些人将引用的上标放在了句号后面,这是不对的,应该在句号之前。

  • 如果你看的外文的多,由外文自己翻译过来引用的,虽然查重的数据库只是字符的匹配,无法做到中文和英文的匹配,但是最好不要养成这样的坏习惯,该标注出处的要标注出处,不要因为自己翻译过来就可以视为己出。当然,如果是描述性的语言翻译过来,则可不必标引。

    以知网为例,上面的内容可以不看,但下面的内容你一定要看:

  • 1)知网查重时,黄色的文字是“引用”,红色的文章是“涉嫌剽窃”。


  • 2)知网查重时,只查文字部分,“图”、“mathtype编辑的公式”、“word域代码”是不查的(要想知道知网到底查那些部分,可以“全选”——“复制”——“选择性粘贴”——“只保留文字”)。建议公式用mathtype编辑,不要用word自带的公式编辑器。


  • 3)word、excel编辑的“表”是可以查出来的。在某些被逼无奈的情况下,可以选择把表截图放到论文里边去!作者亲眼见过有同学自己编的系数,查出来居然跟人家重了,数据决定了系数还不能变,欲哭无泪……


  • 4)参考文献的引用也是要算重复率的(包括在学校要求的X%以内)!所以引用人家文献的时候最好用自己的话改写一下


  • 5)知网的查重是以“章”为基本单元的。比如“封面”、“摘要”、“绪论”都会作为单独的一章,每一章出一个检测结果,标明重复率。每一章有单独的重复率,全文还有一个总的重复率。有些学校在规定论文是否通过查重时,不仅要求全文重复率不能超过多少,还对每章重复率也有要求。


  • 6)知网查重的确是以“连续13个字与别的文章重复”做为判断依据的,跟之前网上一些作者说的情况一致。如果你能够把论文改到任何一句与别的文章保证任意连续13个字都不一样,知网是查不出来的。


  • 7)但是,如果你有一处地方超过13个字与别的文章重复,知网的服务器都对这处地方的前后进行模糊搜索,那些仅仅是简单的加了一些“的”、“在……时”、“但是”等词语来隔断13个字多数情况是会检测出来的。这些模糊搜索有时候非常傻,可能会把一篇写如何养猪的文章跟你的那篇写建筑的文章关联到一起,!遇到这种情况,你就自己”呵呵“吧!


  • 8)书、教材在知网的数据库里是没有的。但是,copy书的同学需要注意,你copy的那部分可能已经被别的文章抄过了,检测的时候就重复了。这样的情况经常出现,尤其是某些经典理论,用了上百年了,肯定有人写过了!


  • 当然,有些同学觉得用自己的话改写一下就ok了。但现实情况是:这些经典理论用自己的话写了也一样有”标红“的可能,因为这些经典的理论已经被人翻来覆去写了N遍了!会不会”标红“就看你人品了!作者查重时,曾出现过一段话用自己的语言翻来覆去改了三遍仍然”标红“的情况,让人哭笑不得。只能说作者当时人品衰得没办法了,但愿现在发的这篇文章能攒些人品,以待来日!


  • 9)网络上的某些内容也是在知网的数据库里的。比如:“百度文库”、“道客巴巴”、“豆丁网”、“互动百科”、“百度百科”。作者查重的时候,甚至还遇到很多奇葩的网站,神马“东方财富网博客”、“ 。所以,选择网上的内容时要慎重


  • 10)外文文献,知网数据库里存储较少。鼓励大家多看外文文献,多学习国外的先进科学知识、工程技术,翻译过来,!


  • 11)建议各位学校查重前,在网上先自费查一遍。检测报告会对重复的地方”标红“,先修改一遍。


  • 12)检测一遍修改完成后,同学们不要掉以轻心。因为知网查重最变态、最令人愤怒的地方来了:第一次查重没有“标红”的地方,第二遍可能会出现“标红”,说你是抄袭。舍得花钱的话,在网上花钱再查一遍,直到低于学校要求的重复率。


整理:灵感君

内容来源:网络

图片来源:网络


温馨提示:推广的内容如有侵权请您告知我们会在第一时间处理或撤销;互联网是一个资源共享的生态圈,我们崇尚分享。转载请注明出处。