毕业论文知网查重那些事

    

    2017届硕士研究生的毕业论文按学校要求进度目前已经到了终稿完成阶段,针对最头痛的知网查重问题,今天,特给同学们推送关于重复率修改的文章,从查重软件运行机制、原理、检测报告分析以及应对策略等方面进行详细阐述和分析,干货多多,非常实用,论文检测及重复率修改,掌握方法其实非常简单,更没有很多同学想象的那么可怕,好好研究研究攻略,掌握好降低对策,很容易哦!

 

一、CNKI知网VIP系统

  此检测系统是最新学术不端文献检测系统5.0(习惯叫做知网VIP,最新系统为5.1),是全国高校普遍用来检测硕博毕业论文的检测系统。他也就是知网最高级版本,检测精度最高!最严格!连续13字符(大概7字)相似就会标红。上传字数限制30万一次,硕士5万字内博士10万字内为佳。

 

二、CNKI知网TMLC系统

  此检测系统是学位论文学术不端行为检测系统(TMLC2),是知名高校普遍使用的知网系统。以《中国学术文献网络出版总库》为全文比对数据库,实现了对抄袭与剽窃、伪造、篡改等学术不端行为的快速检测,可供用户检测学位论文,并支持用户自建比对库。


三、CNKI知网PMLC系统

  “大学生论文抄袭检测系统”(简称PMLC)也叫“中国知网大学生论文管理系统”由清华同方知网自主开发。2010年8月“正式发布,它将全面应用于高等院校的日常教学,帮助高校检查学生论文、作业中是否存在抄袭剽窃行为。面向高校教务处等各级学生管理部门学风建设与管理的需求开发,用于辅助高校教务处管理大学生论文,全程监控论文中是否存在抄袭剽窃等学术不端行为,建立学生诚信档案,帮助提高大学生论文质量。一般本科毕业采用该系统!本科使用最准确,检测范围数据库特点是囊括“大学生联合对比库”。对于抄袭本科论文检测非常有效!只有知网PMLC才可以检测到“大学生联合对比库”。中国知网大学生论文抄袭检测系统也可以测专科毕业论文!

 

四、CNKI知网AMLC系统

  科技期刊学术不端文献检测系统,简称AMLC系统。本系统以《中国学术文献网络出版总库》为全文比对数据库,可检测抄袭与剽窃、伪造、篡改、不当署名、一稿多投等学术不端文献,可供期刊编辑部检测来稿和已发表的文献。本系统限科技学术期刊编辑出版单位内部使用,只能用于检测本刊的来稿和已发表文献。

五、CNKI知网SMLC系统

  社科期刊学术不端文献检测系统,简称“SMLC”。本系统以《中国学术文献网络出版总库》为全文比对数据库,可检测抄袭与剽窃、伪造、篡改、不当署名、一稿多投等学术不端文献,可供期刊编辑部检测来稿和已发表的文献。本系统限社科学术期刊编辑出版单位内部使用,只能用于检测本刊的来稿和已发表文献。



【一】论文检测报告分析及降低重复率方法

1
本文目的



为帮助同学快速、有效的降低论文重合率,顺利毕业



2
修改什么、修改哪些



修改什么,修改多少

同学应该弄清楚的问题,应明确自己该修改哪里,修改到什么程度:

1、您就读的学校在论文检测中使用的是什么系统?(一般是知网)

2、重合率要求是多少?(一般为20%)

3、您的检测报告是否完全看懂了?

弄清楚了这些问题,就明白自己论文修改的终极目标



3
如何降低重复率



1、如果您的论文字数足够,可以将检测出来的重合文字进行一定的删减,将不重要的,不影响核心论述的重合文字删掉,也可以快速、有效的降低论文的文字重合率。

2、对于论述性的文字,如果觉得有必要保留,而又不想做引用标注的,简单的改变文字顺序,或者修改一两个字,是不会有效的。最好的办法就是用自己的话进行重写了,例子:“一日之计在于晨”改为“早上是一天中工作效率最高的时段”,改到这样的程度可以保证百分之百没有问题。如果简单的改成“一日之计在于早晨”,则不会有丝毫的用处。

3、将外语资料翻译成中文,或将繁体资料翻译成简体。这样做会一般来说显著降低文章的重合率。但是是学术不端行为,那就是原文的作者如果发现的话,可能会找上门来。这不是危言耸听,这样的情况在各大学校已经发生过多次了,结果就可想而知了。正确的做法是,将外语或繁体资料转化成简体后,再根据自己的对该知识的所学所悟,用自己的语言和逻辑重新组织一下。原文经典语句,一定要做好脚注、尾注的真确标记,方可引用。

4自己制作表格,将文字叙述转化为表格的形式。目前系统对表格的重合支持的也不好。因此,将文字论述转化为表格的形式体现出来,是一个好办法。什么?表格你也要原样COPY?那我就低调的保持沉默了。

5、如果大段引用某篇文献时又实在不知道该如何修改引用的内容时,那就将引用的段落中句子的顺序打乱从新进行用自己的话语组合,也会部分降低重合率,打乱的过程中稍作修改效果会更好。但是这样的修改不可能将重合的文字全部消除哦。



4
常见问题答疑



1、检测结果是0%的情况。

这是正常的情况,说明同学引用文字没有达到论文总字数的1%。

2、我已经发表过一篇小论文,引用的话会算重合率吗?

这个问题只有各自学校里负责论文检测的老师才能说明白了,因为涉及到他对系统怎么设置。一般默认的检测方式是不去掉第一作者的,也就是说您的引用自己的论文的部分仍然会作为重合部分或参考文献部分进行计算。

3、英文论文。

因为在知网VIP版系统中,中英文库是不能同时选择的,所以除非同学知道学校使用的比对库是英文的还是中文的,否则不能检测。因为使用的比对库不同,结果会天差地别的。

4、有些同学可能很奇怪,自己在论文中明明引用或者抄袭了其他文献的段落或句子,为什么没有检测出来?

这是因为知网的检测系统灵敏度设置了一个阀值,该阀值为1%,以段落计,低于1%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。举个例子:假如段落1有10000字,那么引用单篇文献100字以下,是不会被检测出来的。

5、我明明标注并做了正确的引用了,为什么检测报告中还会对这些内容标红?

知网系统对于正确引用的内容也会标红的,否则如果我们全篇都是引用其他的参考文献的内容,但是我们只要做了正确的标注,那么岂不是重合率还是0%?系统不会有这样的漏洞的。

6、为什么我的论文明明是六个章节,而标红报告中只列出了四个?

这是因为没有重合的章节系统是自动省略掉的。

7、为什么我的论文去年检测的重合率是20%,而今年就变成了30%?

这是因为知网每天都是有大量新近发表的文献入库的。所以同学来检测的时间不要距离学校机测的时间太长,也最好不要参考太新发表的文献。因为这样都有可能造成因为时间差的问题,导致检测的重合率出现偏差的情况。

8、为什么检测报告中的章节划分和我论文中的有差别。

这说明同学论文的目录格式不规范,所以知网的系统将论文自动划分章节。

9、为什么我的检测报告中会有部分特殊符号或乱码?

这是因为同学的论文中有类似修改标记的东西,正常我们的word显示时看不到这些标记的,同学在word中打开“工具”-》“选项”-》“视图”,将“全部”选上并确定后,再看我们的文档,就会发现这些特殊的标记了。要清除这样的标记需要我们将我们的论文全文拷贝成文本格式到一个新建的word文档中才可以。

检测报告如果有些章节缺失,不是没检测完,是这些章节未发现抄袭,系统自动排除,所以检测报告中没有。假如总复制比是0,也就是全文未发现抄袭,那检测报告里什么都没有。



【二】论文查重算法分析及对策研究

现在高校对于硕士和博士论文采用的检测系统,是由知网开发的。但该软件的具体算法,判定标准,以前一直不清楚,本文是从知网内部工作朋友提供的,揭示了知网反抄袭检测系统的算法,如何判定论文是抄袭,以及如何修改来通过的秘籍。

1对格式的要求


    
知网学位论文检测为整篇上传,格式对检测结果可能会造成影响,需要将最终交稿格式提交检测,将影响降到最小,此影响为几十字的小段可能检测不出。都不会影响通过。系统的算法比较复杂,每次修改论文后再测可能会有第一次没测出的小段抄袭(经实践经验证明,该小段不会超过200 字,并且二次修改后论文一般会大大降低抄袭率)

2对比库

    对比库为:中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,中国重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,个人比对库,其他比对库, 部分书籍不在知网库,检测不出抄袭。知网库是国家指定的论文检测对比库,国家指定高校论文检测系统为知网学位论文检测系统,该系统是目前效果最好、范围最广的官方检测系统,所有高校都是知网的检测系统,。

3关于分段和分章出结果


    上传论文后,系统会自动检测该论文的章节信息,如果学校的目录设置符合知网系统内置的分章判断条件,系统就会按章检测,分章出结果,否则会分段出结果。关于分段或分章主要涉及4 中的阀值。

4引用的能检测出来吗?

    有的同学问:“我明明引用了别人的段落或句子,为什么没有检测出来?”也有的同学问:“我的引用标注了出处,为什么还算抄袭?”首先,引用算不算抄袭,与标注出处没有任何关系,引用能不能检测出来,与系统准不准确也没有关系。所有这些都靠系统的阀值来决定。中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为3%,以段落(或章节)的字数来计算,单篇文献低于3%的抄袭或引用是检测不出来的,这种情况常见于大段文字中的小句或者小概念。举个例子:假如检测段落1(第一章)有10000 字,那么引用A 文献300字(10000 乘以3%=300)以内,是不会被检测出来的。若引用B文献超过300字,那么B文献分布于第一章中的抄袭都会被红字标注,不管位于第一章何处,即使打断成句子,只要超过20字就会被标注。实际上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。关于一些同学问引用的为什么也算抄袭,这里主要是因为知网的阀值问题,高于3%的统一算抄袭,也就是说引用于抄袭的临界就在3%之间。一旦你超标,即使你标注了引用也无济于事。所以请同学们注意。我们举例说明:某篇论文第一章有5000 字,那么第一章中,我们就只能引用A文献150 字以下,否则会被系统认为是抄袭。第二章4000 字,那么我们只能引用A 文献120字以下,否则会被系统认为是抄袭。第三章8000 字,第四章7000 字,分别为240 字以下和210 字以下,以此类推。综上所述,引用超标的计算方式是按章计算,这与抄袭的计算方式是一样的。

5系统对一句话怎么才算抄袭?


    
一篇论文的抄袭怎么才会被检测出来?知网论文检测的条件是20字单位以上的相似或抄袭都会被红字标注,但是必须满足4里面的前提条件:即你所引用或抄袭的A 文献文字总和在你的各个检测段落(各章)中要达到3%。

6抄袭的修改方式


    针对标红文字的修改方式除了3中提到的外,还有改词、换句、改变描述方式(变原句为倒装句、被动句、主动句等)、打乱段落顺序、删除关键词汇、关键句等。经过实践证明,使用以上方法结合,可有效降低复制比,保证查重顺利通过(文章完整和通顺、准确为第一位,切不可单纯为了降低重复率而改为四不像)。

【三】查重软件运行机制及应对策略

1论文查重软件的运行机制

1、检测以全文描述型检测为主,也就是将全文分为几个检测段落,一般以文章连贯性、逻辑性和字节数划分。

2、段落扫描,将每一个自然段落段首或者段尾的关键句(也就是可能为段落中心思想的那一句)作为Key,来进行全系统比对,锁定抄袭的对象论文。然后针对可能的抄袭对象论文进行全文对比扫描。

3、句意检测,将一个长句节选出作为语句骨干的名词、动词、形容词,来进行比对,这也就是为了防止论文抄袭时一般的修改。(假定条件是你的行文逻辑与抄袭文章一致)

4、字节检测,一般以10-15个中文字符作为文本检测对象,这也是一般包含主谓宾的中文长句的长度。

2学生的应对策略:

1、首先针对全文描述检测,在不影响文章逻辑架构的基础上,尽量将文章段落与原文进行区别,或者尽量多的使用不同资料来源以避免单篇文章的命中。

2、段落扫描,在文意不变、段落中心思想不变的情况下,修改文章关键句的字面,也就是通常说的换个说法,这个不难吧,好像小学语文就练习过相关能力吧。

3、针对句意检测,针对论文检测报告中标红的部分进行句意改写,也就是将名词主语,形容词,名词宾语进行改写,同时可以在文意不变的情况下尽量调换主谓顺序,如改为被动句(AA使BB改为BB被AA等。)

4、针对字节检测,尽量使用简明扼要的短句,阐述一个问题需要长句时,在不妨碍阅读的情况下多使用逗号断开。


温馨提示:


  CNKI知网查重是最权威的!硕士用知网VIP或者TMLC(单篇市场价240-320元均为合理,越接近全国硕士毕业论文外审阶段即3月底4月初越贵),而本科一般用知网PMLC(市场价单篇60-100元为合理)。虽然只差一个大学生联合对比库对于本科生来说这2个检测系统往往结果相差很大。而知网期刊检测系统AMLCSMLC(单篇20-45元为合理)他们的结果一般误差不大,不管社科还是科技不要太在意系统版本区别。

建议:

1.初稿完成,用免费的paperpass、万方(3万字30元)等检测,进行初次修改。

2.经导师指导,已经多次修改,终稿已经完成,用分段检测的PMLC/AMLC/SMLC检测,(3万字的文章分段检测下来总费用约在90-150元),二次修改。

3.排版已定,最终定稿成型,3月中下旬(过早的话知网检测数据是动态的,如果检测数据在20%左右,等学校检测准备外审就会心虚得再检测一次。过迟,市场检测费用会有上浮,而且越后期知网整个检测系统都很慢,有时候1天都出不来结果),可用VIP或者TMLC系统检测(价格高,此阶段一般市场价在280到320元,如果分段二次检测低于5%,本次检测基本可以省略)。


论文成型是千锤百炼不断打磨的过程

最后望正在辛苦熬夜写论文的同学们

踏踏实实写论文,老老实实待检测,定做问心无愧!


▎素材来源:网络,若侵权,即删
▎文章编辑:山西师大研究生资讯