毕业季 ||有关论文查重的那些事儿!









(向上滑动启阅)

致毕业生:


今天,小编给即将毕业的同学们带来几篇关于论文查重的文章,希望能有所帮助。内容既有

    哪些行为算抄袭?

    如何提前“自测”?

    如何看懂查重结果?

也有关于重复率修改,从查重软件运行机制、原理、检测报告分析以及应对策略等方面进行详细阐述和分析,干货多多,非常实用。论文检测及重复率修改,掌握方法其实非常简单,更没有很多同学想像的那么可怕。好好研究研究攻略,掌握好对策,很容易哦!


——小编








1








2


来源:cnki知网论文检测cnki-papercheck

【一】论文检测报告分析及降低重复率方法


 
常见问题答疑


1、检测结果是0%的情况。

这是正常的情况,说明同学引用文字没有达到论文总字数的1%。如果同学对结果有异议的话,可以在通过了学校的检测之后再确认收货。我们的检测中出现过很多次重合率为0%的情况了,我们不再作过多的解释了。

2、我已经发表过一篇小论文,引用的话会算重合率吗?

这个问题只有您的学校里负责论文检测的老师才能说明白了,因为涉及到他对系统怎么设置。我们默认的检测方式是不去掉第一作者的,也就是说您的引用自己的论文的部分仍然会作为重合部分或参考文献部分进行计算。

3、英文论文。

因为在知网VIP版系统中,中英文库是不能同时选择的,所以除非同学知道学校使用的比对库是英文的还是中文的,否则我们不能检测。因为使用的比对库不同,结果会天差地别的。

4、有些同学可能很奇怪,自己在论文中明明引用或者抄袭了其他文献的段落或句子,为什么没有检测出来?

这是因为知网的检测系统灵敏度设置了一个阀值,该阀值为1%,以段落计,低于1%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。举个例子:假如段落1有10000字,那么引用单篇文献100字以下,是不会被检测出来的。实际上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。

5、 我明明标注并做了正确的引用了,为什么检测报告中还会对这些内容标红?

知网系统对于正确引用的内容也会标红的,否则如果我们全篇都是引用其他的参考文献的内容,但是我们只要做了正确的标注,那么岂不是重合率还是0%?系统不会有这样的漏洞的。

6、为什么我的论文明明是六个章节,而标红报告中只列出了四个?

这是因为没有重合的章节系统是自动省略掉的。

7、为什么我的论文去年检测的重合率是20%,而今年就变成了30%?

这是因为知网每天都是有大量新近发表的文献入库的。所以同学来检测的时间不要距离学校机测的时间太长,也最好不要参考太新发表的文献。因为这样都有可能造成因为时间差的问题,导致检测的重合率出现偏差的情况。

8、为什么检测报告中的章节划分和我论文中的有差别。

这说明同学论文的目录格式不规范,所以知网的系统将论文自动划分章节。

9、为什么我的检测报告中会有部分特殊符号或乱码?

这是因为同学的论文中有类似修改标记的东西,正常我们的word显示时看不到这些标记的,同学在word中打开“工具”-》“选项”-》“视图”,将“全部”选上并确定后,再看我们的文档,就会发现这些特殊的标记了。要清除这样的标记需要我们将我们的论文全文拷贝成文本格式到一个新建的word文档中才可以。

检测报告如果有些章节缺失,不是没检测完,是这些章节未发现抄袭,系统自动排除,所以检测报告中没有。假如总复制比是0,也就是全文未发现抄袭,那检测报告里什么都没有。



【二】论文查重算法分析及对策研究

现在高校对于硕士和博士论文采用的检测系统,是由知网开发的。但该软件的具体算法,判定标准,以前一直不清楚,本文是从主页君知网内部工作朋友提供的,揭示了知网反抄袭检测系统的算法,如何判定论文是抄袭,以及如何修改来通过的秘籍。发出来造福大家

1对格式的要求


    
知网学位论文检测为整篇上传,格式对检测结果可能会造成影响,需要将最终交稿格式提交检测,将影响降到最小,此影响为几十字的小段可能检测不出。都不会影响通过。系统的算法比较复杂,每次修改论文后再测可能会有第一次没测出的小段抄袭(经2 年实践经验证明,该小段不会超过200 字,并且二次修
改后论文一般会大大降低抄袭率)

2对比库

    对比库为:中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,中国重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,个人比对库,其他比对库, 部分书籍不在知网库,检测不出抄袭。知网库是国家指定的论文检测对比库,国家指定高校论文检测系统为知网学位论文检测系统,该系统是目前效果最好、范围最广的官方检测系统,所有高校都是知网的检测系统,。

3关于分段和分章出结果


    上传论文后,系统会自动检测该论文的章节信息,如果你学校的目录设置符合知网系统内置的分章判断条件,系统就会按章检测,分章出结果,否则会分段出结果。关于分段或分章主要涉及4 中的阀值。诚信论文提醒,不论是分章还是分段,保持和学校一致即可。

4引用的能检测出来吗?

    有的同学问:“我明明引用了别人的段落或句子,为什么没有检测出来?”也有的同学问:“我的引用标注了出处,为什么还算抄袭?”首先,引用算不算抄袭,与标注出处没有任何关系,引用能不能检测出来,与系统准不准确也没有关系。所有这些都靠系统的阀值来决定。中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为3%,以段落(或章节)的字数来计算,单篇文献低于3%的抄袭或引用是检测不出来的,这种情况常见于大段文字中的小句或者小概念。举个例子:假如检测段落1(第一章)有10000 字,那么引用A 文献300字(10000 乘以3%=300)以内,是不会被检测出来的。若引用B文献超过300字,那么B文献分布于第一章中的抄袭都会被红字标注,不管位于第一章何处,即使打断成句子,只要超过20字就会被标注。实际上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。关于一些同学问引用的为什么也算抄袭,这里主要是因为知网的阀值问题,高于3%的统一算抄袭,也就是说引用于抄袭的临界就在3%之间。一旦你超标,即使你标注了引用也无济于事。所以请同学们注意。我们举例说明:某篇论文第一章有5000 字,那么第一章中,我们就只能引用A文献150 字以下,否则会被系统认为是抄袭。第二章4000 字,那么我们只能引用A 文献120字以下,否则会被系统认为是抄袭。第三章8000 字,第四章7000 字,分别为240 字以下和210 字以下,以此类推。综上所述,引用超标的计算方式是按章计算,这与抄袭的计算方式是一样的。

5系统对一句话怎么才算抄袭?


    
一篇论文的抄袭怎么才会被检测出来?知网论文检测的条件是20字单位以上的相似或抄袭都会被红字标注,但是必须满足4里面的前提条件:即你所引用或抄袭的A 文献文字总和在你的各个检测段落(各章)中要达到3%。
引用:

6抄袭的修改方式


    针对标红文字的修改方式除了3中提到的外,还有改词、换句、改变描述方式(变原句为倒装句、被动句、主动句等)、打乱段落顺序、删除关键词汇、关键句等。经过实践证明,使用以上方法结合,可有效降低复制比,保证顺利通过。

【三】查重软件运行机制及应对策略

1论文查重软件的运行机制

1、检测以全文描述型检测为主,也就是将全文分为几个检测段落,一般以文章连贯性、逻辑性和字节数划分。

2、段落扫描,将每一个自然段落段首或者段尾的关键句(也就是可能为段落中心思想的那一句)作为Key,来进行全系统比对,锁定抄袭的对象论文。然后针对可能的抄袭对象论文进行全文对比扫描。

3、句意检测,将一个长句节选出作为语句骨干的名词、动词、形容词,来进行比对,这也就是为了防止论文抄袭时一般的修改。(假定条件是你的行文逻辑与抄袭文章一致)

4、字节检测,一般以10-15个中文字符作为文本检测对象,这也是一般包含主谓宾的中文长句的长度。

2学生的应对策略:

1、首先针对全文描述检测,在不影响文章逻辑架构的基础上,尽量将文章段落与原文进行区别,或者尽量多的使用不同资料来源以避免单篇文章的命中。

2、段落扫描,在文意不变、段落中心思想不变的情况下,修改文章关键句的字面,也就是通常说的换个说法,这个不难吧,好像小学语文就练习过相关能力吧,嘿嘿!!

3、针对句意检测,针对论文检测报告中标红的部分进行句意改写,也就是将名词主语,形容词,名词宾语进行改写,同时可以在文意不变的情况下尽量调换主谓顺序,如改为被动句(OO使XX改为XX被OO等。)

4、针对字节检测,尽量使用简明扼要的短句,阐述一个问题需要长句时,在不妨碍阅读的情况下多使用逗号断开。

5、实在不行就抄书吧,出版物的内容目前不在比对库中,这样安全比例高,但是一定要保证抄的这些书比较少有人关注。因为如果大家抄的都是一本书,一个先发论文,一个后发论文,那后面抄书的那位同学就不是抄书,而是抄的前面那位仁兄的论文,这就是引用也撞衫!



3

附:湖南大学本科论文查重的实行管理办法以及注意事项