知网论文查重检测的原理与修改攻略
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
知网论文查重检测的原理与修改攻略
揭秘:知网论文查重的规则及检测原理
当我们写毕业论文时会想到知网论文查重,当我们拿到不达标的检测结果时我们会苦于不了解知网论文查重的规则及检测原理而无从下手。
降低重复率就好比一场战争,知己知彼方能百战百胜;降低重复率需要对症下药,因此我们必须了解知网论文查重的规则原理:
1、知网论文查重由于是采用了最先进的模糊算法,如果整体结构和大纲被打乱,可能会引起同一处的文章检测第一次和第二次标红不一致或者第一次检测没有标红的部分第二次检测被标红。
因此在修改重复内容的时候尽量变换句式,不要打乱论文原来的整体大纲和结构。
2、整篇论文上传后,系统会自动根据文章生成的目录检测该论文的章节信息,然后系统会将论文分章节检测,可以获得每一单章节的复制比同时目录显灰色不参与正文检测;否则会自动分段按照1万字符左右检测,同时目录有可能当成正文检测,重复就会标红。
3、中国知网对该套查重系统的灵敏度设置了一个阀值,该阀值为5%,以段落计,低于5%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。
举个例子:假如检测段落1有10000字,那么引用单篇文献500字以下,是不会被检测出来的。
实际上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。
4、一篇论文的抄袭怎么才会被检测出来?知网论文检测的条件是连续13个字相似或抄袭都会被红字标注,但是必须满足3里面的前提条件:即你所引用或抄袭的A文献文总字数和在你的各个检测段落中要达到5%以上才能被检测出来标红。
5、知网检测系统会自动识别出参考文献,参考文献不参与正文检测。
并且进行剔除,在知网检测报告中参考文献显示灰色字体,说明并没有参与检测。
当然这是在参考文献格式完全正确规范的情况下才会自动排除不会标红。
否则参考文献会当成正文来进行检测导致参考文献全部标红。
结果增高!
6、知网论文查重为整篇上传,PDF或者Word格式对检测结果可能会造成影响。
因为上传PDF检测,PDF会比Word多一个文本转换的过程,这个过程有可能会将你原本正确的的目录和参考文献格式打乱,目录和参考文献等格式错乱,就会导致系统识别不正确而被标红。
特别对于那些有英文目录和大部分英文参考文献的论文,其英文占字符数很高。
英文被标红就会导致总结果大大增高。
7、关于引用尽量引用整段话,如果引用单独一句两句,知网系统是根本识别不到具体你引用的是哪篇文章里面的句子。
所以引用尽量大段引用。
并且引用的内容必须完全一致。
总结:根据这些规则原理,我们就可以针对性的去预防和修改来躲避知网论文查重系统的检测。
根据这些规则原理大可归纳为:论文排版格式是基础,抄袭不能大片的抄袭,但引用要大段的引用。
学长归纳总结了“帮你顺利通过论文查重的6个技巧”
知网论文查重检测的原理以及经验分享
写在前面:不管是本科毕业生、还是硕士博士研究生、亦或是社会研究学者,只要写过论文的人,都必须注意自己论文完稿与现有学术文献的相似度,因为这直接关系到对这篇论文的原创度的判断。
大部分的普通论文写作者,在论文创作过程中,会参考到非常多的文献资料、实验数据等等……这些参考来的片段是引起重复率偏高的重要因素。
对于论文原创度的合格标准,各个学校之间也不尽相同,有些学校定的标准线稍为宽松一些,重复率在30%或20%以下就算合格;而有些学校则比较严格,规定要在10%甚至5%以下才算合格。
5%的要求真的是极度严格了,因为常用字就这么三千多个,专业领域的词汇也都是通用的,随便写点什么都可以查找到相似的句段……
为了在论文写作战线上的同志们能够最大化的降低论文完稿的重复率,本人将中国知网检测系统的查重经验做一个整理总结,希望能给大家有一定的帮助。
毕业生的论文能够顺利通过,期刊投稿的能够顺利发表,评职称的能够顺利升职!
国内应用最广泛,最权威的是知网系的检测系统,那我们这里就以知网检测系统来作为案例来做一些具体的分析。
前面这些都是跟大家瞎聊,下面这些才是正式开始:
(1)在知网查重报告中,标黄色的文字代表这段话被判断为“引用”,标红色的文字代表这段话被判断为“涉嫌剽窃”。
(2)在知网查重进行中,检测系统只能识别文字部分,论文中的图片、word域代码、mathtype编辑的公式、是不检测的,因为检测系统尚无法识别这些复杂的内容格式。
你可以通过[全选]——[复制]——[选择性粘贴]——[只保留文字]这样步骤的操作来查看具体的查重部分。
另外,在编辑公式时,建议使用用mathtype,不要用word自带的公式编辑器。
(3)论文中的表格内容数据是可以识别的。
如果表格的内容有很大的重复度,那么可以把表格截图保存,再放到论文中去。
(4)论文中引用的参考文献部分也是会计算相似度的,所以引用的时候,最好的方式就是先理解内容,再用自己的话写出来。
(5)知网检测系统对论文的分节是以“章”作为判断分节的。
封面、摘要、绪论、第一章、第二章、等等这样一系列的都会各自分成一个片段来检测,每一个片段都计算出一个相似度,再通过这样每章的相似度来计算出整篇论文的总重复率。
(6)有一点可能很多人都已经知道了,就是在知网查重系统中,是以“连续13个字重复”做为识别标准。
如果你能够通过修改,让你的论文任意一句话都找不到连续13个字与别人的文章相同,这样就检测不到。
(7)当知网查重系统识别到你论文中有某句话涉嫌抄袭的时候,它就会对这句话的前面后面部分都重点进行模糊识别,这个时候判断标准就变得更严格,仅仅加一些副词或虚词(比如“的”、“然后”、“但是”、“所以”此类词语)是能够识别出来的。
但这样子的识别方式有时候会显得不是很智能,可能会扯上一篇完全不相干的论文说是内容相似,这个就属于比较无奈的情况了。
(8)知网的对比文库里不包括书籍,教材等。
但有一个问题要注意,当你“参考”这些书籍教材中的一些经典内容时,很可能别人已经“参考”过了,如果出现这样子的情况,那就会被检测到相似。
有些同学会说,那我用自己的话去重新写一下,这样就不会被检测到啦。
这样的方法,理论上是对的,但实际上是,这些经典的句段,已经有无数的人引用过了,也已经被无数的人通过各种改写的方式引用到论文中去的,所以,要写出一段跟别人不一样的话,还真是有点难度,这个也要拼点运气。
(9)网络上的某些内容也是在知网的数据库里的。
比如:“百度文库”、“道客巴巴”、“豆丁网”、“互动百科”、“百度百科”。
作者查重的时候,甚至还遇到很多奇葩的网站,神马“东方财富网博客”、“人大经济论坛”。
所以,选择网上的内容时要慎重。
(9)大家在网上搜索资料的时候,也不要直接引用,知网查重系统在检测文章的时候,也会进行网络搜索的,特别是一些网络学术资料比较多的一些网站,如百度文库、百度知道、360文库等这类网站上面,很容易搜索到相似的信息。
(10)大家可以多参考一些国外的资料,因为在知网的对比文库中,外文资料相对比较少一些,而且用自己的理解翻译成中文的话,几乎不会检测到重复。
(11)各位在论文提交到学校之前,一定要自己先到网站查一下,如果有检测出来相似度较高的片段,自己先改一改。
(12)论文修改一次以后,不要以为就肯定能过了,因为知网系统会根据论文内容的不同自动调整着重检测的段落,所以有时候第一次查重的时候是正常的,一模一样的句子,第二次检测的时候会判断为“抄袭”。
这也是没有办法的,只能多查多改。
(13)知网官方检测系统不对个人开放,学生自己是无法自行到知网去检测论文
的,只能通过第三方检测平台进行,比如易测论文检测平台
等类似的论文查重平台。
(14)除了知网之外,国内应用比较广泛的论文查重系统还有“万方数据”、“维普数据”、“paperpass检测”,“gocheck检测”,“paperrater检测”这几个。
总的来说,万方是最松的,paperpass和paperrater这两个最严。
从费用方面来说,知网的价格是最高的,其它的相对便宜一些,但是检测结果会与知网有区别。
所以一般建议先用便宜的系统查一下,把能改的都改掉,再用知网系统去查,这样子比较划算。
小小的总结一下:以上都是个人总结的经验和理解,不一定绝对是正确的,大家估且看看,有选择的吸收参考一下就好。
如果死板的照着上面的条例方法去修改论文但是没有通过,那也不能怪我,写这些东西只是单纯的大家互相交流一下,希望能帮到一些还不是很明白的朋友,仅此而已!以上!
面对查重,如何修改你的论文
一、常用的论文检测系统
1.目前高校里面所使用的都是知网的检测,但是如果想自己提前检测一下,有实力的同学可以使用知网进行检测,知网检测比较贵,个人不推荐使用,大概250元一次吧,有的更贵一些,注册一个号,然后使用支付宝往账户里面充值,提交论文,等待检测结果。
根据检测报告进行修改,目前淘宝上也有好多进行知网检测的,知网的检测是通过段落比对来进行的。
知网现在也分为多个系统,侧重点不一样,有机会专门说一下。
下面是知网的首页注册通道:
2.对于大部分想省钱的同学,推荐使用PAPERRATER进行检测,个人认为PAPERRATER比中国知网的优势在于:一,价格便宜,每一万字10块钱。
二,检测结果更详细,知网检测的段落,PAPERRATER检测的是每一句话,所以修改起来也很方便,也正是因为这样,有一点需要注意的地方是,PAPERRATER 检测出来的重复率要比知网高一些,有些同学不喜欢这一点,但是我认为这样会更好,我们通过PAPERRATER知道了哪些句子和别人的有相似之处,通过修改,更有效降低重复率,咱们是提前检测的,检测的越详细对咱们越有利。
PAPERRATER近期推出了免费测试的机会,可以去试试。
下面的PAPERRATER的注册通道:
3、还有一个常用的PAPERPASS,原理和PAPERRATER类似,价格也一样,也有免费测试的机会。
部分高校也和其进行了合作,比如上海师范大学、上海海洋大学和北京大学等,这些学校的学生用PAPERPASS最合适。
下面是PAPERPASS的官网:
4.对于还想更省钱的同学,还有个更便宜的方法,万方数据库,一万字一块钱,我也检测过,但是结果很不准确,因为万方的数据库比较小,尽管和知网检测的原理相似,但是由于可供比对的论文太少,很多相似的地方是检测不出来的,这个不推荐使用,下面是万方的注册通道:
5.同学们完成一篇论文,一般都要检测多次,并且是不同检测系统搭配检测。
这样的话,必须每个检测官网都单独注册账号,单独预付充值才正常检测。
况且,有些检测系统根本不对个人开放,比如国内最权威的知网检测系统,个人用户根本无法自行检测。
有平台就专门与国内这些检测机构合作,把各个官方的检测系统都集成到一个网站上,让同学们一个网站即可方便的使用到各个官方的检测系统,且支持真伪查询。
另外,官方给平台的价格是有一定折扣的,有时候平台会拿出部分折扣出来让利给同学们,这样同学们在平台上检测的费用比去官网检测更省钱。
下面推荐一个平台:
论文易测网
6.还有一些同学想找免费的检测软件或者网站,但是我建议不要这样去做,不知名的网站可信度不高,容易造成论文内容泄露。
经过上述的五个方法,我们在完成论文检测之后,下一步工作就是修改了。
二、修改原则:
1.知网是按段落检测,检测到13个相同的字,就认为是雷同,所以连续相同的,不要超过13个字,段落里面提示相似度是多少,然后综合起来;PAPERRATER 是在此基础上有一个比对作用,看看这句话里面与别的论文里面长度相似或相近的话中相似的字数,体现出相似的程度,比如这句话与另一句话有55%的相似,万方的是6个字开始检测重复率,当一段话里面重复的地方多的时候,每六个字就会变成红色,检测的机制还不错,可惜数据库太小了,没有优势。
2.尽量用同义词替代,比如:损坏=破坏;渠道=途径;原理=基本思路;不可见=隐藏;优点尤其突出=优势尽显无疑,大多数=大部分,等等,提前检测出来的报告里面,标红的地方是重点修改区域,拿paperpass来说,有三种颜色,绿色的不用修改,黄色的部分,如果不是大面积的话,如就一两句话,可以不修改,红色的是必须修改的。
3.改变句子的主动被动语态,比如:数字水印为多媒体数据文件在认证、防伪、防篡改、保障数据安全和完整性等方面提供了有效的技术手段。
=在多媒体制品的认证、防伪、防修改和传送安全以及完整性保障方面,可以采用数字水印的检测作为有力的检测手段。
4.同一句话里面有顿号,或者同一层次多个方面的内容,可以调整一些顺序。
5.每个学校相关规定不同,部分学校规定复写率与引用率30%以下,部分学校规定在20%以下,多数学校规定在10%以下;而期刊部一般超过30%,则直接退稿。
6.引用率不能等同于抄袭率,不能作为判断是否抄袭的依据,它仅反映引用部分占整个论文的比重,但引用率过高将可能是引用过度,该行为亦是学术不端的一种,具体规定请参考各单位要求。
下面是一个例子,按照这个程度的修改,保证能通过:
修改前:目前,数字水印技术(Digital Watermarking)已成为国际信息安全学术界研究的一个前沿方向,为多媒体的安全保存和传送开辟了一条全新的途径。
数字水印通过在原始数据中嵌入版权信息,即水印来保证该数据信息的所有权,这种被嵌入的水印可以是一段文本、标识、序列号、图像等各种数字信号。
而且这种水印通常是不可见的,它与原始数据紧密结合并且隐藏在其中,可以经历一些不破坏原数据使用价值或商用价值的操作而能保存下来。
在需要时,能够通过一定的技术检测方法提取出水印,以此作为判断媒体的版权归属和跟踪起诉非法侵权的证据。
数字水印为多媒体数据文件在认证、防伪、防篡改、保障数据安全和完整性等方面提供了有效的技术手段。
修改后:当前,国际信息安全领域的一个热点研究,就是数字水印技术。
这种技术可以在多媒体的保存和传送中提供一种更安全的渠道。
数字水印技术的原理是用水印来保证数据的所有权,即在保存或传送的原始数据中嵌入特定的版权信息。
这些被嵌入的信息,也就是水印,可以是各种形式,比如标识,文本,图像,序列号等各种数字信号。
并且,这些数字信号在表面是不可见的,并且与原始的数据以各种形式密切结合,当然这种结合不会损坏原始数据,所以数据在使用过程中丝毫不受影响。
在使用过程中如果有必要检测水印,则可以通过相关的手段提取出隐含其中的水印,用这种方法来判定原始数据的版权,可以作为法律上侵犯版权的证据。
这项技术在某些领域应用前景特别广发,尤其是多媒体数据、制品、文件的认证、防伪、防止修改、保障传送安全和完整性时,优点尤其突出。
另外,图片是检测不出来的,有一些内容可以替换成表格或者图片,亦或者把一些表格或者图片转化成文字,这样也是可以降低重复率的,还有参考文献的使用,不论哪种检测方法,默认的参考文献方法是用尾注的形式,这样便于识别,关于尾注的方法,我放在下面:
三、插入文献尾注的方法:
1、标号加上【】:
2、点击快捷键ctrl+F:
在查找栏中输入"^e",再替换为:"[^&]"。
3、如果类似【1】【2】【3】【4】【5】之类的中间需要表示成【1-5】,则可选中然后键盘快捷键:ctrl+shift+H将选中内容隐藏,自己手动输入【1-5】,然后点击CTRL+SHIFT+’+’将起放到右上角~~OK啦~~~~。