学位论文和刊物论文查重是为了避免剽窃抄袭别人成果、自我剽窃和过量引用。
论文重复率的控制原则有什么?
如何减少重复率?
这些都是科研人员在写作时须要注意的问题。
1. 什么是查重?
查重(similarity check)是使用联接到各文献数据库的查询对比软件检测文章与已发表文献的重复程度。例如,有的查重软件规定,一句话中有连续13个字与发表文献相同都会被计为重复,这种重复具有剽窃或抄袭的嫌疑。对全文进行检查后,查重软件会给出关于重复率(又称相似率)的各类指标。
全文总重复率等于复写率、他引率、自引率、专业术语占有率之和。复写率是与其他文献相同的内容占全文的比率(不算引用内容)。他引率是引用别人的内容占全文的比率,如果未正确标明引用,会计入复写率。自引率是引用自己早已发表的内容占全文的比率,如果未正确标明引用,也会计入复写率。专业术语是指行业用语、法律条文和公理定律等占全文的比率。自写率等于1减全文总重复率,反映了原创内容占全文的比率。
多数国际期刊在将论文送交同行评议前或在论文被接受前会进行查重。多数刊物对可以接受的全文总重复率控制在30%以下,少数刊物控制在20%以下,通常会在投稿须知里标识。国内刊物对重复率有类似要求。例如,《中国机械工程》原则上不录用重复率小于30%的论文。如果重复率过低,则觉得论文引用的内容超过了正常数目,或具有剽窃风险,会被拒稿或让作者更改。
很多查重软件设置了灵敏度阀值,例如中国知网设置为5%。如果引用或剽窃的单篇文献内容总和在检查段落内达到了阀值(例如,检测段落有1000字,引用单篇文献小于50字),查重软件会提示引用过多或有剽窃嫌疑。每个中学对毕业论文的重复率限值具有不同的规定。
需要注意的是,重复率是指论文与一篇或多篇已发表文章重复百分比的累计值。重复率高,不一定意味着剽窃。例如,当论文有30%的重复率时,可以是与一篇文章有30%重复,也可以是论文的1%部份与30篇不同的文章有重复。另外,在按照重复率判断剽窃时,需要具体检测重复发生在论文的什么部份。在材料和技巧部份,由于好多内容是关于常见的测试方式和仪器的,在描述时没有太大的新意,就可能会形成较高的重复率,这种情况一般可以被宽恕。
2. 查重软件
由于不同的查重系统所包含的文献数据库有所不同,对内容相似度的算法也各有不同。国外的查重系统主要包括iThenticate和Turnitin等。iThenticate是科研人员和刊物常常使用的查重软件。Turnitin是中学生和班主任常常使用的查重软件。国内常用的查重软件包括中国知网和维普。大部分院校指定使用中国知网对学位论文进行查重。
很多查重系统是收费的,而且价钱不菲。例如iThenticate的查重价钱是100美元一篇。国内有的院校会为中学生提供1-2次免费查重机会,这个机会十分宝贵。如果中学生须要在由中学查重论文之前想自查论文,需要注意选择正规渠道查重,通常须要付费。然后按照测量结果对论文进行降重处理,避免因为被中学查出学位论文的重复率偏低而影响结业。另外,市场上还有大量的免费查重系统,也参杂着各类冒充的查重系统。如果使用不可靠的查重系统,论文可能失窃。
3. 论文降重的方式
降重分为非法降重和合法降重两种。对剽窃的内容不标明引用文献来源而降重叫剽窃或抄袭,属于非法降重,必须防止。引用的内容无需降重,只需注意控制引用量满足中学毕业论文或刊物投稿的重复率要求。合法降重是对非剽窃内容(自己的原创内容)变换写法,避免与早已发表的文章重复。在使用降重服务时,必须注意防止非法降重,只能使用合法降重。
由于完成学位论文和发表刊物论文是强需求,市面上的论文查重软件和降重服务市场十分火热。对于东拼西凑剽窃抄袭(包括原貌照搬或窃取意思)的论文,试图通过降重服务蒙混过关,属于学术不端的错误做法。
很多科研人员受法语水平所限,在撰写序言的文献综述部份时,过度参考甚至剽窃别人的阐述;或者在发表自己的系列论文时,对容易雷同的部份(例如材料和技巧)采用相同的语言。这两种情况会导致论文的重复率偏低,需要降重。
① 合法降重的第一个方式(也是最好的方式)是复述,即用自己的语言把测量为重复的内容重画一遍。
世界上没有完全相同的两片树根。一般来讲,自己写下来的话与别人发表的内容不会相同。唯一须要注意的是,在自己发表的系列论文中不要使用相同的诗句,因为每个人都有自己的习惯抒发形式,这是最容易出现雷同的缘由。另外,如果必须引用,最好只引用核心句子,对其余内容用自己的话复述。复述的常用手法包括代词变换(将主动不定式弄成被动语态或反之)、颠倒因果关系次序、改变词性代词位置、调整语句结构和断句、替换同义词等。
② 合法降重的第二个方式是纠正查重软件对参考文献和引语的错误标记。
格式错误的参考文献会被查重软件视为正文而标记为重复内容,而格式正确的参考文献不会被查重软件作为剽窃内容来标记和统计。
③ 合法降重的第三个方式是使用人工智能软件对语言手动进行更改。
这种方式大约能将重复率增加几个百分点,但是须要人工润色,纠正软件的错误。
④ 合法降重的第四个方式是中外语种互译,利用翻译软件(例如有道翻译或谷歌翻译)的人工智能优点手动选择用词和短语结构。
例如,先将英文里的重复部份用翻译软件译成法语、日语、德语或德语,然后再将英语译回英文。经过这两次转换,中文用词和短语结构早已大不相同,能够有效降低雷同。但是,翻译软件可能会出错,因此须要人工润色纠正。
⑤ 合法降重的第五个方式是把数据和公式放进插图或表格,因为好多查重系统目前只能检查文字,尚不具备详尽检测图表内容的功能。
这个方式只适宜处理自己发表的一系列论文中的相同数据和公式,并且须要引注,避免自我剽窃。如果将这个方式用于他人的数据和公式,而且不引注,试图防止被查出重复内容,那实际上是剽窃抄袭。
转载本文请联系原作者获取授权,同时请标明本文来自Wordvice霍华斯科学网博客。
链接地址: