学术论文剽窃问题的认定标准及法律适用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

学术论文剽窃问题的认定标准及法律适用

[摘要]近年来,公众人物学术造假事件的曝光使得民众对学术不端行为的关注进一步提升,其行为的危害已经引起社会各界的广泛重视。如何有效的防范、遏制抄袭等学习不端行为成为人们研究的热点, “本文讨论“剽窃”的法律概念,探究“剽窃”的认定标准,最后探讨的是抄袭的识别技术和检测工具。以冀对于“剽窃”的阻遏提供些许借鉴。

[关键词]剽窃;技术界定;法律标准;法律适用

一、论文剽窃现象触目惊心

论文剽窃现象,从本科生到研究生到博士生,从学生到教授到校长,甚至到中科院的院士。从普通的中国高等院校到中国最高学府——清华、北大,都出现涉嫌抄袭案例。据报道,最年轻的市长周森峰,他的清华硕士毕业论文,就被网友发现抄袭率达到50%。辽宁大学副校长抄袭案确认属实,抄袭内容占八成。

2008年4月,武汉大学信息管理学院硕士生导师沈阳副教授研制自主研发的“ROST反剽窃系统”软件,目前已在全国20多所高校院系推广和100多家期刊社使用。近一年来,沈阳某副教授借助反剽窃系统,开展了对学术剽窃现象的专门检测:以一所部属高校的学生和教师自由命题论文为例,783篇论文中,涉嫌抄袭者过半;全文剽窃的论文有161篇,占20.4%;段落剽窃256篇,占33.2%。其中一个院系的30篇博士学位论文中,存在学术不端行为的有4篇,绝大多数论文存在标注不规范的问题,没有一篇论文完全符合规范。

人们不禁诧异,是什么让学术精英们不顾良心与廉耻?是什么诱惑让他们选择铤而走险?是学术道德丧失、是高校学术监督机制不灵、还是法律打击不力?舆论评说、行业规范和单位纪律惩处之外, 司法程序介入学术剽窃是否会成为制止学术剽窃的有效武器——此乃理论界和实务界当下应该探索的首要问题。然而,在近几年重大的学术剽窃事件中,司法参与的程度和力度都不理想。本文有两个讨论热点,一是旨在澄清剽窃的法律责任的性质,为其进入司法程序提供思路,二是抄袭的识别技术和检测工具。

二、剽窃问题的认定标准

(一)技术界定

1.剽窃检测技术概述

对于自然语言的抄袭检测技术的核心就是文档复制检测技术。文档复制检测有两类基本的检测方法,一类是基于字符串比较的方法,另一类是基于词频统计的方法。

基于字符串比较的方法也称为基于语法的方法,这类方法要求从文档中取一些字符串(这些字符串被称为“指纹”),把指纹映射到Hash表中,最后统计Hash表中相同的指纹数目或者比率,作为文本相似度依据。

基于词频统计的方法也称为基于语义的方法。词频统计法源于信息检索技术中的向量空间模型,该类方法首先要统计每篇文档中各个单词的出现次数,然后根据单词频度构成文档特征向量,最后采用点积、余弦或者类似方式度量两篇文档的特征向量,以此作为文档相似度的依据。

2.抄袭检测系统的应用

国外从20世纪70年代初,就开始有研究防止程序抄袭的软件,但直至1991年第一个自然语言文本抄袭识别软件WordCheck才诞生,目前广泛应用并具有代表性的软件有很多。如论文作业抄袭检查平台TurnItIn,由iParadigms开发,系统采用基于数字指纹的抄袭检测方法,检测资源包括网络资源ProQuest论文库、论文作业库等。提供的英文反剽窃服务目前已经服务于包括美国加州大学伯克利分校、杜克大学、德国汉堡大学等在内的2500多所高校和科研机构,遍及九十多个国家,检索网页数量超66亿,用户达650万。据称,该网站目前已阻止了世界范围内将近600万的学生和教育者的剽窃行为,在使用的高峰期,每天可以收到2万篇论文。由CrossRef与iParadigms共同开发的抄袭检测平台CrossCheck,于2008年6月19日正式启动。CrossCheck的功能由两部分组成:一个基于全球学术出版物所组成的庞大数据库和一个基于网页的检验工具。这个基于网页的工具可用于编辑过程中去鉴别相似文档,生成对比报告,并通过分析去判断是否存有学术剽窃行为。截止2010年3月,正式会员包括Elsevier,Springer,牛津出版社,美国科学进步协会(AAAS),美国物理学会(APS),植物生物学会、《浙江大学学报》(英文版)等75家单位。

国内已研发出两款较成熟的专门软件,且两款软件的核心都是基于数字指纹的抄袭检测方法进行文档相似性检测。一款是武汉大学沈阳副教授研制的“ROST 反剽窃系统”软件,目前已在全国20多所高校院系推广和100多家期刊社使用。另一款是中国学术期刊电子杂志社与中国知网共同研制的“学术不端文献检测系统”,目前全国已有3000多家期刊和360所高校的研究生院免费使用这个软件。ROST系统和CNKI系统当前的一个主要差异在于其使用的参照文档数据库不同。

中国知网从2006年开始立项研发基于全文的“学术不端文献检测系统”,以

《中国学术文献网络出版总库》为全文比对数据库,采用基于数字指纹的多阶快速检测方法,支持从词到句子、篇章级别的数字指纹,可对图、表等特殊检测对象进行基于标题、上下文、图表内容结合的相似性检测处理,还可根据特定的概念、观点、结论等内容进行智能信息分类处理,实现语义级别内容的检测。中国知网拥有文献量居国际国内同类产品之首,这为其进行检测提供了丰富的对比文献资源。科技期刊检测系统已经检测的10多万篇科技文献中,文字复制比超过30%的超过1万篇;学位论文检测系统检测5000篇学位论文,重合字数超过1万篇的论文约1000篇。

(二)法律认定

1.剽窃与抄袭的概念

(1)我国“剽窃”的概念

在中国的词典里,剽窃,意指抄袭窃取别人的著作的行为[1]。“ 剽窃”前冠以“学术”二字,则专指学界尤其教授和研究生二类人在自己的科研领域把别人的学术成果占为已有并擅自使用。抄袭,一是指把别人的作品或语句抄来当做自己的, 二是指不顾客观情况,沿用别人的经验方法等[2]。

文化部1984年6月颁布的《图书期刊版权保护试行条例》第十九条第一项所指“将他人创作的作品当作自己的作品发表,不论是全部发表还是部分发表,也不论是原样发表还是删节、修改后发表”的行为,应该认为是剽窃与抄袭行为,可以看出,该《条例》未对剽窃与抄袭加以区分。

1999年,在国家版权局版权管理司《关于如何认定抄袭行为给青岛市版权局的答复》中,则认为剽窃与抄袭完全是同一概念,并对以后的案件审理有很大的指导作用。原文是:

青岛市版权局:

收到你局关于认定抄袭行为的函。经研究,答复如下:

一、著作权法所称抄袭、剽窃,是同一概念(为简略起见,以下统称抄袭),指将他人作品或者作品的片段窃为己有……。

2001年10月,修订《著作权法》时,第46条删除了原《著作权法》第46条中的“抄袭”二字,将“剽窃、抄袭他人作品的”改为“剽窃他人作品的”。

也就是说,和中国相比,在西方,无论从法律角度还是从世俗的角度,剽窃已经是一个很成熟的概念,并且拥有自己的意义群,如根据是否引用文献分为不引用文献的剽窃和引用文献的剽窃。按照剽窃的严重程度和内容数量多少划分,包括完全剽窃、部分剽窃,复制-粘贴剽窃、词语转换剽窃。按照作者的动机分为蓄意剽窃和非故意的剽窃等。按照剽窃的具体内容划分:文字剽窃、思想剽窃等。按照

相关文档
最新文档