一个基于网格的文本复制检测系统
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一个基于网格的文本复制检测系统
鲍军鹏;沈钧毅;刘晓东
【期刊名称】《微电子学与计算机》
【年(卷),期】2004(21)9
【摘要】如何快速、及时地在大规模文集中发现剽窃文本是知识产权保护中的一个核心问题。
我们利用Globus构建了一个文本复制检测网格系统,称之为DCDGrid。
在DCDGrid原型中我们把单个巨型文集分解成多个中小规模文集,然后将其分布在网络上。
通过网格计算的方式,我们可以同时在多台计算机上检测剽窃文本,可以动态增扩检测文集,缩短检测时间,整个系统具有很高的性价比。
局域网上的模拟测试表明DCDGrid系统是比较实用的。
【总页数】4页(P7-10)
【关键词】复制检测;网格;剽窃;文本挖掘
【作者】鲍军鹏;沈钧毅;刘晓东
【作者单位】西安交通大学电信学院计算机系
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于文本结构树的论文复制检测算法 [J], 王森;王宇
2.基于MapReduce框架的近似复制文本检测 [J], 李瑞;王朝坤;郑伟;王建民;王伟平
3.基于汉字部件直方图的文本复制检测算法 [J], 姜丽清;黄华军;谢黎黎
4.基于网格的数字文档复制检测系统 [J], 刘国华;李旭;张忠平;陈伟
5.中文文本复制检测系统 [J], 杨俊丽;彭新光
因版权原因,仅展示原文概要,查看原文内容请购买。