结合局部敏感哈希的k近邻数据填补算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

结合局部敏感哈希的k近邻数据填补算法
郑奇斌;刁兴春;曹建军;周星;许永平
【期刊名称】《计算机应用》
【年(卷),期】2016(036)002
【摘要】k近邻(kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高.为提高算法效率,提出结合局部敏感哈希(LSH)的kNN数据填补算法LSH-kNN.首先,对不存在缺失的完整记录进行局部敏感哈希,为之后查找近似最近邻提供索引;其次,针对枚举型、数值型以及混合型缺失数据分别提出对应的局部敏感哈希方法,对每一条待填补的不完整记录进行局部敏感哈希,按得到的哈希值找到与其疑似相似的候选记录;最后在候选记录中通过逐个计算相似度来找到其中相似程度最高的k条记录,并按照kNN算法对不完整记录进行填补.通过在4个真实数据集上的实验表明,结合局部敏感哈希的kNN填补算法LSH-kNN相对经典的kNN算法能够显著提高填补效率,并且保持准确性基本不变.【总页数】5页(P397-401)
【作者】郑奇斌;刁兴春;曹建军;周星;许永平
【作者单位】解放军理工大学指挥信息系统学院,南京210007;总参第六十三研究所,南京210007;总参第六十三研究所,南京210007;解放军理工大学指挥信息系统学院,南京210007;总参第六十三研究所,南京210007
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于局部敏感哈希算法的图像高维数据索引技术的研究 [J], 曹玉东;刘福英;蔡希彪
2.基于数据降维与精确欧氏局部敏感哈希的k近邻推荐方法 [J], 郭喻栋;郭志刚;陈刚;魏晗
3.结合局部敏感哈希和随机游走的异常检测算法 [J], 舒敏;刘华文;郑忠龙;徐晓丹
4.局部PCA与k近邻相结合的谱聚类算法 [J], 吴林; 文国秋; 童涛; 谭马龙; 杜婷婷
5.基于车辆数据的k近邻联合概率数据关联算法 [J], 刘昀晓; 王东峰; 曹林; 杜康宁; 李萌; 付冲
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档