分布式搜索中节点索引量大小估计算法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分布式搜索中节点索引量大小估计算法
吴晟;李星
【期刊名称】《计算机应用》
【年(卷),期】2008(28)9
【摘要】分布式搜索是解决对深层网络搜索的有效方案,各节点的索引量大小是分布式搜索引擎描述选择节点的重要参数.为了解决在非合作环境中估算节点索引量大小的问题,提出并实现了基于高频词汇再采样的高频再采样算法和基于文档捕获概率不同假设的异概捕获算法.高频再采样算法在随机采样后基于样本集中的高频词汇进行再采样;而异概捕获算法则利用Logistic函数和条件似然方法估算节点的索引量大小.通过真实网络数据的实验结果表明,这些算法优于已有的采样-再采样与捕获-再捕获算法.
【总页数】4页(P2345-2348)
【作者】吴晟;李星
【作者单位】清华大学,电子工程系,北京,100084;清华大学,电子工程系,北
京,100084
【正文语种】中文
【中图分类】TP393.09
【相关文献】
1.元搜索引擎原理在实现分布式虚拟联合目录中的应用研究 [J], 欧阳剑;李冠盛
2.搜索引擎中混合型分布式索引组织策略 [J], 陈伟;刘康苗;卜佳俊;陈纯;张利军
3.MapReduce在分布式搜索引擎中的应用 [J], 吴文忠;易平
4.ElasticSearch分布式搜索引擎在天文大数据检索中的应用研究∗ [J], 陈亚杰;王锋;邓辉;刘应波
5.ElasticSearch分布式搜索引擎在地名地址检索中的应用 [J], 张哲; 刘云鹤; 王乃生
因版权原因,仅展示原文概要,查看原文内容请购买。