【CN109948021A】一种基于Elasticsearch的云盘搜索方法系统服务器及存储介质【专

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2
CN 109948021 A
权 利 要 求 书
2/2 页
9 .一种基于Elasticsearch的云盘搜索服务器,其特征在于,包括处理器、存储器和存 储在所述存储器中且可运行在所述处理器上的计算机程序,所述计算机程序运行时实现如 权利要求1-7任一项权利要求所述的方法步骤。
10 .一种计算机存储介质,其特征在于,所述计算机存储介质包括:至少一个指令,在所 述指令被执行时实现如权利要求1-7任一项所述的方法步骤。
权利要求书2页 说明书7页 附图百度文库页
CN 109948021 A
CN 109948021 A
权 利 要 求 书
1/2 页
1 .一种基于Elasticsearch的云盘搜索方法,其特征在于,包括以下步骤: 接收 用户输入的 搜索信息 ,对所述搜索信息进行解析 ,并根据解析结果生成可识别的 搜索命令; 基于Elasticsearch搜索方法 ,根据所述搜索命令获取云盘中 与所述搜索信息对应的 目标搜索资源并存储; 将所述目标搜索资源返回至所述用户并显示。 2 .根据权利要求1所述的基于Elasticsearch的云盘搜索方法,其特征在于,获取所述 目标搜索资源的具体步骤包括: 采用网络爬虫的方法根据所述搜索命令爬取与所述搜索信息对应的初始搜索资源; 对所述初始搜索资源进行资源清洗,得到所述目标搜索资源; 将所述目标搜索资源存储入资源数据库中 ,根据所述资源数据库中的所述目标搜索资 源生成索引,并根据所述索引将所述目标搜索资源进行同步。 3 .根据权利要求2所述的基于Elasticsearch的云盘搜索方法,其特征在于,采用网络 爬虫的方法爬取所述初始搜索资源中还包括: 采用Quartz的开源作业调度框架调度所述网络爬虫,并采用cron表达式设置所述网络 爬虫程序中定时爬取所述初始搜索资源的定时任务。 4 .根据权利要求2所述的基于Elasticsearch的云盘搜索方法,其特征在于,对所述初 始搜索资源进行资源清洗后 ,还包括对所述初始搜索资源进行分类 ,得到所述目 标搜索资 源。 5 .根据权利要求1所述的基于Elasticsearch的云盘搜索方法,其特征在于,接收所述 用户输入的所述搜索信息中还包括: 采用词语联想接口提供根据所述搜索信息中的关键字联想获得的联想搜索信息。 6 .根据权利要求1所述的基于Elasticsearch的云盘搜索方法,其特征在于,将所述目 标搜索资源返回至所述用户并显示中还包括: 采用findBy方法向所述用户推荐近似搜索资源,且所述近似搜索资源与所述目标搜索 资源具有相同属性的关键词。 7 .根据权利要求1-6任一项所述的基于Elasticsearch的云盘搜索方法,其特征在于, 将所述目标搜索资源返回至所述用户并显示后还包括: 采用分享插件分享所述目标搜索资源;或采用下载插件下载所述目标搜索资源。 8 .一种基于Elasticsearch的云盘搜索系统,其特征在于,包括输入模块、显示模块、处 理模块、搜索模块和存储模块; 所述输入模块,用于接收用户输入的搜索信息; 所述处理模块 ,用于对所述搜索信息进行解析 ,并根据解析结果生成可识别的 搜索命 令; 所述搜索模块,用于基于Elasticsearch搜索方法,根据所述搜索命令获取云盘中与所 述搜索信息对应的目标搜索资源; 所述存储模块,用于存储所述目标搜索资源; 所述处理模块,还用于将所述目标搜索资源返回至所述用户; 所述显示模块,用于显示所述搜索信息和所述目标搜索资源。
代理人 姜展志
(51)Int .Cl . G06F 16/951(2019 .01) G06F 16/953(2019 .01) G06F 16/9032(2019 .01)
(10)申请公布号 CN 109948021 A (43)申请公布日 2019.06.28
( 54 )发明 名称 一种基于Elasticsearch的云盘搜索方法、
3
CN 109948021 A
说 明 书
1/7 页
一种基于Elasticsearch的云盘搜索方法、系统、服务器及存 储介质
技术领域 [0001] 本发明涉及互联网搜索技术领域,尤其涉及一种基于Elasticsearch的云盘搜索 方法、系统、服务器及存储介质。
背景技术 [0002] 从1946年诞生了世界上第一台电子计算机开始,计算机就绵延不绝的开发和创造 知识。互联网上的信息成爆炸式增长,开启了互联网信息爆炸的时代,要想拥有先进的生产 力 ,就必须依赖于 信息化 ,而 信息化的 发展也是当今时 代的 大势所趋。由 于近些年来云盘 (网盘)技术的兴起,云盘安全稳定、海量存储、可随时随地实现共享文件的特点越来越受用 户的青睐。 [0003] Elasticsearch(实时分布式搜索和分析引擎) ,是一个基于Lucene的全文搜索服 务,是当前流行的企业级搜索引擎。 [0004] 国内外研究技术现状从技术层面来看,目前国内外网盘搜索引擎实现原理大致分 为两派:(1)自定义爬虫程序,使用自定义爬虫的代表有:盘找找、去转盘网等。(2)调用百度 三方接口供搜索,Google自定义搜索等,使用Google自定义搜索的代表有:西林街、盘搜等。 自定义爬虫程序的网盘搜索引擎优于调用Google接口的网盘搜索引擎,原因在于自定义爬 虫程序可以定制资源的搜索,从而达到准确查找资源的目的 ,而调用Google接口 ,受制于 Google ,这就是为什 么通过Google自 定义搜索出来的 资源有效性差 (随 着百 度云的 升级 , Google不能有效的去除失效链接) ;另一方面,调用Google接口需要翻墙,从而导致了搜索 速度的下降 ,影响用户体验。 [0005] 然而现有运用自定义爬虫程序的云盘搜索系统均存在如下几个带有共性的问题: [0006] (1)检索资速度比较慢; [0007] (2)缺乏资源分享功能; [0008] (3)部分网站没有向用户推荐相关资源的功能; [0009] (4)资源类型划分不明确,所有资源混在一起; [0010] (5)用户输入关键字时不友好,没有提示。
( 19 )中华人民 共和国国家知识产权局
( 12 )发明专利申请
(21)申请号 201910044026 .9
(22)申请日 2019 .01 .17
(71)申请人 湖北工程学院 地址 432000 湖北省孝感市交通大道272号
(72)发明人 李纪平 田骏 余通
(74)专利代理机构 北京轻创知识产权代理有限 公司 11212
系统、服务器及存储介质 ( 57 )摘要
本发明涉及一种基于Elasticsearch的云盘 搜索方法、系统、服务器及存储介质,方法包括接 收用户输入的搜索信息,对所述搜索信息进行解 析 ,并根据解析结果生成可识别的 搜索命令 ;基 于Elasticsearch搜索方法 ,根据所述搜索命令 获取与所述搜索信息对应的目标搜索资源并存 储 ;将所述目标搜索资源返回至所述用户并显 示。本发明的云盘搜索方法能够更加高效地查询 到云盘中与用户输入的搜索信息对应的目标搜 索资源,减少用户检索资源花费的时间 ,实时搜 索能力更强,处理数据强,速度快,易扩展。
相关文档
最新文档