垂直搜索引擎
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网站。该网站除了提供农业搜索引擎服务外,还提供关于 农业的新闻组服务、农业政策信息服务。
◆Agriseape Seareh创建于1994年的美国普林斯顿主要提
供农业与相关产业的导航服务。其目标是发展成为农业信 息、农业贸易和农业技术的信息中心。
农业信息垂直搜索引擎 国内发展现状
我国的农业搜索引擎起步较晚,但发展迅速。目前国内农业搜索引擎主要有:
搜索引擎的工作原理
从结构上分析来看,一个搜索引擎由抓取器、索引器、检索器 和用户接口等四个部分组成。
区别与特点
普通搜索引擎 垂直搜索引擎
◆采用广度优先策略 ◆目录式搜索的缺陷是速度慢 ◆关键词搜索的缺陷是信息过载 ◆模糊搜索的缺陷是准确率低
◆ 采用深度优先策略 ◆ 分类细致明确 ◆ 数据全面深入 ◆ 更新及时
多数的农业搜索引擎系统提取数据信息分为2步。从网页中
先通过标签将整个网页信息进行简单提取。通过农业本体 信息抽取来将简单抽取的数据进行3次信息抽取,保证了信 息抽取的准确性(如下图所示)
信息抽取技术示意图
信息过滤技术
Web文本内容过滤有基于内容性和实效性的特点,基于这 2个特点的衡量信息过滤的标准是过滤精度和过滤速度。目 前常用的基本信息过滤方法有3种。
垂直搜索引擎举例
中文图标搜索引擎 (http://www.iconpng.com/) 目前收录了10000多个图标,可以按照图标系列、分类、色系、关 键字、图标标题等搜索;你可以查看每一个图标的作者信息、尺 寸大小、图像文件格式、色系、所属分类等信息。
爱看图标网
豆丁网
中文文档搜索引擎(http://www.docin.com) 豆丁网号称收录了一亿多文档,是最大的中文文档库,提 供针对文档标题、简介、内容的关键字检索功能,并且支 持Word、PDF、PPT、Jpg等30多种文件格式。 物流行业搜索引擎(http://www.56qss.com) 始终致力于全球最大的中文物流信息搜索查询平台建设, 树立全球中文物流搜索第一品牌,只需输入简单关键词或简 单的选择就可在指定的分类中搜索到你需要的信息
◆ 布尔模型
◆ 向量空间模型
◆ 潜在语义模型
结束语 当今世界是信息的时代,也是农业信息的时 代。农业搜索引擎在为广大用户提供农业信息的查 询方面做出了应有的贡献。各项数据表明,在查询 农业信息方面,农业的专业搜索引擎的查全率和查 准率优于综合搜索引擎。与此同时,农业搜索引擎 的搜索功能,搜索结果稳定程度信息量等方面还存 在不足有待完善
农业信息垂直搜索引擎 研究报告
所在院系 学科专业 研究生姓名 指导老师
计算机技术与工程学院 农业信息化 宋玲 高静
2013-10-13
目录
1
垂直搜索引擎综述
2 3 4
农业信息垂直搜索引擎
农业信息垂直搜索引擎的关键技术
结束语
垂直搜索引擎 垂直搜索引擎概念
垂直搜索引擎是应用于某一个行业、专业的搜索引擎,是搜索引 擎的延伸和应用细分化。垂直搜索引擎为用户提供的并不是上百甚至 上千万相关网页,而是范围极为缩小、极具针对性的具体信息。垂直 搜索引擎概念的提出,就是相对于通用搜索引擎的信息量大、查询不 准确、深度不够等提出来的新的搜索引擎服务模式,通过针对性的为 某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信 息和相关服务。可以简单的说成是搜索引擎领域的行业化分工。
◆中国农业科技信息网农业网站搜索引擎(www.Cas.t ne.t cn /ssyq)等。
农业信息搜索引擎主要特点
1
搜索内容主要关注农业 相关信息领域,利用“ 三农”相关的词汇表进 行信息检索控制,并对 农业相关的关键词进行 信息挖掘。 极大的提高 了农业信息检索的命中 率。
2Hale Waihona Puke Baidu
由于采用农业相关信息 的过滤算法,使检索到 的信息专业性比较强, 而且信息数量更少,从 而可以对引擎检索到的 信息进行分类标引和进 一步的整理,提高搜索 引擎信息检索的质量, 据此建立一个农业相关 的高质量的主题索引 数据库。
3
由于采用农业主题信息 过滤 ,采集的数据规模 较小,缩短了用户检索 信息的平均等待时间, 同时搜索引擎可以采用 比通用引擎更加复杂的 检索和信息挖掘算法, 进一步提高了用户搜索 农业相关信息的准确度 。
农业信息垂直搜索引擎的关键技术 信息抽取技术
面向农业主题的信息抽取模块是针对经过主题过滤模
块过滤得到的农业HTML网页数据进行信息抽取,从网页的 某些非结构化数据中抽取出特定的结构化的信息数据。大
物流全搜索
农业信息垂直搜索引擎 国外发展现状
全世界范围来说,农业搜索引擎多种多样,下面以美 国为例介绍几种比较重要的农业搜索引擎
◆WEB-AgriSeareh创建于1998年,它开设的网站主要提
供农业搜索引擎、农业期刊导航和农业站点导航。
◆AgrisurfSeareh是美国一家专门从事农业搜索引擎服务的
◆农搜(www. agrisou. com)——全球数据量最大的中文农业搜索引擎,它实
现了全文检索+语义检索的智能检索引擎
◆搜农(www.Sounong.net)——第1个面向我国农业企业、农民大户、农业专
业技术协会以及广大农业科技人员提供专题搜索服务的垂直搜索引擎
◆华农在线(www.Chinanong.Com)、
◆Agriseape Seareh创建于1994年的美国普林斯顿主要提
供农业与相关产业的导航服务。其目标是发展成为农业信 息、农业贸易和农业技术的信息中心。
农业信息垂直搜索引擎 国内发展现状
我国的农业搜索引擎起步较晚,但发展迅速。目前国内农业搜索引擎主要有:
搜索引擎的工作原理
从结构上分析来看,一个搜索引擎由抓取器、索引器、检索器 和用户接口等四个部分组成。
区别与特点
普通搜索引擎 垂直搜索引擎
◆采用广度优先策略 ◆目录式搜索的缺陷是速度慢 ◆关键词搜索的缺陷是信息过载 ◆模糊搜索的缺陷是准确率低
◆ 采用深度优先策略 ◆ 分类细致明确 ◆ 数据全面深入 ◆ 更新及时
多数的农业搜索引擎系统提取数据信息分为2步。从网页中
先通过标签将整个网页信息进行简单提取。通过农业本体 信息抽取来将简单抽取的数据进行3次信息抽取,保证了信 息抽取的准确性(如下图所示)
信息抽取技术示意图
信息过滤技术
Web文本内容过滤有基于内容性和实效性的特点,基于这 2个特点的衡量信息过滤的标准是过滤精度和过滤速度。目 前常用的基本信息过滤方法有3种。
垂直搜索引擎举例
中文图标搜索引擎 (http://www.iconpng.com/) 目前收录了10000多个图标,可以按照图标系列、分类、色系、关 键字、图标标题等搜索;你可以查看每一个图标的作者信息、尺 寸大小、图像文件格式、色系、所属分类等信息。
爱看图标网
豆丁网
中文文档搜索引擎(http://www.docin.com) 豆丁网号称收录了一亿多文档,是最大的中文文档库,提 供针对文档标题、简介、内容的关键字检索功能,并且支 持Word、PDF、PPT、Jpg等30多种文件格式。 物流行业搜索引擎(http://www.56qss.com) 始终致力于全球最大的中文物流信息搜索查询平台建设, 树立全球中文物流搜索第一品牌,只需输入简单关键词或简 单的选择就可在指定的分类中搜索到你需要的信息
◆ 布尔模型
◆ 向量空间模型
◆ 潜在语义模型
结束语 当今世界是信息的时代,也是农业信息的时 代。农业搜索引擎在为广大用户提供农业信息的查 询方面做出了应有的贡献。各项数据表明,在查询 农业信息方面,农业的专业搜索引擎的查全率和查 准率优于综合搜索引擎。与此同时,农业搜索引擎 的搜索功能,搜索结果稳定程度信息量等方面还存 在不足有待完善
农业信息垂直搜索引擎 研究报告
所在院系 学科专业 研究生姓名 指导老师
计算机技术与工程学院 农业信息化 宋玲 高静
2013-10-13
目录
1
垂直搜索引擎综述
2 3 4
农业信息垂直搜索引擎
农业信息垂直搜索引擎的关键技术
结束语
垂直搜索引擎 垂直搜索引擎概念
垂直搜索引擎是应用于某一个行业、专业的搜索引擎,是搜索引 擎的延伸和应用细分化。垂直搜索引擎为用户提供的并不是上百甚至 上千万相关网页,而是范围极为缩小、极具针对性的具体信息。垂直 搜索引擎概念的提出,就是相对于通用搜索引擎的信息量大、查询不 准确、深度不够等提出来的新的搜索引擎服务模式,通过针对性的为 某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信 息和相关服务。可以简单的说成是搜索引擎领域的行业化分工。
◆中国农业科技信息网农业网站搜索引擎(www.Cas.t ne.t cn /ssyq)等。
农业信息搜索引擎主要特点
1
搜索内容主要关注农业 相关信息领域,利用“ 三农”相关的词汇表进 行信息检索控制,并对 农业相关的关键词进行 信息挖掘。 极大的提高 了农业信息检索的命中 率。
2Hale Waihona Puke Baidu
由于采用农业相关信息 的过滤算法,使检索到 的信息专业性比较强, 而且信息数量更少,从 而可以对引擎检索到的 信息进行分类标引和进 一步的整理,提高搜索 引擎信息检索的质量, 据此建立一个农业相关 的高质量的主题索引 数据库。
3
由于采用农业主题信息 过滤 ,采集的数据规模 较小,缩短了用户检索 信息的平均等待时间, 同时搜索引擎可以采用 比通用引擎更加复杂的 检索和信息挖掘算法, 进一步提高了用户搜索 农业相关信息的准确度 。
农业信息垂直搜索引擎的关键技术 信息抽取技术
面向农业主题的信息抽取模块是针对经过主题过滤模
块过滤得到的农业HTML网页数据进行信息抽取,从网页的 某些非结构化数据中抽取出特定的结构化的信息数据。大
物流全搜索
农业信息垂直搜索引擎 国外发展现状
全世界范围来说,农业搜索引擎多种多样,下面以美 国为例介绍几种比较重要的农业搜索引擎
◆WEB-AgriSeareh创建于1998年,它开设的网站主要提
供农业搜索引擎、农业期刊导航和农业站点导航。
◆AgrisurfSeareh是美国一家专门从事农业搜索引擎服务的
◆农搜(www. agrisou. com)——全球数据量最大的中文农业搜索引擎,它实
现了全文检索+语义检索的智能检索引擎
◆搜农(www.Sounong.net)——第1个面向我国农业企业、农民大户、农业专
业技术协会以及广大农业科技人员提供专题搜索服务的垂直搜索引擎
◆华农在线(www.Chinanong.Com)、