信息检索技巧
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
②减号:格式:- 检索词 功ndows2000的资料,但又不想看 到 关 于 Windows 98 的 网 页 , 检 索 提 问 可 以 为 : +windows2000–windows98。减号的作用在于可以 使搜索结果集中反映你的需求,使你无需为大量 无关的搜索结果而头疼。
搜索图片、图像 格式:image:文件名 功能:检索含有指定文件名图像的所有网页。 示例:要检索含有“日出”图像的所有网页,使用 images:sunrise查询在具体使用搜索引擎查询时, 可参考“Help”
⑤
⑥ 搜索多媒体信息 格式:media:text 功能:检索文件的名字中含有指定文字的多媒体信息 示例:要检索取名为(或名字中含有)cloud的图像、声 音或录像,可使用media:cloud查询。在具体使用时, 还需参考“Help”等等。
可
作为短语连接符。例如:mother-in-law尽管没有加引号,仍作 为专用语处理。
⑤ 截词符:*(星号)
格式:词干*,如computer* 功能:自动查找具有相同词干的所有单词,提高检索的全面性,扩大
命中结果的数量,适用于一部分网站
示例:检索提问computer*,表示可自动查找computer、computers、 computerised、computerized等单词;又如interne* 会检索出 interne、internecine、internet 等相关的内容。 几乎所有主要搜索引擎均支持以上这些检索功能,只是具体使
内容丰富,数据量大,能帮助你迅速找到一些专门的信息。
下面简要介绍一些主要的专题搜索引擎:
① 商贸类搜索引擎(中贸网商务搜索引擎
)
中贸网是我国访问率最高的B-B电子
商务网站之一,它致力于建设在线商业社区,促进企
业与企业间的商务活动。中贸网已成为国外企业在中 国寻找商机的必经门户,成为数以万计中外商家、企 业参与网络经济活动的重要站点。中贸网商务搜索引 擎分成企业产品搜索引擎和供求信息搜索引擎两大部
搜索结果去重 在网络搜索中,有时你会发现搜索结果的前几位似乎 都来自同一个网站。这时你可以使用搜索结果重组功能, 避免这种情况的出现。 搜索结果去重功能是指一个网站最多只能有一页出现 在排名靠前的搜索结果中,以保证搜索的质量,同时给用 户更多更好的选择搜索结果的机会。
⑤
⑥ 相关搜索 在搜索信息时,相关搜索也是非常有用的功能。相关 搜索功能的作用是锁定搜索条件,并自动列出与检索词相 关的词。
(3)限制检索 限制检索指缩小和限定搜索引擎的搜索范围,允 许搜索引擎只在网页的某一种元素中,如标题、链接、 URL等查找结果。限制检索使检索提问更具体、准确。 图6-1是Hotpot限制检索的菜单示例。
主要的限制检索命令: ① 搜索标题 格式:title:text或t:text (注:text指文本文字) 功能:检索网页标题中含有指定字或词组的页面 示例:title:survey,检索网页标题中含有survey这个单词 的所有页面。 ② 搜索网站 格式:domain: domain name 或host:name 或site: domain name 功能:检索词必须出现在域名、主机名或主机地址中 示例:domain:UK,检索英国(United Kingdom)的网页; domain:com,检索所有com网站。
中国金卫网 :
④ IT 搜 索 引 擎 ----IT 罗 盘 ( 赛 迪 网 )
⑤ 搜索引擎目录 易达网 /sxl.htm 中文雅虎() 搜狐() Yeah网易搜索引擎() 新浪搜索() 哇噻中文网() 263搜索() 中文Excite() CEI信息导航 () ⑥ 其他搜索引擎 全球华人寻人引擎 /gb : 图行天下 / 房产地图搜索引擎 : 眼科搜索 :
⑦ 相似网页搜索 有时发现某个搜索结果特别准确,正是你所需要的。 “Find Similar”----相似网页搜索功能可让搜索引擎将与该 网页相似的网页也罗列出来。
⑧ Word Stemming搜索 Word Stemming是截词的一种,指的是在查询 一个关键词的基础上,查询由此关键词变化而来的 其它词。
16 找到了 17 万方数据搜索引擎(北极星)
(2) 专题搜索引擎
互联网是个巨大的信息海洋,各种各样的信息资源应
有尽有,利用前面介绍的综合型搜索引擎查找一般的信息 资源基本上够用了,但是如果要查找产品、企业、电话、 人名、电子邮件、地址等资料,使用专题性的搜索引擎可 能更有优势。专题搜索引擎专门收集某一类的信息资源,
2.国内著名的网络信息检索工具 国内著名的网络信息检索工具分综合类和专题类搜索 引擎介绍:
(1)综合类搜索引擎 ① 搜狐搜索引擎:
② 新浪搜索引擎: ③ 中文雅虎搜索引擎: ④ 网易搜索引擎:
11 中文EXCITE 12
搜索客
13 常青藤
14 蕃薯藤
15
Opendfind 台 湾 网 络 资 源 百 科 索 引
③ 优先算符 优先算符,即括号( ), 格式:(检索词…) 功能:控制逻辑算式中的优先次序,使括号中的表达 式先执行。
④
限定查找的起止日期
在高级检索中,利用文本框下面的日期输入框(一 般为From:→To:)
⑤
控制检索结果的排序
在高级检索中,只要在文本框下的排序(Ranking、 Sort by:等)框中输入有关的词语, 即可对检索获 得的结果进行排序控制,使之按照输入的词语排序。
③ 自然语言检索
即直接采用自然语言中的字、词或句子作提问式 进行检索,同一般口语一样。如“What is WTO?”或 “Who is Clinton?”以这样的自然语言表达式充当检 索提问式。
④ 多语种检索
即提供多种语言环境供检索者使用,检索者可根 据自己的需要选择一种语言,系统会按指定的语种进 行检索并输出检索结果。
用时有时符号会有所差别,所以用户在实际使用前可先浏览一
下“Help”(帮助页面)。
(2)高级搜索技术
高级搜索技术一般用于搜索引擎的高级检索, 即所谓的“advanced search”。搜索引擎都有简单 检索与高级检索之分,简单检索是搜索引擎的默 认工作状态,高级检索必须用鼠标点击 “advanced search”按钮。
(4)特殊检索技术
在简单搜索和复杂搜索过程中还有一些技术也是帮助 搜索的利器, ① 词间空格 检索词之间的空格在不同的搜索引擎中有不同的定义。 ② 区分首字母大小写(即case-sensitive,大小写敏感性) 首字母大写,指检索词的第一个字母大写;首字母小写, 指检索词的第一个字母小写。它主要是针对检索词中含有 人名、地名等专有名词而言的。在区分大小写的情况下, 首字母大写,检索词被当作专有名词看待(如Internet专指 因特网),可提高检索的准确性;
③管道符:| 格式:检索词一 | 检索词二 功能:一组检索词在搜索结果中只要出现任一个 即被命中。 示例:查询有关克林顿或希拉里的资料,检索提 问可以为:克林顿 |希拉里,表示在搜索结果中 克林顿与希拉里这两个词只要出现一个都被命中.
④ 引号:“”
格式:“词组”,如“computer network” 功能:词组检索功能,只检索含有该词组的资料 示例:检索提问“computer network”,表示只检索含有词组computer network的网络文档;检索提问“电脑商情报”,会找出包含 电 脑商情报的网站,不会查找有关电脑商情,XX商情报的内容。 此外,一些标点符号如“-”(连字符)、“\”(斜杠)、“_” (下 划线)、“,”(逗号)、 “ .”(点)等在不同的搜索引擎也
① 布尔逻辑算符(Boolean) 布尔算符 举例 功能 AND A AND B 在搜索结果中,必须同时含有A和B两 个检索词 OR A OR B 在搜索结果中,A、B两个检索词 只要出现一个即可 搜索含有检索词A但不含有B的网络信 息
NOT A NOT B
②
位置算符 位置算符强调检索词与检索词之间的位置关系,如哪 个检索词在前,哪个检索词在后,两个检索词相隔多少 个单词等。
⑤ 21世纪搜索引擎:
⑥ 孙悟空搜索引擎: ⑦ GOOGLE:
⑦ 悠游 ⑧ 3721疯狂搜索
⑨ 来科思
⑩ 中经搜索
二次检索 在网络信息搜索中,经常会感到搜索结果太多,令人 目不暇接,而且其中很大一部分是不需要的。此时建议用 户使用搜索引擎所提供的“Search Within”,即二次检索 功能。二次检索可以锁定搜索的范围,它指的是在前一次 搜索结果的基础上再进一步的查找,有时相当于and的功 能,但在使用上更具灵活性。
⑨
(5)搜索结果显示 搜索结果显示包含两方面内容,一是结果排序,二是 显示格式。极大多数国内外搜索引擎都具有相关度排序功 能。 ① 相关性 搜索引擎通常按照相关程度,从大到小的顺序排列。 相关程度用百分比或分值表示。由于因特网上资源无比丰 富,搜索结果往往多达几十、成百甚至上千上万条。为方 便检索者从中挑选适合自己需要的信息,几乎所有的搜索 引擎都提供了“对检索结果按相关度大小排序”的功能。 ② 显示格式 搜索引擎一般提供1~3种显示格式。常见的是简单链 接或摘要。
分(见图6-7,图6-8)
② 新闻搜索引擎: 焦点搜索 : 太平洋电脑网 /news :
③ 医药搜索引擎:
医狐健康搜索 :
金药搜索----中国金药网 :
5.2.4 网络市场间接调研的方法与步骤
1.网络信息检索技术
网络信息检索技术包括常用运算符、高级搜索技术、
限制检索、特殊检索技术: (1)常用运算符 常用运算符一般用于搜索引擎的简单检索。在网络信 息检索中,掌握一些常用的运算符,会使你的检索提问更 准确,搜索结果更精确。
①
加号:+
格式:+检索词 功能:检索词必须出现在搜索结果中。 示例:查找有关克林顿与琼斯的网页,检索提问式可以 为:+克林顿 +琼斯,表示克林顿与琼斯这两个词必须 出现在搜索结果网页中。
③ 搜索URL 格式:url:text或u:text 功能:检索整个URL中含有指定的字或词组的所有页面。 示例:如果你不知道Intel公司的网址,可通过url:intel查 询。 ④ 搜索链接 格式:link:URL 功能:检索与指定URL相链接的所有页面。 示例:要查询链接到易富网站的所有页面,可使用 link:查找。