信息检索文献检索资料搜索ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、信息检索概述
信息检索:依据一定方法,从已经组织好的有关大量 信息集合中,查出特定的相关信息的过程。按照检索 对象的不同,可分为文献检索、数值检索和事实检索。 信息检索利用检索词、检索条件实现过滤。
数据:描述事物的符号,包括数字、文字、图表、图 像、声音等。
数据库:数据的集合。数据库是信息检索系统的核心 部分之一,数据库的质量直接影响信息检索系统的功 能和效率。
四、信息检索方法
1、布尔检索法 2、截词检索法 3、位置检索法 4、字段检索法
1、布尔检索法 布尔运算符有三种,分别是 逻辑或 OR; 逻辑与 AND; 逻辑非 NOT
逻辑或: A+B、A or B 用来连接同义或相关的词 可增加检索结果 如Railway OR railroad 无人机 or 无人驾驶飞机 or UAV
2、截词检索法
截词:是指检索者将检索词在认为比较合适的地方截 断,也称模糊检索,又称词干检索法。
截词检索:用截断的词的一个局部进行的检索,即利 用检索词的词干加上截词符号去数据库中进行检索。 凡是满足这个截词的所有字符串的记录,系统都为命 中。
截词检索法在西文数据库中广泛使用。通常是在词干 后可能变化的位置上加上截词符号。检索词的单复数 形式,同一词英、美不同拼法,词根相同的词都可用 截词检索。
循环法
循环法又叫分段法。是指常用法和引文法的结合。
既要利用检索工具进行常规检索,又要利用文献后所 附的参考文献进行追溯检索,分期分段地交替使用几 种方法。即先利用检索工具(系统)检索到一批文献, 再以这些文献末尾的参考目标为线索逆向查找,如此 循环进行,直到满足要求时为止。
利用这种方法能够保证所查的资料较全面、系统。
排除、限定和合取法
排除法是指对查找对象的产生和存在的状态在时间上 和空间上加以外在否认。通过这种方法极大地收缩检 索范围。
限定法是相对于排除法而言的,指对查找对象在时间 上和空间上加以内在的肯定。令人满意的答案并非完 整地记录在某一篇文献中。
若把不同资料中涉及到的所需信息的记录都截取下来, 汇集在一起,再经过去粗取精、去伪存真的加工就构 成一个完整的答案,这种方法叫做合取法。
三、信息检索的基本方法
检索就是实施检索策略、搜寻所得文献信息的过程。 查找的方法并没有一定之规可供遵循。对同一个问题 不同的检索者可能就有不同的查找方法,这是因为主 观上受个人的实际经验、知识结构、对检索工具了解 的广度和深度、认识问题的方法等因素的影响,客观 上又受制于检索工具、检索时间和数据库等因素的影 响。
逻辑与: A*B 、 A and B 表示检索含有这两个词的文献集合 用于组配两个不同的概念 减少检索结果 如 traffic AND control UAV and helicopter
逻辑非: A-B 、 A not B 表示检索含检索词A而不含检索词B的文献 用来剔除一些不需要的概念。 减少检索结果 如fruit NOT apple
信息检索工具:
1. 文献信息检索工具:目录、文摘、索引、全文数据 库等。
2. 数据与事实信息检索工具:百科全书、年鉴、传记 资料、地理资料、机构名录、统计资料、字典、词典 等。
二、文献信息ຫໍສະໝຸດ Baidu类型
图书:内容系统、成熟、可靠,新颖性差
期刊:数量大,覆盖面广;内容新颖、及时;交流影 响广泛,信息价值高
限制截断:在词干后加若干截词符,限制可变化的位 数。
例如:educat?? 相当于educator、educated
倒查法
倒查法是由近及远,从新到旧,逆着时间的顺序利 用检索工具进行文献信息检索的方法。此方法的重点 是放在近期文献,只需查到基本满足需要时为止。使 用这种方法可以最快地获得新资料,而且近期的资料 总是既概括了前期的成果,又反映了最新水平和动向, 这种方法工作量小,但漏检率较高,主要用于新课题 立项前的调研。
抽查法:
抽查法是针对检索课题的特点,选择有关该课题的文 献信息最可能出现或最多出现的时间段,利用检索工 具进行重点检索的方法。
它适合于检索某一领域研究高潮很明显的、某一学科 的发展阶段很清晰的、某一事物出现频率在某一阶段 很突出的课题。该方法是一种花时较少而又能查到较 多有效文献的一种检索方法。
报纸:出版周期更短;获取时事政策性信息
政府出版物:源自官方、权威、可靠;可获取政策性、 法规性及科技信息
科技报告:反映前沿科技、内容新颖、有密级控制, 如美国政府四大报告:AD、NASA、PB、DOE报告
专利文献:反映新的技术发明,类型有:专利说明书、 专利公报、专利分类表、专利文摘等检索工具
截词符号:一般为‘?’或‘*’表示截词的截断符号, 各检索系统有不同规定,没有统一标准。
种类: 按截词位置分:前截断、后截断、中截断; 按截词的字符数量分:非限制截断、限制截断
后截断:在检索词词干后面加截词符
非限制截断:在词干后面加一个截词符,表示不限制 词尾可变化的字符位数。
例如:comput?可查找到computed、computing、 computer、computers等词,注意不宜将词截的过短, 否则容易造成误检
会议文献:反映最新成果、最新动向、高水平、前沿 发展动态。包括会议论文集、会议录等
学位论文:内容专深,有较高的学术参考价值
标准文献:反映成熟技术,供研制新产品、改造老产 品、改进工艺和操作水平借鉴
产品资料:形象、直观、新颖,可了解工艺水平、产 品动态等
技术档案与图纸:技术性、适用性、保密性
常用法。这是指利用各种类型检索工具,通过技巧查 找资料的方法。常用法又可分为顺查和倒查两种。
顺查法:
顺查法是指按照时间顺序,由远及近地利用检索系 统进行文献检索的方法。这种方法能收集到某一课题 的系统文献,它适用于较大课题的文献检索。
例如已知某课题的起始年代,现在需要了解其发展 的全过程,就可以用顺查法从最初的年代开始,逐渐 向近期查找。该方法优点是漏检率低,但工作量大。
信息检索:依据一定方法,从已经组织好的有关大量 信息集合中,查出特定的相关信息的过程。按照检索 对象的不同,可分为文献检索、数值检索和事实检索。 信息检索利用检索词、检索条件实现过滤。
数据:描述事物的符号,包括数字、文字、图表、图 像、声音等。
数据库:数据的集合。数据库是信息检索系统的核心 部分之一,数据库的质量直接影响信息检索系统的功 能和效率。
四、信息检索方法
1、布尔检索法 2、截词检索法 3、位置检索法 4、字段检索法
1、布尔检索法 布尔运算符有三种,分别是 逻辑或 OR; 逻辑与 AND; 逻辑非 NOT
逻辑或: A+B、A or B 用来连接同义或相关的词 可增加检索结果 如Railway OR railroad 无人机 or 无人驾驶飞机 or UAV
2、截词检索法
截词:是指检索者将检索词在认为比较合适的地方截 断,也称模糊检索,又称词干检索法。
截词检索:用截断的词的一个局部进行的检索,即利 用检索词的词干加上截词符号去数据库中进行检索。 凡是满足这个截词的所有字符串的记录,系统都为命 中。
截词检索法在西文数据库中广泛使用。通常是在词干 后可能变化的位置上加上截词符号。检索词的单复数 形式,同一词英、美不同拼法,词根相同的词都可用 截词检索。
循环法
循环法又叫分段法。是指常用法和引文法的结合。
既要利用检索工具进行常规检索,又要利用文献后所 附的参考文献进行追溯检索,分期分段地交替使用几 种方法。即先利用检索工具(系统)检索到一批文献, 再以这些文献末尾的参考目标为线索逆向查找,如此 循环进行,直到满足要求时为止。
利用这种方法能够保证所查的资料较全面、系统。
排除、限定和合取法
排除法是指对查找对象的产生和存在的状态在时间上 和空间上加以外在否认。通过这种方法极大地收缩检 索范围。
限定法是相对于排除法而言的,指对查找对象在时间 上和空间上加以内在的肯定。令人满意的答案并非完 整地记录在某一篇文献中。
若把不同资料中涉及到的所需信息的记录都截取下来, 汇集在一起,再经过去粗取精、去伪存真的加工就构 成一个完整的答案,这种方法叫做合取法。
三、信息检索的基本方法
检索就是实施检索策略、搜寻所得文献信息的过程。 查找的方法并没有一定之规可供遵循。对同一个问题 不同的检索者可能就有不同的查找方法,这是因为主 观上受个人的实际经验、知识结构、对检索工具了解 的广度和深度、认识问题的方法等因素的影响,客观 上又受制于检索工具、检索时间和数据库等因素的影 响。
逻辑与: A*B 、 A and B 表示检索含有这两个词的文献集合 用于组配两个不同的概念 减少检索结果 如 traffic AND control UAV and helicopter
逻辑非: A-B 、 A not B 表示检索含检索词A而不含检索词B的文献 用来剔除一些不需要的概念。 减少检索结果 如fruit NOT apple
信息检索工具:
1. 文献信息检索工具:目录、文摘、索引、全文数据 库等。
2. 数据与事实信息检索工具:百科全书、年鉴、传记 资料、地理资料、机构名录、统计资料、字典、词典 等。
二、文献信息ຫໍສະໝຸດ Baidu类型
图书:内容系统、成熟、可靠,新颖性差
期刊:数量大,覆盖面广;内容新颖、及时;交流影 响广泛,信息价值高
限制截断:在词干后加若干截词符,限制可变化的位 数。
例如:educat?? 相当于educator、educated
倒查法
倒查法是由近及远,从新到旧,逆着时间的顺序利 用检索工具进行文献信息检索的方法。此方法的重点 是放在近期文献,只需查到基本满足需要时为止。使 用这种方法可以最快地获得新资料,而且近期的资料 总是既概括了前期的成果,又反映了最新水平和动向, 这种方法工作量小,但漏检率较高,主要用于新课题 立项前的调研。
抽查法:
抽查法是针对检索课题的特点,选择有关该课题的文 献信息最可能出现或最多出现的时间段,利用检索工 具进行重点检索的方法。
它适合于检索某一领域研究高潮很明显的、某一学科 的发展阶段很清晰的、某一事物出现频率在某一阶段 很突出的课题。该方法是一种花时较少而又能查到较 多有效文献的一种检索方法。
报纸:出版周期更短;获取时事政策性信息
政府出版物:源自官方、权威、可靠;可获取政策性、 法规性及科技信息
科技报告:反映前沿科技、内容新颖、有密级控制, 如美国政府四大报告:AD、NASA、PB、DOE报告
专利文献:反映新的技术发明,类型有:专利说明书、 专利公报、专利分类表、专利文摘等检索工具
截词符号:一般为‘?’或‘*’表示截词的截断符号, 各检索系统有不同规定,没有统一标准。
种类: 按截词位置分:前截断、后截断、中截断; 按截词的字符数量分:非限制截断、限制截断
后截断:在检索词词干后面加截词符
非限制截断:在词干后面加一个截词符,表示不限制 词尾可变化的字符位数。
例如:comput?可查找到computed、computing、 computer、computers等词,注意不宜将词截的过短, 否则容易造成误检
会议文献:反映最新成果、最新动向、高水平、前沿 发展动态。包括会议论文集、会议录等
学位论文:内容专深,有较高的学术参考价值
标准文献:反映成熟技术,供研制新产品、改造老产 品、改进工艺和操作水平借鉴
产品资料:形象、直观、新颖,可了解工艺水平、产 品动态等
技术档案与图纸:技术性、适用性、保密性
常用法。这是指利用各种类型检索工具,通过技巧查 找资料的方法。常用法又可分为顺查和倒查两种。
顺查法:
顺查法是指按照时间顺序,由远及近地利用检索系 统进行文献检索的方法。这种方法能收集到某一课题 的系统文献,它适用于较大课题的文献检索。
例如已知某课题的起始年代,现在需要了解其发展 的全过程,就可以用顺查法从最初的年代开始,逐渐 向近期查找。该方法优点是漏检率低,但工作量大。