信息检索方法和步骤

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
硅化物、硫酸、钛络合物、钉胺、呋喃、吡啶、醇 聚四氟乙烯、丁二酸(P)以及如金属板耐蚀钢、 耐蚀合金等;

表示国家名称、地名、组织机构名称及人名的 专有名词以及文献类型、文献载体的名词术语,
28
信息检索的一般步骤
1. 2. 3. 4. 5.
分析检索课题,明确信息需求 选择检索工具,了解检索系统 确定检索途经,选定检索方法


语种(中文、外文;英文、日文)
检索结果数量(100?50?)
16
1.1 检索需求类型
查找某概念的确切含义 如:什么是“blog” 查找某概念的背景知识 如:谁最先发现青霉素
特征型知识:
一般通过事实 型、数值型数 据库和搜索引 擎获得。
查找某些事物的数值及量化指标
17
查找某一学科的一般知识 如:关于分子生物学有哪些专著 查找学科专业领域的新进展 如:有关纳米技术的研究综述
关联型知识:
文献数据库
查找课题相关的专业文献 最常见的!
18
更多实例:

电子元器件的技术特性数据,可用有关的电子元器件类手 册、产品目录、样本或书查找;

查过去某年度某种电气电子类产品的产销、贸易、市场概
况,可用有关年鉴类资料; 查国内外哪些大学招收电气电子类研究生,可查大学类的

机构名录或校方的招生简章资料;
比较复杂、精细的检索课题,又是在人与 机器的对话、交互中实现的。
13
为什么不自己拟定一个检索课题?

请根据你自己的兴趣或正在学习的课程相 关内容拟定一个检索课题,后面课程的实 践将以你拟定的检索课题进行。有可能实 践考试是自拟课题进行检索。
14
准则一

你得到什么检索结果,取决于你怎么提问
七条信息检索准则来自: http://www.infotoday.com/searcher/jan02/block.htm 看ftp://192.168.0.251的“信息检索”文件夹内《搜索信息的七 条准则》,帐号:xinwen 密码:123456
4
抽查法

是根据检索需求,针对所属学科处于发展 兴旺时期的若干年进行文献查找。 用这种方法能获得一批具有代表性、反映 学科发展水平的文献,检索效果和效率较 高,但必须熟悉学科发展的特点。

5
追溯检索法

也叫扩展法、追踪法。此法不是利用确定的检索工具,而 是利用已知文献的某种指引,如文献附的参考文献、有关
实施检索策略,浏览初步结果
调整检索策略,获取所需信息
29
准则二:

去信息应该在的地方检索
30
2.选择检索工具,了解检索系统

与检索主题相关的检索工具有哪些?* (主要看数据库的学科覆盖范围) 与检索需求的文献类型相关的检索工具有 哪些?(如:哪些数据库或网站中含有会 议论文)


语种、年限、结果形式(全文还是文摘) (如检索1989~1994年的文献,选择维 普还是CNKI)

11
一些疑问:

如何进行信息检索? 数据库检索需要哪些技术? 什么是检索策略?
什么是检索途径?
哪些措施可以提供查全率?
哪些措施可以提供查准率?
……
12
什么是信息检索策略?

执行一个课题的检索是有过程、分步来完 成的,检索步骤的科学安排称为检索策略 (retrieval strategy),它是为实现检索目标 而制定的全盘计划或方案。特别是在计算 机检索中,策略问题是明确提出来的,必 须慎重考虑,因为它可能要完成的是一个
表示研究方法、技术方法的名词术语,如分析 (化学)、针刺手法、有限元法、结构功能法、 力学性能试验等;
本页面内容参考《汉语主题词表》
27


表示工艺方法、加工技术的名词术语,如铸造、
锻造、热处理、焊接、酿造、取心钻进、爆破成型、 激光切割等;

表示化学元素、化合物、金属材料与合金的名 词术语,如钠、氧原子、ⅣA族元素、钠化合物、


37
信息检索的一般步骤
1. 2. 3. 4. 5.

文种:中文
更新频率:年 访问模式:IP控制
35
2.4 微观上:“如何检索一个特定的数据库”

宏观上了解数据库,熟悉界面。 利用数据库提供的检索指南(帮助、FAQ)。 了解检索与浏览模式(一般检索、高级检索、 分类检索、特色检索等;按主题浏览、按出版 物字顺浏览等)。 检索结果的获得(多种全文格式、题录信息保 存、提供预印本)
8
3.2 直接检索法

是指直接通过浏览、查阅文献原文而获取所需文献信息的 方法。这种方法不依靠检索工具,所以不是严格意义上的 检索方法
• 优点:能够明确判断文献所包含的信息是否需要 • 缺点:是难以获得全面的文献,且费时费力,具有一定的盲
目性和偶然性。
• 如果检索课题单一,文献相对集中,又熟悉检索书刊,可用
• 若多个下位词都用来检索,相对于一个上位词

来说,一般是扩检。 一个下位词相对于一个上位词来说,一般是缩 检。
26
1.2.5 如何选词

表示具体事物名称的名词术语,如汽车、变压 器、反应堆、水稻、坐标仪等; 表示事物的状态或现象的名词术语,如强度、 失真、土壤熟化、日冕、船舶过载等;


表示科学分类的名词术语,如数学、物理学、 中医学、电子学、建筑工程、水利工程等;
3

3.1 间接检索法(即检索方法)

间接检索法是借助于检索工具查获所需文献的方法,包括 顺查法、倒查法和抽查法。 • 顺查法 是经过分析,确定查找的起始年代,再利用选定的检 索工具由远及近地逐年查找文献的方法。 • 它适用普查一定时间的全部文献,查全率较高,并 能掌握课题的来龙去脉,了解其研究历史、研究现 状和发展趋势。 • 倒查法 • 此法与顺查法相反,是按照时间范围,利用选定的 检索工具由近及远地逐年查找,直到查到所需文献 为止。 • 由于这种方法重点是查检近期文献,所以能获得较 新的文献信息,节省检索时间。 • 然而不如顺查法查全率高,容易产生漏检的现象。

34
如何了解一个数据库样例:书生数字图书

国内重要的数字图书之一 服务形式:WEB/镜像


涵盖学科或主题范围:所有学科
文献类型(出版形式、内容层次等): 电子图书,全文(一次文献)

收录年限,收录对象: 2001~2003,纸本图书的数字化
数据量(记录数):11.4万
注释、辅助索引、附录等,追踪查找文献。

根据已知文献的指引,查找到一批相关文献;再根据相关 文献的有关指引,扩大并发现新的线索,去进一步查找。
如此反复追踪扩展下去,直到检索到切题的文献。

用追溯法检索文献,最好利用与研究课题相关的专著与综 述,因为它们所附的参考资料既多且精。

在检索工具不全、文献线索很少的情况下,可采用此法。



其它特色功能(检索策略保存、信息定制)
全文阅读工具(PDF、专用阅读器)
36
2.4 如何获得数据库的检索帮助与指南信息

一般数据库界面上都有“帮助”或者“检 索指南”。 图书馆等文献机构发布数据库时提供的使 用帮助。 通过Google等搜索引擎搜索。 如:filetype:ppt 中国期刊全文数据库
31
2.1 选择检索工具的一般方法

根据不同的文献类型和语种需求选择 根据利用方便、使用熟练的程度选择 根据相应速度、获得支持和帮助的程度选


根据数据量、信息年限的需求选择 根据经验和推荐选择
32
2.2 选择的前提:知道有哪些信息源

图书馆网站的书目 数字资源列表(数据库) 搜索引擎 如:谷歌图书搜索、百度图书搜索、谷歌学术 搜索、谷歌专利搜索等
6
追溯检索的更多应用

文章参考文献更多文章 文章作者文章 作者文章
作者团体更多作者文章
链接网站更多链接
期刊论文图书
图书期刊论文
7
追溯检索的作用

用较少的文献引出较多的文献 了解科学研究的前期工作基础、相关文献、 经典著作、主要作者、重点期刊等。

• 稻米、皮糠、提取、天然、食品、色素 • 稻米、色素
24
排除检索意义不大的词

排除检索意义不大而且比较泛指的概念
• 如:展望、发展趋势、现状、近况、生产工艺、
应用、利用、作用、方法、影响、制备、结果

不要望词生义
25
1.2.4 明确概念间的逻辑关系

同义词、近义词是或的关系 上位词 即扩检,如“教育心理学” 下位词 即缩检,如“智育心理”、“德 育心理”、“美育心理”、“教学心理 学”、“学习心理学”、“教师心理学”、 “学生心理学”等。

查“自动化”一词的概念与含义,可用百科全书、学科术 语类解释辞典和相关手册;


查电子产品的电路图,可用相应的电路图集或手册;
查钱学森的主要论著和贡献,可用名人录;等等。
19
1.2 主题概念分析
从熟悉的已知文献信息入手 分析检索课题的内容实质

找出隐性的主题概念并将抽象的主题概念转化 为具体的概念 找出核心概念,排除无关概念和重复概念,简 化逻辑关系 明确概念间的逻辑关系
第二讲:基础知识:信息源与信 息检索原理
王建涛 2007-9-25
1
2.6 信息检索工具

手工检索工具 如印刷版的《全国报刊索引》。 计算机检索系统 如《CNKI中国学术文献网络出版总库》

2
2.7 信息检索方法

顺查法:时间上,远近 查全率高 倒查法:时间上,近远 查准率高 抽查法:研究的高级阶段 检索效率高 追溯法(引文法) : A.一次文献参考文献一次信息参考文献 …… 近远 B.一次文献引用该一次信息的文献新的一 次文献…… 实际是由“远近 ”越查文献 越新 交替法(综合法)
课题:高温下使用的不锈钢 “不锈钢”
“耐热钢”
22
隐性主题具体化
如:酸洗费液的处理
处理:“回收”、“再生”
如:煤灰利用 具体利用:? 检索式:
(粉煤灰+煤炭)*(利用+砖+水泥+混凝土+路基+……)
23
1.2.3找出核心概念,简化逻辑关系

并不是概念越多越好! 抓住主题的核心:最能表达检索课题内容, 而且具有实际检索意义的关键词。 如“利用稻米皮糠提取天然食品色素”


来源:龚国伟.分析检索课题的方法与技巧研究.图 书馆工作与研究.2006/04
20
1.2.1 分析检索课题的内容实质

从镀锌残渣中回收锌
• 工艺? • 实际是:从高品位镀锌残渣中分离铁 • 所以课题可以这样表述:
“从锌块中分离铁”
21
1.2.2 隐性主题的处理---主题概念具体化

请分析主题概念。

网络目录 http://dmoz.com/
提供公共信息的专门网站,如标准
开放获取信息资源,如ArXiv预印本文献库
33
2.3 宏观上:“如何了解一个数据库”

国际国内的在学术等领域的影响或地位 服务形式(WEB、光盘、联机检索、单机) 校内、国内、国外。镜像 涵盖学科或主题范围 文献类型(出版形式、内容层次) 收录年限,收录对象 数据量(记录数) 文种 更新频率 访问模式(口令,IP控制) 其它信息:帮助信息、出版者、发行者、在同行中的地位。
调整检索策略,获取所需信息
10
信息检索步骤示意图

分析检索课题 1.主题内容 2.时间范围 3.信息类型 4.检索语种 主 题 概 念
Baidu Nhomakorabea

选择检索工具 1.索引、文摘 2. 全文数据库

确定检索途径 1.分类途径 2.主题途径 3.题名途径 4.著者途径 5.其它途径

获 取 一 次 信 息
选择检索工具 1.馆藏目录 2.图书馆 信息检索系统 确定一次信息出处 1.缩写还原为全称 2.音译转换成原名 3.信息类型 信 息 线 索 选择检索方法 1.顺查法 2.倒查法 3.抽查法 4.追溯法 5.交替法
15
1 分析检索课题,明确信息需求

检索需求类型 主题概念分析(注:是课题检索的重点和难点)

检索目的(申报课题、开题报告、学术论文、成果查新、 课程论文、商业需求以及其它需求类型等)
文献类型(期刊论文、会议论文、科技报告、图书、专利、 标准、网站等) 结果形式(全文、文摘、题录、数值、事实等) 检索年限(如2000年以来的文献)
这种检索方法。
• 对于有多个主题、文献离散度较大的课题,则不宜用此法 • 由于直接检索具有准确性和实用性优势,能满足用户直接获
取文献的要求,因而是文献检索的必要手段。
9
2.8 信息检索步骤
① ② ③ ④ ⑤
分析检索课题,明确信息需求 选择检索工具,了解检索系统 确定检索途经,选定检索方法
实施检索策略,浏览初步结果
相关文档
最新文档