如何提高检索效率
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
遗漏了同义词
课题:“开创 了我国造山带 中系统研究古 地磁的先 例” 。
课题分析:检索式m=“造山带*古地磁”检 索到2篇,为何检索量较少?
再用同义词检索式为:m=“(造山带+秦 岭+大别山+天山+昆仑山+喜马拉雅山+ 三江地区)*古地磁” 检索到9篇。
遗漏了同义词
课题:“开创了我国造山带中系统研究古 地磁的先例” 。
粘合剂做关键词
粘固剂做关键词 胶粘剂做关键词
用户选择不对口的检索工具
查找机械制造方面的资料选用电气电子类的 文摘;用Google等网上搜索引擎找专利文 献,利用期刊论文类的检索工具查询图书, 没有结果。
提高查全的方法:用一个工具检索多个数据 库 如:NSTL
国家科技图书文献中心NSTL
检维索普检索途结果径失误
查全率的字段依次是K=关键词/T=题名结合C=分类号→T=题名→K=关键词 →R=文摘→U=任意字段。 4)取消限定条件。例如避免使用某些检索途径例如信息类型、语种、地理范围、 年代范围。 5)降低检索词的专指度,可以从词表或检出文献中选一些上位词或相关词补充 到检索式。 6)外文单词使用截词检索,可以采用前截断、后截断、前后截断等截词方法。 7)逐步扩大算符的检索范围,逐步提高查全率的算符依次是:位置算符 w→nw→near→逻辑算符and→or。
k=制糖*(工艺*装置) 分类检索
检索式调整为:m=制糖*(工艺+装置) 检索式再调整为:m=制*糖*(工艺+装置)*c=ts243+ts244
思考题
1.影响检索效率的因素和解决 办法是什么?
2.结合影响检索效率的案例, 总结检索本专业综合课题可 能遇到的困难。找出提高检 索效率的方法。
增加检索词,提高查准率
检索课题 “2003年春夏 时装展”,要 得到法国巴黎 的2003的春夏 时装展的资料。
增加检索词,提高查准率 检索式是:“2003年春夏时装展”
检索式调整为“巴黎 2003年 春夏时装展”
10.4兼顾查全率和查准率的案例
检索我国制糖业 中工艺装置发展情 况,如何在保证查 全率前提下提高查 准率?
10.3 影响查准率的案例
1.分析课题缺乏精确性 2.检索工具的检索精度较差 3.检索词的专指度较差 4.增加限定的字段,提高查准率 5.增加检索词,提高查准率
增加限定的字段,提高查准率
课题:使用维普《中文科技期刊数据库》查 询浙江大学高分子科学与工程系作者名为 王立的文献
Hale Waihona Puke Baidu
作者=王立
(作者=王立)*(机构=浙江大学)*全部期刊*年=2000-2006
提高查准率的方法
1)精确确定检索课题的目标,使用专业词汇。 2)选择专业性检索工具例如使用产品数据库、特种搜索引擎。 3)逐步缩小检索途径的检索范围,例如使用《中文科技期刊数据库》时,逐步
提高查准率的字段依次是U=任意字段→R=文摘→K=关键词→T=题名→K= 关键词/T=题名结合C=分类号;该数据库还能限定期刊范围:全部期刊→重 要期刊→核心期刊。 4)用不太常用的检索途径例如信息类型、语种、地理范围、年代范围、作者或 号码作为限定条件。 5)提高检索词的专指度,增加或换用下位词和专指度较强的自由词。 6)逐步缩小算符的检索范围,逐步提高查准率的算符依次是:逻辑算符 or→and→位置算符near→nw→w;使用算符“not”排除干扰信息。
人大复印资料检索结果
自然科 学试验 居多
❖ 案例:检索课题“人教大复学印资实料检验索界室面的管理”的信 息
维普检索
人大复印资料检索
遗漏隐含概念
课题:“垃圾处 理方面”的研 究,如何增加 检索词?
分析:垃圾处理 隐含垃圾利用、 垃圾再生等含 义。
遗漏隐含概念
课题“垃圾处理方增添面隐含”概念的研究,如何增加检索 词?
10.1 概述
查全率=[检出相关文献量/文献库内相关 文献总量]×100%
查准率=[检出相关文献量/检出文献总 量]×100%
提高查全率的基本方法
1)扩大检索课题的目标,使用主要概念,排除次要概念。 2)跨库检索。例如使用国家科技图书文献中心的数据库或者Google实现对不同
类型文献的一次性检索。 3)逐步扩大检索途径的检索范围。例如使用《中文科技期刊数据库》逐步提高
同时兼顾查全率和查准率的方法
1)跨库检索 2)分类途径和主题途径等多途径结合使用。 3)尝试多次检索 4)预防操作错误
1.对课1题0的.分2析影望文响生义查全率的案例
2.检索工具收录范围有缺漏,功能较差 3.正确的常规检索方法也会有缺漏 4.用户选择不对口的检索工具 5.检索途径失误 6.选用了不规范的词 7.所选检索词与检索工具的用词习惯不符 8.遗漏隐含概念 9.遗漏了同义词 10.检索式有缺陷,限定条件过窄 11.误用禁用词
对课题的分析望文生义
实例: 在 Google 检 索
我国生物技术在哪 些地方比较发达? 输入“生物技术 哪些地方 比较发 达”为何检索不到 信息?
评析:难对点是课“发题达”的这个分意析思如望何用文关键生词表义达。在
Google试用“我国生物技术发达地区”作为关键词进行 检索,得知我们国家的生物技术还与国际发达国家有差 距,不能检索到需要的信息。只要找出我国自己的生物 技术研究机构的分布,就能达到检索目标。用检索式 “我国生物技术 研究机构”搜索到“生物技术在线”, 有《我国生物技术应用广泛》一文,文中提到:“我国 生物技术产业通过20多年的发展已经初具规模,北京、 上海、广州、深圳等地已建立了20多个生物技术园区。” 故答案是在北京、上海、广州、深圳等地比较发达。
Google案例
Google案例
检索工具收录范围有缺漏
广西中医学院何
报作教授在19942002年发表的中 药研究论文有20 篇被纸本型《中文 科技资料目录—中 草药》收录,而同
期的数据库《中国
学术期刊全文数据 库》只收录了16 篇。
正确的常规检索方法也会有缺漏
❖ 维普科技期刊数据库中经常出现的非规范术 语等问题影响检索效率