信息检索(理工)复习重点
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章 信息检索概论
第1节:概论 一、信息检索的类型及特点 二、信息检索技术 三、检索相关知识 第2节:文献信息源
一. 信息检索的类型及特点
文献检索:
书目信息检索:相关性检索,提供线索
全文信息检索:直接查找原文
数据信息检索:查找数值型信息 事实信息检索:查找发生的事件
书目信息检索
检索对象:以标题、作者、来源出处、 摘要及收藏地点为检索对象的一类检索 称之为书目信息检索 特点:检索结果不直接解答用户提出的 技术问题,只提供有关线索。
思考题(续)
15. 已知作者姓名, 怎样查找其在三大检索系统中 的收录情况? 怎样在SCI中查引用?
16 . 怎样在JCR中查某种期刊的影响因子?影响 因子如何计算? 17. 期刊文献、专利文献的原文出处是什么?
18. 《中图法》分类号的构成?
19. 如何利用图书馆主页?怎样查馆藏图书和期 刊? 怎样操作图书续借和预约?
右截词
又称后端截词、前端一致。分为有限右截 词和无限右截词。是一种满足前方一致的 检索。
• 允许检索词尾部有若干变化形式
例如:检索式 book? computer*
例如:检索式:computer*
computer computering computerised computerized computerization
哪些数据库属于书目数据库
存储目录、题录、文摘等书目数据的
EI、SCI、全国期刊联合目录、
全文信息检索
以论文或专利说明书的全文为检索对象。 特点:检索结果是与课题相关的论文或 专利说明书的全文。 是在书目信息检索基础上更深层次的内 容检索。(如‘维普’从书目到全文一步 到位)
全文数据库有哪些
存储全文 CNKI,VIP,ELSEVIER,超星电子图书
思考题(续)
24. 国际专利分类号的构成?分类原则?《IPC表》 的适用范围? 25. 什么是同族专利? 26. 专利的类型及申请条件?专利权的特性? 专利的 审批制度?中国专利公布时间期限? 27. 专利号的构成?申请号的构成?专利说明书号的 构成? 28. 布尔算符的意义? 词位检索算符的意义?
考
试
考试时间:第16周,周四第1大节
考试地点:综合楼C306
考试时间:第16周,周四第2大节
考试地点:综合楼C306
思考题
1.
文献信息的类型和特点?划分文献类型的方 法?
一、二、三次文献信息的主要代表?它们各 有何特点?
2.
3. 信息检索的类型?分别检索哪种数据? 各有 何特点? 4. 书目信息检索的对象是什么?
词位检索(SAME)
截词
三、检索相关知识
(1)检索结果排序功能: 按相关度排列检索结果 按出版日期排列检索结果 (2)扩检功能: 很多数据库都有不同的扩检功能,如作者链接功 能,主题词链接功能(EI),同类文献检索功能 (CNKI相似文献检索)。 (3)编制检索提问式
如何选检索词和编检索式
检索课题:汽车噪声的危害与治理
二.检索技术的应用
■中文科技期刊全文数据库
(重庆维普)
‘逻辑与’检索
逻辑或检索
限制检索(字段/时间)
CNKI
中国期刊全文数据库
逻辑与
逻辑或
逻辑非
词位检索
ห้องสมุดไป่ตู้
CNKI
布尔检索:
逻辑与: * and 并且(高级检索 选择)
逻辑或 :+ or 或者(高级检索 选择) 逻辑非: 词位检索: 同句检索(指一句话)(高级检索 选择) not 不包含(高级检索 选择)
检索课题:汽车噪声的危害与治理
1.选择检索词:
汽车、车辆、城市交通
噪声、噪音 控制、防治、治理
2.编写检索式: 考虑查准:
汽车*(噪声+噪音)*(治理+危害)
兼顾查全查准
(城市交通+汽车+车辆)*(噪声+噪音)* (控制+防治+治理+危害)
课题2:近年来中国洪涝灾害分析及对策
课题:近年来中国洪涝灾害分析及对策
protection of the environment
protection of water environmeny
protection of forest environmeny
(nN)关系
要求它所连接的两个检索词在结果中的相 互距离不超过n个词,但前后顺序可以变换。
表示插入的词小于等于n个。
(nW)关系
要求它所连接的两个检索词在检索结 果中相互距离不超过n个词,而且前后顺 序不能颠倒。(n=0,1,2,3,…n), 表示插入的词≤n 例如:second (w) world (w) war (n=0)
例如:检索式:
environment (2W) protection
检索结果中:
environment protection
短语检索
相关短语检索: 输入的短语不加任何括号或引号,检索结 果是中间可以插入词。 精确短语检索: 如果要进行精确短语检索,则必须把输入 的短语加上大括号{ }或引号“ ”。检索结 果是中间不能加入词。
3. 截词检索
(1)自动取词根 Autostemming off
系统提供自动取词根,此功能可以检索以输入词的 词根为基础的所有派生词。如输入management, 结果为managing,managed,manager,manage, managers等。
限制检索
把检索的内容限制在某一范围内:如字段, 文种,时间,重点是字段限制。
1、要求把查询的检索范围限制在标题、作
者、关键词、文摘、刊名等字段内。
2、各个数据库提供的检索字段是不同的。
3、数据库常提供的主题检索字段有哪些? (标题、文摘、关键词)
限制检索对查全查准的作用
字段限制: 任意 文摘 文献类型限制 时间限制 关键词 题名
A OR B
NOT关系
逻辑非(逻辑减):是一种具有概念排 除关系的组配。 用关系词 NOT、- 、不包含 表示。 表示它所连接的两个检索词中应从第一 个概念中排除第二个概念。 A NOT B
词位检索
又叫近义检索和邻近检索 通过检索式中的专门符号来规定 检索词在检索结果中的相对位置。
(nW) (nN)
思考题(续)
10. 中国期刊全文数据库(CNKI)提供的检索方式有几种? 采用了哪些检索技术? 如何下载题录和文摘?下载题录格 式?
11. 期刊论文的著录格式?如何索取纸质原文?如何索取电子 原文?
12. 世界著名的三大检索系统是什么? 13. EI conpendex web 的检索方式有哪些?有 哪些辅助功能?有哪些检索技术? 14. Web of science 的检索方式有哪些?有哪些 辅助功能? 有哪些检索技术?
点击关闭自动取词根(Autostemming off)可禁 用此功能。(注意:此处和别的不一样,别处是选 择为打开,此处是选择为关闭)
自动取词根技术打开
自动取词根技术关闭
使用截词算符 ? *
*
* —无限截词,?—有限截词
4. 限制检索
限制检索有字段、文献类型/文献处理类 型、短语的匹配度、时间、语种等多种 限制。例:只检索期刊论文,可以通过 限制文献类型为“Journal Article ”来实 现。
思考题(续)
29 .中国专利信息网和知识产权局提供了哪些检索途 径? 有哪些检索方法?
30. 专利文献的作用?
31. 比较网络检索和数据库检索的优缺点? 32. 知识产权主要有哪些?保护时间? 33. 数据库常用的排序方法? 34. 如何使用期刊联合目录?
目
录
一、信息检索概论 二、信息检索技术 三、文献信息源 四、专利概论 五、国内数据库检索 六、国外数据库检索 七、专利信息检索
1.检索词:洪灾,涝灾,洪水灾害,水灾,自然灾害, 对策,措施,分析 2.检索式: 考虑查准: T=洪涝 * 灾害 * U=(分析+对策) 兼顾查全查准: T=(洪灾+涝灾+自然灾害+水灾+洪水灾害)* U=(分析+对策)
还原检索式及课题
篇名=(弱势(同句)群体 + 下岗工人- 农民工) *关键词= (生存+生活) 城市弱势群体的生存状况调查
思考题(续)
20 .图书馆有哪些电子资源与本专业有关? 21. 哪些字段是数据库的主题字段? 字段对查全查 准率的影响? 22. 熟悉重要数据库的检索界面(维普,CNKI,EI,SCI 中国知识产权局); 了解各项功能; 可以将检索式表 达的信息输入检索界面,也可以根据检索界面上的 信息还原为检索式和检索课题。 23. 能识别 索书号、IPC号、中国法分类号
输入检索式
检索式:篇名=(大学生+本科生+高校学生+大专院校学生)* 关键词= (文化素质+文学修养+艺术修养)*全文=培养 PY=2000-2008
第二节:信息资源及其类型
5. 信息检索的技术有哪些?
思考题(续)
6. 如何正确使用各种逻辑符号编写提问式,正确 表达研究课题对信息的需求? 7 . 数据库的结构和类型? 8. 在维普中文科技期刊数据库、中国期刊全文数 据库中可采用系统提供的哪些功能来提高信息的 查全率和查准率?
9. 中文科技期刊数据库提供的检索方式有几种? 如何下载题录和文摘?如何自定义下载题录?采 用了哪些检索技术?
为记录,一个记录又包含若干字段。
二、 信息检索技术
指现代信息检索系统采用的相关技术。其 类型主要有 布尔检索 词位检索 截词检索 限制检索 重点为布尔检索、截词检索。 如何使用信息检索技术编写提问式?
布尔检索
所谓“布尔检索”是指通过标准的布 尔逻辑关系词来表达检索词与检索词之间 逻辑关系的检索方法。主要的布尔逻辑关 系词有
(1) near :词序可颠倒,提高查全率。 例如 solar near energy (2) onear :词序不能颠倒,提高查准率。 例如 solar onear energy
截词检索
所谓“截词检索”是指在检索式中用 专门符号(截词符号)表示检索词的某 一部分允许有一定的词形变化。
检索词的不变部分加上由截词符号所 代表的任何变化形式所构成的词汇都是 合法检索词
限制检索
检 索 字 段 限 定 文献类型限定 处理类型限定
原文语种限定
时间范围限定
Web of science
可用的检索技术 布尔检索— and、 or 、 not
词位检索— same
限制检索—标题、主题、年代等
截词检索—— * 、?、$
(* :无限截词, ?和 $为有限截词)
布尔检索
限制检索(题名字段)
AND OR NOT
逻辑与(逻辑乘):是一种具有概念交 叉或概念限定关系的组配。 用关系词 AND、+、并且 表示。 表示它 所连接的两个检索词必须同时出现在检索结 果中才满足 (信息*推送;模具*设计)
OR 关系
逻辑或(逻辑加):是一种具有概念并列 关系的组配。 用关系词OR、+、或者 表示。 表示它所连接的两个检索词中任意一个出 现在检索结果中就满足检索条件。
同段检索(指五句话中)(高级检索 选择)
限制检索:字段限制,时间限制
Ei Village 2
布尔检索: and or not
截词检索和自动取词根技术 词位检索(near)(短语检索)
限制检索(字段、文献类型、语种、时间)
布尔检索、词位检索
Tall near rist near building Structure design
数据信息检索
以具有数量性质并以数值形式表示的 数据为检索对象。 检索的结果是经过测试和评价过的各 种数据。如水的沸点,油的闪点。 它是一种确定性检索。一般常用数据 大全、手册、年鉴进行检索。
事实信息检索
以事实项为检索对象,检索结果是有 关某一事物的具体答案 它也是一种确定性检索。一般常用手 册、年鉴、百科全书进行检索。
. environment protection
protection
environment
算符:NERA 、SAME
特点:限制检索词之间的位置关系,提高查准率。 NERA表示两词之间不得多于9个词,词前后位 置任意 SAME要求检索词在同一个句子中,这里所指的 同一个句子是两个句号之间的字符串,检索词在 句子中的顺序任意。
数据库的类型和结构
一.类型: 参考数据库:主要存储一系列描述性信息, 指引用户到另一信息源以获得完整的原始 信息的一类数据库. 源数据库:主要存储全文、数值、结构式 等信息。能直接提供原始文献信息或具体 数据,用户不必再转查其它信息源的数据 库。
数据库的类型和结构续
书目数据库的结构: 书目数据库是以文档 形式组织的一系列数据,这些数据被称