文献信息检索技术精品PPT课件
合集下载
文献信息检索 ppt课件
❖ 注意:优先级为not, and, or,用括号保证优先 权;运算符两侧必须各有一个空格(半角)。
❖ 实例:
❖ 膜法提取甘露醇中的微生物污染控制 (膜法+膜集成)*甘露醇*(细菌污染+微生物污 染)
写出以下检索词,并用上述布尔逻辑符写出检 索式:
固氮和固碳的生化机理或基因机制
(二)、位置算符
在检索词之间使用,规定算符两边的检索词出现在 记录中的的位置,以提高检准率。比如:如果不 用with位置算符,则词组可能被系统识别为逻辑运 算,protein disulfide isomerase(蛋白质二硫 键异构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等 符号时不易识别成词组。
文献信息检索
文献信息检索
文献信息检索
第二节 检索途径与检索语言 P25-26
1 检索途径 (检索项,检索点、检索入口)
分类途径 主题途径 关键词途径 题名途径 责任者途径 引文途径
❖ 2、检索语言:用来描述检索提问主题、学 科分类等内容的语言,它和检索途径是相对 应的。(P27) 常见的检索语言有主题语言和 分类语言。
题名
检 索
表述文献外表 特征的语言
责任者 代码 引文
语
言
的
分类法
类 型
表述文献内容 特征的语言
❖ 实例:
❖ 膜法提取甘露醇中的微生物污染控制 (膜法+膜集成)*甘露醇*(细菌污染+微生物污 染)
写出以下检索词,并用上述布尔逻辑符写出检 索式:
固氮和固碳的生化机理或基因机制
(二)、位置算符
在检索词之间使用,规定算符两边的检索词出现在 记录中的的位置,以提高检准率。比如:如果不 用with位置算符,则词组可能被系统识别为逻辑运 算,protein disulfide isomerase(蛋白质二硫 键异构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等 符号时不易识别成词组。
文献信息检索
文献信息检索
文献信息检索
第二节 检索途径与检索语言 P25-26
1 检索途径 (检索项,检索点、检索入口)
分类途径 主题途径 关键词途径 题名途径 责任者途径 引文途径
❖ 2、检索语言:用来描述检索提问主题、学 科分类等内容的语言,它和检索途径是相对 应的。(P27) 常见的检索语言有主题语言和 分类语言。
题名
检 索
表述文献外表 特征的语言
责任者 代码 引文
语
言
的
分类法
类 型
表述文献内容 特征的语言
《文献信息检索》课件
探索保持数据库最新和高效的方法,确保你的检索始终依赖于最新的信息资源。
学术写作及相关工具
学术文章写作的基本要素
了解学术写作的基础知识,帮助你撰写高质量的学 术论文。
学术写作软件的介绍和应用
了解各种学术写作软件的特点和用途,提高你的写 作效率和质量。
结束语
非常感谢大家的参与和支持!希望本次课程能够为你们在学术研究中的工作 提供帮助和指导。
检索工具的基本使用
掌握学术搜索引擎和图书馆搜索数据库的基本 使用方法,提高你的检索效率和质量。
检索技巧与策略
学习检索词的选择和组合、布尔运算符的使用 以及结果的评估和筛选,更好地掌握检索技巧。
数据库管理与维护
1
数据库备份和恢复
学会对文献数据库进行备份和恢复,保护你的宝贵数据免受意外丢失的风险。
2
数据库更新和维护
《文献信息检索》PPT课 件
# 文献信息检索
本PPT课件将介绍文献信息检索的基本概念、工具和技巧,以及数据库管理和 学术写作的要点和相关工具。
课程大纲
课程介绍
探索《文献信息检索》课程的目标和教学方法, 为你的学习之旅打下基础。
百度文库
文献信息检索的概念和意义
了解检索的定义、分类以及在学术研究中的作 用,为你掌握检索的关键要素提供背景知识。
文献信息检索ppt课件
第三节 计算机信息检索技术
(一)逻辑运算符 逻辑运算符又称布尔算符,是用来表达各检
索词之间的逻辑关系的符号。 逻辑运算符有“与”、“或”、“非”三种,
分别用“and” 、“or”、 “not”来表示, 也可以用 “*” “+” “-”来表示。
1、逻辑“或”——— ——————————————
其优点是: A、简捷,降低对检索人员的要求; B、易用,易于计算机编制和检索; C、及时,能及时更新词汇。
缺点:
1、不规范,有大量的同义词、近义词,影响查
全率和查准率。如“高速公路” 有”highway”“autoroute”,“freeway”, “speedway”,“thruway”等,“图形图像” 和“图形图象”同义,检索时如果不能全部记 住,会出现漏检;而“cell”既指细胞又指电 池,检索时会出现误检。
分类途径
根据分类语言进行检索的途径,它是一种按学科 范畴和体系来划分事物的检索语言,以分类表的 形式体现。国内文献分类一般使用《中国图书馆 图书分类法》(简称《中图法》).(P30)
专利使用《国际专利分类法》(IPC)分类。国 外分类法很多,比较常见的有《美国国会图书馆 分类法》(LC)、《国际十进分类法》等。
第二节 检索途径与检索语言 P25-26
1 检索途径 (检索项,检索点、检索入口)
分类途径 主题途径 关键词途径 题名途径 责任者途径 引文途径
文献信息检索ppt
❖ 考虑相应的同义词。对同一事物,人们对其有不同的称呼和表达,如“计算机”又称“电脑”、 “图形图像与图形图象”要用逻辑或进行检索。
❖ 上位词、下位词:检索词有上位词下位词之分,一般来说,如果检索上位词,要同时检索下位词, 如在EBSCO中,我们检索“芭蕾舞服装(ballet costume)”,必须同时检索“芭蕾舞裙(ballet skirt)”、“芭蕾舞鞋(toe shoe)”,才能得到满意的查全率。当然,如果下位词太多,则不能 全部选择。如果下位词检索效果不理想,也可以在上位词中检索。海南黄花梨病虫害防治,没有 专门的书,但在《景观植物病虫害防治 》一书中有一节专门论述。
❖ 模糊检索:包含关系,检索词可以在相关字段的任何位置。这是最常见的匹配方式。
❖ 在许多检索系统中(CNKI 、万方、搜索引擎),精确检索表示包含关系,即检索词不被切分, 包含在相关字段的任何位置,与前述的模糊检索相同。模糊检索表示自动分词检索。
第四节 检索步骤
分
确
析
选
定
检
择
检
索
工
索
课
具
词
题
编 制 检 索 式
返回
关键词途径
❖ 以关键词进行检索的方式,关键词又称自由词,是从文献的题名、摘要和正文中抽出的 具有实际意义的非规范化自然语言。
❖ 其优点是: A、简捷,降低对检索人员的要求; B、易用,易于计算机编制和检索; C、及时,能及时更新词汇。
❖ 上位词、下位词:检索词有上位词下位词之分,一般来说,如果检索上位词,要同时检索下位词, 如在EBSCO中,我们检索“芭蕾舞服装(ballet costume)”,必须同时检索“芭蕾舞裙(ballet skirt)”、“芭蕾舞鞋(toe shoe)”,才能得到满意的查全率。当然,如果下位词太多,则不能 全部选择。如果下位词检索效果不理想,也可以在上位词中检索。海南黄花梨病虫害防治,没有 专门的书,但在《景观植物病虫害防治 》一书中有一节专门论述。
❖ 模糊检索:包含关系,检索词可以在相关字段的任何位置。这是最常见的匹配方式。
❖ 在许多检索系统中(CNKI 、万方、搜索引擎),精确检索表示包含关系,即检索词不被切分, 包含在相关字段的任何位置,与前述的模糊检索相同。模糊检索表示自动分词检索。
第四节 检索步骤
分
确
析
选
定
检
择
检
索
工
索
课
具
词
题
编 制 检 索 式
返回
关键词途径
❖ 以关键词进行检索的方式,关键词又称自由词,是从文献的题名、摘要和正文中抽出的 具有实际意义的非规范化自然语言。
❖ 其优点是: A、简捷,降低对检索人员的要求; B、易用,易于计算机编制和检索; C、及时,能及时更新词汇。
第一讲 文献信息检索基础知识 ppt课件
联合国教科文组织(UNESCO)2003年把信息素养 定为终身学习的基础和未来公民的必备能力之一
国外发达国家早已把信息素养融入到自己的教育体 系中,而我国在信息素养教育领域尚处于探索和起 步阶段
我国教育界在《面向21世纪教育振兴行动计划》中 明确提出到2010年在全国建立起终身学习体系,信息 素养是终身学习的条件。
——美国教育技术CEO论坛 2001年第4季度报告
2020/10/28
21
IL是一种综合能力
信息素养需要诸多知识背景;
信息素养需要信息技术的支持,信息技术 是它的有力的工具;
信息素养是一种信息能力;
信息素养是一种了解、搜集、评价和利用 信息的知识结构。
2020/10/28
22
IL在中国的研究和实践
• 具有信息素养的人能够知道什么时候需要信息,能够有效 地获取、评价和利用所需要的信息。
• ——美国图书馆协会ALA, 1989
• 发现、检索、分析、评价与利用信息的 技能或能力。
2020/10/28
15
信息素养的主要内容
信息意识 信息技能 信息评价及利用 信息安全及信息道德
2020/10/28
秋、
语言、战争、贫 困、喜、怒、哀、
乐
6
(一)信息与社会
从生产力的角度可以将人类社会划分为四个发展阶段:
原始社会、农业社会、工业社会和信息社会。
国外发达国家早已把信息素养融入到自己的教育体 系中,而我国在信息素养教育领域尚处于探索和起 步阶段
我国教育界在《面向21世纪教育振兴行动计划》中 明确提出到2010年在全国建立起终身学习体系,信息 素养是终身学习的条件。
——美国教育技术CEO论坛 2001年第4季度报告
2020/10/28
21
IL是一种综合能力
信息素养需要诸多知识背景;
信息素养需要信息技术的支持,信息技术 是它的有力的工具;
信息素养是一种信息能力;
信息素养是一种了解、搜集、评价和利用 信息的知识结构。
2020/10/28
22
IL在中国的研究和实践
• 具有信息素养的人能够知道什么时候需要信息,能够有效 地获取、评价和利用所需要的信息。
• ——美国图书馆协会ALA, 1989
• 发现、检索、分析、评价与利用信息的 技能或能力。
2020/10/28
15
信息素养的主要内容
信息意识 信息技能 信息评价及利用 信息安全及信息道德
2020/10/28
秋、
语言、战争、贫 困、喜、怒、哀、
乐
6
(一)信息与社会
从生产力的角度可以将人类社会划分为四个发展阶段:
原始社会、农业社会、工业社会和信息社会。
文献信息检索ppt
第二章 文献信息检索技术
第一节 文献信息检索技术
(一)检索方式 1、命令式检索:用逻辑运算符、位置算符及其他检索符号,
把不同的检索词连接起来进行检索的一个种方式,如数据库 中的专业检索。适用于专业人员。 2、菜单式检索:一种通过窗口菜单进行检索的简单、易操作 的检索方式。现各数据库的高级检索、初级检索都属于菜单 式检索,是最常用的检索方式,适用于一般读者检索。 3、导航检索:点击检索界面上的超链接进行检索,也叫超链 接检索。
常见的位置算符如下:
位置算符
with
near
field subfiel
d link
表示方法 (W)或()
(nW) (N) (nN) (F) (S)
(L)
说明 两个词在命中结果中相邻(可有空格、标点和连字 符),词序不得颠倒。 两个词之间最多可夹入n个词,词序不得颠倒。 两个词在命中结果中相邻,词序可颠倒。 两个词之间最多可夹入n个词,词序可颠倒。 两个词在同一字段出现,位置不固定。 两个词在同一子字段出现,位置不固定。
分类途径
中图法分类体系
A 马克思主义、列 宁主义、毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教 育 、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学
P 天文学,地球科学 Q 生物科学 R 医药、卫生 S 农业、林业 T 工业技术总论 TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 治金工业 TG 金属学、金属工艺 TH 机械、仪表工业 TJ 武器工业 TK 动力工程
第一节 文献信息检索技术
(一)检索方式 1、命令式检索:用逻辑运算符、位置算符及其他检索符号,
把不同的检索词连接起来进行检索的一个种方式,如数据库 中的专业检索。适用于专业人员。 2、菜单式检索:一种通过窗口菜单进行检索的简单、易操作 的检索方式。现各数据库的高级检索、初级检索都属于菜单 式检索,是最常用的检索方式,适用于一般读者检索。 3、导航检索:点击检索界面上的超链接进行检索,也叫超链 接检索。
常见的位置算符如下:
位置算符
with
near
field subfiel
d link
表示方法 (W)或()
(nW) (N) (nN) (F) (S)
(L)
说明 两个词在命中结果中相邻(可有空格、标点和连字 符),词序不得颠倒。 两个词之间最多可夹入n个词,词序不得颠倒。 两个词在命中结果中相邻,词序可颠倒。 两个词之间最多可夹入n个词,词序可颠倒。 两个词在同一字段出现,位置不固定。 两个词在同一子字段出现,位置不固定。
分类途径
中图法分类体系
A 马克思主义、列 宁主义、毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教 育 、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学
P 天文学,地球科学 Q 生物科学 R 医药、卫生 S 农业、林业 T 工业技术总论 TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 治金工业 TG 金属学、金属工艺 TH 机械、仪表工业 TJ 武器工业 TK 动力工程
文献检索方法ppt课件
数据发掘
利用数据发掘技术从大量 文献中提取有价值的信息 ,为科研和决策提供支持 。
个性化文献推举系统
用户画像
通过分析用户行为和偏好,构建 用户画像,为个性化推举提供根
据。
推举算法
利用推举算法对用户进行个性化文 献推举,提高用户满意度和黏性。
动态更新
根据用户反馈和行为变化,动态调 整推举结果,提高个性化推举的准 确性。
调整检索策略
根据检索结果,不断调整检索策略,以获得更符合需求的文献。
获取与整理文献
获取文献
通过下载、购买等方式获取相关文献 。
整理文献
对获取的文献进行整理和分类,以便 后续阅读和分析。
PART 05
文献综述撰写
文献综述的定义与作用
定义
文献综述是对某一领域的研究文献进行系统性的收集、挑选、评判和归纳整理,以反应当领域的研究现状、主要 成果和发展趋势。
促进学术交流和知识共享
文献检索是学术交流和知识共享的重 要手段,有助于推动学术研究的进步 和发展。
文献检索的分类
01
依照检索方式分类
可以分为手工检索和计算机检索。手工检索是指通过人工方式查找文献
,计算机检索则是利用计算机技术进行文献检索。
02 03
依照检索内容分类
可以分为全文检索、目录检索、关键词检索等。全文检索是指对整篇文 献进行检索,目录检索是指对文献目录进行检索,关键词检索是指通过 输入关键词进行检索。
文献信息检索ppt讲课文档
逻辑提问式(布尔逻辑组配):
❖ 计算机检索的基本技术,主要通过逻辑运算 符(布尔算符)“与(and,*)”、“或(or,+)” 、 “非(not,-)”等将检索词连接的提问式。
❖ 注意:优先级为not, and, or,用括号保证优先权 ;运算符两侧必须各有一个空格(半角)。
第十八页,共47页。
❖ 实例:
第二十六页,共47页。
七 聚类检索
❖ 把相似度较高的文献集中在一起形成一个个的 文献类的检索技术。
第二十七页,共47页。
八、匹配方式 P37-38
❖ 前方一致:检出文献的相关字段前方和检索词 一致,如:检索词为“世界贸易组织”,可检 出《 世界贸易组织概论 》,检不出《 大学世 界贸易组织教程 》
❖ 膜法提取甘露醇中的微生物污染控制
(膜法+膜集成)*甘露醇*(细菌污染+微生物污染)
写出以下检索词,并用上述布尔逻辑符写出检索 式: 固氮和固碳的生化机理或基因机制
第十九页,共47页。
(二)、位置算符
在检索词之间使用,规定算符两边的检索词出现在 记录中的的位置,以提高检准率。比如:如果不用 with位置算符,则词组可能被系统识别为逻辑运算 ,protein disulfide isomerase(蛋白质二硫键异 构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等符号时不易 识别成词组。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物学文献检索
—文献信息检索技术
来自百度文库
检索的概念
信息检索是指将信息按一定方式组织和储存起 来,并针对信息用户的特定需求查找出所需信 息内容的过程。
文献检索(Retrieval):就是通过一种科学的 方法 和途径,在一定的文献信息集合中迅速、 全面、准确的获取自己所需要的那部分信息。
数据库:由计算机进行处理的一定数量同 类信息的有序集合,是用来存储和查找文 献的信息的电子化检索工具。
*按著录方式划分如下: 目录 题录或索引 文摘 全文
目录(Catalogue)
含义: 目录是对文献的外表特征的著录。它通常以完
整出版物(如一本书或一种刊或一个会议录 的名称)作为著录的基本单位来报道和记录 文献。 著录内容: 文献名称、著者、出版项与馆藏信息等内容。
目录(Catalogue)
按职能划分目录种类: 出版发行目录 馆藏目录:按检索标目划分为 书名目录(Title Catalogue) 著者目录(Author Catalogue ) 分类目录(Classified Catalogue) 主题目录(Subject Catalogue ) 联合目录 资料来源目录,如IM、CA、BA
全文(Full-text)
全文检索是指以文献所含的全部信息作为检索 内容的文献检索。
中文:CNKI数据库、万方数据库、维普数据库 外文:Sciencedirect数据库
wiley数据库 blackwell数据库 EBSCO数据库、Ovid系统 Springer电子全文期刊 Nature电子全文期刊
003 汽车与运输 主题词:汽车、运输
004 汽车噪音对环境的污染 主题词 :汽车、 噪音、环境污染
环境污染 汽车
环境污染
汽车
铅 维修 尾气 运输 噪音
001 004
001 001 004 004 001 002 001 003 002 004 003 001 004 002 001 003 004
文献检索(书目信息检索):即检索结果是关于某主题知识的文 献线索,它是通过二次文献,包括传统的以纸张为存储介质的现 代计算机检索系统,找出所需的一次文献或三次文献。
数据检索:就是满足数据需求的检索过程,如数理化等科学 数据,经济数据,历史数据,地理数据等。
事实检索:就是对特定的事件或事实的检索。事实内容包括 大量的科学事件和社会事件。例如:我国建成最早的高速公 路是哪条?何时建设?
概念检索:就是查找特定概念的含义、作用、原理或使用范 围等解释性内容或说明。最常见的概念检索是查找各种参考 工具书,例如字词典、百科全书、名录、手册、指南等参考 工具书。
信息检索类型图:
信息 检索
文献检索 检索性工具书 间接答案(文献线索)
数据检索 事实检索
概念检索
参考性工具书 直接答案(数据、事实)
顺排档:数据库中的记录往往是按时间顺序线 性排列的,每条记录依次编有顺序号,这种文 档称为顺排文档。
例排档:是将顺排文档记录中的可检字段抽出, 按字顺排列而成的字典文档称倒排文档。
顺排文档
倒排文档(主题)
001 汽车尾气中的 铅对环境的污染 主题词:汽车 、尾气、 铅、环境污染
002 汽车的维修 主题词:汽车、维修
文摘(Abstract,Excerpta,Digest)
根据摘要详简程度,文摘可分为: 指示性文摘(简介,Indicative Abstract)
是以最简短的语言,概略指示原文的研究 对象、内容范围、研究目的及方法,一般 在50-150个字。 报道性文摘(Informative Abstract)内容详 细,反映文献的中心内容、观点、数据及 结论,一般在200~300,500,1000字左 右。
信息检索示意图:
信息检索的实质
信息检索的实质是信息用户的需求和一定的信 息集合的比较和选择的过程,即匹配的过程。也 既是用户需求的主题概念和提问表达式同一定信 息系统的系统语言相适应的过程,如果两者相适 应取得一致,则所需信息被检中,否则,检索失 败。 文献检索重要的一种信息检索。
信息检索的类型
检索系统的构成
手工检索系统 计算机(网络)检索系统
篇名字段 文摘字段 基本索引字段 叙词字段 自由标引字段 辅助索引字段
检索系统的构成
记录 有多个字段组成记录,使数据库的信息单元
文档 数据库中一部分记录的集合,也使数据库的结 构。一个数据库至少包括一个顺排文档和一个 倒排文档。
检索语言
题录(Title)或索引(Index)
概念: 其一,是指检索工具,它揭示文献的外表特征和内
容特征,即著录文献是以一个完整出版物的某一 部分(如书的章节或刊中一篇论文题目)为著录 单位。 其二,是指检索途径(附录式索引),如,分类索 引、主题索引、生物体索引、著者索引等。 著录内容: 论文题目、著者、文献出处(刊名、发表年月、卷、 期、页码)及文种等。如,《中目》、《IM》、 《CNKI》免费题录等。
数据库、文档、记录、字段之间的关系
文档1 (顺排档) 记录1
数据库
文档2 (倒排档、 记录2
索引)
字段1 字段2
…
…
字段n
… 记录n
子字段1 子字段2
…
子字段n
文档n (倒排档)
Internet用户的增长(1994-2003)
万人
3500 3000 2500 2000 1500 1000
信息检索的意义
▪ 信息与现代科技的发展
现代科技发展特点:高速化、综合化、专业化。 ➢ 信息量急剧增长。 ➢ 信息的使用寿命缩短。
▪ 信息检索意义
➢ 充分利用信息资源,避免重复劳动。 ➢ 为人们更新知识、实现终身学习提供门径。
检索系统的著录
检索系统是有序的信息集合。每个信息都 需要经过加工,把信息的特征著录即描述下 来,成为一个条目,亦称记录。将一个个记 录按一定序列编排起来便组成一个可供检索 的系统。
文摘(Abstract,Excerpta,Digest)
含义: 文摘是指对文献内容选择重要部分以简练的 形式作为摘要,并按一定的原则和方法编排 而成的一种检索工具。
著录内容: 同⑵ + 文摘。 如,中国医学文摘,中国药学文摘, 中国生物学
文摘,CA,BA,CBM,CMCC,MEDLINE/PubMed 等。
—文献信息检索技术
来自百度文库
检索的概念
信息检索是指将信息按一定方式组织和储存起 来,并针对信息用户的特定需求查找出所需信 息内容的过程。
文献检索(Retrieval):就是通过一种科学的 方法 和途径,在一定的文献信息集合中迅速、 全面、准确的获取自己所需要的那部分信息。
数据库:由计算机进行处理的一定数量同 类信息的有序集合,是用来存储和查找文 献的信息的电子化检索工具。
*按著录方式划分如下: 目录 题录或索引 文摘 全文
目录(Catalogue)
含义: 目录是对文献的外表特征的著录。它通常以完
整出版物(如一本书或一种刊或一个会议录 的名称)作为著录的基本单位来报道和记录 文献。 著录内容: 文献名称、著者、出版项与馆藏信息等内容。
目录(Catalogue)
按职能划分目录种类: 出版发行目录 馆藏目录:按检索标目划分为 书名目录(Title Catalogue) 著者目录(Author Catalogue ) 分类目录(Classified Catalogue) 主题目录(Subject Catalogue ) 联合目录 资料来源目录,如IM、CA、BA
全文(Full-text)
全文检索是指以文献所含的全部信息作为检索 内容的文献检索。
中文:CNKI数据库、万方数据库、维普数据库 外文:Sciencedirect数据库
wiley数据库 blackwell数据库 EBSCO数据库、Ovid系统 Springer电子全文期刊 Nature电子全文期刊
003 汽车与运输 主题词:汽车、运输
004 汽车噪音对环境的污染 主题词 :汽车、 噪音、环境污染
环境污染 汽车
环境污染
汽车
铅 维修 尾气 运输 噪音
001 004
001 001 004 004 001 002 001 003 002 004 003 001 004 002 001 003 004
文献检索(书目信息检索):即检索结果是关于某主题知识的文 献线索,它是通过二次文献,包括传统的以纸张为存储介质的现 代计算机检索系统,找出所需的一次文献或三次文献。
数据检索:就是满足数据需求的检索过程,如数理化等科学 数据,经济数据,历史数据,地理数据等。
事实检索:就是对特定的事件或事实的检索。事实内容包括 大量的科学事件和社会事件。例如:我国建成最早的高速公 路是哪条?何时建设?
概念检索:就是查找特定概念的含义、作用、原理或使用范 围等解释性内容或说明。最常见的概念检索是查找各种参考 工具书,例如字词典、百科全书、名录、手册、指南等参考 工具书。
信息检索类型图:
信息 检索
文献检索 检索性工具书 间接答案(文献线索)
数据检索 事实检索
概念检索
参考性工具书 直接答案(数据、事实)
顺排档:数据库中的记录往往是按时间顺序线 性排列的,每条记录依次编有顺序号,这种文 档称为顺排文档。
例排档:是将顺排文档记录中的可检字段抽出, 按字顺排列而成的字典文档称倒排文档。
顺排文档
倒排文档(主题)
001 汽车尾气中的 铅对环境的污染 主题词:汽车 、尾气、 铅、环境污染
002 汽车的维修 主题词:汽车、维修
文摘(Abstract,Excerpta,Digest)
根据摘要详简程度,文摘可分为: 指示性文摘(简介,Indicative Abstract)
是以最简短的语言,概略指示原文的研究 对象、内容范围、研究目的及方法,一般 在50-150个字。 报道性文摘(Informative Abstract)内容详 细,反映文献的中心内容、观点、数据及 结论,一般在200~300,500,1000字左 右。
信息检索示意图:
信息检索的实质
信息检索的实质是信息用户的需求和一定的信 息集合的比较和选择的过程,即匹配的过程。也 既是用户需求的主题概念和提问表达式同一定信 息系统的系统语言相适应的过程,如果两者相适 应取得一致,则所需信息被检中,否则,检索失 败。 文献检索重要的一种信息检索。
信息检索的类型
检索系统的构成
手工检索系统 计算机(网络)检索系统
篇名字段 文摘字段 基本索引字段 叙词字段 自由标引字段 辅助索引字段
检索系统的构成
记录 有多个字段组成记录,使数据库的信息单元
文档 数据库中一部分记录的集合,也使数据库的结 构。一个数据库至少包括一个顺排文档和一个 倒排文档。
检索语言
题录(Title)或索引(Index)
概念: 其一,是指检索工具,它揭示文献的外表特征和内
容特征,即著录文献是以一个完整出版物的某一 部分(如书的章节或刊中一篇论文题目)为著录 单位。 其二,是指检索途径(附录式索引),如,分类索 引、主题索引、生物体索引、著者索引等。 著录内容: 论文题目、著者、文献出处(刊名、发表年月、卷、 期、页码)及文种等。如,《中目》、《IM》、 《CNKI》免费题录等。
数据库、文档、记录、字段之间的关系
文档1 (顺排档) 记录1
数据库
文档2 (倒排档、 记录2
索引)
字段1 字段2
…
…
字段n
… 记录n
子字段1 子字段2
…
子字段n
文档n (倒排档)
Internet用户的增长(1994-2003)
万人
3500 3000 2500 2000 1500 1000
信息检索的意义
▪ 信息与现代科技的发展
现代科技发展特点:高速化、综合化、专业化。 ➢ 信息量急剧增长。 ➢ 信息的使用寿命缩短。
▪ 信息检索意义
➢ 充分利用信息资源,避免重复劳动。 ➢ 为人们更新知识、实现终身学习提供门径。
检索系统的著录
检索系统是有序的信息集合。每个信息都 需要经过加工,把信息的特征著录即描述下 来,成为一个条目,亦称记录。将一个个记 录按一定序列编排起来便组成一个可供检索 的系统。
文摘(Abstract,Excerpta,Digest)
含义: 文摘是指对文献内容选择重要部分以简练的 形式作为摘要,并按一定的原则和方法编排 而成的一种检索工具。
著录内容: 同⑵ + 文摘。 如,中国医学文摘,中国药学文摘, 中国生物学
文摘,CA,BA,CBM,CMCC,MEDLINE/PubMed 等。