信息检索基本知识及技巧教材
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)信息检索是终身教育的基础 unesco:可以防止知识老化,不断更新知识
2020/4/15
6
二 信息检索的要素
(1)前提——信息意识/信息素养 information literacy 新闻阅读:《武汉的士起步价调为两公里16元 12月1日起执行》 看到标题,能联想到什么?
从信息认知、信息情感 和 信息行为 三个方面进行分析!
狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所 需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。
2020/4/15
3
1.2 信息检索的手段
(1)手工检索 eg:美国工程索引 (2)光盘检索 eg:medline (3)网络检索 eg:springerlink
000 总论
100 哲学
200 宗教
300 社会科学
第一层
400 语言
500 自然科学和数学 600 技术(应用科学)
展开层
630 农业 631 农业经营
700 艺术、美术和装饰艺术
631.5 作物栽培
800 文学
900 地理、历史及辅助学科
2020/4/15
23
通用十进制图书分类法 —— Universal Decimal Classification UDC
十进制图书分类法由两位比利时书目专家(Paul Otlet、Henri la Fontaine)19世纪末在杜威 十进制图书分类法的基础上继续研发的分类方法。此种分类方法由数字和特殊符号组成,把 涉及各种知识体系及学科的书籍予以分类。介于数字和符号无语言障碍的特性,该分类法在 世界各地的图书馆中被广泛应用。
2020/4/15
4
1.3 信息检索的对象
(1) 文献检索(Document Retrieval) : 是以文献(包括题录、文摘和全文)
为检索对象的检索。可分为全文检索 和书目检索两种。
(2) 事实检索 (Fact Retrieval) :是以某一客观事实为检索对象,查找某一事物
发生的时间、地点及过程的检索。
期刊的检索途径主要用到: 刊名 篇名 作者 关键词 ISSN
2020/4/15
11
会议论文的检索途径主要用到: 会议名称 主办单位 会议地点 关键词 作者 会议文章篇名
学位论文的检索途径主要用到: 作者 学位授予单位 导师姓名 关键词 论文篇名
2020/4/15
12
专利资料的检索途径主要用到: 关键词 专利权人 发明人 国际专利分类号 公开号
标准资料的检索途径主要用到: 标准编号 标准名称 发布单位 发布日期 关键词
2020/4/15
13
报告资料的检索途径主要用到: 报告号 关键词 作者 报告单位 合同户报告代码
百科全书、类书资料的检索途径主要用到: 音形义
2020/4/15
14
(3)核心——信息利用能力
掌握各种信息源 掌握检索语言 熟练使用检索工具 对检索结果的评价,判断
加标志的叙词 组面词(如:组面分类法) 短语
文献全文的自然语言
2020/4/15
20
2. 2 按应用功能划分的检索语言 分类语言 主题语言
2020/4/15
21
2.21 分类语言
是用分类号和相应的分类款目名称来表达信息内容的主题概念,并按学科 体系的逻辑次序将信息资源系统地加以划分和组织的语言。
2020/4/15
15
附:期刊的指数计算
影响因素是一种期刊中论文的平均被引率 (特1)定影年响度因的素影响因素 = 该年引用该刊前两ห้องสมุดไป่ตู้文章的总次数
前两年该刊所发表文章的总数
即年指标
用于测度一种期刊被利用的速度,也是测度期刊重要性的依据
一特定年度对该刊当年发表文章的引用次数 即年指标 =
当年该刊所发表文章的总数
(3) 数据检索(Data Retrieval) :是以数值或数据(包括数据、图表、公式等)
为对象的检索。
2020/4/15
5
1.4 信息检索的作用
(1) 信息检索是获取知识的捷径
eg:princeton的学生 约翰·菲利普 利用图书馆公开资料设计原子弹。
(2) 信息检索是科学研究的向导 eg:(美)阿波罗飞船的燃料箱的重复研究问题。
2020/4/15
2
一 信息检索的定义、分类及其作用
1.1 信息检索的定义
信息检索(Information Retrieval):,是指将信息按一定的方式组织和 存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称 又叫“信息的存储与检索(Information Storage and Retrieval),这是广义的 信息检索。
2020/4/15
7
(2)基础——信息源
A、信息的载体: 印刷型 缩微型 机读型 声像型
2020/4/15
8
B、信息的内容和加工级次: 一次文献 二次文献 三次文献
2020/4/15
9
C、信息的出版形式: 图书 期刊 会议资料 学位论文 专利 标准 报告 百科全书、类书
2020/4/15
10
图书的检索途径主要用到: 书名 作者 出版社 ISBN 关键词
信息检索基本知识及技巧
The principles and skills on information retrieval
主 讲 人 :施 亮 Lecturer :caesar, shi
2020/4/15
1
目录 outline
一 信息检索的定义、分类及其作用 二 检索语言 三 检索的效率、手段和方法
分类语言能反映事物的从属派生关系,便于按学科门类进行族检索。
2020/4/15
22
杜威十进分类法 —— Dewey Decimal Classification ,DC/DDC
美国M.杜威编制的综合性等级列举式分类法。分为详、简两种版本,详本于1876年问世, 取名为《图书馆图书小册子排架及编目适用的分类法和主题索引》,1951年的第15版 改名《杜威十进分类法》
2020/4/15
18
外表特征:就是文献上记明的、显而易见的特征。
外表特征语言 (书目引文语言)
题名(书名、篇名) 著者姓名 文献序号(如:ISBN、ISSN、专利号、报告号等) 书目引文 出版事项 文献类型
2020/4/15
19
非句法语言 内容特征语言
句法语言
等级制体系分类法 标题词 关键词 叙词 单元词
2020/4/15
16
自引率与被引率
自引率是指一种期刊中引用本刊的参考文献对全部参考文献之比;被 自引率是一种期刊被本刊中文章引用的次数与该刊被引用的总次数之比。
自引率 =
某刊自引的引文量 该刊全部引文量
被引率 =
某刊自引的引文量 某刊被引用的总次数
2020/4/15
17
二 检索语言
2.1 按表现形式划分的检索语言 外表特征语言 内容特征语言
2020/4/15
6
二 信息检索的要素
(1)前提——信息意识/信息素养 information literacy 新闻阅读:《武汉的士起步价调为两公里16元 12月1日起执行》 看到标题,能联想到什么?
从信息认知、信息情感 和 信息行为 三个方面进行分析!
狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所 需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。
2020/4/15
3
1.2 信息检索的手段
(1)手工检索 eg:美国工程索引 (2)光盘检索 eg:medline (3)网络检索 eg:springerlink
000 总论
100 哲学
200 宗教
300 社会科学
第一层
400 语言
500 自然科学和数学 600 技术(应用科学)
展开层
630 农业 631 农业经营
700 艺术、美术和装饰艺术
631.5 作物栽培
800 文学
900 地理、历史及辅助学科
2020/4/15
23
通用十进制图书分类法 —— Universal Decimal Classification UDC
十进制图书分类法由两位比利时书目专家(Paul Otlet、Henri la Fontaine)19世纪末在杜威 十进制图书分类法的基础上继续研发的分类方法。此种分类方法由数字和特殊符号组成,把 涉及各种知识体系及学科的书籍予以分类。介于数字和符号无语言障碍的特性,该分类法在 世界各地的图书馆中被广泛应用。
2020/4/15
4
1.3 信息检索的对象
(1) 文献检索(Document Retrieval) : 是以文献(包括题录、文摘和全文)
为检索对象的检索。可分为全文检索 和书目检索两种。
(2) 事实检索 (Fact Retrieval) :是以某一客观事实为检索对象,查找某一事物
发生的时间、地点及过程的检索。
期刊的检索途径主要用到: 刊名 篇名 作者 关键词 ISSN
2020/4/15
11
会议论文的检索途径主要用到: 会议名称 主办单位 会议地点 关键词 作者 会议文章篇名
学位论文的检索途径主要用到: 作者 学位授予单位 导师姓名 关键词 论文篇名
2020/4/15
12
专利资料的检索途径主要用到: 关键词 专利权人 发明人 国际专利分类号 公开号
标准资料的检索途径主要用到: 标准编号 标准名称 发布单位 发布日期 关键词
2020/4/15
13
报告资料的检索途径主要用到: 报告号 关键词 作者 报告单位 合同户报告代码
百科全书、类书资料的检索途径主要用到: 音形义
2020/4/15
14
(3)核心——信息利用能力
掌握各种信息源 掌握检索语言 熟练使用检索工具 对检索结果的评价,判断
加标志的叙词 组面词(如:组面分类法) 短语
文献全文的自然语言
2020/4/15
20
2. 2 按应用功能划分的检索语言 分类语言 主题语言
2020/4/15
21
2.21 分类语言
是用分类号和相应的分类款目名称来表达信息内容的主题概念,并按学科 体系的逻辑次序将信息资源系统地加以划分和组织的语言。
2020/4/15
15
附:期刊的指数计算
影响因素是一种期刊中论文的平均被引率 (特1)定影年响度因的素影响因素 = 该年引用该刊前两ห้องสมุดไป่ตู้文章的总次数
前两年该刊所发表文章的总数
即年指标
用于测度一种期刊被利用的速度,也是测度期刊重要性的依据
一特定年度对该刊当年发表文章的引用次数 即年指标 =
当年该刊所发表文章的总数
(3) 数据检索(Data Retrieval) :是以数值或数据(包括数据、图表、公式等)
为对象的检索。
2020/4/15
5
1.4 信息检索的作用
(1) 信息检索是获取知识的捷径
eg:princeton的学生 约翰·菲利普 利用图书馆公开资料设计原子弹。
(2) 信息检索是科学研究的向导 eg:(美)阿波罗飞船的燃料箱的重复研究问题。
2020/4/15
2
一 信息检索的定义、分类及其作用
1.1 信息检索的定义
信息检索(Information Retrieval):,是指将信息按一定的方式组织和 存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称 又叫“信息的存储与检索(Information Storage and Retrieval),这是广义的 信息检索。
2020/4/15
7
(2)基础——信息源
A、信息的载体: 印刷型 缩微型 机读型 声像型
2020/4/15
8
B、信息的内容和加工级次: 一次文献 二次文献 三次文献
2020/4/15
9
C、信息的出版形式: 图书 期刊 会议资料 学位论文 专利 标准 报告 百科全书、类书
2020/4/15
10
图书的检索途径主要用到: 书名 作者 出版社 ISBN 关键词
信息检索基本知识及技巧
The principles and skills on information retrieval
主 讲 人 :施 亮 Lecturer :caesar, shi
2020/4/15
1
目录 outline
一 信息检索的定义、分类及其作用 二 检索语言 三 检索的效率、手段和方法
分类语言能反映事物的从属派生关系,便于按学科门类进行族检索。
2020/4/15
22
杜威十进分类法 —— Dewey Decimal Classification ,DC/DDC
美国M.杜威编制的综合性等级列举式分类法。分为详、简两种版本,详本于1876年问世, 取名为《图书馆图书小册子排架及编目适用的分类法和主题索引》,1951年的第15版 改名《杜威十进分类法》
2020/4/15
18
外表特征:就是文献上记明的、显而易见的特征。
外表特征语言 (书目引文语言)
题名(书名、篇名) 著者姓名 文献序号(如:ISBN、ISSN、专利号、报告号等) 书目引文 出版事项 文献类型
2020/4/15
19
非句法语言 内容特征语言
句法语言
等级制体系分类法 标题词 关键词 叙词 单元词
2020/4/15
16
自引率与被引率
自引率是指一种期刊中引用本刊的参考文献对全部参考文献之比;被 自引率是一种期刊被本刊中文章引用的次数与该刊被引用的总次数之比。
自引率 =
某刊自引的引文量 该刊全部引文量
被引率 =
某刊自引的引文量 某刊被引用的总次数
2020/4/15
17
二 检索语言
2.1 按表现形式划分的检索语言 外表特征语言 内容特征语言