《信息检索概论》PPT课件
合集下载
信息检索原理ppt课件
ppt课件
检索系统
文
文献
献 源
选择 收集
文献 特征
标
数据库
分
识标
检 索
析 信
语引
匹配
结 果
用
息
检索 言
户
需
课题
求
检索 提问式
反馈
ppt课件
1.4文献信息检索的类型:按检索内容
文献检索 (相关性检索)
检索结果为文献原文或线索 全文检索 书目检索
数据检索 (确定性检索)
检索结果为数值、数据
事实检索 (确定性检索)
ppt课件
3. 文献信息的一般检索步骤
分析研究课题,明确检索要求 选择检索工具或检索系统 确定检索途径 实施检索,记录和阅读文献线索 索取原始文献
ppt课件
3.1 研究课题的分析
分清课题性质 前沿探索性 调查研究性 面象应用性
课题背景知识的获取 利用网络搜索引擎 查阅图书馆相关馆藏,专著、工具书 询问专业人员
内容特征
表达文献信息主题内容的检索标识
内容特征
文献
模糊对应
外表特征
与文献主题内容没有关系或关系不大的信息
外表特征
文献
一一对应
ppt课件
1.3 文献信息检索一般原理
存储 选择和收集文献 提取文献信息的内外部特征 标引,整理,形成检索系统(工具)
检索系统
文
文献
献 源
选择 收集
文献 特征
标
数据库
分
识标
检 索
析 信
语引
匹配
结 果
用
息
检索 言
户
需
课题
求
检索 提问式
反馈
ppt课件
1.4文献信息检索的类型:按检索内容
文献检索 (相关性检索)
检索结果为文献原文或线索 全文检索 书目检索
数据检索 (确定性检索)
检索结果为数值、数据
事实检索 (确定性检索)
ppt课件
3. 文献信息的一般检索步骤
分析研究课题,明确检索要求 选择检索工具或检索系统 确定检索途径 实施检索,记录和阅读文献线索 索取原始文献
ppt课件
3.1 研究课题的分析
分清课题性质 前沿探索性 调查研究性 面象应用性
课题背景知识的获取 利用网络搜索引擎 查阅图书馆相关馆藏,专著、工具书 询问专业人员
内容特征
表达文献信息主题内容的检索标识
内容特征
文献
模糊对应
外表特征
与文献主题内容没有关系或关系不大的信息
外表特征
文献
一一对应
ppt课件
1.3 文献信息检索一般原理
存储 选择和收集文献 提取文献信息的内外部特征 标引,整理,形成检索系统(工具)
信息检索ppt课件
缺点: ① 关键词取自标题或者文摘、全文,用词不规范,忽
略了同义词、近义词、简称等等同关系,易漏检。 ② 关键词语言对于文献或者网页的主题没有深入分析,
不能准确地揭示文献实质内容,准确性较差。
17
检索途径
❖ 概念:检索途径是指用文献信息数据库中记 录的某一特征作为检索起点或检索入口
❖ 检索途径通常表现为字段检索
具有广泛影响的定义
信息是事物存在方式、运动状态及其特 征的反映,是事物发出的信号、消息。
1 1
信息的特征
载体依附性
信
无限共享性
息
的
永不枯竭性
特
征
开发增值性
应用时效性
存在普遍性
2
2
二、知识(knowledge)
❖ 《汉语词典》中解释为:人们在改造世界 的实践过程中所获得的认识和经验的总和。
❖ 知识 是人类对自然界、人类社会中各种现 象、规律的信息反映进行思维分析,加工 提炼,经过系统化、理论化的结果。
二、医学信息素养的内涵主要包括:
信息意识:是个体对信息重要性的认识程ቤተ መጻሕፍቲ ባይዱ和对 信息是否具有特殊的、敏锐的感受力和持久的注 意力,即对信息的捕捉、分析、判断和吸收的敏 感性。
信息知识:是指与信息有关的理论、知识和方法。
信息能力:是对信息的搜集获取能力、分析鉴别 能力和综合利用能力。
略了同义词、近义词、简称等等同关系,易漏检。 ② 关键词语言对于文献或者网页的主题没有深入分析,
不能准确地揭示文献实质内容,准确性较差。
17
检索途径
❖ 概念:检索途径是指用文献信息数据库中记 录的某一特征作为检索起点或检索入口
❖ 检索途径通常表现为字段检索
具有广泛影响的定义
信息是事物存在方式、运动状态及其特 征的反映,是事物发出的信号、消息。
1 1
信息的特征
载体依附性
信
无限共享性
息
的
永不枯竭性
特
征
开发增值性
应用时效性
存在普遍性
2
2
二、知识(knowledge)
❖ 《汉语词典》中解释为:人们在改造世界 的实践过程中所获得的认识和经验的总和。
❖ 知识 是人类对自然界、人类社会中各种现 象、规律的信息反映进行思维分析,加工 提炼,经过系统化、理论化的结果。
二、医学信息素养的内涵主要包括:
信息意识:是个体对信息重要性的认识程ቤተ መጻሕፍቲ ባይዱ和对 信息是否具有特殊的、敏锐的感受力和持久的注 意力,即对信息的捕捉、分析、判断和吸收的敏 感性。
信息知识:是指与信息有关的理论、知识和方法。
信息能力:是对信息的搜集获取能力、分析鉴别 能力和综合利用能力。
信息检索PPT课件
导论
• 一 课程内容 • 信息检索课,过去也被称为文献检索课,是高校
学生学习信息知识、掌握检索技能、提高信息素 质的基础课,是由原国家教委统一命名并三4次下 文要求高等院校开设的一门科学方法课。 • 教学内容包括基本理论、信息检索、信息利用三 大部分。
导论
• 二 课程意义
• (1) 提高信息素质
第一讲 信息检索概述
• 二 信息检索的原理和本质
• 信息检索包括存储和检索两个过程。
• 信息的存储就是信息组织的过程,将无序的信息转换为有序的信息集合的过程 。它是根据一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和 描述,并按一定的原则和方法进行加工处理,使之有序化。信息的存1储0 是信息 传播和检索的基础和前提,它包括信息选择、信息分析、信息源表述和内容揭 示、信息重组和信息存储。这一过程主要由信息工作人员完成,他们通过信息 组织将文献信息转化为文献标识,序化后构成信息检索系统库。
合,即从检索词A的结果集合中排除检索词B的部分。
• 示例:除长白山以外,吉林省的旅游资源有哪些
? 19
• 提问式:(吉林省*旅游资源)-长白山
第一讲 信息检索概述
• 1 布尔逻辑检索
三个或三个以上检索词间逻辑运算顺序
–吉林省除长白山以外的旅游资源或旅游景点
20
吉林省 not 长白山 and(旅游资源or旅游景点)
《信息检索原理》课件
普通的搜索引擎模型
传统的信息检索模型
每个搜索请求都由关键字组成, 搜索引擎根据这些关键字在全 部Web内容中查找匹配。
使用机器处理的卡片目录和通 过专业人员进行分类目录来存 储和获取信息。
基于垂直领域信息检索 模型
针对某个特定主题,通过搜索 和筛选与该特定主题相关的文 件。
信息检索的不同方法
利用不同的方法,可以获得不同的结果。了解不同的体系结构以及如何选择最适合您需要的体系结构至关重 要。
《信息检索原理》PPT课 件
本课程旨在介绍信息检索的基本概念、原理、方法和现代信息检索系统的发 展和应用。通过本课程,你将了解信息检索面临的挑战和未来趋势。
什么是信息检索?
信息检索是一种通过计算机系统自动处理大量不明确的信息请求并返回有关信息的技术。了解信息检索 模型和方法对于理解如何有效地获取信息是至关重要的。
了解如何评估信息检索系统的性能对于优化系统至关重要。
准确性
最终检索结果中的正确和错误比例
召回率
所有相关文档在总文档数中的占比
精确率
最终检索结果中相关文档的比例
F1得分
综合考虑召回率和精确率的衡量指标
MAP
通过找到满足查询的文档并对它们进行排名, 计算系统排名与真实排名之间的平均奖励
如何优化信息检索系统
了解信息检索系统中的瓶颈和问题,可以学习如何优化以提高检索成功率。
信息检索课件
如果在网站上有访问日志记录,网站
管理员就能知道,哪些搜索引擎的网络蜘 蛛过来过,什么时候过来的,以及读了多 少数据等等。如果网站管理员发现某个蜘 蛛有问题,就通过其标识来和其所有者联 系。
3. 搜索策略与技巧
(1) 搜索策略
1. 分析搜索需要
2. 选择合适的搜索工具
3. 构建合适的检索式
逻辑运算符 通配符
题 ,
选择 合适 的检 索工
具
选择 恰当 的关 键词
正确 设计 检索 式
及时 调整 检索 策略
作业
1.信息检索方式有哪些,并简要介绍; 2.网络信息检索有哪些特点;
2.1.4 搜索引擎
1. 搜索引擎的种类划分
(1) 根据引擎的种类划分
1. 目录型搜索引擎 如 Yahoo! Lycos 2. 关键词型搜索引擎 如 百度 Google 3. 混合型搜索引擎
限制检索是通过限制检索范围,达到优化检索结果的方法。是一种附加检 索条件,不能单独使用。 (1)字段限制检索 (2)范围限制检索
5)加权检索技术
加权检索是指根据检索词对检索课题的重要程度,事先指定不同的权值。
6. 网络商务信息检索策略
如何进行一次信息检索活动呢?
并分 确析 定检 关索 键的 词主
3)位置检索
位置检索又称邻近检索,是在检索词之间使用位置算符来规定算符两边的 检索词出现在记录中的位置,从而获得不仅包括制定检索词而且这些词在记 录中的位置也符合特定要要求的记录。 (1)(W)算符 (2)(nW)算符 (3)(nN)算符 (4)(S)、(F)算符
管理员就能知道,哪些搜索引擎的网络蜘 蛛过来过,什么时候过来的,以及读了多 少数据等等。如果网站管理员发现某个蜘 蛛有问题,就通过其标识来和其所有者联 系。
3. 搜索策略与技巧
(1) 搜索策略
1. 分析搜索需要
2. 选择合适的搜索工具
3. 构建合适的检索式
逻辑运算符 通配符
题 ,
选择 合适 的检 索工
具
选择 恰当 的关 键词
正确 设计 检索 式
及时 调整 检索 策略
作业
1.信息检索方式有哪些,并简要介绍; 2.网络信息检索有哪些特点;
2.1.4 搜索引擎
1. 搜索引擎的种类划分
(1) 根据引擎的种类划分
1. 目录型搜索引擎 如 Yahoo! Lycos 2. 关键词型搜索引擎 如 百度 Google 3. 混合型搜索引擎
限制检索是通过限制检索范围,达到优化检索结果的方法。是一种附加检 索条件,不能单独使用。 (1)字段限制检索 (2)范围限制检索
5)加权检索技术
加权检索是指根据检索词对检索课题的重要程度,事先指定不同的权值。
6. 网络商务信息检索策略
如何进行一次信息检索活动呢?
并分 确析 定检 关索 键的 词主
3)位置检索
位置检索又称邻近检索,是在检索词之间使用位置算符来规定算符两边的 检索词出现在记录中的位置,从而获得不仅包括制定检索词而且这些词在记 录中的位置也符合特定要要求的记录。 (1)(W)算符 (2)(nW)算符 (3)(nN)算符 (4)(S)、(F)算符
信息检索概述PPT课件
物质的运动产生信息;各种信息经过人们系统化的加工处理,
转化成知识;知识经过系统化的加工处理转化为情报;情报用于
社会实践,解决实践中存在的问题,创造出物质财富或精神财富,
这时的情报便转化为生产力,产生新的信息,形成一个无限循环
的转化过程。这也表明,信息包含知识、知识包含情报。它们不
仅仅是包含关系,而且可以互相转化。
12
③计算机信息检索系统阶段
计算机信息检索可以分成四个发展阶段: 第一阶段:脱机检索阶段 第二阶段:联机检索阶段 第三阶段:光盘检索阶段 第四阶段:网络检索阶段
13
5、信息检索的现状
5
④知识、情报和文献
知识是人类社会实践的总结,是人的主观世界对客观世界的 概括和总结。
情报的概念是极其广泛的,它是一种普遍存在的社会现象。
文献一词最早出现在《论语·八佾》中,新版《辞海》读文 献的定义作了解释:“记录有知识的一切载体的统称,即用文字、 图像、符号、声频、视频等手段记录人类知识的各种载体(如纸 张、胶片、磁带、磁盘、光盘等)。
的馆藏目录、检索工具和参考工具书都是卡片型或者印刷型的,检索的
方式基本上是以手工方式为主。
11
②机械信息检索阶段
机械信息检索系统是20世纪40-50年代开始使用各种机械装置进 行信息检索的机械系统,这个阶段的生命周期很短暂,是手工检索向 计算机信息检索的过渡阶段。机械信息检索主要包括两种基本类型。
信息检索ppt课件 共93页
排原则进一步展开,组成了22个基本大类:A、B、C、D、 E、F、… Z(L、M、W、Y) • 这就是俗称的《中图法》五部二十二大类。
主题法
1、自然语言(非规范语言):信息检索系统中使用的标 引词直接来自文献和用户提问而不加控制的一类检索语言, 主要有关键词语言。
自然语言的应用以计算机为前提,否则,自然语言检索 将难以实现。
Company
LOGO
信息检索
Company
LOGO
课程性质
《文献信息检索》课就其实质来说,是一门方 法课, 即通过讲授信息检索基础理论、信息检索 方法和各种中外文数据库的使用,提高同学们获 取信息的能力,主要是培养学生的情报信息意识 和提高检索技能。
Company
LOGO
一、信息素质
信息素养的概念
的特点,采取一定的途径、方法和步骤,将所需 文献资料查找出来,并加以利用。
前提:必须有检索工具 其次:途径和方法——桥梁、纽带 最后:检索者
信息检索活动的功用
一、利用信息检索工具,全面细致地搜索前人的工作经
验与成果,及时掌握事物的最新动态及发展趋势;
二、提高工作效率,提高人们的自学能力、科研能力、
2、主题法:按照所论述的事物 将文献所论述的事物按照规范化的语言(主题词)的字顺进 行排检,从本质上讲,是用词语来揭示文献所阐释或研究的对象、 事物和问题。与分类法相比,从不同角度来揭示文献。
主题法
1、自然语言(非规范语言):信息检索系统中使用的标 引词直接来自文献和用户提问而不加控制的一类检索语言, 主要有关键词语言。
自然语言的应用以计算机为前提,否则,自然语言检索 将难以实现。
Company
LOGO
信息检索
Company
LOGO
课程性质
《文献信息检索》课就其实质来说,是一门方 法课, 即通过讲授信息检索基础理论、信息检索 方法和各种中外文数据库的使用,提高同学们获 取信息的能力,主要是培养学生的情报信息意识 和提高检索技能。
Company
LOGO
一、信息素质
信息素养的概念
的特点,采取一定的途径、方法和步骤,将所需 文献资料查找出来,并加以利用。
前提:必须有检索工具 其次:途径和方法——桥梁、纽带 最后:检索者
信息检索活动的功用
一、利用信息检索工具,全面细致地搜索前人的工作经
验与成果,及时掌握事物的最新动态及发展趋势;
二、提高工作效率,提高人们的自学能力、科研能力、
2、主题法:按照所论述的事物 将文献所论述的事物按照规范化的语言(主题词)的字顺进 行排检,从本质上讲,是用词语来揭示文献所阐释或研究的对象、 事物和问题。与分类法相比,从不同角度来揭示文献。
《信息检索课件》PPT课件
.
41
.
42
.
43
.
44
.
45
.
46
.
47
.
48
.
49
.
50
.
51
.
52
.
53
.
54
.
55
.
56
.
57
.
58
.
59
.
60
.
61
.
62
.
63
.
64
.
65
.
66
.
67
.
68
.
69
.
70
.
71
.
72
.
73
.
74
.
75
.
76
.
77
.
1
.
2
.
3
.
4
.
5
.
6
.
7
.
8
.
9
.
10
.
11
.
12
.
13
.
14Hale Waihona Puke Baidu
.
15
.
16
.
17
.
18
.
信息检索(共40张PPT)
索书号举例
F123.16/W61 F123.16-2/Z24/2 F123.17/Z89/(2) F123.2/L66-2 F12/Y30
主题检索语言
由主题词汇构成,即将自然语言中的名词术语经过 规范化后直接作为信息标识,揭示主题概念之间的 关系。
主题语言表达的概念比较准确,具有专指性, 不同的专业领域或不同的数据库(一般为外文数据 库)有自己的主题词表。
本人的研究成果为基本素材而创作(或撰写)的文献。
如期刊论文、科技报告、会议论文、专利说明书
检索的目标
¨二次文献(Secondary Document):是指文献情报工作者对一次文献
进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作
人员编辑、出版和积累起来的工具性的文献。二次文献的重要性在于可以帮助人们查
技术,边缘交叉学科只能从学科门类进行检索 隶属于一个门类下,造成漏检
《中国图书馆图书分类法》
1999年推出了第四版,共分5大部类22个基本大类。 22个基本大类是在5在部类的基础上第一次划分得到的,
称为一级类目,分别对应一个英文字母;
从基本大类起,再连续划分3次,得到二级、三级、四 级类目。
采用汉语拼音字母和数字相结合的方式对图书进行分 类,是目前国内各公共图书馆和高校图书馆普遍使用的 图书分类法,我馆藏书也是按照该分类法进行排架。
信息检索绪论 PPT课件
知识来源于信息,是信息的一部分,是 对信息进行加工后获得的产品。
作用:用以指导人类认识和改造世界
特征:规律性、实践性、渗透性、继承 性、信息性。
情报
定义:就是为了解决一个特定的问 题所需要的激活了、活化了的特殊 知识或信息。作为交流对象的有用 的知识,知识的一部分。
作用:解决特定的问题。
报纸
形式特征:有统一的名称,定期连续出 版,每期汇集许多篇文章、报道、消息 等,多为对开或四开,以单张散页形式 出版。
报纸
内容特征:时间性强,能以最快的速度报道国内外 发生的最新事件和科学技术的最新研究成果,内容 广泛。
类型:按出版周期分,有日报、双日报、周报、旬 报等;按范围划分,有全国性报纸、地方性报纸、 系统性报纸等;按内容划分,有综合性报纸、专业 性报纸。
科 技 报告
科技报告的特点
科技报告是单位和
个人向上级或委托单位 撰写的关于某个课题研 究成果的正式报告。
(1)内容新颖,选题尖端实用; (2)不公开发行或少量发行; (3)质量参差不齐; (4)保密性强; (5)每份报告独立成册,有连续编号。
会议文献
会议文献是指在各 种会议上宣读、交流的 论文、报告、会议录等 文献。定期召开的会议 录或论文集其实相当于 连续出版物。
*学位论文一般不对外发行,印数少,不 容易获得。
*质量参差不齐,其中硕士、博士论文较 为专深,对研究工作有较大参考价值。
作用:用以指导人类认识和改造世界
特征:规律性、实践性、渗透性、继承 性、信息性。
情报
定义:就是为了解决一个特定的问 题所需要的激活了、活化了的特殊 知识或信息。作为交流对象的有用 的知识,知识的一部分。
作用:解决特定的问题。
报纸
形式特征:有统一的名称,定期连续出 版,每期汇集许多篇文章、报道、消息 等,多为对开或四开,以单张散页形式 出版。
报纸
内容特征:时间性强,能以最快的速度报道国内外 发生的最新事件和科学技术的最新研究成果,内容 广泛。
类型:按出版周期分,有日报、双日报、周报、旬 报等;按范围划分,有全国性报纸、地方性报纸、 系统性报纸等;按内容划分,有综合性报纸、专业 性报纸。
科 技 报告
科技报告的特点
科技报告是单位和
个人向上级或委托单位 撰写的关于某个课题研 究成果的正式报告。
(1)内容新颖,选题尖端实用; (2)不公开发行或少量发行; (3)质量参差不齐; (4)保密性强; (5)每份报告独立成册,有连续编号。
会议文献
会议文献是指在各 种会议上宣读、交流的 论文、报告、会议录等 文献。定期召开的会议 录或论文集其实相当于 连续出版物。
*学位论文一般不对外发行,印数少,不 容易获得。
*质量参差不齐,其中硕士、博士论文较 为专深,对研究工作有较大参考价值。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息: 1 音讯、消息 2 通讯系统传输和处理的对象 3 客观事物存在的方式及运动状态的
表征。
信息的基本属性: 普遍性、客观性、传递性、 共享性、中介性、可储性、可知性、无限性。
文献:是人们用以记录和传播各种知识 信息载体。载体形态如纸张、磁盘、光 盘。缩微平片等。
情报:被激活的那部分信息。
然 科
R 药学、卫生 S 农业科学 T 工业技术
学 U 交通运输
V 航空、航天
X 环境科学、劳动保护科学
Z 综合性图书
T TB TG TH TE …… TU TV
TB1 TB2 TB3 TB4 …… TB9 TB1 TB2 TB3 TB4 TB5 …… TB9 TB41 TB42 …… TB47 TB48 TB49
0 总论
1 哲学、心理学
2、国际十进分类法(UDC) 2 宗教、神学
3 社会科学、法律、
UDC已有23种语言的版本。 行政
4 语言学
5 数学、自然科学
UDC的类目表主要由主表与辅6 助应符用科号学、、辅医助学、 表组成。UDC的主表把全部工知学识、分农为学 十大 门 基类 本,分每类一如类下分大纲、目7影竞艺、技、术音分、 乐目美 、。术 娱U、 乐DC摄 、
2、分类排检法 分类法是将图书资料按学科、事物性
质等系统加以排列的一种方法,也是目 前 世界各国应用最广泛的一种方法。
七分法,又称七略。产生于东汉时期的 刘向、刘歆所编,定本13219卷。全部分 为:六艺略、诸子略、诗赋略、兵书略、 数术略、方技略和辑略,略下分38种。
四分法,清代以来古籍编目常用的方 法。以经、史、子、集四部排,经部下分10 类,史部下分15类,子部下分14类,集部下 分5类。总共四部,44大类,67子目,如 《四库全书总目》200卷。
TB482 …… TB488 TB489
T—工业技术类中国分类法举例
以T-工业技术大类下的TP类展开下位类如下:
T
工业技术
TP
自动化技术、计算机技术
TP3
计算技术、计算机技术
TP39
计算机应用
TP393
计算机网络
TP393.0
一般性问题
TP393.01
计算机网络理论
TP393.02
计算机网络结构与设计
Yeh,Chung-hsing(Monash Univ,Clayton,Aust);Deng,Hepu. Proc IEEE Int Conf Intell Process Syst ICIP v.2.1998 Proceeding of ……Systems,ICIPS. Part 2(of 2), Beijing,China,IEEE,Piscataway,NJ,USA,p1564-1568.
2、百科全书 百科全书是概述一切学科领域或者某一学 科领域基本知识的具有权威性、知识性、 检索性的大型工具书,被称为“工具书之 王”。
二 近代参考工具书类型
《中国大百科全书》 1978~1993年编,全书按学科或知识领域 分为74卷,其中正文学科分73卷,总索引 1卷。总条目7.8万条,总字数1.26亿字总 插图近5万幅,其中彩图1.5万幅。
d.会议文献:指学术会议文献。年十万余篇。
e.学位论文:是高校研究生、毕业生为获得学位进行 科学研究而写出的学术性论文博士学位论文中,常含 有独创性的学术性文献资料
f.专利文献:
专利是与产业活动密切相关的,因而其实用性非常强。
根据专利的技术水平和应用情况,其类型有invention( 发明)、utility patent(实用新型)、和design patent(外 观设计)等。年50万件。
400语言学 1 、杜威十进分类法 (DDC) 500纯粹科学
600技术科学 ( Dawey Decimal Classification a7n0d0美Re术lated Index ) 是世界上比较流行,也比较权威8的00一文种学图书分类 方法。由美国图书馆学家麦维尔9·00杜历威史于1876年 首创,它由大类、门、纲、目、子目等组成。 它将全部学科的书刊分为九大类,用1到9间的数 字表示,不属于这九类中的图书为第0类。每一大 类下再分1到9个子类,依此类分下去。
标准五
获取与使用信息要符合道德与法律规范
识别并研究印刷型、电子型信息环境的 隐私和安全
免费和收费信息 知识产权、版权 合适的文献格式,引用格式等
信息素质教育包括的内容
1 信息意识教育 2 信息能力教育 3 信息道德教育
信息与经济、科技、生活的关系
1.2 信息、文献基本知识
1.2 .1 信息、文献概念
“利用大量的信息工具及主要信息源使问 题得到解答的技术和技能”
美国 高等教育信息素质标准(1998)
具备明确信息需求的内容与范围的能力 高效获取所需信息 能客观、审慎地评估信息与信息源 个人或作为群体的一员能有效地利用信息以完
成特定的任务 获取与使用信息要符合道德与法律规范
标准一
具备明确信息需求的内容与范围的能力
中国图书馆图书分类法
三 工具书的主要排检方法
杜威十进分类法 国际十进分类法 国际专利分类法
3、主题排检法 以代表文献主题内容的主题词为标识
检索文献的途径,这类索引以主题词(标 题词、关键词、叙词等)的字顺编排。
三 工具书的主要排检方法
4、时序排检法 常用于编制年表、历表、年谱等工具书 方面。它按时间顺序先后排列的一种方 法。
1.2.6 三次文献(参考工具书)概述
一 中国古代工具书简介
1)字词典 使用部首法排序。如《说文解 字》、《康熙字典》。
2)韵书 按韵编排汉字的字书称为韵书。如《佩文 韵府》。
3)类书 类书是采集古代文献资料,按类别或韵母 编排,以供寻检、征引使用的工具书。
如宋《太平御览》、明《永乐大典》。
4)政书 政书是记载历代典章制度的史书。它搜
能够定义、并明确地表述信息需求 能够识别各种潜在的信息资源的类型和形式 能够考虑获取所需信息的代价和受益 重新评估所需信息的性质和范围
标准二
高效获取所需信息
信息源分布(图书馆、网络资源、专业协 会、研究机构等) 选用恰当的调查研究方法 信息检索系统中利用有效方法和检索策略 (如关键词、相关术语、规范化语言、逻辑 算符、命令语言)
5、地序排检法 常用于编制考查地理和地方资料工具书。
1.3 信息检索语言
A 作者
检索语言
描述文献外表特征的语言
B 号码
C 其他(书名、引 文、出版社、出 版日期等)
描述文献内容特征的语言
a 分类语言 b 主题语言
000 总论 100 哲学 200宗教
1.3.1 文献分类方法(分3类00语社会言科) 学
存在,可归属在其上位类。
l
对于包含有两个以上主题内容的课题,如“机
械手的控制系统”涉及“机械手”和“控制系统”两个
主题概念,这时应考虑它们的主从关系,在这个课题中
研究的是仅针对机械手而言的控制系统,可以说是控制
机械加工 00003 00395 11009 14561 --模型 00375 --误差 18007 11456 --发展 13175
4)文摘。如
037840 Algorithm for fuzzy multi-criteria decisionmaking.
This paper presents a new algorithm for solving the general fuzzy multi-criteria decision making(MCDM) problem involving fuzzy data expressed by means of linguistic terms….. (Author abstract) 14 Refs,English.
g.标准文献:标准化主要包括三个方面:
产品标准化,即产品质量要符合技术规定;零部件通 用化;产品规格化和系列化。
1.2.5 二次文献类型(检索工具)
1)目录。以书名、刊名、会议名等为单位编写。 2)题录。如: 200008568 我国食品与包装机械市场预测[刊]田恒 真(中国农机院食品研究所)//包装与食品机械。2000, 18(1) 。-1-5 3)索引。如:
《不列颠百科全书》
3、年鉴、年刊、年报 4、手册
二 近代参考工具书类型
5、名录
经济机构名录 如《世界企业500强》。
商品名录 如《美国进出口商品名录》。 地名录 如《世界地名录》。 人名录 如《当代中国经济学家录》。 6、资料汇编 7、表谱 8、图录
三 工具书的主要排检方法
1、字顺排检法
① 形序法:部首法、笔画法、笔顺法、号 码法 ② 音序排检法:汉语拼音字母顺序排列法; 西文字母顺序排列法;韵部排列法,中国古 代按音编制的汉字检字法大都是按韵部排列 的。
知识产生 记录
一次文献
二次文献
三次文献
传播利用 研究、实验、实践、综合
新知识的产生
1.2.4 文献型科技信息源(一次文献)
a.科技图书:世界年出版50万种。
b.科技期刊(periodical):年出版10万种,500万篇。
c.科技报告:报道(记录)研究和开发调查工作的成 果或进展情况的一种文献类型,一般都编有号码,供 识别报告本身及其发行机构。 报告是一种典型的机关 团体出版物。如美国政府工作报告: PB报告,NASA 报告、 AD报告、DOE报告。年90万篇。
标准三
能客观、审慎地评估信息与信息源
概括信息源的适用性 评价和比较信息的可靠性、权威性、时
效性 综合主要观点的逻辑统一、可查实性
Biblioteka Baidu
标准四
个人或作为群体的一员能有效地利用 信息以完成特定的任务
应用信息创造成果、完成项目 (如完成课题报告、学位论文等) 为实现成果和目标修正学习过程 选用最有力的交流媒体和形式
广义:包含信息储存和查找两部分 (Information Storage and Retrieval)
狭义:信息查找(Information Search)
1.1.2 信息检索能力培养的意义
信息检索能力与信息素质
信息素质概念 :1974年美国信息工程协会 主席Paul, Zurkowski首次定义为:
集我国历代或某一朝代政治、经济、文化、 军事等史料,分门别类,按时代先后顺序编 排。如唐.杜右《通典》、《元典章》、 《明会典》、《清会典》等。
二 近代参考工具书类型
1、字词典 近代 《词源》、《辞海》、《汉语大词 典》 上海辞书出版社,1986年第一卷, 自第二卷起改由汉语大词典出版社出版, 共出12卷。共收词语37万条, 5 000余 万字。
第一章 信息检索概论
2004 喻萍
第一章 信息检索概论
1.1 信息检索概念及其意义 1.2 信息文献基本知识 1.3 信息检索语言 1.4 信息检索基本方法及步骤
1.1 信息检索含义及意义
1.1.1 信息检索含义
信息检索(Information Retrieval)指从 大量的信息集合中找出所需信息的过程与方法。
从上表看出分类号的变化体现了各学科体 系的从属关系,分类号位数每增加一位,则分 类级别便低一级。
如TP39代表计算机应用,TP393类目是计算机 网络,是TP39的下位类。
确定分类号的方法有以下二种:
①直接查找法
熟悉分类表,按学科体系从大类开始逐级查找
l
对于只存在一个主题的课题,方法就较简单。
如“机械手”。当要求的主题过于狭窄,没有相应类目
1.2 .2 信息、知识、情报、文献的关系
知识
信息
情报 文献
1.2.3 文献等级
一次文献(primary document):指作者以本 人的研究成果为基本素材而创作或撰写的文献。 二次文献(secondary document):指对一次 文献进行加工、提炼和压缩后所得到的报道性产 物。检索工具书和网上引擎是典型的二次文献。 三次文献(tertiary document):是指对有关 的一次文献和二次文献进行广泛深入的分析研究 综合概括而成的具体知识、数据。如大百科全书 、辞典等。
8 语言学、文学9 地理、传记、历史
3、《中国图书馆分类法》
A 马克思主义、列宁主义、毛泽东思想
B 哲学
C 社会科学总论
D 政治、法律
社 会
E 军事 F 经济 G 文化、科学、教育、体育
科 H 语言、文字
学 I 文学
J 艺术
K 历史、地理
N 自然科学总论
O 数学科学和化学
P 天文学、地球科学
自 Q 生物科学
表征。
信息的基本属性: 普遍性、客观性、传递性、 共享性、中介性、可储性、可知性、无限性。
文献:是人们用以记录和传播各种知识 信息载体。载体形态如纸张、磁盘、光 盘。缩微平片等。
情报:被激活的那部分信息。
然 科
R 药学、卫生 S 农业科学 T 工业技术
学 U 交通运输
V 航空、航天
X 环境科学、劳动保护科学
Z 综合性图书
T TB TG TH TE …… TU TV
TB1 TB2 TB3 TB4 …… TB9 TB1 TB2 TB3 TB4 TB5 …… TB9 TB41 TB42 …… TB47 TB48 TB49
0 总论
1 哲学、心理学
2、国际十进分类法(UDC) 2 宗教、神学
3 社会科学、法律、
UDC已有23种语言的版本。 行政
4 语言学
5 数学、自然科学
UDC的类目表主要由主表与辅6 助应符用科号学、、辅医助学、 表组成。UDC的主表把全部工知学识、分农为学 十大 门 基类 本,分每类一如类下分大纲、目7影竞艺、技、术音分、 乐目美 、。术 娱U、 乐DC摄 、
2、分类排检法 分类法是将图书资料按学科、事物性
质等系统加以排列的一种方法,也是目 前 世界各国应用最广泛的一种方法。
七分法,又称七略。产生于东汉时期的 刘向、刘歆所编,定本13219卷。全部分 为:六艺略、诸子略、诗赋略、兵书略、 数术略、方技略和辑略,略下分38种。
四分法,清代以来古籍编目常用的方 法。以经、史、子、集四部排,经部下分10 类,史部下分15类,子部下分14类,集部下 分5类。总共四部,44大类,67子目,如 《四库全书总目》200卷。
TB482 …… TB488 TB489
T—工业技术类中国分类法举例
以T-工业技术大类下的TP类展开下位类如下:
T
工业技术
TP
自动化技术、计算机技术
TP3
计算技术、计算机技术
TP39
计算机应用
TP393
计算机网络
TP393.0
一般性问题
TP393.01
计算机网络理论
TP393.02
计算机网络结构与设计
Yeh,Chung-hsing(Monash Univ,Clayton,Aust);Deng,Hepu. Proc IEEE Int Conf Intell Process Syst ICIP v.2.1998 Proceeding of ……Systems,ICIPS. Part 2(of 2), Beijing,China,IEEE,Piscataway,NJ,USA,p1564-1568.
2、百科全书 百科全书是概述一切学科领域或者某一学 科领域基本知识的具有权威性、知识性、 检索性的大型工具书,被称为“工具书之 王”。
二 近代参考工具书类型
《中国大百科全书》 1978~1993年编,全书按学科或知识领域 分为74卷,其中正文学科分73卷,总索引 1卷。总条目7.8万条,总字数1.26亿字总 插图近5万幅,其中彩图1.5万幅。
d.会议文献:指学术会议文献。年十万余篇。
e.学位论文:是高校研究生、毕业生为获得学位进行 科学研究而写出的学术性论文博士学位论文中,常含 有独创性的学术性文献资料
f.专利文献:
专利是与产业活动密切相关的,因而其实用性非常强。
根据专利的技术水平和应用情况,其类型有invention( 发明)、utility patent(实用新型)、和design patent(外 观设计)等。年50万件。
400语言学 1 、杜威十进分类法 (DDC) 500纯粹科学
600技术科学 ( Dawey Decimal Classification a7n0d0美Re术lated Index ) 是世界上比较流行,也比较权威8的00一文种学图书分类 方法。由美国图书馆学家麦维尔9·00杜历威史于1876年 首创,它由大类、门、纲、目、子目等组成。 它将全部学科的书刊分为九大类,用1到9间的数 字表示,不属于这九类中的图书为第0类。每一大 类下再分1到9个子类,依此类分下去。
标准五
获取与使用信息要符合道德与法律规范
识别并研究印刷型、电子型信息环境的 隐私和安全
免费和收费信息 知识产权、版权 合适的文献格式,引用格式等
信息素质教育包括的内容
1 信息意识教育 2 信息能力教育 3 信息道德教育
信息与经济、科技、生活的关系
1.2 信息、文献基本知识
1.2 .1 信息、文献概念
“利用大量的信息工具及主要信息源使问 题得到解答的技术和技能”
美国 高等教育信息素质标准(1998)
具备明确信息需求的内容与范围的能力 高效获取所需信息 能客观、审慎地评估信息与信息源 个人或作为群体的一员能有效地利用信息以完
成特定的任务 获取与使用信息要符合道德与法律规范
标准一
具备明确信息需求的内容与范围的能力
中国图书馆图书分类法
三 工具书的主要排检方法
杜威十进分类法 国际十进分类法 国际专利分类法
3、主题排检法 以代表文献主题内容的主题词为标识
检索文献的途径,这类索引以主题词(标 题词、关键词、叙词等)的字顺编排。
三 工具书的主要排检方法
4、时序排检法 常用于编制年表、历表、年谱等工具书 方面。它按时间顺序先后排列的一种方 法。
1.2.6 三次文献(参考工具书)概述
一 中国古代工具书简介
1)字词典 使用部首法排序。如《说文解 字》、《康熙字典》。
2)韵书 按韵编排汉字的字书称为韵书。如《佩文 韵府》。
3)类书 类书是采集古代文献资料,按类别或韵母 编排,以供寻检、征引使用的工具书。
如宋《太平御览》、明《永乐大典》。
4)政书 政书是记载历代典章制度的史书。它搜
能够定义、并明确地表述信息需求 能够识别各种潜在的信息资源的类型和形式 能够考虑获取所需信息的代价和受益 重新评估所需信息的性质和范围
标准二
高效获取所需信息
信息源分布(图书馆、网络资源、专业协 会、研究机构等) 选用恰当的调查研究方法 信息检索系统中利用有效方法和检索策略 (如关键词、相关术语、规范化语言、逻辑 算符、命令语言)
5、地序排检法 常用于编制考查地理和地方资料工具书。
1.3 信息检索语言
A 作者
检索语言
描述文献外表特征的语言
B 号码
C 其他(书名、引 文、出版社、出 版日期等)
描述文献内容特征的语言
a 分类语言 b 主题语言
000 总论 100 哲学 200宗教
1.3.1 文献分类方法(分3类00语社会言科) 学
存在,可归属在其上位类。
l
对于包含有两个以上主题内容的课题,如“机
械手的控制系统”涉及“机械手”和“控制系统”两个
主题概念,这时应考虑它们的主从关系,在这个课题中
研究的是仅针对机械手而言的控制系统,可以说是控制
机械加工 00003 00395 11009 14561 --模型 00375 --误差 18007 11456 --发展 13175
4)文摘。如
037840 Algorithm for fuzzy multi-criteria decisionmaking.
This paper presents a new algorithm for solving the general fuzzy multi-criteria decision making(MCDM) problem involving fuzzy data expressed by means of linguistic terms….. (Author abstract) 14 Refs,English.
g.标准文献:标准化主要包括三个方面:
产品标准化,即产品质量要符合技术规定;零部件通 用化;产品规格化和系列化。
1.2.5 二次文献类型(检索工具)
1)目录。以书名、刊名、会议名等为单位编写。 2)题录。如: 200008568 我国食品与包装机械市场预测[刊]田恒 真(中国农机院食品研究所)//包装与食品机械。2000, 18(1) 。-1-5 3)索引。如:
《不列颠百科全书》
3、年鉴、年刊、年报 4、手册
二 近代参考工具书类型
5、名录
经济机构名录 如《世界企业500强》。
商品名录 如《美国进出口商品名录》。 地名录 如《世界地名录》。 人名录 如《当代中国经济学家录》。 6、资料汇编 7、表谱 8、图录
三 工具书的主要排检方法
1、字顺排检法
① 形序法:部首法、笔画法、笔顺法、号 码法 ② 音序排检法:汉语拼音字母顺序排列法; 西文字母顺序排列法;韵部排列法,中国古 代按音编制的汉字检字法大都是按韵部排列 的。
知识产生 记录
一次文献
二次文献
三次文献
传播利用 研究、实验、实践、综合
新知识的产生
1.2.4 文献型科技信息源(一次文献)
a.科技图书:世界年出版50万种。
b.科技期刊(periodical):年出版10万种,500万篇。
c.科技报告:报道(记录)研究和开发调查工作的成 果或进展情况的一种文献类型,一般都编有号码,供 识别报告本身及其发行机构。 报告是一种典型的机关 团体出版物。如美国政府工作报告: PB报告,NASA 报告、 AD报告、DOE报告。年90万篇。
标准三
能客观、审慎地评估信息与信息源
概括信息源的适用性 评价和比较信息的可靠性、权威性、时
效性 综合主要观点的逻辑统一、可查实性
Biblioteka Baidu
标准四
个人或作为群体的一员能有效地利用 信息以完成特定的任务
应用信息创造成果、完成项目 (如完成课题报告、学位论文等) 为实现成果和目标修正学习过程 选用最有力的交流媒体和形式
广义:包含信息储存和查找两部分 (Information Storage and Retrieval)
狭义:信息查找(Information Search)
1.1.2 信息检索能力培养的意义
信息检索能力与信息素质
信息素质概念 :1974年美国信息工程协会 主席Paul, Zurkowski首次定义为:
集我国历代或某一朝代政治、经济、文化、 军事等史料,分门别类,按时代先后顺序编 排。如唐.杜右《通典》、《元典章》、 《明会典》、《清会典》等。
二 近代参考工具书类型
1、字词典 近代 《词源》、《辞海》、《汉语大词 典》 上海辞书出版社,1986年第一卷, 自第二卷起改由汉语大词典出版社出版, 共出12卷。共收词语37万条, 5 000余 万字。
第一章 信息检索概论
2004 喻萍
第一章 信息检索概论
1.1 信息检索概念及其意义 1.2 信息文献基本知识 1.3 信息检索语言 1.4 信息检索基本方法及步骤
1.1 信息检索含义及意义
1.1.1 信息检索含义
信息检索(Information Retrieval)指从 大量的信息集合中找出所需信息的过程与方法。
从上表看出分类号的变化体现了各学科体 系的从属关系,分类号位数每增加一位,则分 类级别便低一级。
如TP39代表计算机应用,TP393类目是计算机 网络,是TP39的下位类。
确定分类号的方法有以下二种:
①直接查找法
熟悉分类表,按学科体系从大类开始逐级查找
l
对于只存在一个主题的课题,方法就较简单。
如“机械手”。当要求的主题过于狭窄,没有相应类目
1.2 .2 信息、知识、情报、文献的关系
知识
信息
情报 文献
1.2.3 文献等级
一次文献(primary document):指作者以本 人的研究成果为基本素材而创作或撰写的文献。 二次文献(secondary document):指对一次 文献进行加工、提炼和压缩后所得到的报道性产 物。检索工具书和网上引擎是典型的二次文献。 三次文献(tertiary document):是指对有关 的一次文献和二次文献进行广泛深入的分析研究 综合概括而成的具体知识、数据。如大百科全书 、辞典等。
8 语言学、文学9 地理、传记、历史
3、《中国图书馆分类法》
A 马克思主义、列宁主义、毛泽东思想
B 哲学
C 社会科学总论
D 政治、法律
社 会
E 军事 F 经济 G 文化、科学、教育、体育
科 H 语言、文字
学 I 文学
J 艺术
K 历史、地理
N 自然科学总论
O 数学科学和化学
P 天文学、地球科学
自 Q 生物科学