文献信息检索方法跟技术新

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

9.1 信息检索基础
B.信息检索语言的基础
概念逻辑和知识分类是信息检索语言的基础。
任何一种信息检索语言,都是表达一系列描述信息内 容的概念及其相关关系的概念标识系统。也就是说,它们 都是建立在概念逻辑基础上的。
主题分析就是将信息内容概括为某个或某几个概念。 信息检索过程中,概念是利用各种信息检索语言的语词 (标识)来表达的。
9 文献信息检索方法与技术
9.1 信息检索基础
9.2 信息检索途径、方法与步骤 9.3 计算机信息检索 9.4 检索效果评价
9.1 信息检索基础
(1)什么是信息检索
信息检索就是在信息的海洋里“大海捞针”。如何捞? 利用过滤技术。
过滤技术的形式是多样的: 筛子:筛沙,筛米,筛面…… 风:如扬场利用自然风把稻谷与稻草末分开,风车用人造 风把米和米糠分开…… 磁场:如用“质子回旋加速器”把质子和其他粒子分离 水:(利用浮力差别) 其他条件限制:身高、年龄、体重、学历、相貌、地域、 出身、单双号限制等等
9.1 信息检索基础
(1)什么是信息检索
案例:李开复从30万图片邮件中找出20封邮件(离开 微软到GOOGLE)。
方法:把图片转换为文字,再检索。
信息检索(Information Retrieval):依据一定方法, 从已经组织好的有关大量信息集合中,查出特定的相关信 息的过程。
按照检索对象的不同,可分为文献检索、数值检索和 事实检索。
¾ 主题检索语言:用主题词汇来表达各种概念,将各种概念忽略其相关 关系按字顺排列,表达的概念较准确。
¾ 代码检索语言:针对事物的特征,用代码系统来加以标引和排列,如 化合物的分子式索引系统等。
9.1 信息检索基础
D.常用信息检索语言介绍
D-1.分类检索语言 ①《中国图书馆图书分类法》(简称《中图法》)
9.1 信息检索基础
(3)信息检索语言
信息检索语言与自然语言的区别: 自然语言具有多义性。 信息检索语言是人工语言,具有唯一性。
信息检索语言对要对一词多义或多词一义的语词进行 规范化处理,例如:自行车、单车、脚踏车;鲁迅、周树 人。
各种文献分类法,如《中国图书馆分类法》、《国际 十进分类法》,以及各种主题词表,如《中国分类主题词 表》、《工程索引(Ei)叙词表》等,都是检索语言。
9.1 信息检索基础
概念之间的关系有相容关系和不相容关系。
相容关系:同一关系 属种关系 交叉关系 整体与部分的关系
不相容关系:并列关系 矛盾关系 对立关系
9.1 信息检索基础
C.信息检索语言的类型
信息检索语言按照其构成原理,可分为分类检索语言、 主题检索语言、代码检索语言。
¾ 分类语言:用分类号表达各种概念,将各种概念按学科性质进行系统 排列。它集中体现学科的系统性,反映事物的从属、派生关系,从上 至下,从总体到局部层层展开,是一种等级关系。
第一部类 马克思列宁主义、毛泽
东思想 A 马克思主义、列宁主义、毛泽
东思想 第二部类 哲学
B 哲学 第三部类 社会科学
C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理
第四部类 自然科学 N 自然科学总论 O 数理科学和化学 P 天文学、地理科学 Q 生物科学 R 医学、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、劳动保护科学(安全
信息存储的逆过程。 用户根据信息需求,选取合适的检索词(标题、著者 姓名、主题词、分类号等),利用检索工具或检索系统查 找出相关信息。
查找的过程实际上是一个匹配的过程,即确定检索词 并将检索词与标引词做相符性比较,二者一致,就算找到 了符合要求的信息。
9.1 信息检索基础
(3)信息检索系统
广义地,信息检索系统是包含了从信息采集到信息检 索全过程的服务体系。
9.1 信息检索基础
(4)信息检索语言
A.信息检索语言的含义与作用
信息检索的实质,就是人们的信息提问与信息的检索 标识相比较后决定取舍的过程。一致,就“命中”了信息。 不一致,就继续查找。
信息的标识用词和检索用词使用共同的语言来表达。
这种在信息的存储和检索过程中共同使用的语言, 就是信息检索语言。又称为情报检索语言、索引语言、标 引语言。
信息检索系统的四个基本要素:目标;一定规模的信 息资源;实现存储与检索的技术装备手段;一定的存储与 检索方法。
狭义地,信息检索系统就是指用户查找信息所使用的 检索工具或系统。
随着技术的发展和应用,信息检索系统的物理形式发 生了重大变化,它曾经是一本书、一套卡片、一张光盘, 现在更多的是一个网络数据库。
科学)
第五部类 综合 Z 综合性图书
9.1 信息检索基础
②《中国科学院图书馆图书分类法》(简称《科图 法》)
设置5大部类,25大类。
《科图法》五大部类:马克思列宁主义、毛泽东思想
哲学 社会科学 自科科学 综合性图书
《科图法》
00 马克思列宁主义、毛泽东思想
10 哲学 20 社会科学 21 历史、历史学 27 经济、经济学 31 政治、社会生活 34 法律、法学 36 军事、军事学 37 文化、科学、教育、体育 41 语言、文字学 42 文学 48 艺术 49 无神论、宗教学
依据:毛泽东同志在《整党的作风》中的一段话。 什么是知识?自从有阶级的社会存在以来,世界上知 识只有两门,一门叫做生产斗争知识,一门叫做阶级斗争 知识。自然科学、社会科学就是这两门知识的结晶,哲学 则是关于自然知识和社会知识的概括和总结。此外还有什 么呢?没有了。
设置5大部类22大类,见下表。
《中国图书馆图书分类法》
50 自然科学 51 数学 52 力学 53 物理学 54 化学 55 天文学 56 地质、地理科学 58 生物科学 61 医药、卫生 65 农业科学 71 技术科学
ຫໍສະໝຸດ Baidu信息检索利用检索词、检索条件实现过滤。
9.1 信息检索基础
(2)信息检索原理 信息检索包括存储和检索两个方面。
A.信息存储的过程
①信息采集:根据一定的规则收集信息。 ②信息标引、著录。
对信息的内容特征和形式特征进行揭示和描述。 ③编制检索工具或建立检索系统。
9.1 信息检索基础
(2)信息检索原理 B.信息检索的过程
相关文档
最新文档