信息检索语言.

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.检索语言的组成要素
3.检索语言的特点:严密性、可控性、系统性
4.检索语言的类型
按规范程度分
自然语言 规范化语言
按组配方式分
先组式语言 后组式语言
按照描述信息特征划分
内容特征语言
分类语言/主题语言
外部特征语言
名称语言/著者语言/序号语言
二、主题检索语言
1.相关概念: 主题:指文献论述的对象,包括事物、问题、现象等。 主题词:用来表达文献主题的词语。 主题语言:是以自然语言中语词文字为基础,以反映特定事物为中心, 以主题词字顺为基本结构的一种检索语言。 2. 主题语言原理: 以主题为中心集中文献 以词语作为检索标识 以字顺方式作为主要检索途径 通过参照系统等方式揭示主题词之间的关系
时代分面
C1 古代 C2 近代 C3现代 C4当代 ……
4.分类语言的标记符号 标记符号:文献分类法中用以表示类目的代号,又称分类号。 作用:它具有固定类目的位置,明确各个类目的先后次序,在一定程度 上显示类目之间的隶属、并列关系以及描述某个类目的含义。 标记符号的要求 :
容纳性 表达性 简短性 助记性
5.标记符号的种类
单纯号码:是指采用某一种符合通行习惯并具有一定固有次序的符号系 统。它又可分为单纯数字号码和单纯字母号码两种,常见的是单纯阿拉 伯数字号码。如《杜威十进分类法》、《科图法》等采用单纯阿拉伯数 字号码。 混合号码:是指同时采用两种或两种以上符合通行习惯并具有固有次序 的符号系统,它一般是字母与阿拉伯数字相结合。如《美国国会图书馆 分类法》、《中图法》均采用混合号码。
2. 基本类型 分面叙词表与分类号—主题词表对应表是分类主题一体化词表的两 种主要类型。 (1)分面叙词表 分面叙词表是以英国学者艾奇逊等编制的《分面叙词表》的名字所 命名的一个类型,这是世界上第一部分类主题一体化词表。 (2)分类号—主题词对应表 这是一种将现成的分类表和叙词表,通过词汇对应相互结合而成的 一体化语言,从而将分类表和主题词表功能集于一身。由于它是将现成 的分类表和主题词表进行的对应,不对已有的分类表和主题词表进行大 的改动,实现了一部分分类号和主题词的等值对应,一大部分是兼容的 关系,因此这种词表被称为低层次的一体化词表。 以《中图法》与《汉语主题词表》为基础编制的《中国分类主题词表》, 就是这种类型的一体化词表的典型代表。
2.分类语言的局限性: 间接性。使用分类语言进行信息检索,检索者需要两重转换。 分类语言不能按主题集中信息。 从实际需要看,大量的检索课题需 要按主题进行特性检索,体系分类语言不适合这种多维性的专题概念的 特性检索。 3.分类语言的类型: • 按照编制方法分: – 等级列举式分类法 – 分面组配分类法 – 列举-组配分类法
6.标记制度
标记制度:是指为文献分类法的类目配置分类号码的方法,也称编号制 度或配号制度。 层累标记制 顺序标记制 混合标记制 分面标记制
7.标记方法
预留空号法 八分法 双位制 借号法 字母标记法 对应编号法
8.著名的分类表
美国
《杜威十进分类法》 《国际十进分类法》 《美国国会图书馆图书分类法》
信息检索语言
张 行
检索语言概述 主题检索语言 分类检索语言 分类主题一体化检索语言
一、检索语言概述
1.信息检索语言的基ຫໍສະໝຸດ Baidu功用
信息检索语言是根据信息检索需求所使用的一种专门的人工语言,这 种人工语言是在自然语言基础上形成的,能够描述和组织信息特征的 一种语言。 表达信息 组织信息
字符 基本词汇 语法规则
等级列举式分类法 U448.1 各种桥梁 U448.1 桥梁、按用途分 U448.11 人行桥 U448.12 两用桥 U448.13 铁路桥 …… U448.2 桥梁、按结构分
分面组配分类法
地区分面
E1 中国 E2 朝鲜 E3 韩国 E4 日本 ……
体裁分面
D1 诗歌 D2 戏剧 D3 小说 D4 散文 ……
3.主题语言特点: (1)集中性 (2)直观性 主题语言直接用能够表达信息内容的主题词来作为检索 标识,主题词来源于自然语言,比较直观,符合人们的辩识习惯。 (3)灵活性 主题语言的主要特征是通过词与词之间的概念组配来揭 示信息中的各种主题,尤其是后组式的组配原则,便于按照检索需要自由 组配检索概念,具有很大的灵活性。 4.类型:
中国
《中国图书馆图书分类法》 《中国科学院图书馆图书分类法》 《中国人民大学图书馆图书分类法》
印度 《冒号分类法》 《国际专利分类法》
9.《中国图书馆分类法》
五大部类:
22个基本大类: A 马克思主义、列宁主义、毛泽东思想、邓小平理论; B 哲学、宗 教; C 社会科学总论; D 政治、法律; E 军事; F 经济; G 文 化、科学、教育、体育;; H 语言、文字; I 文学; J 艺术; K 历史、地理; N 自然科学总论; O 数理科学和化学; P 天文学、地球科学; Q 生物科学; R 医药、卫生; S 农业科 学; T 工业技术; U 交通运输; V 航空、航天; X 环境科 学、安全科学; Z 综合性图书
标题词语言; 单元词语言; 叙词语言; 关键词语言
三、分类语言
1.基本概念: 亦称体系分类语言,是以学科范畴和学科体系为基础来划分事物的 一种检索语言。在信息存储和检索中,它是一种对信息内容的概念进行 逻辑分类和有规律地系统排列而构成的检索语言,并以分类表(分类法)的 形式体现。 分类语言最显明的特点是系统性,具有族性检索的功能,有利于人 们从学科专业的角度进行全面性的检索。
马克思主义、列宁主义、毛泽东思想 哲学 社会科学 自然科学 综合性图书
四、分类主题一体化检索语言
1. 基本原理 分类主题一体化语言集成了分类语言与主题语言的优点,分类语言 与主题语言虽然有许多不同,但在构成原理上却是相同的。 (1)两者均采用了概念逻辑的原理 (2)两者都是用了分类的方法 (3)两者的基本构件相同
相关文档
最新文档