信息组织—信息组织原理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、信息组织中的控制与规范
?词汇控制 词汇控制包括下述内容: ?词间关系控制
目的:用于扩检、缩检、改变检索方向 方法:设置参照、倒置标题、使用副标题、 通过类目体系揭示词间关系 举例:害虫 S 杀虫剂
无损检验 S 无损探伤仪 血管 F 动脉
二、信息组织中的控制与规范
?句法控制
句法控制是指根据信息资源标引和检索的 需要,所作出的组词造句的规则,是对检索语 词的组合方式的规定。
表示系统检出相关信息资源的能力。
一、对信息组织的要求
2、检准率(查准率)
系统实施检索时检出的与某一检索提问相 关的信息资源数与检出的信息资源总数之比。
检出相关信息资源量 检准率= 检出信息资源总量 ×100%
表示检索系统排除与检索提问无关信息 资源的能力。
一、对信息组织的要求
检全率与检准率的关系
二、信息组织中的控制与规范
?描述控制 根据上述各项控制要求做具体的规定,就
形成了各种信息描述规范。
分类法和主题法也可以说是从主题角度提 出的信息描述规范。
二、信息组织中的控制与规范
?词汇控制 词汇控制是根据信息资源标引和检索的需
要,对自然语言中的词汇进行选择、规范并揭 示其相关性的过程。
二、信息组织中的控制与规范
为了以明确、统一的方式对信息资源进行组织,需 要对语词之间的组合方式,即句法进行控制。
二、信息组织中的控制与规范
制
?标引和检索的句法控制
二、信息组织中的控制与规范
?描述控制
描述记录一般概要记录资源各种基本特征 的数据,可以以浓缩的方式集中反映资源的特 征和内容。
(1)描述项目的控制
根据资源特点选择具有组织和揭示价值的资源特征 作为描述的项目。描述项目应该充分反映信息资源的基 本特征和数据。
二、信息组织中的控制与规范
二、信息组织中的控制与规范
?句法控制
为什么要进行句法控制?
因为仅有规范的语词是不够的,语词只能表达简单 的概念。语词的组合才能表达复杂的概念。特别是信息 组织的一种重要方法——主题法,就是通过对相应语词 的组配来实现对复杂概念的表达的。但是汉语非常灵活, 语词之间的组合方式多种多样,如下例。
?计算机控制遥感系统对大地测量 ?遥感系统在计算机控制下对大地测量 ?大地测量在计算机控制下通过遥感系统进行 ?遥感系统对大地测量在计算机控制下进行
目的:克服一义多词现象,将同一内容、特 征的资源集中在相同的标识下。 方法:选定一个规范词,建立用代参照 举例:电脑 Y 计算机
计算机 D 电脑
二、信息组织中的控制与规范
?词汇控制 词汇控制包括下述内容: ?词义控制
目的:克服一词多义现象 方法:加限义词、增设含义注释和范围注释 举例:疲劳(生理);疲劳(物理) 举例:“下次你跟着出租车跑回来,还可以 省掉十块钱”
系统的及时性指检索工具能否在较短时 间内将信息资源纳入系统,尽快提供使用。
一、对信息组织的要求
4、系统的易用性
对标引者而言,指系统是否便于进行描述 和标引操作,是否需要掌握复杂的专门技能才 能使用,在处理过程中为减少处理差错能否得 到各种提示和帮助等。
对广大检索用户而言,则是指系统检索是 否易于使用,操作是否复杂,是否需要预先学 习才能实施检索;检索界面是否友好,是否配备 有相应说明,并提供各种具有启发性的帮助等。
一、对信息组织的要求
5、检索的成本效益
指检索系统的成本和效益之比。 成本一般指检索系统设备费用、标引处理 费用、检索运行费用。 效益则是指检索系统的性能及因此产生的 效益,包括获取信息能取得的经济效益和社会 效益。
二、信息组织中的控制与规范
信
?对信息资源的描述控制
息
组
织
?标引和检索的词汇控制
的
控百度文库
?词汇量过大,给词汇的加工、管理增加困难,在 描述信息的选词和检索时确定检索用词时都造成困 难。
鉴于上述原因,一般必须根据检索系统的需要,对词汇 进行必要的选择和处理。
二、信息组织中的控制与规范
?词汇控制 词汇控制包括下述内容: ?同义控制 ?词义控制 ?词间关系控制
二、信息组织中的控制与规范
?词汇控制 词汇控制包括下述内容: ?同义控制
?检全率与检准率之间呈互逆
关系
检
全 率
?检索系统对检全率与检准率 的权衡,应考虑检索系统的任
%
务、服务对象的需求、信息资
源集合的规模等多种因素,并
根据使用需要提供选择的可能
检准率%
性。
一、对信息组织的要求
3、检索速度和系统的及时性
检索速度指用户实施检索时获得检索结果 花费的时间。这一指标不仅与系统响应检索提 问的速度有关,同时也涉及查全、查准等因素, 与信息资源的组织是否合理直接相关。
第二章 信息组织原理
本章提示
1、对信息组织的要求 2、信息组织中的控制与规范 3、规范控制的依据
一、对信息组织的要求
1、检全率(查全率)
系统实施检索时检出的与某一检索提问相 关的信息资源数与检索系统中与该提问相关的 实有信息资源总数之比。
检出相关信息资源量 检全率= 系统相关信息资源总量 ×100%
(2)描述文字的控制
规定描述信息资源时所采用的文字,应当准确、精 炼、统一、规范。
二、信息组织中的控制与规范
(3)描述级别的控制
规定对信息资源进行描述的详略程度。应根据不同 的使用对象和需求,信息资源的特点、设备条件加以确 定。
二、信息组织中的控制与规范
(4)描述格式的控制
包括各种描述项目的次序、描述的标识、描述项目 的表达形式等。对此做统一规定的目的是方便不同类型 信息系统之间的交流。
?词汇控制
为什么要进行词汇控制?
因为对信息的描述离不开自然语言。但是自然 语言做为日常交流的语言,存在很多问题:
?表达不够精确一致,语词与概念不是一一对应
一词多义:e.g.疲劳一词,在医学和物理学领域各自 有不同的含义
一义多词:e.g.土豆&马铃薯;电脑&计算机 词义含糊:e.g.笔记本(本子?便携式电脑?)
二、信息组织中的控制与规范
?词汇控制 为什么要进行词汇控制?
?自然语言词汇没有明确地表达词间关系,很难 适合检索系统显示概念间联系的要求。
e.g. 浮游生物与水生生物是包含与被包含的 关系;浮游生物与水底生物是并列关系等。
e.g. “湖广熟,天下足”
二、信息组织中的控制与规范
?词汇控制 为什么要进行词汇控制?