信息组织—信息组织原理

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二、信息组织中的控制与规范
?词汇控制 词汇控制包括下述内容: ?词间关系控制
目的:用于扩检、缩检、改变检索方向 方法:设置参照、倒置标题、使用副标题、 通过类目体系揭示词间关系 举例:害虫 S 杀虫剂
无损检验 S 无损探伤仪 血管 F 动脉
二、信息组织中的控制与规范
?句法控制
句法控制是指根据信息资源标引和检索的 需要,所作出的组词造句的规则,是对检索语 词的组合方式的规定。
表示系统检出相关信息资源的能力。
一、对信息组织的要求
2、检准率(查准率)
系统实施检索时检出的与某一检索提问相 关的信息资源数与检出的信息资源总数之比。
检出相关信息资源量 检准率= 检出信息资源总量 ×100%
表示检索系统排除与检索提问无关信息 资源的能力。
一、对信息组织的要求
检全率与检准率的关系
二、信息组织中的控制与规范
?描述控制 根据上述各项控制要求做具体的规定,就
形成了各种信息描述规范。
分类法和主题法也可以说是从主题角度提 出的信息描述规范。
二、信息组织中的控制与规范
?词汇控制 词汇控制是根据信息资源标引和检索的需
要,对自然语言中的词汇进行选择、规范并揭 示其相关性的过程。
二、信息组织中的控制与规范
为了以明确、统一的方式对信息资源进行组织,需 要对语词之间的组合方式,即句法进行控制。
二、信息组织中的控制与规范

?标引和检索的句法控制
二、信息组织中的控制与规范
?描述控制
描述记录一般概要记录资源各种基本特征 的数据,可以以浓缩的方式集中反映资源的特 征和内容。
(1)描述项目的控制
根据资源特点选择具有组织和揭示价值的资源特征 作为描述的项目。描述项目应该充分反映信息资源的基 本特征和数据。
二、信息组织中的控制与规范
二、信息组织中的控制与规范
?句法控制
为什么要进行句法控制?
因为仅有规范的语词是不够的,语词只能表达简单 的概念。语词的组合才能表达复杂的概念。特别是信息 组织的一种重要方法——主题法,就是通过对相应语词 的组配来实现对复杂概念的表达的。但是汉语非常灵活, 语词之间的组合方式多种多样,如下例。
?计算机控制遥感系统对大地测量 ?遥感系统在计算机控制下对大地测量 ?大地测量在计算机控制下通过遥感系统进行 ?遥感系统对大地测量在计算机控制下进行
目的:克服一义多词现象,将同一内容、特 征的资源集中在相同的标识下。 方法:选定一个规范词,建立用代参照 举例:电脑 Y 计算机
计算机 D 电脑
二、信息组织中的控制与规范
?词汇控制 词汇控制包括下述内容: ?词义控制
目的:克服一词多义现象 方法:加限义词、增设含义注释和范围注释 举例:疲劳(生理);疲劳(物理) 举例:“下次你跟着出租车跑回来,还可以 省掉十块钱”
系统的及时性指检索工具能否在较短时 间内将信息资源纳入系统,尽快提供使用。
一、对信息组织的要求
4、系统的易用性
对标引者而言,指系统是否便于进行描述 和标引操作,是否需要掌握复杂的专门技能才 能使用,在处理过程中为减少处理差错能否得 到各种提示和帮助等。
对广大检索用户而言,则是指系统检索是 否易于使用,操作是否复杂,是否需要预先学 习才能实施检索;检索界面是否友好,是否配备 有相应说明,并提供各种具有启发性的帮助等。
一、对信息组织的要求
5、检索的成本效益
指检索系统的成本和效益之比。 成本一般指检索系统设备费用、标引处理 费用、检索运行费用。 效益则是指检索系统的性能及因此产生的 效益,包括获取信息能取得的经济效益和社会 效益。
二、信息组织中的控制与规范

?对信息资源的描述控制



?标引和检索的词汇控制

控百度文库
?词汇量过大,给词汇的加工、管理增加困难,在 描述信息的选词和检索时确定检索用词时都造成困 难。
鉴于上述原因,一般必须根据检索系统的需要,对词汇 进行必要的选择和处理。
二、信息组织中的控制与规范
?词汇控制 词汇控制包括下述内容: ?同义控制 ?词义控制 ?词间关系控制
二、信息组织中的控制与规范
?词汇控制 词汇控制包括下述内容: ?同义控制
?检全率与检准率之间呈互逆
关系

全 率
?检索系统对检全率与检准率 的权衡,应考虑检索系统的任
%
务、服务对象的需求、信息资
源集合的规模等多种因素,并
根据使用需要提供选择的可能
检准率%
性。
一、对信息组织的要求
3、检索速度和系统的及时性
检索速度指用户实施检索时获得检索结果 花费的时间。这一指标不仅与系统响应检索提 问的速度有关,同时也涉及查全、查准等因素, 与信息资源的组织是否合理直接相关。
第二章 信息组织原理
本章提示
1、对信息组织的要求 2、信息组织中的控制与规范 3、规范控制的依据
一、对信息组织的要求
1、检全率(查全率)
系统实施检索时检出的与某一检索提问相 关的信息资源数与检索系统中与该提问相关的 实有信息资源总数之比。
检出相关信息资源量 检全率= 系统相关信息资源总量 ×100%
(2)描述文字的控制
规定描述信息资源时所采用的文字,应当准确、精 炼、统一、规范。
二、信息组织中的控制与规范
(3)描述级别的控制
规定对信息资源进行描述的详略程度。应根据不同 的使用对象和需求,信息资源的特点、设备条件加以确 定。
二、信息组织中的控制与规范
(4)描述格式的控制
包括各种描述项目的次序、描述的标识、描述项目 的表达形式等。对此做统一规定的目的是方便不同类型 信息系统之间的交流。
?词汇控制
为什么要进行词汇控制?
因为对信息的描述离不开自然语言。但是自然 语言做为日常交流的语言,存在很多问题:
?表达不够精确一致,语词与概念不是一一对应
一词多义:e.g.疲劳一词,在医学和物理学领域各自 有不同的含义
一义多词:e.g.土豆&马铃薯;电脑&计算机 词义含糊:e.g.笔记本(本子?便携式电脑?)
二、信息组织中的控制与规范
?词汇控制 为什么要进行词汇控制?
?自然语言词汇没有明确地表达词间关系,很难 适合检索系统显示概念间联系的要求。
e.g. 浮游生物与水生生物是包含与被包含的 关系;浮游生物与水底生物是并列关系等。
e.g. “湖广熟,天下足”
二、信息组织中的控制与规范
?词汇控制 为什么要进行词汇控制?
相关文档
最新文档