信息组织知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
知识要点
第一章绪论
1、什么是信息组织?(理解)
信息组织:对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。2、信息组织的发展阶段——按组织对象划分(理解)
按组织对象划分信息组织经历了三个阶段:文献组织阶段、信息组织阶段、知识组织阶段文献组织阶段——组织对象:传统文献实体,不涉及文献内容本身。
信息组织阶段——组织对象:从广度上,以纸质信息为中心转向以电子媒介信息为中心;
从深度上,除了对文献实体进行组织,还要深入信息内容。
知识组织阶段——组织对象:从显性知识扩展到隐性知识。知识组织直接给用户提供直
观的、可操作的系统化知识。不再局限于利用片面的信息来满足用户
的需求,而是对用户的需求系统分析,向用户提供全面、完善的解决
方案。
按职能划分信息组织经历了三个阶段(补充):
清册职能时期
查检职能时期
组织职能时期
3、网络信息组织的基本方法(掌握)
①文件方式
•一般用于局域网内的非结构化信息组织。
•优点:通过FTP协议进行传输,简单方便
•缺点:以文件为单位共享和传输信息会使网络负载越来越大
②自由文本方式
•主要用于全文数据库的组织
•对非结构化的文本信息进行组织和处理的方式
•能够完整地反映出一次文献的全貌
•通过计算机自动进行文献信息的处理和组织,支持全文检索。
③数据库方式
•一般用于结构化/规范化信息组织。
•优点:最小存取单位是字段,从而大大降低网络数据传输的负载。
•缺点:对非结构化信息处理难度大
•数据库方式是当前普遍使用的网络信息资源的组织方式。
④主页方式
•网页一般通过HTML语言规则将文本、图像、声音、视频等各种类型的信息集合在一起。
⑤超文本方式
⑥主题树方式
•主题树方式是一种可供检索和查询的等级式主题目录。它以人工方式或半自动方式搜集信息,然后将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织。
•主题树方式不太适合大型的综合性的网络信息资源系统,而较适合专题指引库的建立。
⑦搜索引擎方式
⑧指引库方式
• 指引库,也称导航库。它并不存储各种实际的信息资源,只存放有关主题的
数据库或服务器的地址等信息,可指引用户到特定的地址获取所需的信息。
5、信息的外表特征、内容特征分别包括哪些?(理解)
外表特征:与信息内容无关的特征,如题目、作者、出处、作者工作单位、专利号等 内容特征:信息所涉及的中心事物和学科属性 ,如分类号、主题词、关键词、摘要等。
6、什么是标引语言?什么是自然语言?什
么是受控语言?自然语言区别于受控语言的特点有哪些?(理解)
标引语言:是表达文献主题概念和文献需求主题概念的简明性、单义性和关联性概念标识系统,是根据标
引和检索需要而编制的人工语言。
• 也叫“情报语言”、“索引语言”、“检索语言” • 揭示信息的中心主题和内容特征 • 信息标引的依据
• 用于将检索用语和标引用语进行匹配 • 对自然语言进行规范化处理后的人工语言
标引语言实际上是检索者与组织者之间的一种“约定”
自然语言:文献作者所使用的书面语言
受控语言:词汇及语法都受到各种控制的人工语言。
7、标引包括哪些类型?自然语言标引包括
模糊对应
外表特征
内容特征
精确对应
信 息
哪些方法?(理解)
几个重要概念(补)
•自然语言标引:采用自然语言作为信息记录主题内容检索标识的标引。
自然语言标引的方法:
1.关键词法
2.文本检索
3.自由标引
4.自然语言入口词检索
8、索取号及其构成(掌握)
索取号:是信息服务机构赋予每一种信息资源的唯一号码。它反映每种信息资源的具体存放位置。
索取号由两部分组成:分类号和书次号(书次号通常采用“种次号”或“著者号”)。
“种次号”是依照同类信息资源到信息服务机构的先后次序编制的顺序号或流水号;
“著者号”是依照著者姓名的音、形等特征编制的号码。
9、信息存储介质(理解)
存储介质—纸张、磁盘、磁带、缩微胶片、光盘等
10、信息存取系统的类型(理解)
信息检索系统的类型
•按照信息源类型划分:文献型、事实型、数值型、图像型
•按照工作方式和存取介质:手工、单机、联机、光盘、网络
信息检索系统的结构
信息检索系统一般包括五个子系统:
•选择子系统
•标引子系统
•词表子系统
•检索子系统
•交互子系统
11、衡量检索效率的指标(理解)
衡量检索效率的指标主要有:
•查全率(漏检率)
•查准率(误检率)
第二章分类法(重点)
1、什么是分类法?包括哪些类型(即构成原理)?(理解)
分类组织法:根据概念的划分与概括原理,按照事先规定好的学科专业体系或事物范畴,根据某一特性将信息分门别类的组织成系统,以便于用户按照学科专业或事物范畴途径查询特定信息的信息组织法。
•分类法使用分类号来标识类目,分类号可反映类目在分类体系中的位置和排列次序。
分类语言的构成原理:1)等级体系分类法2)分面组配分类法3)等级体系—分面组配分类法(也即混合分类法)
2、什么是体系分类法?其主要代表有哪些?(理解)
含义:类目按等级层层展开,并详尽列举的文献分类法
☐特点
•将表达事物的概念(类目)按照知识分类与逻辑关系进行纵向从属、横向并列的方式编排成概念等级体系;
•是一种先组式定组型标引语言,其类目与类号标识都是在编制分类表时事先确定或大部分确定好的;
•按照学科专业和事物范畴区分和集中文献;
•标识符号既可以用于组织分类目录与索引,也可用于排书上架;
•采用数字和字母作为标识,便于国际标准化。
☐种类
•《中国图书馆分类法》(简称《中图法》)
•《中国科学院图书馆分类法》(简称《科图法》)
•《杜威十进分类法》(简称DDC)
•《国际十进分类法》(简称UDC)
•《美国国会图书馆图书分类法》(简称LDC)
☐局限性(补充)
•列举类目与无限增长的科学知识不相适应;
•类目体系的单向线性结构与概念多向成族的网状结构不相适应;
•分类标识的概括性与信息源主题的专指性不相适应;
•号码标识的有限性与知识单元的无限性不相适应;