信息组织总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
1、信息组织是为了把无序的信息整理归纳成为有序的信息资源的活动;信息的表示通常都是数据,但是只有经过了处理的数据才能成为信息。
2、信息组织活动实际上是对信息资源的处理,通常是以信息检索为基础的,所以建立检索的规范和控制语言是信息组织的关键手段。
从这个意义上说,信息检索是信息组织的目的和归属。
3、信息组织的形式(检索方式)有二种,其一是“固定排列法”;其二是“分类排列法”。
常用的是分类法,本课主要介绍分类法。
4、信息组织的研究有三个层面的内容:理论层面、规范层面和方法层面。
理论层面研究信息组织的基本规律,为规范层面和方法层面提供理论依据,指导信息组织的操作和实施。
规范层面提供信息组织应该遵循的共同规范(描述规范和检索语言)。
方法层面是实现信息组织的具体技术(操作方法、标引规则和描述规则)
5、信息组织是信息检索的基础和前提,信息检索是信息组织的目的和归宿。
第一章习题:
1、信息的定义是经过处理的、可供公享的数据;数据的定义是通过有意义的组合来反映客观事实特征的、可以识别、也可以传输进行通信的非随机符号。
它们之间的联系是经过处理的数据就是信息、无序数据不是信息。
2、信息组织的意义在于为了检索方便对信息资源进行的有序化组织的活动;信息组织的主要工作过程是建立信息资源收藏系统和检索工具。
3、信息组织有四种分类,它们是文献目录、索引、机读数据库和网络引擎。
4、信息组织和信息检索的关系是检索是信息组织的目的和归宿、组织是检索的基础和前提。
检索语言的意义是信息资源主题概念关系的词汇和规则所组成的人工语言系统。
第二章
1、为了有效的检索和利用信息组织,对于大型检索系统需要考虑“检全率”;而对于中、小型检索系统,检全率可以忽略,重点是“检准率”。
检全率和检准率二者是反比例关系。
2、检索速度和系统及时性是涉及信息资源组织时间和检索时间的二个指标。
另外、一个好的检索系统还要考虑“易用性”和“成本效益”。
3、要使信息组织符合实际使用的需要,是通过各种规范控制的方法实现,包括:一是对信息组织对象的描述控制;二是对检索过程中的词汇控制和句法控制。
4、为有效地组织信息,必须对描述记录的内容、描述方式进行必要的控制,包括四个方面:
⑴描述项目控制(根据资源的特征选择有价值的描述项目)⑵描述文字控制(以便准确、统一地进行各种特征的记录)⑶描述级别控制(根据系统的特点和需要,制定描述项目的详略程度)⑷描述格式的控制(项目的次序、标识、表达形式的规范)。
5、具体的控制规范有“词汇控制”和“句法控制”;“词汇控制”是对自然语言中的词汇进行选择、规范并揭示其相关性,有“同义控制”和“词义控制”。
“句法控制”是根据资源标引和检索的需要,通过组词造句的规则对检索系统的语词组合方式作出规定。
常用的方法有:引用次序(复合主题标引和检索时,各个主题因素的组合次序)、使用辅助符合(是进行句法控制的重要手段,包括关系符号、逻辑组配符号、联系符号和职能符号)
6、规范控制的依据是“以概念逻辑为工具,以知识分类为基础,根据信息资源特点和设备条件状况进行的。
第二章习题:
1、谈谈你对检全率和检准率的概念的理解,并且说明它们之间的关系。
【答】检全率和检准率是衡量信息检索系统的有效性的二个重要指标。
检全率是检出的相关信息资源量占系统资源总量的百分比;检准率是指检出的有效资源数量占检出的相关资源量的百分比。
它们的关系是反比例的,实际检索系统是根据检索系统的特点和用户的需求确定这二个参数的;具体说:对于中、小型检索系统要求有比较高的检全率,而对信息数量大的数据库或搜索引擎,则要求有比较好的检准率。
2、为什么要进行词汇控制?词汇控制包括哪些内容?
【答】信息资源组织的有序化的依据基础是自然语言,但是自然语言的特点与描述、标引的要求存在差异,比如自然语言存在一词多义、一义多词,语词和概念不是一一对应,所以必须根据检索系统的需要,对词汇进行必要的选择和处理(即控制)
3、句法控制有什么作用?常见到方法有哪些?
【答】词汇控制有利于以统一、规范的方式揭示信息资源的主题或特征,但是仅有词汇是不够的,还必须有词汇的组合方法,才能够对复杂的主题的组织与揭示形成相应的语词组配(句法控制)。
句法控制的常见方法有三种(1)引用次序法(组配次序),主要用于分类资源组织法中。
(2)辅助符号法(组配符号),是重要的句法手段,具体有关系符号、联系符号、职能符号和逻辑组配符号。
(3)轮排法,是通过对语句中语词位置的变动解决检索系统总量增加时,句法形式多样化、引用次序法中各种复杂主题只有一个检索入口,影响查找和使用。
第三章
1、在信息资源组织的实践中,网络信息资源的描述数据是“元数据”。
信息描述的目的就是以元数据为中介,对信息资源进行各种操作。
作用有:识别(进行个别化描述,使用户能够识别资源对象)、定位(提供信息资源位置)、检索(通过描述数据中的检索点,提供各种基本的检索途径)和选择(记录资源的各种特征,供用户对其使用价值进行判断,决定取舍)。
2、检索点是指检索信息资源所使用的题名、责任号、分类号、主题词等各种供检索使用的数据。
题名检索点是从题名角度查找资源。
选择方法有:正题名直接作标目;付题名和附注项中的合辑题名作标目。
要注意的是:并列题名不选作标目,题名检索点一般不能超过二个。
第三章习题:
1、简述“元数据”在信息描述中的作用?
【答】在信息资源组织的实践中,网络信息资源的描述数据是“元数据”。
信息描述的目的就是以元数据为中介,对信息资源进行各种操作。
作用有:识别(进行个别化描述,使用户能够识别资源对象)、定位(提供信息资源位置)、检索(通过描述数据中的检索点,提供各种基本的检索途径)和选择(记录资源的各种特征,供用户对其使用价值进行判断,决定取舍)
2、检索点的意义是什么?题名检索点的选择方法是什么?
【答】检索点是指检索信息资源所使用的题名、责任号、分类号、主题词等各种供检索使用的数据。
题名检索点是从题名角度查找资源。
选择方法有:正题名直接作标目;付题名和附注项中的合辑题名作标目。
要注意的是:并列题名不选作标目,题名检索点一般不能超过二个。
第四章
1、信息描述的实际意义是什么?简述信息描述工作的基本程序,并扼要说明各步的工作内容。
2、Connexion编目平台有什么优越性?说明利用Cnnexion系统查重的操作方法?
3、《都柏林核心集》方式北大图书馆的描述记录如下图示,试解释前面四行的意义。
第五章
1、信息资源分类的特征是四个,从属于二个方面:⑴按照学科特点、内容特点分类;⑵以一定的标记符号、从字顺角度提供类目索引。
2、分类法的类型有聚类和分类二种;其编制方式有三种⑴等级列举式;⑵
分面组配式⑶列举组配式。
3、说明下面各表的分类编辑方式:
⑴P80物理学分类表;⑵P86生物科学分类表;
⑶P91生物科学分类表。
⑷P91工程技术分类表。
第五章习题:
1、准确、一致地组织和揭示信息资源的依据或者工具是信息资源分类法、也称为文献分类法、分类语言;是根据类目之间的关系组成的,并配有一定标记符号的类分信息工具;按编制方式可以分为等级列举式、发分面组配式和列举组配式三种类型。
2、类目表的结构成分有主表、复分表、标记符号、说明与注释和类目索引。
其中“复分表”的使用的重要注意事项是复分表不能单独使用和确定使用后不能随意变动。
3、说明标记技术中的八分法的具体做法,并且将下面的文献用八分法进行类目号码配置。
(44分)(物理学,中学物理;普通物理;力学、电学、热学、光学、原子物理、电磁学、
人体仿真学。
)
【答】八分法(又称为扩九法),做法是:在层累数字标记的情况下,当同位类超过10个,不足18个时,前九位用0-8表示,8后面的标记用二位数字表示一次划分。
O40物理学
O41中学物理学
O42普通物理
O43力学
O44热学
O45电学
O46光学
O47原子物理学
O48电磁学
O491人体仿真学
第六章习题
1、世界三大分类法是⑴DDC(杜威十进分类法);⑵UDC(国际十进分类法);⑶LCC(美国国会图书馆图书分类法)
;(可以写代号)其中⑴的特点:主表是对于已知主题的详细列举,基本上是以学科为中心展开的。
2、试分析下表的结构,回答下列问题:
⑴为什么这个表属于“十进分类”体系?
⑵它的第一级类目有几个大类?总类的用途是什么?
⑶举例说明这个类目表的层层展开特征;试将“法律”展开为九个三级类(宪法、刑法、诉讼法、行政法、民法、经济法、环境保护法、选举法、物权法)
2、试分析下表的结构,回答下列问题:
3、⑴为什么这个表属于“十进分类”体系?
答:DDC的主表是对已知主题的详细列举,其第一级类目把所有学科门类分为9个大类,再把不好归类的门类列入一个总类,一共是十个大类,故称为“十进分类”体系。
(2)它的第一级类目有几个大类?总类的用途是什么?
答:第一级类目有“总类、哲学、宗教、社会科学、语言学….等”十个大类;总类的用途是:为其他不能够进入其他9个大类的学科门类留下一个归类口。
第七章小结
1、在一般分类规则中有三种分类规定:(1)单主题信息资源分类标引。
(2)多主题信息资源分类标引。
前者分有二种情况,如《人口统计学》归入“人口学”下的专类,标引是G921,属于简单单主题信息分类资源,《中国茶道文化》应归“中国文化史”K203属于方面单主题,后者包括并列关系,从属关系,联结主题等。
2、《计算机应用基础》应归入计算机应用。
3、对文献进行分类组织,又称排架。
可以将文献组织成一个按内容之间的关系排列的系统。
同类书要求取号简易、号码简短。
4、分类索引号又称分类排架号,分类索引书号的记录形式通常是2-3行书写。
5、鲁迅《准风月谈》的号码是“辅助符号\数学”的组合,其中辅助符号是1。
6、王力《古代汉语》第一册和第二册的区分是依靠辅助符号结合相应的数字区分。
第一册:H109.2W253
第二册:H109.2W253:2
7、(1)、F129.9表示中国经济地理,则浙江经济地理“F129.955”
(2)、法语词典:H32法语+6词典=H326
(3)、物理学文摘:专题书目类号Z89+物理学O4=Z89:O4
(4)、阿富汗哲学:亚洲3+西亚7=阿富汗372+哲学B=B372
(5)、轻工业企业组织与管理:轻工业F407.8+组织管理F406=F407.806
8、老舍的《骆驼祥子》应该归入现代中长篇小说。
第八章小结
1、主题法是分类法以外另一种从角度标引和检索信息资源的方法。
特征:
(1)直接一语词作为检索标识
(2)以字顺作为主要检索途径
(3)以特定的事物、问题、对象即主题为中心集中信息资源
2、主题法类型:标题法、元词法、叙词法、关键词法
3、“物理文献索引”可以分解为物理、文献和检索三个元词,如果用叙词表示是物理文献检索。
4、元词是用来标引文献主题的、最基本的、字面上不能分的语词。
叙词是经过规范化处理的以基本概念为基础的表达文献主题的词或词组。
叙词之间主要有三种关系:等同关系、属分关系、相关关系。
5、等级关系符号:F分项指示符
S属向指示符
Z族首词符号
6、后组词:指以单元概念的语词形式入词表的词,即单词。
7、先组词:直接以复合概念的语词形式入词表的词,即词组,可以拆分。
P207
第九章
1、《汉表》的基本构成和辅助索引的基本类型,解释“轮排索引”为什么条目排序是双向排列法。
【答】:“主表、附表、范畴索引、词族索引、英汉对照索引”共分三卷十册。
范畴索引、词族索引、轮排索引
条目的排序采用双向排列法,即先按检索入口右侧汉字的拼音排列,右侧相同的主题词,则按检索入口左侧的汉字,从右向左排,以便可以通过靠近入口词部分的汉字的排列,集中相关条目,方便用户选择使用。
因为很多汉语拼音相同,为了避免误检,采用双向轮排法。
第十章
1、整体标引:是一种概括揭示信息资源基本主题内容的标引,亦称浅标引。
(名词解释)这种标引只揭示信息资源中具有检索价值的整体性主题,不揭示其涉及的各种从属性内容。
2、全面标引:是一种充分揭示信息资源论及的所有符合检索系统要求的主题概念的标引,亦称深标引。
3、对口标引:是一种揭示资源中适合专业需要的主题内容的标引,亦称重点标引。
4、综合标引:是一种以集合型信息资源的整体为单元进行的概括性标引。
5、分析标引
6、简述分类法和主题法的区别:
【答】(1)主题分析角度不同:分类标引侧重从学科、专业的角度组织体系;主题标引侧重标引对象的确切揭示。
(2)转换途径不同:分类法按类目之间的关系层层分析,顺序累层制;主题法以字顺系统为主要途径,直接从语词出发进行查找。
(3)标识不同:分类法的标识是分类号;主题法的结果是主题词
(4)揭示的特点不同:分类法对主题对象的揭示比较概括;主题法的对主题对象的揭示比较专指。
中图法采用分类标引,汉表采用主题标引。
7、分析主题时,我国国家标准提出了一个“分面公式”,请说明它是怎样把文献主题进行分解的?
【答】A主体因素(A1研究对象、A2材料、A3方法、A4过程、A5条件)
B通用因素
C空间因素
D时间因素
E文献类型因素
例:2011年中国神八飞船研究方案
D时间C空间A主体因素B通用E文献类型
中国80年代农田水利规程手册
C空间D时间A主体因素B通用E文献类型
8、主题概念转换的基本方式:直接转换,主体概念可以直接用词表上的一个叙词嫁衣表述;分解转换,分析出来的主题概念没有现成的主题词可供直接标引,需要将主题概念分解成简单主题概念:加联号、加职号、根据输出需要确定标题。
9、职能符号的使用:
符号职能
A动作对象
B部分
C性质
D操作
E施动者
例:美国对欧盟的农产品贸易
E美国A欧盟D农产品贸易
10、标题的确定:单一标题、复合标题---组配符号,(1)冒号“:”(2)短横“—”(3)逗号。
例:(1)生物学:物理学(生物物理学)
(2)矿物—化学成分(矿物化学成分)
(3)小说—语言学:美学(小说语言美学)
多级标题的拟定:计算机存储器生产工艺
直接标引:电子计算机—存储器—生产工艺
轮替法:存储器—电子计算机—生产工艺。