2信息组织(著录)
信 息 组 织
信息管理过程
1.4 网络信息组织的方式
1.搜索引擎方式 目前,搜索引擎是对因特网上二次信息进行组织的主要形式,其实质是一种报道、存储 网上一次信息的检索工具。搜索引擎一般利用被称做Robot(机器人)、Spider(蜘蛛)、 Worm(蠕虫)的自动代理软件,定期或不定期的在网上爬行,通过访问网络中公开区域 的每一个站点,对网络信息资源进行收集,然后利用索引软件对收集的信息进行自动标引, 创建一个详尽的可供用户进一步按关键词查询Web页面的索引数据库。这种数据库的内容 一般有标题、摘要或简短描述、关键词和URL,文件大小、语种以及词出现的频率和位置 等。这种方式所搜集的信息虽然丰富广博,但良莠不齐。
信息管理过程
1.3 信息组织的基本方法
2.信息描述方法 (1)文献信息著录 ① 使各国的文献著录项目及其排列顺序具有互换性,即实现文献著录的国际统一。 ② 克服语言障碍,使各国文献著录具有易识别性,即使不认识某种文字的读者,也能通 过标识符号系统,识别著录项目。 ③ 有助于将一般书目转换为机读目录形式。 (2)MARC格式 MARC(Machine Readable Catalogue),机器可读目录英文全称的首字母缩写,它 是计算机能够识别和阅读的一种目录,是美国国会图书馆提出的著名的机读目录发展计划。
信息管理过程
1.2 信息组织的原则
3.目的性原则 信息组织具有鲜明的目的性,必须围绕用户的信息需求开展工作,注意信息机构的目标 市场的需求状态及其变化特征。信息组织在一般情况下并不直接与用户联系,处于一般信 息管理流程的中间位置,但信息管理的一切环节都必须以“用户第一”为宗旨,信息传播 的效果在很大程度上由信息组织的水平决定。同时,从现代信息管理发展来看,信息组织、 信息检索和信息提供利用具有趋于融合的发展态势。因此,信息组织工作也必须积极开展 用户研究,充分了解用户需求,改进信息组织方式,使信息组织成果能极大地方便用户的 选择和利用。
作业:查询资料什么是著录和标引,并自行制作一份著录标引,可以是手工著录标引,也可以是机读著录标引。
作业:查询资料什么是著录,什么是标引,并自行制作一份著录标引,可以是手工著录标引,也可以是机读著录标引。
一.什么是著录1.定义在组织检索系统时,对具体信息的各种形式特征、内容特征及物质形态等进行分析、选择和记录的过程。
通常意义上讲的著录就是指,按照某种标准化的格式和要求(如MARC),对文献的某些被规定的特征进行描述(如责任者、题名、出版社等),形成一条一条的信息描述项,最后著录的结果就是一条关于该信息资源的书目数据记录。
2.著录的基本要求(1)准确化:著录的结果要全面、客观、准确地揭示信息资源的内容特征和形式特征;(2)规范化:要求信息著录坚持标准化著录原则,按照统一的著录项目、著录格式、标识符号等进行著录。
3.著录的作用揭示、组织、检索4.信息著录的标准(1)著录法:关于如何进行著录的具体规定和具体做法。
通常包括著录原则、适用范围、著录项目、著录格式、著录来源、著录文字、标识符号以及各个著录项目的具体细则规定。
(2)常用标准英-美编目条例第2版》(AACR2)、《国际标准书目著录》(International Standard Bibliographic Description)…中国的《文献著录总则》(GB3972.1-83)、《西文文献著录条例》、《连续出版物著录规则》(GB3792.3-85)…MARC、USMARC、CNMARC5.著录格式(1)普通图书卡片式款目著录格式正题名=并列题名:副题名及说明题名文字〔文献类型标识〕/第一责任者;其他责任者.·-版次及其它版本形式/与本版有关的责任者· -文献特殊细节·-出版发行地:出版发行者,出版发行日期(印刷地:印刷者,印刷日期)页数及卷册数:图;尺寸或开本+附件·-(丛编名/责任者,国际标准连续出版物编号;丛编编号·附属丛编)附注国际标准书号;中国标准书号(装订):获得方式提要Ⅰ. 题名Ⅱ.责任者Ⅲ. 主题词Ⅳ.分类号实例乱世佳人=Gone with the wind/(美)米切尔(Mitchell,M.著;黄怀仁,朱攸若译.·-杭州:浙江文艺出版社,1991.41034页;20cm本书另有译名:飘ISBN 7-5339-0367-6:¥10.70Ⅰ. 乱…Ⅱ. ①米…②Mitchell③黄…④朱…Ⅲ.长篇小说Ⅳ.I712.45(2)连续出版物卡片式款目著录格式正题名.分册标识,分册题名=并列题名.并列分册题名:其他题名信息/第一责任者,其他责任者.-版本.-卷期年月标识.-出版地:出版者,出版年.-文献数量;其他形态细节;尺寸+附件.-(丛刊题名;丛刊标识)出版周期附注其他题名分类号主题词ISSN=识别题名6.主要类型信息著录就是按照某种规则揭示某一信息资源的主要特征,给出信息资源的缩影。
信息组织_第三章信息描述
主办国 美 英 美 澳 芬 美 德 加 日本 意大利 美 中国
主办地点 俄亥俄州.都柏林 华瑞克大学 俄亥俄州.都柏林 堪培拉 赫尔辛基 华盛顿特区 法兰克福 渥太华 东京 佛罗伦萨 西雅图 上海
主办组织 OCLC/NCSA OCLC/UKOLIN OCLC/CNI OCLC/DSTC,NLA OCLC/NLF OCLC/TLC OCLC/ OCLC/NLC/IFLA NII/DCMI/JST DCMI/AIB/BNCF DCMI/UW/IIS/MS
一、信息描述的意义
3、信息描述的规范——网络信息资源的描述规范
近年来,网络信息资源的描述问题成为广泛关注的热点之 一。出版界、计算机界和书目文献界一起,结合电子环境 和技术的发展,共同创建了一系列新的描述规范,包括:
《文本编码倡议》(Text Encoded Initiative,简称TEl) 《都柏林核心集》(Dublin Core,简称DC) 《政府信息定位服务》(Government Information Locator Service, 简称GILS) 《联合地理数据委员会的数字地球空间元数据》(Content Standard Digital Geospatial Metadata,简称CSDGM) 《可视资源核心范畴》(Core Categories for Visual Resources,简称 CCVR) 《编码档案描述》(Encoded Archival Description,简称EDA) 《博物馆信息的计算机交换》(Computer Interchange Of Museum Information,简称CIMl)
二、信息资源描述项目、标识和描述级次
组织机构一览表
组织简称 OCLC UKOLIN CNI DSTC NLA NLC
信息组织——精选推荐
信息组织信息组织1、什么是⽂献的实体组织?⽂献的实体组织是将同⼀类⽂献及其著录和标引记录组成⼀个有序的系统。
如分类排架系统、分类⽬录、主题⽬录等。
2、什么是语法信息组织?语法信息组织是以信息的形式特征为依据组织信息的⽅法,如字顺组织法、代码组织法、地序组织法、时序组织法等。
3、什么是语义信息组织?语义信息组织是以信息内容或本质特征为依据组织信息的⽅法,如分类组织法、主题组织法。
4、什么是信息组织的⾃动组织?随着计算机技术在信息组织中的应⽤,计算机辅助编制和管理词表、⾃动分类、⾃动标引以及对⾃然语⾔的⾃动处理和理解等技术和⽅法得到了长⾜发展,并且已⾛出实验室进⼊实⽤技术阶段,国内外部都有了商业化的软件系统。
5、布利斯《书⽬分类法》的意义是什么?布利斯将其理论贯彻到其所编的《书⽬分类法》中,建⽴了《书⽬分类法》的理论基础。
这部著名的综合性分类法所确⽴的原则,如科学与教育上的⼀致原则、类⽬的从属原则、⼴泛设置交替类⽬原则、标记符号的综合原则、最⼤的使⽤效率原则等,⼴泛地包括了知识体系来源原则。
6、培根的知识分类体系对图书分类法有什么影响?中外古今的许多哲学家都有关于知识分类的思想,英国哲学家培根提出了完整的知识分类。
把全部知识分为记忆、想象和理性三个⽅⾯,即关于记忆的是历史,关于想象的是诗歌,关于理性的是哲学。
“历史—诗歌—哲学”构成了培根的知识⼤纲。
7、概念的内涵与外延是怎样的关系?概念是反映对象的⼀般属性和本质属性的思维形式。
它是思维的最基本单元,其内容是客观的,由词来表现,并具有民族特点。
概念的含义与适⽤的范围就是⼀个概念的内涵与外延。
明确概念实际上就是明确其内涵与外延。
概念的内涵与外延之间是互相依存⽽⼜互相制约的。
在⼀个概念中,当它的内涵扩⼤时,则它的外延就缩⼩;当它的内涵缩⼩时,则它的外延就扩⼤。
8、什么是概念的划分?概念的划分就是以事物的某种属性为分类标准,将⼀个属概念的外延划分成若⼲个种概念的⽅法。
信息组织知识点汇总
知识点汇总第一章1、信息组织的定义以用户需求为导向,依据信息体自身的属性特征,信息工作者或用户按照一定的原则、方法和技术,将杂乱无章的信息整理成为有序的信息集合的活动和过程.2、信息组织的原理基本原理:如果有若干自然状态的无序信息资料,将这些信息资料按照某种属性特征排列成一个序列,并且需要使用信息资料的用户能将自己的需求转换成相应的信息资料属性特征,并在排列后的信息资料序列中找到自己所需要的信息资料。
信息组织由信息著录标引(信息描述揭示)和信息序化两个工作环节组成。
3、信息组织的内容一般而言,信息组织包括四项内容。
1。
信息筛选(甄别有用信息,剔除无用信息)2.信息分析(对信息的内外部特征进行细化、挖掘、加工整理并归类)3.信息描述与揭示(对信息资源的部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录的过程)4。
信息整序与存储(按照一定的格式和顺序存储在特定的载体中)4、信息组织的类型按信息的认识层次划分,信息组织有三种类型1.语法信息组织(研究语言符号之间的形式范畴的结构规则,如:字顺法、代码法、地序法、时序法)2.语义信息组织(研究信息的内容特征的组织方法,如:分类法、主题法)3。
语用信息组织(研究环境与使用者的不同而不断变化的信息群,如:权重值信息组织法、概率组织法)5信息组织的作用控制整序提升品质传播利用节约成本第二章1、熵(entropy)最早是热力学上的一个符号,是一种测量在动力学方面不能做功的能量综述。
熵指的是混乱的程度,负熵是物质系统有序化、组织化、复杂化状态的一种量度。
香农第一次将“熵”引入到信息论中,在信息论中,“熵”可以用作某件事不确定度的量度.信息量越大,体系结构越规则,功能越完善,熵就越小.利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储等活动。
学术界目前普遍接受的观点是“信息即负熵”。
2、逻辑学原理在信息组织中的应用概念之间的关系(图略):相容关系同一关系:是指有相同外延的两个概念之间的关系。
信息著录法
1999年美国与加拿大MARC排除相异性联合推出 MARC21。2001年大英图书馆也宣布采用 MARC21。 由于各国不同的机读编目格式造成书目记录共享障 碍,为了方便不同格式之间的数据转换,国际图联 (IFLA)在1977年推出UNIБайду номын сангаасARC: Universal MARC Format格式。
UNIMARC完全符合国际标准ISO2709的各项规 定,分为头标区、目次区、数据区三个区。 UNIMARC基本保持了MARCII的结构,项目设 置与内容安排大部分相同,通过改进,可容纳各种 类型文献,作为国际机读书目数据交换格式为多国 使用。
CNMARC是中国机读目录(China MachineReadable),用于中国国家书目机构同其他国家 书目机构及中国国内图书馆与情报部门之间,以标 准的计算机可读形式交换书目信息。
著录——指在编制文献目录时,对文献内容和形 式特征进行分析、选择和记录的过程。 文献信息编目工作主要可以分为两大步骤:第一 步是文献信息著录,第二步是目录组织。著录是 编目工作的基础,目录的质量在很大程度上由著 录的质量决定。 款目——指依据一定的规则和方法,对文献特征 与编目业务信息所做的记录。 其表现形式是反映文献内容特征和形式特征的著 录项目的组合,包括描述项目、检索点(标目)、 编目业务注记三部分信息。款目是组成传统目录 的基本要素。
· 传统著录法
传统著录法是相对于MARC(机读目录)著录法 和元数据(DC等)著录法而言的,是指按照《国 际标准书目著录》(ISBD)等标准和规则的要 求统一进行规范化的著录,著录方式是手工操作 或利用计算机进行分项著录,形成规范的卡片目 录,然后由手工编排各款目的著录法。 传统著录法的原理对于理解MARC著录法和以 DC为代表的元数据著录法有着很重要的意义。
【精品】2、信息组织(分类法)
1、自始自终贯穿科学分类的思想,集中体现学科的系统性,反映事物之间的从属关系。2、分类结构显示直观,易于把握,便于使用。3、类目体系展开比较系统,并可以根据实际需要对类目的等级进行适当调整。4、标记简明,适合于分类排架。
等级列举式分类法的不足:
揭示专门主题能力差,不能充分揭示信息资源中大量存在的细小专深的主题;类表具有一定的凝固性,不便根据需要调整,难以与科学发展保持同步;大型列表一般篇幅较大,对列表的管理要求高。
(标记制度之)层累制
用类号的位数来反映类目的级别及其关系。类号位数越少,级别越高,反之越低。例:以《中图法》为例:Q 生物科学Q1 普通生物学Q17 水生生物学Q178 水生生物生态学和地理学Q178、5 水文分布Q178、53 海洋生物Q178、535 海底
《总目》著录图书一万余种,基本上包括了乾隆以前的中国古代的重要著作。“四分法”体系更臻完善,极大地影响了后世目录编撰的方法,几乎成为全国统一的图书分类体系。
四分法:经、史、子、集
经部十类——(易、书、诗、礼、春秋、孝经、五经总义、四书、乐、小学)史部十五类——(正史、编年、纪事本末、别史、集史、诏令奏议、传记、史钞、载记、时令、地理、职官、政书、目录、史评)子部十四类——(儒家、兵家、法家、农家、医家、天文算法、术数、艺术、谱录、杂家、类书、小说家、释家、道家)集部五类——(楚词、别集、总集、诗文评、词曲)
信息分类组织的目的
将各个领域有关的信息(概念、事实、数据、信息记录、信息实体)按照一定的特征(内容、形式、功能、用途)分门别类地加以聚合或区分,以便于系统化的识别、检索、利用。
文献的分类
文献分类是指根据文献的学科属性或其他特征,将各种文献分门别类地、系统地加以组织和揭示的方法。文献分类方法是一种规范化、理论和技术都比较成熟的信息组织活动。网络信息的分类是一种综合性的信息分类,它在传统的文献分类的基础上,也吸收了事物分类的方法。
信息组织-第一章
• (6) 各种类型类表、词表研究。包括各种综 合性类表、词表研究,专业性类表、词表 研究等;
• (7) 标引理论与技术的研究。包括各种标引 方式、类型研究以及各种文献、主题类型 标引方法的研究等;
26
• (8)信息检索工具研究.。包括各种手工检索 系统、机械检索系统的构成、技术方法等 的研究;
• (9) 计算机技术在信息整序领域应用的研究 包括词表的自动编制、自动赋词标引等研 究;
– a.信息描述规范 – b.检索语言
24
• 1.2.2信息组织研究对象
– 根据上面的分析,信息组织领域的研究对象, 或者说研究领域,一般包括以下基本内容:
• (1) 信息组织基本理论方法的研究。包括信 息组织的基本任务、要求、方法的研究; 描述控制、词汇控制、句法控制研究;相 关知识门类如知识分类、概念逻辑、语言 学等与信息组织关系的研究;
– 理论层面主要研究信息组织的基本规律和理论基础,为 规范层面和方法层面提供理论依据,指导信息组织的操 作和实施;
– 规范层面主要通过描述规范、检索语言的建立,为信息 组织的操作提供实施的规范和依据。使用它,可以按照 规定的方式,一致、有效地进行描述和标引,是进行信 息组织必须共同遵守的规范;
– 方法层面包括操作的技术方法、信息组织的管理、标引 规则、描述规则等,是实现信息资源组织的具体技术方 法,其作用是按照信息资源组织的要求进行操作、实现 信息资源系统的组织。
不仅告诉人们有 什么信息,而且 告诉人们怎样找
到信息。
从最完整意义上实现 了整序信息、科学分 流、促进选择、保证 利用的组织职能。 30
• 这三个阶段主要与古代信息管理时期、近代信息 管理时期和现代信息管理时期相对应。
《信息组织》复习要点
第一章一、名词解释1、文献:是用一定的技术手段把一定的信息内容记录到一定载体上形成的存储型传递媒体。
2、著录:对表示文献内容、外表形式和物质形态的特征进行分析、选择和记录的过程。
标引:指在分析文献内容和情报提问的基础上,用某种索引语言或标志符号把文献的主题概念及其他有检索意义的特征标示出来,作为情报存储和检索依据的处理过程。
按照索引语言或标示符号的类型,可分为分类标引,主题标引和非主题标引。
3、款目:依据一定的方法,对表示文献内容,外表形式和物质形态的特征所做出的记录。
4、信息组织的必要性即为什么要学习信息组织?a.知识和信息的海量新和无限性与人的精力和时间的有限性形成了尖锐的矛盾;b.知识和信息的无序性和污染性与人类使用的选择性也形成了尖锐的矛盾;c.越来越多的人意识到,“原始信息本身并不能产生价值” ,只有对信息资源采用相应的方法加以控制和处理才能使人们实现对其合理开发和有效利用,而信息组织则是解决这一问题的根本方法和关键措施之一;d.深入研究与解决关于信息组织的系列问题是十分必要的。
5、信息组织(信息序化或信息整理):利用一定的科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
6、信息组织的基本专业要求是?a.信息内容有序化;b.信息流向明确化;c.信息流速适度化。
7、耗散结构论是比利时学者普里高津提出来的;协同论是德国物理学教授海尔曼. 哈肯提出来的。
知识理论——H.E. 布里斯提出来的。
知识组织可分为主观知识的组织和客观知识组织两种类型。
8、专指度:是指我们在信息揭示的主题标引中对信息中各个主题的内容和方面的展示过程。
9、按照信息组织的组织对象把信息组织分为信息资源组织和检索工具;依据信息组资源的注意内容,主要分为分类法和主题法。
第二章1、七分法是我国出现最早的一部图书分类体系,始创于汉代的《七略》,后现于南朝的《七志》和梁朝的《七录》。
档案著录标识符和格式_信息组织_[共2页]
第九章档案著录与立卷档案著录就是在编制档案目录时,对档案的内容和形式特征进行分析、选择和记录的过程。
档案著录项目就是揭示档案内容和形式特征的记录事项,包括题名与责任说明项、稿本与文种项、密级与保管期限项、时间项、载体形态项、附注与提要项、排检与编号项。
著录格式就是著录项目在条目中的排列顺序及其表达方式,档案目录是按照一定的次序编排而成的条目汇集,是档案管理、检索和报道的工具。
著录信息来源于被著录的档案,单份或一组文件著录时主要依据是文头和文尾,一个或一组案卷著录时主要依据是案卷封面、卷内文件目录、备考表等,被著录档案本身信息不足时,要参考其他有关的档案资料。
档案著录一般需要审读档案、阅读题名和浏览全文。
通过审读档案,了解和判断档案所反映的中心内容和其他主题因素。
文件和案卷的题名是对档案内容的概括。
在题名准确反映档案中心内容的情况下,阅读题名是分析、提炼主题的一条捷径,但题名不能作为提炼主题概念唯一的依据。
在档案无题名或题名不能全面、准确地反映档案主题时应浏览全文。
浏览全文应注重了解题名未能反映的主题和深层次主题,发掘隐含主题。
浏览全文重点是阅读全文的开头、结束语、段落题名,必要时阅读批语、摘要、简介、目次、图表、备考表等内容。
第一节档案著录标识符和格式档案著录用文字必须规范化,汉字应使用规范化的简化汉字,外文与少数民族文字应依照其文字规则书写。
文件编号项、时间项、载体形态项、排检与编号项中的数字应使用阿拉伯数字。
图形及符号应照录,无法照录的可改为其他形式的相应内容,并加“[ ]”号。
一、著录用标识符著录用标识符用来识别各著录项目、单元及其内容。
.—置于稿本与文种项、密级与保管期限项、时间项、载体形态项、附注项著录项之前。
= 置于并列题名之前。
: 置于x 201 x。
信息组织知识点
信息组织1.信息组织:根据信息检索的需要,以各种类型的信息资源为对象,运用适宜的工具和方法,依据一定的标准和规则,通过对信息外在特征和内容特征的表征和排序,实现无序信息流向有序信息流的转换,从而使信息集合达到科学组合,保证用户对信息的有效获取和利用。
2.信息组织的层次:有序化、优化(重组)3.信息组织的功能:基本功能:全面揭示和再现信息的外在特征和内容特征,科学反映和描述信息的特色。
增值优化功能:信息单元、数据依据逻辑方法再现和重组的过程是一个序化增值过程。
目标功能:减少信息间的相互干扰,控制信息的运动方向,有效地将信息组织起来,形成一定的成果。
社会功能:通过信息合理而规范的组织,能有效控制信息流向,从而实现一定的社会目标。
4.信息组织的要求:内容有序化、流向明确化、流速适度化、数量精简化、质量最优化5.信息组织方法:1. 以信息资源的外部特征为检索依据,提供从资源外在形式进行检索的途径。
描述法(著录、编目)2. 以表达信息资源主题内容的标识为依据,提供从资源内容角度进行检索的途径。
分类法和主体法6.信息组织的内容:(按活动类型分)信息选择、信息分析、信息描述和揭示、信息储存(按层次分)描述报道、有序化并控制、揭示开发、浓缩增值、聚集重组7.信息组织的成果:目录、索引、数据库、搜索引擎8.目录:著录一批相关的文献,按一定的次序编排而成的一种登记、报道和宣传文献实体和虚拟信息的检索工具。
包括文献收藏目录和书目9.索引:索引是将原始文献中某些重要的或有意义的信息,如书名、刊名、篇名、主题、人名、地名等分别摘录出来,进行标引,再按一定方式编排,并注明出处,以供检索的工具。
信息组织描述法1.2.信息描述:根据信息组织的目的和信息检索的要求,按照一定的信息管理规则和技术标准,将存在于某一物理载体上的信息资源的形式特征和部分内容特征进行全面描述并给予记录的过程。
3.描述性编目(Descriptive Cataloguing):是对文献的外部特征进行识别、分析、选择,并予以记录成为款目,继而将款目按一定顺序组织成为目录或书目的过程。
信息组织学
6
精选2021版课件
(2)SGML(通用标记语言及相关标准) 是一种关于电子文献格式描述的计算机语言。此
处的“文献”包括一切电子格式的文档。SGML从 结构和内容提供了描述文献的格式,其核心是文 献类型定义DTD。
SGML规模庞大,功能丰富,具有各种选项,用其 标记文献使文献不依赖特定的软硬件,具有方便 的可互操作性和格式的可转换功能,以适合多种 应用或反复使用的目的。 (3)HTML(超文本标记语言)
5
精选2021版课件
(1)ISBDs(国际标准书目著录规则) 对信息的描述规定了统一的描述格式、内容、符号,其
核心是统一描述内容。其描述内容包括八大项: 1)题名与责任者项。 2)版本项。 3)文献特殊细节项。 4)出版发行项。 5)载体形态描述项。 6)丛编项。 7)附注项。 8)文献标准号与获得方式项。 9)提要项(中文文献书目描述所加)。
HTML是SGML的一种简化应用,是目前Web在 Internet上使用的出版语言,其主要功能是发布、 获取、交流信息。
7
精选2021版课件
(4)XML(可扩展标记语言) XML是SGML在Web应用服务上的一个重要分支,
它是一种元标记语言,可提供描述结构化资料的 格式,它避免了SGML的繁琐但仍保持其威力,同 时也克服了HTML因过于简单而给网络信息应用带 来的不便。其优点有简洁、开放、可扩充、国际 共享等。 (5)Metadata(元数据)(重点)
专用平台,不能跨平台使用;MARC描述内容仅局限与文 献书目数据,不适应多媒体格式信息;MARC仅局限于数 据描述部分,其他相关数据的管理信息较少。
2.2.2 元数据的基本含义 最常见的:元数据是关于数据的数据。 哈佛大学数字图书馆项目:元数据是帮助查找、存 取、 使用和管理信息资源的信息。 美国图书馆协会编目、描述和存取委员会:元数据 是结构、编码数据,描述信息款项的特征,辅助描述数 据的标识、发现、评估和管理。
信息组织知识点汇总教程文件
信息组织知识点汇总知识点汇总第一章1、信息组织的定义以用户需求为导向,依据信息体自身的属性特征,信息工作者或用户按照一定的原则、方法和技术,将杂乱无章的信息整理成为有序的信息集合的活动和过程。
2、信息组织的原理基本原理:如果有若干自然状态的无序信息资料,将这些信息资料按照某种属性特征排列成一个序列,并且需要使用信息资料的用户能将自己的需求转换成相应的信息资料属性特征,并在排列后的信息资料序列中找到自己所需要的信息资料。
信息组织由信息著录标引(信息描述揭示)和信息序化两个工作环节组成。
3、信息组织的内容一般而言,信息组织包括四项内容。
1.信息筛选(甄别有用信息,剔除无用信息)2.信息分析(对信息的内外部特征进行细化、挖掘、加工整理并归类)3.信息描述与揭示(对信息资源的部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录的过程)4.信息整序与存储(按照一定的格式和顺序存储在特定的载体中)4、信息组织的类型按信息的认识层次划分,信息组织有三种类型1.语法信息组织(研究语言符号之间的形式范畴的结构规则,如:字顺法、代码法、地序法、时序法)2.语义信息组织(研究信息的内容特征的组织方法,如:分类法、主题法)3.语用信息组织(研究环境与使用者的不同而不断变化的信息群,如:权重值信息组织法、概率组织法)5信息组织的作用控制整序提升品质传播利用节约成本第二章1、熵(entropy)最早是热力学上的一个符号,是一种测量在动力学方面不能做功的能量综述。
熵指的是混乱的程度,负熵是物质系统有序化、组织化、复杂化状态的一种量度。
香农第一次将“熵”引入到信息论中,在信息论中,“熵”可以用作某件事不确定度的量度。
信息量越大,体系结构越规则,功能越完善,熵就越小。
利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储等活动。
学术界目前普遍接受的观点是“信息即负熵”。
2、逻辑学原理在信息组织中的应用概念之间的关系(图略):相容关系同一关系:是指有相同外延的两个概念之间的关系。
信息著录与信息标引
信息著录与信息标引一、什么是信息著录1、定义。
“文献是记录有知识的一切载体。
著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。
著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。
”通常意义上讲的著录就是指,按照某种标准化的格式和要求(如MARC),对文献的某些被规定的特征进行描述(如责任者、题名、出版社等),形成一条一条的信息描述项,最后著录的结果就是一条关于该信息资源的书目数据记录。
2.主要类型。
信息著录就是按照某种规则揭示某一信息资源的主要特征,给出信息资源的缩影。
因此对所有的信息资源类型都可以进行著录。
录音资料、电影与录像资料、微缩品、测绘制图资料、电子资源都可以进行著录,但最早也是最普遍的著录形式还是纸质书籍的著录。
3、信息著录的主要方式。
以图书的著录为例。
为了更好的实现信息资源的共享,著录时通常是遵循统一的格式,如,最常见的MARC。
MARC会给出所要著录的款目、使用的符号和代码、著录的格式、著录款目的顺序以及特殊情况下的处理方式(如多责任者、多语种、信息不详、信息明显错误等)。
编目人员要做的就是按照规定,使用受控的语言,逐条填写个款目的内容。
(当然有些款目是不必要填写的,也有相应规定。
)图一、图二给出了MARC工作界面的截图和一条完成的书目记录。
二、信息著录的意义。
1、信息组织的意义。
信息著录是信息组织的一种具体的方法,信息组织实现的意义也就是其所有具体方法的意义,当然也包括信息著录。
信息组织是使无序信息有序化的过程,起最终目的是使主体(人)能够“更好”的利用信息。
这里的“更好”包括更加方便、快捷的检索信息、准确定位所需的特定信息、获得最有价值的信息等,这些也都是信息著录可以实现的效果。
2、信息著录本身的意义。
除了信息著录作为信息组织的具体方式而具有的普遍的意义,它作为一种区别于其他信息组织方式的具体的方法,同时具有它本身的特殊功能。
信息著录所要解决的问题是揭示某一信息整体的、完整的、概要的特征,既包括外在的信息载体的特征的揭示,也包括内在的信息内容特征的揭示。
第三章 信息著录和标引
三、自动分类 自动分类是指由计算机系统自动提取 信息的特征项,依据一定的算法,将信息 按内容或属性归到一个或多个类别的过程。 主要包括自动归类和自动聚类两个部分。
(一)自动归类 1981年,侯汉清从计算机管理分类表、 1981年,侯汉清从计算机管理分类表、 计算机分类检索、计算机自动分类、机编 分类表四个方面探讨了自动归类的问题, 拉开了我国关于自动归类研究的序幕。
二、信息著录的标准 (一)信息著录标准的发展 信息著录标准一直受到信息工作者的 重视,世界各国都为信息著录标准的编制 和推广付出了多年的努力和积极的探索。
(二)《文献著录总则》 (二)《文献著录总则》 1.著录项目 1.著录项目 2.著录级次 2.著录级次 3.著录格式 3.著录格式
第二节 机读目录与元数据
(二)各种类型主题文献的分类标引规则 1.单主题文献的分类标引方法 1.单主题文献的分类标引方法 2.多主题文献的分类标引 2.多主题文献的分类标引 3.相关关系主题文献的分类标引 3.相关关系主题文献的分类标引
二、主题标引 主题标引指依据一定的主题词表,对 文献的内容先进行主题分析,并赋予文献 语词标识的过程。目前,国内主要采用 《汉语主题词表》及其相关的专业词表进 汉语主题词表》 行主题标引。
第三章 信息著录和标引
第一节 信息著录的含义和标准 一、信息著录的含义和作用 (一)信息著录的含义 信息著录简称著录,是指在组织检索 系统时对文献内容和形式特征进行选择和 记录的过程。信息著录是组织检索系统的 基础,是信息存储过程中的一个重要环节。
(二)信息著录的作用 1.信息著录是揭示文献内容特征及相关信息的 1.信息著录是揭示文献内容特征及相关信息的 有效方法 2.信息著录是编制目录和建立数据库的基础 2.信息著录是编制目录和建立数据库的基础 3.信息著录结果是信息检索的主要依据 3.信息著录结果是信息检索的主要依据
信息的检索第三章信息的著录和标引
实用标准文案第三章信息著录和标引信息著录的含义和标准3.1信息著录的含义一、信息著录:简称著录,指在组织检索系统时对文献内容和形式特征进行选择和记录的过程。
著录对象是信息,著录结果是款目或记录。
款目:指依据一定的标准方法,对一种文献或信息源的内容价值物质形态进行描述而形成的一条记录。
款目由一条条著录项目组成。
著录项目:用于揭示文献内容和形式特征的记录事项。
信息著录的基本要求:①准确性。
要求著录结果准确全面客观的揭示文献或其它信息源的内容特征或形式特征②规范化。
要求信息著录坚持标准化原则,按照统一的著录项目,著录格式,标识符号进行著录。
信息著录的作用二、1、揭示功能:信息著录主要反映的是文献本身的特征,通过对文献全面系统的分析,揭示出其内容特征和形式特征,将其浓缩于只言片语中,从而表达文献的基本信息。
2、组织功能:信息著录后形成的款目或记录,是编制目录的基础,也是组织数据库数据的基本单元。
文献编目包括信息著录和目录组织两步。
信息著录是对文献内容特征形式特征进行选择记录后形成款目或记录。
目录组织是将这些款目或记录按照一定组织规则编排在一起最终形成检索工具或数据库。
3、检索功能:存储是检索的第一个阶段,即将表达文献特征的有检索意义的标识通过记录组织成手工检索工具或计算机数据库,而表达文献特征的标识需要通过著录和标引来完成。
作为信息著录结果的款目或记录,记载了表达文献特征的各种标识。
精彩文档.实用标准文案信息著录的标准三、《文献著录总则》旨在根据各种类型文献的共同特点,确定文献著录原则、内容、标识符号、格式等的统一规定。
具有指导作用为信息著录提供原则性框架,并不作为文献著录的直接依据。
1、著录项目:①题名与责任者项②版本项③文献特殊细节项④出版发行项⑤载体形态项⑥丛编项⑦附注项⑧文献标准编号及有关记载项⑨提要项2、著录级次:著录文献的详简程度,分为三级:①简要级次,款目仅著录主要项目②基本级次,著录主要项目同时还著录部分选择项目③详细级次,著录全部主要项目和全部选择项目。
信息组织复习题及参考答案
结构体系:从宏观上看,体系分类法的结构体系包括分类表(也称类目表)、编制和使用的说明、索引(类表辅助工具,常见类型有直接索引、相关索引、链式索引和叙词索引):从微观上看,类目是构成分类法的最基本要素,每个类目代表具有某种共同属性的文献集合:一个类目由类号、类名、类级、注释和参照组成的。
2-2比较体系分类法和组配分类法各自的特点。
语言学(要把庞杂分散的信息组织成有序优化的整体,就必须建立符号系统)、逻辑学(信息组织是一种思维活动,它必须遵循科学的思维方法才能保证信息组织的序化质量)、知识分类学(信息组织以知识分类为基础,可以较好地揭示各个知识领域之间的关系和规律性)是信息组织的方法基础。
1-4信息组织研究的主要内容是什么?
信息组织学是关于信息组织的一整套理论、方法与技术的科学。它研究的主要内容有信息的采集、识别、描述、标引、整合、整序存储和利用。
5-1什么是Dublin Core元数据?基本DC与限定DC的区别在哪里?
都柏林核心(简称DC)的研究是一项跨国家、跨学科的研究活动,其根本目的在于促进资源发现。DC元数据就是该研究项目关于元数据方案所取得的一系列成果,是一个简单的用户可扩展的元数据体系。区别:基本DC只有15个,只能对信息资源做一些简单的、基本的描述;而限定DC有较多的扩充,能比较精确地描述信心资源。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、计算机编目:
计算机编目有许多类型,到目前使用时间最长的为机读编目 格式(Machine Readable Cataloging Format,简称MARC), 是根据文献特点和文献机构之间交换的需要建立的标准化 的计算机可读形式。
MARC格式:
纪传体史书——
东汉班固的《汉书》以纪传体的体例首开断代史的先河。 西汉司马迁的《史记》首次以纪传体的体例记载了从传说
中的黄帝至汉武帝3000余年的历史。
纪传体:
司马迁创造了“纪传体”的。 不同于以往编年史、国别史。 纪传体有五种不同的体例,包括:
表、纪、书、世家、列传, 其中以纪和列传为主体,故称纪传体。 全书分十二本纪、十表、八书、三十世家、七十列传。
并列丛书名 丛编责任者 国际标准连续出版物编号 丛编编号
附注项 文献标准编号及有关记载 提要项 标识项
国际标准文献编号 中国文献标准编号
分类号 主题词
描述的符号和文字:著录项目标识符又称前置符,置
于著录项目前,依次为:
._ = :
/ ; , + //
各大项符号 并列题名、并列丛书名 副题名及说明题名文字、出版者或发行者、图书及其他形态、副 丛编名、价格 第一责任者 不同著作方式的说明、第二出版地或发行地、尺寸、丛编编号 分辑(卷)次、附属丛编 附件 析出文献的出处
“目录”
“目录”一词,起源于汉代,且“目”与“录”各有其含义。 “目”仅指篇名或书名,“录”却既指篇名或书名,也包括对 篇名或书名的叙录说明文字。
“目录”原本指篇名或书名以及对作者事迹、写作过程、校勘 情况、学术价值等的说明文字。
后来将“目”(仅篇名或书名)泛称“目录”。
目录学
将目录称为学,始于北宋。
刘向(公元前77年-前6年)——《别录》,我国第一部图书目录。 二十卷,汉刘向撰。成书于西汉末年。
刘歆(公元前53年-公元23年)——《七略》世界上第一个图书分 类目录。成书于西汉末年,它比1545年西方“目录学”之父德 国的吉士纳的《万象图书分类法》还早1571年。
《史记》记载:“汉兴,肖何次律令,韩信申军法,
MARC格式是指定的计算机可读目录数据标准交换格式,20世 纪60年代末70年代初在北美首先应用。推动了图书馆进入自动 化阶段。MARC在世界范围使用广泛,产生了许多不同的版本, 如:
美国的USMARC 英国的UKMARC 欧洲的UNIMARC 中国的CNMARC等。
著录的详略级次:按著录的详略程度,把著录项目分为三级
1、记录全部项目,称为详细级次。可提供文献的全部书目信 息,适合于国家书目的编制。
拓扑学的首要概念:线段、曲线、圆周与圆片的映射的几何学 / (美)陈锡居(Chinn,W.G.),(美)斯廷路德(STEENROD,N.E)
著;蒋首方,江泽涵译.上海:上海科学技术出版社,1984.3 196页;32开 书名原文:First concept of topoloqy 0.88元 1.拓……2.①陈….②斯….③蒋….④江…3.4.O189
构成了极高目录学价值的国家藏书提要目录。 《汉书•艺文志》记载刘向校书:“每一书已,向辄条其篇目,撮其指意,录而
奏之。”
叙录体
刘向始创的叙录体目录体例,在1900多年前就已达到很
高水平。 叙录(又称解题、提要,始于刘向),列于书名之后,用
以揭示图书内容主旨、价值得失、介绍作者生平、学术源 流、以及该书的版本、校勘、流传情况。
传录体、辑录体
传录体目录:始于南朝宋、齐时王俭的私家目录(南北朝,宋,公元420年-479
年;南齐公元480-公元502年)《七志》。
偏重作者传记而不述图书的内容主旨。
辑录体目录:以元代马瑞临《文献通考•经籍考》为代表。辑录体目录在
体制结构上分为序言、书名、作者、卷数、提要、按语和自注等项目, 其中提要是最具特色的部分,其提要不是编目者本人的语言,而是辑引 原书序跋和他人评论来完成对书目的评介。这种全新的解题方式最大限 度地保存了书目资料的原貌,具有很高的文献学价值和学术意义。
一、目录: 产生于文献的大量积累和人们对文献的需
求
早在殷商时代(公元前15~前12世纪),已经有了大量的文献。据考 古发现,河南安阳小屯村等地出土甲骨文16万片之多,而 且排列有一定顺序。
周代掌管文献的史官有明确分工,如“外史”“掌四方之 志,掌三皇五帝之书,掌达书名于四方”,这说明周代时 已有登记和通报文献的目录工作。
1976年,出版了国际标准书目著录总则。
1978年,根据国际编目标准调整的英美编目条例(AACR2)出版。
1983年,我国正式发表《文献著录总则》,其后,出版了
各个分册,包括:
《普通图书著录规则》
《连续出版物著录规则》
《非书资料著录规则》
《地图资料著录规则》
《档案著录规则》
《古籍著录规则》
《检索期刊条目著录规则》
《文后参考文献著录规则》
信息描述项目
信息描述项目是用以揭示文献内容和特征的记录事 项,也称著录项目。著录项目一般应能根据信息资 源的特点和信息组织的需要,有效地揭示信息资源 基本特征。
描述项目可分为: 基本描述项目 描述子项目
基本描述项目
一个描述记录由若干大项组成,一个大项又可以划分出若 干小项,组成一个系统的、完备的描述结构。
二、信息的控制
2、3 著录
一、信息的著录
亦称信息资源描述,是指根据信息组织和检索的需 要,对信息资源的主要内容、形式特征、物质形 态等进行分析、选择、记录的活动。
信息描述在传统的文献检索系统的中称文 献著录或书目著录。
信息描述的结果是描述记录,又称元数据, 可以用来作为信息资源的代替物组织检索 系统。
我国国家标准《文献著录总则》规定的基本描述项目有9 个大类,依次为:
1、题名和责任者项 2、版本项 3、文献特殊细节项(连续出版物、地图等) 4、出版发行项 5、载体形态项 6、丛编项 7、附注项 8、文献标准编号及有关记载项 9、提要项
描述子项目——
为了准确揭示信息资源的特点,在基本项目下设置子项目加细描述。
张苍为章程,叔孙通定礼仪。”这是秦火之后,国家 整理古籍最早的记录。基本上是对军事书籍的整理。
汉高祖刘邦(公元前206年-前195年)统一中国后,“与民休 息”,使生产力水平得到极大的提高,文化空前繁荣。刘 邦下令“大收篇籍,广开献书之路”。
汉武帝时(公元前124年)下令“建藏书之策,置写书之 官,下及诸子传说,皆充密府”。结果是“百年之间,书 积如丘山”。
《七略》创立的书目七分法体系,影响着后来历代封建王 朝官修目录的发展。
《七略》的类目体系
辑略(目录的总说明) 六艺略 :易 书 诗 礼 乐 春秋 论语 孝经 小学 诸子略: 儒家 道家 阴阳家 法家 名家 墨家 纵横家
杂家 农家 小说家 诗赋略:屈原赋之属 陆贾赋之属 孙卿赋之属 杂赋 歌诗 兵书略:兵权谋 兵形势 兵阴阳 兵技巧 数术略:天文 历谱 五行 蓍龟 杂占 形法(根据山川宫室的形势及人畜器
基本级次:记录主要项目的同时,记录部分选择项目,称为基本级
次,是文献单位实践中最常用的级次。
拓扑学的首要概念:线段、曲线、圆周与圆片的映射的几何学 / (美)陈锡居(Chinn,W.G.),(美)斯廷路
(STEENROD,N.E.)著;上海:上海科学技术出版,1984.3 196页;32开 0.88元
1.拓……2.①陈….②斯….③蒋….④江…3.4.O189
简要级次:仅记录主要项目的称为简要级次,一般为小型文献单位
或编制书本式目录使用。
拓扑学的首要概念:线段、曲线、圆周与圆片的映射的 几何学 / (美)陈锡居(Chinn,W.G.), 等著.上
海:上海科学技术出版社, 1984.3 196页;32开 0.88元
汉成帝和平三年(公元前26年),鉴于当时图书典藏不善,多有散佚,朝廷 命刘向等人校书。刘向校书——
首先—— 广罗异本,以相校雠,不拘一家,择善而从; 其次—— 整理错乱,除去重复,互相补充,定著篇章; 然后—— 条别篇章,定考目次,写定正本,最后命定书名。 在定本奏给皇上之前,刘向将每本书的叙录另抄一份,集中一起,名之《别录》,
共130篇,526500字。
十二本纪叙述了以帝王为中心的各时期的历史大事(纵)。 列传,记汉武帝以前重要的历史人物(横)。 纪与传构成了《史记》的经纬。 此后,每一旧王朝灭亡,就有史家以纪传体的形式为之修史。
这种以君王传记为纲的纪传体史书,称为“正史”。
1921年,北洋政府大总统徐世昌下令把清朝遗老柯劭忞所 著的《新元史》例为正史,合称“二十五史”。后来人们 又加上了民国初年官修的《清史稿》,称为“二十六史”。
长期以来,人们经过探索,建立了一系列信息描述规范和标 准,其中以书目文献领域描述标准化的努力最为典型。
文献描述标准
也称文献著录标准。形成于20世纪70年代,是随着 计算机在文献领域中的应用而逐步发展起来的。 为了促进各国信息资源的交流和互换,国际文献 界于70年代开始进行国际标准书目著录的研究。
1971年,国际图书馆协会联合会编目委员会颁布了单行著作国 际标准著录准则,之后又推出了丛书、乐谱、地图、非书资料 等书目的描述标准。
的异同) 4、提要钩玄,治学涉径之学也(指导读书)
二、信息描述的演化过程
书本式目录 卡片式目录 机读目录 元数据
XML可扩展标记语言
2、卡片目录
发明于100多年前。对文献资源的组织和揭示起到 了很大的作用。
卡片目录
传统的目录由一张张反映文献特征的卡片组成,最早的著录方 法为五段空格法:
分类号 题名 著者 出版者 主题
四种款目,组织相应的检索目录。
标目——即检索点,是记录中用来作为排检依据的资源特征。 标目的作用—— 1、决定款目的性质,供组织相应的检索工具使用。 2,作为排检的依据,确定一款目在检索系统中的位置,供检索查