文化信息资源的组织讲义
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.网络信息资源的组织
➢ 数据库方式
数据库组织方式:是将所有已获得的网络信息资源以固定的记录 格式存贮,用户通过关键词及其组配查询,就可以找到所需要的 信息线索(即相关站点链接),并通过信息线索直接链接到相应 的网络信息资源。
输入检索式
结构化查询
客户端
检索结果
服务器
检索结果
数据库
3.网络信息资源的组织
➢ 超媒体技术:
是超文本技术与多媒体技术的结合,它将文字、图像、声音、视频 等多媒体信息以超文本的方式组织起来,用户通过高度超级链接 的网络结构在各种信息库中航行,从而找到所需要的信息。
线性文本 引入网络结构
加大表现力
多媒体 引入网络结构
超文本
加大表现力
超媒体
3.网络信息资源的组织
➢ 优点:
✓ (1)是网络信息组织未来的发展方向,是符合人们跳跃性思维习 惯的非线性组织方式,具有良好的包容性和可扩充性;
3.网络信息资源的组织
➢ 缺点:
➢ (1)必须事先建立一套完整的范畴体系,用户对使用的范畴体系 有一定的了解,增加用户的智力负担;
➢ (2)要保证主题树的结构清晰性和资源可用性,主题范畴体系的 结构就不能过于复杂,每一类目下的信息检索条目不宜过多,这 就降低了该方式所能容纳的信息资源的数量。
3.网络信息资源的组织
(2)UNIMARC(国际机读目录通信格式) (3)CNMARC(中国机读目录格式)
2.信息资源的描述与揭示
2. Dublin Core(都柏林核心集) (1)起源于1995年在美国俄亥俄州都柏林市召开的元数据讲习班。
目前,已得到广泛的承认和应用,成为国际RFC2413和美国 Z39.85标准。(http://dublincore.org ) ➢ (2)作用:为描述网络资源提供了一种规范。 (3)15个核心元素 ➢ DC元数据有15个核心内容元素(element)。这15个元素组成 了都柏林核心元数据元素集( Dublin Core Element Set)。
3.网络信息资源的组织
➢ 优点:
➢ (1)简单易用,屏蔽了网络链接技术和资源获取技术对用户的复 杂性,提供了一种基于树型的浏览方式、简单易用的信息检索和 利用界面;
➢ (2)信息检索按照一定的范畴分类体系,逐次查看,对用户而言, 目的性强,查准率较高;
➢ (3)采用树型目录结构组织信息资源,具有良好的可扩充性和较 严密的系统性。
1.信息资源组织原理
➢ (3)按信息的传播载体划分 ➢ 文献信息源 ➢ 非文献信息源 ➢ 在这里,非文献信息源特指网络环境下没有以传统文献载体形式
出现的信息源,如程序代码、网页、超文本等。为了学习的方便, 我们统称为网络信息源。
1.信息资源组织原理
✓ 1.元数据的概念:
元数据(metadata)是关于数据的数据(data about data),是
明化、易用性; ➢ ⑤组织的技术从手工单一发展到半自动化、自动化、智能化,即
要求组织的标准化、兼容化。
3.网络信息资源的组织
➢ 文件方式
➢ 优点: (1)简单方便; (2)是存贮非结构化信息的天然单元。
➢ 缺点: (1)难以平衡网络负载与文件数量的关系; (2)不能充分地显示结构化信息之间的结构关系; (3)文件本身可看做信息单元,需要作为对象来管理。
2.信息资源的描述与揭示
✓ 信息标引包括主题分析和转换标识两个环节。
✓ 主题分析:在了解和确定信息的内容属性以及帮助揭示内容的某 些外表属性之后,将这些属性概括为主题并用自然语言表述,同 时分析主题概念之间或主题概念因素之间的结构关系。
✓ 转换标识:用专门的主题概念或概念因素,构成一定形式的检索 标识。
✓ (2)超越媒体类型对信息组织与检索的限制,实现了链接浏览的 搜寻方式;
✓ (3)避免了检索语言的复杂性。
3.网络信息资源的组织
➢ 缺点:
➢ (1)采用浏览的方式搜寻信息,当超媒体网络过于庞大时,很难 迅速而准确地的定位;
➢ (2)很难保存浏览过程中的所有记录,难以避免“迷航”现象。
教学总结
笔记整理
GILS) 《多媒体内容描述接口》 (Multimedia Content Description Interface,简
称MPEG-7)
2.信息资源的描述与揭示
➢ 1.Machine Readable Catalogue:MARC标准;
➢ 起源:美国国会图书馆,1965年提出了“标准机器可读目录记录 款式的建议”,即MARCⅠ 。1967年MARCⅡ 诞生。
专门用来描述数据的特征和属性,描述和组织信息资源,发现信
息资源的语言和工具。
➢ 2.元数据的描述对象:
➢
早期:元数据主要指网络资源的描述数据
➢
后来:逐步扩大到各种以电子形式存在的信息资源的描述数据。
➢
现在:元数据适用于各种类型信息资源的描述记录。
1.信息资源组织原理
➢ 元数据的基本功能 ✓ (1)识别。确认并对要进行组织的信息资源进行个别化描述,使
1.信息资源组织原理
➢ 信息的外部特征是指信息的物理载体直接反映的信息对象,构成 信息的外在的、形式的特征,如信息载体的物理形态、题名、作 者、出版或发表日期、流通或传播的标记等方面的特征。
➢ 信息的内容特征就是信息包含的内容,它可以由关键词、主题词 或者其他知识单元表达。信息组织的基本对象就是信息的外部特 征和内容特征。
2.信息资源的描述与揭示
➢ (2)著录的标准化:在国家或国际范围内,对文献著录的原则、
内容、格式等做出具有一定约束力的规范。
➢ 国际:1971年,国际图书馆协会联合会(IFLA),单行著作国际 标准书目著录ISBD(M);
➢
1976年,出版了国际标准数目著录总则ISBD(G)。中
国:1983年7月,正式发表了全国文献著录标准系列中的《文献
2.信息资源的描述与揭示
➢ 元素
来自百度文库名称
说明
➢ Creator
创作者
资源内容的主要创作者
➢ Contributor 其他贡献者 对资源做出其他贡献的对象
➢ Publisher 出版者
资源的提供、发表、出版者
➢ Rights
权限
资源所属或管理的权限信息
➢ Date
日期
资源生命周期中的特定日期
➢ Format
2.信息资源的描述与揭示
20世纪80、90年代诞生的大量规范: 《文本编码倡议》(Text Encoded Initiative,简称TEI) 《都柏林核心集》(Dublin Core,简称DC) 《政府信息定位服务》(Government Information Locator Service,简称
Q&A
感谢您的关注! 请您多多指导!
➢
生活中的辛苦阻挠不了我对生活的热 爱。20 .11.15 20.11 .15Su nday, November 15, 2020
➢ 优点:
➢ (1)利用数据模型对信息进行了规范化处理,优化了数据的查询, 提供一整套数据控制和操作的方法,利用信息项之间的联系进行 信息的重组和查询,提高数据操作的灵活性;
➢ (2)数据的管理与应用程序完全分离,大大降低了网络传输的负 载;
➢ (3)为多媒体信息、半结构化信息以及非结构化信息的组织提供 良方。
➢ 可扩展性:不仅有15个核心标记元素,子元素和扩展
➢
元素,还可以与其他元数据连接使用
3.网络信息资源的组织
网络信息的特点:
➢ 组织的对象从各种类型的数据发展到更加丰富多彩的信息、信息 链甚至知识;
➢ ②组织的范围从文献内、外特征深入到信息单元、知识单元; ➢ ③组织的结果从静态的文本格式发展到动态的多模式的链接; ➢ ④组织的形式从数据结构发展到知识表示。即要求信息组织的透
2.信息资源的描述与揭示
(2)标引的两种主要类型:
➢ 分类标引:采用分类语言的标引。 ➢ 分类语言用分类号表达主题概念,依据知识分类将主题概念组织、
排列成类目体系,主要以类目体系的自身结构显示概念之间的关 系。 ➢ 主题标引:采用主题语言的标引。 ➢ 主题语言是一种由受控的自然语言语词直接表达主题概念,按语 词字顺排列主题,主要用参照显示概念之间关系的标引语言。
3.网络信息资源的组织
➢ 缺点:
➢ (1)不能提供数据信息之间的知识关联;
➢
数据库组织方法是基于语用的组织,有严格的数据模型,
单个数据项缺乏行为能力,所以难以显示信息单元的知识内容之
间的语义关联。
➢ (2)对用户和服务器端都提出了较高的要求。
3.网络信息资源的组织
➢ 主题树组织方式:
将信息资源按照某种事先确定的概念体系结构,分门别类地逐层 加以组织,用户通过浏览的方式逐层加以选择,层层遍历,并通 过信息线索直接找到相应的网络信息资源。
著录总则》(GB3792.1-83),其后,先后出版了各个分则。
2.信息资源的描述与揭示
文献信息的标引
➢ (1)标引的基本概念: ➢ 信息标引:指分析信息的内容属性(特征)及相关外表属性,并用
特定语言表达分析出的属性或特征,从而赋予信息检索标识的过 程。
➢ 标引语言:表达信息主题概念和检索需求主题概念的简明性、单 义性和关联性的概念标识系统。
资源格式
资源的格式
➢ Language 语言
资源所使用的语言
➢ Identifier
标识符
对资源进行标识的识别信息
2.信息资源的描述与揭示
(4)DC的主要优点:
➢ 简单易懂:15个元素通俗易懂
➢ 运用灵活:它即可以用于规范的资源描述,也可以用
➢
于非专业领域
➢ 国际通用:目前已有10多种不同语言的版本
➢ (4).信息存贮:将经过加工整理序化后的信息按照一定的格式
和顺序存贮在特定的载体中的一种信息活动。
1.信息资源组织原理
信息组织的类型:
➢ (1)按信息表现形式划分
➢ 文字信息组织
➢ 图像信息组织
➢ 声音信息组织
➢ 视频信息组织
➢ (2)按信息的加工程度划分
➢
一次信息组织
➢
二次信息组织
➢
三次信息组织
文化产业管理专业《文化信息资源开发规划》课程
第6讲 文化信息资源的组织
时间: 1月11日 14:00~16:00 地点: A306
内容
➢ 信息资源组织原理 ➢ 信息资源的描述与揭示 ➢ 网络信息资源的组织
1.信息资源组织原理
➢ 信息组织也称信息整序,是利用一定的规则、方法和技 术对信息的外部特征和内容特征进行揭示和描述,并按 给定的参数和序列公式排列,使信息从无序集合转换为 有序集合的过程。
2.信息资源的描述与揭示
➢ 元素 ➢ Title ➢ Subject ➢ Description ➢ Type ➢ Source ➢ Relation ➢ Coverage
名称 标题 主题 主题 资源类别 来源 关联关系 覆盖范围
说明 资源标题 资源内容的主题 关于资源的简要描述 资源的内容类别 产生该资源的其他资源 与其他资源的关系 资源地理、时间或管理的范围
➢ 特点: 共有001~999个字段,其中999字段为用户自定义字段; 字段内容著录详尽,字段下又设子字段以及重复字段;字段作用 强化,可检索的字段多
➢ 每条MARC记录可分为头标区、目次区和数据区。
2.信息资源的描述与揭示
(1)USMARC(美国国会图书馆机读目录通信格式) 在1995年,美国NDLP启动,对USMARC做了一些修改:增加了 “电子资源地址与存取”字段即856字段。
1.信息资源组织原理
➢ (1).信息选择:从采集到的、处于无序状态的信息流中甄别出 有用的信息,剔除无用的信息,是信息组织过程的第一步。
➢ (2).信息分析:按照一定的逻辑关系从语法、语义和语用上对 选择过的信息内、外特征进行细化、挖掘、加工整理并归类的信 息活动。
➢ (3)信息描述与揭示:也称为信息资源描述,根据信息组织和检 索的需要,对信息资源的主题内容、形式特征、物质形态等进行 分析、选择、记录的活动。
用户能识别被组织的资源对象。
✓ (2)定位。提供信息资源位置的信息,以便用户访问时使用。
✓ (3)检索。通过在描述数据中提供检索点,便于用户对资源的检 索和利用。
✓ (4)选择。通过记录信息资源的特征,诸如主题、作者、类型、 物理形式、层次和日期等,供用户对信息资源的使用价值进行判 断,决定是否使用该资源。
2.信息资源的描述与揭示
1.文献信息的著录
➢ (1)著录的基本概念: ➢ 著录:是指在编制文献目录时,对文献内容和形式特征进行分析、
选择和记录的过程。
➢ 款目:著录的结果是款目,它是反映文献内容和形式特征的 著录 项目 的组合。
➢ 目录:将一批款目按照一定的次序编排而成的一种文献报道和检 索工具。