第三章机读目录概述介绍

合集下载

档案管理学基础 第3章

档案管理学基础 第3章

第一节
档案收集的意义和要求
第二节
社会组织内文件的归档
第三节
立档单位对档案的收集
第四节 档案馆对家庭档案、名人档案的收集
第五节 档案馆对家庭档案、名人档案的收集
第六节 国家档案馆对口述史料的采集和征集
第三章 档案的收集
第一节
档案收集的意义和要求
一、档案收集的意义 二、档案收集的要求
相关概念
• 档案收集 • 民生档案资源 • 定期归档、实时归档、延期归档 • 家庭档案 • 口述史料
(三)重视做好民生档案工作、不断完善和丰富民生档案资源
✓ 民生档案资源是指那些与广大人民群众的合法权利保障密切相关的各 种门类、专业档案的总称。
✓ 研究制定民生档案资源的归档和接收范围、管理办法,监督指导民生 档案资源的归档、收集工作
✓ 与人民群众切身利益密切相关的有利用价值的各类文件材料收集齐全, 并按有关规定将其归档和移交。
• 有关法律法规规定应归档保存的文件材料 和其他对本企业(公司)各项活动具有查 考价值的文件材料。
不纳入
• 有关组织和上级主管单位制发的不需本企业(公司)办 理的普发性文件材料,任免、奖惩非本企业(公司)工 作人员的文件材料,供参考使用的抄件,等等;
• 本企业(公司)产生的重份文件材料,无查考利用价值 的事务性、临时性文件,未经会议讨论、未经领导审阅 和签发的文件,一般性文件的历次修改稿、各次校对稿, 无特殊保存价值的信封,不需办理的一般性来信、来电 记录,企业(公司)内部互相抄送的文件材料,本企业 (公司)负责人兼任外单位职务形成的与本企业(公司) 无关的文件材料,有关工作参考的文件材料;
(三)归档要求
4.各社会组织电子文件及其元数据的归档要求

机读目录概述范文

机读目录概述范文

机读目录概述范文机读目录(MARC)是一种用于记录图书馆藏书的标准编码格式,为图书馆管理和检索图书馆藏书提供了重要的工具。

MARC的发展源于20世纪60年代,当时需要一种可以用计算机进行处理的目录记录格式。

MARC的出现极大地促进了图书馆事业的发展,提高了图书馆信息服务的效率和质量。

MARC格式记录的优点是灵活性和可扩展性。

因为MARC格式设计时采用了层次化的结构,使得字段和子字段可以根据需要进行组合和扩展。

这意味着图书馆可以自定义一些字段来记录特定的信息,以满足自己的特殊需求。

例如,一些特殊馆藏的图书馆可以添加一些额外的字段来描述这些馆藏的特殊属性。

此外,MARC格式记录还可以与其他标准和格式进行对接,实现数据的互通和共享。

例如,MARC格式记录可以转换为国际标准书号(ISBN)或国际标准编号(ISSN)格式,以便在全球范围内唯一标识图书或期刊。

MARC格式记录也可以与其他图书馆信息系统的数据格式进行转换,实现图书馆之间的联机互通。

虽然MARC格式记录在图书馆界得到了广泛的使用和认可,但也面临一些挑战。

首先,MARC格式记录的编写和维护需要一定的专业知识和技能,对于一些小型图书馆来说可能比较困难。

其次,MARC格式记录的结构较为复杂,可能需要较长的时间来学习和掌握,使得人们对其应用和发展的兴趣有所降低。

最后,随着数字图书馆和数字出版的兴起,MARC格式记录的适用性和效率也面临一定的挑战。

总体而言,MARC格式记录作为一种图书馆信息管理工具,为图书馆事业的发展做出了巨大贡献。

在未来,MARC格式记录仍将继续发展和演变,以应对数字化时代和信息技术的挑战,为图书馆信息服务提供更加全面和高效的支持。

第三章 信息检索教程

第三章 信息检索教程
22
举例:期刊2
23
期刊著录格式
24
期刊的著录
写出下面期刊文献著录:
25
小节练习1
1. 什么是文献著录? 2.文献著录的结果是—— 3. 既著录主要项目,还著录全部选择项目的著录级次称为—— 4. 既著录主要项目,还著录部分选择项目的著录级次称为——
26
3.2 机读目录与元数据
3.2.1 机读目录
43
3.2.3 都柏林核心元数据和机读目录的比较
1. 著录的对象不同
DC与 MARC的 3. 著录的主体不同 比较 4. 著录的详简程度不同
5. 标识的方法不同
2. 数据的形式不同
44
小节练习2
1、什么是机读目录,一条CNMARC机读目 录的组成? 2、头标区数据元素: 00123cbm1#2200277###52## 其中c、b、m、1分别表示什么? 3、什么是元数据?
12
图书的著录(参考文献著录规则)
13
14
图书著录中的文献类型标志
常用文献类型用单字母标识,具体如下: (1)期刊[J](journal) (2)专著[M](monograph) (3)论文集[C](collected papers) (4)学位论文[D](dissertation) (5)专利[P](patent) (6)技术标准[S](standardization) (7)报纸[N](newspaper article) (8)科技报告[R](report)
CNMARC记录
记录头标区
地址目次区
数据字段区
记录分隔符
注:各字段数据元素及其标准详细情况参见教材P83-87
33
ISO-2709的机读目录标准

信息检索与利用--第三讲

信息检索与利用--第三讲

历史
地理 自然科学 医药卫生 工业技术 农业科学技术 综合性图书
杜威十进分类法
杜威十进分类法(Dewey Decimal Classification,DC/DDC), 美国M.杜威编制的综合性等级列举式分类法。 杜威十进分类法大类表: 000 总论 100 哲学 200 宗教 300 社会科学 400 语言 500 自然科学和数学 600 技术(应用科学) 700 艺术、美术和装饰艺术 800 文学 900 地理、历史及辅助学科
2、国内常用图书分类法简介
任何一个图书馆,不论其藏书有多少,都必须对藏书进 行科学的分类和排架,以便读者有效利用文献资源。 所谓图书分类,就是根据图书的学科内容或读者对象、 文种、编辑形式、体裁等特征来分门别类地组织图书。 •《中国图书馆分类法》 (Chinese Library Classification - CLC) 简称《中图法》,它是当今国内图书馆使用最广泛的分 类法体系,国内主要大型书目、检索刊物、机读数据库, 以及《中国国家标准书号》等都著录《中图法》进行分 类。
1.分类排架法
(1)先按《中图法》分类体系排架; 以文献分类体系为主体的排架方法,多用于排列图书。 分类排架号(索书号)=分类号 + 辅助号
分类号:代表图书内容所属的学科类目, 辅助号:为同类图书的区分号。 一般先按分类号顺序排列,分类号相同,再按辅助号顺序排列, 一直区分到各类图书的不同品种。 (2)同类图书排列法通常有4种: 1)按著者名称字顺排列 即相同类号的图书再依据著者号码的次序排列。用这种排列法可 集中同类中同一著者的不同著作,附加区分号后,还可集中同一 著作的不同版本、不同译本、不同注释本、同一传记主编的各种 传记等。是各国图书馆普遍采用的排列方法。 2)按书名字顺排列, 3)按出版时间排列 4)按图书编目种次排列,

第三章 信息著录和标引

第三章  信息著录和标引

(二)信息标引的质量控制
1.一)主题分析 1.主题类型和结构 2.主题分析方法
(二)概念转换
主题概念转换是以主题分析为基础, 将确定的主题概念赋予检索标识的过程。 概念转换的结果是形成检索标识。
一、分类标引
文献分类标引是指依据一定的分类检 索语言,对文献内容的学科性质及其有检 索意义的形式特征进行分析、归纳,赋予 文献分类检索标识(分类号)的过程。目 前,国内主要依据《中国图书馆分类法》 来进行分类标引。
三、自动分类
自动分类是指由计算机系统自动提取 信息的特征项,依据一定的算法,将信息 按内容或属性归到一个或多个类别的过程。 主要包括自动归类和自动聚类两个部分。
(一)自动归类
1981年,侯汉清从计算机管理分类表、 计算机分类检索、计算机自动分类、机编 分类表四个方面探讨了自动归类的问题, 拉开了我国关于自动归类研究的序幕。
三、都柏林核心元数据和机读目录的比较
1.著录的对象不同 2.数据的形式不同 3.著录的主体不同 4.著录的详简程度不同 5.标识的方法不同
第三节 信息标引的含义和步骤
一、信息标引的含义和质量控制
(一)信息标引的含义 信息标引是指在分析文献内容的基础上, 用某种检索语言把文献主题以及其他有意 义的特征标识出来作为文献存储与检索依 据的一种文献处理过程。
(一)元数据的作用
元数据具有描述、定位、搜寻、评估、 选择等多种功用,可以连贯有效地描述、 管理、编目网络资源,以便用户更方便地 找到资源,并找到更多的相关资源。
(二)都柏林核心元数据集
1995年,在美国俄亥俄州的都柏林召开 了由OCLC和美国超级计算机应用中心主持 的第一届元数据研讨会,与会代表来自信 息管理和信息技术领域,他们一致认为有 必要产生一个简单的描述网络上文件类对 象(DLO)资源的元数据集,并最终产生 了一个包括13个元素的都柏林核心元数据集。

机读目录概述

机读目录概述

中国机读目录的研制过程
1975年刘国均发表的《马尔克计划简 介——兼论图书馆引进电子计算机问题》 揭开了我国计算机编目和机读目录研制 工作序幕。
1979年北京图书馆等单位组成“北京地 区机读目录研制协作组”,开始研究 LCMARC磁带。1980年我国正式颁布了 国家标准字符集。
中国机读目录的研制过程
MARC21
1994年12月起,美、加、不列颠图书馆 开始推动USMARC、CANMARC、 UKMARC三者的机读编目格式整合计 划,但最后的成果MARC21(1999年) 是CANMARC和USMARC的之间的合 作与发展。
MARC21是一套响应网络时代而产生的 一种通用的开放的资料格式。
二、地址目次区
目次区紧接在头标区之后,含有一个/ 多个目次款目。每个目次长12个字 符,包括三位数字字段号、四位数 字数据字段长度和五位数字字段起 始符位置。描述中由计算机自动生 成。
三、数据字段区
目次区之后为数据字段区,由若干 个定长和变长字段构成,每个字段 之间由字段分隔符隔开。
数据字段区所含数据有两种形式。
MARC21
MARC21基本上发展成为五大部分: 1. 书目数据MARC21 2. 规范数据MARC21 3. 分类数据MARC21 4. 馆藏数据MARC21 5. 团体信息MARC21
MARC21
MARC21在原有基础上增加了538 字段(系统需求和存取注释)、516 字段(计算机文件类型或数据注 释)、256字段(计算机文件特征) 以及856字段(电子地址和存取)等 字段。
1982年,《文献目录信息交换用磁带格式》 (GB2901-82),主要参考了ISO2709-81。
1986年,UNIMARC2版中文译本问世,北 京图书馆等单位据此编写了CNMARC讨论 稿,1989年得到认定。

机读目录概述

机读目录概述
• 依据《 UNIMARC 手册》制定 依据《 手册》 • 结合中国汉字的特殊性,增设了一些必须字段、子字段 结合中国汉字的特殊性,增设了一些必须字段、 • 格式一体化
机读目录格式简介
机读目录框架结构
–《文献工作——文献目录信息交换用磁带格式》 《文献工作 文献目录信息交换用磁带格式》 文献目录信息交换用磁带格式 ISO2709) (ISO2709)
机 读 目 录 概 述
信息管理教研室 田梅
主要内容
第一节 机读目录格式简介 第二节 计算机编目流程 第三节 计算机编目与手工编目的分析比较
第一节 机读目录格式简介
计算机编目
– (Computerized Cataloging)是一种现代化的编目方法,将书目 Cataloging)是一种现代化的编目方法, 信息输入到计算机中,在程序的自动控制下处理书目数据, 信息输入到计算机中,在程序的自动控制下处理书目数据,生成 目录产品的过程。 目录产品的过程。
• UNIMARC的特点 UNIMARC的特点
–将不同文种、不同载体的文献的机读目录实行格式一体化 将不同文种、 将不同文种 –设置了连接款目块 设置了连接款目块
机读目录格式简介
21格式 格式》 简称MARC 三、《MARC 21格式》(简称MARC 21 )
–美国、加拿大图书馆协会共同推出,1999-2000出版 美国、加拿大图书馆协会共同推出,1999-2000出版 美国
• USMARC格式一体化 USMARC格式一体化 • 减少USMARC与CANMARC的差别 减少USMARC与CANMARC的差别 USMARC
–2001年8月,英国宣布采用MARC 21 格式 2001年 2001 英国宣布采用MARC –五大部分 五大部分

中南大学博士考试《卫生信息管理学》第三版答案

中南大学博士考试《卫生信息管理学》第三版答案

第一章绪论1、如何理解信息的内涵?有两种观点为大多数人所接受:第一种观点认为信息是事物运动的状态和方式,即信息不是事物本身,但反映了事物的特征与特性,不同事物有不同的特征,并在不同的条件下发生变化,这种特征与变化就是信息;第二种观点认为信息就是一组具有意义的事实或数据。

2、信息和信息资源的特征有哪些?信息特征:客观性、依附性、可存储性、共享性、知识性、普遍性、可识别性、可转化性、可再生性、时效性。

信息资源特征:资源的一般特征:需求性、稀缺性、使用方向的可选择性。

信息资源的特殊性:不可分性、共享性、时效性、不同一性、驾驭性。

3、针对信息管理与信息资源管理的内涵与外延,谈谈你的认识信息管理:狭义来说,信息管理就是对信息的管理,即对信息进行组织、控制、加工、规划等,并引向预订目标。

广义来说,信息管理不单单是对信息进行管理,还是对涉及信息活动的各种要素(信息、人、设备、机构等)进行的合理组织和控制,以实现信息及相关资源的合理配置,从而有效地满足社会信息需求的过程信息资源管理的内涵:信息资源管理既是一种管理思想,又是一种管理模式;其管理对象主要是信息活动中的各种要素(包括信息、人员、技术、设备、资金等),其管理内容是对信息资源进行组织、控制、加工等,其管理目的是为有效地满足社会的各种需求,其管理模式是将信息技术、人文和经济手段相结合以实现信息资源的最佳配置和有效利用。

信息管理与信息资源管理的关系:等同关系、从属关系、发展关系。

4、卫生信息资源管理的流程是什么?卫生信息资源的采集、组织、交流、分析、利用。

5、卫生信息资源管理的任务是什么?1)建立卫生信息的基础设施2)建立卫生信息资源管理标准3)制定卫生信息资源管理的法律、法规和管理条例4)健全卫生信息化的重大项目投资管理制度5)培养高素质、复合型卫生信息管理人才6、什么是卫生信息管理学?其主要研究内容是什么?生信息管理学是研究卫生信息管理实践活动中各个环节与过程及其发展规律与方法的学科。

中国机读目录格式介绍

中国机读目录格式介绍

中国机读目录格式介绍中国机读目录格式是一种被广泛应用于图书馆和文献中心的目录编制规范,用于对书籍、文献、期刊和其他资料进行描述和索引。

机读目录的主要目的是使读者能够通过计算机检索和获取所需文献或资源,提高信息检索效率。

下面将详细介绍中国机读目录格式。

一、机读目录的结构1. 主标识符(Main Entry):即目录的主要标识符,一般是书名、文献标题或期刊名称。

主标识符可以根据不同的目录编制规则进行格式化,例如《图书分类法》、《中图法》等。

3. 附注(Note):包括目录的附加信息和解释,例如版本信息、出版商信息、目录述评等。

4. 主题词(Subject Heading):采用图书馆的主题词汇表对目录进行主题索引,以方便用户检索。

二、机读目录的元素1. 主标识符元素(Main Entry Element):包括主标识符类型、主标识符内容和主标识符辅助信息。

主标识符类型可以是书名、文献标题、期刊名称等,主标识符内容是具体的书名或标题,主标识符辅助信息包括出版年份、出版地等。

3. 附注元素(Note Element):主要包括附注内容和附注类型,附注内容是目录的附加信息,附注类型可以是版本信息、出版商信息、目录述评等。

4. 主题词元素(Subject Heading Element):包括主题词类型和主题词内容。

主题词类型是指采用的主题词汇表,主题词内容是具体的主题词。

三、机读目录的编写和应用中国机读目录格式的编写和应用可通过专门的目录编写软件来实现,例如“图书馆国家联网工程”采用的“图书目录分析处理系统(AMIS)”。

这种软件支持目录编写人员进行目录的格式化和输入,同时也支持系统用户进行检索和查询。

机读目录的应用可以通过网络或图书馆内部检索系统进行,用户可以根据主标识符、个别标识符或主题词等进行检索,从而找到所需的文献或资源。

机读目录的应用大大提高了文献检索的效率和准确性,对于学术研究、教育教学和知识传播具有重要意义。

第3章 信息著录与标引

第3章 信息著录与标引
(一)信息标引的含义:
信息标引是指在分析文献内容的基础上,用某种检索语言把文献主题以及其 他有意义的特征标识出来,作为文献存储与检索依据的一种文献处理过程. 简单来说,标引就是依据检索语言,确定文献标识的过程.
(二)信息标引的步骤:
1.主题分析:通过讨论文献的中心思想,确定被标引文献的主题概念. 2.概念转换:以主题分析为基础,将确定的主题概念赋予检索标识的过
5
(二)元数据
1.元数据:data about data (关于数据的数据);在互联网中,
元数据是指描述任何互联网数据和资源,促进互联网信息资源 是组织和发现的数据,以协助对网络资源的识别,定位与描述.
2.元数据的作用
(1)定位与检索. (2)著录与描述.描述数据单元的数据元素包括:内容,载体, 位置,获取方式,制作与利用方法. (3)资源管理. (4)资源保护与长期保存.
(1)从标引深度划分:全文自动标引和题名自动标引; (2)从选用的标引词划分:叙词自动标引和关键词自动标引; (3)从标引方式划分:自动赋词标引和自动抽词标引; (4)从标引形成的标识划分:主题自动标引和分类自动标引.
3.自动标引的类型
统计标引法 语言分析标引法 人工智能标引法
9

(2)国内
中国国家标准《文献著录总则》 《西文文献著录条列》 《连续出版物著录规则》等
3
2.《文献著录总则》
1983年正式颁布. 目的:在于根据各种类型文献的共同特点,确定文献著录原则,内容, 标识符合,格式等统一规定. 作用:为信息著录提供原则性框架,但并不作为文献著录的直接依据. 《文献著录总则》依据《国际标准书目著录》(ISBD)规定9大著录项目, 大项下设置若干子项.
① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨

机读目录基本知识(1)

机读目录基本知识(1)
集中著录; • 具有连续出版物性质的文献,集中著录;
精选课件
集中与分散
• 丛编大多数分散,除非单册题名无独立识别 和检索意义;
➢其他卷册不在手边时,要在303字段说明著 录依据的卷册;
➢无论集中还是分散,都要用总题名和分集题 名查重, 避免同一套书编制体例不一致。
• 多卷书有分卷题名,且分卷题名有检索意义 的文献,可以分散著录;
精选课件
著录用文字
• 题名与责任说明项、版本项、文献特殊细节 项、出版发行项和丛编项一般按照所著录文 献本身的文字著录(繁体字照录);
• 除题名外的数字用阿拉伯数字; • 谬误如实照录,并在3XX(附注)字段说明,
如有必要,在5XX(相关题名)字段做检索 点; • 载体形态项、附注项、标准编号与获得方式 可采用简化汉字;
精选课件
• 001 XJT012005001630 • 005 20060512144438.3 • 010 |a7-5633-3781-4|dCNY39.80 • 090 |aH319.5|b/472 • 099 |aCAL 012003037954 • 100 |a20030313d2003 em y0chiy0121 ea • 101 0# |achi|aeng|ceng • 102 |aCN|b450000 • 105 |aabf z 000yy • 106 |ar • 200 1# |a人类的故事|Aren lei de gu shi|d= The Story of mankind
著录项目
规定信息源
题名与责任说明项
题名页 版本项 版权页或题名页、 封面、出版说明等处
出版发行项
题名页、其他序页、出版说明
载体形态项
整部图书及附件

3-机读目录格式

3-机读目录格式
机读目录格式
MARC Format
机读目录格式
是各国文献机构自动化系统之间传输和交换机 读目录数据时共同遵循和使用的标准记录格式, 又称机读目录交换格式。 它规定书目数据在机读介质上的表示和标识方 法,包括机读记录的构成、各数据字段在机读 介质上的总体安排及其内容结构。
2020/5/27
机读目录格式的类型
2020/5/27
机读目录样例
Байду номын сангаас
卡片目录样例
学习要求与思考题
什么是记录头标?记录头标由哪些数 据元素构成? 数据字段区包括哪两类字段?各起什 么作用? 熟悉内容标识符的类型及各自的作用。
2020/5/27
THANK YOU!
举例
子字段标识符
数据元素
子字段
@a药物动力学参数手册 @Ayao wu dong li xue can shu shou ce @f田 文艺编@Ftian wen yi bian
2020/5/27
字段
人事信息数据
字段
记录
2020/5/27
姓名 张三 李四 王五 ……
工号 31001 31002 31003
字段标识符
2020/5/27
字段长度
字段起始位置
数据字段区(fields)
控制字段(Control fields)是提供系统 的控制号和表示文献特征的各种代码化 数据的字段。所有控制字段均不设指示 符和子字段,其字段标识符的前两位都 为“0”,即从001-009。
2020/5/27
数据字段区(fields)(续)
由两个字符组成,用以识别可
@a
变长字段中的不同子字段。第一

个字符为子字段分隔符,用“@”

文献编目基础知识

文献编目基础知识

文献编目基础知识文献编目基础知识主讲人石春耘顾蔷芬第一部分:概述第二部分:文献编目工作所包含的内容和基本概念第三部分:我馆文献编目工作概况第四部分:汇文系统编目模块功能简介第五部分:CNMARC格式著录标准和规则第一部分:概述1文献机构的目录职能:1.1目录的揭示职能和检索职能:目录的职能主要是对文献的形式和内容特征描述,通过完整的著录来实现,(传统编目工作主要产生题名、责任者、主题、分类四大款目)为读者提供文献的目录,以揭示馆藏内容。

1.2目录的宣传职能和和识别职能1.3目录的管理、交流职能和情报、参考职能:2 文献编目的发展及现状2.1文献编目、网络信息资源编目和信息资源编目:对大量馆藏实体信息资源进行整理、整序和整合的工作,被称为"文献编目",但对于大量非馆藏网络信息资源,同样也存在一个整理、整序和整合的工作,所以我们将这两大部分的编目工作统称为信息资源编目。

2.2文献编目现状:20世纪下半期,西方的信息资源编目工作已由跨国化、统一化、手工化、进入到国际化、标准化、自动化、网络化。

在我国近三十年,文献编目工作也得到了长足的发展,大部分地区的图书馆的编目工作已完成了标准化、自动化的进程,文献资源共建共享已逐步成为现实,开展的网上联合编目并取得了较好的社会效益和经济效益。

我馆2000年上了"汇文"系统,2002年正式申请成为CALIS的成员馆,实现了联机合作编目。

3 网络信息资源编目与发展3.1我国网络信息资源编目现状3.2网络信息资源编目知识简介DC简介:采用DC格式作为网络信息资源描述工具1995年OCLC和NCSA创造出了一套全新的编目格式Dublin Core,即都柏林核心,简称DC,DC的创建思想是使用简单的标识集合来描述网络信息资源,所包括的三个大类十五个要素可基本揭示信息资源的特征。

第一大类为描述资源内容的要素;第二大类为描述知识产权的要素;第三大类为描述资源外部属性的要素。

【课件】机读目录著录标准及档案管理软件应用PPT课件

【课件】机读目录著录标准及档案管理软件应用PPT课件
(问题)名称或规范化简称
.
21
第一部分:内容
归档文件机读目录必录项目著录要求: 件号:是指归档文件的排列顺序号。录入时,
件号为2位阿拉伯数字,归档文件数量达到100 以上的,件号为3位阿拉伯数字,不足的在前 面以“0”补齐
.
22
第一部分:内容
文件题名、责任者、时间、全宗号、保管期限 等项目要求与文件级档案目录著录要求相同
.
18
第一部分:内容
归档文件机读目录必录项目著录要求: 页数:每一份归档文件内的实有页数。
.
19
第一部分:内容
归档文件机读目录必录项目著录要求: 年度:是指归档文件的形成年度。录入时,年
度为YYYY
.
20
第一部分:内容
归档文件机读目录必录项目著录要求: 机构(问题):是指作为分类方案类目的机描图像的合并及存储 合并: 使用工具把扫描的多个单页图像文件合并成一
个多页图像文件
.
38
第三部分:内容
存储格式
采用黑白二值模式扫描的图像文件,一般采用 TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的 文件,一般采用JPEG格式存储。存储时的压缩率的选 择,应以保证扫描的图像清晰可读的前提下,尽量减 小存储容量为准则。
度的前提下展现原貌的原则,去除数字图像中 影响可读度的杂质,包括局部去污,如去除黑 点、黑线、黑框;整体去污,去除页面上的污 渍 拼接:为保证档案数字化图像的整体性,对幅 面分离的数字图像进行拼接
.
36
第三部分:内容
扫描图像的处理 裁边处理:采用彩色模式扫描的图像应进行裁
边处理,去除多余的白边,以有效缩小图像文 件的容量,节省存储空间。
选录项目:文件字号、密级、附件、主题词、 分类号、缩微号、文本项、利用形式、摘要、 所在柜(架)号等

机读目录概述

机读目录概述

机读目录概述
周兵
【期刊名称】《国家图书馆学刊》
【年(卷),期】1979(000)001
【摘要】本文共分五部分,第一部分介绍机读目录产生的历史背景,第二部分介绍机读目录记录的格式结构,第三部分介绍目录记录的转换技术,第四部分介绍机读目录的应用,第五部分介绍机读目录的标准和系统的网络。

本文对了解国外机读目录和研究我国的机读目录有一定参考价值。

——编者
【总页数】11页(P32-42)
【作者】周兵
【作者单位】
【正文语种】中文
【中图分类】G258.1
【相关文献】
1.机读目录概述(续) [J], 周兵;
2.机读目录概述(续完) [J], 周兵;
3.《中国机读目录通讯格式》与《中国机读目录格式》之比较 [J], 黄明
4.机读目录著录注意事项概述 [J], 邵仰东
5.中西文图书及连续出版物机读目录的比对 [J], 姜建国
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.2 CNMARC的逻辑结构




头标必备、不可重复。 数据元素名称 字符位置 记录长度 0- 4 记录状态 5 执行代码 6- 9 指示符长度 10 子字段标识符长度11 数据基地址 12-16 记录附加定义 17-19 目次区结构 20-23
字符数 5 1 4 1 1 5 3 4
3.2 CNMARC的逻辑结构
MARC记录:简称记录Machine Readable Catalogue MARC记录是书目数据库里的一个信息单元。 每条记录由头标、目次区和若干个字段构成。
CNMARC格式的总体结构图见P55图5-1
3.2 CNMARC的逻辑结构
1.记录头标区:简称头标。位于记录的开端 ,固定长为24字符,提供本记录的有关参 数。 记录头标区的记录状态、执行代码和记录 附加定义需要人工设定。
3.2 CNMARC的逻辑结构
2.目次区
字段标识符 字段长度 字段起始字符位置 … … 字段分隔符 (00-02) (03-06) (07-11) 款目1
数据款目
001001100000 010002300011
字段标识符
001 010
字段长度
11 23
字段起始字符位置
0 11(0+11)
100004100034
. . .
100
41
34(11+23)
3.2 CNMARC的逻辑结构
3.数据字段区
A. 10大功能块
0XX 标识块
5XX
相关题名块
主题分析块 知识责任块 国际使用块 国内使用块
1XX 编码信息块 6XX 2XX 著录块 3XX 附注块 7XX 8XX源自4XX 连接款目块 9XX
3.2 CNMARC的逻辑结构
3.数据字段区 B.数据字段区的数据组成方式 数据元素——子字段——字段——数据 字段区
3.2 CNMARC的逻辑结构
4.必备字段
<1>所有文献必备字段 记录头标、001、100、200、801 <2>特定类型文献必备字段 文字类:101 测绘制图:120、123、206 电子资源:230、304 乐谱等:125 拓片:191
【美国国会图书馆简介】
(Library of Congress,United States)建 于1800年,距今已有二百余年的历史,是美国 的官方国家图书馆之一,也是全球最重要的图 书馆之一。美国国会图书馆是在美国国会的支 持下,通过公众基金、美国国会的适当资助、 私营企业的捐助及致力于图书馆工作的全体职 员共同努力建成的,它是美国历史最悠久的联 邦文化机构,已经成为世界上最大知识宝库。 它保存各类收藏近1亿2100万项,超过三分之 二的书籍是以多媒体形式存放的。其中包括很 多稀有图书、特色收藏、世界上最大的地图、 电影胶片和电视片等(除农业技术和临床医学 方面的信息分别由国家农业图书馆和国家医学 图书馆收藏外,其它信息均被国会图书馆收藏 )。
3.3 MARC21
一、字段块 二、必备字段
三、重要字段说明
四、CNMARC与MARC21字段对照
3.3 MARC21
MARC21是我国西文文献编目的数据源。 MARC21的前身是? 1998年至2000年,一体化的USMARC更 名为MARC21。

西文marc示例:

3.1 机读目录的产生与发展
2.在中国发展 (1)1975年,刘国钧先生发表论文,揭 开了我国机读目录研究工作的序幕。 (2)1979年开始研究,1996年,CNMARC 《中国机读目录通讯格式》发布。 (3)2004年3月出版CNMARC/B《新版中 国机读目录通讯格式》 (4)2003年,MARC21格式使用手册启动 ,向全国各类图书馆提供编制西文数 据数据的统一标准和较为规范的参考 依据。
第三章 机读目录概述
机读目录的产生与发展 CNMARC的逻辑结构 MARC21
3.1 机读目录的产生与发展
1.在西方发展 (1)1965年,美国国会图书馆开始研制 业务工作采用电子计算机的可能性 (2)1966年2月,进行试验 (3)1966年4月,美国国会图书馆( /index.html)设计 出世界上第一个机读目录格式MARCI (4)1967年,转向MARCII的研制 (5)1969年开始向全国发行MARCII格式 书目磁带,最初称为LCMARC,1983年改为 称为US- MARC,即美国机器可读目录。



1951年到北京,先后任北京大学图书馆学系教授 、系主任。并兼任北京大学学术委员会委员、北 京图书馆顾问等。 1958年起担任北京大学图书馆学系主任。 1979年被推选为中国图书馆学会名誉理事。 1980年6月27日刘国钧因病逝世于北京。刘国钧长 期从事图书馆工作和图书馆学教学研究工作。他 在图书馆学研究上,十分注意理论与实践的结合 和图书馆事业发展的新趋势。他的许多研究成果 ,如图书分类、图书编目、图书馆自动化技术等 ,都对中国图书馆事业的建设和发展起着推动作 用。著有《中国图书分类法》、《图书馆学要旨 》、《图书馆目录》、《中国书史简编》、《刘 国钧图书馆学论文选集》等。 来源:更多的人物可见湖南图书馆网站的人物介 绍栏目/tsgrwjs/
补充几个基本术语
(1)字段:由字段标识符标识的被定义的 字符串。在CNMARC中,除了00X字段,其 它字段均包含一个或一个以上子字段。其 长度包括字段指示符、子字段标识符、数 据元素和字段分隔符。 (2)子字段:字段内明确定义的最小数据 单元。
补充几个基本术语
(3)字段标识符:用于标识字段的一组符 号,由3位数字字符组成。 (4)指示符:字段中头两个字符位的值。 提供字段内容、字段之间的相互关系以及 数据处理过程中所需操作的附加信息。每 个指示符的值都有其独立的含义。字段指 示符一般为数字或空位。 (5)子字段标识符:由两个字符组成,用 以识别可变长字段中的不同子字段。第1 个字符为子字段分隔符,第2个字符为字 母或数字。

3.3 MARC21

MARC21/B格式共设183个字段,其中必备字 段为7个(P354-360)
– – – – – – – 001 控制号 003控制号标识 005最近一次处理的日期和时间 008定长数据元素 040编目源 245题名说明 300载体形态
3.3 MARC21 三.重要字段说明
3.1 机读目录的产生与发展
(6)1977年,IFLA 研制UNIMARC (7)1991年,美国图书馆协会接受格式一体 化建议,对USMARC进行一体化 (8)1998年至2000年,一体化的USMARC更 名为MARC21。 (9)2002年推出MARCXML,是目前通用的XML 格式MARC。 (10)在适用于MARC21的MARCXML推出之 后,丹麦国家图书馆致力于开发M arcXchange,这是适用于各种MARC的XML格 式。在由LC接任MarcXchange的维护机构后 ,2008年它正式成为国际标准ISO25577
3.2 CNMARC的逻辑结构
01633nam0 2200361 45( 记录头标区) 机读目录样例 001DT2000021574(地址目次区) 010 $a7-5036-2657-7$dCNY25.00 100 $a19990607e20001999kemy0chiy0121 ea 1011 $achi$ceng 102 $aCN$b110000 105 $ak as 000yy 106 $ar 200 1 $a世界贸易体制的政治经济学$AShi Jie Mao Yi Ti Zhi De Zheng Zhi Jing Ji Xue$e从关贸总协定到世界 贸易组织$dThe political economy of the World trading system$eFrom GATT to WTO$f(英)迈 克尔· 考斯泰基(Michel M. Kostecki)著$g刘平等译 $zeng 210 $a北京$c法律出版社$d1999$h2000第2次印刷 215 $aⅩⅢ,317页$d20cm
(1)245: 本字段包含题名与责任说明 有两位指示符 第一位: 题名附加说明 一般有主要款目标目时,取1, 提供题名附加款目;否则就取0, 不做附加款目 第二位: (0-9)代表检索从第几位开始
3.3 MARC21 一.字段块
00X: 控制信息段 1XX: 主要款目标目 3XX:载体形态项 5XX:附注字段 7XX:附加、连接 9XX:本地使用 2XX: 题名、版本、出版 4XX:丛编说明字段 6XX:主题检索字段 8XX:丛编附加、馆藏信息
3.3 MARC21
二.必备字段
MARC21/B格式共设183个字段,其中必 备字段为?个 请同学们根据上表指出哪些字段是必备 字段?
3.2 CNMARC的逻辑结构
机读目录样例
305 $a原英文版于1995年由牛津大学出版社出版 304 $aM.M.考斯泰基,规范译名:M.M.科斯特茨基 320 $a有英文书目(第298~315页) 5101 $aThe political economy of the World trading system$eFrom GATT to WTO$zeng 5171 $a从关贸总协定到世界贸易组织$ACong Guan Mao Zong Xie Ding Dao Shi Jie Mao Yi Zu Zhi 606 $a关税和贸易总协定$x研究 60102$a世界贸易组织$x研究 690 $aF743$v4 701 1$a科斯特茨基$AKe Si Te Ci Ji$g(Kostecki, Michel M. )$4著 702 0$a刘平$ALiu Ping$4译 801 0$aCN$bDATATRANS$c20000321 8564 $u2000/0215/021574.htm 905 $aDATATRANS$b000456$dF743$e145
相关文档
最新文档