第3章 信息著录和标引解剖

合集下载

第三章 信息检索教程

第三章 信息检索教程
22
举例:期刊2
23
期刊著录格式
24
期刊的著录
写出下面期刊文献著录:
25
小节练习1
1. 什么是文献著录? 2.文献著录的结果是—— 3. 既著录主要项目,还著录全部选择项目的著录级次称为—— 4. 既著录主要项目,还著录部分选择项目的著录级次称为——
26
3.2 机读目录与元数据
3.2.1 机读目录
43
3.2.3 都柏林核心元数据和机读目录的比较
1. 著录的对象不同
DC与 MARC的 3. 著录的主体不同 比较 4. 著录的详简程度不同
5. 标识的方法不同
2. 数据的形式不同
44
小节练习2
1、什么是机读目录,一条CNMARC机读目 录的组成? 2、头标区数据元素: 00123cbm1#2200277###52## 其中c、b、m、1分别表示什么? 3、什么是元数据?
12
图书的著录(参考文献著录规则)
13
14
图书著录中的文献类型标志
常用文献类型用单字母标识,具体如下: (1)期刊[J](journal) (2)专著[M](monograph) (3)论文集[C](collected papers) (4)学位论文[D](dissertation) (5)专利[P](patent) (6)技术标准[S](standardization) (7)报纸[N](newspaper article) (8)科技报告[R](report)
CNMARC记录
记录头标区
地址目次区
数据字段区
记录分隔符
注:各字段数据元素及其标准详细情况参见教材P83-87
33
ISO-2709的机读目录标准

第4章 信息著录法

第4章  信息著录法

30
正题名[一般文献类型标识]=并列题名:其他题名 信息/第一责任说明;其他责任说明.―版本说明/与本 版有关的责任说明.-文献特殊细节.―出版地:出版 者,出版日期(印刷地:印刷者,印刷日期)
数量及特定文献类型标识:图;尺寸+附件.― (丛书项)
附注项
标准编号:获得方式
2021/7/20
信息组织
2021/7/20
信息组织
17
逗号“,”:用于有从属标识的从属题名、 责任方式相同的第二、第三个责任者、附 加版本说明、出版年(发行年、印刷年)、 ISSN、交替题名、分段号码的第二、第三 段页码之前。
圆点“.”:用于从属标识或无从属标识的丛 属题名, 属于不同责任者的第二、第三个无 总题名文献的题名, 分丛书题名之前。
加号“+”:用于载体形态项的附件之前。
2021/7/20
信息组织
18
括号“( )”:用于丛书项、印刷事项、 载体形态项的补充说明、标准编号与获得 方式项的附加说明、连续出版物卷、期、 年、月或其他标识项的年月标识。
乘号“×”:用于载体形态项的文献宽度或厚 度尺寸之前。
省略号“…”:用于标识省略的著录内容。
信息组织
责任者主要款目
26
2021/7/20
信息组织
27
2021/7/20
以责任者为主标目形成的附加款目
信息组织
28
2021/7/20
以题名为主标目形成的附加款目
信息组织
29
中国文献著录标准--《文献著录总则》 ➢ 指导思想 ➢ 编制体例 ➢ 基本结构 ➢ 主要内容
2021/7/20
信息组织
2021/7/20
信息组织
22

档案分类与著录标引

档案分类与著录标引

档案分类与著录标引档案分类与著录标引一、档案分类的概念及其意义二、档案著录标引三、档案实体分类四、档案分类方案的编制档案事业及其构成广义档案工作包括档案管理工作、档案行政管理工作、档案教育工作、档案科学研究工作、档案宣传工作、档案国际合作与交流工作等。

档案管理工作:档案收集(接收、征集)—整理(分类、有序化)—鉴定(内容、价值、技术状况)—编目与检索—保管—统计—编辑与研究—利用(查询服务、举办展览)一、档案分类的概念及其意义(一)概念1、类和分类类就是具有共同特征的个体集合。

分类即根据事物的异与同,按照一定的标准将其区分开来。

2、档案分类档案分类即根据档案内容和形式的异同,按照一定的分类原则和方法,使用一定的分类标准,对档案进行划分。

3、全宗全宗是一个独立的机关、组织或个人在社会活动形成的全部档案构成的有机整体。

基本含义:(1)全宗是一个有机整体。

(2)全宗是在一定的历史活动中形成的。

(3)全宗是以一定的社会单位为基础而构成的。

全宗类型:组织全宗、人物全宗两种。

全宗形式:独立全宗、联合全宗、全宗汇集、档案汇集四种。

4、立档单位形成档案全宗的单位,又称“全宗形成者”。

一个独立从事活动的机关、组织(或个人)就是一个立档单位,一个立档单位形成的全部档案就构成一个全宗。

构成立档单位的条件:(1)能够依法独立地进行工作、生产、经营、科研、教学等社会职能活动,单独行使相应的职权,并能主要以自已的名义单独对外行文。

(2)设有管理人事的机构或人员,并有一定的人事任免、奖惩权。

(3)设有会计单位或经济核算单位,自己可以编制预算或财务计划。

(二)分类的意义分类是档案整理的核心内容和重要的基础性工作,是档案标准化、规范化工作的具体体现。

通过对浩繁杂乱的档案文件,分门别类,组合成保管单位,固定排列顺序,实现档案的有序化,可以给排架提供依据,为档案检索提供有利条件。

在应用计算机等现代化管理手段中,分类也是一个重要的基础。

第三章 信息著录和标引

第三章  信息著录和标引

(二)信息标引的质量控制
1.一)主题分析 1.主题类型和结构 2.主题分析方法
(二)概念转换
主题概念转换是以主题分析为基础, 将确定的主题概念赋予检索标识的过程。 概念转换的结果是形成检索标识。
一、分类标引
文献分类标引是指依据一定的分类检 索语言,对文献内容的学科性质及其有检 索意义的形式特征进行分析、归纳,赋予 文献分类检索标识(分类号)的过程。目 前,国内主要依据《中国图书馆分类法》 来进行分类标引。
三、自动分类
自动分类是指由计算机系统自动提取 信息的特征项,依据一定的算法,将信息 按内容或属性归到一个或多个类别的过程。 主要包括自动归类和自动聚类两个部分。
(一)自动归类
1981年,侯汉清从计算机管理分类表、 计算机分类检索、计算机自动分类、机编 分类表四个方面探讨了自动归类的问题, 拉开了我国关于自动归类研究的序幕。
三、都柏林核心元数据和机读目录的比较
1.著录的对象不同 2.数据的形式不同 3.著录的主体不同 4.著录的详简程度不同 5.标识的方法不同
第三节 信息标引的含义和步骤
一、信息标引的含义和质量控制
(一)信息标引的含义 信息标引是指在分析文献内容的基础上, 用某种检索语言把文献主题以及其他有意 义的特征标识出来作为文献存储与检索依 据的一种文献处理过程。
(一)元数据的作用
元数据具有描述、定位、搜寻、评估、 选择等多种功用,可以连贯有效地描述、 管理、编目网络资源,以便用户更方便地 找到资源,并找到更多的相关资源。
(二)都柏林核心元数据集
1995年,在美国俄亥俄州的都柏林召开 了由OCLC和美国超级计算机应用中心主持 的第一届元数据研讨会,与会代表来自信 息管理和信息技术领域,他们一致认为有 必要产生一个简单的描述网络上文件类对 象(DLO)资源的元数据集,并最终产生 了一个包括13个元素的都柏林核心元数据集。

信息检索教程(第三版)PPT11

信息检索教程(第三版)PPT11
3.数据字段区 由一些可变长数据组成。数据字段区的功能块有10个,每个功能 块设立了一些相关 字段。
4.2.2 元数据
元数据的英文为 Metadata,意为关于数据的数据。在互联网中,元数据是 指描述任何 Internet数据和资源,促进互联网信息资源的组织和发现的数 据,以协助对网络资源的识 别、描述、指示其位置。
4.1 信息著录的含义和标准
4.1.1 信息著录的含义和作用
1.信息著录的含义 信息著录简称著录,是指在组织检索系统时对文献内容和形式特征进行选择和记录的
过程。信息著录是组织检索系统的基础,是信息存储过程中的一个重要环节。准确性 和规范化是信息著录的基本要求。准确性要求著录结果要全面、客观、准确地 揭示 文献或其他信息源的内容特征和形式特征。 2.信息著录的作用 信息著录的目的是为了报道和检索信息,通过著录可以浓缩文献信息的特征,起到揭 示文献、报道文献,帮助人们快速地了解文献,进而选择自己所需文献的作用。
的信息为止,经过一系列工 序、采用多种方式与手段,最终形成记载文献相关信息的款 目或记录。 (3)检索功能 作为信息著录结果的款目或记录,记载了反映文献特征的可供检索的各 个标识。
4.1.2 信息著录的标准
信息著录标准是指在描述信息过程中所要依据的规则和条例,是实现信息著录标准化 的前提和根本。信息著录标准包括国际标准和国家标准。
4.1.1 信息著录的含义和作用
信息著录 的作用具体如下: (1)揭示功能 信息著录主要反映的是文献本身 所具有的特征,在对文献全面系统分析、选出最具有代
表性的特征后,通过概括而精练地 叙述内容特征,以及简略而准确地描述形式特征。 (2)组织功能 信息著录从分析文献的内 容特征和外表特征开始,到记录下各种与文献报道和检索有关

信息著录与信息标引

信息著录与信息标引

信息著录与信息标引一、什么是信息著录1、定义。

“文献是记录有知识的一切载体。

著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。

著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。

”通常意义上讲的著录就是指,按照某种标准化的格式和要求(如MARC),对文献的某些被规定的特征进行描述(如责任者、题名、出版社等),形成一条一条的信息描述项,最后著录的结果就是一条关于该信息资源的书目数据记录。

2.主要类型。

信息著录就是按照某种规则揭示某一信息资源的主要特征,给出信息资源的缩影。

因此对所有的信息资源类型都可以进行著录。

录音资料、电影与录像资料、微缩品、测绘制图资料、电子资源都可以进行著录,但最早也是最普遍的著录形式还是纸质书籍的著录。

3、信息著录的主要方式。

以图书的著录为例。

为了更好的实现信息资源的共享,著录时通常是遵循统一的格式,如,最常见的MARC。

MARC会给出所要著录的款目、使用的符号和代码、著录的格式、著录款目的顺序以及特殊情况下的处理方式(如多责任者、多语种、信息不详、信息明显错误等)。

编目人员要做的就是按照规定,使用受控的语言,逐条填写个款目的内容。

(当然有些款目是不必要填写的,也有相应规定。

)图一、图二给出了MARC工作界面的截图和一条完成的书目记录。

二、信息著录的意义。

1、信息组织的意义。

信息著录是信息组织的一种具体的方法,信息组织实现的意义也就是其所有具体方法的意义,当然也包括信息著录。

信息组织是使无序信息有序化的过程,起最终目的是使主体(人)能够“更好”的利用信息。

这里的“更好”包括更加方便、快捷的检索信息、准确定位所需的特定信息、获得最有价值的信息等,这些也都是信息著录可以实现的效果。

2、信息著录本身的意义。

除了信息著录作为信息组织的具体方式而具有的普遍的意义,它作为一种区别于其他信息组织方式的具体的方法,同时具有它本身的特殊功能。

信息著录所要解决的问题是揭示某一信息整体的、完整的、概要的特征,既包括外在的信息载体的特征的揭示,也包括内在的信息内容特征的揭示。

信息内容分析与标引课件

信息内容分析与标引课件
–有关标准理论的文献入G307。
信息内容分析与标引课件
(续)
• 会议文献、学位论文、产品资料的分类标引 –会议文献主要是指会议录(论文集); –学位论文一般包括硕士和博士论文; –产品资料包括产品样本、产品目录、产品说明书等。 它们的分类标引规则是一致的,一般依其内容进行 分散归类。除了入C、N、T类的有关类目外,分入 各学科、专业有关类目的,则应加上相应的总论复 分号。
能以某一期的内容为依据。 –多主题的期刊应适当进行分析分类或互见分类标引。
• 报纸的分类标引
–报纸一般不依内容分类标引,而按“地区—刊名— 年代”或“刊名—年代”进行排架或组织目录。
–对于专业报纸,可以用《中图法期刊分类表》进行 分类标引。
信息内容分析与标引课件
7. 非书资料的分类标引规则
• 非书资料是缩微资料、声像资料(视听资料)、 机读文献等非印刷型文献
信息内容分析与标引课件
(续)
• 丛书的分散归类
–即分别依丛书中各种书的内容各自归类,丛 书分散归类时不必使用表示丛书的总论复分 号。必要时,再为整套丛书作综合分类。
–宜采用分散归类的丛书主要是学科性和专业 性强、学术价值高的丛书;内容广泛、各种 书之间联系不密切的丛书。
–例如:《管理心理学》(现代管理科学丛书) 入C93-05。《现代系统工程学概论》(现代 管理科学丛书)入N92。
• 辨识类目含义,首先应该分析各大类的内部结 构,从各构成部分的联系和区别中去把握具体 类目的含义
信息内容分析与标引课件
《中图法》社会科学类的基本层次结构示意图
信息内容分析与标引课件
(二) 类目含义限定辨识法
• 分类法的类名往往不能完整地表达类目的含义, 类目的实际含义受到其他因素的制约,因而应该 采用相关因素限定的方法来辨识类目含义

第3章 信息著录与标引

第3章 信息著录与标引
(一)信息标引的含义:
信息标引是指在分析文献内容的基础上,用某种检索语言把文献主题以及其 他有意义的特征标识出来,作为文献存储与检索依据的一种文献处理过程. 简单来说,标引就是依据检索语言,确定文献标识的过程.
(二)信息标引的步骤:
1.主题分析:通过讨论文献的中心思想,确定被标引文献的主题概念. 2.概念转换:以主题分析为基础,将确定的主题概念赋予检索标识的过
5
(二)元数据
1.元数据:data about data (关于数据的数据);在互联网中,
元数据是指描述任何互联网数据和资源,促进互联网信息资源 是组织和发现的数据,以协助对网络资源的识别,定位与描述.
2.元数据的作用
(1)定位与检索. (2)著录与描述.描述数据单元的数据元素包括:内容,载体, 位置,获取方式,制作与利用方法. (3)资源管理. (4)资源保护与长期保存.
(1)从标引深度划分:全文自动标引和题名自动标引; (2)从选用的标引词划分:叙词自动标引和关键词自动标引; (3)从标引方式划分:自动赋词标引和自动抽词标引; (4)从标引形成的标识划分:主题自动标引和分类自动标引.
3.自动标引的类型
统计标引法 语言分析标引法 人工智能标引法
9

(2)国内
中国国家标准《文献著录总则》 《西文文献著录条列》 《连续出版物著录规则》等
3
2.《文献著录总则》
1983年正式颁布. 目的:在于根据各种类型文献的共同特点,确定文献著录原则,内容, 标识符合,格式等统一规定. 作用:为信息著录提供原则性框架,但并不作为文献著录的直接依据. 《文献著录总则》依据《国际标准书目著录》(ISBD)规定9大著录项目, 大项下设置若干子项.
① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨

文献的著录和标引_文献检索实用技术_[共2页]

文献的著录和标引_文献检索实用技术_[共2页]

◆◆_______

____________________________________

____
◆◆◆第二章 文献信息检索基础知识
·11·
分时共同使用的表。

《中图法》的复分表分为:①总论复分表;②世界地区复分表;③中国地区表;④国际时代表;⑤中国时代表;⑥世界种族与民族表;⑦中国民族表;⑧通用时间、地点表。

例如,《英国油画集》为J233(561),“(561)”为英国复分号,《近二年来的肿瘤疗法经验》为R730.5=5,“=5”为时间复分号。

《中图法》整体结构示意图如图2-2所示。

图2-2 《中图法》整体结构示意图
《中图法》的作用有如下几个。

①组织文献排架。

文献的分类号作为排架的依据。

图书馆的文献资料多的有几百上千万册,少的也有十几万册,怎样把这些文献有规律地排放在书架上,还要便于读者查找呢?《中图法》分类体系能够解决这个问题。

我国大多数的图书馆都使用《中图法》来组织文献的排架。

②编制检索系统。

我国大部分的检索系统都具备分类索引。

③通用性。

《中图法》在我国图书情报领域是通用的。

第三节文献的著录和标引
一、文献的著录
1.文献著录的含义
文献著录是指将文献的外部特征和内部特征分析出来,并采用一定的方式将这些特征连接在一起,形成原文的代替品。

这一过程称为文献著录。

文献著录的结果形成条目。

文档一体化系统的数据准备--著录与标引

文档一体化系统的数据准备--著录与标引

文档一体化系统的数据准备-一著录与标引5 . 1 著录与标引的含义著录是对文件或档案的内容特征和形式特征进行分析、选择和记录的过程。

著录包括著和录两个方面。

著,即标引。

标引是在文件或档案的加工、存贮和检索过程中,将其内容主题的自然语言,转换成规范化的检索语言的过程,标引是针对内容特征而言的。

录,即抄录。

抄录是将文件或档案的形式特征,如作者、时间、文号等照录在著录条目上。

标引使用的是规范化的人工语言,而抄录使用的是文件或档案固有的自然语言。

标引是著录的核心部份,通过标引,使文件或档案的内容信息形成检索标识,管理自动化系统才具有管理和检索功能。

在手工系统中,对文件进行著录,即形成文件登记表或登记卡片,对档案进行著录,即形成各种形式的档案目录。

在管理自动化系统中,文书及档案的著录过程与手工系统仍然是相似的,但它已减少了许多的重复性工作,使著录与标引的效率大为提高。

特别是象S L W S 等将文书及档案的管理合二为一的系统,由于在文书管理阶段即对所发生的文件即时进行了著录,从而,使文件归档时著录工作量大为减少。

在管理自动化系统中,对文件和档案的管理,是通过对文件和档案数据库的管理来实现的。

而数据库的建立,又必须依赖于著录项目的输人。

也就是说,没有这种输入,自动化管理就无从谈起。

这也是我们把著录和标引称为管理自动化系统的数据准备或前处理工作的原因。

著录的质量,直接影响到自动化系统的应用水平。

现在的计算机还不会判断这些特征数据的质量,就如我们常说的,“输入的是垃圾,输出的也是垃圾”著录与标引的工作质量,可以概括为对内容特征和形式特征进行描述及给予检索标识的正确性与全面性程度。

影响著录与标引的正确性和全面性的主要原因有以下几点:(1)主题分析不正确,析出的主题与实际内容不符。

(2)主题分析不充分或无控制,析出的主题少于或多于文件和档案有参考价值的实际内容。

(3)给出的标识符号与主题概念不符,即标识错误或组配错误等。

信息著录与信息标引

信息著录与信息标引

信息著录与信息标引信息著录与信息标引当今我们正处于一个信息爆炸的时代。

此时信息呈现出几大特点,一是数量多,增长快,尤其是在网络环境下,这一特点表现得更加突出。

例如清华同方的《中国期刊全文数据库》,通过对2006年11月28~30日3天该数据库公布的新增论文数量的统计,平均每天增长23228篇。

由此可见,网络环境下,文献信息资源的数量非常庞大且增长速度惊人。

[1]二是新词层出不穷,据中国语言文字工作委员会做过的一个保守统计,平均每年产生800多个新词语。

[2]在这种资源种类纷繁复杂,标准不一,十分不方便用户使用的情况下。

要有一个方法来描述信息资源是非常必要的,否则,用户在未浏览完信息而只看其外在形式的情况下,是无法了解信息的概况,以判断信息资源是否符合自己的需要的。

因此,信息的著录就显得尤为重要。

著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。

[3]有了信息的著录,用户就可以在未读过文献的情况下,浏览信息著录的结果——款目或目录来对文献信息进行大致了解。

随着信息数量的急剧增多,信息著录的标准化和自动化也越来越成为信息著录的发展方向,其将使得用户在使用信息的款目和目录时更加地快捷和准确。

由此我国也在2004年出版了最新的《新编中国机读目录格式使用手册》,下面就以其为范例对什么是信息著录进行一个解释。

由于《新编中国机读目录格式使用手册》设置了184个字段,我们将主要介绍其数据字段区的常用字段。

如美国作家丹·布朗的小说《数字城堡》,我们要著录这本文献,首先是其001记录控制号:0120********其中0表示受编文献为普通图书,1表示受编文献语种为中文,20**为编目的年(由编目时间决定),******为编目流水号(视具体编目时的顺序决定)。

其次为010国际标准书号和011国际标准连续出版物号字段:010##$a7-02-004814-5$dCNY25.00(由于其不是连续出版物,所以不用011国际标准连续出版物号字段)其中010##表示这是010字段,$a7-02-004814-5表示其ISBN 号,$dCNY25.00表示其定价为人民币25元。

信息检索 第三章 信息著录和标引---精品资料

信息检索 第三章 信息著录和标引---精品资料

第三章信息著录和标引3.1信息著录的含义和标准一、信息著录的含义信息著录:简称著录,指在组织检索系统时对文献内容和形式特征进行选择和记录的过程。

著录对象是信息,著录结果是款目或记录。

款目:指依据一定的标准方法,对一种文献或信息源的内容价值物质形态进行描述而形成的一条记录。

款目由一条条著录项目组成。

著录项目:用于揭示文献内容和形式特征的记录事项。

信息著录的基本要求:①准确性。

要求著录结果准确全面客观的揭示文献或其它信息源的内容特征或形式特征②规范化。

要求信息著录坚持标准化原则,按照统一的著录项目,著录格式,标识符号进行著录。

二、信息著录的作用1、揭示功能:信息著录主要反映的是文献本身的特征,通过对文献全面系统的分析,揭示出其内容特征和形式特征,将其浓缩于只言片语中,从而表达文献的基本信息。

2、组织功能:信息著录后形成的款目或记录,是编制目录的基础,也是组织数据库数据的基本单元。

文献编目包括信息著录和目录组织两步。

信息著录是对文献内容特征形式特征进行选择记录后形成款目或记录。

目录组织是将这些款目或记录按照一定组织规则编排在一起最终形成检索工具或数据库。

3、检索功能:存储是检索的第一个阶段,即将表达文献特征的有检索意义的标识通过记录组织成手工检索工具或计算机数据库,而表达文献特征的标识需要通过著录和标引来完成。

作为信息著录结果的款目或记录,记载了表达文献特征的各种标识。

三、信息著录的标准《文献著录总则》旨在根据各种类型文献的共同特点,确定文献著录原则、内容、标识符号、格式等的统一规定。

具有指导作用为信息著录提供原则性框架,并不作为文献著录的直接依据。

1、著录项目:①题名与责任者项②版本项③文献特殊细节项④出版发行项⑤载体形态项⑥丛编项⑦附注项⑧文献标准编号及有关记载项⑨提要项2、著录级次:著录文献的详简程度,分为三级:①简要级次,款目仅著录主要项目②基本级次,著录主要项目同时还著录部分选择项目③详细级次,著录全部主要项目和全部选择项目。

科技论文参考文献的著录与标引

科技论文参考文献的著录与标引

常见问题
专著著录格式
–[序号] 主要责任者.专著名[M]. (其他责任者).出版地:出版者 ,出版年:起止页码.(获取或访 问路径). • 如:[1] 王歧龙,马鸣图,吴宝榕 ,等.微合金钢-物理和力学冶金[M]. 北京:冶金工业出版社,1989:1218.
连续出版物著录格式
–[序号] 作者.题名[J].刊名, 年,卷(期):起止页码.获取或 访问路径.
学位论文著录格式
–[序号] 作者.论文题名[D]. 保存地点:保存单位,年:起 止页码.
如:[1] ×××.磨细高钛高炉渣微 粉特性及其在高性能混凝土中的 应用[D].武汉:武汉科技大学, 2002:12-18.
按正文引用先后顺序连续编码,并将序 号置于括号中。
如:钢材晶粒尺寸细化一个数量级,钢铁材料的强度可提高
•如:[3] 徐有邻.建筑用钢 筋优化诌议[J].钢铁钒钛 ,2001,22(1):7-15.
专利著录格式
–[序号] 专利所有者.专利题 名:专利国别,专利号[P] . 出版日期.获取或访问路径. •如:[3] 贾连弟.净化钢液用 复合剂及使用方法:中国专利 ,91112693 [P].1995-03-10.

参考文献的著录原则
必要性、时效性、 准确性、公开性
• 亲自阅读过的、必要的、最新的文献, 不罗列众所周知的教材、教科书内容等 • 公开发表的 • 标准化著录格式
参考文献的著录方法
GB/T7714-2005
随文标注法 • 顺序编码制√ • 著者-出版年制
(1)为了省事,随意转引二手文献,既 不核对,自己也没有看过或浏览过,引用 是否恰当、准确,一般很少考虑。 (2)阅读的是中文文献,引用的是外文 文献。 (3)不注意时效性,文献年限久远。 (4)有文献表,但无相关标引。 (5)标引序号与文献序号不一致。 (6)上角标还是文献叙述部分不清。 (7)著录缺项。

信息著录法

信息著录法

·机读目录著录法
MARC(Machine Readable Catalogue)是 “机器可读目录”,是以代码形式结构和特定结构记 录在计算机存储载体上的,可用计算机识别与阅读的 目录。
MARC数据最早产生于美国。1961年,美国国会图 书馆开始图书馆自动化的设想,从此进行了多年的研 究与实验,不断取得新成果,并推动其他国家相继采 用MARC格式建立自己的机读目录系统。 为了与其他国家和地区的MARC版本区分开,1983 年美国国会图书馆将其MARCII改称为USMARC。
《普通图书著录规则》,《连续出版物著录规则》, 《非书资料著录规则》,《地图资料著录规则》, 《档案著录规则》,《古籍著录规则》, 《检索期刊条目著录规则》,《文后参考文献著录 规则》等。
《文献著录总则》与各个著录分则在编制结构和内 容上基本保持一致,正文部分一般由引言、名词术 语、著录项目、著录项目标识符和著录内容识别符、 著录格式、著录详简级次、著录用文字、文献类型 标识符、著录根据、著录项目细则等10项内容构成。 各个著录分则还有一些附录。 《文献著录总则》主要内容包括著录项目及其标识 符和著录格式两部分。 《文献著录总则》规定的基本描述项目分为9个大 项目,依次为: 题名和责任者项、版本项、文献特 殊细节项、出版发行项、载体形态项、丛编项、附 注项、文献标准编号及有关记录项、提要项。
提要项 排检项
例片
绿色政治:全球的希望/(美)卡普拉(Capra,F.),斯 普雷纳克(Spretnak,C.)著;石音译 .— 北京:东方 出版社,1988.2 373页;23cm . —(现代思想文化译丛)
书名原文:Green Politics,根据美国纽约E.P.达顿出版 公司1984年版译出。 ISBN7-5060-0009-1:2.25元

知识要点

知识要点

知识要点第一章绪论1、什么是信息组织?其成果包括哪些?(了解)2、信息组织的发展阶段(了解)第二章信息组织的形式与类型1、信息组织的主要内容(即步骤)2、什么是著录、标引?3、信息的外表特征、内容特征分别包括哪些?4、信息存取系统的类型和结构5、衡量检索效率的指标6、信息组织的类型(重点、理解)第三章元数据信息描述1、什么是元数据?(了解)3、什么是MARC、MARC元数据?4、MARC中856字段的用途5、什么是DC?DC包括几个核心元素?第四章信息揭示与标引(重点)1、信息标引的类型2、什么是索取号?由什么组成?3、几种主要多媒体数据标引方法的基本原理4、什么是自然语言?什么是受控语言?自然语言区别于受控语言的特点有哪些?5、自然语言组织的类型6、什么是全文检索7、自动标引中影响标引词选择的因素有哪些?涉及的主要技术有哪些?8、自动标引的方法有哪些?其基本思想是什么9、汉语自动分词的方法第五章信息存储与排序1、信息存储的类型(理解)2、从形式特征、内容特征、效用特征三个方面对信息排序的方法分别包括哪些?(理解)第七章分类组织系统(重点)1、什么是分类法?包括哪些类型?2、什么是体系分类法?其主要代表有哪些?3、什么是组配式分类法?其主要代表有哪些?4、什么是体系-组配式分类法?其主要代表有哪些?5、分类法中基本标记符号包括哪些类型?6、常用标记制度包括哪些?7、《中图法》、《科图法》、《DDC》、《UDC》分别采用什么标记符号和标记制度?第八章主题组织系统(重点)1、什么是主题法?主题法有什么特点?2、主题法包括哪些类型?3、主题法参照系统的构成4、几种代表性主题法中哪些是自然语言,哪些是人工语言?5、主题法和分类法的比较6、什么是范畴索引、词族索引?7、什么是后控制?8、如何利用主题组织对搜索引擎进行改造第十章网络信息组织(重点)1、数据挖掘技术在信息组织中的应用2、什么是SGML、XML?具有哪些特性和优势?3、什么是元搜索引擎4、搜索引擎的结构5、搜索引擎对搜索结果进行排序的依据6、搜索引擎的发展趋势选择:16×1.5=24分判断:8×1=8分名词解释:4×3=12分简答:4×8=32分论述:2×12=24分。

第2章 信息描述与著录

第2章  信息描述与著录
第2章 信息描述与著录
信息组织的主要内容包括:对信息的外在 特征(也称语法特征)进行选择、记录与 描述;对信息的内容特征(也称语义特征) 进行揭示、标引与编码;对信息记录进行 存储与特征排序;针对用户需求对特定信 息进行重组与开发以提高信息质量,促进 信息增值。
2.1 概述 信息描述与著录是根据特定的信息管理规则和技 术标准,将存在于某一物理载体上的信息记录的 外在特征和部分内容特征进行选择、描述和记录 的过程。对信息进行描述与著录主要着眼于信息 的外在特征和物质形态特征,如题名、责任人、 出版事项等。在这一过程中,若干著录事项按照 一定的规则和格式组织起来,便形成了关于某文 献的信息款目。成千上万条信息款目再按一定的 规则进行排列与组织即成为信息加工的最终产品 之一——目录、题录、文摘、索引和数据库等。 之一——目录、题录、文摘、索引和数据库等。
(1)元数据应用规范的构建 1)确定元数据标准 2)建立元数据标准使用规范 3)考虑元数据的表达语言 4)确定元数据应用规则 (2)元数据信息构建步骤 1)需求调查 2)建立规范 3)实现平台 4)人员培训 5)组织数据 6)数据维护
(4)XML(可扩展标记语言) XML(可扩展标记语言) XML是SGML在Web应用服务上的一个重要分支, XML是SGML在Web应用服务上的一个重要分支, 它是一种元标记语言,可提供描述结构化资料的 格式,它避免了SGML的繁琐但仍保持其威力, 格式,它避免了SGML的繁琐但仍保持其威力, 同时也克服了HTML因过于简单而给网络信息应 同时也克服了HTML因过于简单而给网络信息应 用带来的不便。其优点有简洁、开放、可扩充、 国际共享等。 (5)Metadata(元数据) Metadata(元数据) 元数据也称为描述数据的数据,这是一种专门用 来描述数据的特征和属性的语言标准,它也是描 述和组织Internet信息资源,发现Internet信息资 述和组织Internet信息资源,发现Internet信息资 源的工具。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.4.2.3 主题词组配标引的形式
3.5.1 自动标引概述
3.5.2 自动标引的原理
3.5 自
3.5.3.1 统计标引法


3.5.3
3.5.3.2 语言分析标引法

自动标引方法 3.5.3.3 人工智能标引法(略)
3.5.3.4.自动赋词标引法
3.5.4 自动分类
3.5.4.1 自动归类 3.5.4.2 自动聚类
3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
• 著录:在组织检索系统时,对具体信息的各种形式特征、内容 特征及物质形态等进行分析、选择和记录的过程。
• 款目/记录:按照一定的方法和规则对某一信息的内容和特征所 作的描绘结果。
– 在逻辑上代表该信息。 – 款目由一条条著录项目组成。 – 著录项目是用于揭示信息内容和形式特征的记录事项。
与 元 数
3.2.2
元数据的作用
都柏林核心元数据 DC
内容描述 外形描述 知识产权

元数据
修饰词的含义
DC的修饰词 类型:元素修饰词和编码
DC实例
体系修饰词
其他元数据规范
DC与MARC的比较
3.3
信 息 标 引
3.3.1 含义与质量 控制
3.3.1.1 含义 3.3.1.2 标引的不同方式 3.3.1.3 质量控制
• 常用著录标准:
《英-美编目条例 第2版》(AACR2)、《国际标准书目著录》 (International Standard Bibliographic Description)… 中国的《文献著录总则》(GB3972.1-83)、《西文文献著 录条例》、《连续出版物著录规则》 (GB3792.3-85)… MARC、USMARC、CNMARC
……
• 3.1.2 信息著录的标准
– 3.1.2.2 《文献著录总则》
《国际标准书目著录》(即ISBD)
《文献著录总则》(GB3972.1-83)
《普通图书著录规则》 《档案著录规则》 《连续出版物著录规则》 《非书资料著录规则》 《地图资料著录规则》 《古籍著录规则》

主题的类型与结构含 义 Nhomakorabea3.3.2.1 主题分析
主题分析的方法

3.3.2 3.3.2.2 概念转换

步骤

3.4

类 标 引
3.4.1 分类标引
3.4.1.1 基本原则(5个原则) 3.4.1.2 不同类型主题的分类标引的规则



3.4.2.1 选词规则
标 3.4.2

主题标引 3.4.2.2 组配规则
第3章 信息著录和标引
信息组织与检索
本章主要内容:
3.1 信息著录的含义和标准 3.2 机读目录与元数据 3.3 信息标引的含义与步骤 3.4 分类标引与主题标引 3.5 自动标引
huangyinghy2@
3.1
3.1.1 含 关键词:著录、对象、款目、基本要求、
215 __ $a 532页 $c 图 $d 24cm $e 光盘1片 314 __ $a 责任者规范汉译姓:尼尔森 314 __ $a 责任者规范汉译姓:凯莉 454 _1 $1 2001 $a Office XP: The complete reference $1 701 1 $a Nelson, $b StepHen L. $1 701 1 $a Kelly, $b Julia 606 0_ $a 软件包 $A ruan jian bao
一条著录记录的实例:
注:(以下“_”表示空格)
000 01103nam 2200313 4500 (头标区) 001 0000212192 005 20020703085900.0 010 __ $a 7-111-09692-4 $d CNY58.00 (含光盘) 010 __ $a 7-980007-34-4 $b 光盘 100 __ $a 20020524d2002 emky0chiy0121 ea 101 1_ $a chi $c eng 102 __ $a CN $b 110000 105 __ $a a z 000yy 106 __ $a r 200 1_ $a 中文Office XP专家 $A zhong wenO ffice XP zhuan jia $f (美) StepHen L. Nelson, Julia Kelly $g 智慧东方工作室译 210 __ $a 北京 $c 机械工业出版社 $d 2002
610 0_ $a Office XP $A Office XP
690 __ $a TP317.1 $v 4 701 _1 $a 尼尔森, $A ni er sen, $b S. L. $g (Nelson, StepHen L.) 701 _1 $a 凯莉, $A kai li, $b J. $g (Kelly, Julia) 712 02 $a 智慧东方工作室 $A zhi hui dong fang gong zuo shi $4 译
801 _0 $a CN $b XMU $c 20020527
801 _2 $a CN $b JUSTLib $c 20020701
905 __ $a JUSTLib $d TP317.1/N28
3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
• 著录的基本要求: – 准确化:著录的结果要全面、客观、准确地揭示信息 资源的内容特征和形式特征; – 规范化:要求信息著录坚持标准化著录原则,按照统 一的著录项目、著录格式、标识符号等进行著录。

义及作
作用
录用


3.1.2.1 什么是著录法

著录标准的发展(略)

3.1.2

标准

3.1.2.2
著录项目 著录项目的特点
《文献著录总则》 著录等级
著录格式
3.2
机 读 目 录
3.2.1 机读目录
机读目录概述:概念、产生与发展
格式特点
头标区
CNMARC的记录结构 MARC的发展
目次区 数据区 实例
3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
著录的作用
文本
揭示
组织
检索
• 3.1.2 信息著录的标准
3.1 (续)
• 著录法:关于如何进行著录的具体规定和具体做法。 通常包括著录原则、适用范围、著录项目、著录格式、 著录来源、著录文字、标识符号以及各个著录项目的 具体细则规定。
相关文档
最新文档