经典:第3章-信息著录和标引

合集下载

第三章 计算机检索基础知识

第三章 计算机检索基础知识
在利用计算机进行信息检索的早期,人们只是用单台计
算机的输入输出装置进行检索,用磁带作存储介质,一般为 连续的顺序检索方式。检索部门把许多用户的检索提问汇总
到一起,进行批量检索,然后把检索结果通知各个用户,用
户不直接接触计算机。
联机检索(on-line retrieval)
60年代末,由于计算机软硬件技术的不断提高,出现了一台主机带 多个终端的联机信息检索系统。联机检索是用户利用终端设备,通 过通信网络或通信线路与检索系统联机,进行“人机对话”,从检 索中心的数据库及时查找所需要的文献信息过程。 80年代,发达国家的一些计算机信息联机检索系统,通过卫星通信
注意:这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。不同的检 索系统其位置算符的表示方法不尽相同。
截词检索
截词检索就是把检索词截断,取其中的一部分,在加
上截词符号一起进行检索。
• 主要用于检索词的单复数、词性的词尾变化、词根相同的一类词, 以及同一词的拼法变异等。 • 从本质上说,截词算符是一种逻辑“或”的关系。
对信息内容特征进行标引和对信息外部特征进行著录,形成 一条信息题录,并根据信息内容作出摘要,然后将上述检索标识 与著录项目一并填入工作单,就完成了数据库建设的“数据前处 理”工作。
数据库及其编排结构
• 数据库的类型
• 数据库的构成 • 数据库的记录格式 • 数据库的编排结构
数据库的类型
按照信息处理层次划分:
A AND B:检索词A和检索词B同时出现在一条记录中。 • 其作用是缩小检索范围,提高查准率。
例如:查有关“人口控制”的文献,检索式可写成: 人口 AND 控制
逻辑或(OR)
A OR B:记录中出现检索词A或检索词B或两词同时出现 在一条记录中。 • 其作用是扩大检索范围,提高查全率。

作业:查询资料什么是著录和标引,并自行制作一份著录标引,可以是手工著录标引,也可以是机读著录标引。

作业:查询资料什么是著录和标引,并自行制作一份著录标引,可以是手工著录标引,也可以是机读著录标引。

作业:查询资料什么是著录,什么是标引,并自行制作一份著录标引,可以是手工著录标引,也可以是机读著录标引。

一.什么是著录1.定义在组织检索系统时,对具体信息的各种形式特征、内容特征及物质形态等进行分析、选择和记录的过程。

通常意义上讲的著录就是指,按照某种标准化的格式和要求(如MARC),对文献的某些被规定的特征进行描述(如责任者、题名、出版社等),形成一条一条的信息描述项,最后著录的结果就是一条关于该信息资源的书目数据记录。

2.著录的基本要求(1)准确化:著录的结果要全面、客观、准确地揭示信息资源的内容特征和形式特征;(2)规范化:要求信息著录坚持标准化著录原则,按照统一的著录项目、著录格式、标识符号等进行著录。

3.著录的作用揭示、组织、检索4.信息著录的标准(1)著录法:关于如何进行著录的具体规定和具体做法。

通常包括著录原则、适用范围、著录项目、著录格式、著录来源、著录文字、标识符号以及各个著录项目的具体细则规定。

(2)常用标准英-美编目条例第2版》(AACR2)、《国际标准书目著录》(International Standard Bibliographic Description)…中国的《文献著录总则》(GB3972.1-83)、《西文文献著录条例》、《连续出版物著录规则》(GB3792.3-85)…MARC、USMARC、CNMARC5.著录格式(1)普通图书卡片式款目著录格式正题名=并列题名:副题名及说明题名文字〔文献类型标识〕/第一责任者;其他责任者.·-版次及其它版本形式/与本版有关的责任者· -文献特殊细节·-出版发行地:出版发行者,出版发行日期(印刷地:印刷者,印刷日期)页数及卷册数:图;尺寸或开本+附件·-(丛编名/责任者,国际标准连续出版物编号;丛编编号·附属丛编)附注国际标准书号;中国标准书号(装订):获得方式提要Ⅰ. 题名Ⅱ.责任者Ⅲ. 主题词Ⅳ.分类号实例乱世佳人=Gone with the wind/(美)米切尔(Mitchell,M.著;黄怀仁,朱攸若译.·-杭州:浙江文艺出版社,1991.41034页;20cm本书另有译名:飘ISBN 7-5339-0367-6:¥10.70Ⅰ. 乱…Ⅱ. ①米…②Mitchell③黄…④朱…Ⅲ.长篇小说Ⅳ.I712.45(2)连续出版物卡片式款目著录格式正题名.分册标识,分册题名=并列题名.并列分册题名:其他题名信息/第一责任者,其他责任者.-版本.-卷期年月标识.-出版地:出版者,出版年.-文献数量;其他形态细节;尺寸+附件.-(丛刊题名;丛刊标识)出版周期附注其他题名分类号主题词ISSN=识别题名6.主要类型信息著录就是按照某种规则揭示某一信息资源的主要特征,给出信息资源的缩影。

《信息组织学》考试复习大纲(详细)

《信息组织学》考试复习大纲(详细)

第一章1、信息采集:是指根据特定的目标和要求,将分散在不同时空域的有关信息,通过特定的手段和措施采掘和汇聚的过程。

它涉及一切信息工作中的信息采集活动,包括企业和其他组织的管理者们为了实现决策、管理和控制等目标所进行的信息采集。

2、信息采集渠道:①大众传播媒体②文献③政府机构④合作伙伴⑤消费者⑥信息中介结构3、信息采集方法:问卷调查、访谈、实验研究、文献收集4、信息组织与信息检索的关系:信息检索是根据特定的需求,运用某种检索工具,按照一定的方法,从大量的信息中查找出所需信息的过程。

对信息检索进行完整描述,一般必须包括信息组织和检索两个方面。

在信息检索系统中,信息组织是依据信息资源的主题内容和特征,将无序的信息组织成有序集合。

信息组织是信息检索的基础和前提。

信息组织根据用户需要,以信息资源的一定单元为处理对象,依据预先制定的规范,对其特征加以记录,并进行标引和必要的记录,然后将这些信息记录,按照规定的方式输入检索系统。

第二章1、信息组织:就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。

2、信息组织基本内容:按照信息组织的活动类型分“信息选择、信息分析、信息描述与揭示、信息存储”按照信息组织的流程分“信息的筛选和鉴别、信息的分类和排序、信息的著录和标引、信息的编目和组织、信息的分析和研究”3、信息描述与揭示方法:一是著录,主要描述文献信息的形式特征;二是标引,主要揭示文献信息的内容特征。

4、信息组织的类型:信息组织可归为语法信息组织、语义信息组织和语用信息组织三大类型。

从广义上看,信息采集阶段的信息组织主要是一种语用信息组织;信息组织阶段的信息组织属综合型信息组织;信息检索和开发阶段的信息组织则属于优化型语用信息组织。

5、一次信息、二次信息、三次信息:一次信息是人们研究或创造性成果的直接记录,一般指公开出版的图书、期刊论文、研究报告、会议文献、学位论文、专利说明书、网上未经过处理的电子化信息等。

信息著录法

信息著录法

1999年美国与加拿大MARC排除相异性联合推出 MARC21。2001年大英图书馆也宣布采用 MARC21。 由于各国不同的机读编目格式造成书目记录共享障 碍,为了方便不同格式之间的数据转换,国际图联 (IFLA)在1977年推出UNIБайду номын сангаасARC: Universal MARC Format格式。
UNIMARC完全符合国际标准ISO2709的各项规 定,分为头标区、目次区、数据区三个区。 UNIMARC基本保持了MARCII的结构,项目设 置与内容安排大部分相同,通过改进,可容纳各种 类型文献,作为国际机读书目数据交换格式为多国 使用。
CNMARC是中国机读目录(China MachineReadable),用于中国国家书目机构同其他国家 书目机构及中国国内图书馆与情报部门之间,以标 准的计算机可读形式交换书目信息。
著录——指在编制文献目录时,对文献内容和形 式特征进行分析、选择和记录的过程。 文献信息编目工作主要可以分为两大步骤:第一 步是文献信息著录,第二步是目录组织。著录是 编目工作的基础,目录的质量在很大程度上由著 录的质量决定。 款目——指依据一定的规则和方法,对文献特征 与编目业务信息所做的记录。 其表现形式是反映文献内容特征和形式特征的著 录项目的组合,包括描述项目、检索点(标目)、 编目业务注记三部分信息。款目是组成传统目录 的基本要素。
· 传统著录法
传统著录法是相对于MARC(机读目录)著录法 和元数据(DC等)著录法而言的,是指按照《国 际标准书目著录》(ISBD)等标准和规则的要 求统一进行规范化的著录,著录方式是手工操作 或利用计算机进行分项著录,形成规范的卡片目 录,然后由手工编排各款目的著录法。 传统著录法的原理对于理解MARC著录法和以 DC为代表的元数据著录法有着很重要的意义。

全国自考《信息资源管理》真题及答案

全国自考《信息资源管理》真题及答案

全国自考《信息资源管理》真题及答案总分:100分题量:29题一、单选题(共20题,共40分)1.信息按照一定逻辑从低向高运动就构成了A.信息过程B.信息传播C.信息检索D.信息服务正确答案:A本题解析:暂无解析2.一次信息、二次信息、三次信息等的划分依据是A.言息记录方式B.信息存储介质C.信息加工处理深度D.信息应用领域正确答案:C本题解析:暂无解析3.信息资源规划是对组织管理或经营活动所需信息,从产生、获取到处理、传输及利用进行全面规划,不涉及A.业务分析B.数据架构分析C.建立数据标准D.系统设计与开发正确答案:D本题解析:暂无解析4.下列对应于技术实现层面的信息化规划是A.企业资源规划B.信息资源规划C.信息化项目规划D.信息化战略规划正确答案:C本题解析:暂无解析5.公司信息化存在的最大问题是公司分散的、独立运行的事务处理系统较多,应用系统之间缺乏数据交换与信息共享,即所谓A..IT黑洞B.信息孤岛C.IT项目泥潭D.信息污染正确答案:B本题解析:暂无解析6.信息系统的重要组成部分是人,对人员管理的重点在于人员组织机构建设、培训和A.各种文化建设B.各种制度建设C.各种文档建设D.各种标准建设正确答案:B本题解析:暂无解析7.系统集成实现的关键在于解决系统之间的互联性和A.方便性B.快捷性C.能动性D.互操作性正确答案:C本题解析:暂无解析8.为了减少意外事件引起的对信息系统的损害,首先要制定应付突发事件的A.规章制度B.审查措施C.跟踪计划D.应急计划正确答案:D本题解析:暂无解析9.信息用户的人类个体或群体的三方面特征分别是拥有信息需求、具备利用信息的能力和A.具有接受信息服务的行动B.具有实现信息需求的思想C.具有接受信息服务的思路D.具有实现信息需求的方法正确答案:A本题解析:暂无解析10.信息著录和标引的主要依据是A.数据B.元数据C.数据库D.数据结构正确答案:B本题解析:暂无解析11.对与某一研究对象相关的各种来源、各种内容的信息,按特定的目的进行归纳汇集而形成完整的、系统的信息集合的信息分析方法是A.综合法B.对比法C.相关法D.因果法正确答案:A本题解析:暂无解析12.制定信息资源管理标准的对象的内涵是A.实践经验B.重复性事物C.统一性D.最佳秩序正确答案:B本题解析:暂无解析13.系统标准化对象的整体及其相关要素有目的、有计划地制定和贯彻一个标准系统的标准化方法称为A.组合B.综合C.程序化D.简化正确答案:B本题解析:暂无解析14.1SO按专业性质设立技术委员会(TC)和若干分技术委员会(SC),TC和SC的成员分别为P成员和O成员。

第3章 信息著录和标引解剖

第3章 信息著录和标引解剖

3.4.2.3 主题词组配标引的形式
3.5.1 自动标引概述
3.5.2 自动标引的原理
3.5 自
3.5.3.1 统计标引法


3.5.3
3.5.3.2 语言分析标引法

自动标引方法 3.5.3.3 人工智能标引法(略)
3.5.3.4.自动赋词标引法
3.5.4 自动分类
3.5.4.1 自动归类 3.5.4.2 自动聚类
3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
• 著录:在组织检索系统时,对具体信息的各种形式特征、内容 特征及物质形态等进行分析、选择和记录的过程。
• 款目/记录:按照一定的方法和规则对某一信息的内容和特征所 作的描绘结果。
– 在逻辑上代表该信息。 – 款目由一条条著录项目组成。 – 著录项目是用于揭示信息内容和形式特征的记录事项。
与 元 数
3.2.2
元数据的作用
都柏林核心元数据 DC
内容描述 外形描述 知识产权

元数据
修饰词的含义
DC的修饰词 类型:元素修饰词和编码
DC实例
体系修饰词
其他元数据规范
DC与MARC的比较
3.3
信 息 标 引
3.3.1 含义与质量 控制
3.3.1.1 含义 3.3.1.2 标引的不同方式 3.3.1.3 质量控制
• 常用著录标准:
《英-美编目条例 第2版》(AACR2)、《国际标准书目著录》 (International Standard Bibliographic Description)… 中国的《文献著录总则》(GB3972.1-83)、《西文文献著 录条例》、《连续出版物著录规则》 (GB3792.3-85)… MARC、USMARC、CNMARC

文献检索(第三章)

文献检索(第三章)

社 会 科 学
自 然 科 学
(2)主题途径 主题途径
这是通过文献资料的内容主题进行检索的途径,主 题途径依据的是各种主题索引或关键词索引,主题索引 或关键词索引按检索词的字顺排列,检索者只要根据课 题确定了检索词(主题词或关键词),便可以像查字典那 样,按照字顺去逐一查找,从检索词下的索引款目,找到 所需文献的线索。 主题途径检索文献关键在于分析课题,提炼主题 概念,运用词语来表达主题概念。对于主题索引,需 要把自拟的语词同相应的词表核对。主题途径是一种 主要的检索途径。
五 文献信息检索的方法
1.常用法
常用法又称直接法,是指直接利用检索工具(系 统)检索文献信息的方法,这是文献检索中最常用的 一种方法。它又分为顺查法,倒查法和抽查法。
1.1 顺查法
顺查法指按照时间的顺序,由远及近地利用检索 系统进行文献信息检索的方法。这种方法能收集到某 一课题的系统文献,它使用于较大课题的文献检索。 例如,已知某课题的起始年代,现在需要了解其发展 的全过程,就可以用顺查法从最初的年代开始,逐渐 向近期查找。优点是漏检,误检率低,但劳动量较 大。
(1)基本部类:如中图法分五大类部:马列毛邓;哲学; 社会科学;自然科学;综合性图书。 (2)基本大类:构成分类表的第一级类目。中图法为22个 基本大类。 (3)简表:由基本大类与由其直接展开的一、二类目所形 成的类目表。 (4)详表:由简表展开的各种不同登记的类目所组成的类 目表,是文献分类的真正依据。
OPAC :是指以计算机编码形式存贮在计算机 系统内,供读者通过终端设备进行联机检索的 图书馆目录,即书目数据库的一种形式。
2.题录(bibliography 、bibliographic、citation)
题录是单篇文献外表特征的揭示和报导,即对某一文献外部特 征的描述,由一组著录项目构成一条文献记录。 题录的著录项目一般有著者,篇名及出处等,常以一个内容上 独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整 本出版物)为基本著录单位。题录在揭示文献内容的深度方面,比 目录深入,但又比文摘简单。 示例1:

信息检索教程第3章 信息著录和标引

信息检索教程第3章 信息著录和标引
31
Thank You!
32
9
第3章 信息著录和标引
中文文献的著录主要采用的是CNMARC,以共享我 国图书馆和信息部门的中文书目记录;西文文献的著录则 采用USMARC,以共享国外权威的西文书目记录。这里 重点介绍CNMARC。
CNMARC 记录
记录头 标区
地址目 次区
数据字 段区
记录分 隔符
注:各字段数据元素及其标准详细情况参见教材P47-51
影响标引质量的因素 标引深度 专指度 一致性
16
第3章 信息著录和标引
3.3.2 信息标引的步骤
信息标引的步骤包括主题分析和概念转换,也就是先 要对文献的内容进行分析,明确文献的主要内容和主题概 念,然后用分类法或主题法将其充分、准确地表达出来。
3.3.2.1 主题分析
1. 主题类型和结构
(1)单主题和多主题 (2) 显性主题和隐性主题
普通高等教育”十一五”国家级规划教材
信息检索教程
王立清 主编
第3章 信息著录和标引
本章要点
信息著录和标引是使 信息序化的过程。它通过 揭示信息的内在以及外在 特征,将分散无序的信息 重组,规范控制信息流向, 以便用户有效利用。
●介绍信息著录和标引的含义 与作用
●叙述信息著录和标引的发展 ●介绍元数据的定义与作用 ●比较机读目录MARC和都柏林
26
第3章 信息著录和标引
统计标引法
3.5.2 自动标 语言分析标 引方法 引法
词频统计法 加权标引法 n-Gram标引法 统计学习标引法
句法分析标引法 语义分析标引法
人工智能标 JAKS标引法、WorldViews标引
引法
法和MedIndEx标引法

《信息化管理与运作》期末综合练习题及答案

《信息化管理与运作》期末综合练习题及答案

《信息化管理与运作》期末综合练习题及答案一、单项选择题1. 信息技术革命最主要包括四个方面特征,下面的(A )不在其中。

A. 网络化B. 群体化C. 科学化D. 智能化2. 生产运作管理的目标是高效、灵活、( C )地生产合格产品或提供满意服务。

A. 安全、环保B. 盈利、快速C. 准时、清洁D. 可靠、稳定3. 信息化绩效评价具有( B )等特征。

A. 复杂性、客观性、科学性B. 间接性、长期性、互补性C. 间接性、灵活性、非价值性D. 准确性、灵活性、可靠性4. 在信息系统维护工作中,通常( C )所占比重最大。

A. 改正性维护B. 适应性维护C. 完善性维护D. 预防性维护5. 企业经营战略具有(B )、竞争性、纲领性等特征。

A. 经营性、协作性B. 全局性、长远性C. 整体性、市场性D. 最优性、挑战性6. 项目控制管理主要包括项目范围、( A )、成本、质量控制等方面。

A. 进度B. 预算C. 决算D. 数量7. 信息化项目管理是对信息化项目过程的( D )、实施、收尾等各个环节进行指导和监控。

A. 设计、安排B. 核算、决策C. 控制、落实D. 启动、计划8. 信息化组织机构可以归结为( D )种类型。

A. 1B. 2C. 3D. 49. CIO的含义是( A )。

A. 信息主管B. 业务员C. 信息员D. 联络员10. 企业不必向( C )提供财务信息。

A. 税务部门B. 投资者C. 其他企业D. 债权人11. 信息技术最主要包括四个方面技术,下面的( B )不在其中。

A. 计算机技术B. 数字媒体处理技术C. 传感技术D. 控制技术12. 企业信息化建设需要构建信息网络,它需要具体地建设企业的( A )。

A. 内网、外网、互联网B. 通信网、局域网、广域网C. 数字网、电话网、办公网D. 电话网、电脑网、无线网13. 下列的( A )不属于人力资源的四个特点之一。

A. 稀缺性B. 能动性C. 智力性D. 社会性14. 评价指标体系应该遵循( D )、可行性、重点性、动态性等原则。

信息著录法

信息著录法

《国际标准书目著录》(ISBD)在国际编目领域 的影响极其深远,在统一各国文献信息著录条例、 实现目录著录国际标准化方面做出了重要贡献,在 亚洲、非洲、欧洲、美洲的一些国家的书目中得到 了广泛的应用,而且,许多国家还将其作为制定或 修改各种编目条例的重要参考依据。
《文献著录总则》
我国国家标准《文献著录总则》(GB3792.1-83) 由全国文献工作标准化技术委员会提出,全国文献 工作标准化技术委员会第六分委员会起草,国家标 准局1983年7月2日发布,1984年4月1日起实施。 其后,又颁布了与《文献著录总则》配套的适合各 源自类型文献著录的一系列国家标准。包括:
中国机读目录研制开始于20世纪70年代。1986年, UNIMARC中译本面世,以此为基础,根据我国实 际情况,编制了《中国机读目录通讯格式》讨论稿, 1992年2月正式出版《中国机读目录通讯格式》, 即CNMARC。
CNMARC格式为我国机读目录实现标准化、与国 际接轨,从数据结构方面提供了保障。
机读目录中的这类编目业务注记内容更丰富,如头 标区中的记录状态、编目等级,以及数据区中的国 际使用字段、国内使用字段等,其作用主要是用于 机构内部索取文献和管理文献,或者是作为更新、 管理款目或记录的依据。 不同的编目机构的具体情况不同,会使他们的编目 业务注记在品种、数量及表现形式上存在较大的差 别。 编目业务注记是文献著录信息的重要组成部分,既 是目录管理与利用的重要依据,也是文献信息管理 与利用的必要依据,在当代信息著录中具有越来越 重要的作用。
ISBN978-7-302-17155-3:37.00元
本书作为信息管理专业系列教材之一,系统地讲述了信息组织 的基本理论方法,包括„„等。
I. ①信·②面· · · · ·II.马· · ·III.信息管理-高等学校-教材 IV.G203-43

信息检索教程(第三版)PPT11

信息检索教程(第三版)PPT11
3.数据字段区 由一些可变长数据组成。数据字段区的功能块有10个,每个功能 块设立了一些相关 字段。
4.2.2 元数据
元数据的英文为 Metadata,意为关于数据的数据。在互联网中,元数据是 指描述任何 Internet数据和资源,促进互联网信息资源的组织和发现的数 据,以协助对网络资源的识 别、描述、指示其位置。
4.1 信息著录的含义和标准
4.1.1 信息著录的含义和作用
1.信息著录的含义 信息著录简称著录,是指在组织检索系统时对文献内容和形式特征进行选择和记录的
过程。信息著录是组织检索系统的基础,是信息存储过程中的一个重要环节。准确性 和规范化是信息著录的基本要求。准确性要求著录结果要全面、客观、准确地 揭示 文献或其他信息源的内容特征和形式特征。 2.信息著录的作用 信息著录的目的是为了报道和检索信息,通过著录可以浓缩文献信息的特征,起到揭 示文献、报道文献,帮助人们快速地了解文献,进而选择自己所需文献的作用。
的信息为止,经过一系列工 序、采用多种方式与手段,最终形成记载文献相关信息的款 目或记录。 (3)检索功能 作为信息著录结果的款目或记录,记载了反映文献特征的可供检索的各 个标识。
4.1.2 信息著录的标准
信息著录标准是指在描述信息过程中所要依据的规则和条例,是实现信息著录标准化 的前提和根本。信息著录标准包括国际标准和国家标准。
4.1.1 信息著录的含义和作用
信息著录 的作用具体如下: (1)揭示功能 信息著录主要反映的是文献本身 所具有的特征,在对文献全面系统分析、选出最具有代
表性的特征后,通过概括而精练地 叙述内容特征,以及简略而准确地描述形式特征。 (2)组织功能 信息著录从分析文献的内 容特征和外表特征开始,到记录下各种与文献报道和检索有关

信息组织知识点汇总

信息组织知识点汇总

知识点汇总第一章1、信息组织的定义以用户需求为导向,依据信息体自身的属性特征,信息工作者或用户按照一定的原则、方法和技术,将杂乱无章的信息整理成为有序的信息集合的活动和过程。

2、信息组织的原理基本原理:如果有若干自然状态的无序信息资料,将这些信息资料按照某种属性特征排列成一个序列,并且需要使用信息资料的用户能将自己的需求转换成相应的信息资料属性特征,并在排列后的信息资料序列中找到自己所需要的信息资料.信息组织由信息著录标引(信息描述揭示)和信息序化两个工作环节组成。

3、信息组织的内容一般而言,信息组织包括四项内容。

1.信息筛选(甄别有用信息,剔除无用信息)2.信息分析(对信息的内外部特征进行细化、挖掘、加工整理并归类)3.信息描述与揭示(对信息资源的部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录的过程)4.信息整序与存储(按照一定的格式和顺序存储在特定的载体中)4、信息组织的类型按信息的认识层次划分,信息组织有三种类型1。

语法信息组织(研究语言符号之间的形式范畴的结构规则,如:字顺法、代码法、地序法、时序法)2。

语义信息组织(研究信息的内容特征的组织方法,如:分类法、主题法)3.语用信息组织(研究环境与使用者的不同而不断变化的信息群,如:权重值信息组织法、概率组织法)5信息组织的作用控制整序提升品质传播利用节约成本第二章1、熵(entropy)最早是热力学上的一个符号,是一种测量在动力学方面不能做功的能量综述.熵指的是混乱的程度,负熵是物质系统有序化、组织化、复杂化状态的一种量度。

香农第一次将“熵”引入到信息论中,在信息论中,“熵"可以用作某件事不确定度的量度.信息量越大,体系结构越规则,功能越完善,熵就越小.利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储等活动.学术界目前普遍接受的观点是“信息即负熵”。

2、逻辑学原理在信息组织中的应用概念之间的关系(图略):相容关系同一关系:是指有相同外延的两个概念之间的关系。

信息著录与信息标引

信息著录与信息标引

信息著录与信息标引一、什么是信息著录1、定义。

“文献是记录有知识的一切载体。

著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。

著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。

”通常意义上讲的著录就是指,按照某种标准化的格式和要求(如MARC),对文献的某些被规定的特征进行描述(如责任者、题名、出版社等),形成一条一条的信息描述项,最后著录的结果就是一条关于该信息资源的书目数据记录。

2.主要类型。

信息著录就是按照某种规则揭示某一信息资源的主要特征,给出信息资源的缩影。

因此对所有的信息资源类型都可以进行著录。

录音资料、电影与录像资料、微缩品、测绘制图资料、电子资源都可以进行著录,但最早也是最普遍的著录形式还是纸质书籍的著录。

3、信息著录的主要方式。

以图书的著录为例。

为了更好的实现信息资源的共享,著录时通常是遵循统一的格式,如,最常见的MARC。

MARC会给出所要著录的款目、使用的符号和代码、著录的格式、著录款目的顺序以及特殊情况下的处理方式(如多责任者、多语种、信息不详、信息明显错误等)。

编目人员要做的就是按照规定,使用受控的语言,逐条填写个款目的内容。

(当然有些款目是不必要填写的,也有相应规定。

)图一、图二给出了MARC工作界面的截图和一条完成的书目记录。

二、信息著录的意义。

1、信息组织的意义。

信息著录是信息组织的一种具体的方法,信息组织实现的意义也就是其所有具体方法的意义,当然也包括信息著录。

信息组织是使无序信息有序化的过程,起最终目的是使主体(人)能够“更好”的利用信息。

这里的“更好”包括更加方便、快捷的检索信息、准确定位所需的特定信息、获得最有价值的信息等,这些也都是信息著录可以实现的效果。

2、信息著录本身的意义。

除了信息著录作为信息组织的具体方式而具有的普遍的意义,它作为一种区别于其他信息组织方式的具体的方法,同时具有它本身的特殊功能。

信息著录所要解决的问题是揭示某一信息整体的、完整的、概要的特征,既包括外在的信息载体的特征的揭示,也包括内在的信息内容特征的揭示。

信息检索与利用考点总结

信息检索与利用考点总结

注:考试时,务必带上2B铅笔、橡皮擦,签字笔。

考试题型:填空、简答、单选、多选、判断第一章绪论1、信息素养的概念、具体内容(内涵)答:概念:具有信息素养的人能够知道什么时候需要信息,能够有效地获取、评价和利用所需要的信息。

具体内容(内涵):信息意识:敏感度信息知识:信息基本知识,检索技术等信息能力:选择能力、收集能力、判断能力、处理能力、利用能力信息道德:抵制不良信息、过滤粗糙信息、选择有利信息2、搜商的概念答:第一:搜商仅指人们运用搜索引擎的智力。

这是狭义的“搜商”概念。

第二:搜商是指运用物质性工具进行搜索的智力。

这是一种广义搜商的概念。

第三,搜商应指人们所有搜索行为的智力。

这是最广义的“搜商”概念,我们不妨叫它“泛搜商”。

3、信息检索的意义答:1)信息检索是大学生必备的基本素质2)信息检索是科学研究的重要前提3)信息检索是培养创新型人才的重要基础4)信息检索是个人终身学习的基本保障4、信息、知识、情报和文献的定义、关系;信息的基本特征;情报的属性;构成文献的基本要素。

答:定义:信息:信息是自然界、人类社会和人类思维活动中一切事物的存在方式和运动状态的本质属性和客观反映。

知识:知识是人们在改造客观世界的实践中所获得的认识和经验的总和。

情报:人们为解决某一个特定的问题而搜索、传递且有特定效用的知识或信息。

文献:记录有知识的一切载体。

关系: 1)包含关系:知识包含于信息中,信息包含了情报,文献也包含于信息内。

2)转化关系:文献是记录有信息或知识的载体,当文献中记录的信息或知识传递给用户,并为用户所利用时,就转化为情报。

例:图书馆馆藏图书。

3)交叉关系:情报虽大多来自文献,但也可能来自口头和实物,所以情报与文献存在交叉关系。

信息的基本特征:客观性,时效性,价值型,传递性,共享性,开发性。

情报的属性(3种):知识性(信息性)、传递性和效用性(被用户所利用)。

构成文献的基本要素(4个):1)知识内容:信息或知识2)记录符号:表达符号3)物质载体:材料4)记录手段:即将知识、信息固化到载体上的手段5、一些文献类型的特征号码(ISBN,ISSN,CN,GB2763-87,GB/T,ISO,IEC)答:ISBN:国际标准书号(唯一性)。

第3章 信息著录与标引

第3章 信息著录与标引
(一)信息标引的含义:
信息标引是指在分析文献内容的基础上,用某种检索语言把文献主题以及其 他有意义的特征标识出来,作为文献存储与检索依据的一种文献处理过程. 简单来说,标引就是依据检索语言,确定文献标识的过程.
(二)信息标引的步骤:
1.主题分析:通过讨论文献的中心思想,确定被标引文献的主题概念. 2.概念转换:以主题分析为基础,将确定的主题概念赋予检索标识的过
5
(二)元数据
1.元数据:data about data (关于数据的数据);在互联网中,
元数据是指描述任何互联网数据和资源,促进互联网信息资源 是组织和发现的数据,以协助对网络资源的识别,定位与描述.
2.元数据的作用
(1)定位与检索. (2)著录与描述.描述数据单元的数据元素包括:内容,载体, 位置,获取方式,制作与利用方法. (3)资源管理. (4)资源保护与长期保存.
(1)从标引深度划分:全文自动标引和题名自动标引; (2)从选用的标引词划分:叙词自动标引和关键词自动标引; (3)从标引方式划分:自动赋词标引和自动抽词标引; (4)从标引形成的标识划分:主题自动标引和分类自动标引.
3.自动标引的类型
统计标引法 语言分析标引法 人工智能标引法
9

(2)国内
中国国家标准《文献著录总则》 《西文文献著录条列》 《连续出版物著录规则》等
3
2.《文献著录总则》
1983年正式颁布. 目的:在于根据各种类型文献的共同特点,确定文献著录原则,内容, 标识符合,格式等统一规定. 作用:为信息著录提供原则性框架,但并不作为文献著录的直接依据. 《文献著录总则》依据《国际标准书目著录》(ISBD)规定9大著录项目, 大项下设置若干子项.
① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨

文献检索第三章

文献检索第三章

第三章计算机信息检索计算机信息检索的发展计算机检索主要经历了以下四个阶段(1)脱机检索阶段(1954-1964年)早期应用系统,利用单台计算机,以磁带作为存储介质,进行的批量或定题检索。

已基本淘汰。

脱机检索(Offline Retrieval),即批处理检索,1946年世界上第一台电子计算机问世后,20世纪50年代初就有人开始研究其在信息检索领域的应用。

1954年,美国海军武器实验站图书馆在一台电子管计算机上建立了世界上第一个计算机检索系统。

(2)联机检索阶段(20世纪60年代-80年代)进入20世纪60年代,计算机检索进入了实用和全面发展阶段。

20世纪60年代末,数据通讯网络出现,大容量计算机分时系统和强功能检索软件研制成功,使脱机检索发展到联机检索并迅速得到了推广。

20世纪70-80年代,联机检索得到迅速发展,一些联机检索系统开始向公众提供商业性服务,如DIALOG、ESA、ORBIT、BRS等许多世界著名的联机检索系统相继投入商业性运营。

联机检索的优缺点:直接利用国内外大量规范化得专业数据库进行信息检索,迅速地查到相关信息。

有较高的查全率和查准率,但联机费用较高,而且需要熟练地检索技能。

(3)光盘检索阶段 1983年,出现了一种新的存储器,CD-ROM光盘。

光盘检索具有储量极大而体积微小,要求设备简单,可随地安装,使用方便、易于操作,检索费用低(不需要昂贵的联机检索通讯费用),具有可随时修改检索策略而具有很高的查全率和查准率等优点,因而至今仍被世界各地广泛应用。

(4)网络化检索阶段进入20世纪90年代,随着卫星通讯、公共数据通讯、光缆通讯技术以及信息高速公路事业在全世界的迅猛发展,计算机情报检索走向了全球大联网。

网上资源具有信息的时效性、内容的广泛性、访问的快速性、搜索的网络性和资源的动态性五大特点,那么要及时、准确、有效地获取与自身需求相关的实用信息,对所有网络用户都非常具有挑战性。

计算机信息检索原理计算机信息检索是指人们在计算机检索网络或终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,然后再由终端设备显示和打印的过程。

第三章 信息著录和标引

第三章  信息著录和标引

三、自动分类 自动分类是指由计算机系统自动提取 信息的特征项,依据一定的算法,将信息 按内容或属性归到一个或多个类别的过程。 主要包括自动归类和自动聚类两个部分。
(一)自动归类 1981年,侯汉清从计算机管理分类表、 1981年,侯汉清从计算机管理分类表、 计算机分类检索、计算机自动分类、机编 分类表四个方面探讨了自动归类的问题, 拉开了我国关于自动归类研究的序幕。
二、信息著录的标准 (一)信息著录标准的发展 信息著录标准一直受到信息工作者的 重视,世界各国都为信息著录标准的编制 和推广付出了多年的努力和积极的探索。
(二)《文献著录总则》 (二)《文献著录总则》 1.著录项目 1.著录项目 2.著录级次 2.著录级次 3.著录格式 3.著录格式
第二节 机读目录与元数据
(二)各种类型主题文献的分类标引规则 1.单主题文献的分类标引方法 1.单主题文献的分类标引方法 2.多主题文献的分类标引 2.多主题文献的分类标引 3.相关关系主题文献的分类标引 3.相关关系主题文献的分类标引
二、主题标引 主题标引指依据一定的主题词表,对 文献的内容先进行主题分析,并赋予文献 语词标识的过程。目前,国内主要采用 《汉语主题词表》及其相关的专业词表进 汉语主题词表》 行主题标引。
第三章 信息著录和标引
第一节 信息著录的含义和标准 一、信息著录的含义和作用 (一)信息著录的含义 信息著录简称著录,是指在组织检索 系统时对文献内容和形式特征进行选择和 记录的过程。信息著录是组织检索系统的 基础,是信息存储过程中的一个重要环节。
(二)信息著录的作用 1.信息著录是揭示文献内容特征及相关信息的 1.信息著录是揭示文献内容特征及相关信息的 有效方法 2.信息著录是编制目录和建立数据库的基础 2.信息著录是编制目录和建立数据库的基础 3.信息著录结果是信息检索的主要依据 3.信息著录结果是信息检索的主要依据

信息著录与信息标引

信息著录与信息标引

信息著录与信息标引信息著录与信息标引当今我们正处于一个信息爆炸的时代。

此时信息呈现出几大特点,一是数量多,增长快,尤其是在网络环境下,这一特点表现得更加突出。

例如清华同方的《中国期刊全文数据库》,通过对2006年11月28~30日3天该数据库公布的新增论文数量的统计,平均每天增长23228篇。

由此可见,网络环境下,文献信息资源的数量非常庞大且增长速度惊人。

[1]二是新词层出不穷,据中国语言文字工作委员会做过的一个保守统计,平均每年产生800多个新词语。

[2]在这种资源种类纷繁复杂,标准不一,十分不方便用户使用的情况下。

要有一个方法来描述信息资源是非常必要的,否则,用户在未浏览完信息而只看其外在形式的情况下,是无法了解信息的概况,以判断信息资源是否符合自己的需要的。

因此,信息的著录就显得尤为重要。

著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。

[3]有了信息的著录,用户就可以在未读过文献的情况下,浏览信息著录的结果——款目或目录来对文献信息进行大致了解。

随着信息数量的急剧增多,信息著录的标准化和自动化也越来越成为信息著录的发展方向,其将使得用户在使用信息的款目和目录时更加地快捷和准确。

由此我国也在2004年出版了最新的《新编中国机读目录格式使用手册》,下面就以其为范例对什么是信息著录进行一个解释。

由于《新编中国机读目录格式使用手册》设置了184个字段,我们将主要介绍其数据字段区的常用字段。

如美国作家丹·布朗的小说《数字城堡》,我们要著录这本文献,首先是其001记录控制号:0120********其中0表示受编文献为普通图书,1表示受编文献语种为中文,20**为编目的年(由编目时间决定),******为编目流水号(视具体编目时的顺序决定)。

其次为010国际标准书号和011国际标准连续出版物号字段:010##$a7-02-004814-5$dCNY25.00(由于其不是连续出版物,所以不用011国际标准连续出版物号字段)其中010##表示这是010字段,$a7-02-004814-5表示其ISBN 号,$dCNY25.00表示其定价为人民币25元。

第3章-信息著录和标引

第3章-信息著录和标引

2021/8/14
13
• 3.1.2 信息著录的标准
– 3.1.2.2 《文献著录总则》 《国际标准书目著录》(即ISBD)
《文献著录总则》(GB3972.1-83)
2021/8/14
《普通图书著录规则》 《档案著录规则》 《连续出版物著录规则》 《非书资料著录规则》 《地图资料著录规则》 《古籍著录规则》
2021/8/14
18
• 3.1.2 信息著录的标准
3.1 (续)
– 3.1.2.2 《文献著录总则》
4.著录格式——(1)项目标识符
·— 各大项(每段起首除外) = 并列题名、并列丛编名
: 副题名及说明题名文字、出版发行者、图、副丛编名、价格(或其 它获得方式)
/ 第一责任者、与本版有关的责任者
(4) 客观性。著录项目遵循客观著录的基本原则。
2021/8/14
16
• 3.1.2 信息著录的标准
– 3.1.2.2 《文献著录总则》
3.1 (续)
3.著录级次
著录级次指著录的详细程度。所有著录项目被分为主要项目 和选择项目。 简要级次:只著录主要项目 基本级次:主要项目+部分选择项目 详细级次:主要项目+全面选择项目
2021/8/14
8
一条著录记录的实例:
注:(以下“_”表示空格)
000 01103nam 2200313 4500 (头标区) 001 0000212192 005 20020703085900.0 010 __ $a 7-111-09692-4 $d CNY58.00 (含光盘) 010 __ $a 7-980007-34-4 $b 光盘 100 __ $a 20020524d2002 emky0chiy0121 ea 101 1_ $a chi $c eng 102 __ $a CN $b 110000 105 __ $a a z 000yy 106 __ $a r 200 1_ $a 中文Office XP专家 $A zhong wenO ffice XP zhuan jia $f (美) StepHen L. Nelson, Julia Kelly $g 智慧东方工作室译 210 __ $a 北京 $c 机械工业出版社 $d 2002

信息检索第三章信息著录和标引

信息检索第三章信息著录和标引

信息检索第三章信息著录和标引第三章信息著录和标引3.1信息著录的含义和标准一、信息著录的含义信息著录:简称著录,指在组织检索系统时对文献内容和形式特征进行选择和记录的过程。

著录对象是信息,著录结果是款目或记录。

款目:指依据一定的标准方法,对一种文献或信息源的内容价值物质形态进行描述而形成的一条记录。

款目由一条条著录项目组成。

著录项目:用于揭示文献内容和形式特征的记录事项。

信息著录的基本要求:①准确性。

要求著录结果准确全面客观的揭示文献或其它信息源的内容特征或形式特征②规范化。

要求信息著录坚持标准化原则,按照统一的著录项目,著录格式,标识符号进行著录。

二、信息著录的作用1、揭示功能:信息著录主要反映的是文献本身的特征,通过对文献全面系统的分析,揭示出其内容特征和形式特征,将其浓缩于只言片语中,从而表达文献的基本信息。

2、组织功能:信息著录后形成的款目或记录,是编制目录的基础,也是组织数据库数据的基本单元。

文献编目包括信息著录和目录组织两步。

信息著录是对文献内容特征形式特征进行选择记录后形成款目或记录。

目录组织是将这些款目或记录按照一定组织规则编排在一起最终形成检索工具或数据库。

3、检索功能:存储是检索的第一个阶段,即将表达文献特征的有检索意义的标识通过记录组织成手工检索工具或计算机数据库,而表达文献特征的标识需要通过著录和标引来完成。

作为信息著录结果的款目或记录,记载了表达文献特征的各种标识。

三、信息著录的标准《文献著录总则》旨在根据各种类型文献的共同特点,确定文献著录原则、内容、标识符号、格式等的统一规定。

具有指导作用为信息著录提供原则性框架,并不作为文献著录的直接依据。

1、著录项目:①题名与责任者项②版本项③文献特殊细节项④出版发行项⑤载体形态项⑥丛编项⑦附注项⑧文献标准编号及有关记载项⑨提要项2、著录级次:著录文献的详简程度,分为三级:①简要级次,款目仅著录主要项目②基本级次,著录主要项目同时还著录部分选择项目③详细级次,著录全部主要项目和全部选择项目。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
• 著录:在组织检索系统时,对具体信息的各种形式特征、内容 特征及物质形态等进行分析、选择和记录的过程。
• 款目/记录:按照一定的方法和规则对某一信息的内容和特征所 作的描绘结果。
– 在逻辑上代表该信息。 – 款目由一条条著录项目组成。 – 著录项目是用于揭示信息内容和形式特征的记录事项。

义及作
作用
录用


3.1.2.1 什么是著录法

著录标准的发展(略)

3.1.2

标准

3.1.2.2
著录项目 著录项目的特点
《文献著录总则》 著录等级
著录格式
3.2
机 读 目 录
3.2.1 机读目录
机读目录概述:概念、产生与发展
格式特点
头标区
CNMARC的记录结构 MARC的发展
目次区 数据区 实例
11
3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
著录的作用
文本
揭示
组织
检索
• 3.1.2 信息著录的标准
3.1 (续)
• 著录法:关于如何进行著录的具体规定和具体做法。 通常包括著录原则、适用范围、著录项目、著录格式、 著录来源、著录文字、标识符号以及各个著录项目的 具体细则规定。
与 元 数
3.2.2
元数据的作用
都柏林核心元数据 DC
内容描述 外形描述 知识产权

元数据
修饰词的含义
DC的修饰词 类型:元素修饰词和编码
DC实例
体系修饰词
其他元数据规范
DC与MARC的比较
3.3
信 息 标 引
3.3.1 含义与质量 控制
3.3.1.1 含义 3.3.1.2 标引的不同方式 3.3.1.3 质量控制
• 常用著录标准:
《英-美编目条例 第2版》(AACR2)、《国际标准书目著录》 (International Standard Bibliographic Description)… 中国的《文献著录总则》(GB3972.1-83)、《西文文献著 录条例》、《连续出版物著录规则》 (GB3792.3-85)… MARC、USMARC、CNMARC ……
第3章 信息著录和标引
信息组织与检索
1
本章主要内容:
3.1 信息著录的含义和标准 3.2 机读目录与元数据 3.3 信息标引的含义与步骤 3.4 分类标引与主题标引 3.5 自动标引
huangyinghy2@
2
3.1
3.1.1 含 关键词:著录、对象、款目、基本要求、
13
• 3.1.2 信息著录的标准
– 3.1.2.2 《文献著录总则》
《国际标准书目著录》(即ISBD)
《文献著录总则》(GB3972.1-83)
《普通图书著录规则》 《档案著录规则》 《连续出版物著录规则》 《非书资料著录规则》 《地图资料著录规则》 《古籍著录规则》
905 __ $a JUSTLib $d TP317.1/N28
10
3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
• 著录的基本要求: – 准确化:著录的结果要全面、客观、准确地揭示信息 资源的内容特征和形式特征; – 规范化:要求信息著录坚持标准化著录原则,按照统 一的著录项目、著录格式、标识符号等进行著录。
3.4.2.3 主题词组配标引的形式
3.5.1 自动标引概述
3.5.2 自动标引的原理
3.5 自
3.5.3.1 统计标引法


3.5.3
3.5.3.2 语言分析标引法

自动标引方法 3.5.3.3 人工智能标引法(略)
3.5.3.4.自动赋词标引法
3.5.4 自动分类
3.5.4.1 自动归类 3.5.4.2 自动聚类
8
一条著录记录的实例:
注:(以下“_”表示空格)
000 01103nam 2200313 4500 (头标区) 001 0000212192 005 20020703085900.0 010 __ $a 7-111-09692-4 $d CNY58.00 (含光盘) 010 __ $a 7-980007-34-4 $b 光盘 100 __ $a 20020524d2002 emky0chiy0121 ea 101 1_ $a chi $c eng 102 __ $a CN $b 110000 105 __ $a a z 000yy 106 __ $a r 200 1_ $a 中文Office XP专家 $A zhong wenO ffice XP zhuan jia $f (美) StepHen L. Nelson, Julia Kelly $g 智慧东方工作室译 210 __ $a 北京 $c 机械工业出版社 $d 2002

主题的类型与结构
含 义
3.3.2.1 主题分析
主题分析的方法

3.3.2 3.3.2.2 概念转换

步骤

3.4

类 标 引
3.4.1 分类标引
3.4.1.1 基本原则(5个原则) 3.4.1.2 不同类型主题的分类标引的规则



3.4.2.1 选词规则
标 3.4.2

主题标引 3.4.2.2 组配规则
9
215 __ $a 532页 $c 图 $d 24cm $e 光盘1片 314 __ $a 责任者规范汉译姓:尼尔森 314 __ $a 责任者规范汉译姓:凯莉 454 _1 $1 2001 $a Office XP: The complete reference $1 701 1 $a Nelson, $b StepHen L. $1 701 1 $a Kelly, $b Julia 606 0_ $a 软件包 $A ruan jian bao 610 0_ $a Office XP $A Office XP 690 __ $a TP317.1 $v 4 701 _1 $a 尼尔森, $A ni er sen, $b S. L. $g (Nelson, StepHen L.) 701 _1 $a 凯莉, $A kai li, $b J. $g (Kelly, Julia) 712 02 $a 智慧东方工作室 $A zhi hui dong fang gong zuo shi $4 译 801 _0 $a CN $b XMU $c 20020527 801 _2 $a CN $b JUSTLib $c 20020701
相关文档
最新文档