第二讲信息组织方法论

合集下载

《信息组织》课件(第二章)

《信息组织》课件(第二章)
号。 2、联系符号:用于揭示同一文献主题之间联系强度的专
用符号。
.
2.2信息组织中的控制与规范
联号使用时,对某些几个主题共同使用的主题词,可使 用重复标号法。即同时标上几个联号,如果主题词为 各主题通用,还可以使用通用联号“0”
联号的特点: 联号的适用范围:
.
2.2信息组织中的控制与规范
3、职能符号
也是用户查找的对象,应当以他们为首要范畴; B、任何两个范畴中,如通过分析发现A范畴是活动对象
或是B范畴到达到的目的,那么,我们就认为A范畴在 组织文献方面最重要,从而将其置于组配次序的前头。
.
2.2信息组织中的控制与规范
范畴设置: 物质—部分—成分—性质—测度 物质—行为、操作或过程—施动者或工具 物质(产品)—种类—部分—成分—性质—过程—操作—
.
2.2信息组织中的控制与规范
(一)、引用次序 1、定义:组配次序,指复合主题标引和检索时各个
主题因素的组合次序。 (1)分类法:指类目划分标准使用的次序或不同分
面的概念在组配时被引用的先后次序; (2)主题法:字顺标题检索系统中主标题与各级子
标题使用的次序。
.
2.2信息组织中的控制与规范
2、引用次序的作用 (1)有助于标引的一致性 (2)可以避免出现错误的组配关系 (3)有助于提高主题标引的适用性
.
2.2信息组织中的控制与规范
3、引用次序的类型 1、显著性引用次序 是根据主题概念对用户心理印象的显著程度确定的次序。
(1)美国图书馆学家克特 1876 《字典式目录》。
采用自然语言中的通用术语作为标题唯一来源,同时规定 当自然语言次序中第一个语词不重要时,应当将更显著 的语词放在最前面

信息组织的方法有哪些

信息组织的方法有哪些

信息组织的方法有哪些信息组织是指将零散的信息按照一定的规律和方式进行整理和分类,以便于更好地理解和利用。

在信息爆炸的时代,有效的信息组织方法显得尤为重要。

下面将介绍一些常见的信息组织方法。

首先,分类法是一种常见的信息组织方法。

通过对信息进行分类,可以将相似的内容归纳到一起,便于查找和理解。

例如,图书馆将图书按照主题分类,商店将商品按照类型分类,这些都是分类法的应用。

分类法可以按照时间、地点、主题、类型等不同维度进行分类,从而使信息更加有序。

其次,索引法也是一种常用的信息组织方法。

索引是对信息内容的一种提炼和概括,通过索引可以快速地找到所需的信息。

在图书、期刊、报纸等出版物中,都会有相应的索引,方便读者快速找到感兴趣的内容。

在数字化时代,搜索引擎也是一种索引的应用,通过关键词检索可以找到海量的信息。

此外,时间顺序法也是一种常见的信息组织方法。

按照时间的先后顺序来组织信息,可以清晰地展现事物的发展过程和变化规律。

历史事件、生物演化、技术发展等都可以通过时间顺序来进行组织,使人们更好地理解事物的发展脉络。

另外,逻辑顺序法也是一种重要的信息组织方法。

逻辑顺序是指按照事物发展的逻辑关系来组织信息,使得信息之间的联系更加清晰和连贯。

在写作中,常常会运用时间顺序、因果关系、对比分析等逻辑关系来组织信息,使文章更具说服力和逻辑性。

最后,图表法也是一种常用的信息组织方法。

通过图表的形式将信息呈现出来,可以使复杂的信息更加直观和易懂。

统计图表、流程图、思维导图等都是图表法的应用,在教育、科研、管理等领域都有广泛的应用。

综上所述,信息组织的方法有很多种,每种方法都有其适用的场景和特点。

在实际应用中,可以根据具体的情况选择合适的信息组织方法,以便更好地理解和利用信息。

通过合理的信息组织,可以使信息更加清晰、有序,提高工作和学习的效率。

信息组织的方法有哪些

信息组织的方法有哪些

信息组织的方法有哪些信息组织是指将大量的信息按照一定的规则和结构进行整理和分类,以便于有效地管理和利用。

在信息爆炸的时代,信息组织显得尤为重要,它不仅可以帮助我们更好地理解和利用信息,还可以提高我们的工作效率和生活质量。

那么,信息组织的方法有哪些呢?首先,最基本的信息组织方法就是分类和标签。

通过将信息按照一定的属性和特征进行分类,然后给每个类别加上相应的标签,可以使得信息更加有序和易于查找。

比如,在电脑上整理文件时,我们可以按照文件类型、创建时间、重要程度等属性进行分类,并给每个文件加上相应的标签,这样就能够轻松地找到所需的文件。

其次,信息组织还可以采用时间顺序的方法。

将信息按照时间的先后顺序进行排列,可以清晰地展现事物的发展过程和变化轨迹。

比如,在写历史事件的论文时,我们可以按照时间顺序将事件进行排列,这样读者就能够更加清晰地了解事件的发展过程。

另外,信息组织还可以采用地域和空间的方法。

将信息按照地域和空间的不同特征进行整理,可以使得信息更加直观和具体。

比如,在地图上标注不同地区的气候、人口分布等信息,可以帮助我们更好地了解各地的情况。

此外,信息组织还可以采用逻辑和层次的方法。

将信息按照逻辑关系和层次结构进行整理,可以使得信息之间的联系更加清晰和有条不紊。

比如,在写论文时,我们可以采用逻辑结构,将论点、论据、结论等信息按照一定的逻辑顺序进行组织,这样可以使得论文的逻辑性更加强大。

最后,信息组织还可以采用图表和图形的方法。

通过图表和图形的形式展现信息,可以使得信息更加生动和直观。

比如,在做数据分析时,我们可以通过柱状图、折线图等形式展现数据,这样可以使得数据更加易于理解和比较。

综上所述,信息组织的方法有很多种,每种方法都有其适用的场景和优势。

在实际应用中,我们可以根据具体的情况选择合适的方法,以便更好地组织和利用信息。

信息组织的目的是为了使得信息更加清晰、有序和易于获取,从而提高我们的工作效率和生活质量。

组织信息的方法

组织信息的方法

组织信息的方法
组织信息的方法如下:
1、位置。

根据位置来组织信息。

它可以是物理位置,或者是概念上(空间上)的位置。

我们人类在进化中形成了这样的能力,在日常生活中就是这样组织位置的。

从地图导航和战争策略,到厨房调料的摆放,都是如此。

当信息有多个不同来源和场所时,位置的组织就非常重要。

2、字母表。

根据字母表顺序组织信息,是一种处理随机数据的好方法,比如说姓名。

当信息量特别大时,这是最佳的组织方式之一。

我们都用过这种方式,而且知道,只要用户熟悉字母表,这种数据组织方式就非常有效。

3、时间。

这可能是人类最广泛使用的信息组织方式。

我们喜欢以线性的方式思考和归类事物。

对于一定时间段以前发生的事件,这是绝佳的归类方式。

依据时间来组织,可以轻易观察到变化,并且做出对比。

由于我们人类通过线性的方式来感知时间,这就是最佳的记录历史的方式。

4、分类。

当需要把信息按照相似性或相关性排列时,分类是最适合的组织方式。

原因是我们的大脑也以类似的方式工作,我们喜欢把类似的事物归为一类。

把事物分类编组,帮助用户更轻松找到信息所属的大类,只要他们知道自己在找什么。

这种方式与字母表相结合效果非常好。

5、层次或连续性。

当信息可以通过同一种丈量方式来组织时,就可以以量级来排列。

第二节 信息组织

第二节  信息组织

段,而一些主题检索的搜索引擎也辅助以分类索引
功能
CNKI中的组织法
搜索引擎的分类搜索

信息存储
将经过加工整理序化后的信息按一定格式与顺序存储在 特定的载体中;
第二节
信息组织概述
1.1.2 信息组织 1.信息组织的定义 2.信息组织的基本内容 3.信息组织的理论基础 4.信息组织的方法基础 5.信息组织的两大思想
3 信息组织的理论基础
1)知识组织理论
6)信息自组织论
2).系统科学论
控制论
系统论
信息论
香农(美国数学家)创立 狭义信息论是研究在通讯系统中普遍存在着的信息
传递的共同规律、以及如何提高各信息传输系统的 有效性和可靠性的一门通讯理论。 广义信息论被理解为使运用狭义信息论的观点来研 究一切问题的理论。 信息论认为,系统正是通过获取、传递、加工与处 理信息而实现其有目的的运动的。
面上揭示出了知识组织的内涵。
知识组织将文献和信息中所包含的知识
内容用词语和概念表达,采用知识工程 中的知识表达方法--OAV三元组法进行 知识标引和组织,能更有效地对网络信 息进行组织和检索。
知识组织的一般方法
储节旺将知识组织方法归纳为7种:知识表
示、知识重组、知识存检、知识聚类、知识 编辑、知识布局和知识监控
耗散结构理论比较成功地解释了复杂系统在远离平 衡态时出现耗散结构这一自然现象,并得到广泛的 应用。它已在解释和分析流体、激光器、电子回路、 化学反应、生命体等复杂系统中出现的耗散结构方 面获得了很多有意义的结果,并且正在用耗散结构 理论研究一些新的现象。诸如核反应过程,生态系 统中的人口分布,环境保护,交通运输和城市发展 等,都可当作远离平衡态的复杂系统来研究。这方 面的工作也取得了一定的进展。

信息资源组织方法论本体方法

信息资源组织方法论本体方法
信息资源组织方法论本体方法
• •
Why develop an ontology?
• To share common understanding of the structure of information among people or software agen knowledge • To make domain assumptions explicit • To separate domain knowledge from the
• 元数据方案自身难以对不同知识体系、不同“粒度”的资 源进行描述,而知识本体正是起到这个作用,从而实现异 构资源和系统之间的语义联系;
• 单纯的元数据方案对于数字资源的整个生命周期的描述非 常困难,而采用以诸如FRBR模型为基础的知识本体,这 个问题便迎刃而解,不同生命周期的知识产权属性也非常 易于描述;
• 描述:Declarative specification of entities and their relationships with each other
• 推理:Constraints and rules that permit reasoning within the ontology
Involves
hasOutput
rdfType
“平明版”
“1952”
Involves hasInput
hasOutput
atTime
rdfType
atTime
“安徽文艺版
“1990”
………
docin/sundae_meng
图2:ABC本体模型描述傅雷翻译作品《约翰 克里斯朵夫》
本体描述语言OWL
different time instants. • 总是有一些事件发生一些过程有一些对象会参与There are

教学课件第二讲信息组织方法论

教学课件第二讲信息组织方法论
同义词和近义词通过“等价关系”联系起来the linking of synonymous and nearly (quasi) synonymous terms through equivalence relationship USE and UF
通过修饰揭示同形异义情况the disambiguation of homographs Qualifier
主题法的类型
• 叙词法,又称主题词法Thesaurus
– 以规范化的自然语言语词作为文献主题的标识, 通过叙词的概念组配表达主题概念。
– 20世纪50年代末提出。吸取了元词法、标题法 以及分面组配分类法的优点而发展起来
– 能够多向成族、多检索途径、多因素组配、灵 活扩检/缩检/改变检索范围
– 灵活性、专指度、可扩展性俱佳
《汉语主题词表》
• 1975 年,中国情报所、北京图书馆、国防科工委 情报所、电子科技情报所、六二八所、机械科技 情报所等单位组建全国1048个单位、7519人参加 的《汉语主题词 表》研究编辑工作,是全国汉学 信息处理系统工程(简称748工程)的组成部分, 目的是建立全国统一的联机情报检索网络。该主 题词表是中国第一部大型综合性 检索工具书,全 书包括主表、附表、词族索引、范畴表、英汉对 照索引等、共分3卷10个分册。其收词范围之广、 编辑技术之先进、结构体系之严谨,当时是国内 外一流的。该成果获1985年国家科技进步二等奖。
叙词表详解 (略)
Introduction
• Thesaurus 的原义为:Treasury, Collection • 通常用于同义字字典。
“A book of words and their synonyms”(Merriam-
Webster’s Dictionary) “A book of words that are put in groups together according to connections between their meanings rather than in an alphabetical list.” (Longman Dictionary of Contemporary English)

信息组织方法

信息组织方法

信息组织方法
数据信息组织方法指的是把大量信息采用最有效的组织方式来结构化管理信息,以便提升使用信息的效率。

一般来讲,常用的数据信息组织方法包括结构化法、层次结构法、面向对象法、拓展网状法和关系数据库法。

结构化法基于固定的模式对数据特征进行整体划分,把不同的数据组合成不同的结构体;层次结构法基于一种树型结构建立起多重层次的数据结构;面向对象法是以数据和运算的集合的概念将原有的数据信息封装成对象;拓展网状法是根据节点和关系建立网状数据模型来存储信息;关系数据库法基于数据之间相互关联,通过特定操作来进行检索数据。

信息组织方法体系

信息组织方法体系

Information Dissemination ④See INFORMATION DISSEMINATION
③ Information Retrieval (For systems, see INFORMATION RETRIEVAL
SYSTEMS)
③ Information Use Language Translation and Linguistics ⑥ (723)
• 能形成若干检索标识,可进行多途径检索; • 完善的参照系统,可帮助选准叙词,并可进行扩检和
b2单元词表:专利工具中的《WPI-标准化主 题词表》
36
b单元词法
b3特点: 优点:强调词汇的单元化和后期
组配,因此提高了主题法的灵活 性; 缺点:由于它过分强调词汇单元 化,词汇处理方法又不甚合理,易 发生错误组配,误检率较高,故实
37
C关键词法
C1定义:以关键词作为文献主题内容的标 识和检索标识的主题法。
27
二 信息组织方法
2.1 按组织对象分:文献实体组织与文献内容 组织
文献实体组织的对象是文献,书本指的是传统 的信息资源类型,主要指印刷型的出版物,如 图书、期刊、会议论文、科技报告等。文 献实体组织是把这些文献及其著录和标引 记录组织成一个有序的系统。如图书馆的 分类排架系统、分类目录、主题目录等。
11
1.1.4 信息描述的作用和原则
• 文献目录/信息资源数据库的功能。揭 示功能;检索功能;管理功能。
• 信息描述的原则。客观性、实用性、 标准性、制度化。
12
1.1.5 信息描述理论与实践的开展
古代。 中国,分类目录《七略》、《四库全书
总目提要》 西方,亚历山大图书馆《在全部学术领

信息组织概论第二章备课讲稿

信息组织概论第二章备课讲稿

2.1信息组织发展的历史实践
近、现代信息组织实践:
➢ 第一部现代意义的分类法:1876年美国图书馆学家编制 的《杜威十进制分类体系》
➢ 现代主题法原则的确立:是以1876年科特的《字典式目 录条例》为标志的
➢ 现代文献组织发展的一个重大突破:1933年印度图书馆 学家阮冈纳赞《冒号分类法》,对现代分类法、主题法 的发展产生了巨大的影响,其中在分类领域,出现了分 面理论研究的热潮。
网格技术
网格是把整个因特网整合成一台巨大的超级计算机, 实现各种资源的全面共享。用简单的话讲,网格是 高性能计算机、数据源、因特网三种技术的有机组 合和发展,它与因特网相比具有高性能、一体化、 知识生产、资源共享等技术优点。
信息构建
信息组织的 新技术
信息过滤
信息构建就是从信息复杂的状态中抽取 本质要点,并将这些要点以清晰美观易
2.1信息组织发展的历史实践
2.1信息组织发展的历史实践
我国主题法发展至今的特点:
• 叙词语言占主导地位 • 专业词表不断涌现,词表数量持续增加 • 词表结果多样化 • 词表兼容达到一定的程度
2.1信息组织发展的历史实践
国外信息组织的历史实践 古代信息组织实践 近代信息组织实践 现代信息组织实践
学习要求
• 主要内容:本章主要讲述国内外信息组织 发展历史、发展现状以及发展 趋势。
• 了解:国内外信息组织发展历史; 数字环境下信息组织的发展现状; 信息组织的活动; 信息组织领域的新技术; 知识组织的含义。
第二章 信息组织的发展沿革
章节简介
信息组织发展的历史实践 信息组织的发展现状 从信息组织到知识组织
1
国内信息组织实践
2
国外信息组织实践

信息资源组织方法论本体方法

信息资源组织方法论本体方法

rdfType
“平明版”
“1952”
Involves hasInput
hasOutput
atTime
rdfType
atTime
“安徽文艺版
“1990”
………
图2:ABC本体模型描述傅雷翻译作品《约翰 克里斯朵夫》
本体描述语言
• 由发展而来 • 基于和 • 分个版本
知识本体的创建
本体创建阶段
建立本体的目标、范围、 需求分析
• ()较之其他资源系统,知识本体将提供什么样 的服务。
• ()知识本体和其他资源系统的关系,包括资源 的进一步映射和整合。
• ()知识本体在建设时间、进度上的要求。
本体规划
• ()明确计划中要达到的工作目标,论证工作的重要性和 必要性。
• ()明确工作的具体任务和要求,每一时期的中心任务和 工作重点;对任务进行层层分解,列出工作责任矩阵,确 定完成工作的优先次序。
• ()本体的清晰性。即本体中的术语是否被清晰无歧义的 定义。除了规范的主题、分类术语外,对本体进化产生的 概念是否给出明确、严格的语义定义。
• ()本体的一致性。即本体中的概念间的关系在逻辑上是 否严密、一致,能否支持本体在语义逻辑上的推理。
• ()本体的可扩展性。即本体可否顺利实施进化,本体能 否在层次结构上可扩充,在语义上可丰富与完善,能否加 入新的术语概念。
本体工具比较的一个案例
• 这是一个全面的对本体工具的对比。共对比了个本体工具 •
本体的种类
• 普通 (一般或常识) 本体 • ( 高层本体或顶层本体) • 领域本体 • 术语本体 • 形式本体 • 混合本体 • 表现本体 • 任务方法本体 • 局部本体
通用本体
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

主题法的类型
• 叙词法,又称主题词法Thesaurus
– 以规范化的自然语言语词作为文献主题的标识, 通过叙词的概念组配表达主题概念。 – 20世纪50年代末提出。吸取了元词法、标题法 以及分面组配分类法的优点而发展起来 – 能够多向成族、多检索途径、多因素组配、灵 活扩检/缩检/改变检索范围 – 灵活性、专指度、可扩展性俱佳
(Source: J. Aitchison, A. Gilchrist, & D. Bawden. Thesaurus Construction and Use: A Practical Manual. 3rd ed. London: Aslib, 1997. P. 47)
基本叙词关系
三类词间关系: • 等价: the relationship between preferred and non-preferred terms where two or more terms are regarded, for indexing purposes, as referring to the same concept • 层次: this relationship shows levels of superordination and subordination. The superordinate term represents a class or whole, and the subordinate terms refer to its members or parts • 相关: the relationship is found between terms which are closely related conceptually but not hierarchically and are not members of an equivalence set.
(Source: ANSI Z39.19-1993, p. 1)
结构和关系
• 叙词表必须能够揭示其所含叙词之间的结构关系An intrinsic feature of a thesaurus is its ability to distinguish and display the structural relationships between the terms it contains. • 叙词表内两类广义的关系There are two broad types of relationships within a thesaurus: – 微观层次——个体词之间的语义联系Micro Level – the semantic links between individual terms – 宏观层次——词和词间关系与主题领域的整体结构 相关Macro level – how the terms and their interrelationships relate to the overall structure of the subject field
耗子 老鼠
USE UF
老鼠 (preferred term) 耗子 (non-preferred term)
等价关系(续)
• 同义词Synonyms – terms are virtually interchangeable or regarded as the same
– – – – Popular names and scientific names Common nouns or scientific names, and trade names Standard names and slang Terms originating from different cultures sharing a common language (e.g., pavements/sidewalks) – Competing names for emerging concepts (e.g., metadata之各種中譯名) – Current or favored term versus outdated or deprecated term (e.g. dishwashers/washing-up machines)
词汇控制(续)
叙词表的词汇控制通过三种方法达成:Vocabulary control in a thesaurus is achieved through three principal means:
a) b)
c)
范围、含义说明the delineation of the scope, or meaning, of descriptors Scope Note (SN)范围说明 同义词和近义词通过“等价关系”联系起来the linking of synonymous and nearly (quasi) synonymous terms through equivalence relationship USE and UF 通过修饰揭示同形异义情况the disambiguation of homographs Qualifier
叙词表的简要历史
• 1959年杜邦公司的工程信息中心开发了首个实用的序 词表 • 1960 – the Armed Services Technical Information Agency (ASTIA) produced the Thesaurus of ASTIA Descriptors • 1961 – the American Institute of Chemical Engineers (AIChE) published the Chemical Engineering Thesaurus • 1964 – the Engineers Joint Council (EJC) published the Thesaurus of Engineering Terms • 1967 – Thesaurus of Engineering and Scientific Terms (TEST)
《汉语主题词表》
叙词表详解 (略)
Introduction
• Thesaurus 的原义为:Treasury, Collection • 通常用于同义字字典。 “A book of words and their synonyms”(MerriamWebster’s Dictionary) “A book of words that are put in groups together according to connections between their meanings rather than in an alphabetical list.” (Longman Dictionary of Contemporary English) – e.g., Roget’s Thesaurus of English Words and Phrases • 1957AD – H. P. Luhn最早以Thesaurus代表「主題索引 用语词典」(简称叙词表),并以之为词汇控制的工 具。(一說Brownson于1957正式使用叙词表一詞)
主题法的类型
• 关键词法(又称自由词)
– 直接以文献中能够表达主题概念的关键词作为 标识。来自于计算机自动抽词 – 关键词:出现在文献的题名、文摘、正文中, 能够表达文献主题,具有检索意义的语词。 – 自然语词,不做规范化处理(不受控) – 无词间关系,但编制禁用词表 – 现在计算机也能结合一定的受控功能,以提高 检索的准确性
(本頁及以下關于各種relationship的敘述,主要參考: Aitchison, Gilchrist, & Bawden, 1997, Section F)
等价关系
• Descriptors – Preferred terms • Lead-in terms (Entry terms) – Non-preferred terms • Lead-in term USE DESCRIPTOR • DESCRIPTOR UF Lead-in term • Example:
叙词法的综合性
• 与元词法和标题法一样采用自然语言,但规范控制严格, 保证标识与概念的唯一对应; • 适当采用标题法的预先组配,而不是元词法尽可能细分, 以表达组合、专有概念,减少组配误差; • 借鉴分面组配分类法,采用概念组配而不是字面组配; • 完善了标题法的参照系统; • 采用体系分类法的叙词分类索引和等级索引(词族索引), 甚至直接引入体系分类表或分面分类表,实现分类主题一 体化; • 采用关键词法的轮排方法,编制叙词轮排索引
主题法的类型
主பைடு நூலகம்法的类型
• 单元词法Uniterm
– 又称元词法,以取自自然语言、经过规范化处理的语 词作标识,通过子面组配表达主题。 – 最基本的、概念上不可再分解的词,表示文献主题 – 克服标题不足 – 后组式,易轮排(每个词)索引,灵活 – 20世纪50年代用于穿孔卡系统(最早的机检系统) – 字面分拆,语义准确性差 – 词间缺乏联系,缺乏参照系统
第二讲 信息组织方法论 第五章 主题法
刘炜 wliu@
主题法
• 直接以表示文献主题的语词作标识,提供 字顺检索途径,并主要采用参照系统结石 词间关系的标引和检索文献的方法。其中 的语词可以是自然语言,也可以是受控语 言。 (p.114)
主题法的特点
• • • • 揭示文献的内容属性 以自然语言为基础(不用标记制度) 直接以局部(语词)指代文献 以特性检索为主,族性检索通过词间的关 联达到 • 以明确性的检索为主,模糊检索通过技术 的手段达到
Brief History (cont.)
采用叙词表的目的
词汇控制
信息控制和使用词根的需求来自于对自然语言两个 缺点的克服: 多词一意Synonyms – different terms representing the same concept 一词多义Polysemes – a word with multiple meanings [in spoken language, polysemes are homonyms; in written language, they are homographs – terms with the same spelling representing different concepts. Only the latter is relevant to thesauri.]
相关文档
最新文档