[情报语言学]主题语言
我国情报语言学探讨
专指 度高 、 为读 者掌握使 用 以及词汇无滞 后 等优点 。 易
情报语 言学在 研究方法 主要包 括如下 几点 :
在计算机 检索正 在 逐 步 发展 到互联 网络 阶段 的新 形 势 下 , 情 报 语 言 学 研 究 的 基 本 课 程 应 是 如 何 使 情 报 检 索 语 言 适 应
NO .15, 01 2 0
现 代 商 贸 工 业 Mo enB s e a eId s y d r ui s Trd ut ns n r
21 O O年 第 1 5期
我 国情 报 语 言 学 探 讨
张Hale Waihona Puke 燕 ( 山大 学南方 学院外语 系 , 东 广 州 500) 中 广 1 0 0
1 情 报语 言 学概 述
造 的 人 工 语 言 , 门 用 于 各 种 手 工 的 和 计 算 机 化 的 文 献 情 专
出 , 们 在 研 究 情 报 检 索 语 言 的 同 时 , 注 意 对 自然 语 言 检 我 应
情 报 存 储 检 索 系 统 , 体 系 分 类 法 、 配 分 类 法 、 题 法 、 元 索 的 研 究 。 他 还 呼 吁 : 报 语 言 学 研 究 者 应 当 积 极 参 与 自 是 组 标 单 然 语 言 检 索 的研 究 , 前 亟 需 从 情 报 语 言 学 角 度 深 入 研 究 当 词 法 、 词 法 、 键 词 法 以及 各 种 代 码 体 系 和 引 证 关 系 追 溯 叙 关 把 法 等 的 统 称 。其 实 质 是 表 达 一 系 列 概 括 文 献 情 报 内 容 的 概 自然 语 言 检 索 方 法 , 情 报 语 言 学 的 原 理 和 方 法 引 进 自然
摘
要 : 着 电 子 计 算 机 和 网络 技 术 的 应 用发 展 , 报 语 言 学 对 图 书 馆 、 报 、 案 、 闻 、 随 情 情 档 新 出版 以及 其 他 行 业 的 影 响 也
情报学复习资料(4)
情报科学理论——第5 章情报科学的学科基础5.1 情报科学的哲学基础哲学是关于世界观和方法论的学说,是人们对于整个世界的根本看法的理论体系。
它在情报科学的学科基础中具有重要地位和作用,是情报科学推进的“思想发动机”。
于是,哲学基础是情报科学理论基础的重要组成部份。
哲学方法是情报科学研究广泛使用的科学方法之一,是情报科学理论研究的世界观和方法论。
1.波普尔的“三个世界”理论(1)波普尔的“三个世界”理论的主要内容英国哲学家卡尔·波普尔(Karl Popper)在其1972 年的《客观知识》著作中和1976 年的《没有认识主体的认识论》演讲中系统地提出了“三个世界”理论。
波普尔把世界或者宇宙万物划分为三个部份,即“三个世界”。
“世界1”指的是客观物质世界,“世界2”是主观知识或者精神状态的世界,“世界3”是客观知识世界。
(1)波普尔的“三个世界”理论的主要内容波普尔认为,“客观知识”具有自律性,可形成“一个世界”。
“客观知识”是通过人类主观精神创造的,但一旦产生,就和人类的主观精神相脱离而独立存在。
波普尔的“世界3”不仅包括一切人工制品和思想,而且还包括“任何迄今没有想到的推论”。
5.1 情报科学的哲学基础1.波普尔的“三个世界”理论(1)波普尔“三个世界”理论的主要内容“世界3”具有明显特征:第一,它是真实存在的,它能改变物质对象的世界。
第二,它具有自主性,如未被预期和未及判断的理论是“世界3”自己产生的,所以有自主性。
第三,它是永恒的,无始无终的。
它是人创造的,反过来也影响人的创造。
波普尔用蜜蜂酿制蜂蜜来比喻人类生产知识与知识的客观性。
5.1 情报科学的哲学基础1.波普尔的“三个世界”理论(2)波普尔“三个世界”理论的主要问题从根本上混淆了哲学的基本问题,即思维和存在的关系问题。
“世界3” 既包括一切人工物质产品和精神产品,也包括尚未被认识而将来可能被认识和发现的潜在对象。
这样一来,“世界3” 成为了一个虚无漂渺的世界,而且把不同性质内容划属一个世界从根本上混淆了知识同物质的界限和关系。
我国情报语言学探讨
我国情报语言学探讨随着电子计算机和网络技术的应用发展,情报语言学对图书馆、情报、档案、新闻、出版以及其他行业的影响也越来越大。
通过对情报语言学历史发展脉络的梳理,并探析在新时期下情报语言学的今后发展方向,以期能为我国情报语言学研究作出些许之贡献。
标签:情报检索语言;自然语言;情报语言学1 情报语言学概述情报语言学是指以情报检索语言和自然语言在情报检索中的应用为主要研究对象的学科,是情报检索学的一个分支。
其主要包括情报检索语言的应用和自然语言的应用两类。
所谓情报检索语言,是指根据情报检索的需要而创造的人工语言,专门用于各种手工的和计算机化的文献情报存储检索系统,是体系分类法、组配分类法、标题法、单元词法、叙词法、关键词法以及各种代码体系和引证关系追溯法等的统称。
其实质是表达一系列概括文献情报内容的概念及其相互关系的概念标识系统。
而自然语言,则是指人们在日常交流中所使用的口头形式或书面形式的语言,其与情报检索语言相比,具有标引速度快、标引难度低、标识专指度高、易为读者掌握使用以及词汇无滞后等优点。
情报语言学在研究方法主要包括如下几点:(1)结构功能分析法。
情报检索语言功能的完善,都是通过其结构的增加和改进来达到的。
因此,弄清某种结构产生什么功能,某种功能是由哪种结构产生的,产生同一种功能的不同结构的优劣,以及某种结构的适用范围和条件等,是极重要的一种研究方法。
(2)比较分析法。
将两种或两种以上情报检索语言进行比较,或将产生同一种功能的不同结构、方法进行比较,或将情报检索语言与自然语言进行比较,找出其异同及优劣。
(3)历史演进研究法。
情报检索语言一直在不断进化中,所以要了解它们所采用的各种原理和方法优缺点,可以从历史演进过程中观察那些原理和方法是如何被扬弃的。
为什么被扬弃?通过分析历史,寻找现实的切合实践的研究方法,避免重蹈覆辙。
真正做到“以史为鉴,为我所用”。
(4)理想语言设计法。
也就是说,设想某种功能较完善的理想情报检索语言,然后努力寻找达到这些理想标准的具体方法,进行编制——试用——优化,最后成为一个可以实际应用的结构形式。
语言学基础知识点
语言学基础知识点语言学是对人类语言的系统性研究,涉及语言的结构、使用和习得等方面。
它是一门复杂而精密的学科,需要掌握一系列基础知识点。
本文将介绍语言学的基础知识点,包括语言分类、语音学、语法学和语义学等内容。
一、语言分类语言是人类与世界沟通交流的工具,按照语言之间的关系,可以将语言分为以下几类:1. 语系分类:语系是指由共同祖源的语言所构成的系统,常见的语系有汉藏语系、印欧语系、阿尔泰语系等。
2. 语族分类:语族是指由同一远古时期的原始语所发展而来的一组语言,常见的语族有汉藏语族、印欧语族、阿尔泰语族等。
3. 语支分类:语支是指在一个语族内具有一定程度关系的一组语言,比如在汉藏语族中,汉语是其中的一个语支。
4. 语言类型分类:根据语言的语法结构,可以将语言分为屈折语、孤立语、辅助语等类型。
二、语音学语音学是研究语音的学科,包括音位、音韵和音系等内容。
1. 音位:音位是指在一种语言中能够区分意义的最小语音单位。
不同语言的音位差异很大,比如汉语有四个声调,而英语则没有。
2. 音韵:音韵是指研究语音的组织和规律的学科,包括音位的组合、音变规律等。
3. 音系:音系是指一个语言中所有音位的总体组织结构,可以通过音标来表示。
不同语言的音系差异很大,比如英语和法语的音系就有很大的不同。
三、语法学语法学是研究句子结构和组织的学科,包括句法、词法和语用学等内容。
1. 句法:句法是研究句子结构的学科,包括短语结构、句子成分等。
不同语言的句法结构也有很大差异,比如汉语的主谓宾结构,英语的主谓宾结构。
2. 词法:词法是研究词的形态和构词规律的学科,包括词的分类、词性等。
不同语言的词法规律也有所不同,比如汉语的词性很多,英语的词性相对简单。
3. 语用学:语用学是研究语言使用的学科,包括语境和语用的关系、指称和概括等。
语用学关注的是语言的真正意义和用途。
四、语义学语义学是研究词义和句义的学科,包括词义学和句义学等内容。
1. 词义学:词义学是研究词的意义和用法的学科,包括词义的构成、词汇关系等。
语言学基础知识
语言学基础知识语言是人类沟通交流的重要工具,它的产生和发展伴随着人类社会进步的步伐。
语言学作为研究语言现象的学科,其基础知识对于深入理解和掌握语言具有重要作用。
本文将介绍语言学的基础知识,包括语言的定义、语言的特点、语言的层次结构以及语言的变体和联系。
一、语言的定义语言是人类特有的交际工具,通过语言的使用,人们能够表达思想、交流信息。
语言可以是口头的,也可以是书面的,它包括词汇、语法、句法等要素。
语言不仅仅是为了传递信息,更反映了人们对事物的认识和思考方式。
二、语言的特点1. 交际性:语言是为了交流而存在的,通过语言可以传递信息、表达感情、进行思考和推理。
2. 符号性:语言使用指定的符号来代表特定的意义,人们通过了解共同的符号系统来理解和表达信息。
3. 音、形、义的综合性:语言包括声音、文字和语义三个要素,它们相互嵌套、相互制约,形成了语言的结构和功能。
4. 创造性:人们可以通过语言创造新的词汇、句子来表达新的概念和思想。
5. 文化性:语言与特定的文化背景紧密相关,反映了人们的文化观念、价值观和社会习俗。
三、语言的层次结构语言具有层次性和结构性,包括语音、词汇、句法和语义四个层次。
1. 语音层次:语音是语言中的基本单位,包括音素和音节。
音素是最小的语音单位,而音节则是由一个或多个音素组成的。
2. 词汇层次:词汇是语言中具有独立意义的最小单位,它们通过组合形成不同的词组和句子。
3. 句法层次:句法是语言中词汇的组织和语序的规则。
句法包括句子的结构、语法关系和句型等要素。
4. 语义层次:语义是研究词汇和句子意义的学科,它关注词汇的定义和概念,句子的意思和推理等内容。
四、语言的变体和联系语言在不同地区和社会群体中会出现一定的差异和变体,这种差异可以分为社会方言、地域方言和个体差异。
1. 社会方言:社会方言是指特定社会群体中使用的语言变体,它与群体的身份、地位等因素相关。
比如,职业方言、年龄方言等。
2. 地域方言:地域方言是指不同地域中使用的语言变体,它与地理位置、文化背景等有关。
主题检索语言的特点
主题检索语言的特点(叙词法的特点):直接性:即直接用自然语言名词术语作为标识符号,最直观、最方便,一目了然。
专指性:是指解释和查找文献主题的深度而言。
集中性:主题检索语言对反映同一主题的各个方面的文献可以达到高度集中的效果。
多元性:是指对文献主题内容采用多个主题词进行组配标引和检索,揭示与查找该文献的途径多,从而提高对文献的揭示能力和利用率。
适应性:通过增补新的主题词或通过组配,主题检索语言在表达新概念的文献和新的研究课题的资料时具有很强的适应能力。
标引就是对文献主题分析的结果赋予检索标识的过程。
主题标引:是一种将文献主题的自然语言形态,转换为主题法语言形态(叙词、标题词、关键词、单元词)的标引,这是建立主题检索系统的依据。
分类标引:是一种将文献主题的自然语言形态,转换为分类语言形态的标引,即转换成分类号码的一种标引,这是建立分类检索系统的依据。
浅标引:是一种标引深度较浅的主题标引,主要用于手工检索系统,即把文献中最重要的概念作为主题标识的标引。
深标引:是一种标引深度较深的主题标引,主要用于计算机检索系统,它反应文献中主要的和次要的概念。
标引深度是指对一片文献所赋予的全部检索标识的数量。
就主题标引而言,则指标引一篇文献平均所给予的主题词的数量。
标引等级是指将文献中的概念根据主次按等级划分,分为三个等级,一级概念标引1.一级概念标引,也称主要标引。
仅仅揭示文献的主要论点。
2.二级概念标引,也称次要标引。
3.三级概念标引,也称不要标引。
2.加权标引:是指一种采用打星号的方式区分主要、次要标引的方法。
既为所标引主题词确定IM和NIM词的过程。
加权标引的目的是突出文献重点,划分标引等级。
主题分析概念:是指根据文献存储与检索的要求,对文献内容进行分析,从中提炼主题概念,确定主题类型、剖析主题结构和确定概念间关系的过程主题分析的意义在于使标引者尽可能的掌握一定的分析方法,遵循共同的分析步骤,客服因分析不一致造成的标引不一致,保证标引的初始环节达到较高的一致性主题标引的原则一、基本原则(一)真实性(二)客观性(三)全面性(四)准确性(五)专指性(六)一致性二、选词原则(一)首选专指词(二)次选组配词(三)选择上位词或靠近义词(四)标引自由词三、选词注意事项(一)随时注意主题词的增删,尽量使用新词表。
张琪玉情报语言学语录
笔者按 张琪 玉教授 ,90年 6月 7日生 。15 13 94年 7月毕 业 于北京 大学 图 书馆 学 系。 曾 任新 疆维吾 尔 自治 区图书馆 副馆 长、 汉大 学图 书馆情 报 学 院教 授 暨 图书馆 学情 报 学研 究所 武
方 案 的主要 实 现 方法 是 : 面 分 析 +概 念 代 分
报语 言学学科 建设 》 代 自序 ] [ 3页 , 3页 ) 总 2 在计算 机检 索 日益发 展 的条 件下 , 自
然语 言具 有 不 可 阻 挡 的发 展 前 途 。 ( 代 自 [ 序] 5页 , 5页 ) 总 3 对 于高要 求 的情报 检索 来说 , 控制 是 绝对必要 的 。而 对 检索 过 程 进 行 控 制 , 是 正 情 报语 言 学 的 精 髓 。 ( 代 自序 ] [ 5页 , 5 总
检索 的要求 。 ( 同上 , , 2 ) 7页 总 7页 l 概 念逻辑 是 一种 科学 思 维方 法。 5 ( 同上 ,1页 , 3 页 ) 1 总 1 l 客观 世 界事 物 既 是 多样 性 、 差 万 6 千 别的, 又是统 一 的 、 层次 的 。将事 物概念 纳 有 入知识 分类体 系 ( 事物 和学 科 的分 类 体系 ) ,
他 文献 内容检索 方 法 ] 表达 一 系 列概 括 文 是 献情 报 内容的概念 及其 相互关 系的概念标 识 系统 , 职 能是 作 为情 报 检 索 系 统 的语 言 保 其 证 , 核心 问题是 检 索 效率 。( 张 琪 玉与 情 其 《
结合 , 体系 分类法 与组 配分类 法 的结合 , 人工 语 言 与 自然 语 言 的结 合 , 码 标识 与语 词 标 号 识 的结 合 , 系统 序列与 字顺序 列 的结合 , 不变 概 念代 码与 可变 概念体 系 的结 合 。上述 结合
第2章 情报检索语言的类型
词汇控制: 词汇选择
叙词语言
• 选择原则:出现频率;单义;组配 • 词汇类型:名词 • 先组词选择:直接以复合概念的语词形式 收入词表的词,即词组 • 后组词选择:以单元概念的语词形式收入 词表的词,即单词
词形和词义控制 词间关系控制:等同;等级;相关
32
叙词表
我国标准化手册对叙词表的定义是:叙 词表(Thesuarus)也称主题词表( Subject headings)。它是将文献标引 人员或用户的自然语言转换成规范化名 词术语的一种术语控制工具;是概括各 门或某一门学科领域,并由语义相关、 族性相关的术语组成的规范化的动态词 典。
叙词语言
性质: 概念性:具体和抽象;属种;单一和复合 规范化:词形、词义 优选处理:使用频率 组配:用两个或多个主题词组合起来表达 某一复合概念 语义关系:等同、等级、相关 动态性
30
叙词语言
特点: 直接性(直观性) 专指性:揭示文献主题内容的深度 适应性 客观性 主题集中性
20
标题词语言
标题表结构:
• 编制说明 • 主表 • 副表:副标题词(限定词)
编制:
• 积累成表法 • 通常编表法
21
标题词语言
优点:
• 标题词的单义性 • 用参照系统显示标题词间的相互关系
不足:
• 词表收词量大 • 标引缺乏灵活性 • 先组式,无法多角度检索 • 不能族性检索
22
7
情报检索语言的种类
特点:按事物集中文献,用参照系统等 方法间接显示概念或事物之间的关系, 提供事物名称的字顺检索途径。 包括: 标题法、单元词法、叙词法、关键词法 用主题词表示知识因子,用参照系统来 表示知识关联,用语词标识系统作为组 织知识的基本方式。
当代中国情报语言学的开拓者——读《张琪玉情报语言学文集》有感
当代中国情报语言学的开拓者——读《张琪玉情报语言学文
集》有感
于丽萍
【期刊名称】《信息管理导刊》
【年(卷),期】2002(015)006
【摘要】@@由北京图书馆出版社出版的《张琪玉情报语言学文集》,是庆祝张琪玉教授七十华诞的特殊贺礼.
【总页数】3页(P60-62)
【作者】于丽萍
【作者单位】武警上海指挥学院图书馆,上海,200435
【正文语种】中文
【相关文献】
1.走向自然语言与情报检索语言结合之路--与我国著名情报语言学家张琪玉教授的通讯访谈 [J], 张欣毅;张京生
2.开创情报语言学的新天地:记张琪玉教授对情报语言学的新贡献 [J], 曹树金;罗春荣;汪东波
3.张琪玉情报语言学研究方法的理论探索及其应用研究 [J], 王崇良;余朝晖
4.传承学术思想弘扬治学精神推动情报语言学发展——张琪玉情报语言学思想研讨会论文综述 [J], 包冬梅
5.情报语言学的环境趋势及其对策思考——对张琪玉教授情报语言学思想的再思考[J], 傅亮
因版权原因,仅展示原文概要,查看原文内容请购买。
情报检索语言与自然语言之分析比较
自然语 言存 在 大量 的多义 词 ,与 这些 多义 词 相 用 原文 的词语 . 一般 不 作标 引或 少 量标 引 , 以情 报 所 连 的很 多 不 同 主题 概 念 的文 献 会 被 同 时 检 索 出来 , 检索语 言 的标 引速度 比 自然 语言 的慢 。
摘 要: 在对 情报 检 索语 言和 自然语 言界 定和 比较 的基础 上 , 分析 它们在 情 报检 索 中的优越 性 和局 限 性 。 出 指
易用化 、 能化 , 智 受控 化 的 自然语 言检 索是 未 来情4. 索的发展 趋 势和 方 向 , 1 t  ̄ 同时提 出 了改进 自然语 言检 索 的
词 型主 题 检索 语 言 从 可 以表达 文 献 主题 概 念并 提 对 词 义 和词 问关 系的控 制 .从 而会 造 成 一 部 分有 用
收稿 日期 :0 6 0 — 5 20 — 8 0
作者 简介 : 淑平(9 6 )广 东 药学院 图书馆 中外文检 索刊 室 工作 , 员。 麦 17 一 , 馆
语 言 是 因情 报 检 索 需 要 而 创 制 的 一个 专 业 语 言 . 专
门应 用 于各 种 手 工 和计 算 机化 的文献 情 报存 贮 和检 索 系 统 .是 表 达 文献 主 题 概念 和 检 索课 题概 念 的人
工语 言 情 报 检 索语 言 按 其结 构 或 原理 可分 为分 类 21 检全 率方 面 . 法语 言 、 主题法 语 言和 代码 语 言三 大类 分 类法 语言
维普资讯
第2 6卷 第 5期
河南 图书馆 学刊
20 0 6年 1 O月
情报检 索语 言 与 自然语言 之分析 比较
麦 淑 平
《分类语言与主题语言》
《分类语言与主题语言》在语言学领域,研究者们常常将语言分为不同的类别。
其中,最常见的分类方式是将语言分为分类语言和主题语言。
分类语言是指那些以词类为基础进行词汇分类的语言。
在分类语言中,词汇按照它们的词性被划分到不同的类别中。
例如,英语中的名词、动词、形容词等就是词性的一种分类方式。
分类语言的一个特征是词汇的词性是固定的,即一个词的词性不会随着上下文的改变而变化。
这使得分类语言在语法上较为规范和严谨,但也可能导致词汇的灵活性和多义性较低。
主题语言则是以话题为基础进行词汇分类的语言。
在主题语言中,词汇按照它们所描述的概念或事物进行分类。
例如,中文中的“水果”、“动物”、“交通工具”等就是主题的一种分类方式。
主题语言的一个特征是词汇的分类是相对灵活的,一个词可以根据上下文的不同而属于不同的主题。
这使得主题语言在表达灵活性和多义性上具有优势,但也可能导致语法结构相对自由,不太规范。
分类语言和主题语言在词汇分类和语法结构上存在一定的差异。
在分类语言中,词汇的分类是基于词性的,词汇的形态和句法结构相对固定。
而在主题语言中,词汇的分类是基于话题的,词汇的形态和句法结构相对灵活。
这两种语言分类方式各有优劣,适用于不同的语言需求和表达目的。
需要注意的是,分类语言和主题语言并不是绝对的二分法,而是一种语言类型的理论分类。
实际上,大部分语言都同时具有分类语言和主题语言的特征,只是在程度上有所不同。
例如,英语既有一定的词类分类,又可以通过词汇的语义和上下文进行主题分类。
总而言之,分类语言和主题语言是语言学研究中常见的分类方式。
它们在词汇分类和语法结构上存在差异,分别强调了语言的规范性和灵活性。
然而,实际上大部分语言都同时具备这两种分类方式的特征,只是在程度上有所不同。
阐述主题语言的类型及特点
阐述主题语言的类型及特点主题语言指的是在文章或篇章中所围绕的主题所使用的语言,主题语言通常具有其独特的类型和特点,本文将阐述主题语言的类型及特点。
一、具象语言具象语言是指能够呈现出感官印象与形象的语言。
在文章中,具象语言通常可以通过给出生动的形象、行为、动作、情绪等来帮助读者对主题进行更加生动深刻的理解。
具象语言的使用可以让读者更好的沉浸在文本中,时刻感受到主题的真实和具体。
例如,在描述自然环境的时候,使用具象语言可以让读者感受到大自然的美妙,例如“夜空中点缀着无数繁星,如同无数个钻石打造的灯塔”,“森林之中,清脆的鸟鸣声不绝于耳”,这些生动形象的描写让读者能够感受到自然环境的美好,更好地理解自然的神奇与美妙。
二、抽象语言抽象语言指的是比较抽象、通俗的语言。
在文章中,抽象语言通常被用来阐述一些特定概念或者思想,具有更强的概括性和逻辑性。
例如,要论述一个问题的解决方案,就需要使用抽象语言来表达思路,让读者能够清晰的理解自己的言论。
例如,在阐释一个思想或者观点的时候,需要使用一些概念性的抽象语言来表达思想。
“寻求合理的目标”“实现生产效益”,这些常见的抽象语言可以帮助人们把复杂的思想概念化,让读者能够更容易地理解文章的主题。
三、感性语言感性语言指的是那些既包含抽象意义又富有感染力的语言。
在文章中,感性语言通常被用来表达一些对情感的呼唤,表达对人性深处的共鸣。
使用感性语言能够让读者感受到主题所蕴含的细腻情感,更好的理解主题所传递的人性内涵与哲思。
例如,在讲述值得信赖的人或者友谊的时候,可以使用感性语言来表达,例如“温暖如春阳的爱”,“朴实的友情是最珍贵的财富”,这些感性语言带有一种人性的情感温暖与感染力,通过这些语言的渲染,读者能够深入理解主题所蕴含的人性思考和人性追求。
四、形式化语言形式化语言是指那些通俗性不太强,具有更为技术性质的语言。
在文章中,形式化语言通常被用来表述一些具有更高复杂性的思想或者概念,通常是特定领域所使用的专业术语。
情报语言学
.检索语言(标引语言)各种情报检索系统表达文献主题概念。
检索语言的优势能简单明白又比较专指地表达文献及检索课题的主题概念;语词与概念一一对应,排除了多词一义、一词多义和词义模糊现象;能显示概念之间的关系容易将概念进行系统排列;检索时便于将标引用语和检索用语进行相符性比较检索语言的作用存储过程:一次信息(分析)—信息特征—检索语言(标引)—标识(输入)—信息检索工具(系统)(输入)—检索结果检索过程:信息需求(分析)—检索提问—检索语言(标引)—标识(检索)—信息检索工具(系统)(输入)—检索结果检索语言功能知识组织功能,保证较高的检索效率。
具体有四点功能:对文献的情报内容(及某些外表特征)加以标引的功能;对内容相同及相关的情报加以集中或揭示其相关性的功能;对大量情报加以系统化或组织化的功能;便于将标引用语和检索用语进行相符性比较的功能词汇控制指根据文献标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。
词汇控制的范围词量控制词类控制词形控制词义控制词间关系控制专指度控制先组度控制词量控制方法一个宽泛的上位词,代替若干专指的下位概念,通过表示单元概念语词的组配,表达复合概念来代替直接收入词组,减少词量。
词类控制方法控制、排除与标引和检索无关的词汇。
按照对文献主题内容揭示的要求,一般只使用名词或名词性词组。
必要时使用形容词、介词、连词和数量词。
词形控制方法一个概念只有一个语词表达。
汉字形体的控制、外来词的控制、标点和数字的控制、同义词的控制词义控制方法加限定词、加注释词间关系控制方法词间关系的揭示主要是通过等级结构、类目注释、类目参照、交替类目等实现的。
等级关系:类目的等级体系、版面的字体、字号、缩格等辅助手段。
相关关系:参见注释和内容范围注释。
等同关系:类名后的限定词或类目的同义词注释。
专指度指检索词与文献主题概念的切合程度,是影响检索语言标引质量的一个重要因素。
较高的专指度有助于提高检索的准确度,满足对特定主题文献的查找。
分类语言与主题语言比较
分类语言与主题语言比较1. 表达文献主题概念的方法不同分类检索语言是用分类号来表达文献主题概念,并按学科性质分门别类地将文献系统组织起来的语言。
主题检索语言是用语词来表达文献主题概念,它不管各语词之间相互关系如何,一律按字顺排列成主题词表,故称主题检索语言。
按选词原则,语词型检索语言又分为标题词语言、单元词语言、关键词语言和叙词型语言四种。
2. 主题概念的组织方式不同分类法按学科体系或逻辑体系组织,系统性强,反映事物的派生、隶属与平行关系。
能够直接地满足以学科或专业出发、范围较广泛的检索课题要求,但读者难以掌握新、细小、复杂主题在体系中的准确位置。
主题法是按照词的顺序来组织主题概念,依名检索,解决了分类法中难于归类的主题。
3. 标识符号不同分类法采用纯数字、纯字母或字母数字混合形式的标式符号代表其所属学科门类。
直观性差,在标引与检索过程中均需经过“概念、标识符号”的转换过程。
主题法采用自然语言中的名词术语。
经规范化处理后,作为检索标识,简明直观,易于掌握使用。
4. 标引的方法不同分类法注重于学科属性,标引采用标记系统表达,对文献资料分类基本是对号人座。
主题法则侧重于主题因素之间的关系,标引过程难度较大,它必须从文献的标题与内容中分析出主题,然后根据主题词表收词情况对主题概念进行分析转还,找到较确切表达主题概念的词。
5. 结构体系不同分类法结构体系的主体是按学科性质划分的等级层累结构的逻辑分类系统,它遵循从总到分、从一般到特殊、从低级到高级、从简单到复杂、从上位到下位,层层展开、上下隶属的逻辑序列,便于读者从学科门类进行族性检索。
主题法结构体系的主体是字顺系统,满足了读者对图书进行特性检索的需要。
6. 主要功能不同分类法的主要功能是组织分类目录和分类排列图书,这是管理图书的一种科学方法。
主题法不具有组织藏书和排架的功能,它的主要功能是组织主题目录,这一目录直接用语言文字表达出来,按字顺排列。
7. 对科技发展的适应性不同分类法是一种先组的列举式语言,受学科体系和符号的束缚,不能随学科的发展而增删某些类目。
givenandtheme语言学
givenandtheme语言学摘要:一、引言1.概述Given 和Theme 语言学的重要性2.介绍本文的目的和结构二、Given 语言学概述1.Given 语言学的定义2.Given 语言学的主要研究对象3.Given 语言学的主要理论三、Theme 语言学概述1.Theme 语言学的定义2.Theme 语言学的主要研究对象3.Theme 语言学的主要理论四、Given 和Theme 语言学的应用1.语言教学2.语言翻译3.语言障碍康复4.跨文化交流五、Given 和Theme 语言学的未来发展1.人工智能技术在Given 和Theme 语言学中的应用2.语言学领域的创新研究方向3.我国在该领域的政策和支持六、结论1.总结Given 和Theme 语言学的重要性2.展望Given 和Theme 语言学的未来发展正文:一、引言随着全球化的不断深入,语言学作为一门跨学科的领域,日益受到广泛关注。
其中,Given 和Theme 语言学作为语言学的重要分支,对于理解人类语言的本质和推动语言学领域的发展具有重要意义。
本文将从概述、应用和未来发展等方面,对Given 和Theme 语言学进行详细探讨,以期为读者提供有益的参考。
二、Given 语言学概述1.Given 语言学的定义Given 语言学,又称“给定信息语言学”,是研究语言中给定信息(即说话者已知或可推知的信息)在交际过程中的表达和理解的一门学科。
给定信息是语言交际中不可或缺的要素,对于实现有效沟通至关重要。
2.Given 语言学的主要研究对象Given 语言学的主要研究对象包括:句法、语义、语用等方面的现象。
这些现象涉及到语言结构、意义表达和交际策略等方面,共同构成了Given 语言学的研究范畴。
3.Given 语言学的主要理论Given 语言学的主要理论有:Grice 的合作原则、Levinson 的信息结构理论、Jackendoff 的认知语法等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多级标题
Brain-Diseases -Diagnosis(脑- 疾病- 诊断) Church and State -France -History -20th Century
9
标题的类型(续)
带限定词的标题
Form (Mathematics) 形式(数学) Form (Roman law) 制度(罗马法) Photography (in Scientific application) 科学摄影
13
元词法的特点
词表体积小 标引专指度高 便于从不同角度检时,容易造 成误差; 缺乏完善的参照系统, 不利于族性检索。
例如:雪崩二极管——
雪崩+二极管 工业仪表——工业+仪表 工业仪表or仪表工业??
14
3.1.3主题法的类型
叙词法
从自然语言中精选出来的,经过严格处理的语词作为文献 主题标识,通过概念组配表达文献主题的主题法。 吸收了元词法、标题法、分面组配法的优点。 形成于50年代末,60年代初期。
29
3.2叙词法的词汇控制
词义控制(2-1)
涡旋(气象) 巴黎和会(1946) 病毒(计算机)
(1)加限定词 涡旋(流体力学) 巴黎和会(1918) 病毒(医学)
30
3.2叙词法的词汇控制
词义控制(2-2)
(2)加注释
含义注释
封建社会学校 注:封建社会的各种学校,如太学、书院、私塾等 用法注释
等级关系:专指度不同的两个叙词上位叙词和下位叙词之 间的关系。
属(S):下位叙词指示符。 分(F):上位叙词指示符。
族(Z):族首词,族系关系。
功能:扩大或缩小检索范围 使用范围
属种关系 整部关系 集合概念与个体概念
35
等级关系的类型——属种关系
大风子科
芦甘属
微电机 F 微型电源电机 微型控制电机
例: 学院 注:用于高等专业学校与专业名称组配使用。例:音乐学院 Y音 乐+学院
历史注释
例: Library Catalogs Mar.1980 UF Dictionary catalogs (1968-1980) Divided catalogs(1968-1980)
31
3.2 叙词法的词汇控制
15
叙词法的发展简史:
1947-1950: Mooer 先后提出描述词情报检索情报检 索系统等术语为叙词法的发展奠定思想基础。 1957: H. Brownson 第一次正式使用叙词表。 1959: 杜邦公司编制完成第一部叙词表。 1961:美国化学工程协会编辑出版化学工程叙词表。 1960’s NASA Thesaurus 1970’s 普及至欧洲 。 1985据叙词表指南统计当时世界上正在使用的英法德 文叙词表约计 600 部。
26
3.2 叙词法的词汇控制
回忆一下:词汇控制包括哪些方面?
词类控制 词形控制 词义控制 词间关系控制
27
3.2叙词法的词汇控制
3.2.1 词类控制
① 词类控制:以简单名词和名词性词组为主,收录少量形容词。
② 词组控制:词组分解后用于组配会产生歧义的或不符合用户习 惯的则选择词组作为叙词。
19
关键词语言举例
在《计算机在道路勘测与道路设计中的应用》 一文中,每个关键词仅从题名中抽取,检索者 无论从哪一个关键词入手都会检索到文献号为 067294的文献。 道路勘测 道路设计 计算机 067294 道路设计 计算机 道路勘测 067294 计算机 道路勘测 道路设计 067294
20
3.1 主题语言概述
24
概念组配的类型
联结组配:这种组配表示几个概念之间的联系,并不形成 新的概念,只揭示参加组配概念之间的某种联系。 例如:档案学+图书馆学→ 档案学与图书馆学的关系 粤语+比较+普通话→ 广东话与普通话的异同
25
叙词组配的作用
编制叙词表时,可以控制词量、缩小词表篇幅。 美国《ASTIA标题表》10万词改为叙词表 7000多词 标引时,通过组配来保证标识表达主题概念的专指性。 提供多途径检索。 “微型柱塞式计量泵” 计量泵+微型泵+柱塞泵 三个途 径 有助于自由扩大或缩小检索范围。 能比较及时反映新事物、新学科。 文化社会学文化学+社会学
专有名词性词组 南京农业大学
专业文献中出现频次较高的 捕获粒子不稳定性 分解后没有单独意义的词组 比例税
28
3.2叙词法的词汇控制
3.2.1词形控制
(1)汉字形体的控制:选择通行的或权威规定的写法。
储气筒(正式叙词) 贮气筒(非正式叙词)
(2)外来词的控制:一般采用通用的汉语译名,除非是公认的,比译名
3
3.1 主题语言概述 3.1.2 主题法的特点
以主题为中心集中文献 分类法是以学科体系为中心集中文献 直接以语词作为检索标识 分类法以号码系统为检索标识 如:关于“茶的焙制” TS272.4(分类);茶——焙制(主题) 以字顺方式作为主要检索途径 分类法以类目之间的关系作为检索途径 “族性”与“特性”
标题法:以标题词作为文献主题标识的标引和 检索的主题法。 最早出现的一种主题法,属于列举式主题法, 先组式
8
标题的类型
单级标题
Library; Psychology; Cataloging
词组标题
California sea lion(加利福尼亚海狮,名词词组标题) Automobile supplies industry(汽车供应业,形容词词组标题) Basketball for children(儿童棒球,介词词组标题) Literature and Science(文学与科学,连词词组标题)
D 天科木科
F 大风子 芦甘属 天科木属 锡兰鹅莓 S 双子叶植物 Z 种子植物
S 大风子科
Z 种子植物
微型驱动电机
S 电机
36
等级关系的类型——整部关系
揭示地理位置中的整部关系
例:东北非 F 埃及、利比亚、苏丹 S 北非
3.1.2主题法的特点(续)
用来处理文献,编制各种检索工具及检索系统 分类法用来组织文献排架及编制分类检索工具
6
3.1 主题语言概述
3.1.3主题法的类型
按照构成原理分:标题法、元词法、
叙词法、关键词法 按照标识的组配特点分:先组式主 题法、后组式主题法。
7
3.1.3主题法的类型
标题法
列举式词表,形式直观; 定组式标题,结构固定, 含义明确; 按词表列举的标题标引, 操作简便
收词量大; 专指度不足,修订量大; 只能从规定的组配顺序入 手查找,无法从多因素、 多角度检索。
12
3.1.3主题法的类型
元词法
一种以元词作为主题标识,通过字面组配的方式表达文献 主题的主题法。 元词:用来标引文献主题的、最基本的、字面上不能再分 的语词。 元词法是后组式语言的先驱。 元词法是机械检索系统中倒排档的先驱。 例如:“化学文献主题标引”——化学、文献、主题、标 引
3.1.4 叙词法的原理——概念组配
任何一种在自然语言基础上发展起来的主题法都会遇到一 个不可克服的矛盾,那就是收词量有限的词表与海量的自 然语言词集之间的矛盾。因此,必须通过精心选择和采用 语词组配这一重要的原理和方法来表达各种文献的主题概 念。 字面组配
语词组配
概念组配
21
字面组配与概念组配
倒置标题
重要的,通用的放前面 或 利用字面成族 Chemistry,analytic 分析化学 Chemistry,Organic 有机化学
10
标题法的词间关系
通过参照揭示词间关系 被叙词法所吸收
在LCSH中,use(用),UF(代),BT(属) RT(分),RT(参)。
11
标题法的特点
16
叙词语言对其他检索语言的吸收
17
叙词语言的特点
组配准确,标引能力强; 结构完备,词汇控制严格; 适合多途径检索,检索效 率高; 对检索系统的适应性强。
词汇控制严格,词表编制 难度大; 标引规则复杂,标引难度 大,速度慢; 用户难以熟悉词表及标引 规则,给使用带来不便。
18
关键词语言
更流行。 滴滴涕(正式叙词) DDT(非正式叙词) ISBN(正式叙词) 国际标准书目(非正式叙词)
(3)标点和数字的控制:圆括号、连字符和小圆点,其他符号一般不用
(4)同义词、准同义词的控制:选一个作正式词,其余为非正式词。
马铃薯(正式词) 土豆(非正式词) 腐蚀实验(正式词) 耐腐蚀实验(非正式词) 中国民族同盟(正式词) 民盟(非正式词)
正式主题词
上位词
表示分概念或部分概念 的主题词,如金融统计 的下位词:存款统计
主题词
非正式主题词
下位词
表示与某主题词有密切 联系的主题词,如金融统计 的相关词:金融管理 文献标引和检索 时用以表达文献 主题概念的优选词
相关词
33
3.2.3 词间关系控制
等同关系:正式叙词和非正式叙词之间的关系。
用(Y):非正式叙词指示符,非正式叙词指向正式叙词。
第三章 主题语言
1
内容提要
第一节 主题法概述 第二节 叙词法的词汇控制(重点掌握) 第三节 叙词表的结构(重点掌握) 第四节 《汉表》简介 第五节 叙词表的编制与管理(掌握编制方法) 第六节 叙词表的评价