主题类型的要领及主题检索标识词序公式的扩展

合集下载

公文主题标引基础知识

公文主题标引基础知识

公文主题标引基础知识公文主题词是从公文标题中选取并转换而来,满足办公自动化和公文处理标准化需要,能够体现公文概念的词或词组。

公文关键词标引的主要依据是国务院办公厅秘书处制定的《国务院公文主题词表》。

此外,各地区、各行业都根据自己的文档处理实践制定了自己的词库。

1.关键词、词库、搜索语言是什么(1)主题词。

主题词,也称为描述性词语,是指以概念为基础,经过规范,具有组装能力,能够表现词与词之间语义关系的一些词语和短语。

主题词分为正式主题词和非正式主题词。

正式主题词用于索引和检索文档,非正式主题词是查找正式主题词的引导词。

(2)词库。

同义词库,也称为同义词库,是指从自然语言中按词序选择语义相关和家族相关的术语组成的标准化动态词典。

(3) 《公文主题词表》.《公文主题词表》是用于文档主题索引和检索的同义词库。

是为满足办公自动化特别是计算机数据处理的需要,对党政机关公文进行标引和检索的术语控制工具。

(4)搜索语言。

检索语言是根据人们检索工作的需要而创造的人工语言。

它是存储和搜索文档的通用基础,也称为索引语言。

检索语言分为分类语言和主题语言。

分类语言的概念。

它是指以阿拉伯数字或拉丁字母和数字的混合作为类别识别符号,以基本类别作为词汇,以类别的隶属关系来表达复杂概念的一种检索语言。

主题语言的概念。

它是一种检索语言,以直接讨论的事物和对象为基础,以自然语言为基本词汇,以概念之间的逻辑关系为构词方式。

二、为什么要索引公文的关键词(一)文献关键词标引有利于建立先进的文献检索系统,协助领导决策。

随着信息量和数据量的增加,简单的分类和检索方法很难满足人们对多主题文档搜索的需求。

主题检索法弥补了分类检索法的不足,检索更加自由,搜索跨度更大。

(2)对公文主题词进行标引是建立办公自动化检索系统的前提。

办公自动化系统通过文档上标注的关键词将文档带入检索系统。

在办公自动化系统中,作者通过主题词搜索与主题相关的文档。

(3)主题词标引是实现公文管理现代化的基础。

信息组织主题法

信息组织主题法
一、主题法
主题法—— 即主题检索语言。 是指以表达主题内容的词语作检索标识,
以字顺为检索途径的一种标引和检索信息资 源的方法。
主题法
标题法 单元词法
叙词法 关键词法
主题法的特征
1、以特定的事物、问题、现象,即以主题为中心集中信息资源; 2、以字顺为主要检索途径; 3、通过参照系统等方式揭示主题词之间的关系。
4、主题法的基础同样是概念逻辑和知识分类,在应用知识 分类方面主要是应用事物分类原理。
主题法的特点
可以集中与主题有关的各个方面的信息资源,检索直接性、通用性好, 适合于各种专指检索。在性能上与分类法互补。
主题法通常不用于组织图书,只广泛用于组织各种检索工具,不
仅可以编制用于手工检索的书目索引,也可以用来建立计算机检索系统, 进行机检。
图形显示
字顺表(主表。由众多的叙词款目和非叙词款目按字顺排列)
Shengchan Ziben —— 汉语拼音
叙词 ——
近百年来,主题语言经历了从标题法到元词法、叙词法、关 键词法的演变过程。
其发展趋势是——从先组式语言向后组式语言发展,从例举 式语言向组配式语言发展,从人工操作向自动处理发展,从 受控语言向规范化语言与自然语言并用发展。(重点)
1、标题法
标题法是最早产生的一种主题语言。 标题法是用规范化了的自然语言(标题),即经过标准化处理
标题法主要通过参照的方式来揭示标题词之间的联系。 早期的参照形式主要有参照、参见参照两种。
标题法的性质:
直观性
(采用列举式 词表)
语义关联性
(以参照方式对 词汇进行控制, 揭示标题之间的 相关性)
受控性(定
组式标题结构 固定,含义明 确)

信息检索05-主题语言

信息检索05-主题语言

查潘序伦的生平事迹
下位概念词,必要时增加上位
要从总体上把握课题概念。
概念词和下位概念词。
具有计时等功能的磁疗表
水果 → 梨
一种具有计时功能的表形磁疗器
有些复杂的概念可以拆分成可
揭示出课题中隐含的,但在字 替换的概念和不可替换的概念
面上没有直接表示出来的概念, 两部分,可以替换的词之间用
,剩余价值,燃料电池
缩略词
专指词、通用词与泛指词
专指词 = 专业名词
表示具体事物名称的名词术语 表示事物的状态或现象的名词术语 表示科学分类的名词术语 表示研究方法、技术方法的名词术语 表示工艺方法、加工技术的名词术语 表示化学元素、化合物、金属材料与合金的名词术语
通用词
表示国家名称、地名、组织机构名称及人名的专有名词
美国,WTO,世界知识产权组织
文献类型、文献载体和其他通用的的名词术语
专利,标准,百科全书,手稿,模型、模式
不能用作检索词的情况
词性比较复杂的词
爱国
动宾短语,相当于动词,不能作检索词用
全国
在“全国上下”中是名词,在“全国人民”中是形容词 词性不确定,不能作检索词用
去掉相对不重要的词和重叠概念
合著网络 论文产出 模式
补充隐含概念(上下位概念,可替换概念,递推概念)
合著网络 论文产出 模式 拓扑属性
主题概括注意事项
正确分析课题内容,补充隐念概念
近两年上海进口和出口货运量(吨位数)
关键词并不是越多越好,只保留最能表达课题 内容,具有实际检索意义的核心概念。
上下位关系
载重汽车
=卡车
≈承载式车体

标引公文主题词及应注意问题

标引公文主题词及应注意问题

标引公文主题词及应注意问题(一)主题词标引程序“三步”走第一步:审读文件,分析主题。

首先通读公文,了解公文的主要内容和发文意图。

一般来说,审读文件标题,进行主题词标引是文秘人员常用的方法。

如文件标题能概括公文的主要内容,就从标题入手分析主题。

否则,就要从公文的内容入手进行主题分析。

主题类型分为单主题和多主题两种。

单主题是指一份公文所研究和论述的只有一个对象或问题。

多主题是指一份公文所研究和论述的主题对象不只一个,而是两个或者更多,而且都是并列的独立主题。

单主题标引时用多个表达同一概念主题词,多主题用分组的多个主题词分别表达各自的主题概念。

分析主题重点是主题结构分析,确定主题因素。

主题结构分析即分析主题里面的主要成分和次要成分以及它们之间的关系。

主题因素分为主体因素、通用因素、位置因素、时间因素和文献类型因素五部分。

主体因素是指公文论述的主题中的关键性概念,它是公文主题的主要成分,其他主题因素都附属于这个主体因素;通用因素是构成主题的一些通用概念,它说明主体因素的动态和趋势。

通用概念没有专指性也没有独立检索价值,不宜单独使用;位置因素是表明主体因素所处的位置和范围,文件规定适用的地区、位置和对象。

位置因素包括国家名称、地区名称和组织机构名称;时间因素是从时间上对主体因素进行限定,把主题对象放在特定的时间范围之内。

时间因素包括年代、时代、朝代、期限等;文献类型因素包括文献种类、公文文种、文件名称编号等。

第二步:提炼、转换主题概念。

经过分析主题类型和主题结构后,就掌握了一份文件的全部主题概念。

对这些主题概念,并不完全需要标引出来,而应当去粗取精,有所取舍。

要提炼标引那些最重要的、专指性最强的主题概念,舍弃一般的主题概念。

对提炼出的公文真正具有检索意义的主题概念,查公文主题词表将其准确、规范、科学地转换成主题词。

1、公文主题词的选取方法主要有四:一是从公文标题中摘录;二是从公文正文中提取;三是题文结合撮要;四是自己概括。

图书馆信息组织主题法

图书馆信息组织主题法
– Automobiles(单词标题) – Budget deficits(词组标题) – Correlation(Statistics)(带限定词) – Copper ores—analysis(倒置标题) – Art, American—20th century(预先组配好的多级标题)
标题法(续)
• 方面组配的范围很广,使用也较自由,绝大多数的叙 词组配是方面组配
联结组配
• 有一种称之为联结组配或关联组配的叙词组配,其作 用是表示两个或多个事物之间的联系,实际上是方面 组配的一种特殊类型。它往往是表达不同事物的叙词 之间用表示它们之间关系的叙词联结起来
特称组配
• 特称组配,是指用一个表示事物类称的属概念叙词与 表达“种差”(待表达种概念比参与组配的那个属概 念多出某种特征)的叙词进行组配
• 标题法用参照系统显示标题之间的关系,现在的标题 法已经采用类似叙词法的参照方式。例如,LCSH(以 LCSH中"Electronic commerce"为例)
标题法(实例)
标题法优缺点
• 标题法具有主题法的共同优点:
–以事物为中心集中信息,便于从事物出发的检索, 特性检索功能较强,标识直观;
的综合。 (二)概念组配原理
概念组配是叙词法的基本原理。
(一)综合性原理
• 叙词法是多种情报检索语言的原理和方法的综 合,主要表现为:
– 叙词法与标题法和单元词法一样,采用自然语言的语词作标 识,但更严格地对自然语言语词实施规范化处理或控制,以 保证标识与概念之间的唯一对应;
– 叙词法适当采用标题法的预先组配,选用必要的词组,放弃 单元词法的语词尽可能分解原则,以减少组配操作和组配误 差;
– 具有主题法的共同优点; – 因采用组配方式,可以实现多向成族,多途径检索,多因素

主 题 法

主 题 法

中国概况》 例:《中国概况》
中国—概况 中国 概况
《年鉴编制方法》 年鉴 编制 年鉴编制方法》 年鉴—编制
4.5单主题文献的标引 单主题文献的标引
定义: 一篇文献中只研究一个中心对象或主题。 定义: 一篇文献中只研究一个中心对象或主题。 根据文献主题概念的数量和关系, (根据文献主题概念的数量和关系,又可分为 单元主题和复合主题) 单元主题和复合主题) 单元主题:不必进行组配。 单元主题:不必进行组配。 高等数学导论》 高等数学—概论 《高等数学导论》 高等数学 概论 复合主题:除从属关系以外, 复合主题:除从属关系以外,一般应进行组配 标引。 标引。
复合主题(1) 复合主题(1)
应采用交叉组配方式进行标引。 交叉关系:应采用交叉组配方式进行标引。 计算机数据通信基础》计算机通信—数据通信 《计算机数据通信基础》计算机通信 数据通信 应采用限定组配方式进行标引。 限定关系:应采用限定组配方式进行标引。 高等教育理论研究》高等教育—教育理论 教育理论—研究 《高等教育理论研究》高等教育—教育理论—研究 应用、影响、 应进行组配标引。 应用、影响、比较及相互关系:应进行组配标引。
应用关系 限定关系
交叉关系
影响关系
比较关系
4.6多主题文献的标引 多主题文献的标引
多主题文献:要分解为单主题, 多主题文献:要分解为单主题,再进行分组标引或分
组组配标引。 组组配标引 例:《激光在生物学和医学上的应用》 激光在生物学和医学上的应用》 生物学—激光应用 / 医学 激光应用 医学—激光应用 生物学 激光应用
《物理化学中的胶体化学》 物理化学中的胶体化学》
物理化学 胶体化学
一元微积分与微分方程》 《高等数学 Ⅱ 一元微积分与微分方程》

主题标引绪论

主题标引绪论

主题标引绪论主题检索语言:定义,实质,构建基础,性质与特点,类型,演变,主题标引MEDLARS检索语言:NLM简介,MEDLARS检索语言特点,我国医学文献主题标引主题检索语言定义主题法:以自然语言中的名词术语作为标识符号,并依据这些标识符号的语义和字顺,编排和组织文献信息资源建立各种查询工具和检索系统.主题法的基本要素:词语标识,语义脉络,字顺系统主题检索语言定义主题法的两种涵义:指一种用语词标识处理文献信息资源,组织主题检索工具或检索系统的方法指主题检索语言(主题标引语言)返回主题检索语言的实质实质:词汇控制,句法控制控制的缘由:主题检索语言是一种人工语言,非自然语言.自然语言是人类社会在交际中自然演变形成的,存在一义多词,一词多义,词汇表达概念模糊和不确定,词间关系不明晰等缺陷.如果不加以控制,很难满足信息检索系统的多种要求.因此对信息检索系统的基本元素——主题词进行控制是主题法的核心内容.主题检索语言的实质主题检索语言的基本成分:主题词具体体现:各种主题词表主题词之间存在两种基本关系:语义关系句法关系主题检索语言的实质词汇控制:根据文献标引和检索的需要,对自然语言中的词汇进行选择,规范并揭示其相关性的过程.目的:标识准确,单义,相关,适用,兼容词汇控制的范围:词量控制,词类控制,词形控制,词义控制,词间关系控制,专指度控制,先组度控制等专指度:检索词与文献的主题概念的切合程度主题检索语言的实质句法控制:根据文献标引和检索的需要,通过一定的组词造句规则,对检索语词的组合方式作出规定句法控制的措施:引用次序(组配次序),控制符号,句式变换返回主题检索语言构建基础概念逻辑知识分类术语学返回主题检索语言的性质与特点性质:概念化,规范化,组配性,语义性,动态性特点:直接性,专指性,集中性,多元性,适应性返回主题检索语言类型体系分类法分类检索语言组配分类法检索语言体系-组配分类法先组标题法主题检索语言单元词法叙词法后组关键词法系统分类组合时间主题检索语言类型依据标识组合时间分类:先组定组式,先组散组式,后组式(1)先组定组式语言(列举式语言):标识在编表时(标引前)就已固定组合好,标引和检索时不必或较少进行组配的一种情报检索语言.例:标题法乙型肝炎—先天性主题检索语言类型(2)先组散组式语言:标识主要供组配使用,标引时将表达主题概念的若干标识组配成标识串的一种情报检索语言.例:冒号分类法儿童图书馆:2,61主题检索语言类型(3)后组式语言(组配式语言):标识主要供组配使用,标引时不将标识组配在一起,到检索时才将标识组配起来的一种情报检索语言.单元词语言,叙词语言例:乙型肝炎/先天性主题检索语言类型依据标识是否受控分类:受控语言:标题法,叙词法,单元词法非受控语言(自然语言):关键词法主题检索语言类型主题检索语言与分类检索语言比较:主题:专指性,直接性,组配灵活分类:系统性,间接性,严密性趋势:分类-主题一体化返回主题检索语言的演变标题语言分面分类语言单元词语言;叙词语言关键词语言标题语言早期类型的主题检索语言开始:1856年,英国Crestadoro发表《图书馆的编目技术》形成:1895年出版的《美国图书馆学会标题表》和1911年诞生的《美国国会图书馆标题表》标题法:以"标题"表达文献内容主题,"标题"最初取自篇名,逐渐发展到取自文献的主题内容.标题语言优点:(1)对标题词进行规范,达到词的单义(2)对标题细分:带说明语的单级标题,如"十二指肠溃疡"多级标题,如"胃-溃疡","胃-生理","胃-肿瘤"倒置标题,如"肝炎,中毒性","肝炎,酒精性","肝炎,先天性"带限定词的标题,如"桔(树)","桔(水果)"标题语言(3)为集中同一主题的文献,将方面概念作副标题,如"病因","诊断","治疗"(4)用参照系统显示标题词间等同关系,等级和相关关系总之,大量采用词组或短语作标题,含义明确,结构稳定,专指度比较高.标题语言缺点:先组式语言,标题固定不能多元标引和多元检索,不灵活不能解决文献"集中与分散"的矛盾20世纪30-40年代,分面分类理论逐步发展,由此产生单元词法,叙词法.单元词语言早期的后组式主题检索语言20世纪50年代初,美国陶伯(M.Taube)等创立单元词法:以字面上不能再分的词汇单元——元词作标识,以字面组配表达文献主题.单元词语言优点:与标题语言一样,标识受控将"标题"分解为单元词,通过若干单元词的组配专指地表达主题概念,是后组式检索语言如:胃+肿瘤+治疗每个单元词都可作为检索入口,提供多途径检索可利用单元词的增减扩大,缩小或改变检索范围单元词语言缺点:对词组的分解是字面分解,组配也是字面组配,易导致语义失真及误检字面组配概念组配香蕉苹果香蕉+苹果香蕉味食品+苹果胃溃疡出血胃+溃疡+出血胃溃疡+消化性溃疡出血缺乏完善的参照系统,不利于族性检索叙词语言新型的后组式主题检索语言与单元词出现同期,美国穆尔斯(C. N. Mooers)创造是对单元词语言的直接继承,但克服了单元词语言的不足,吸收并综合了多种标引语言的原理和方法,是能结合计算机使用的后组式语言,是目前主要的受控语言.叙词语言吸收:以分面组配语言的概念组配代替单元词语言的字面组配适当采用标题语言的先组式采用标题语言和单元词语言对语词的严格控制采用并完善标题语言的参照系统采用体系分类语言的原理编制叙词分类索引和等级索引采用关键词语言的轮排方法,编制叙词轮排索引叙词语言优点:概念组配准确,标引能力强结构完备,词汇控制严格适合多途径检索,检索效率高对检索系统的适应性强叙词语言缺点:叙词表编制和管理难度较大利用叙词语言标引和检索较复杂,使信息报道速度相对较慢关键词语言自然语言形式的情报检索语言随计算机出现,为适应索引编制自动化的需要产生直接以自然语言中未经控制或只作少量控制的语词为文献主题标识,通过关键词轮排方法揭示文献主题.关键词表简单,不必设参照,使用禁用词表.关键词语言优点:直接源于自然词汇,专指性优于其它主题语言标引无需查表,简便易行,节省人力及时更新词汇,报道信息快适于计算机自动抽词标引,标引一致性高,标引深度大关键词语言。

检索式编制技巧

检索式编制技巧
由于gpsgps测量测量的高精度高速度通性强便于操作不受测边的长度和通视条件的限制抗的高精度高速度通性强便于操作不受测边的长度和通视条件的限制抗干扰能力强可全天候作业等优点近年来许多城市已利用干扰能力强可全天候作业等优点近年来许多城市已利用gpsgps平面控制网对平面控制网对原有的城市控制网进行了改造其目的是将旧网改造成符合或高于现行规定的新原有的城市控制网进行了改造其目的是将旧网改造成符合或高于现行规定的新网以适应城市建设的发展

应以课题提供的关键词为参考,根 据检索要求复核、筛选、补充、精炼检 索用词。选定的检索词应符合检索主题; 确认检索词是否为规范词;并应列出常 用中外文同义词、缩写词,以及核心词 的上下位类词。应充分利用词表、辞海、 术语标准、词典等工具书,以及从已检 出的文献中,扩展检索用词。
二、运算符的类型 在进行计算机检索时,有时有一些比较复杂 的课题,如:“GPS在建筑中的应用”,既涉 及GPS,又涉及建筑, 这时候要编制出满足要 求的计算机检索式,就必须用到运算符,它是机 检的基础。 布尔逻辑、截词检索、字段检索,位置算符 。
(3)中间截断:在检索词中间加一个或 几个?号,主要解决一些英美拼写不同, 单复数形式的不同的词的输入,可简化 输入。
如:输入wom?n可检出 woman,women
各种算符在数据库中的实际应用
位置算符
1)EI
NEAR Bridge NEAR Piling*
表示这两个词要彼此接近,前后顺序不限。 W/n Pig*W/2pine*表示两个词的距离不能超过n个单词 Adj Channel adj tunnel表示含有这两个词,两个词相邻, 位置一定 2)ISI Proceedings 用同句算符(SAME):如Channel same tunnel,表示channel 和tunnel 出现在同一句子中才 符合检索条件。

医学文献检索基础知识

医学文献检索基础知识
精品课件
医学文献检索基础知识
文献检索语言
四、文献的检索语言 1、文献检索语言及其意义
检索语言,又称文献存储与检索语言、索引语言、标引 语言等,是信息检索系统存贮与检索共同遵循的一种专用语言, 是在文献检索领域中用来描述文献特征和表达信息检索提问的一 种专用语言。
创建文献检索语言的目的是为了建立有序化的文献检 索系统,而文献的有序化是为了便于检索,因此,文献检索语言 是一种使检索系统(文献标引人员)和检索者(检索系统使用者)
医学文献检索基础知识
文献信息检索课是一门如何查找文献、 知识和信息的工具性课程,它被人们喻为开启知 识宝库的钥匙,是以培养学生的独立学习能力为 宗旨。文献检索课作为一门科学方法课,它将不 仅使你的信息意识更为敏锐,而且可以了解文献 信息组织与检索的原理,学习操作使用各种专业 文献信息数据库和网络检索工具。科学技术的飞 速发展导致了文献资料的急剧增长,文献和文献 检索的知识可以帮助人们从浩瀚而深邃的文献海 洋中汲取实用的知识并节约宝贵的时间。当你在 临床医疗、科学研究或学习生活中遇到任何疑难 问题,都可以尝试通过检索来获取知识信息、寻 找问题答案。
精品课件
医学文献检索基础知识
文献检索语言
2、文献检索语言的种类 (1)文献外表特征检索语言:
著者索引 题名索引 文献序号索引 引文索引
精品课件
医学文献检索基础知识
文献检索语言
(2)文献内容特征检索语言: 分类检索语言 主题描述语言
精品课件
医学文献检索基础知识
文献检索语言
①分类检索语言 分类检索语言是将各种知识领域的类
精品课件
医学文献检索基础知识
二、计计算算机机检检索索系统系的统构成
1、文献信息数据库的类型 (1)事实数据库(fact database) (2)数值数据库(numeric database) (3)书目数据库(bibliographic database)

3-3主题检索语言

3-3主题检索语言
标题词表:一般由编制说明和主词表等部分构成,主表按主标题 词字顺排序,在同一主标题词下再将与之有关的副标题词逐一排 列。用see和see also显示标题词之间的相互关系。
4
2、2 Uniterm indexing
元词法的概念:以单元词作为检索标识的文献标引和检索方法。 它是对标题法先组式标识进行改革而形成的一种后组式语言。元 词是指能够表达文献主题,经过规范化处理的最小、最基本的词 汇单元,具有概念上的独立性、单元性和规范性的特点。
叙词语言具有严密的语义关系。根据词义的需要,叙词相互之 间有3种语义关系:⑴ 等同关系(用-代),指叙词与非叙词之 间的关系。⑵ 等级关系(分-属-族),指专指度深浅不同的 两个叙词之间的隶属关系。⑶ 相关关系(参-参),指叙词之 间存在一定的关联、交错、对立和矛盾的关系(或称类缘关 系),两者互为参照。
键词法的主要特点: ⑴ 采用语词作为概念标识,直接从文献中抽取关键词。相对于叙词
法、标题法和元词法来说,要求标引水平低,尤其适用于计算机 处理和自动标引。 ⑵ 具有丰富的轮排方式并建立字顺排列体系,检索非常方便。采用 键词法的检索系统是时差最短和最经济的检索系统。 ⑶ 由于键词的非规范性,词汇质量较粗略,影响到文献检索的查全 率和查准率等。 键词法的表现形式——Keyword Index。
3-3 Subject Retrieval Language
一、主题检索语言的概念与特点 二、主题检索语言的基本类型 三、《汉语主题词表》与文献标引
思考题
1
一、主题检索语言的概念与特点
1、1主题检索语言是指采用描述文献主题的语词标识并按字顺排检的 信息检索语言。一般由主题词表及其编制和使用规则组成。
3
2、1 System of subject heading

主题标引

主题标引
一、基 本 概 念 二、主题标引的方式
三、主题标引工作流程
四、主题标引的基本规则 五、各种主题、类型资源的标引
2
一、基本概念
1、主题法的概念与类型 2、主题标引 3、与分类标引的异同
二、主题标引的方式
三、主题标引的工作流程
四、主题标引的基本规则
五、各种主题、类型信息资源的标引
3
主题法

是分类法以外,另一种从内容角度标引和检索信息资源的方法。一般 是指直接以表达信息资源主题内容的语词做检索标识,以字顺为主要 检索途径的标引和检索信息资源的方法。
37






2001#$a汉古文字与纳西东巴文字比较 6060#$a东巴文$x对比研究$x汉字$x古文字 2001#$a中美图书馆学的比较 6060#$a图书馆学$x对比研究$y中国$y美国 一般论述重点在前,如不能判断主次,按汉语自然 语序排。


38


2001#$a气候对作物的影响 6060#$a气候影响$x作物 2001#$a网络神话与生活 6060#$a互联网络$x影响$x社会生活 产生影响在前,受影响在后
2001#$a任继愈学术文化随笔$h史学篇 2252# #$a二十世纪中国学术文化随笔大系


注:全套书分为哲学篇、宗教篇、史学篇三篇。
综合标引:600#0$a任继愈$j文集 分散标引:606##$a史学$y中国$j文集
12

分析标引是一种根据信息资源中部分片段或集合型资源的 构成单元进行的标引。分析标引是与整体标引和综合标引 相对应的标引方式。即在整体标引或综合标引的同时,根 据某种特定需要,进一步对信息资源中部分重要的局部主 题予以标引的方式。

一种面向主题的关键词查询扩展方法.

一种面向主题的关键词查询扩展方法.
基于统计的方 法 [1,7]仅 停 留 在 词 的 表 面 信 息,扩 展 的 结 果 并不理想。语义计算的方法[8,9]从一定程度上提高了信息检索 的相关率,但是基于语义词典的扩展方法过分依赖于较完备的 语义体系。另外,由语言专家标注的词之间的语义关系,这些语 义关系并不是专门为信息检索服务的[10],原因是词典中虽然给 出了词的语义关系,但却缺乏应用这种关系的上下文信息,从而 加入的扩展词不一定能提高信息检索的性能,反而会提前发生 “查询漂移”。也 就 是 说,由 于 领 域 的 独 立 性,使 得 语 义 词 典 中 意义相似的词语在特定领域却不能作为扩展词。
2 基于局部统计和语义扩展相结合的主题关 键词查询扩展模型
随着网络的应用与普及,开放和分享成为时代的主题。基于 Web的主题相关信息,往往有多个信息源对其进行描述,主题信 息的关键词搜索结果有着固有的高度冗余性。冗余性信息对于 给定主题,从另外一个角度来讲往往是主题较重要的信息,而采 用局部统计的方法能够使得主题较重要的关键词得到凸显,有利 于选择高质量的关键词。在自然语言中(特别是中文),语言的 表述形式丰富多样,另外,由于个人表述习惯以及文化背景的不 同,使得对于同一主题信息的描述,会产生各种各样的表述方式。 例如:人们 对 “板 蓝 根 副 作 用”这 一 主 题 的 多 样 性 描 述 语 句 有: “长期服用板蓝根会导致肠胃道出血”,“经常冲服板蓝根会造成 肠胃道出血”等等语句。所以“导致”和“造成”都应该成为该主 题关键词的查询扩展词,而从词义角度讲,“导致”和“造成”存在 同意关系,又由于语义知识词典是独立于具体语料集,难以凸显 具体领域语料本身的特性。譬如,在医药领域中的描述语句中, 并非与“导致”存在同意关系的词(如:诱致、招致等)都可以加入 扩展词集,该类词集的加入反而会提前发生查询漂移。多样的表 述使得主题信息的查询获取难度加大,而由于语义知识词典中词 语的固有的领域独立性,单纯的语义扩展词难以反应待检索主题 的特征,因此,很难取得较好的主题关键词查询扩展效果。而基 于统计的方法获取的关键词可以从某种程度上反应主题的特征, 为了克服主题关键词扩展中的主题关键词多样性的问题,本文在 局部统计的基础上,结合语义知识来扩展主题关键词。

常用文献检索技巧一览表

常用文献检索技巧一览表

强制检索字符:“”或 ‘’
如:title(“oil and gas”)AND abstract(comput*)
字段限制符:
Pubmed数据库
检索词 [字段标识] 或 “检索词”[字段标识] 逻辑字符 AND、OR、 NOT 、AND NOT 截词检索字符 :*;强制检索字符:“”
Title ti Abstract ab Journ Affilation Author Language al title ad au la ta Public ation date dp Publica tion type Pt Sub heading sh MeSH terms mh
将符号“?”放置在词中间,表示模糊检索。 如:B?nard 表示命中Bé nard
简单检索
检索式用逻辑算符AND、OR、NOT表示。 位置算符“NEAR”表示两词之间最多相隔0-5个字,词顺可以颠倒若希望词序不 颠倒可将检索式用引号括起如:"system near manager" 用NEAR匹配词组比AND更精确。
是基于整个期刊文献内容的全字段检索。快速检索规则同样适用简单及高级检索。
高级检索基本与简单检索的方式相同,只是扩展了检索限定范围
位置算符:NEAR、 ADJ
如: title(oil) near title( gas) 逻辑字符 AND、OR、 NOT 、AND NOT

ScienceDirect (Elsevier)数据库
SinoMed主题检索
Tip1:词条中带有“见”字时,前面款目词为同义词,后面为正式主 题词;词条中无“见”时,前后均为主题词。 Tip2:副主题词用于对主题词某一特定方面限定,强调某些专指方 面。如:“肝/药物作用”表明文章是讨论药物对肝脏的影响。 Tip3:加权检索与非加权检索: 仅适用于主题词。 ◇“加权检索”表示仅对加星号(*)主题词(主要概念主题词)检索。 ◇“非加权检索”表示对加星号和非加星号主题词(非主要概念主题 词)均检索。 ◇ 系统默认状态为非加权检索,若进行加权检索请勾选“加权检索” 选框。 Tip4:(1)主题词扩展检索与非扩展检索 如:对主题词“HIV感染”,扩展检索指对该主题词及其10个下位主 题词检索,不扩展检索仅对“HIV感染”进行查找。 (2)副主题词扩展检索与非扩展检索: 部分副主题词之间也存在上下位关系。如副主题词“副作用”的下位 词有“毒性”、“中毒”。

检索主题词

检索主题词

检索主题词主题词检索是一种在图书馆和数据库中常用的检索方法,它使用特定的词汇或短语来查找相关主题的检索方法。

通过使用主题词检索,可以找到与所需主题相关的图书、期刊文章、研究报告和其他文献。

以下是主题词检索的一般步骤:1.明确检索需求:在进行主题词检索之前,需要明确自己的检索需求,例如要查找的主题、相关领域、文献类型、时间范围等。

2.选择主题词:在明确检索需求之后,需要选择相应的主题词。

主题词应当具体、明确、准确,可以查阅相关主题词表或根据文献的标题、关键词等自行选择。

3.使用逻辑运算符:在进行主题词检索时,可以使用逻辑运算符(如AND、OR、NOT)来组合不同的主题词,以获取更精确的检索结果。

4.使用括号:当需要组合多个主题词时,可以使用括号来明确优先级。

5.使用截断符号:当主题词比较长或不确定时,可以使用截断符号(如*)来进行模糊检索。

6.加入限定条件:在进行主题词检索时,可以加入限定条件,如时间范围、语言、文献类型等,以缩小检索范围。

7.评估检索结果:在获取检索结果之后,需要对结果进行评估和筛选,以确保结果与检索需求一致。

关于主题词检索的注意事项:1.理解主题词的含义:在选择主题词时,需要理解主题词的含义和相关概念,以确保所选主题词和检索需求一致。

2.避免使用一般性词汇:一些一般性的词汇(如"the"、"a"、"of"等)在主题词检索中没有意义,需要避免使用。

3.考虑多种表达方式:同一个主题可以有不同的表达方式,需要考虑多种表达方式,并尝试将其纳入到检索中。

4.注意词序的影响:在使用多个主题词进行检索时,主题词的顺序可能会影响检索结果,需要根据实际需求合理选择词序。

5.尝试使用同义词:同一个主题可以有不同的同义词,需要尝试使用同义词来增加检索结果的覆盖范围。

6.尝试使用关键词:除了主题词之外,文献的标题、摘要、关键词等也可以作为检索词来使用,可以扩大检索结果的覆盖范围。

公文主题词表使用方法

公文主题词表使用方法

附件3公文主题词表使用方法一、标引细则1・公文主题词表分为三个层次。

以《国务院公文主题词表》为例,第一层是对主题词区域的分类,如〃综合经济〃,不用作主题词标引。

第二层是类别词,即对主题词的具体分类,如〃计划〃。

第三层是类属词,如〃规划"、〃统计〃。

第二层和第三层统称为主题词,用于公文的标引。

2 •标引公文主题词要直接、准确、客观地反映公文论述的主题。

3•选词时,应首先选用切合公文主题概念的专指性较强的主题词。

4•当没有专指性较强的主题词时,应选用上位类别词替代标引。

5.若无合适的上位类别词替代标引时,应选用与主题概念关系较密切的两个或两个以上的正式主题词进行组配标引。

组配标引所选的词之间空一字距。

6•若仍不能满足需妾时,方可选用本词表以外的适当词(称自由词)进行标引。

自由词标引应遵循下列原则:(1)选用的自由词应符合本词表的选词原则。

(2 )标引时,应在自由词后加〃△“标记。

(3 )选用人物、年代、组织机构、地区等专用名词作为自由词标引时,人物名称用全称,年代用阿拉伯数字,组织机构、地区名称用全称或规范化简称,不加“△〃标记。

7・主题词的标引位置。

主题词应作为版记的第一项,标在公文的抄送栏之上。

〃主题词”用3号黑体字,居左顶格标识,后标全角冒号。

词目之间空1字。

8•主题词的标引数量。

每件公文所选用的主题词数量T殳应在5个以内。

9•主题词的排列次序。

T殳次序为:反映公文内容的主题词在前,反映公文形式(文种)的主题词在后。

单主题公文主题词的标引格式是:类别词+类属词+文种;双主题公文主题词的标引格式是:类别词+类属词+类别词+类属词+文种;三个以上主题的公文依此类推。

标引的地区名称、组织机构名称、年代和人物名称等,置于反映公文内容的主题词后、文种之前。

若地区名称、组织机构名称、年代和人物名称等同时出现在同一公文中, 则按地区名称、组织机构名称、年代和人物名称的顺序排列。

公文的文种置于最末位。

主题检索方法

主题检索方法

缩写形式
AB,abnorm AD,admin AE,adv eff AA,analogs AN,anal AH,anat
and 类似物和衍生物 D3-6,D14-18,D20-23
分析
D
and 解剖学和组织学 A1-10 , A13-14 , B2 ,
B6
3.《英汉对照医学主题词树状结构表》
以医学学科分类角度对主题词进行等级分类而
主题法的特点(续)
(二)规范化 同义词(一义多词)规范:爱滋病、艾滋病、 获得性免疫缺陷综合征 多义词(一词多义)规范: – 范围注释:杜鹃→杜鹃(植物)、杜鹃(动 物) – 含义注释:
主题法的特点(续)
(三)组配性
1.概念相交 2.概念限定 3.概念概括 4.概念联结 ☆先组式组配 ☆后组式组配
Adverse effects副作用(D,E1-4,E6,E7)(AE,adv eff) 用于诊断、治疗、预防或麻醉的药物、化学物质、生物和物理作用物, 英文缩写 以及制造的产品在正常用量时所引起的不良反应;也用于诊断、治 疗、13预防、麻醉、外科手术及其它措施时出现的副作用或并发症。 Drug therapy药物疗法(C,F3)(DT,drug ther) 用于疾病主题,通过投给药物、化学物质和抗生素来治疗疾病;不包 括饮食疗法和放射疗法,这要用各自的专题副主题词;也不包括免 疫疗法和生物制品疗法,这要用副主题词“治疗”。
二、主题法的特点
(一)概念化:
1.独立概念:反映某一特定事物 2.普遍概念:代表一类事物 3.属概念:上位概念 4.种概念:下位概念 5.并列概念:具有并列关系的概念 6.同一概念:即同义词关系 7.相关概念:属种关系和同一关系外的具有某种密切关系的两个 概念 8.复合概念:可分解为两个以上的单一概念的概念

主题类型的要领及主题检索标识词序公式的扩展

主题类型的要领及主题检索标识词序公式的扩展

信息主题类型分析的要领及汉语主题检索标识构成公式的扩展顾潇华一、信息标引时主题类型判断1、主题类型的判断是分类标引和主题标引工作的重要基础判断主题类型是做信息标引工作时主题分析的第一步。

因此,也等于是整个信息标引工作得第一步。

因为,无论分类标引还是主题标引都要做主题分析。

主题分析时,首先要判断主题类型,然后才能做接下来的其他各个主题分析环节或全部信息标引各环节的工作。

所以,主题类型的判断是分类标引和主题标引工作的重要基础。

2、信息主题的类型1)按信息主题数量分:①单主题:信息内容只涉及一个中心对象或问题,如:钢;还可以是只涉及一个中心对象或问题但带有其他因素,如:钢的抗拉性,钢是中心问题,抗拉性是其他因素。

②多主题:文本信息涉及两个或多个事物对象和问题,如:摄影与空中摄影,摄影、空中摄影都是中心对象或问题。

2)按信息主题中主题概念的数量及关系分:①单元主题:只有一个中心对象作为主题概念,如:普通生物学。

②复合主题:有两个以上主题概念,即:除了中心问题还有其他概念,如钢的抗拉性。

③联结型主题:一般有两个中心对象或问题并被一个联结词连接,如:激光在医学中的应用,激光、医学是中心对象,“应用”是起联结作用的联结词。

3)前两种划分方法的联系:①单主题包括:单元主题(钢)和复合主题(概念交叉型、概念限定型、概念联结型);②多主题包括:并列多主题(河流与湖泊)和从属多主题(摄影和空中摄影);4)复合主题类型:①概念交叉型:如喷气式垂直起落飞机,是由喷气式飞机和垂直起落飞机这两个概念(两个中心问题)交叉组成;②概念限定型:如汽车车身,汽车这一中心问题被车身这一其他因素限定;③概念联结型:如;激光在医学中的应用,激光、医学是中心因素,被应用这一联结词联结。

另外还有一些主题类型的划分角度,如按信息内容被表达程度划分的,按专业角度划分的等等。

但上述基础主题类型是关键方面。

所以本文仅探讨所列出的主题类型的判断要领3、判断主题类型要领的具体实施步骤当拿到被分析的文本,无论是纸质文献信息,还是其他载体形式的信息,信息标引时判断主题类型要采用排除法一步一步进行。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息主题类型分析的要领及汉语主题检索标识构成公式的扩展顾潇华一、信息标引时主题类型判断1、主题类型的判断是分类标引和主题标引工作的重要基础判断主题类型是做信息标引工作时主题分析的第一步。

因此,也等于是整个信息标引工作得第一步。

因为,无论分类标引还是主题标引都要做主题分析。

主题分析时,首先要判断主题类型,然后才能做接下来的其他各个主题分析环节或全部信息标引各环节的工作。

所以,主题类型的判断是分类标引和主题标引工作的重要基础。

2、信息主题的类型1)按信息主题数量分:①单主题:信息内容只涉及一个中心对象或问题,如:钢;还可以是只涉及一个中心对象或问题但带有其他因素,如:钢的抗拉性,钢是中心问题,抗拉性是其他因素。

②多主题:文本信息涉及两个或多个事物对象和问题,如:摄影与空中摄影,摄影、空中摄影都是中心对象或问题。

2)按信息主题中主题概念的数量及关系分:①单元主题:只有一个中心对象作为主题概念,如:普通生物学。

②复合主题:有两个以上主题概念,即:除了中心问题还有其他概念,如钢的抗拉性。

③联结型主题:一般有两个中心对象或问题并被一个联结词连接,如:激光在医学中的应用,激光、医学是中心对象,“应用”是起联结作用的联结词。

3)前两种划分方法的联系:①单主题包括:单元主题(钢)和复合主题(概念交叉型、概念限定型、概念联结型);②多主题包括:并列多主题(河流与湖泊)和从属多主题(摄影和空中摄影);4)复合主题类型:①概念交叉型:如喷气式垂直起落飞机,是由喷气式飞机和垂直起落飞机这两个概念(两个中心问题)交叉组成;②概念限定型:如汽车车身,汽车这一中心问题被车身这一其他因素限定;③概念联结型:如;激光在医学中的应用,激光、医学是中心因素,被应用这一联结词联结。

另外还有一些主题类型的划分角度,如按信息内容被表达程度划分的,按专业角度划分的等等。

但上述基础主题类型是关键方面。

所以本文仅探讨所列出的主题类型的判断要领3、判断主题类型要领的具体实施步骤当拿到被分析的文本,无论是纸质文献信息,还是其他载体形式的信息,信息标引时判断主题类型要采用排除法一步一步进行。

首先,判断被标引对象是单主题还是多主题,如果有两个研究的中心问题的概念,要看在表达信息内容的题名或语句中有无联结词,如:“作用”、“影响、”“应用”、“关系”等字样,有这些字样的信息,其主题类型一般为概念联结型复合主题,就可以依照概念联结型复合主题的要求做分类标引和主题标引的后续工作;如果没有上述联结词字样,说明不是概念联结型复合主题,这时可以判断文本是多主题,就可以依照多主题的要求做分类标引和主题标引的后续工作;如果不是多主题,在单主题的情况下还需要判断是单元主题还是复合主题,如果是单元主题,就可以依照单元主题的要求做分类标引和主题标引后续工作;如果不是单元主题,在复合主题的情况下“优先考虑是否为概念交叉型复合主题”,如果是概念交叉型复合主题,就可以依照概念交叉型复合主题的要求做分类标引和主题标引的后续工作;如果不是概念交叉型复合主题,才能判断信息的主题类型为概念限定型复合主题,然后依照概念限定型复合主题的要求做分类标引和主题标引后续的工作。

的确,需记录在检索数据库或说检索工具中的信息大多是概念限定型复合主题的信息,但此要领的关键就是要在排除了其他所有主题类型后,才能判断信息为概念限定型复合主题,而不能拿到被标引的文本就认为信息的主题类型是概念限定型的复合主题,这种排除法就是保证准确判断主题类型的要领。

二、对汉语主题检索标识因素构成和词串序列扩展探讨的意义尽管现在信息组织领域研究大多围绕汉语分词、自动标引、语义网和本体等等新问题进行,信息主题的因素及检索标识词序等问题看上去已成熟,没什么可研究的。

但是,由于绝大多数国内外图书馆仍然使用MARC描述信息,其中的6——主题功能模块各字段的形成离不开主题因素及词串序列的应用。

另外,在版编目也需提供依据主题因素构成和词序规则来形成其主题检索标识项目。

还有,除搜索引擎这种检索数据库的形成其各个环节是自动化的外,就是中国学术期刊网等等检索数据库也是需要人工处理一些检索标识。

所以,应在已有的概念限定型复合主题的因素构成和词串序列的基础上扩展出其他主题类型的因素构成和词串序列。

这种扩展,对分类标引工作有部分作用,对主题标引实际工作和信息管理类专业的信息组织课程及图情档工作业务培训的教学十分有益。

概念限定型复合主题的因素构成及词串序列是所有信息组织的资料或教材都介绍的,即:主题构成的因素及其序列可分为主体因素(研究对象,即:中心对象或问题、材料、方法、过程、条件等)、通用因素、位置因素、时间因素、文献类型因素等五种。

一般来说,主题因素最全的一条信息也就由这五种因素构成。

须强调的是,共同表达一条信息主题的每个主题词语必定属于其中的某个因素,各个因素分别表示属于该因素的主题词语在主题标识词串中的职能,而主题词串中的各个主题都必须按照五个因素或范畴面的规定词序排列,形成一种主题词串的序列公式:A(A1—A2—A3—A4—A5)—B—C—D—E式中:A为主体因素(A1表示研究对象,A2表示材料,A3表示方法,A4表示过程,A5表示条件);B表示通用因素;C表示位置因素,D表示时间因素;E表示文献类型因素。

假如有一条信息的题目为:二十世纪中国财政学学科发展论文集,其主体因素是财政学、通用因素是学科发展、位置因素是中国、时间因素是二十世纪、文献类型因素是论文集。

该题的主题标识结果则是:财政学—学科发展—中国—二十世纪—论文集。

主体因素是信息内容涉及的研究对象,其他因素是对研究对象的限定,该题的研究对象是财政学、但不讨论财政学的全部范围,只研究财政学的学科发展,还只是中国的财政学,不是现在、不是未来、只是刚刚过去的二十世纪的,不是期刊,不是报纸,只是论文集。

所谓限定就是指限定了研究对象的范围。

此题包括的主题因素是最全的、五个因素都具备的一个限定型复合主题举例,但有些信息内容可能没有一些因素或范畴面,比如:河北档案,主体因素是档案,位置因素是河北,即只研究河北的档案问题,其他档案问题不是此“河北档案”课题涉及的范围,而且该题没有通用因素、时间因素和文献类型因素。

概念限定型复合主题的因素和词串序列已众所周知,但还有其他主题类型的信息。

其他主题类型也应该有其因素构成和词串序列形式。

但是到目前为止,无论主题标引实际工作还是信息组织的教学工作,没有明确规定其他类型的因素构成和词串序列公式。

一般认为仿照概念限定型复合主题的因素和词串序列规定自行处理即可。

本文认为,明确指出或拓展出其他主题类型的因素构成和词串序列是十分必要的,可借此解决主题标引结果的不规范性和不确定性,因此具有较高的现实意义。

三、主题构成因素和词串序列的扩展1、多主题的因素构成和词串序列公式:多主题是指信息主题的主体因素有两个以上,即有两个以上的研究对象,如“图书馆学情报学与档案学”,该题有三个研究对象,即三个主体因素,一个是“图书馆学”,一个是“情报学”,第三个是“档案学”,该题没有其他因素。

多主题信息的标引结果要求有几个主体因素就有几个主题检索标识结果,一般形成两个以上主题检索标识,如“河流与湖泊”,其主题检索标识结果是:1)河流2)湖泊从而可得出:多主题的因素由多个主体因素构成,其词串序列公式:1)A2)A (或更多的只有一个主体因素的检索标识,看课题涉及到几个研究对象)。

另外,即便有其他因素,因其研究对象有两个以上,也属于多主题信息,如“西藏的河流与湖泊”,西藏是位置性限定因素,西藏作为该题的限定因素。

其主题检索标识结果:1)河流—西藏2)湖泊—西藏从而可以得出带有其他因素的多主题的词串序列公式:1)A—B(A—C或A—D或A—E)2)A—B(A—C或A—D或A—E)上述公式表明,多主题的主体因素可以被任何因素限定,并且有几个主体因素(研究对象)就有几个带限定因素的多主题检索标识结果。

当然,每个词串公式也可以同时带有若干限定因素,比如:1)A —B—D,2)A—B—C。

2、概念交叉型复合主题的因素构成和词串序列公式概念交叉型复合主题的信息其研究对象一般是指研究对象是用几个概念交叉语词组合成的,这种情况下有几个概念参与交叉就有几个主体因素,如“高钛合金钢”是由三个主题概念词交叉而成的,即:高合金钢、钛钢、不锈钢。

其标引结果为:高合金钢:钛钢:不锈钢若用词串序列公式中的A表示主体因素,概念交叉型复合主题的词串序列公式为:A:A:A……(按规定,用“:”做各词之间的组配符号)。

虽然说概念交叉型复合主题是由两个以上主体因素交叉构成,但有时带有其他因素,比如“超音速轰炸机结构设计”,其主题检索标识结果:超音速飞机:轰炸机—结构设计。

因此构成用两种符号组配成的检索标识结果,其词串序列公式为:A:A—B(通用因素参与限定)A;A—C(空间因素参与限定)A;A—D(时间因素参与限定)A;A—E。

(文献类型因素参与限定)当然,每个词串公式也可以同时带有若干限定因素,比如:A:A—B—C。

3、单元主题的因素构成和词串序列公式单元主题实质上就是一条信息涉及某一事物所有的方面,研究对象就只有一个,而且内容涉及研究对象的所有方面,比如“普通语言学”,其研究对象就是普通语言学,构成因素也就只有一个,因涉及其所有方面,所以就仅有主体因素没有其他任何限定的因素。

那么,“普通语言学”的标引结果为:普通语言学从而可以得出单元主题的因素只由一个主体因素构成,其词串序列公式:A单元主题的标引结果非常简明单纯。

4、概念联结型复合主题的因素构成和词串序列公式概念联结型复合主题一般涉及两个事物,因此也就有两个研究对象或说两个主体因素,并有一个起联结作用的通用因素语词(应用、影响、关系、作用等)联结,比如“激光在医学中的应用”、“森林对气候的影响”、“图书馆学与情报学的关系”、“信息资源在企业战略决策中的作用”等等。

这些题目的标引结果分别为:激光—应用—医学森林—影响—气候图书馆学—关系—情报学信息资源—作用—企业战略决策概念联结型复合主题的两个事物都可作为主题检索标识结果的主标目,即:都可到词串序列中的第一个词的位置作检索入口词,也就是常说的“轮排”。

但是,轮排时要对联结词做相应的改动,如:信息资源对企业战略决策的影响企业战略决策—影响因素—信息资源。

若用词序公式中的A表示两个主体因素(研究对象),B表示起联结作用的联结词,概念联结型复合主题的词串序列公式为:A—B—A当然,词串公式中的两个主体因素可以带有各自的限定因素,比如“中国足球俱乐部兴起对足球运动水平的影响”,其主标引结果:足球俱乐部—中国—影响—足球运动—运动水平,词串序列公式:A —C—B—A—B。

至此,主题标引遇到的所有主题类型的构成因素和词串序列公式得到扩展,从而明确了各种类型主题信息主题标引结果的形式,为正确得到主题标引结果奠定了更好、更全面、更细致的基础。

相关文档
最新文档