CHKD智能检索系统的功能和检索词的选择
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
① 广西河池市人民医院,547000,河池市南新东路18号
易彦伶①
关键词中国医院知识仓库
系统功能
检索词
摘
要
简要阐述CHKD KNS5.0智能检索系统的功能,探讨CHKD智能检索系统中检索词的选择;比较主题词、关键词
和分类号检索的优缺点、适用范围,要使查全率和查准率达到理想的平衡点,联合使用效果更佳。
Functions and Index Terms of CHKD Intelligent Searching System / Yan-ling YI // China Digital Medicine. -2008 3 (1): 67 to 68KeywordsChinese hospital knowledge warehouse, system functions, index terms
AbstractThis paper introduces the functions of CHKD KN5.0 intelligent searching system and the index terms selection.It compares the advantage, disadvantage and applicability of different searching models, such as by subject headings, bykeywords and by classification codes. All these searching models have to be integrated and to make the precision ratioand recall ratio in perfect balance will improve the efficiency in searching.Corresponding author
The people's hospital of He Chi, He Chi 547000, Guangxi Autonomous Region, P.R.C.
分类法和主题法既是文献标引语言中两种最基本的语言类型,又是文献检索系统中两种最基本的查找方法[1]。
CHKD检索系统是我国第一套具有主题词、关键词、分类号智能检索的全文数据库系统,它实现了关键词——主题词——分类号自动转换,支持非规范语言、自然语言向规范语言、受控语言自动转换的功能,笔者就使用CHKD多年的经验从该系统的特点、功能及使用方法方面进行论述。
1系统特征
1.1文献标引实现规范、标准和统一该系统标引主题词依据的是《美国Medline医学主题词表》及《中国中医药学主题词表》进行扩展整合并细分,CHKD主题词使用表标引文献分类号依据的是《中国图书馆分类法、医学专业分类表》进行扩展并细分,它采用统一标准主题词或分类号表达,支持非规范的自由词转换为规范的主题词或分类号,为通过异构跨库无障碍的信息资源获取总库平台实现文献信息资源无界共享奠定了基础。
1.2自动转换关键词、主题词、分类号可实现自动转换,支持非规范语言、自然语言向规范语言、受控语言自动转换。
检索者只要输入任何有检索意义的词,系统会将输入的词转换为医学主题词进行检索,提高了查全、查准率。
1.3知识链接通过“知网节”页面提供参考文献链接、引证文献链接、共引文献链接、二次参考文献链接、相关文献作者等等,用户既可以宏观了解某一领域的研究内容、研究范围和进展,也可以微观知晓某一专题的属性,现状和发展趋势,实
CHKD智能检索系统的
功能和检索词的选择
中国数字医学第3卷第1期
67
现知识挖掘和知识发现。
1.4简便实用检索系统界面友好、简便、易操作,用户可任意选择检索方式,系统可根据用户需要,随时显示语义结构、词间关系、指导用户扩展或限定检索范围,使检索结果更加理想,该系统既可满足普通检索者的一般检索需求,又可满足专业图书情报检索人员的专业需求。
2系统功能
2.1专项检索检索者可选择主题词、关键词或分类号检索项,直接输入主题词、关键词或分类号进行检索。
2.2智能检索选择主题词或分类号检索时,系统可将检索者输入的任一关键词自动转换为该词所对应的主题词或分类号进行检索,实现主题词或分类号检索结果的输出,如果系统中无对应的主题词或分类号,系统可自动按照所输入关键词进行检索。
2.3模糊查询选择主题词检索时,可以在模糊查询框内输入拟用主题词中含有的任一字或词进行主题词轮排查找,在查找结果中点击所需的主题词便可直接进行检索;选择分类号检索时可以在模糊查询框内输入任一拟选分类号进行分类号轮排查找,在查找结果中点击所需分类号便可直接进行检索。
3检索过程中检索词的选择和出现的问题
3.1主题词法主题词是人工语言,是从大量的能明确表达文献主题内容的自然语言中优选出来的,将那些同义词、多义词、同形异义词进行标准化处理,转换成概念与词一一对应的单义词[2]。
主题词用于文献的主题标引和检索,词语有较严格的规范,对检索文献内容的修饰和限定,其目的是提高查准率,减少误检的发生。
主题是查准
率较高的一种方法,它的来源是标准
的主题词表,主题词表是标引和检索
人员的共同语言,因此检索者正确使
用的前提是熟悉主题词表及指南,若
主题词选择不准,就可能误检、漏检。
主题词在检索和查新过程中虽然查准
率较高,但主题词的更新较慢,无法反
映学科发展的最新动向。
3.2关键词法一般检索者使用较多,
它是一种自然语言,是从信息内容本
身抽取主要依赖计算机自动抽词技术
来完成,辅以人工自由标引的非规范
词。
因为自然语言存在同义、多义、词
汇模糊等。
缺点是容易漏检,查准率较
低,但查全率较高。
例如:耳鼻咽喉科
的“喉肿瘤”、“喉癌”及“喉咽癌”等
专业语,都可作关键词,如果检索时只
选择其中一个或数个进检索,就容易
出现漏检,如果改用规范化的主题词
“喉肿瘤”来作为主题词,则可将其全
部同义词都集中于同一术语下从而提
高文献检索的查全率和查准率。
但在
新专业性概念无对应的主题词的情况
下,通过主题词检索无法达到精确查
询的目的时,关键词的使用就显得尤
为重要[3]。
3.3分类号法CHKD系统的类号聚
类功能保证了类号查全率,它在进行
上位类号检索时同时显示其下位类的
文献,如:当选择类号R573.3胃炎进
行检索时,检索结果除含有R573.3的
标引文献外,还含有R573.3的下位类
R573.31浅表性胃炎、R573.32萎缩
性胃炎、R573.33肥厚性胃炎、R573.34
胆汁返流性胃炎、R573.39其他所标
引的全部文献,如果准确地选择下类
来检索则只出现对应一个类号的文
献。
查全率、查准率都较高,但一般检
索者不太熟悉《中国图书馆分类法》的
分类体系,难以理解、定位和掌握,检
索文献时往往查不到相关资料,例如,
查找“过敏性休克”应在R593.1变态
反应性疾病中找,如果在R392.8变态
反应及过敏性反应中就检不到文献。
4总结
主题词法和关键词法检索各有千
秋,针对不同的检索内容应采用合适
的检索方式,如追溯以前的文献,查找
熟悉的内容,主题词法检索较好;如查
找前沿研究内容,特别是某些专业术
语还没有在该学科内流行,没得到广
泛认同,关键词法检索就比较恰当[4]。
主题词法检索、关键词法检索、分类号
检索法原理不同,查找不同内容时检
索结果不相同,只有将几种方法灵活,
联合使用,才能互利互补,相辅相成,
使查全率和查准率达到理想的平衡
点,从而获得全面准确的文献。
综上所
述,CHKD期刊全文数据库智能检索
系统不仅保留了主题词检索的优越
性,而且还利于分类、主题和关键相互
结合,扬长避短,还有更多的人性化功
能不仅满足了图书情报人员的专业需
求,而且也方便普通用户掌握主题词
受控语言的检索技巧,从而提高
CHKD期刊全文数据库的查准率和查
全率,使CHKD期刊全文数据库检索
系统达到国际领先水平,极大地推动
了信息时代知识共享的发展。
参考文献
[1] 朱芊《中国分类主题词表》(第二版)[M]
北京图书馆出版社, 2005, 9
[2] 沈懿, 胡汝珍 主题词与关键词的应用[J]
中国医学文摘:
耳鼻咽喉科学2004, 20(4):222
[3] 沈燕金 中国医院知识仓库(CHKD)中主
题词和关键词的使用 医学信息[J]2005, 18
(12): 1685
[4] 邢春国 徐桂香 田冬梅 医学文献检索中
检索词的选择[J] 现代情报2007, 1(1): 136-137
【收稿日期:2007年4月2日】
中国数字医学第3卷第1期68。