检索第四讲 如何提取关键词
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主
考察报告 Y调查报告
ຫໍສະໝຸດ Baidu
题
词
2) 关键词(Keywords)
(1)什么是关键词?(P15)
从文献主题内容(篇名、章节名) 中抽出来的 ,带有关键性的重要词 汇,作为检索入口词。
(2)关键词检索及其结果
例1:
湖南省国土资源地学数据库模型与数据融合 技术应用研究
关键词:湖南省 国土资源 地学数据库 数据融合技术
例:
同义词:我国—中国—中华人民共和国—国内 音译词:迪斯科—disco 电子邮件— E-mail 学名:拐枣—Hovenia acerba Lindl 俗名:拐枣—万寿果、金钩子、金钩梨 简称—全称:西华师大—西华师范大学 缩写:美国职业男球赛—NBA,世界贸易组织—WTO,
金砖五国—BRICS 术语:非典-非典型肺炎-严重急性呼吸综合症-SARS 代码:水——H2O 上位词:语言—英语—词义—同义词、反义词 下位词:中国—四川—南充—顺庆
• 通过主题索引的检索,可查到相关主题信息在《EA》 中的卷数与页数。
4、如何提取主题词与关键词
正确提取主题词与关键词是检索文献的关 键点,贯穿于检索课教学的始终。
1)主题词(subject words)
• (1)什么是主题词?
• 能够表达文献主题的概念,被规范化的词, 并具有检索意义和组配性能。
例如:“国土资源”的英语翻译
•
• land and resources land and natural resources • land resources lands and mineral resources
• territorial resources • territorial natural resources
(TU建筑科学—984城市规划) 《遥感数据的计算机处理与地理信息系统》 TP751.1 (TP自动化技术—7遥感技术—751图像处理方法——
751.1数字处理 《地理信息系统设计与实现》 P208 (P2测绘学—208测绘数据库与信息系统)
2) 无论是当代的搜索引擎、网络数 据库,还是工具书(EB)后的“主 题索引”等,大多是按主题法进行 编排和检索的。
利用CNKI进行检索
例1的检索结果仅有1篇文献,为什么?
关键词提取太窄、太细
关键词:湖南省 国土资源 地学数据库 数据融合技术
• 例2 贵州矿产资源的开发利用 • • 关键词:贵州 矿产资源
检索:
例2的关键词“贵州” “矿产资源”
关键词的概念太大,未进一步细化。
检索结果分析
• 从以上两个例子的检索结果来看, 仅按标题提取关键词,作为检索入 口词不太全面完整,因而检索到的 参考文献偏少、内容不够丰富。
第4节 信息的组织
信息组织的方式之三
该讲的主要内容
• 1、什么是主题法? • 2、为何要用主题法? • 3、主题法的运用举例 • 4、如何提取主题词和关键词? • 5、课堂练习与讲评
三、主题法(P14)
1、什么是主题法?
•
• 采用主题词作为文献主题标识和 查找依据的文献编排检索方法叫 主题法。
《汉语主题词表》编排方法
• 全部主题词款目按汉语拼音字顺排列,并在每个主题词款 目下根据需要设有:
• “Y”(用) • “D”(代) • “F”(分) • “S”(属) • “Z”(族) • “C”(参)
•
• 词的参照项可作为选词和扩大概念时参考。
利用《汉语主题表》,在同义词 中选出主题词:
自然环境图 Y环境地图
关键词的近义词检索举例
CNKI检索近义词:“裹足” “缠足” “小脚” “三寸金莲”
中文关键词不同表达法 检索举例
• 百度搜索以下关键词的结果:
• 考研 (约53,500,000结果) • 研究生招生考试(约1,300,000个 ) • 研究生考试(约31,300,000 )
中文关键词的英文翻译有不同的表达法
3、主题法的运用举例
例1 百度搜索“中学地理教学法”
例2 CNKI数据库检索有关的学术文章
例3 馆藏目录检索“地理信息系统”的相关图书
例4 报纸中在线搜索新闻“BRICS”
例5 《EA》(美国大百科全书)后的
“Subject Index”
• Geography 12-437 • Atlas 2-624 • Basin 3-318 • Climate 7-71 • Desert 9-1 • Exploration and Discovery 10-772;11-182 • Island 15-509 • Lake 16-673 • Map 18-277 • Ocean 20-611 • River 23-545
• national territory resources • national land resources
• state land resources • natural resource
2、为何要运用主题法?
1) 针对跨学科、交叉学科的情况 ,按分类检索文献会出现漏检的 问题。
为了更完整、准确而快捷地检 索到文献,应该使用主题法进行 检索。
例1 “GIS”的学科分布
例2“地理信息系统”相关图书的中图分类号
《地理信息系统基本原理及应用》 P91(数理地理学) 《地理信息系统及其在城市规划与管理中的应用》 TU984
• • 规范化:就是对自然语言的各种名词术语进
行优选和限定,单一,避免同一性,多义性。
(2)利用《汉语主题词表》查找主题词
《汉语主题词表》介绍
• 是一部显示主题词与词间语义关系的规范化, 动态性的检索语言词表。它是自然语言与情报 系统语言之间的媒介,同时又是人与计算机之 间在进行情报存储与检索方面的联系工具。它 适合用以组织计算机化情报系统的存储与检索, 也适合用以组织编制手工检索的主题目录和主 题索引。
(3)关键词提取的注意事项
• A.使用专业名词(特定概念或专业 术语)、物体、人名、地名、机构 名等作关键词。
• • 避免使用“研究”、“探讨”、
“论述”、“世界”等词作关键词。
•
B.注意提取隐含主题词
例:“废旧电池的回收处理与利用” 隐含主题词:循环利用、稀土金属、
稀有金属、提炼
C.正确提取中英文关键词的同义 词、近义词及其相关词等。