科技查新检索中的关键词选择
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
科技查新检索中的关键词选择
张柏秋1,吴晓鐄2
1. 吉林大学教育部科技查新工作站,长春 (130012)
2. 天津市科学技术信息研究所,天津(300074)
E-mail:bqzhang@
摘要:科技查新是一种特殊的文献检索,它要求科技查新机构和查新员对查新报告的客观性与公正性承担法律责任。针对特定课题做到查准、查全并非易事,对查新员提出更高的要求。本文通过分析查新员在科技查新过程中遇到困惑的原因,提出了完善关键词检索的三种途径,即拓展检索用关键词、灵活制定检索策略、分类与主题组合检索。最后指出查新工作者应善于学习,掌握批判性思维技巧,努力提高自身素质。
关键词:科技查新;文献检索;关键词检索;分类法;主题法
科技查新检索不同于一般文献检索。一般文献检索多以搜集资料为目的, 既无查全的奢望, 亦无分析归纳成报告的必要, 实属一种无约束的个人行为。科技查新检索的目的是出具查新报告, 查新检索者针对查新委托项目的若干查新点, 要按规定的文献收藏年限检索一系列的文献数据库, 要查准、查全, 并按合同如期完成能够禁得起同行专家推敲的科技查新报告。科技查新机构和查新检索人员要对查新报告的客观性、公正性承担法律责任。
1 科技查新检索中关键词选择的困惑
由查新检索的目的决定了查新检索者必须具备较高的专业、外语、文献检索能力等综合业务素质和高度的社会责任感。因为在浩如烟海的国内外文献中针对特定研究课题力求做到查准、查全并非易事, 其中, 单就查新关键词的选择就往往令人困惑!
如: 布氏杆菌病的防治研究课题——
若直接按照委托方的项目名称检索维普数据库: “布氏杆菌病*防治”=83篇文献。
然而, 借助词表即可明了“布氏杆菌病”的规范名称及其他常用名称[1], 据此检出文献篇数如下:
布氏杆菌病412 布鲁杆菌病49
布鲁氏菌病1352 传染性流产19
布氏菌病579 波状热16
布鲁氏杆菌病107 马尔他热9
布鲁菌病70 地中海热9
用以上扩展的检索词再次进行组配检索的结果:
(布氏+布鲁+传染性流产+波状热+马尔他热+地中海热)*防治=897篇文献。
上例中的关键词于扩展前后的检出文献篇数相差十倍以上! 那么, 依据前者检出结果所出具的查新报告还有什么客观、公正可言?
由此想到不久前的一则新闻, 谈及了医药中的一物多名: 在我国200种常用药品中有4个药名的占20%, 5个药名的占25%, 6个药名的占25%, 7个药名的占15%, 有的药甚至有10多个药名。如:胃舒达、保胃健、卡玛特、保维坚、愈疡宁,其实就是消化系统药物“法莫替丁”。这种“一药多名”现象不仅给患者选择药品带来麻烦,还掩盖了药价虚高以及医药购销环节
的腐败,更给群众安全用药带来了隐患[2]。
上则新闻笔者看后, 着实也为查新检索担忧——吃错药固然非同小可! 若因一物多名造
成文献漏检乃至查新结果严重失误, 由此亦可导致药品重复研制, 产品重复立项, 以至知识产权纠纷等后果。
其实不仅是药名, 一物多名在国内外的科技文献中普遍存在, 甚至令业内人士也望而生畏! 例如:
磺化油 sulphonated oil
磺化蓖麻油 sulfonated castor oil
可溶性蓖麻油 soluble castor oil
茜草油alizarin oil
土耳其红油Turkey red oil
(以上看似互不相干的化学名称实际上竟是同一种物品——摘自《英汉同物异名词典》[3]) 在科技文献中除了一物多名, 还经常有错别字出现, 如: 线形聚酯、线性聚酯(误)、线型聚酯(误); 活性炭、活性碳(误); 蓝宝石、兰宝石(误); 菜篮子、菜蓝子(误); 聚乙烯、聚乙稀(误); 阈值、阀值(误); 弛豫、驰豫(误)……这种真伪词汇混杂, 使文献检索更加扑朔迷离! 广大科技查新人员正是置身于这般如此繁乱的一物多名、加之一词多义而令人眼花缭乱的科技文献大海中孜孜探求!
2 完善关键词检索的若干途径
上述对查新检索关键词选择的困惑充分说明, 一物多名(或统称作同义词)是查新检索中的永恒难题。当然这里所指的“同义词”是实质上含意相同或相近的一类词的总称。在查新课题检索过程中, 为了尽量减少漏检, 应该通过关键词的扩展、检索策略的变通、文献分类法的运用等多种途径设法化解这种一物多名的痼疾!
2.1 对检索用关键词进行必要的扩展
对查新关键词的扩展应以用户提供的关键词为参考,确认关键词是否符合查新点主题,
并根据查新点重新复核、筛选、补充、精炼检索用词, 包括: 选定的关键词是否为规范词, 常用中外文同义词、缩写词是否列出, 是否涉及到核心关键词的上下位类词。应充分利用词表、辞海、术语标准、词典和其他工具书, 以及从已检出的文献中, 扩展检索用词。(以下数字多为从维普库中检出的文献篇数)
(1) 立足规范词, 兼顾自由词
胶粘剂9584 粘固剂271
粘合剂5440 胶结剂142
粘结剂3959 粘胶剂125
粘接剂1150 粘着剂107
黏合剂672 胶合剂94
胶黏剂544 粘附剂77
(2) 善用词的全称、简称及缩写
乙型病毒性肝炎13 脱氧核糖核酸51
乙型肝炎324 DNA 1001
乙肝402 DNA36
(以上自《中国专利数据库》题目中检出)
(3) 勿忘不同词根的上下位类词扩展
中生代3615 电阻焊 645
白垩纪1550 点焊1501
侏罗纪1502 缝焊909
三叠纪1149 凸焊134
(4) 注意外来词的译写变化
波尔兹曼55 欧几里德 301
玻耳兹曼115 欧几里得 207
玻尔兹曼217 欧基里德 5
波耳兹曼12 欧几理德 3
波尔茨曼 2 欧氏几何 142
Boltzmann 686 Euclid 359
(注意有时用英文人名检出的中文文献会更多!)
(5) 慎用词组或短语
查新实践表明, 许多查新合同中的英文关键词组是委托方自行拼凑的, 如:
课题名称:耐磨合金铸铁浮动油封的石蜡精密铸造
① paraffin wax precise cast (委托方提供) 0
②precise cast (委托方提供) 624
③ precise casting (委托方提供) 15 300
④ lost-wax casting 208 000
⑤ investment casting 579 000
(以上是从Google搜索引擎试检的词频: 词组①、②、③是委托方直译的“石蜡精密铸造”; 而词组④、⑤却能揭示其“失蜡(lost-wax)”或“熔模(investment)”等精密铸造工艺特征! 故二者词频迥异!)
课题名称:露天矿排土参数与排土计划的优化
①采、排一体优化 mining-dumping integral optimization 0
②分区分期排土 subzone & periodic dumping 0
③生态适应指数 ecological-adaptive index 0
④排土场自动设计 pit dump automation design 0
⑤多目标优化 multi-objective planning 845
(以上是采用委托方提供的英文词组从Google搜索引擎试检的词频, 仅⑤见少许结果。经查新者将“多目标优化”英文词组改为“multi-objective optimization”, 词频陡然升至289 000! ) 倘若查新者依照委托方这种生涩呆滞的自造词组来检索外文文献, 那犹如隔靴搔痒! (6) 忌用自造词
检索词应该涵盖行业内公知公用的技术术语, 委托方自创词汇、企业自己命名的产品名称、产品型号, 都不宜用作检索词。
2.2 以检索策略覆盖关键词表达的盲区
委托方提供的关键词一般都能体现出查新项目自身的技术性、专一性和个性特征; 查新者则应针对查新项目使检出文献体现出事物的可比性、普遍性和共性特征。因此检索用词应不受委托方的局限,使之既不过于宽泛,又不过于偏窄,组配后言简意赅!总之查新者要在与委