信息检索知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机检索
1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息。
2.信息检索
广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。
包括存储和检索两个过程.
狭义:从信息集合中找出所需信息的过程。
信息查找(Information Search,Information Seeking)
2。
1信息现状分析
1)信息爆炸
导致文献量急剧增加,内容相互渗透,语种增多;
文献分布异常分散;
文献寿命愈来愈段;
2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高。
3.检索的作用
1)促进智力资源的开发;
2)协助管理者做出正确的决策;
3)帮助科研人员借鉴前人的研究成果,避免重复劳动;
4)信息检索是知识更新的手段.
4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。
自建数据库:馆藏目录(OPAC),本校学位论文数据库。
商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。
免费数据库:开放获取资源、机构典藏和其他免费的网络资源。
5.数据库类型(2)
从收录文献的内容分,有综合性数据库和专业性数据库之分;
从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;
从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;
各数据库举例:
专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA)综合性数据库:读秀、Scopus、EI、SCI
特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT
全文数据库:CNKI、维普、SPE
摘要性数据库:EI、PA
引文数据库:Web of Science、CSSCI(中文社会科学引文索引)
6.Science Citation Index Expanded(SCI—E)是个什么样的数据库?
它是ISI检索平台中Web of Science核心合集中的一个子库
它是一个摘要型数据库
它是一个引文数据库
它是一个期刊数据库
它收录的学科范围包括科学、技术的各学科
7.查文献应该如何选择数据库?
学科专业:有专业型数据库时,首选专业型数据库;
数据量:选择数据量大的;
文献类型:根据研究的需要。
如果仅需要某种文献,最好选择该类型的子库;
检索功能:准确性高、易用、检索结果的处理能力;
分析功能
第三章信息资源的分类
8。
信息存贮载体:印刷型、缩微型、声像型、机读型
9。
根据加工程度划分
零次文献:口头信息、未公开发表的文字资料(手稿、书信、笔记等);时效性强;大量而无序;
一次文献:期刊论文、专利文献、科技报告、会议录等;研究人员最终索取的文献;
二次文献:检索工具:如SCI、EI、CA、PubMed/Medline
三次文献:选用大量有关的文章,经过综合、分析、研究而编写
出来的文献;如:综述、评论、评述、进展、动态等;研究人员最终需要的文献。
科研人员与科学信息的获取和利用:
研究人员的文献平台可以由二次文献作为入口,满足整体的需求;然后,通过这个入口来获取有用的高质量的全文期刊(一、三次文献)来满足纵深对的研究需要.
10.根据文献编辑出版的特征和范围划分(1)
1)科技图书Books(Monograph,Anthology,Textbook,Reference book):内容系统成熟可靠,新颖性较差;学习,教育之用。
2)科技期刊Periodical (Journal,magazine,serial):数量大,覆盖面广,内容新颖,及时;交流,影响广泛,信息价值高.
3)报纸(Newspaper):出版周期更短;获取实事性、政策性信息。
4)政府出版物(Government Publications):源自官方、权威、可靠、价廉;可获取政策性、法规性及科技信息。
5)科技报告(Sci/Tech Report):反映前沿科技、内容新颖、有密级控制.如:美国政府四大科技报告:PB,AD,NASA,DOE报告。
6)专利文献(Patent Document,Patent specification/bulletin/aids):类型有:专利说明书、专利公报、专利分类表、专利文摘等检索工具。
反映新的技术发明,是重要的技术、经济信息源。
7)会议文献(Conference paper,Proceedings):会议论文集,回忆录,会议资料等;反映最新成果,最新动向,高水平,前沿发展动态。
8)学位论文(Dissertations\Thesis);内容专深,非卖品,有较高学术参考价值。
9)标准文献(Standards):反映成熟技术,掌握技术政策,技术水平,可供研究新产品,改造老产品,改进工艺和操作水平是借鉴。
10)产品资料:形象、直观、新颖、可了解工业水平、产品发展、市场动态等。
11)广告(Advertisement):可及时把握竞争对手最新推出的产品品种,市场卖点。
准确掌握个地区市场的广告竞争态势。
12)技术档案和图纸:技术性,适用性,保密性。
11.检索语言:根据检索需求而编制的检索系统存储与检索共同使用的人工约定语言。
分类:体系分类语言、标题词语言、关键词语言、叙词语言。
12.检索途径:又称检索点,指利用信息的各种内外特征,作为检索出发点,从不同角度来检索信息.有:
分类(Classified):所属学科分类
主题(Subject):所属主题内容、关键词
著者(Author):团体著者(Corporate Author)
名称,题目(Title)
代码(Code)
13.基本运算符(1)
逻辑算符“与”:and 或*
例:telecommut? and productiv?
逻辑算符“或”:or 或+
例:computer or microcomputer
逻辑算符“非”:not 或—
例:aspartame not beverage
14.基本运算符(2):截词符
用于解决一些词干相同、词义相近、但词尾或词头不一致的派生词(如有同一词根派生出的名词、动名词、动词、形容词、副词等),或名词的单、复数形式,或痛一次的英美不同拼写形式等词的一次输入。
PQD平台的截词符用?、*和$表示。
截词符?Nurse?—nursed/nurses ad???—added/adult/adopt
用于替换某个字词中间或结尾的任何一个字符,不能代表没有字符。
截词符*control*—control/controlled/controlling 代替0—10个字符
截词符$ $5beat—Upbeat/offbeat/heartbeat 限定截词符用$n表示,代替0-n个字符.
15.基本运算符(3):位置算符(P/n、N/n)
用于限定词与词之间的位置关系,以提高查准率.
当检索词为词组形式时,或两个检索词之间可能被禁用词或标点符号隔开时,均应使用位置算符。
P/0 两个单词中间有一个空格或一个字符,在文献中出现的前后位置不能互换。
Polar P/0 embedded可检索到:polar-embedded或polar embedded P/1 两个单词中间可能有0-1个单词,在文献中出现的前后位置不能互换。
位置算符P/n与位置算符N/n的用法近似,区别在于前后单词是可以互换的。
16.PQD检索词自动匹配
在PQD中检索时,系统会自动匹配单词的单复数,英美拼写变体,形容词比较级最高级等形式。
17.短语检索:“”(双引号检索短语)
在PQD中可把短语放在引号内进行精确短语检索,但这种检索方式不能自动匹配。
在PQD中,空格默认为逻辑算符and。
18.字段检索
格式:字段名(检索词或检索式)
AU(smith)and TI(food):检索标题含有food,作者含有smith 的文章.
多个字段检索时,字段与字段之间用逗号隔开
AB,TI(food):检索标题含有food或者摘要含有food的文档。
PQD中,检索式常用限制字段为TI,AB,SU,IF。
PQD中的主题词(SU)字段是系统标引的独立字段。
19.检索策略:指为实现检索目标而制定的检索计划和方案。
检索式是检索策略的具体体现,是指计算机检索中用来表达用户检索提问的
逻辑表达式,通常由检索词和各种逻辑算符、截词符、位置算符以及系统规定的其他连接符号等构成。
20.检索的基本步骤
1)分析检索课题,明确检索要求,确定检索的主题内容、范围等
2)确定检索概念
3)选择表达概念的检索词
选择所有不同的能够表达检索概念的词
使用截词检索各种词尾变化的词
使用位置算符指定词组或词间的相对位置关系4)使用逻辑算符组配检索概念,拟定检索表达式
5)选择恰当的数据库
6)上机检索
21.获取全文的方法
全文链接按钮、全文数据库、馆际互借、图书馆文献传递、免费全文网站、提供免费全文的期刊,作者E—mail联系或作者主页。
22.检索策略的优化方法(1)
扩大命中文献量的方法
1)选择其他同义词、相关词、上位词
2)去掉一个不太重要的检索信息
3)将限制严谨的位置算符改为较宽松的位置算符,或通过and 算符代替位置算符
4)取消某些限制过严的后缀符、限制符等
5)增加检索途径,将主题途径与非主题途径结合起来使用
6)利用截词技术,检索所有相同词干的词
7)用E指令扩词以核实拼写
8)选择其他数据库进行检索
23.检索策略的优化方法(2)
缩小命中文献量的方法
1)提高检索式的专指度,增加或换用下位词和专指度较强的词
2)增加一个检索概念
3)将检索式中的and算符改为位置算符;或将较宽松的位置算符改为更严谨的位置算符
4)使用后缀限制,将检索词限制在基本索引的“重要"字段中,如规范词字段或题目字段
5)用辅助索引的某些字段与主题索引组结合限制检索范围
6)截词使用不当
24.三大检索系统概况
SCI(Science Citation Index)
SCI—E(Science Citation Index Expanded)科学引文索引
SSCI(Social Science Citation Index)社会科学引文索引
A &HCI(Arts & Humanities Citation Index)艺术与人文引文索引
CPCI(Conference Proceedings Citation Index)
CPCI—S(Conference Proceedings Citation Index—Science)科
学会议
CPCI—SSH(Conference Proceedings Citation Index-Social Science Citation Index)社会科学与人文艺术会议
EI(The Engineering Index)工程索引
25.三大检索系统收录质量区别
SCI最能反映基础学科研究水平和论文质量
检索系统收录的科技期刊比较全面
集中各学科高质量优秀论文的精粹
成为世界科技密切注视的中心和焦点
CPCI、EI这两个检索系统评定科技论文和科技期刊的质量标准相对要宽松
CPCI是一种综合性的科技会议文献检索刊物,该检索工具收录包括自然科学、技术科学以及历史与哲学等,覆盖的学科范围广,收录会议文献齐全,而且检索途径多,出版速度快。
易成为了检索全世界正式出版的会议文献的主要的和权威的工具。
26.临近算符
NEAR/x :NEAR代表所链接的两个词之间的词语数量小于等于N,默认的使用Near的缺省值是15.
SAME:要求两个检索词是在一个检索字段中.Yale SAME hosp 27.利用WOS强大的分析功能
Web of Science数据库中可以对检索结果按照以下方式进行研究:按照作者分析:了解某个研究的核心研究人员是谁;
按照国际和地区分析:了解核心研究国是哪里;
按照文件类型分析:了解该研究通常以什么途径发表;
按照机构名称分析:了解有哪些机构在从事这项研究;
按照语种分析:了解该研究是以什么语种发表的;
按照出版年分析:了解该研究的发展趋势;
按照期刊标题分析:了解该研究通常发表在哪些期刊上;
按照学科分类分析:了解该研究设计了哪些研究领域。
28.检索方式选择
EI Compendex Web的主要检索方式有三种:
快速检索(Quick Search——系统默认界面)
专家检索(Expert Search)
词表检索(Thesaurus Search)
此外,还有浏览检索(Browse Indexes)等其它辅助检索工具. 29.检索表达式的构造
逻辑运算符(AND,OR,NOT):逻辑运算符的运算优先级别相同,自左向右。
字段限制符(wn 字段码):window wn TI AND sapphire wn TI
短语检索(“检索短语”或者{检索短语})
截词运算符
词根检索($):$management 可查manage,managed,manager,Managers,managing等.
30.浏览索引
浏览索引可帮助用户选择合适的检索词;
在快速检索和专家检索中都提供浏览索引功能;
在快速检索中有作者、作者单位、刊名、出版社和Ei受控次的浏览索引;
在专家检索中还增加了论文类型、文献类型和语言的浏览索引。
由于Ei Compendex 以不同的格式引用作者的姓名,所以特别建议用户在检索时使用作者浏览索引。
31.结果浏览
可以在结果浏览中浏览命中记录的文摘信息(Abstract—系统默认格式)和详细信息(Detailed Record)
可以改变记录的排列顺序
可以获取记录的全文和链接图书馆馆藏
可以进行组合检索
可以回顾检索历史、保存检索策略、保存检索结果、通过E—mail 发送最新文献的点子通告等
32.小结
Ei Conpendex使用的平台是Engineering Village,uong检索收录或文献时,注意选库。
Ei用于检索工程领域的二次文献。
检索方法有快速检索、专家检索和词表检索,建议初学者采用快速检索的方法.
注意采用该数据库特有的浏览器索引功能,可使检索结果更准、
更全。
33.专利类型
发明专利:是指对产品、方法或其改进所提出的新的技术方案.
实用新型专利:是指对产品的形状、构造或其结合多提出的适于使用的新技术方案.
外观设计专利:是指对产品的形状、团或者其结合以及色彩与形状、图案的结合所做出的富有美感并适于工业应用的新设计。
34.专利的特点
专有性:是指专利权人对其发明创造所享有的独占的制造、使用、销售和进口的权利。
地域性:一个人/国家依照其本国专利法授予的专利,在该国法律管辖的范围内有效,对其他国家没有任何约束力,外国对其专利权不承担保护义务。
时效性:对于专利的保护期限,各国的规定不尽相同。
我国专利法规定:发明专利、实用新型专利以及外观设计专利的保护期限自申请日起分别为20年、10年、10年。