信息检索与利用-检索流程
《信息检索与利用》课程标准
江苏省新闻出版学校出版与发行专业(五年制高职)《信息检索与利用》课程标准一、概述(一)课程性质《信息检索与利用》是新闻出版与发行专业的专业基础课,通过系统的理论讲授与专门的实践操作训练,旨在帮助学生强化科技信息需求与表达,深入掌握科技信息查询与数据分析的知识、方法与技能,提高学生灵活运用信息资源体系、检索工具和方法解决科技类信息问题的能力,进而促进学生在现代信息环境下基于资源的学习和研究能力的增长,以达到全面强化学生的信息素质的目的。
并通过实践技能训练,提高学生的实践能力、创新能力和职业能力,为学生就业打下坚实的理论基础和职业基础。
(二)课程基本理念注重培养学生的专业思维能力和专业实践能力,把创新意识的培养贯穿于整个教学中。
采用理论与实践相结合的教学方法,培养学生分析问题、解决问题的能力。
通过理论讲述使学生掌握信息检索与数据分析的基本原理和基本方法;通过项目学习与训练使学生进一步理解掌握信息检索与利用的基本方法。
(三)课程设计思路以就业为导向,以能力为本位,以职业技能为主线,以情境单元课程为主题,尽可能形成基于职业岗位、工作过程的课程体系。
在具体学习项目的选择和编排中,以情境单元为基础,通过实训、案例分析、情景模拟、实战训练、上机操作等相结合的形式培养学生分析问题、解决问题的实际能力,以及对理论知识的深化了解。
本课各部分具体内容及课时分配如下表:二、课程目标(一)总目标通过对《信息检索与利用》课程学习,使学生学会信息检索与利用的基本概念、基本理论、基本方法,树立良好的信息检索理念,学会运用信息,培养学生发现、分析和解决问题的能力,熟练掌握信息检索与利用的策略和技术,养成良好的职业道德和职业思想。
(二)具体目标1.素质(1)具备较高的信息素养,理解合理合法构建专业信息资源体系在知识创新中的重要作用。
(2)掌握信息检索的基础知识(信息检索方法、信息检索策略、信息检索步骤、信息检索结果的识别)。
(3)掌握一定的统计分析方法。
信息检索与利用
信息检索与利用信息检索与利用随着数字化时代的到来,信息的数量和种类在不断增长,人们对于信息的需求也日益增强。
如何快速、准确、有效地获取所需信息,成为了信息时代的一大难题。
信息检索与利用成为破解这一难题的有效途径之一。
一、信息检索的概念及流程信息检索是指根据用户提出的检索词或检索式,在信息组织体系中寻找与之相关联的信息并找到其位置,提供用户预期的检索结果的过程。
信息检索可分为手动检索和机器检索两种方式。
手动检索是指通过人工筛选的方式进行检索,而机器检索则是在计算机或其他智能设备的支持下进行检索。
在信息检索过程中,我们需要遵循一定的流程,如图1所示。
图1 信息检索流程首先是明确检索目标。
明确检索目标是信息检索中最基本也是最关键的一步。
只有明确具体的检索目标,才能确定检索内容、检索方法和搜索策略。
第二步是制定检索策略。
搜索引擎检索策略是制定检索操作的指导方针和方法。
其中,关键词的选定和排列,是关键词检索的首要环节,直接影响检索结果的质量和检索速度。
接着是信息检索操作。
信息检索过程中必须要有一个有效的检索平台或检索工具。
通常,我们在搜索引擎、数据库或图书馆的数据库中进行检索。
在实际操作中,可以通过精细的查询语句进行检索,也可以通过分类、浏览等方式获取所需信息。
最后是反馈和评价。
通过反馈和评价,不仅可以对检索过程进行改进,还可以对检索结果进行分析、评价和处理。
同时,还可以通过反馈和评价获取更多更有价值的信息。
二、信息检索的方法信息检索方法根据检索策略的不同,主要可以分为以下几种。
1.关键词检索法关键词检索法,指的是以相关关键词为检索关键词组成查询语句,在检索工具中进行关键词检索的一种检索方法。
本方法适用于检索范围较广、目标较为明确的信息。
2.分类检索法分类检索法,是指根据先前设计好的分类知识体系,将信息按照分类学科进行归类,并在科学分类树中按照路径寻找所需信息的一种检索方法。
该方法适用于专业知识体系较为完善、信息明确的情况。
信息检索与应用第四章 中文数据库检索
文献太少怎么办
方法一:减少检索词 方法二:重新选择检索字段 方法三:知网节帮你解决 用不同的检索字段,逐步扩大检索范围:
篇名 < 关键词 < 文摘 < 主题 < 全文
检索实践
检索文章名称中包含“管理学”的期刊文章。 检索“老年性糖尿病”有关的医学文献。 检索“中医药治疗乙肝”方面的文献。
高级检索
高级检索可以在所有的字段中进行检索、 构建布尔检索式 检索词之间的逻辑组配关系为
不同字段之间:并且、或者、不含 同一字段中:并含、或含、不含 词频:检索词在相应检索字段中出现的频率 匹配:检索词命中方式(精确查询、模糊查询) 检索结果排序
可以对检索条件进行限定
检索小技巧
中文数据库检索
CNKI期刊、学位论文检索
中国知网数据库(简称CNKI)、中文科技 期刊数据库(简称维普)、万方数据库 (简称万方)是我国三大权威数据库。
CNKI简介
CNKI即是中国知识基础设施工程(China National Knowledge Infrastructure)。 CNKI工程是以实现全社会知识资源传播共享与 增值利用为目标的信息化建设项目,由清华大 学、清华同方发起,始建于1999年6月。 《中国知识资源总库》的全球最大的中文知识 门户网站, CNKI 亦可解读为“中国知网” (China National Knowledge Internet )的 英文简称。
按基金分组
按基金检索,细 化检索方向
检索结果处理——结果排序
排序浏览:可根据主题排序、发 表时间、被引频次、下载频次等 条件查看相关文献信息
信息检索的一般步骤主要流程
信息检索的一般步骤主要流程
信息检索的一般步骤主要流程包括以下几个步骤:
1. 确定检索需求:明确需要检索的信息内容、范围以及检索的目的和要求。
2. 制定检索策略:根据检索需求,制定具体的检索策略,包括选择合适的检索工具和数据库、确定关键词或搜索词的选择以及设置检索条件等。
3. 执行检索:根据制定的检索策略,在选定的检索工具或数据库中进行具体的检索操作,输入关键词或搜索词,设置检索条件,并获取检索结果。
4. 评估检索结果:对获取的检索结果进行评估,判断是否符合检索需求和要求,如需要可以对检索结果进行筛选、排序、整理和分类等处理。
5. 分析和利用检索结果:对检索结果进行分析,提取有用的信息,并进行进一步的利用,如撰写报告、写作论文、制定决策等。
6. 检索效果评估:评估检索过程和结果的效果,如对检索策略和工具的评价,对检索结果的准确性和相关性进行评估等。
7. 反馈和调整:根据评估结果,对检索过程和结果进行反馈和调整,可能需要重新制定检索策略,再次执行检索等。
这些步骤并不是严格的线性顺序,可以根据实际情况进行灵活调整和组合,以达到更好的信息检索效果。
信息检索与利用教程电子教案
表谱:以列表形式揭示有关知识内容 的参考工具书称为表谱。例《中国医 史年表》与《实用中医内科表典》。
图录:以图形画像掲示事物形象,并 配以文字说明的参考工具书称为图录。
表谱、图录能直观、形象与简明地反 映了事物原貎,是一种实用价值很大的 参考工具书。
2020/5/8
信息检索与利用教程
19
(6)、名录
以《全国报刊索引》为例,熟悉并认识手 工检索工具的编排结构、正文格式及查 找方法。
例:
2020/5/8
信息检索与利用教程
8
2.1.2 参考工具书
工具书是一种依据特定的需要,广 泛汇集相关的知识或文献资料,按一定 的体例和检索式编排,专供查资料线索 的图书。
2020/5/8
信息检索与利用教程
9
工具书的编排结构
《中国卫生年鉴》
《中国中医药年鉴》
《中国百科年鉴》
2020/5/8
信息检索与利用教程
14
(4).手册
手册或称指南,是汇集有关学科或 领域的基本知识、资料和数据,以 供人们随时方便地查检的参考工具 书。 如:《家庭医护手册》、《医学实用 数据手册》(三楼参考工具书)
2020/5/8
信息检索与利用教程
2020/5/8
信息检索与利用教程
23
2.2.2 年度资料的检索
年度资料——年鉴
年鉴是及时报道某国家、地区或行 业/领域最新信息的工具书, 一年 出版一次,通常分门别类,按时 间顺序,以短文形式记录过去一 年有重大影响的人物和发生的重 要事情。最有代表性的是统计年 鉴
2020/5/8
信息检索与利用教程
12
(2).百科全书
以词条形式系统介绍各学科基 本概念、基础理论、重要事实及数 据、历史人物等的参考工具书。
信息检索与利用
信息检索与利用的相关技术
自然语言处理技术
自然语言处理技术是一种将 自然语言文本转换为计算机 可处理形式的技术。该技术 可以应用于信息检索系统中 ,通过将用户的自然语言输 入转换为计算机可理解的形 式,提高系统的准确率和效 率
信息检索与利用的相关技术
机器学习技术
机器学习技术是一种通过让计算机自 动学习和改进以实现特定任务的技术 。该技术可以应用于信息检索系统中 ,通过训练和学习,使系统能够更好 地理解和处理用户输入,以及更准确 地返回相关结果
和工具,从大量的信息中查找
02
和获取所需信息的过程
本文将介绍信息检索与利用的
04
基本概念、发展历程、重要性
及相关技术03ຫໍສະໝຸດ 而信息利用则是指将所获取的 信息用于解决实际问题或提升 自身能力的过程
2
信息检索与利用 的发展历程
PART 2
信息检索与利用的发展历程
信息检索与利用的发展历程可以
追溯到古代的图书分类和编目。 然而,真正意义上的信息检索始 于20世纪50年代,当时美国国防 部(DOD)开始实施军事数据库项 目,包括"国防部信息查询服务 "(DIALOG)和"军事查找与检索系 统"(MIDS)。这些系统利用了"布 尔模型"和"向量模型"等检索模 型,实现了对大量信息的高效检
本文介绍了信息检索与利用 的发展历程、重要性及相关 技术,希望对大家有所帮助 和启示
-
汇报结束
不妥之处敬请批评指正
5
信息检索与利用 的相关技术
PART 5
信息检索与利用的相关技术
信息抽取技术
信息抽取技术是一种从自然 语言文本中提取出特定信息 (如命名实体、时间、地点 等)的技术。该技术可以应 用于信息检索系统中,通过 对文本内容的分析和理解, 提取出其中的关键词、主题 等有用信息,提高系统的查 全率和查准率
信息检索的一般步骤(主要流程)
信息检索的一般步骤(主要流程)当进行信息检索时,以下是更具体的论述和详细的步骤,以便更好地理解信息检索的主要流程:1. 确定信息需求:- 明确问题:确保清楚自己需要解决的问题或寻找的信息。
- 确定范围:限定问题的范围和关注点,以便更精确地搜索。
2. 收集信息源:- 根据需求选择合适的信息源,如图书馆、学术数据库、网络搜索引擎等。
- 确定可靠的来源:选择来自权威机构、专业出版物或可信的网站的信息源。
3. 制定搜索策略:- 选择适当的搜索引擎或数据库:根据信息类型和领域选择最适合的工具。
- 确定关键词:使用与问题相关的关键词和术语来进行搜索。
- 利用搜索语法:使用引号、布尔运算符(AND、OR、NOT)等来优化搜索结果。
4. 进行搜索:- 输入关键词:将确定的关键词输入搜索引擎或数据库的搜索框中。
- 运行搜索:点击搜索按钮或提交搜索查询以获得结果。
5. 筛选信息:- 查看搜索结果:浏览搜索结果页面,根据摘要或标题初步筛选信息。
- 阅读评估:选择合适的文献或页面进行仔细阅读,评估其与问题的相关性和可信度。
6. 阅读和理解:- 仔细阅读:对选定的文献或页面进行全面阅读,注意关键观点、实证数据和结论。
- 理解内容:理解文献或页面中的信息,将其与问题和需求进行联系和比较。
7. 组织和归纳:- 整理信息:将获取的信息进行整理、分类和注释,以方便后续使用和参考。
- 归纳主要观点:总结并归纳出对问题最重要的观点、发现或结论。
8. 评估和反思:- 评估结果:反思搜索过程中所得到的信息是否解决了问题或满足了需求。
- 反思改进:分析搜索过程中的不足之处,以改进和提高将来的信息检索能力。
以上步骤提供了一个基本的信息检索流程,但要记住,每个人的需求和情境都可能有所不同,因此可以根据实际情况进行调整和定制化。
此外,信息检索是一个持续的过程,可能需要多次迭代和尝试,以获得最佳的结果。
图书馆的信息检索与利用
数据库检索技巧
提供数据库检索技巧和培训,帮助读者更加高 效地利用数据库资源。
数据库资源评价与选择
对数据库资源进行评价和选择,为读者提供更好的学术研究和学习支持。
04
信息检索评价与提高
信息检索评价
检索速度
评价检索系统的响应速度,确保用户能够快 速获取所需信息。
查准率
评估检索系统检索结果的准确性,降低无关 信息的干扰。
电子资源的利用
电子期刊与数据库
01
提供各种电子期刊和数据库资源,方便读者进行学术研究和学
习。
电子图书与参考工具书
02
提供电子图书和参考工具书,满足读者对于不同类型文献的需
求。
电子资源检索技巧
03
提供电子资源检索技巧和培训,帮助读者更加高效地利用电子
资源。
数据库资源的利用
数据库类型
介绍不同类型的数据库资源,如学术数据库、 商业数据库等。
社区化发展
构建线上线下相结合的社 区平台,促进用户之间的 交流与合作。
跨界合作
与其他信息机构、企业等 开展合作,实现资源共享 和互利共赢。
THANK YOU
信息素养与信息道德相互关联
信息素养和信息道德在很多方面是相互关联的。具备信息素养的人更容易理解信息道德的要求,而遵 守信息道德也是提高信息素养的重要方面。
信息素养与信息道德相互促进
提高信息素养有助于更好地理解和遵守信息道德,而遵守信息道德也有助于提升个体的信息素养水平 。两者共同促进个体在信息化社会中的全面发展。
根据用户需求和偏好,为用户提供定 制化的检索服务。
加强用户培训
提高用户的信息素养和检索技能,使 其能够更有效地利用图书馆资源。
文献信息检索与利用
文献信息检索与利用信息检索与利用是信息领域的一项重要任务,涉及到检索和利用各种类型的信息源,包括文献、数据库、网络资源、社交媒体等,以满足信息需求和支持决策。
本文将着眼于文献信息检索与利用,介绍文献检索的基本概念、检索工具和检索技巧,并探讨文献利用的方法与技巧,以提高文献检索与利用效率和实用价值。
一、文献检索的基本概念1. 文献定义及其分类文献是指以书写形式记载下来的各种信息,包括书籍、期刊、报纸、学位论文、研究报告、专利、标准、技术资料等,其特点是具有较高的准确性、权威性和可信度。
文献按照出版载体、出版形式和内容特征划分,可以分为印刷文献、电子文献、政府文件、商业文献、学术文献、非学术文献等。
2. 文献检索的定义及意义文献检索是指通过一系列的检索策略和工具,筛选和获取与特定研究主题相关的文献信息的过程。
文献检索的意义在于:可以快速获取大量的相关文献信息,提高研究的效率和准确性;可以发现新的知识点和研究趋势,有助于科学研究和学术交流;可以拓宽学术信息来源,增加研究的深度和广度。
3. 文献检索的基本步骤文献检索一般包括以下基本步骤:(1)明确研究主题和目的,制定检索计划和策略;(2)选择合适的文献检索工具和数据库,如中英文文献数据库、学位论文数据库、专利数据库等;(3)设置检索关键词和检索语法,如采用布尔运算符(AND、OR、NOT)或括号来组合检索词;(4)执行检索操作,并对检索结果进行筛选和评估,包括去重、排除不相关文献、确定重要文献等;(5)阅读和理解检索到的文献内容,提取有用信息和数据,支持自己的研究和决策。
二、文献检索工具文献检索工具是实现文献检索的重要支撑,常见的文献检索工具有以下几种:1. 图书馆目录图书馆目录是指图书馆所收藏的各种文献信息,如书名、作者、出版社、题名、分类号等,通过书名、作者、题名等关键词来检索和查找相关文献。
图书馆目录的优点是全面性强,对于印刷文献和中文文献的获取有很好的覆盖率;缺点是速度慢,检索方式单一,难以处理大量文献信息。
网络信息的检索与利用~
第一章1.信息检索(information retrieval)是指将新鲜一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程.全称又叫信息存储于检索(information storage and retrieval).狭义的信息检索则仅指从信息集合中找出所需信息的过程.信息检索的分类:A根据检索手段的不同,可分为:手工检索、光盘检索、联机检索和网络检索。
(网络检索式信息检索的发展方向,因而本书以网络检索为主)。
B根据检索对象形式的不同,可分为:①文献信息检索:是以文献(包括题录、文摘和全文)为检索对象的检索。
②数值型信息检索:是以数值或数据为对象的一种检索,包括文献中的某一数据、公式、图表,以及某一物质的化学分子式等,数据检索分为数值型和费数值型。
③事实型信息检索:是以某一客观事实为检索对象,查找某一事物发生的时间地点及过程的检索,其检索结果主要是客观事实或为说明事实而提供的相关资料。
2.检索语言是把信息的存储与检索联系起来,把标引人员与用户联系起来,以便取得共同理解,实现交流的语言. 目前使用的检索语言包括:人工语言(分为主题语言和分类语言)和自然语言(可以为那些不懂人工语言的网络用户提供极大的便利).3.数据库是“至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合”. (通俗)数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。
数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源.根据载体不同可分为:联机数据库(online database),光盘数据库(CD-ROM database)和网络数据库(networked database).根据内容与功能可划分为:指南数据库(directory database),交易(执行)数据库(transactional database),全文数据库(full text database),书目数据库(bibliographic database),字(词)典数据库(dictionary database),数值数据库(numeric database)与统计数据库(statistical database)和图像数据库(image database).4.检索词是用户或检索人员给出的字,词,字符或短语,用于查找含有它们的记录.检索式也称检索提问表达式,是要求系统执行的检索语句.检索策略是就一个问题检索一个或多个数据库所输入的全部检索式的集合,是为满足信息需求所制定的一系列检索式.5.查全率(recall ratio)与查准率(precision ratio)是检索质量的两个重要的评价指标.查全率是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例.查准率是指检出文献中合乎需要的文献数量占文献全部数量的比例.6.布尔逻辑检索的主要运算符是:①逻辑”与”,用AND(或*)表示.②逻辑”或”,用OR(或+)表示.③逻辑”非”,用NOT(AND NOT,BUT NOT)(或-)表示.7.邻近检索:又称位置算符检索,文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样.位置算符检索是用一些特定的算符来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用, ,BDS拥有的国内信息库主要有:中国国防科技信息、中国军工报、网上新闻库、国防科技成果综合推广库、现代军事、中国工程院士学术报告、国防科技简讯、国内成果交流库、国防科技报告中文馆藏库、国防科技中文文摘库、中国经济信息库、中国科技期刊题录库、中国专利文摘库。
信息检索基本步骤
案例分析:
课题名称 检索系统
三维打印技术的应用 CNKI、万方、维普
湖泊富营养化的处理 CNKI、万方、维普
第三步 提炼检索词
方法:切分、去除、替补 注意:
逻辑“或” —————————————————
A
B
用符号“or”或“+”表示,其逻辑表达式为:
A or B
或 A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
逻辑“与” ————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为:
A*B
或Hale Waihona Puke A and B其意义为检索记录中必须同时含有检索词A和B的
文献,才算命中文献。
逻辑“非” ————————————————
AB
用符号“not”或“-”,其逻辑表达式为:
A not B
或
A-B
其意义为:检索记录中含有检索词A,但不能
含有检索词B的文献,才算命中文献。
案例分析:
课题名称
三维打印技术的应用
2 检索效果的评价指标
检索效果(Retrieval Effectiveness)是指检索系 统检索的有效程度,它反映了检索系统的能力。包括 技术效果和经济效果。
克兰弗登(Cranfield)评价系统性能的指标:
♦ 收录范围 ♦ 查全率 ♦ 查准率 ♦ 响应时间 ♦ 用户负担 ♦ 输出形式
➢查全率 是指检出的相关文献量与检索系统中相关文献总量的
信息检索的步骤
电子期刊
01 CNKI中国知识资源总库 02 维普智立方发现系统
05 万方会议论文
CNKI中国知识资源总库
作为“CNKI平台”资源基础的《中 国知识资源总库》,目前已容纳了 包括CNKI系列数据库和来自国内 外的加盟数据库2600多个,全文 和各类知识信息数据超过了5000 万条,是目前全球最大的知识资 源全文数据库集群。
电子资源的检索与利用
3.4信息检索的一般步骤
信息检索的一般步骤
01 分析检索课题,明确信息需求 02 选择检索工具,了解检索系统 03 确定检索途经,选定检索方法 04 实施检索策略,浏览初步结果 05 调整检索策略,获取所需信息
信息检索步骤示意图
③
①
②
分析检索课题
1.主题内容 2.时间范围 3.信息类型
读秀学术搜索
假期漫游
从2011年12月9号开始,可使用"我的图书馆"账号登录读 秀,新用户请在学校ip内注册,注册登录完成后请点此验 证,已有账号的同学请在学校ip内登录后点此验证
使用方法:在读秀登录页面点击"寒假账号登录"链接,先登 录"我的图书馆",然后从我的图书馆首页左上角的链接进 入读秀
"超星数字图书馆"为目前世界最大的中文在线数字图书馆,提供 大量的电子图书资源提供阅读,其中包括文学、经济、计算机等 五十余大类,数百万册电子图书,500 万篇论文,全文总量 13 亿余页,数据总量1000000GB,大量免费电子图书,超16万集的 学术视频,拥有超过35万授权作者,5300位名师,一千万注册用 户并且每天仍在不断的增加与更新。为目前世界最大的中文在线 数字图书馆。
信息检索与利用-第五章第五节
图书馆“国内外美术专业网站导航”网页
/whdh-xkdh/xkdh-msx-mswz.htm
一、艺术、体育信息计算机检索
2. 音乐学科网站
中央音乐学院(GB) /
一、艺术、体育信息计算机检索
加拿大多伦多音乐学院(中英文) /
二、艺术、体育信息工具书检索
中国书法鉴赏大辞典 周倜主编,北京燕山出
版社1989年版。
中国美术名作鉴赏辞典 潘耀昌主编,浙江文
艺出版社1999年版。 还有《世界美术家画库》、《今日中国美术 (中英文本)》、《中国美术馆藏革命历史题材 优秀美术作品选》、《外国美术名作欣赏》等。
二、艺术、体育信息工具书检索
二、艺术、体育信息工具书检索
② 研究论著信息检索
四部总录· 艺术篇 丁福保、周云青著,商务印书馆1957
年版。该书著录图书1500余种。 中国古代画论要籍简介 温肇桐编,天津美术出版社 1980年版。该书收录469种古代画论要籍,并附古代画论 常用工具书目。 书画书录解题 余绍宋撰,浙江人民出版社1982年据 1932年本影印。 全国报刊造型艺术资料索引 人民美术出版社1987年 编辑出版。该书收录有关艺术方面的论文资料1万余条。
二、艺术、体育信息工具书检索
钢琴名曲大全 (美)威尔编,人民音乐出版社1988年
版。
中国音乐史图鉴 中国艺术研究院音乐研究所编,人民
一、艺术、体育信息计算机检索
National Basketball Association(NBA)=
美国NBA网站 /
一、艺术、体育信息计算机检索
足球报电子版(GB) / 中国乒乓球协会(GB) / Fédération Internationale de Volleyball(FIVB)=国际 排球联合会 http://www.fivb.ch/
“信息检索与利用”检索报告(搜索引擎检索)
[3]网络信息检索的未来[M]傅蓉图书馆学研究2002-07-30/kns/brief/default_result.aspx
[4]论网络环境下情报检索语言的发展趋势[C],易红,徐军华,武汉大学/view/feae8bd99ec3d5bbfd0a74cf.html
[5]现代信息检索在网络环境下的发展趋势江苏教育学院王小婷(中图分类号)G250.73〔文献标识码〕F〔文章编号〕1008-0821(2006)10-0067-02
/view/be1c8e3f87c24028915fc39a.html
检索实习总结(检索方法、检索系统的比较,检索过程、检索结果的分析等).
“信息组织与利用”检索报告
(注:利用搜索引擎查找相关信息)
班级:计算机15-1学号:5011110121姓名:艾丽木姑丽。塔依尔分数
课题名称
网络信索引擎)
课题分析:以计算机技术、通信技术和网络技术为代表的现代信息技术的飞速发展,改善了信息检索技术的软硬件环境,促进了信息检索理论与实践的发展,同时也给信息检索带来了新的挑战。网络信息资源纷繁复杂、类型多样,如何从海量的网络信息资源中快速、准确、高效的检索到所需信息,是现阶段值得关注的问题。用户对信息的需求、利用与信息量的急剧增长之间的矛盾,尚未得到很好的解决。而知识检索能适应用户的现实信息需求及其发展变化。
信息检索与利用第二课
可以检出含有“ 可以检出含有“Heat pipe”的文献 的文献
(nW)算符
(nW)算符是(W)的复数形式,其中的 算符是( )的复数形式,其中的W 算符是 既表示With,也表示 既表示 ,也表示Words。在两词之间 。 使用( ), ),表示算符两侧的检索词的 使用(nW),表示算符两侧的检索词的 词序不可颠倒,但两词之间允许插入最 词序不可颠倒, 个词。 多n个词。 个词 – 例: Wear(1W)materials
截词算符
是指用给定的词干做检索词, 是指用给定的词干做检索词,查找含有 该词干的全部检索词的记录, 该词干的全部检索词的记录,也称词干 检索或字符屏蔽检索。 检索或字符屏蔽检索。
– – – – – 右截断(前方一致): 右截断(前方一致):comput* 前方一致 左截断(后方一致): ):*magnetic 左截断(后方一致): 中间截断(前后方一致): ):organi?ation 中间截断(前后方一致): 有限截断: 有限截断:fib? ? 无限截断 : comput* 等
续 上
列出Web的同义词: 的同义词: ③ 列出 的同义词 3W、万维网、环球网、环球信息网 、万维网、环球网、 的检索词为: 例1的检索词为: Web、3W、万维网、环球网、环球信息网分 、 、万维网、环球网、 布式、 布式、协同工作 构建检索式: 构建检索式:用检索算符连接上述检索词后 的检索式为: 的检索式为:
1.4计算机信息检索步骤 计算机信息检索步骤
1分析检索课题 分析检索课题 首先应了解该检索课题属于什么学科范围, 首先应了解该检索课题属于什么学科范围,以 便选择数据库; 便选择数据库;其次应了解国内外采用什么技 术术语,以便拟定检索词; 术术语,以便拟定检索词;再其次要了解检索 目的是广泛地调研发展现状(要查全), ),还是 目的是广泛地调研发展现状(要查全),还是 要解决什么具体技术问题(要查准); );是基础 要解决什么具体技术问题(要查准);是基础 理论研究(要查学术性期刊、会议论文、 理论研究(要查学术性期刊、会议论文、学位 论文),还是产品开发、 ),还是产品开发 论文),还是产品开发、工艺改造的应用性研 要查报告、专利、标准)。总之, )。总之 究(要查报告、专利、标准)。总之,只有先 对技术课题的性质、 对技术课题的性质、学科范围和检索目的等充 分了解后,才能顺利进行后续工作。 分了解后,才能顺利进行后续工作。
检索一般步骤_信息检索与应用_[共3页]
般注重查阅近期资料,不必一年一年地往前查到底,只需查到所需资料够用时为止。
此法的优点是可节省不少时间,缺点是漏检率较高。
(3)抽查法。
这是利用某一学科的发展,一般是波浪式的特点,进行查找的方法。
当该学科处在兴旺发展时期时,科技成果和发表的文献一般也很多。
因此,只要针对发展高潮期进行抽查,就能查获较多的文献资料。
(4)引文法。
引文法是一种查找时以某一特定论文的著者为对象进行追溯检索的方法,利用引文索引查找文献。
4.分段法分段法又称循环法,是交替使用“追溯法”和“常规法”来进行检索的综合检索方法。
检索的过程通常是分段进行的,即利用检索系统查到一批文献资料,又利用这些文献资料所附的参考文献追溯查找,这样分期分段地交替进行,循环下去,直到满足检索要求为止。
这样即使检索系统有缺期、缺卷现象存在,也能连续获得所需年限以内的文献资料。
1.4.2 检索一般步骤1.分析课题分析研究课题要明确检索要求和范围。
正式检索文献之前,对课题要进行认真的分析研究,明确课题查找的要求,这个环节相当重要。
如果课题的要求不同,则检索的工作量会相差很大。
例如,要查找“茶树的种植”的资料,对茶树的性状、用途等方面的资料可以不查;但如果提出的课题是有关茶叶资料的普查,则有关的各方面的资料都应查找。
通过分析课题,明确查找要求(时间、文献类型等)后,还要根据课题的学科性质,确定检索的学科范围。
课题分析要从以下几个方面进行。
(1)分析主题内容。
所谓主题内容,就是课题研究的中心问题。
如果一个课题研究的中心问题有多个,就有多个主题。
根据课题的内容,需要深入分析主题。
其目的在于明确课题检索的要求,找出课题需要的关键,进而形成反映课题中心问题的主题概念,即拟出关键词。
(2)分析问题类型。
不同检索系统在收集不同类型的信息时会有所侧重,检索时应当根据信息类型选择检索系统,才能使检索达到最佳效果。
自然科学领域的研究通常分为基础研究、应用研究和开发研究三种。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
构造检索式(试验性检索)
例4:地震序列分析的工具和方法研究 要完成本项检索课题,必须使用结构性提问式: 题名=地震序列 and 主题=分析 and 任意字段=(工 具或方法)
构造检索式(试验性检索)
1.当检索结果信息量过多时
原因:选用了多义性的检索词;截词截得过短;输 入的检索词太少;应该使用“与(AND)”的使用了“ 或(OR)”;优先运算符“()”使用错误。考虑缩 小检索范围,方法如下:
(1)减少同义词、同族相关词等相关性不强的检索词 。 (2)采用“AND” 或“NOT”算符连接检索词或进行二 次检索。
构造检索式(试验性检索)
(3)使用范围较小的字段 通常的字段限制范围的大小顺序是: 题名<关键词<摘要<全文 (4)缩短检索年限,限制检索结果的文献类型、语种 及出版国。 (5)使用位置算符。 (6)改模糊检索为精确检索。
构造检索式
所谓的检索提问式(query,search formulation ),是信息检索中用来表达用户检索提问的逻辑 表达式。 组成:布尔逻辑算符、 位置算符、 截词符、 限制算符 系统规定的其他组配连接符号
构造检索式(试验性检索)
简单提问式——含一个检索词的提问式; 上下文提问式——精确短语或近似精确短语的提 问式,也可称为短语提问式; 复合提问式——含有布尔算符和至少2个检索词 的 提问式; 结构性提问式——含有2个以上布尔算符和至少4 个检索词的多层结构组合的提问式。
同义词的选择方法
除前面介绍的几种方法选择同义词之外,再介
绍几种常用的方法。
(1)利用数据库的同义词选择功能
(2)利用搜索引擎寻找同义词
(3)从数据库检索结果中寻找同义词
(4)利用自己的专业知识
(5)利用自己平时积累的知识
维 普 期 刊 库
百 度
6
中 国 期 刊 库
艾滋病 AIDS HIV STD 爱滋病 ……
信息检索流程(以期刊为例)
课题 选择检索词(限定词、同义词) 初步拟定检索式并导入数据库 调整检索策略再次拟定检索式(考虑查全、查准率)并导入数据库 命中结果(题录形式) 阅读单篇摘要 批量下载摘要
索取全文(中文、外文)
检索词选择技巧-1
1.切分
切分是对课题的语句以词为单位进行拆分,转换为 检索的最小单元。 例1:检索“妇女吸烟与肺癌的关系研究”相关文献。 直接切分:妇女|吸烟|与|肺癌|的|关系|研究 注意:当词切分后将失去原来的意思时,不应再切分 ,即必须注意保持意义的完整。如“中国科学院”、 “电子邮件”不可再切分。
检索词选择技巧-1
2.删除
删除是对自然语言中不具有实质性检索意义的: 虚词(如介词、连词、副词等), 使用频率较低的词, 专指性太高、过分宽泛的词 过分具体的限定词 不能表达课题实质的高频词 存在蕴含关系可以合并的词
检索词选择技巧-1
英语或汉语中都有许多虚词,不能作为检索词。 如:汉语中“的、地、得、了”等助词 英语中的a about also and any as at be between by both for some so not this with等介词或冠词等
构造检索式(试验性检索)
(3)减少检索年限、文献类型、语种及出版国的 限制,如增加回溯检索年限; (4)选择范围较小的字段,如题名字段 (5)使用截词符(?或*); (6)改精确检索为模糊检索;
(7)同时使用拼写正确的词,以及拼写错误的词 或存在多种普遍错别字的词作为检索词。
调整检索策略(正式检索)
(4)注意外来词的译写变化
波尔兹曼 玻耳兹曼 20 31 欧几里德 欧几里得 30 59
玻尔兹曼
波耳兹曼
34
3
欧基曼
0
欧氏几何
Euclid
17
75
Boltzmann 374
(注意:用英文名检出的中文文献最多!)
中国期刊全文数据库/篇名字段/1999-2009年/09.03.09
检索词选择技巧-1
例2:检索“中国非常规天然气工业的发展前景研 究”方面的相关文献。 进行拆分以后,工业、发展、前景、研究这四个自 由词具有一定的检索意义,但是由于或者是意义过 于宽泛、或者是不能表达课题实质、或者是存在蕴 含关系的原因,没有必要全部作为检索词,根据需 要可以保留1-2个作为检索词。
21291
21094
中国期刊全文数据库/篇名字段/1999-2009年/09.03.05
(3)必要时应向上下位类词扩检
电阻焊 112
F 点焊 621 (点焊-电阻焊) 620 缝焊 222 (缝焊-电阻焊) 222 凸焊 37 (凸焊-电阻焊) 37
实际报道“电阻焊”的文献量: 112 + 620 + 222 + 37 = 991(篇)
中国期刊全文数据库/篇名字段/1999-2009年/09.03.09
例1:“妇女吸烟与肺癌的关系研究” 切分:妇女/吸烟/与/肺癌/的/关系/研究 核心检索词:吸烟、肺癌, 补充上位词:烟、癌症、恶性肿瘤。 检索式:(吸烟 or 烟)and (肺癌 or 癌症 or 恶性肿 瘤)
例2: “人工智能技术在计算机辅助教学中的应用与实现” 切分:人工智能/技术/在/计算机/辅助设计/中/的/应用/与/ 实现 核心词:人工智能、计算机辅助设计 扩展:人工智能:同义词:智能模拟 下位概念:模式识别、自然语言理解与生成、专 家系统、自动程序设计 、数据智能检索 计算机辅助教学系统(computer Aided Instruction ,CAD ) 检索式: (人工智能OR智能模拟OR模式识别OR自然语言理解与生成OR专 家系统OR自动程序设计)AND(计算机辅助教学OR CAD)
(1)立足规范词,兼顾自由词
胶粘剂
粘合剂
2611
1021
黏合剂
粘固剂
125
74
粘结剂
胶黏剂
668
275
粘附剂
胶合剂
44
21
粘接剂
225
粘胶剂
19
中国期刊全文数据库/篇名字段/2000-2010年
(2) 注意词的全称、简称及缩写字母
乙型病毒性肝炎 乙型肝炎 乙肝 脱氧核糖核酸 DNA 1318 18426 10233 197 29977
构造检索式(试验性检索)
2.当检索结果信息量太少时
原因:检索词拼写错误;遗漏重要的同义词或隐含概念 ;检索词过于冷僻具体;没有使用截词算符;位置算符 和字段算符使用的过多;使用过多的“AND”算符。考 虑扩大检索范围,方法如下:
(1)考虑同义词或近义词(使用布尔逻辑符or连接);
(2)选择上位词或泛指词补充到检索式中,(如飞行器 ____航天飞机____ 载人航天飞机)
检索词选择技巧-1
检索词选择技巧-1
检索词选择技巧-2
选定的检索词应符合检索目的;确认检索词 是否为规范词;并列出常用中外文同义词、缩写 词, 以及核检索用词。 (1) 立足规范词,兼顾自由词 (2) 注意词的全称、简称及缩写字母 (3) 必要时应向上下位类词扩检 (4) 注意外来词的译写变化 (5) 同义词的选择方法