信息检索
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1信息检索:
1.概念:广义的信息检索是指将信息以一定的方式组织存储起来并根据用户需求找出有关信息的的过程和技术,又称信息存储与检索。狭义的信息检索则是指从已存储的信息集合中找出所需信息的过程。
2.方法:常用法(顺查法倒查法抽查法),追溯法,分段法。
3.步骤:1找出主要或相关内容2列出自然语言或近义词3了解背景情况4明确需要类型、语种5了解有无查全查准查新要求
4.原理:信息用户的需求和信息集合的比较与选择,即匹配。
5.检索效果评价:主要从时间质量费用三方面衡量。
查全率=[检出相关文献量/文献库内相关文献总量]*100%
查准率=[检出相关文献量/检出文献总量]*100%
6.影响检索效果因素:系统收录范围、索引语言、标引工作、检索工作。
2著录是按照一定的规则,对信息的外部特征和内部特征加以简单明确的表述。标引是就信息的内容按一定的分类或主题词表给出分类号或主题词。
6搜索引擎
1.搜索引擎是一种能通过Internet接收用户的查询指令,并向用户提供符合其查询要求的信息资源网址的系统。
2.类型:全文搜索索引擎(google、百度),目录索引类搜索引擎(搜狐、新浪),元搜索引擎,集合式搜索引擎,门户搜索引擎,免费链接列表。
3.搜索引擎检索技术:全文检索技术,隐含语义检索,P2P检索技术,多媒体检索技术。
4.检索方式:简单检索、高级检索、目录检索
5.检索引擎的检索技巧:使用关键字的技巧;减号“-”的运用;利用双引号(“”)进行精确匹配搜索;停用词的应用;及时调整检索策略;巧妙利用目录导航的检索方式。
12检索语言
1.检索语言:特征的语言描述文献内部:检索语言、主题检索语言;特征的语言描述文献外部:提名语言、著者语言、号码语言。
2.分类检索语言:1中国图书分类法2中国科学院图书分类法3杜威十进制分类法4国际十进制分类法
3.主题法检索语言:1标题法2叙词法3关键词法4自然语言法学科内容
4.主题法与分类法比较:是从不同角度揭示文献内容的方式。1分类法主要揭示文献所论述的问题,从文献内容出发,将研究对象置一定的学科体系之下。2主题法直接用名词术语作为检索词,表达概念较为准确和灵活,直接性、专指性、易用性是主题法的主要特征。只注意揭示文献中所论述与研究的对象,各主题词之间是相互独立的。3二者功能互补,检索时二者结合使用更有利于查全查准相
关的文献信息。
13追溯法
这是利用已有文献后面的参考文献进行追溯查找的方法,是在没有检索工具或检索工具不全情况下使用的一种方法,但这种方法查找的文献不全,目前已很少有人使用。
7源数据库
指能直接提供原始资料或具体或具体数据的自足型数据库,用户不必再查阅其他信息源,可包括数值数据库、文本-数值数据库、全文数据库、术语数据库、图像数据库、音频数据库等。
9引文
引文是借鉴前人研究成果的一种方法。要求:1引文精辟2引用完整3内容描述贯通。
25引文分析与引文测度
引文分析:是研究文献之间、期刊之间、科学家之间、机构之间等引证关系的科学计量学的一个领域。引文分析对象不同,引文测度也不同,对科技期刊进行分析的常用指标主要有:影响因子,即年指标,自引用率,自被引用率,引用半衰期,被引半衰期。影响因子作为期刊评价指标已得到广泛应用。
14科学引文索引
SCI,是美国科学情报研究所(ISI)出版产品之一,其形式包括印刷版,关盘版及联机数据库。
局限性:文献收录不全;引词模糊;引文索引在编制上存在问题
19中国社会科学引文索引
CSSCI,由南京大学中国社会科学研究评价中心与香港科技大学于1998年研制,是国家、教育部重点建设项目,并作为我国社会人文科学主要文献信息查询预评价的重要工具,填补了我国社会科学引文索引的空白。
15 RSS
1.概念:RSS是一种描述和同步网页内容的XML格式,通常被认为是Really Simple Syndication(真正简易聚合)的简称。用以发布经常更新资料的网站,例如博客文章、新闻、音频或视频的网摘。
2.优点:对信息获取者【个性化信息聚合;信息获取高效性;信息利用方便性;信息过滤;知识积累与管理;促进交流】
对信息发布者【信息发布低成本;媒体平等;节省版面与带宽;跨平台的信息发布】
5.相对于邮件列表的比较优势:1保护用户隐私2免除垃圾邮件和广告的困扰3取消订阅非常容易4信息的自动快速更新5信息的聚合与过滤
16科技报告
1.含义:科技报告是科研项目投资者或科研管理部门要求项目承担着提交的,反映研究过程中某阶段的进展情况或研究工作最终成果的,以技术积累和技术交流为目的的科技文献。
2.种类:出版形式分:报告、札记、备忘录、论文、译文。
按工作进程时间顺序分:初期报告、进展报告、中间报告、终结报告。按技术内容、文献作用分:科技政策报告、科技考察报告、科技实验报告、科学游记、技术报告。按保密条例和规定分:保密报告,解密报告,非密报告。
3.特点:专一的告知性、明确的目的性、严格的保密性、快速的时效性、广泛的应用性。
4.作用:1具有文献价值和科学研究价值2应用广泛,是科技论文写作的先导3预示或揭示新发明新发现4传播科技知识速度快、能力强5具有确认科学发现、科技发明的优先权。
20知识 11情报 8信息
1、信息:信息是用文字、数据或符号等形式通过一定的传递和处理来表现各种相互联系事物在运动变化中所具有的特征内容的总称。
2、知识:知识是人类在识识和改造世界的社会实践中获得的对事物本质认识币成果和结晶,即人类通过有目的、有区别、有选择地利用信息,对自然界、人类社会及思维方式与运动规律的认识、分析与掌握,并通过人的大脑进行思维整合使信息系统化而构成知识,因此,知识仅存于人类社会。
3、情报:是为一定目的,具有一定时效,经过发送由载体传递,能为感觉器官或感觉系统接收的情况的报导。是具有特定效应的知识。
文献:是记录知识的一切载体。
4、关系:信息是情报和知识的载体,情报是指特指的专业信息,知识是信息和文献的内核,知识依存于信息,信息经过提炼和加工可成为知识,知识是信息中的精华部分;信息的价值取决于其精华部分的价值。
21信息资源
1、概念:指一切能够产生信息或为了传递而持有信息的系统。凡是产生和持有信息,并能传递或透漏信息的人、物和机构,都可以称为信息资源。
2、类型:
按学科划分为自然信息资源和社会信息资源;
可分为离散信息资源和连续信息资源;记忆信息资源和无记忆信息资源;
按开发程度分为潜在~和现实~;按方式和载体分为口语信息资源、口语~、实物~和文献~;