评价信息检索的标准

合集下载

科技信息检索与技术评分标准

科技信息检索与技术评分标准

《科技信息检索与技术》参考评分标准
《科技信息检索与技术》课程总分100分,由以下两个部分构成:
一、平时实习报告(40分)
平时实习一共四次,需要完成信息工具报告。

1.1 电子图书(10分)
1.2中文电子期刊、学位论文(10分)
1.3 外文全文数据库、文摘数据库(10分)
1.4 网络搜索引擎、专利(10分)
二、期末综合报告(60分)
期末综合报告以选定题目进行分析、整理、书写综述报告。

综述字数1000-1500字,我的信息素养300字。

2.1需求分析(5分)
2.2文献收集(15分)
2.2.1检索工具(4分)
2.2.2.检索表达式(5分)
2.2.3检索过程(6分)
2.3信息选择与分析(15分)
3.3.1检索结果的罗列(5分)
3.3.2检索结果的摘要撰写(10分)
2.4 课题综述报告(25 分)
2.5 我的信息素养(附加5分)
信息查询与利用教研室。

大作业-1-《信息检索》综合大作业标准格式

大作业-1-《信息检索》综合大作业标准格式

《文献检索》课程综合大作业课题名称:专业:班级:学号:姓名:得分:完成时间:年月日评分体系及项目得分1.课题的难度系数值(5分)得分2.选择和使用工具书(检索系统)的情况:(1)选择工具书、刊或检索系统的种类(10分)得分(2)查的文献条目的数量(5分)得分(3)所查文献的出版类型(5分)得分(4)所查的原始文献的文种(限中英文两种)(5分)得分(5)外文文摘的翻译情况(至少翻译一篇)(5分)得分(6)综合运用所选工具书、各种索引的能力(5分)得分(7)查准、查全率(所查检索条目与选择课题的针对性的评价)(15分)得分(8)综合运用各种检索方式的能力(多种检索方式扩大或缩小范围)(15分)得分3. 英文原始文献的获取情况(5分)得分4.按照“步骤要求”和“格式要求”完成实习报告情况(5分)得分5.按照格式要求撰写模拟论文 (20分) 得分总分:参考格式(正式作业中请将红色及蓝色文字删除,填入自己的内容):课题名称江苏滩涂的分布、利用现状与前景研究一、分析研究课题1.背景分析:江苏地处我国沿海中部,东临黄海,海洋区位优势明显。

海洋资源密度指数列全国第二,丰度指数列全国第六,综合指数为全国第三,海洋自然资源的分布在我国处于重要地位。

然而,到目前为止江苏沿海地区仍然是一块尚未充分开垦的宝地。

江苏省政府制定的"九五"计划和2010年远景规划中将建设"海上苏东"列为全省发展的重点工程,即通过10至15年的开发,使江苏东部沿海的海洋经济达到陆地经济的水平,实现全省经济发展战略从陆地向海洋延伸,到2010年基本形成沿海港口群体和临海工业基地,海洋产业的产值达到1500亿元,使江苏的沿海地带成为我国海岸带中比较发达的地区。

江苏省建设"海上苏东"工程,主要是加快发展滩涂农林牧业、海洋渔业,积极培育滨海旅游业、海洋食品、海洋医药工业,着力改善基础设施条件,全方位开发海洋产业,形成海洋经济全面发展的局面。

信息检索

信息检索

1信息、知识、情报、文献的关系 :信息是宇宙间的一切运动状态及其反应,我们通过对这些信息的获取来认识事物本质,并由此产生新的知识。

知识是经人脑思维加工而成的有序化的人类信息。

文献是被物化了的知识记载,是被人们认可并进行长期管理的信息。

情报是人们为解决特定问题而被活化了的更为高级、更为实用的知识。

2零次文献:主要指尚未经过系统整理形成一次文献的零散资料,例如,未正式发表的书信、手稿、讨论稿、实验的原始数据、工程草图、人们在某些专业会议上口头交流的经验或某些论点等。

一次信息:以作者本人的生产和科研工作为依据而创作的原始信息。

如专著、教材、学术论文等。

二次信息:将分散的无序的一次信息进行加工整理后,使之成为系统有序的信息。

如书目、引文索引、搜索引擎的搜索结果等。

三次信息:根据二次信息提供的线索,利用一次信息,经过调研、分析、综合而形成的。

如百科全书、综述、述评、字词典等。

3信息检索的意义:①信息检索是大学生信息素质教育的主要内容②信息检索是创新人才应具备的基本技能③信息检索是科学研究和论文写作的重要环节④信息检索是开发信息资源的有效途径⑤信息检索是科学决策的依据和企业竞争的手段4什么是信息检索:信息检索(广义上)是将杂乱无序的信息按一定的方式组织和存储起来,并根据信息用户的需求找出相关信息的过程和技术,全称是”信息存储与检索”。

(狭义的信息检索指的是后一过程。

)5检索语言的概念:是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。

它是信息标引人员和信息检索人员沟通的桥梁。

对于信息标引人员来说,它是表达文献主题内容,形成文献标识并借以组织文献的依据;对于检索人员来说,它是表达检索课题要求,并同检索系统中已经存储的文献标识进行比较从而获得所需文献的依据。

(检索语言是根据文献信息检索需要而编制的一种人工语言,又称检索标识。

它是在自然语言的基础上记过处理后能够表达文献特征,供信息检索系统存储和检索共同使用的人工语言,实质上它是存储和检索之间的约定语言,是人与检索系统对话的基础,是沟通信息存储和信息检索两个过程的桥梁。

信息检索习题带答案

信息检索习题带答案

最新文献检索一、判断题1、《维普期刊资源整合服务平台》作者提供的关键词语言属于叙词语言。

答案.(错误)2、借助于《维普期刊资源整合服务平台》期刊导航可查阅某年限范围期刊上发表的文献。

答案.(正确)3、《维普期刊资源整合服务平台》收录的范围限人文社会科学类。

答案.(错误)4、在因特网上可任意检索《维普期刊资源整合服务平台》,并可以下载全文。

答案.(错误)30、在文后参考文献中,如果一篇文献被第二次引用,可以在参考文献表中以“同上”或者“ibid”等简略地予以表示。

答案.(错误)31、按照惯例,在文献正文中引用文献的标示,应置于引文最末句的右上角。

答案.(正确)32、按照惯例,在文献正文的标题处需要放置引用文献的标示时,应置于标题的右上角。

答案.(错误)33、通常只要在文后标注出所引参考文献,文中无需标注。

答案.(错误)34、当在论著正文中直接引用了他人的研究著述时,应该在文后参考文献表中列出被引用文献的相关信息。

答案.(正确)35、当提及的参考文献为论著正文中直接说明时,其序号应该与正文排齐。

答案.(正确)36、在论著正文同一处引用多篇文献时,各篇文献的序号在方括号内按从小到大的顺序全部列出。

答案.(正确)44、权利人对其获得的发明创造具有永久独占权。

答案.(错误)45、按照我国专利法的规定,专利分为发明、实用新型、外观设计三种。

答案.(正确)46、狭义的专利文献是指专利说明书。

答案.(正确)47、专利的有效期是从公告日开始计算。

答案.(错误)48、专利文献是集技术、经济和法律于一体的特种文献。

答案.(正确)49、专利是受法律保护的,其中发明专利的保护期限是10年。

答案.(错误)50、在科技论文正文后的参考文献的著录中,[M]代表该文献是一件专利。

答案.(错误)51、一项发明创造要获得专利权必须具备新颖性、创造性和实用性。

答案.(正确)52、了解石河子大学专利申请的情况,可以通过国家知识产权局专利检索系统来实现。

信息检索考题及答案

信息检索考题及答案

信息检索考题及答案一、单选1、报道范围主要为能源方面的科技报告为( D、DOE)。

2、(C报纸)是出版周期最短的定期连续出版物。

3、( A学术论文)是高校或科研机构的毕业生为获取学位而撰写的。

4、了解各个国家政治、经济、科技发展政策的重要信息源是(B政府出版物)5、年鉴属于下列哪一类别(D三次信息)6、下列哪种文献属于一次文献(A图书)。

7、下列文献中属于一次信息的是( A专利说明书) 8、以下各项属于二次信息的是( A索引)21、(D 漏检率)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。

22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D、H319 )。

23、布尔逻辑表达式:在职人员NOT(中年AND 教师)的检索结果是(A检索出除了中年教师以外的在职人员的数据)24、布尔逻辑检索中检索符号“OR”的主要作用在于( B提高查全率)。

25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C索引)。

26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A全文检索)27、截词检索中,“?”和“*”的主要区别在于(A 字符数量的不同)。

28、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(C* )表示无限限检索。

29、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(A?)表示有限检索。

30、利用截词技术检索“?ake”,以下检索结果正确的是(D take)31、利用图书末尾所附参考文献进行检索的方法是(D追溯法)。

32、位置运算符号(W)和(N)的主要区别在于(D 检索词是否出现在同一文献中)。

33、我国最早的分类法是(B 《七略》)34、要查找吴敬琏所发表的文章,首选途径为(C 责任者途径)。

对于中国期刊全文数据库(CNKI)的使用权限的说法,(A从任何公网终端都可访问其全文信息)是不正确的。

信息检索概念及分类

信息检索概念及分类

信息检索概念及分类
一、概念
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。

狭义的信息检索仅指信息查询(Information Search)。

即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。

广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。

又称信息的存储与检索。

一般情况下,信息检索指的就是广义的信息检索。

二、分类
(一)按存储与检索对象划分,信息检索可以分为:
文献检索
数据检索
事实检索
以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。

(二)按存储的载体和实现查找的技术手段为标准划分:
手工检索
机械检索
计算机检索
其中发展比较迅速的计算机检索是“网络信息检索”,
也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。

(三)按检索途径划分:
直接检索
间接检索。

信息检索效果评价标准

信息检索效果评价标准

信息检索效果评价标准信息检索是指通过计算机系统,根据用户的查询需求,从大规模的信息资源中快速地找到相关的信息并呈现给用户。

信息检索的效果评价标准是用于评估信息检索系统在返回结果时的准确性和用户体验的指标。

有效的评价标准可以帮助改进检索系统的性能,提高用户的满意度。

下面将介绍一些常用的信息检索效果评价标准。

1. 信息检索准确性信息检索准确性是评价系统检索结果与用户查询需求之间匹配程度的指标。

常用的准确性指标有:- Precision(精确率):表示检索结果中相关文档的比例,计算公式为:Precision = Relevant Documents / Retrieved Documents。

- Recall(召回率):表示检索结果中相关文档被检索出的比例,计算公式为:Recall = Relevant Documents / Relevant Documents in Collection。

- F-Measure(F值):是综合Precision和Recall的度量指标,计算公式为:F-Measure = 2 * (Precision * Recall) / (Precision + Recall)。

2. 排序质量排序质量是评价信息检索系统返回结果的排序效果的指标。

常用的排序质量指标有:- Mean Average Precision(MAP):表示所有查询的平均准确率,计算公式为:MAP = (1 / Q) * ∑(AP(q)),其中Q为查询的数量,AP(q)为查询q的准确率。

- Normalized Discounted Cumulative Gain(NDCG):以用户划分的相关程度对结果进行评分,计算公式为:NDCG =DCG / IDCG,其中DCG为折损累积增益,IDCG为理想情况下的折损累积增益。

3. 用户满意度用户满意度是评价信息检索系统提供的用户体验的指标。

常用的用户满意度指标有:- Click-through Rate(CTR):表示用户点击相关结果的比率,计算公式为:CTR = Clicked Documents / Retrieved Documents。

《信息检索》考试答案及评分标准

《信息检索》考试答案及评分标准

2010—2011学年第一学期《信息检索》考试答案及评分标准一、填空题(每空0.5分,共10分)1、小王在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、80%,则全部相关文献有25 篇。

2、文件ABC.001.TXT的后缀名是TXT ,文件类型是文本文件。

3、多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。

4、在使用搜索引擎检索时,URL:ustc可以查到网址中带有ustc的网页。

5、根据索引编制方式的不同,可以将搜索引擎分为索引型搜索引擎和网络目录型搜索引擎。

6、按文献的相关度来划分,可以把文献分为密切相关文献、相关文献、参考文献。

7、检索工具具有两个方面的职能:存储职能、检索职能。

8、利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法,又称为引文法。

9、、已知一篇参考文献的著录为:”Levitan, K. B. Information resource management. New Brunswick: Rutgers UP,1986”,该作者的姓是:Levitan 。

10、检索语言可分为两大类:分类语言、主题词语言。

11、当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。

12、查询关键词为短语"DATA OUTPUT",可以用位置算符(W)改写为:DATA (W) OUTPUT 。

二、单项选择(每题1分,共15分)1、一般来说,关键词出现在文献的不同字段表达的相关性不同,以表达的相关性从强到弱排序如下:【C】A.关键词>标题>文摘>正文B.关键词>文摘>正文>标题C.标题>关键词>文摘>正文D.正文>文摘>关键词>标题2、关于索引型搜索引擎的采集和索引机制,错误的说法是:【B】A.采用网页采集机器人robot,循着超链接不停采集访问到的页面B.网页采集机器人可以采集到所有的页面C.自动提取网页中的关键词建立索引D.网页的更新有一定的周期,有时候存储的网页信息已经过时3、搜索含有"data bank"的PDF文件,正确的检索式为:【A】A."data bank"+filetype:pdfB.data and bank and pdfC.data+bank+pdfD.data+bank+file:pdf4、在下列哪种检索工具中可以得到历年的统计数据?【C】A.字典B.百科全书C.年鉴D.手册5、如果需要检索某位作者的文摘被引用的情况,应该检索:【C】A.分类索引B.作者索引C.引文索引D.主题索引6、下列哪种图书不属于工具类图书?【A】A.科技专著B.字典C.手册D.年鉴7、下列哪个检索系统提供了美国四大报告的检索?【A】A.NTIS数据库B.OCLC FIRST SEARCHC.中国科技成果库D.维普数据8、授予专利的时候给出的编号是:【C】A.公告号B.发明号C.专利号D.公开号9、检索国外博士学位论文的主要检索工具为:【B】A.WEB OF SCIENCEB.PQDDC.OCLC FIRST SEARCHD.ISTP10、如果希望了解某种产品在使用中可能出现哪些故障,存在哪些缺陷,最好通过下列哪种渠道检索?【C】A.产品数据库B.厂商产品说明C.产品论坛D.博览会11、国家图书馆检索系统,检索符“?”和“#”的关系为:【B】A.两者作用一样B.采用“colo?r”命中的记录更多C.采用“colo#r”命中的记录更多D.以上都不对12、下面哪个检索式的作用与短语检索"DIGITAL CAMERA"等价:【A】A. DIGITAL (W) CAMERAB. DIGITAL (N) CAMERAC. DIGITAL AND CAMERAD. DIGITAL OR CAMERA13、如果想要了解即将举办的会议的信息,下列途径最好的一种是:【A】A. 专业学会/协会网站B. 会议论文数据库C. 科技会议录索引D. 会议题录数据库14、书目数据库主要提供的是【B】A. 一次信息B. 二次信息C. 三次信息D. 零次信息15、利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法是【A】A. 倒查法B. 顺查法C. 追溯法D. 抽查法三、多项选择(每题2分,共30分)评分标准:选错或少选不得分1、下列关于网络信息资源的组织方式的描述中,正确的有:【BCD】A.采用HTTP语言编写,传输使用HTML协议B.无统一机构进行内容的管理C.各个网站独立发布信息而又互相有关联D.信息之间的关联以超链接的方式组织2、网络信息检索工具的评价与比较指标有哪些?【ABCDE】A.数据库指标B.信息组织与管理指标C.检索功能的指标D.检索结果E.检索界面3、搜索引擎存在的问题和缺陷有哪些?【ABCD】A.Web网页数目庞大,增长迅速,查全率不高B.过期信息较多,经常有死链接C.索引更新较慢,难以找到最新的信息D.多义词、同义词的大量存在,查准率不高4、下列哪些手段会达到缩小检索范围,提高查准率的作用?【ABC】A.字段检索B.限制检索C.短语检索D.使用上位词5、分类法的特点有哪些?【BCD】A.各个分类之间互不关联B.按学科专业性质集中图书C.按照从属关系及远近亲疏的关系把图书组成为一个有等级条理的体系D.提供从学科分类查找图书的途径6、主流的电子图书格式有哪些?【ABCD】A.TXTB.PDFC.CHMD.HTM7、下列数据库中,提供期刊原文的有哪些?【ABD】A.学术期刊网B.维普科技期刊C.WEB OF SCIENCED.ELSEVIER8、科技报告的特点有哪些?【ACD】A.反映了新兴学科和尖端科学的研究成果B.系统性强,对理论的论述比较深入透彻C.常常附有大量数据、图表和原始试验记录,D.控制在一定范围内使用,外界不易获得最新的报告内容9、关于会议文献,正确的说法有:【ACD】A.会议文献是学术会议的成果。

文献检索复习题2

文献检索复习题2

《文献检索》复习一、填空1、按照出版形式分,原始文献可以分为图书、期刊和特种文献三大类。

2、检索语言是应文献信息的加工、存储和检索的共同需要而编制的专门语言,检索语言主要可分为两大类:狭义检索、广义检索。

3、小王在某个数据库中检索到了90篇文献,查准率和查全率分别为40%、80%,则全部相关文献有45篇;当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。

4、文献是信息的主要载体,根据对信息的加工层次可将文献分为___零次_文献、__一次_文献、_二次___文献和__三次__文献。

5、无论是手工检索还是计算机检索,都是一个经过仔细地思考并通过实践逐步完善查找方法的过程。

检索过程通常包含以下几个步骤___分析课题_、__选择工具_、___确定途径__、__编制检索表达式_、__检索__。

6、《中国图书馆图书分类法》共分_五_个基本部类,下分__22__个大类。

7、CNKI的《中国期刊全文数据库》的全文格式有___caj___和___pdf____两种。

8、我国专利类型分发明专利、实用新型专利、外观设计专利三种,专利申请必须具备三个条件:__新颖性___、__创造性____、_实用性____。

9、中国标准分为_企业标准_、__国家标准__、_国际标准_和_行业标准_四级。

10、检索工具具有两个方面的职能:储存职能和检索职能。

二、不定项选择1、二次文献主要包括(AC)等。

A、文摘 B、年鉴 C、目录 D、题录2、信息素质的内涵主要包括(ABC)。

A、信息意识素质B、信息能力素质C、信息道德素质D、信息职业素质3、布尔逻辑检索的运算符号包括(ABC)。

A、and B、or C、not4、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A )A、检索出除了中年教师以外的在职人员的数据B、中年教师数据C、中年和教师的数据D、在职人员数据5、超星数字图书馆可以为我们提供(ABCD)A、图书的原文B、专利文献的原文C、科技报告的原文D、学位论文的原文6、利用截词技术检索“?ake”,以下检索结果正确的是(D)A、stake B、snake C、slake D、take7、在搜索引擎中的高级检索语法中,(C)体现了精确匹配。

信息检索题库 答案(终极版)分析

信息检索题库 答案(终极版)分析

四川师范大学信息检索课后作业1.(第1章•单选)联合国教科文组织分别于2003年和2005年召开了以(A)为主题的世界性大会,并发布了《布拉格宣言》和《亚历山大宣言》。

A、信息素养B、信息安全C、信息检索D、信息评价2.(第1章•多选)信息素养的基本构成具体包括(ABCD)A、信息知识B、信息意识C、信息能力D、信息伦理3.(第1章•多选)信息意识具体包括(ABCD)。

A、充分认识到信息在学习、工作和生活中的重要作用,遇到问题时首先应该想到通过信息的获取和利用来解决所遇到的问题;B、对信息具有敏锐的感知力和洞察力,能高效、快速识别有价值的信息,善于从所获取的信息中找出解决问题的思路、线索或方案;C、对信息具有积极的内在需求,善于根据社会需要主动发现自身的信息需求;D、具有通过获取信息强化自身学习能力的想法和观念,遇到不懂的东西能积极主动的通过获取信息找寻答案。

4.(第1章•多选)关于信息素养教育,下列说法正确的是(ABCD)。

A、信息素养教育的第一个层次是拓展视野,使人们知道这个世界上原来还有这么多信息资源。

B、信息素养教育的第二个层次是训练信息获取能力,使人们知道如何获取所需要的信息。

C、信息素养教育的第三个层次是培养信息利用能力,使人们具有敏锐的信息意识和利用信息解决问题的能力。

D、信息素养教育的目标是培养终身学习能力,而信息素养教育自身也是一个终身学习的过程,信息素养教育与终身学习能力是一个相互促进、螺旋提升的关系。

5.(第1章•多选)信息素养是指:基于(ABC),通过确定、检索、获取、评价、管理、应用信息解决所遇到的问题并以此重构自身知识体系的综合能力和基本素质。

A、信息意识B、信息知识C、信息伦理D、信息评价6.(第1章•多选)2000年1月18日,美国大学与研究图书馆协会(ACRL)标准委员会审议通过了《高等教育信息素养能力标准》,其中包含5项标准和22项具体指标。

下列属于5项标准的是(ABCD)。

信息检索

信息检索
40、广义的 专利具有三个方面的含义:专利权、专利发明和专利文献。
二、 按信息的表现形式划分:(1)文献型信息源;(2)非文献型信息源。非文献型信息源包括电子信息源、数值型信息源、声像型信息源、多媒体信息源以及实例与口头信息源。
6、信息出版类型:是指记录有知识的文献出版类型。
7、信息检索:是指将信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户的需要找出有关信息的过程。它的全过程又称为信息存储与检索。
19、主题语言类主要有标题词语言、叙词语言(后组式)、关键词语言和单元词语言等。它们统称为主题法系统。
关键词(非规范化)语言指在文献标题、摘要或正文中出现的,对表达文献内容具有实质意义,能作为检索入口的,起关键性描述作用的词汇。
20、检索语言的特点:检索语言不同于自然语言,它所表述的概念只是一种解释,不允许一词多义、多词一义而使概念的表述模糊不清。
25、数据库的结构:数据库是以文档的形式组织起来的。(1)记录(record):文档的基本组成单位。记录是作为一个单位来处理的有关数据的集合,是对某一实体的属性进行描述的结果。 例如文献的题名、作者、发表时间、语种、分类号、主题词等;(2)字段(field):是记录的下级数据单位,用来描述实体的某一属性。 例如文献号字段、题名字段、作者字段、出版字段、语种字段、文摘字段、主题词字段、分类号字段等;每个字段的具体内容成为字段值或属性值。字段的设计决定了检索点的数量。(3)文档(file)若干个记录构成的信息集合称为文档。
32、常用基本检索字段:(1)TI(题名字段):找出题名中含有world-wide-web的记录(用法举例:S world(w)wide(w)web/TI);(2)AB(文摘字段):找出文摘中含有Academic Library记录(S Academic(w)Library/AB);(3)DE(主题词字段):找出主题词字段中含有Internet的记录(S Internet/DE)。

复习题(有答案)

复习题(有答案)

复习题一、名词解释及简答信息的概念及特征文献及分类情报、信息、知识、文献的关系目录追溯法文献信息资源ISBN和ISSN的组成及组成部分的含义《全国报刊索引》信息检索的含义及分类(广义的信息检索)信息检索语言信息检索的基本原理布尔逻辑运算中的各种符号的含意图书馆各种数据库的检索途径计算机检索系统的构成计算机信息检索常用的检索技术四大权威检索数据库是哪些?专利及分类试比较分类语言与主题词语言按信息加工形式分,信息源分为一次文献、二次文献和三次文献,请简述它们及其之间的关系什么是查全率和查准率?影响查全率和查准率的因素有哪些?常用的布尔逻辑算符有几种?并简述各自的作用文献综述学位论文的含义及分类参考文献的著录格式1. 知识:知识是人们通过实践对客观事物及其运动过程和规律的认识。

主观知识、客观知识。

2. 检索工具:检索工具是指用以报导、存贮和查找文献线索的工具。

它是附有检索标识的某一范围文献条目的集合,是二次文献。

3.信息检索:广义的,包括信息的存储和检索两个过程,信息存储——指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。

信息检索——指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。

狭义信息检索:仅指信息的检索过程。

从某一信息集合中找出所需的信息的过程,即信息查询。

4. 信息:信息是人们通过感觉器官与外界进行交换的一切内容。

1. 知识:知识是人们通过实践对客观事物及其运动过程和规律的认识。

主观知识、客观知识2. 信息:信息是人们通过感觉器官与外界进行交换的一切内容。

3.信息检索:广义的,包括信息的存储和检索两个过程,信息存储——指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。

信息检索

信息检索
以计算机信息存储设备为载体
2.按信息的加工级别划分
• 零次文献(实验记录、手稿、原始录音、谈话记录等) • 一次文献(图书、期刊论文、会议论文、科技报告、专
利、标准等)
• 二次文献 (目录、题录、文摘等) • 三次文献 (文献综述、年鉴、词典)
三次文献之相互关系
读者查找
一次文献
二次文献
三次文献
作者发表
三、 信息检索的技术与方法
信息检索的技术
• 布尔逻辑检索 • 截词检索 • 限制检索
(一) 布尔逻辑检索
• 布尔逻辑组配运算是采用布尔代数中的逻辑 “与”、逻辑“或”、逻辑“非”等算符,将 检索提问式转换成逻辑表达式,限定检索词在 记录中必须存在的条件或不能出现的条件。
• 凡符合布尔逻辑所规定的条件的文献,即为命中文献。
以事实作为检索对象,查找用户所需的描述性 事实,其检索对象为机构、企业、人物的基本 情况、历史变迁等。 百科全书、工具书
(二)信息检索的意义
1.节约研究人员的时间,避免重复劳动 科学研究具有继承和创造两重性,科学 研究的两重性要求科研人员在探索未知或 从事研究工作之前,应该尽可能地占有与 之相关的信息。信息检索是研究工作的基 础和必要环节,成功的信息检索无疑会节 省研究人员的大量时间,使其能用更多的 时间和精力进行科学研究。
1. 逻辑“与”(并且)
• 符号:“and” 或“*”表示 • 表达式:A*B 或者 A and B
• 意义:检索记录中必须同时含有检索词AB的 文献,才算命中文献 • 作用:增加限制条件,即增加检索的专指性, 以缩小提问范围,减少文献输出量,提高查 准率。
2. 逻辑“或”(或者)
• 符号:“or” 或 “+”表示 • 表达式:A OR B 或 A+B • 意义:检索记录中凡含有检索词A或含有检索 词B,或同时含有检索词A、B的,均为命中文 献文章。 • 作用:放宽提问范围,增加检索结果,起扩 检作用,提高查全率。

信息检索的评价标准

信息检索的评价标准

信息检索的评价标准信息检索的评价标准最近在看检索的相关论⽂,接触到了很多与检索相关的评价准则。

整理在此,以供查询以下内容主要来⾃1. 基本假设与术语以⼀个⽂本检索系统为例,我们事先拥有⼀堆⽂档集,并且集合中每篇⽂档的属性都知道,每篇⽂档对应的相关⽂档是哪些也都⼀清⼆楚。

设想我们查询单篇⽂档,该⽂档检索系统的所有返回结果称为"返回⽂档",⽂档集合中与该篇⽂档中相关的⽂档(即我们期望被返回的⽂档)的集合称为“相关⽂档”,其余⽂档则被称为“不相关⽂档”2. 精确度(Precision)(precision = \frac{|{相关⽂档}\cap{返回⽂档}|}{|返回⽂档|})简⾔之,精确度就是检索系统返回的⽂档中,与被查询⽂档是相关的⽐例,越⾼越好3. 召回率(Recall)(recall = \frac{|{相关⽂档}\cap{返回⽂档}|}{|相关⽂档|})简⾔之,召回率就是所有相关⽂档中,被检索系统返回的⽐例,越⾼越好4. 误检率(fall-out){fall-out = \frac{|{不相关⽂档}\cap{返回⽂档}|}{|不相关⽂档|}}如上,误检率就是所有不相关⽂档中,被检索系统返回的⽐例,越低越好5. F-score/F-measure安利⼀个简单的版本,它相当于精确度和召回率的平均(F = \frac{2\cdot precision\cdot recall}{(precision + recall)})6. 平均精度(average precision)之前介绍的精度和召回率都是针对所有的检索结果进⾏评估,但是实际上检索系统返回的结果是存在序关系的。

最理想的情况是返回结果按照与⽂档的相关程度是⼀致的。

因此我们有必要在评估检索效果时考虑序的影响。

针对返回结果(应该是排好序的),在每⼀个位置(即第某个检索结果),都可以在该位置以上的所有返回⽂档,计算其召回率和准确率。

信息素养五项标准

信息素养五项标准

信息素养五项标准信息素养是人们在信息社会中应具备的一种重要能力,它是指人们能够理解、利用和评价信息,以及在解决实际问题过程中善于收集、处理和传递信息的能力。

在国内,信息素养五项标准是指国家教育部制定的培养高等学校学生信息素养的五项指标。

下面将对这五项标准进行详细阐述。

第一项标准是信息意识。

信息意识是指在解决问题的过程中,能够意识到信息的重要性,并能够主动地获取、利用和评价信息。

信息时代,信息的价值日益凸显,信息不仅是解决问题的基础,也是提高自身素质的重要途径。

信息意识培养的关键在于培养学生主动关注信息、善于发现信息、对信息进行正确评价和利用的能力。

第二项标准是信息能力。

信息能力是指在信息处理过程中,能够灵活运用信息技术进行信息获取、加工、分析、整合和应用的能力。

信息技术的发展使得信息丰富多样,并且信息量庞大,信息能力的培养对于有效获取和正确处理信息至关重要。

信息能力培养的关键在于教会学生掌握信息技术的基本操作和使用方法,以及培养学生分析和整合信息的能力。

第三项标准是信息道德。

信息道德是指在使用信息过程中,遵循信息伦理规范,尊重知识产权和他人的隐私权,遵守法律法规的能力。

在信息社会中,尊重他人的知识产权和隐私权是维护网络秩序和良好人际关系的基础。

信息道德培养的关键在于培养学生正确使用信息、遵守法律法规和维护网络安全的意识。

第四项标准是信息检索。

信息检索是指能够有效地使用各种检索工具和技术,获取所需信息的能力。

在信息时代,信息量庞大,信息的获取往往成为了解决问题的第一步。

信息检索能力的培养对于学生的学习和工作至关重要。

信息检索培养的关键在于教会学生掌握基本的检索技巧和方法,以及能够评价和选择合适的信息源。

第五项标准是信息评价。

信息评价是指能够对所获取的信息进行正确的分析和评价,判断其真实性、可靠性和价值的能力。

在信息时代,信息的真实性和可靠性是受到广泛关注的问题。

信息评价能力的培养对于学生的判断和决策能力至关重要。

《信息检索》考试答案及评分标准

《信息检索》考试答案及评分标准

2010—2011学年第一学期《信息检索》考试答案及评分标准一、填空题(每空0.5分,共10分)1、小王在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、80%,则全部相关文献有25 篇。

2、文件ABC.001.TXT的后缀名是TXT ,文件类型是文本文件。

3、多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。

4、在使用搜索引擎检索时,URL:ustc可以查到网址中带有ustc的网页。

5、根据索引编制方式的不同,可以将搜索引擎分为索引型搜索引擎和网络目录型搜索引擎。

6、按文献的相关度来划分,可以把文献分为密切相关文献、相关文献、参考文献。

7、检索工具具有两个方面的职能:存储职能、检索职能。

8、利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法,又称为引文法。

9、、已知一篇参考文献的著录为:”Levitan, K. B. Information resource management. New Brunswick: Rutgers UP,1986”,该作者的姓是:Levitan 。

10、检索语言可分为两大类:分类语言、主题词语言。

11、当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。

12、查询关键词为短语"DATA OUTPUT",可以用位置算符(W)改写为:DA TA (W) OUTPUT 。

二、单项选择(每题1分,共15分)1、一般来说,关键词出现在文献的不同字段表达的相关性不同,以表达的相关性从强到弱排序如下:【C】A.关键词>标题>文摘>正文B.关键词>文摘>正文>标题C.标题>关键词>文摘>正文D.正文>文摘>关键词>标题2、关于索引型搜索引擎的采集和索引机制,错误的说法是:【B】A.采用网页采集机器人robot,循着超链接不停采集访问到的页面B.网页采集机器人可以采集到所有的页面C.自动提取网页中的关键词建立索引D.网页的更新有一定的周期,有时候存储的网页信息已经过时3、搜索含有"data bank"的PDF文件,正确的检索式为:【A】A."data bank"+filetype:pdfB.data and bank and pdfC.data+bank+pdfD.data+bank+file:pdf4、在下列哪种检索工具中可以得到历年的统计数据?【C】A.字典B.百科全书C.年鉴D.手册5、如果需要检索某位作者的文摘被引用的情况,应该检索:【C】A.分类索引B.作者索引C.引文索引D.主题索引6、下列哪种图书不属于工具类图书?【A】A.科技专著B.字典C.手册D.年鉴7、下列哪个检索系统提供了美国四大报告的检索?【A】A.NTIS数据库B.OCLC FIRST SEARCHC.中国科技成果库D.维普数据8、授予专利的时候给出的编号是:【C】A.公告号B.发明号C.专利号D.公开号9、检索国外博士学位论文的主要检索工具为:【B】A.WEB OF SCIENCEB.PQDDC.OCLC FIRST SEARCHD.ISTP10、如果希望了解某种产品在使用中可能出现哪些故障,存在哪些缺陷,最好通过下列哪种渠道检索?【C】A.产品数据库B.厂商产品说明C.产品论坛D.博览会11、国家图书馆检索系统,检索符“?”和“#”的关系为:【B】A.两者作用一样B.采用“colo?r”命中的记录更多C.采用“colo#r”命中的记录更多D.以上都不对12、下面哪个检索式的作用与短语检索"DIGITAL CAMERA"等价:【A】A. DIGITAL (W) CAMERAB. DIGITAL (N) CAMERAC. DIGITAL AND CAMERAD. DIGITAL OR CAMERA13、如果想要了解即将举办的会议的信息,下列途径最好的一种是:【A】A. 专业学会/协会网站B. 会议论文数据库C. 科技会议录索引D. 会议题录数据库14、书目数据库主要提供的是【B】A. 一次信息B. 二次信息C. 三次信息D. 零次信息15、利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法是【A】A. 倒查法B. 顺查法C. 追溯法D. 抽查法三、多项选择(每题2分,共30分)评分标准:选错或少选不得分1、下列关于网络信息资源的组织方式的描述中,正确的有:【BCD】A.采用HTTP语言编写,传输使用HTML协议B.无统一机构进行内容的管理C.各个网站独立发布信息而又互相有关联D.信息之间的关联以超链接的方式组织2、网络信息检索工具的评价与比较指标有哪些?【ABCDE】A.数据库指标B.信息组织与管理指标C.检索功能的指标D.检索结果E.检索界面3、搜索引擎存在的问题和缺陷有哪些?【ABCD】A.Web网页数目庞大,增长迅速,查全率不高B.过期信息较多,经常有死链接C.索引更新较慢,难以找到最新的信息D.多义词、同义词的大量存在,查准率不高4、下列哪些手段会达到缩小检索范围,提高查准率的作用?【ABC】A.字段检索B.限制检索C.短语检索D.使用上位词5、分类法的特点有哪些?【BCD】A.各个分类之间互不关联B.按学科专业性质集中图书C.按照从属关系及远近亲疏的关系把图书组成为一个有等级条理的体系D.提供从学科分类查找图书的途径6、主流的电子图书格式有哪些?【ABCD】A.TXTB.PDFC.CHMD.HTM7、下列数据库中,提供期刊原文的有哪些?【ABD】A.学术期刊网B.维普科技期刊C.WEB OF SCIENCED.ELSEVIER8、科技报告的特点有哪些?【ACD】A.反映了新兴学科和尖端科学的研究成果B.系统性强,对理论的论述比较深入透彻C.常常附有大量数据、图表和原始试验记录,D.控制在一定范围内使用,外界不易获得最新的报告内容9、关于会议文献,正确的说法有:【ACD】A.会议文献是学术会议的成果。

文献检索知识总结

文献检索知识总结

文献检索第一章信息:是事物存在方式、运动状态及特征的反映,是事物发出的信号、信息。

信息的特征:共享性、存储性和传递性、价值性、时效性。

信息分为:文献信息和非文献信息。

知识:是优化理论化了的信息集合。

信息素质包括:信息意识、信息能力和信息道德三方面内容。

文献:记录有知识的一切载体,具体的说,文献是将知识用文字、符号、图像、音频等记录在一定的物质载体上的结合体。

文献有四个基本要素:1知识2载体3文字、图像、符号、音频、视频4)记录按文献加工程度划分文献的类型:1)零次文献2)一次文献:这是作者直接以自己的工作、科研、社会劳动等实践经验为依据而撰写的文献,也常称为原始文献。

如:期刊文献、专著、科技报告、学位论文、专利说明书等。

3)二次文献:是根据一次文献外表或内容特征,按照一定规则和方法进行加工、整理、浓缩、按一定顺序编排形成的有序化文献。

如:各种目录、索引和文摘。

4)三次文献:三次文献可分为综述研究和参考工具书两大类型一次文献是文献基本形式,是最主要的信息资源,是人们检索利用的主要对象;二次文献是对一次文献的浓缩和有序化,是检索一次文献的工具;三次文献是将大量分散的一次文献归纳、按知识门类或专题重新组合,多从新的高度揭示相关文献内容。

文献按文献出版形式分:1图书2期刊3特种文献:科技报告、专利文献、会议文献、学位论文、政府及国际组织出版物、其他特种文献现代文献特点:1数量大、增长快(生物医学文献占全部文献的近六分之一)2分布广泛、分散交叉3使用寿命缩短4出版类型多样化。

文献的半生期:某学科现时尚在利用的全部文献的一半,是在多长时间内发表的。

文献半生期越短,其老化速度越快,使用寿命也就愈短。

信息检索:是利用一定的检索工具,以科学的方法,从众多的文献中找出特定需要信息的过程。

根据检索对象和检索内容的不同,信息检索可分为:文献检索、事实检索和数据检索。

信息检索的意义和作用:1是打开知识宝库的钥匙2借鉴他人成果,促进科研发展3更新知识结构,提供终生学习途径。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

评价信息检索的标准
一:准确度
准确性是评价信息表示质量的最重要指标,就是信息表示要能准确描述原文档的内容。

专指性是指一个与准确性密切相关的概念。

通常用于衡量标引质量。

一个词只能表示一个主题概念,极为专指性。

在定义上,专指性是对选词的表达主题的深度而言。

例如:信息检索————多媒体检索,在标引文件时,视频检索这一主题概念具有最高的专指性,相比之下,信息检索,多媒体检索专指性低。

二:简明性
简明性成为判断是否节约用户时和减轻用户负担时的一个重要指标。

不同形式的信息表示简明性的具体标准都已确立。

(1)查全率(Recall Ratio)
当用户要全面检索某一信息库时,检出的成功度可用检出的所有相关信息在信息库所有相关信息中所占的比例来表示。

这种对信息库检索全面性的测量指标即为查全率。

查全率与系统能够检索出的相关文献能力有关。

可定义为:
检出的相关信息数
查全率= ———————————————×100%
信息库中相关信息总数
(2) 查准率(Precision Ratio)
当用户要对检索到的结果进行分析时,检出的相关信息数在所有检出信息中所占的比例往往成了较重要的评判指标。

这种对检索结果中的相关信息的测量指标即为查准率。

也有称为信号噪声比(signal-to-noise ratio)。

查准率与检索出的相关信息数有关。

可定义为:
检出的相关信息数
查准率= ———————————————×100%
检出的信息总数查全率和查准率必须结合使用,单独使用两者中的任何一个都不能全面说明检索效果的好坏。

若检出1 篇相关信息,必能达到100% 的查准率,但查全率却会非常低;同样,若检出的信息数等于库中信息的总量a + b + c + d,则必能获得100% 的查全率,但很显然查准率必定也低得可怜。

查全率和查准率是评价检索效果好坏的指标,而漏检率和误检率则是测量检索误差的指标。

10112107
乔明星。

相关文档
最新文档