评价信息检索的标准

合集下载

科技信息检索与技术评分标准

科技信息检索与技术评分标准

《科技信息检索与技术》参考评分标准
《科技信息检索与技术》课程总分100分,由以下两个部分构成:
一、平时实习报告(40分)
平时实习一共四次,需要完成信息工具报告。

1.1 电子图书(10分)
1.2中文电子期刊、学位论文(10分)
1.3 外文全文数据库、文摘数据库(10分)
1.4 网络搜索引擎、专利(10分)
二、期末综合报告(60分)
期末综合报告以选定题目进行分析、整理、书写综述报告。

综述字数1000-1500字,我的信息素养300字。

2.1需求分析(5分)
2.2文献收集(15分)
2.2.1检索工具(4分)
2.2.2.检索表达式(5分)
2.2.3检索过程(6分)
2.3信息选择与分析(15分)
3.3.1检索结果的罗列(5分)
3.3.2检索结果的摘要撰写(10分)
2.4 课题综述报告(25 分)
2.5 我的信息素养(附加5分)
信息查询与利用教研室。

大作业-1-《信息检索》综合大作业标准格式

大作业-1-《信息检索》综合大作业标准格式

《文献检索》课程综合大作业课题名称:专业:班级:学号:姓名:得分:完成时间:年月日评分体系及项目得分1.课题的难度系数值(5分)得分2.选择和使用工具书(检索系统)的情况:(1)选择工具书、刊或检索系统的种类(10分)得分(2)查的文献条目的数量(5分)得分(3)所查文献的出版类型(5分)得分(4)所查的原始文献的文种(限中英文两种)(5分)得分(5)外文文摘的翻译情况(至少翻译一篇)(5分)得分(6)综合运用所选工具书、各种索引的能力(5分)得分(7)查准、查全率(所查检索条目与选择课题的针对性的评价)(15分)得分(8)综合运用各种检索方式的能力(多种检索方式扩大或缩小范围)(15分)得分3. 英文原始文献的获取情况(5分)得分4.按照“步骤要求”和“格式要求”完成实习报告情况(5分)得分5.按照格式要求撰写模拟论文 (20分) 得分总分:参考格式(正式作业中请将红色及蓝色文字删除,填入自己的内容):课题名称江苏滩涂的分布、利用现状与前景研究一、分析研究课题1.背景分析:江苏地处我国沿海中部,东临黄海,海洋区位优势明显。

海洋资源密度指数列全国第二,丰度指数列全国第六,综合指数为全国第三,海洋自然资源的分布在我国处于重要地位。

然而,到目前为止江苏沿海地区仍然是一块尚未充分开垦的宝地。

江苏省政府制定的"九五"计划和2010年远景规划中将建设"海上苏东"列为全省发展的重点工程,即通过10至15年的开发,使江苏东部沿海的海洋经济达到陆地经济的水平,实现全省经济发展战略从陆地向海洋延伸,到2010年基本形成沿海港口群体和临海工业基地,海洋产业的产值达到1500亿元,使江苏的沿海地带成为我国海岸带中比较发达的地区。

江苏省建设"海上苏东"工程,主要是加快发展滩涂农林牧业、海洋渔业,积极培育滨海旅游业、海洋食品、海洋医药工业,着力改善基础设施条件,全方位开发海洋产业,形成海洋经济全面发展的局面。

信息检索

信息检索

1信息、知识、情报、文献的关系 :信息是宇宙间的一切运动状态及其反应,我们通过对这些信息的获取来认识事物本质,并由此产生新的知识。

知识是经人脑思维加工而成的有序化的人类信息。

文献是被物化了的知识记载,是被人们认可并进行长期管理的信息。

情报是人们为解决特定问题而被活化了的更为高级、更为实用的知识。

2零次文献:主要指尚未经过系统整理形成一次文献的零散资料,例如,未正式发表的书信、手稿、讨论稿、实验的原始数据、工程草图、人们在某些专业会议上口头交流的经验或某些论点等。

一次信息:以作者本人的生产和科研工作为依据而创作的原始信息。

如专著、教材、学术论文等。

二次信息:将分散的无序的一次信息进行加工整理后,使之成为系统有序的信息。

如书目、引文索引、搜索引擎的搜索结果等。

三次信息:根据二次信息提供的线索,利用一次信息,经过调研、分析、综合而形成的。

如百科全书、综述、述评、字词典等。

3信息检索的意义:①信息检索是大学生信息素质教育的主要内容②信息检索是创新人才应具备的基本技能③信息检索是科学研究和论文写作的重要环节④信息检索是开发信息资源的有效途径⑤信息检索是科学决策的依据和企业竞争的手段4什么是信息检索:信息检索(广义上)是将杂乱无序的信息按一定的方式组织和存储起来,并根据信息用户的需求找出相关信息的过程和技术,全称是”信息存储与检索”。

(狭义的信息检索指的是后一过程。

)5检索语言的概念:是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。

它是信息标引人员和信息检索人员沟通的桥梁。

对于信息标引人员来说,它是表达文献主题内容,形成文献标识并借以组织文献的依据;对于检索人员来说,它是表达检索课题要求,并同检索系统中已经存储的文献标识进行比较从而获得所需文献的依据。

(检索语言是根据文献信息检索需要而编制的一种人工语言,又称检索标识。

它是在自然语言的基础上记过处理后能够表达文献特征,供信息检索系统存储和检索共同使用的人工语言,实质上它是存储和检索之间的约定语言,是人与检索系统对话的基础,是沟通信息存储和信息检索两个过程的桥梁。

信息检索习题带答案

信息检索习题带答案

最新文献检索一、判断题1、《维普期刊资源整合服务平台》作者提供的关键词语言属于叙词语言。

答案.(错误)2、借助于《维普期刊资源整合服务平台》期刊导航可查阅某年限范围期刊上发表的文献。

答案.(正确)3、《维普期刊资源整合服务平台》收录的范围限人文社会科学类。

答案.(错误)4、在因特网上可任意检索《维普期刊资源整合服务平台》,并可以下载全文。

答案.(错误)30、在文后参考文献中,如果一篇文献被第二次引用,可以在参考文献表中以“同上”或者“ibid”等简略地予以表示。

答案.(错误)31、按照惯例,在文献正文中引用文献的标示,应置于引文最末句的右上角。

答案.(正确)32、按照惯例,在文献正文的标题处需要放置引用文献的标示时,应置于标题的右上角。

答案.(错误)33、通常只要在文后标注出所引参考文献,文中无需标注。

答案.(错误)34、当在论著正文中直接引用了他人的研究著述时,应该在文后参考文献表中列出被引用文献的相关信息。

答案.(正确)35、当提及的参考文献为论著正文中直接说明时,其序号应该与正文排齐。

答案.(正确)36、在论著正文同一处引用多篇文献时,各篇文献的序号在方括号内按从小到大的顺序全部列出。

答案.(正确)44、权利人对其获得的发明创造具有永久独占权。

答案.(错误)45、按照我国专利法的规定,专利分为发明、实用新型、外观设计三种。

答案.(正确)46、狭义的专利文献是指专利说明书。

答案.(正确)47、专利的有效期是从公告日开始计算。

答案.(错误)48、专利文献是集技术、经济和法律于一体的特种文献。

答案.(正确)49、专利是受法律保护的,其中发明专利的保护期限是10年。

答案.(错误)50、在科技论文正文后的参考文献的著录中,[M]代表该文献是一件专利。

答案.(错误)51、一项发明创造要获得专利权必须具备新颖性、创造性和实用性。

答案.(正确)52、了解石河子大学专利申请的情况,可以通过国家知识产权局专利检索系统来实现。

信息检索考题及答案

信息检索考题及答案

信息检索考题及答案一、单选1、报道范围主要为能源方面的科技报告为( D、DOE)。

2、(C报纸)是出版周期最短的定期连续出版物。

3、( A学术论文)是高校或科研机构的毕业生为获取学位而撰写的。

4、了解各个国家政治、经济、科技发展政策的重要信息源是(B政府出版物)5、年鉴属于下列哪一类别(D三次信息)6、下列哪种文献属于一次文献(A图书)。

7、下列文献中属于一次信息的是( A专利说明书) 8、以下各项属于二次信息的是( A索引)21、(D 漏检率)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。

22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D、H319 )。

23、布尔逻辑表达式:在职人员NOT(中年AND 教师)的检索结果是(A检索出除了中年教师以外的在职人员的数据)24、布尔逻辑检索中检索符号“OR”的主要作用在于( B提高查全率)。

25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C索引)。

26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A全文检索)27、截词检索中,“?”和“*”的主要区别在于(A 字符数量的不同)。

28、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(C* )表示无限限检索。

29、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(A?)表示有限检索。

30、利用截词技术检索“?ake”,以下检索结果正确的是(D take)31、利用图书末尾所附参考文献进行检索的方法是(D追溯法)。

32、位置运算符号(W)和(N)的主要区别在于(D 检索词是否出现在同一文献中)。

33、我国最早的分类法是(B 《七略》)34、要查找吴敬琏所发表的文章,首选途径为(C 责任者途径)。

对于中国期刊全文数据库(CNKI)的使用权限的说法,(A从任何公网终端都可访问其全文信息)是不正确的。

信息检索概念及分类

信息检索概念及分类

信息检索概念及分类
一、概念
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。

狭义的信息检索仅指信息查询(Information Search)。

即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。

广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。

又称信息的存储与检索。

一般情况下,信息检索指的就是广义的信息检索。

二、分类
(一)按存储与检索对象划分,信息检索可以分为:
文献检索
数据检索
事实检索
以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。

(二)按存储的载体和实现查找的技术手段为标准划分:
手工检索
机械检索
计算机检索
其中发展比较迅速的计算机检索是“网络信息检索”,
也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。

(三)按检索途径划分:
直接检索
间接检索。

信息检索效果评价标准

信息检索效果评价标准

信息检索效果评价标准信息检索是指通过计算机系统,根据用户的查询需求,从大规模的信息资源中快速地找到相关的信息并呈现给用户。

信息检索的效果评价标准是用于评估信息检索系统在返回结果时的准确性和用户体验的指标。

有效的评价标准可以帮助改进检索系统的性能,提高用户的满意度。

下面将介绍一些常用的信息检索效果评价标准。

1. 信息检索准确性信息检索准确性是评价系统检索结果与用户查询需求之间匹配程度的指标。

常用的准确性指标有:- Precision(精确率):表示检索结果中相关文档的比例,计算公式为:Precision = Relevant Documents / Retrieved Documents。

- Recall(召回率):表示检索结果中相关文档被检索出的比例,计算公式为:Recall = Relevant Documents / Relevant Documents in Collection。

- F-Measure(F值):是综合Precision和Recall的度量指标,计算公式为:F-Measure = 2 * (Precision * Recall) / (Precision + Recall)。

2. 排序质量排序质量是评价信息检索系统返回结果的排序效果的指标。

常用的排序质量指标有:- Mean Average Precision(MAP):表示所有查询的平均准确率,计算公式为:MAP = (1 / Q) * ∑(AP(q)),其中Q为查询的数量,AP(q)为查询q的准确率。

- Normalized Discounted Cumulative Gain(NDCG):以用户划分的相关程度对结果进行评分,计算公式为:NDCG =DCG / IDCG,其中DCG为折损累积增益,IDCG为理想情况下的折损累积增益。

3. 用户满意度用户满意度是评价信息检索系统提供的用户体验的指标。

常用的用户满意度指标有:- Click-through Rate(CTR):表示用户点击相关结果的比率,计算公式为:CTR = Clicked Documents / Retrieved Documents。

《信息检索》考试答案及评分标准

《信息检索》考试答案及评分标准

2010—2011学年第一学期《信息检索》考试答案及评分标准一、填空题(每空0.5分,共10分)1、小王在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、80%,则全部相关文献有25 篇。

2、文件ABC.001.TXT的后缀名是TXT ,文件类型是文本文件。

3、多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。

4、在使用搜索引擎检索时,URL:ustc可以查到网址中带有ustc的网页。

5、根据索引编制方式的不同,可以将搜索引擎分为索引型搜索引擎和网络目录型搜索引擎。

6、按文献的相关度来划分,可以把文献分为密切相关文献、相关文献、参考文献。

7、检索工具具有两个方面的职能:存储职能、检索职能。

8、利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法,又称为引文法。

9、、已知一篇参考文献的著录为:”Levitan, K. B. Information resource management. New Brunswick: Rutgers UP,1986”,该作者的姓是:Levitan 。

10、检索语言可分为两大类:分类语言、主题词语言。

11、当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。

12、查询关键词为短语"DATA OUTPUT",可以用位置算符(W)改写为:DATA (W) OUTPUT 。

二、单项选择(每题1分,共15分)1、一般来说,关键词出现在文献的不同字段表达的相关性不同,以表达的相关性从强到弱排序如下:【C】A.关键词>标题>文摘>正文B.关键词>文摘>正文>标题C.标题>关键词>文摘>正文D.正文>文摘>关键词>标题2、关于索引型搜索引擎的采集和索引机制,错误的说法是:【B】A.采用网页采集机器人robot,循着超链接不停采集访问到的页面B.网页采集机器人可以采集到所有的页面C.自动提取网页中的关键词建立索引D.网页的更新有一定的周期,有时候存储的网页信息已经过时3、搜索含有"data bank"的PDF文件,正确的检索式为:【A】A."data bank"+filetype:pdfB.data and bank and pdfC.data+bank+pdfD.data+bank+file:pdf4、在下列哪种检索工具中可以得到历年的统计数据?【C】A.字典B.百科全书C.年鉴D.手册5、如果需要检索某位作者的文摘被引用的情况,应该检索:【C】A.分类索引B.作者索引C.引文索引D.主题索引6、下列哪种图书不属于工具类图书?【A】A.科技专著B.字典C.手册D.年鉴7、下列哪个检索系统提供了美国四大报告的检索?【A】A.NTIS数据库B.OCLC FIRST SEARCHC.中国科技成果库D.维普数据8、授予专利的时候给出的编号是:【C】A.公告号B.发明号C.专利号D.公开号9、检索国外博士学位论文的主要检索工具为:【B】A.WEB OF SCIENCEB.PQDDC.OCLC FIRST SEARCHD.ISTP10、如果希望了解某种产品在使用中可能出现哪些故障,存在哪些缺陷,最好通过下列哪种渠道检索?【C】A.产品数据库B.厂商产品说明C.产品论坛D.博览会11、国家图书馆检索系统,检索符“?”和“#”的关系为:【B】A.两者作用一样B.采用“colo?r”命中的记录更多C.采用“colo#r”命中的记录更多D.以上都不对12、下面哪个检索式的作用与短语检索"DIGITAL CAMERA"等价:【A】A. DIGITAL (W) CAMERAB. DIGITAL (N) CAMERAC. DIGITAL AND CAMERAD. DIGITAL OR CAMERA13、如果想要了解即将举办的会议的信息,下列途径最好的一种是:【A】A. 专业学会/协会网站B. 会议论文数据库C. 科技会议录索引D. 会议题录数据库14、书目数据库主要提供的是【B】A. 一次信息B. 二次信息C. 三次信息D. 零次信息15、利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法是【A】A. 倒查法B. 顺查法C. 追溯法D. 抽查法三、多项选择(每题2分,共30分)评分标准:选错或少选不得分1、下列关于网络信息资源的组织方式的描述中,正确的有:【BCD】A.采用HTTP语言编写,传输使用HTML协议B.无统一机构进行内容的管理C.各个网站独立发布信息而又互相有关联D.信息之间的关联以超链接的方式组织2、网络信息检索工具的评价与比较指标有哪些?【ABCDE】A.数据库指标B.信息组织与管理指标C.检索功能的指标D.检索结果E.检索界面3、搜索引擎存在的问题和缺陷有哪些?【ABCD】A.Web网页数目庞大,增长迅速,查全率不高B.过期信息较多,经常有死链接C.索引更新较慢,难以找到最新的信息D.多义词、同义词的大量存在,查准率不高4、下列哪些手段会达到缩小检索范围,提高查准率的作用?【ABC】A.字段检索B.限制检索C.短语检索D.使用上位词5、分类法的特点有哪些?【BCD】A.各个分类之间互不关联B.按学科专业性质集中图书C.按照从属关系及远近亲疏的关系把图书组成为一个有等级条理的体系D.提供从学科分类查找图书的途径6、主流的电子图书格式有哪些?【ABCD】A.TXTB.PDFC.CHMD.HTM7、下列数据库中,提供期刊原文的有哪些?【ABD】A.学术期刊网B.维普科技期刊C.WEB OF SCIENCED.ELSEVIER8、科技报告的特点有哪些?【ACD】A.反映了新兴学科和尖端科学的研究成果B.系统性强,对理论的论述比较深入透彻C.常常附有大量数据、图表和原始试验记录,D.控制在一定范围内使用,外界不易获得最新的报告内容9、关于会议文献,正确的说法有:【ACD】A.会议文献是学术会议的成果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

评价信息检索的标准
一:准确度
准确性是评价信息表示质量的最重要指标,就是信息表示要能准确描述原文档的内容。

专指性是指一个与准确性密切相关的概念。

通常用于衡量标引质量。

一个词只能表示一个主题概念,极为专指性。

在定义上,专指性是对选词的表达主题的深度而言。

例如:信息检索————多媒体检索,在标引文件时,视频检索这一主题概念具有最高的专指性,相比之下,信息检索,多媒体检索专指性低。

二:简明性
简明性成为判断是否节约用户时和减轻用户负担时的一个重要指标。

不同形式的信息表示简明性的具体标准都已确立。

(1)查全率(Recall Ratio)
当用户要全面检索某一信息库时,检出的成功度可用检出的所有相关信息在信息库所有相关信息中所占的比例来表示。

这种对信息库检索全面性的测量指标即为查全率。

查全率与系统能够检索出的相关文献能力有关。

可定义为:
检出的相关信息数
查全率= ———————————————×100%
信息库中相关信息总数
(2) 查准率(Precision Ratio)
当用户要对检索到的结果进行分析时,检出的相关信息数在所有检出信息中所占的比例往往成了较重要的评判指标。

这种对检索结果中的相关信息的测量指标即为查准率。

也有称为信号噪声比(signal-to-noise ratio)。

查准率与检索出的相关信息数有关。

可定义为:
检出的相关信息数
查准率= ———————————————×100%
检出的信息总数查全率和查准率必须结合使用,单独使用两者中的任何一个都不能全面说明检索效果的好坏。

若检出1 篇相关信息,必能达到100% 的查准率,但查全率却会非常低;同样,若检出的信息数等于库中信息的总量a + b + c + d,则必能获得100% 的查全率,但很显然查准率必定也低得可怜。

查全率和查准率是评价检索效果好坏的指标,而漏检率和误检率则是测量检索误差的指标。

10112107
乔明星。

相关文档
最新文档