计算机信息检索2016-2018年真题汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简述互联网信息资源的局限性?
分散
无序
多变
信息质量难以控制
信息安全难以保障
简述元搜索引擎的缺点?
检索结果全面性和可靠性较差
不能灵活控制结果的输出
检索结构排序不够理想
信息搜索覆盖面存在局限性
检索式处理较复杂
简述图书馆馆藏目录检索系统的检索途径?
题目检索
责任者检索
分类检索
主题/关键词检索
号码检索
出版社名称检索
搜索引擎的“瓶颈”?
1.搜索引擎的索引能力,搜索引擎收录信息的全面性是衡量其质量水平的重要
指标,能够被索引进数据库的信息是有限的,搜索引擎的索引量,索引的更
新时滞等都是制约搜索引擎的瓶颈。
2.迎战“深网”,在深网的搜索渗透过程中,主流搜索引擎面对不小的挑战。
3.由于种种原因,目前搜索引擎的排序和输出主要有相关性差和搜索结构单一
化等问题。
目录型网络检索工具与搜索引擎的区别?
1.适用性:目录型检索工具适合希望了解某一方面、某一概念的全面信息,而
搜索引擎对搜录某一特定信息较为有用。
2.优势与不足:目录型检索工具收录的网站经过专家人工精选,内容丰富、学
术性强,信息质量稳定,检准率高,但搜索范围比搜索引擎小,信息更新速度较慢,很难检到较专业、深入的信息,搜索引擎查询全面而充分、方便快捷,但是可选择的网络信息资源太多,检准率,查全率都比目录型检索工具差,而且感觉使用复杂,门槛高。
3.发展趋势:目录型网络检索工具和检索引擎各有优缺点,将来的发展趋势是
将两者结合起来,使结果更为全面、准确。
超文本传输协议
是浏览器与web服务器之间相互通信、传输,响应用户请求的协议。
超文本标记语言
是一种专门编程语言,具体规定和描述了文件显示的显体格式
元搜索引擎
元搜索引擎又称集合式搜索引擎、并行搜索引擎或搜索引擎之搜索引擎,它是将多个搜索引擎集成在一起,并提供一个统一的检索界面。
目录型网络检索工具
目录型网络检索工具一般采用人工或半人工方式采集和存储网络信息,由专业人员对网络资源进行调查收集,并遵循某种分类体系进行分类,存储和组织。
标准
标准指按规定程序制定,经公认权威机构或主管机关批准的,一整套在特定领域内必须执行的规格、规则,技术要求等规范性文献。
传记资料
记录历史人物或当代著名人物的生平资料等相关信息,这些信息一般包括出卒年、学历、职务、经历、家庭、政治背景、学术观点、团体评价等。
机构目录
机构目录又称名录、指南、行名录等,是用来查找机构团体相关的一类检索工具。
会议文献
学术会议是科学工作者进行学术交流等的重要场所,会议文献是在各种学术会议上所发表的论文、报告、讲演等的统称。
参考信息
指人名、地名、机构、事件、统计数据等一类数据、事实信息,是人们在工作研究和日常生活中经常要查考、引用的信息。
网络资源目录
是以整个互联网资源为检索对象,将一些重要、优质的网络资源组织成分类目录,提供给用户检索.
黄页信息
黄页是国际通用的按企业性质和产品类别编排的工商电话号码薄,相当于一个城市或地区的工商企业的户口薄;网络上的黄页信息还含有相应工商企业的地址、
产品和经营等的有关信息.
基于内容的图像检索(CBIR)
基于内容的图像检索是针对图像的颜色、形状、纹理和空间布局等可视化内容进行分析和检索的图像检索技术.
年鉴
年鉴是系统汇集一年内人、事、物各方面发展变化的新情况和统计资料,按年度连续出版的资料性参考工具。
用户组信息资源,它的主要优点是什么?
用户组信息资源实质上都是由一组对某一特定主题事物有共同兴趣的网络用户组成的邮件群组或电子论坛,是一种有组织的电子邮件系统,用户在期间通过电子邮件进行一对多的交流。
优点:直接交互;全球互联;主题鲜明
互联网检索工具的性能评价主要从哪5个方面进行?其中反映检索系统效率的主要是什么?(检全率和检准率)
1.收录范围
2.检索功能
3.检索效率
4.检索结果的处理和展示
5.用户界面设计
什么是垂直搜索引擎?主要特征是什么?关键技术主要有哪两项?
垂直搜索引擎是针对某一特定领域,某一特定人群或某一特定需求提供的信息搜索和有一定价值的相关信息服务,其特点是专、精、深,且具有行业色彩。
主要特征是:1.在信息采集上,采用主动采集与被动采集相结合的方式
2.在信息加工上,对网页信息进行结构化信息提取加工
3.在信息检索上,能够提供结构化与非结构化相结合的方式进行检索
目录型网络检索工具主要适用于什么检索情况?请列举有代表性的网络资源目录,国内外各两个?
主要适用于:1.用户进行较笼统的主题浏览和检索,允许用户从登记类目中任意选择检索范围,对这些不同深度的主题类目进行浏览或检索
2.当用户未形成很精确的检索概念时,采用主题指南作为检索起点非常有效。
有代表的网络资源目录:国外:雅虎,Galaxy,Dmoz
国内:搜狗,新浪
HTML
是一种专门编程语言,具体规定和描述了文件显示的具体格式,也即web的描述语言,用于编制通过www显示的超文本文件
Web信息资源
又称word wide web,是因特网信息资源最主要、最常见的形式。
它是指建立在超文本、超媒体技术的基础上。
集文本、图像、图形、声音为一体,并以直观的图形用户界面展示和提供信息的网络资源形式。
检全率
对于一项检索,实际检出的文件数目与所有应该被检出的文件数的比率
简述CBIR(基于内容的图片检索)的特点
1.直接从图像中提取语义和特征,并根据这些线索从大量存储在数据库的图像
中查找,检索出具有相似特征的图像数据。
可使检索过程更加有效,适应性更强。
2.以相似匹配similarity代替精确匹配match方式
3.提问方式直观,检索交互性强
4.多层次的高效检索
简述因特网上的主要信息内容包括哪些种类(政科教,媒商休)
1.政府信息
2.科研信息
3.教育信息
4.媒体信息
5.商务信息
6.休闲娱乐信息
简述人们对因特网提供的信息与服务的误解
1.认为因特网无所不能,无所不包,所有信息均可在网上找到
2.认为在网上找到的,下载的信息都是对的
3.认为因特网上的信息可以取代其他的媒体或信息渠道
4.认为因特网上的信息无太多利用价值
目录型网络检索工具的分类法与类型
分类法有:1.主题分类法(主学图分)
2.学科分类法
3.图书分类法
4. 分面组配法
类型有:1. 网络资源目录(网学搜)
2.学科信息门户
3.搜索工具门户
链接
链接是web网页的元素,是指向其他信息资源的指针,把web页捆绑在一起,跟随链接可从一个文档跳到另一个文档。
搜索工具门户
是将主要的搜索引擎集中起来,并按检索对象或检索功能的不同进行分类、编排组织成目录,通过目录向用户提供网络检索工具的分布、选择与推荐、引导。
图像检索
是通过搜索图像的文本表示或者视觉特征,为用户提供互联网上相关图像资料检索服务的专业搜索引擎系统。
网络信息检索技术发展需要以什么核心?主要在哪6个领域进行开发和创新?以提高搜索工具的信息服务功能,完善搜索服务为核心。
6个领域:( 智语垂,基跨信)
1.智能检索
2.语义检索
3.垂直检索
4.基于内容的多媒体信息检索
5.跨语言检索
6.信息检索可视化
网络信息资源质量的评价标准主要分为哪5条?评价方法主要分为哪两类?
1.目的(目范内费评)( 定性, 定量)
2.范围
3.内容
4.费用
5.评论
评价方法:1.定性评价
2.定量评价
网络检索工具,按检索对象、检索机制和集成检索工具数量的不同,分别如何进行划分?
按对象:web资源检索工具(web与非web)
非web资源检索机制
按检索机制:目录型(目索混)
索引型
混合型
按集成检索工具数量划分:独立型网络检索工具(独立,集成)
集成型网络检索工具
在信息检索策略中,试给出任意7个进阶检索技巧?
1.猜测URL
2.右截断网址
3.利用网页快照
4.注意多义词
5.避免拼写错误
6.利用浏览器的“查找”功能
7.利用检索工具的特殊功能
8.使用辅助关键词
9.顺藤摸瓜
10.使用自然语言检索
11.注意单词的大小写
12.垂直搜索
13.善于利用错误技巧
搜索引擎检索的对象是实时匹配互联网上的网页吗?说明其工作原理的四个步骤,及其工作需要的四种主要信息预处理技术。
搜索引擎实际检索的对象不是真正的互联网,而是预先经过加工整理的网页索引数据库;其对网页的检索并不是基于语义,而是一种机械性的匹配网页文字。
工作原理的4个步骤:
1.抓取:从互联网抓取网页
2.索引:建立索引数据库
3.搜索、排序:在索引数据库中搜索排序
4.显示:对搜索结果进行处理排序
四种主要信息预处理技术:(关垃链网)
1.关键词提取技术
2.垃圾信息消除技术
3.链接分析技术
4.网页重要性计算技术
在使用搜索引擎时,关键词的有效选取非常重要,请说明关键词选取常用的5步骤,以及常见的可配套使用的布尔逻辑操作符。
关键词选取步骤:
1.抽取基础关键词,排除常用词
2.考虑基础关键词的同义词
3.考虑上位词和下位词
4.考虑相关词
5.总结审视
常见的可配套使用的布尔逻辑操作符:
1.and操作符
2.or操作符
3.“”(引号操作符)
4.Near操作符
5.Before和after操作符
6.And not操作符
7.通配符
8.括号操作符
简述互联网信息检索的类型
1.顺链而行的浏览
2.基于目录型检索工具的互联网信息检索
3.基于索引型检索工具的互联网信息检索
简述目录型网络检索工具的特点
1.面向用户的易用性
2.提供准确性较高的信息内容
3.提供导航作用良好的检索体系结构
4.以明确的主题和对象为中心设置确定类目
5.有兼容性强的多元类目
简述网上参考信息源的主要类型
1.百科知识检索网站
2.人物信息检索网站
3.地理信息检索网站
4.时事新闻信息检索网站
5.机构信息检索网站
6.语词信息检索网站
7.统计信息检索网站
试述互联网信息资源的评价方法
1). 定性评价,按照一定的评价标准对被评站点的各方面特征、质量做出主观评判
2.定量评价,利用数量分析方法。
对相关数据进行调查采集,统计分析,进而做出较系统.客观的评判
用户可以通过以下途径做出评价:
1.从URL中得到信息.
2.查看网站描述和版权声明。
3.从链接中获取信息.
4.参与他人评价.
试述网络信息检索技术将来的发展领域
1.智能检索:将人工智能技术引入检索系统,实现智能化的信息检索系统.
2.语义检索:检索工具不再拘泥于用户所输入检索关键词或查询语句的字面形式,能够通过概分析,透过字面形式理解检索需求的本质.
3.垂直检索:采集专门领域范围内的信息,并通过采用与之相应的标引、索引语言及分类体系,满足用产”专门”的信息查询需求。
4.基于内容的多媒体信息检索,可以在没有人来参与的情况下,能自动识别或理解媒体对象重要特征
5.跨语言检索,可以用某种语言检索另外一种语言表达的信
息资源的方法和技术。