信息检索复习资料(有答案版)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.请说明一次文献、二次文献和三次文献的特点和功用。

(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。如期刊论文、科技报告、会议论文、

专利说明书

(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人

员编辑、出版和积累起来的工具性的文献。二次文献的重要性在于可以帮助人

们查找一次文献。如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。包括综述研究和参考工具两类。如综述、

述评、词典、百科全书、年鉴、指南数据库、书目之书目

2.请说明题录目录文摘的特点以及区别

(1)题录是揭示和报导单篇文献外表特征的工具。

特点:以单篇文献为著录对象

(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。

特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征

(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。

特点:带摘要的题录

3. 布拉德伏特文献文献分散定律和期刊影响因子的概念

(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。

如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。

(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。

4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。

(1)信息是信息论中的一个术语,常常把消息中有意义的内容称为信息。信息就是信息,既非物质,也非能量。信息的属性:客观性、依附性、可传递性、可塑性、时效性、共享性

(2)知识:知识是人类社会实践经验的总结,是人的主观世界对于客观世界的如实反映和概括。系统化、理论化的信息就称为知识。

(3)情报:是人们在一定的时间内为一定的目的而传递有使用价值的知识或信息。情报的特点:保密性、时效性、传递性。情报是被激活了的知识

三者的关系是:信息是知识的源泉;知识是系统化、理论化的信息;情报是活化的知识和信息,能为人们所利用;其涵义关系是信息>知识>情报

5.请对搜索引擎的分类及检索结果排序方法举例说明

(1)主题引擎又称基于Robot的搜索引擎。这种引擎的信息主要为网页,通过程序自动地收集处理和提供信息是主题引擎的特点。

百度搜索数据的排序方式:

百度搜索引擎的核心技术是超链分析技术,统计每个网页被其它网页链接指向的情况,次数越多则级别越高,排名也就越靠前。因此,超链分析就是通过分析链接网站的多少来评价被链接的网站质量,这保证了用在百度搜索时,越受用户欢迎的内容排名越靠前。

(2)目录引擎的信息大多面向网站,是依靠专职编辑或志愿人员人工建立起来的。人工收集和处理信息是目录引擎的主要特点。搜狐网站内容的排序,按照频道类别排序,每个屏道内部的内容按照时间顺序排序。

(3)多元引擎又称元搜索引擎。多元引擎本身没有存放网页信息的数据库。当用户查询一个关键词时,它把查询请求转换成其他数个搜索引擎能够接受的命令格式,并行地或者有选择性地访问这些搜索引擎并查询这个关键词,处理这些搜索引擎返回的结果,然后再返回给用户。360搜索结果的排序,也是使用了“超链分析技术”,统计每个网页被其它网页链接指向的情况,次数越多则级别越高,排名也就越靠前。6.选择一个你比较熟悉的网络搜索引擎,以“*********”为题,根据计算机信息检索的

六个步骤,进行主题分析,选用正确检索算符,构造检索式进行模拟检索练习。(评分标准:检索步骤正确,检索算符运用准确,检索式无误各5分,其它步骤5分,满分20分)

(1)计算机信息检索共六个步骤:

1.明确检索要求和检索目标

2.课题概念分析*

3.检索词的扩展、选择和处理*

4.数据库的选择

5.检索策略构成和调整方法*

6.输出格式和方式的选择

7.绘制信息检索原理图并进行简要说明。

8.举例说明文档(顺排文档、倒排文档),记录和字段

(1)文档:是若干条逻辑记录构成的信息集合。文档是书目数据库和文献检索系统中数据组织的基本形式。根据数据库的内部结构,一个数据库至少包括一个顺排文档和一个倒排

文档。

▪顺排文档:是按照记录号顺序组成的数据集合,是数据库的主体、正文。由于它存贮有记录的最完整的信息,所以,通常又把它称之为主文档。无序性,无法检索。

▪倒排文档:按照一定的属性顺序,对顺排文档的内容,重新排列组成的数据集合,对数据库正文起索引作用。记录的特征标识(作者、期刊名称等)排序,其后列出含有此标识的记录号。提高检索效率。

▪记录—某一实体全部属性的描述,是文档的基本单元。

▪字段—某一实体的具体属性的描述,是记录的基本单元。

根据与文献内容相关与否,分基本字段和辅助字段两类:

⏹基本字段(Basic Fields) (表达文献内容特征):

⏹篇名字段、文摘字段、叙词字段、自由标引词字段

⏹辅助字段(Additional Fields): (表达文献外表特征)

⏹例:作者字段(AU=)、期刊名称字段(JN=)、出版年份字段(PY=)、语种

字段(LA=)等。

⏹在检索中,辅助索引一般不单独使用,而常与基本索引配合使用,起限定

检索范围的作用。

9.请说明文献信息检索的基本步骤有哪些。

根据既定课题,系统地查找所需求的文献信息,主要的程序为

1).分析研究课题,明确检索要求

2).了解课题背景知识,归纳主题内容

3).分析课题涉及的主题概念

4).选择检索系统

5).实施检索

6).获取原始文献

相关文档
最新文档