最新文献检索第三章 上海建桥学院PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•03.02.2021
•21
• 举例: • 检索式: A and B • 或: A * B • 限影部份为检 • 中文献。 • (同时包含A和B两概念) • 缩小检索范围, • 提高查准率即检准率。
•03.02.2021
•22
• ⑶ 非(NOT)运算符
• 用来从某个概念中剔除另一个概念。 即检出的记录中只能含有NOT算符前 的检索词,不能同时含有其后的词。
• 截词符也称通配符,一般有:*,?等表示。 不同数据库有不同的表示法。
• 适用于西文检索,可以检索出同一词干 开Fra Baidu bibliotek、词义相近的检索词,扩大检索范 围。一般有后截词、前截词、中间截词 三种.
•03.02.2021
•25
• 1)后截词:前方一致,查找检索词词尾有变 化的词。分无限和有限二种。
• 无限截词:词干后紧接一个截词符;
•03.02.2021
•7
•
数据库
•
︱
•
文档3
•
/\
•
顺排文档 倒排文档(若干)
•
/\
• 记录的主体 记录的索引
•
/\
•
篇名文摘等 作者刊名等
••03.02.2021
/\
•8
数据库构成
• 从使用者观点观察, 数据库主要由“文 档——记录——字 段”三个层次构成 。
•字段 •记录•文 档
•03.02.2021
。
•03.02.2021
•12
数据库的字段
• 根据与文献内容相关与否,一般检索系 统将字段区分为二种:
• 1)基本(索引)字段—反映文献主题内容 如前记录中的:篇名、摘要、关键词
• 2)辅助(索引)字段—反映文献外部特征 如前记录中的:作者、机构、文献出处
•03.02.2021
•13
3.3 计算机信息检索类型
•03.02.2021
•11
• 文献数据库某记录:
• 【篇名】Dialog联机检索系统引入文献 检索课程
• 【作者】 程爱平;战玉华;钱俊雯;黄 晓玲;
• 【机构】 清华大学图书馆;
• 【摘要】 介绍了Dialog联机检索系统的
信息资源分类、数据库扫描以及逻辑算
符、通配符、… …提高学生的信息素质
文献检索第三章 上海建桥学 院
3.1 概 论
• 3.1.1 计算机信息检索的概念
• 计算机信息检索,简称机检,是指利
• 用计算机查找文献信息的过程。
• 3.1.2 计算机信息检索发展
• 脱机批处理: 电子管 54年-
• 联机数据库检索: IC 65年-
• 光盘数据库检索:DOS 85年-
• 网络数据库检索:WINDOW 93年-
•17
3.4.1 检索技术
• 1) 布尔逻辑检索
• 规定检索词之间的逻辑关系的算 符 ,称为布尔逻辑算符。
• 布尔逻辑算符包括:
• ⑴ 或(OR、+)运算符
• ⑵ 与(AND、*)运算符
• ⑶ 非(NOT、)运算符
• 不同的数据库,运算符有不同的表达
形式。
•03.02.2021
•18
• ⑴ 逻辑或(OR、+)运算符:
• 意为包含A或者包 含B,或者同时包含 A和B两概念,扩大 检索范围,提高查全 率即检全率。
•03.02.2021
•第4章 计算机信
•20
• ⑵ 与(AND、*)运算符
• 用来组配不同检索概念。
• 其含义是检出的记录必须同时含有所 有的检索词。
• AND算符的作用是缩小检索范围减少 命中文献量,提高检索结果的查准率 。
• NOT算符的作用是缩小检索范围,提 高检索结果的查准率。
•03.02.2021
•23
• 举例: • 检索式:A not B • 限影部份为 • 检中文献。 • 只要含有A概念, • 剔除含有B概念 • 的文献。 • 使用时要慎重。
•03.02.2021
•24
• 2)截 词 检 索
• 当某些检索词词干相同、词义相近,但 词头、词尾或词中间有变化时,可以采 用截词方法扩展检索词。
•03.02.2021
•10
• 记录是文档的基本单元。它是对某一实体 的全部属性进行描述的结果。
• 在全文数据库中,一个记录相当于一篇完 整的文献;在书目数据库中,一个记录相 当于一条文摘或题录。
• 字段是记录的基本单元。它是对实体的具 体属性进行描述的结果。在数据库的记录 中含有题名、著者、出版年主题词、文摘 等字段。
• 3.3.1 光盘信息检索 • 可以是单机检索、联机光盘检索; • 可避免远距离电讯传输时可能出现的通讯失
误; • 具有很大的存储容量,耐用,可反复使用; • 可以提供文本、图像、声音等信息;
•03.02.2021
•14
• 3.3.2 联机信息检索 • 检索范围广 • 检索内容新、实时性强 • 查全率和查准率高 • 检索结果输出方式灵活、实用 • 具有快、多、全的检索功能 • 费用昂贵,需要一定的检索技巧
• 用来组配具有同义或同族概念的词, 如同义词、相关词等。
• 含义是检出的记录中,至少含有其中 一个检索词。
• OR算符的基本作用是扩大检索范围 ,增加命中文献量,提高检索结果的 查全率
• OR运算符具有去重功能。
•03.02.2021
•19
• 举例:
• 检索式:A or B
•
或:A + B
• 阴影部份为检中文 献。
•03.02.2021
•15
•3.3.3 网络信息检索 • 资源共享、更新快; • 检索途径多; • 检索速度快; • 检索更方便灵活; • 检索结果可以直接输出;
•03.02.2021
•16
3.4 计算机信息检索基本技术
• 检索技术 • 检索式和检索策略的构成 • 检索策略的调整
•03.02.2021
•9
• 从数据库的内部结构来看,文档的概念是 指数据库内容的组织形式。一
• 般地说,一个数据库至少包括一个顺排 文档和一个倒排文档。
• 顺排文档是按照记录号顺序组成的数据 集合,是数据库的主体、正文。
• 倒排文档是按照一定的属性顺序,对顺排 文档的内容,重新排列组成的数据集合, 对数据库正文起索引作用。
•03.02.2021
•2
• 3.2.3 数据库构成
• 按国际标准ISO/DIS5127的规定,数据库 是指至少由一种文档(file)组成能满足特 定目的或特定功能数据处理系统需要的 数据集合。
• 用户选择所需的联机系统数据库时多数 数据库以单一的文档编号出现此时文档 (File)的概念和数据库(Database)相当。 但有些数据库因规模庞大,被分成若干 个文档。