应用检索实例谈谈信息检索的查全率和查准率
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
检 索 系 统 建 立 者 的 业 务 水 平 直 接 决 定 了 主 题 词 表 质 量 、标 引 质 量 以 及 检 索 工 具 的 质 量 。我 们 的 标 引 人 员 等 专 业 人 员 应 该 选 择 具 有 图 书 馆学、情报学专业知识的人才。编制检索工具, 特别是机检工具时要求 更高, 需要同时具备图书馆学、情报学和计算机的专业知识。目前我国 不少高校都设 有 图 书 馆 学 、情 报 学 专 业 , 如 武 汉 大 学 信 息 管 理 学 院 的 本科专业图书馆学, 以及研究生专业情报学都是国内这一领域内具有 较 高 水 平 的 专 业 。这 些 专 业 在 教 授 图 书 馆 学 、情 报 学 专 业 知 识 的 同 时 , 对计算机的要求也很高, 目的就是为了适应信息时代的要求。
检索工具分为手检工具和机检工具两种, 手检工具以书本式检索 工具为主, 机检工具即数字化检索工具。相较于机检工具而言, 书本式 检索工具技术含量比较低, 比较好掌握。而机检工具则同时涉及计算 机领域和图书情报领域, 需要较高的专业水平才能完成。机检工具的 质量主要从内容和设计两方面来衡量, 内容包括该检索系统的记录 量 、收 录 年 限 、更 新 频 率 、文 献 类 型 、学 科 范 围 等 。 设 计 包 括 检 索 界 面 、 检索方式、检索字段、文种支持等。如果检索工具质量不好, 对查全率 和 查 准 率 有 直 接 影 响 。以 国 家 科 技 文 献 中 心 的 《中 文 会 议 论 文 数 据 库 》 为例, 在作者项中输入王平, 并在结果记录中进行二次检索, 在全文项 中输入作者的单位“重庆邮电学院邮政自动化研究所”, 得到如下检索 结果:
●提高检索用户的检索水平的途径
主题词表质量、标引质量等因素与检索用户之间没有直接关系, 它们由专业人员完成。在实际操作过程中, 检索人员的检索水平是决 定 查 全 率 与 查 准 率 的 关 键 因 素 。检 索 水 平 就 是 对 检 索 系 统 的 指 令 和 运 作熟悉情况,对被检主题的理解程度, 检索时检索策略的组织, 主题词 的选择, 检索方式的确定等。不同水平的检索人员在同一检索系统中 检索同一课题时也会出现不同的检索结果。在下面的小节中, 笔者将 重点谈谈如何提高检索人员的检索水平。
查询时间: 0.918 秒 查询结果: 共找 9 条记录 10 条/页 第 1 页
序号
文献标题
作者
1 电子商务环境下物流配送车辆计划调度系统的设计与实现 王平
2 电子商务环境下物流配送车辆计划调度系统的设计与实现 王平
3 电子商务时代的邮政运输路由规划技术
王平
4 邮政客户服务中心的设计
王平
5 电子商务环境下物流配送计划调度专家系统的设计与实现 王平
标 引 质 量 即 标 引 文 献 或 提 问 时 给 出 主 题 词 的 全 面 性 与 正 确 性 。全 面性表现在揭示文献主题内容的广度和表达主题的深度, 对文献的内 容分析越透彻, 标引词使用得越多,查全率就越高; 标引时选用专指性 强的主题越多, 标引越深,与之匹配的检索词越专指, 检索时检出的文 献针对性越强, 查准率就高。
【关键词】查全率; 查准率; 信息检索 Analysis on Recall Ratio and Accur acy Ratio of Infor mation Retr ieval Based on Retr ieval Pr actices
【Abstr act】Based on the information retrieval experience, the main factors of recall ratio and accuracy ratio were analyzed. Meanwhile, efficient methods were introduced to improve both recall ratio and accuracy ratio at searching level in computer retrieval system.
主 题 词 表 质 量 主 要 表 现 在 词 表 结 构 和 词 汇 两 方 面 。词 表 结 构 由 款 目词、词间参照关系及其有关数据组成。其中, 词间参照关系在一定程 度上决定主题词表的功能, 参照性越强, 检索效率就越高。词间参照关 系 一 般 分 为 同 义 关 系 、等 级 关 系 和 相 关 关 系 。 同 义 关 系 的 作 用 是 当 某 一概念采用不同用词时用来确定采用的词, 借以提高查准率, 等级关 系和相关关系的作用是推荐主题词, 扩大标引范围, 借以提高查全率。 主题词包括叙词( 受控主题词) 和关键词( 非控主题词) 。关键词未经词 形控制和词义控制, 不显示词的等级关系和相关关系, 因此一般不用 来构筑主题词表。构成主题词表的是叙词, 它是人们在归纳人类知识 的基础上,将所涉及的各种概念以规范的词和词组的形式固定下来,形 成主题词表, 可以大幅度地提高查准率。
6 邮政车辆计划调度系统的设计与实现
王平
7 敏捷制造模式下物流配送决策支持系统
王平
8 存储过程在 ASP/ADO 中的应用
王平
9 存储过程在 ASP/ADO 中的应用
王平
从以上的检索实例可知, 仅仅 9 条记录, 就有两条存在重复现象, 其中记录 1、2、5 重复, 8、9 重复。数据重复就影响了用户的查准率。可 见检索工具的质量好坏对检索用户的检索效率有直接影响。
1.在对检索内容进行分析的基础上准确全面地选择检索系 统和检索范围
对检索内容进行深入分析, 是提高查全率与查准率的前提。在对 检索内容的结构、类 型 、专 业 范 围 、性 质 等 进 行 分 析 后 , 才 能 根 据 不 同 的检索要求,选择合适的检索系统, 正确选择主题词与逻辑运算符, 合 理调节查全率和查准率, 实际操作中的原则是在保证查全率的基础上 努力提高查准率。
4.正确编写检索式
检索式指根据用户要求将检索标志( 主题词、分类号等) 组成便于 机 器 检 索 处 理 的 提 问 表 达 形 式 。检 索 式 的 编 写 质 量 取 决 于 检 索 人 员 对 用户提问内容的理解, 他们的专业知识和检索式的编写技巧。其中最 重要的是配置合适的逻辑关系, 即用逻辑运算符将有关检索词进行组 配, 用于表达各检索词之间的逻辑关系。有逻辑“与”( AND 或 *) 、逻辑 “或”( OR 或+) 和逻辑“非”( (AND)NOT 或- ) 3 种。在同一检索式中,这 3 种逻辑运算符可单独使用,也可配合使用。逻辑“与”是具有概念 交 叉 和限定关系的一种组配, 检索出的记录包括由 AND 分开的所有词, 文 献检索时可以用 “与 ”逻 辑 算 符 限 定 多 个 检 索 词 同 时 出 现 于 检 索 结 果 中, 其组配结果使提问概念内涵加深外延缩小, 实现缩检的目的; 逻辑 “或”是具有并列关系的一种组配, 检索出的记录包括由 OR 分开的任 意一个词, 其组配结果使提问概念的内涵变浅外延扩大, 实现扩检的 目的; 逻辑“非”缩小检索,检索出的记录不包括 NOT 后的词。
●影响查全率和查准率的主要因素
信息检索系统的质量和检索用户的检索水平是影响查全率和查 准 率 的 主 要 因 素 。而 主 题 词 表 、标 引 、检 索 工 具 等 直 接 关 系 到 一 个 检 索 系 统 质 量 的 高 低 。主 题 词 表 和 标 引 是 一 个 信 息 检 索 工 具 赖 以 存 在 的 理 论基础, 也是决定信息检索工具查全率和查准率的最原始和最基本的 因素; 检索工具的质量则直接影响了信息检索的查全率和查准率。
363科技信息○科前沿○SCIENCE & TECHNOLOGY INFORMATION
2008 年 第 24 期
0 条记录, 其它的会议论文数据库基本上都支持中英文字符检索, 而 且 CPCD 还有中文简体和中文繁体两种检索界面。
2.手检和机检相结合
手检是机检的基础, 在机检之前进行手检, 以了解检索课题领域 的文献发表情况和反映该课题的英文表达形式等, 为上机检索做好准 备。手检由人脑直接支配, 可随时改变提问标识和检索策略, 弥补数据 库在标引和逻辑组配上的不足, 再加上机检系统存在更新周期以及国 内机检系统存在数量不足等问题, 对机检效果不好的课题, 进行手检 补充, 才能达到查全查准的目的。
现在大部分信息检索系统都采用关键词进行检索, 这极大地方便 了信息用户, 但关键词未经词形控制和词义控制, 不显示词的等级关 系和相关关系, 使得检索语言中存在大量的反映同一概念的不同形式 的词, 不利于文献的查全。因此,在选取检索词的时候,必须从多种角度 来考虑,反映同一概念的检索词越多, 越能保证查全率。反映同一概念 的检索词主要包 括 同 义 词 、反 义 词 、上 下 位 词 和 检 索 词 的 易 错 形 式 等 4 种类型。信息检索中的同义词有学名与俗名、全称与简称、新称与旧 称、外文形式及其简称、不同的译名等形式; 有些反义词从相反的角度 反映同一个问题,造成相同主题文献的分散, 可以对反义词同时进行 检索; 对于新兴学科、交叉学科和边缘学科的课题,要搞清楚概念 之 间 的关系, 合理选择比主题词内容范围更广的上位词及更窄的下位词参 加检索, 以扩大检索范围; 网络信息资源中,错别字现象层出不穷。只 有尽可能地找全这些不同的表述方式, 信息检索人员才能得到较高的 查全率,简单的关键词检索往往会降低检索质量, 必须选择规范的专 业术语, 检索提问标识规范化, 与文献标引词一致才能获得所需信息, 因此检索用户对所输入的主题词必须加以规范, 并在检索中不断进行 修正和完善。
信息检索过程中, 选择什么样的检索系统进行检索是保证查全率 和查准率的关键。确定检索系统的一般原则是以专业检索系统为主, 综合性检索系统为辅; 以重点检索系统为主, 一般检索系统为辅。笔者 认为用户在检 索 过 程 中 , 应 该 充 分 了 解 该 信 息 检 索 系 统 的 性 质 、存 储 信 息 的 内 容 及 范 围 、检 索 系 统 的 设 计 、同 类 检 索 系 统 的 特 点 和 差 异 等 , 以 保 证 检 索 信 息 基 本 上 都 包 含 在 被 选 择 的 检 索 系 统 中 。从 内 容 方 面 来 说, 为了保证查全率, 应该选择收录量多, 收录年限长, 更新频率快的 检索系统, 要保证 查 准 率 , 则 应 从 文 献 的 学 科 范 围 、收 录 时 间 等 考 虑 。 如查找医学会议论文最好在医学专业会议论文数据库 CMAC 中查找, 查找 1985 年以前的会议论文必须在《国内专业会议资料数据库》中检 索。还要注意检索系统的设计, 同类检索系统的差异等, 如《中国会议 论文全文数据 库 》不 支 持 英 文 字 符 检 索 , 在 全 文 项 中 输 入 PID 则 返 回
3.准确选择主题词
选 择 主 题 词 就 是 把 主 题 概 念 转 换 成 检 索 语 言 。选 词 的 广 度 和 专 指 度, 对查全率和查准率起着关键作用。选取的主题词范围面广一些、泛 指性强一些可以 提 高 查 全 率 , 范 围 窄 一 点 、专 指 度 高 一 些 可 以 提 高 查 准率; 选择外延较广的上位词检索可以提高查全率, 选择外延较窄的 下位词检索可以提高查准率; 选择反映同一概念的多个主题词进行检 索可以提高查全率。
科技信息
○科教前沿○
SCIENCE & TECHNOLOGY INFORMATION
2008 年 第 24 期
应用检索实例谈谈信息检索的查全率和查准率
易中梅 ( 华南师范大学图书馆 广东 广州 510006)
【摘 要】本文结合作者的信息检索工作实践, 分析了信息检索工作中影响查全率与查准率的因素, 并重点介绍了在机检系统中,从检索水 平方面提高信息检索的查全率与查准率的有效途径。
【Key wor ds】Recall ratio; Accuracy ratio; Information retrieval
查全率和查准率是评价和衡量信息检索系统检索效果和功能的 两 项 重 要 技 术 指 标 与 重 要 参 数 。查 全 率 是 指 被 检 出 的 相 关 文 献 占 总 文 献内所有相关文献的百分比,查准率是指被检出的相关文献占被检出 文献总数的百分比, 即:查全率=检出的相关文献/实有相关文献,查准 率 =检 出 的 相 关 文 献/ 检 出 的 全 部 文 献 。查 全 率 是 用 来 描 述 系 统 检 出 文 献能力的一种尺度, 查准率则是用来描述系统拒绝不相关文献的能力 或 检 索 精 确 度 的 一 种 尺 度 。本 文 笔 者 全 面 分 析 了 影 响 查 全 率 和 查 准 率 的主要因素, 并结合笔者检索会议论文的实例, 重点讨论了在机检系 统中,如何从提高检索用户的检索水平方面提高信息检索的查全率和 查准率的各种途径。
检索工具分为手检工具和机检工具两种, 手检工具以书本式检索 工具为主, 机检工具即数字化检索工具。相较于机检工具而言, 书本式 检索工具技术含量比较低, 比较好掌握。而机检工具则同时涉及计算 机领域和图书情报领域, 需要较高的专业水平才能完成。机检工具的 质量主要从内容和设计两方面来衡量, 内容包括该检索系统的记录 量 、收 录 年 限 、更 新 频 率 、文 献 类 型 、学 科 范 围 等 。 设 计 包 括 检 索 界 面 、 检索方式、检索字段、文种支持等。如果检索工具质量不好, 对查全率 和 查 准 率 有 直 接 影 响 。以 国 家 科 技 文 献 中 心 的 《中 文 会 议 论 文 数 据 库 》 为例, 在作者项中输入王平, 并在结果记录中进行二次检索, 在全文项 中输入作者的单位“重庆邮电学院邮政自动化研究所”, 得到如下检索 结果:
●提高检索用户的检索水平的途径
主题词表质量、标引质量等因素与检索用户之间没有直接关系, 它们由专业人员完成。在实际操作过程中, 检索人员的检索水平是决 定 查 全 率 与 查 准 率 的 关 键 因 素 。检 索 水 平 就 是 对 检 索 系 统 的 指 令 和 运 作熟悉情况,对被检主题的理解程度, 检索时检索策略的组织, 主题词 的选择, 检索方式的确定等。不同水平的检索人员在同一检索系统中 检索同一课题时也会出现不同的检索结果。在下面的小节中, 笔者将 重点谈谈如何提高检索人员的检索水平。
查询时间: 0.918 秒 查询结果: 共找 9 条记录 10 条/页 第 1 页
序号
文献标题
作者
1 电子商务环境下物流配送车辆计划调度系统的设计与实现 王平
2 电子商务环境下物流配送车辆计划调度系统的设计与实现 王平
3 电子商务时代的邮政运输路由规划技术
王平
4 邮政客户服务中心的设计
王平
5 电子商务环境下物流配送计划调度专家系统的设计与实现 王平
标 引 质 量 即 标 引 文 献 或 提 问 时 给 出 主 题 词 的 全 面 性 与 正 确 性 。全 面性表现在揭示文献主题内容的广度和表达主题的深度, 对文献的内 容分析越透彻, 标引词使用得越多,查全率就越高; 标引时选用专指性 强的主题越多, 标引越深,与之匹配的检索词越专指, 检索时检出的文 献针对性越强, 查准率就高。
【关键词】查全率; 查准率; 信息检索 Analysis on Recall Ratio and Accur acy Ratio of Infor mation Retr ieval Based on Retr ieval Pr actices
【Abstr act】Based on the information retrieval experience, the main factors of recall ratio and accuracy ratio were analyzed. Meanwhile, efficient methods were introduced to improve both recall ratio and accuracy ratio at searching level in computer retrieval system.
主 题 词 表 质 量 主 要 表 现 在 词 表 结 构 和 词 汇 两 方 面 。词 表 结 构 由 款 目词、词间参照关系及其有关数据组成。其中, 词间参照关系在一定程 度上决定主题词表的功能, 参照性越强, 检索效率就越高。词间参照关 系 一 般 分 为 同 义 关 系 、等 级 关 系 和 相 关 关 系 。 同 义 关 系 的 作 用 是 当 某 一概念采用不同用词时用来确定采用的词, 借以提高查准率, 等级关 系和相关关系的作用是推荐主题词, 扩大标引范围, 借以提高查全率。 主题词包括叙词( 受控主题词) 和关键词( 非控主题词) 。关键词未经词 形控制和词义控制, 不显示词的等级关系和相关关系, 因此一般不用 来构筑主题词表。构成主题词表的是叙词, 它是人们在归纳人类知识 的基础上,将所涉及的各种概念以规范的词和词组的形式固定下来,形 成主题词表, 可以大幅度地提高查准率。
6 邮政车辆计划调度系统的设计与实现
王平
7 敏捷制造模式下物流配送决策支持系统
王平
8 存储过程在 ASP/ADO 中的应用
王平
9 存储过程在 ASP/ADO 中的应用
王平
从以上的检索实例可知, 仅仅 9 条记录, 就有两条存在重复现象, 其中记录 1、2、5 重复, 8、9 重复。数据重复就影响了用户的查准率。可 见检索工具的质量好坏对检索用户的检索效率有直接影响。
1.在对检索内容进行分析的基础上准确全面地选择检索系 统和检索范围
对检索内容进行深入分析, 是提高查全率与查准率的前提。在对 检索内容的结构、类 型 、专 业 范 围 、性 质 等 进 行 分 析 后 , 才 能 根 据 不 同 的检索要求,选择合适的检索系统, 正确选择主题词与逻辑运算符, 合 理调节查全率和查准率, 实际操作中的原则是在保证查全率的基础上 努力提高查准率。
4.正确编写检索式
检索式指根据用户要求将检索标志( 主题词、分类号等) 组成便于 机 器 检 索 处 理 的 提 问 表 达 形 式 。检 索 式 的 编 写 质 量 取 决 于 检 索 人 员 对 用户提问内容的理解, 他们的专业知识和检索式的编写技巧。其中最 重要的是配置合适的逻辑关系, 即用逻辑运算符将有关检索词进行组 配, 用于表达各检索词之间的逻辑关系。有逻辑“与”( AND 或 *) 、逻辑 “或”( OR 或+) 和逻辑“非”( (AND)NOT 或- ) 3 种。在同一检索式中,这 3 种逻辑运算符可单独使用,也可配合使用。逻辑“与”是具有概念 交 叉 和限定关系的一种组配, 检索出的记录包括由 AND 分开的所有词, 文 献检索时可以用 “与 ”逻 辑 算 符 限 定 多 个 检 索 词 同 时 出 现 于 检 索 结 果 中, 其组配结果使提问概念内涵加深外延缩小, 实现缩检的目的; 逻辑 “或”是具有并列关系的一种组配, 检索出的记录包括由 OR 分开的任 意一个词, 其组配结果使提问概念的内涵变浅外延扩大, 实现扩检的 目的; 逻辑“非”缩小检索,检索出的记录不包括 NOT 后的词。
●影响查全率和查准率的主要因素
信息检索系统的质量和检索用户的检索水平是影响查全率和查 准 率 的 主 要 因 素 。而 主 题 词 表 、标 引 、检 索 工 具 等 直 接 关 系 到 一 个 检 索 系 统 质 量 的 高 低 。主 题 词 表 和 标 引 是 一 个 信 息 检 索 工 具 赖 以 存 在 的 理 论基础, 也是决定信息检索工具查全率和查准率的最原始和最基本的 因素; 检索工具的质量则直接影响了信息检索的查全率和查准率。
363科技信息○科前沿○SCIENCE & TECHNOLOGY INFORMATION
2008 年 第 24 期
0 条记录, 其它的会议论文数据库基本上都支持中英文字符检索, 而 且 CPCD 还有中文简体和中文繁体两种检索界面。
2.手检和机检相结合
手检是机检的基础, 在机检之前进行手检, 以了解检索课题领域 的文献发表情况和反映该课题的英文表达形式等, 为上机检索做好准 备。手检由人脑直接支配, 可随时改变提问标识和检索策略, 弥补数据 库在标引和逻辑组配上的不足, 再加上机检系统存在更新周期以及国 内机检系统存在数量不足等问题, 对机检效果不好的课题, 进行手检 补充, 才能达到查全查准的目的。
现在大部分信息检索系统都采用关键词进行检索, 这极大地方便 了信息用户, 但关键词未经词形控制和词义控制, 不显示词的等级关 系和相关关系, 使得检索语言中存在大量的反映同一概念的不同形式 的词, 不利于文献的查全。因此,在选取检索词的时候,必须从多种角度 来考虑,反映同一概念的检索词越多, 越能保证查全率。反映同一概念 的检索词主要包 括 同 义 词 、反 义 词 、上 下 位 词 和 检 索 词 的 易 错 形 式 等 4 种类型。信息检索中的同义词有学名与俗名、全称与简称、新称与旧 称、外文形式及其简称、不同的译名等形式; 有些反义词从相反的角度 反映同一个问题,造成相同主题文献的分散, 可以对反义词同时进行 检索; 对于新兴学科、交叉学科和边缘学科的课题,要搞清楚概念 之 间 的关系, 合理选择比主题词内容范围更广的上位词及更窄的下位词参 加检索, 以扩大检索范围; 网络信息资源中,错别字现象层出不穷。只 有尽可能地找全这些不同的表述方式, 信息检索人员才能得到较高的 查全率,简单的关键词检索往往会降低检索质量, 必须选择规范的专 业术语, 检索提问标识规范化, 与文献标引词一致才能获得所需信息, 因此检索用户对所输入的主题词必须加以规范, 并在检索中不断进行 修正和完善。
信息检索过程中, 选择什么样的检索系统进行检索是保证查全率 和查准率的关键。确定检索系统的一般原则是以专业检索系统为主, 综合性检索系统为辅; 以重点检索系统为主, 一般检索系统为辅。笔者 认为用户在检 索 过 程 中 , 应 该 充 分 了 解 该 信 息 检 索 系 统 的 性 质 、存 储 信 息 的 内 容 及 范 围 、检 索 系 统 的 设 计 、同 类 检 索 系 统 的 特 点 和 差 异 等 , 以 保 证 检 索 信 息 基 本 上 都 包 含 在 被 选 择 的 检 索 系 统 中 。从 内 容 方 面 来 说, 为了保证查全率, 应该选择收录量多, 收录年限长, 更新频率快的 检索系统, 要保证 查 准 率 , 则 应 从 文 献 的 学 科 范 围 、收 录 时 间 等 考 虑 。 如查找医学会议论文最好在医学专业会议论文数据库 CMAC 中查找, 查找 1985 年以前的会议论文必须在《国内专业会议资料数据库》中检 索。还要注意检索系统的设计, 同类检索系统的差异等, 如《中国会议 论文全文数据 库 》不 支 持 英 文 字 符 检 索 , 在 全 文 项 中 输 入 PID 则 返 回
3.准确选择主题词
选 择 主 题 词 就 是 把 主 题 概 念 转 换 成 检 索 语 言 。选 词 的 广 度 和 专 指 度, 对查全率和查准率起着关键作用。选取的主题词范围面广一些、泛 指性强一些可以 提 高 查 全 率 , 范 围 窄 一 点 、专 指 度 高 一 些 可 以 提 高 查 准率; 选择外延较广的上位词检索可以提高查全率, 选择外延较窄的 下位词检索可以提高查准率; 选择反映同一概念的多个主题词进行检 索可以提高查全率。
科技信息
○科教前沿○
SCIENCE & TECHNOLOGY INFORMATION
2008 年 第 24 期
应用检索实例谈谈信息检索的查全率和查准率
易中梅 ( 华南师范大学图书馆 广东 广州 510006)
【摘 要】本文结合作者的信息检索工作实践, 分析了信息检索工作中影响查全率与查准率的因素, 并重点介绍了在机检系统中,从检索水 平方面提高信息检索的查全率与查准率的有效途径。
【Key wor ds】Recall ratio; Accuracy ratio; Information retrieval
查全率和查准率是评价和衡量信息检索系统检索效果和功能的 两 项 重 要 技 术 指 标 与 重 要 参 数 。查 全 率 是 指 被 检 出 的 相 关 文 献 占 总 文 献内所有相关文献的百分比,查准率是指被检出的相关文献占被检出 文献总数的百分比, 即:查全率=检出的相关文献/实有相关文献,查准 率 =检 出 的 相 关 文 献/ 检 出 的 全 部 文 献 。查 全 率 是 用 来 描 述 系 统 检 出 文 献能力的一种尺度, 查准率则是用来描述系统拒绝不相关文献的能力 或 检 索 精 确 度 的 一 种 尺 度 。本 文 笔 者 全 面 分 析 了 影 响 查 全 率 和 查 准 率 的主要因素, 并结合笔者检索会议论文的实例, 重点讨论了在机检系 统中,如何从提高检索用户的检索水平方面提高信息检索的查全率和 查准率的各种途径。