信息检索与数据挖掘

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息检索与数据挖掘
2015/4/13
6
正确率(Precision)和召回率(Recall)
正确率(Precision ,简写为P) 是返回文档中真正相关的 比率
召回率(Recall,R) 是返回结果中的相关文档占所有相关 文档(包含返回的相关文档和未返回的相关文档)的比率
信息检索与数据挖掘
2015/4/13
信息检索与数据挖掘
2015/4/13
3
提纲

上一讲回顾

❸ ❹
动机
相关反馈基础 相关反馈详细介绍

查询扩展
信息检索与数据挖掘
2015/4/13
4
提纲
❶ ❷ ❸ ❹ ❺
上一讲回顾 动机 相关反馈基础 相关反馈详细介绍 查询扩展
信息检索与数据挖掘
2015/4/13
5
上一讲回顾
信息检索的评价方法 不考虑序的评价方法(即基于集合):P、R、F 考虑序的评价方法:P/R曲线、MAP、NDCG 相关评测 检索结果的摘要

几何平均值
上面那个例子 GMAPa=0.056, GMAPb=0.086 GMAPa<GMAPb GMAP和MAP各有利弊,可以配合使用,如果存在难Topic时,GMAP更能体 现细微差别
信息检索与数据挖掘
2015/4/13
14
NDCG
• 每个文档不仅仅只有相关和不相关两种情况,而是 有相关度级别,比如0,1,2,3。
未插值的AP: 某个查询Q共有6个相关结果,某 系统排序返回了5篇相关文档,其位置分别是第 1,第2,第5,第10,第20位,则 AP=(1/1+2/2+3/5+4/10+5/20+0)/6
多个查询的AP的平均值称为系统的 MAP(Mean AP) MAP是IR领域使用最广泛的指标之一
信息检索与数据挖掘
信息检索与数据挖掘
2015/4/13
1
信息检索与数据挖掘
第7章 相关反馈和查询扩展
信息检索与数据挖掘
2015/4/13
2
课程内容
第1章 绪论 第2章 布尔检索及倒排索引 第3章 词典查找及扩展的倒排索引 第4章 索引构建和索引压缩 第5章 向量模型及检索系统 第6章 检索的评价 第7章 相关反馈和查询扩展 第8章 概率模型 第9章 基于语言建模的检索模型 第10章 文本分类 第11章 文本聚类 第12章 Web搜索 第13章 多媒体信息检索 第14章 其他应用简介
7
正确率 vs. 召回率
P = TP / ( TP + FP ) R = TP / ( TP + FN )
信息检索与数据挖掘
2015/4/13
8
正确率和召回率相结合的指标:F值
F 允许正确率和召回率的折中
where α ϵ [0, 1] , b 2 ϵ [0,∞] 常用参数: balanced F , b = 1 or α = 0.5
我们可以假设,对于返回结果: •相关度级别越高的结果越多越好 •相关度级别越高的结果越靠前越好
•R(j,d)是评价人员给出的文档d对查询j的相关性得 分,Zj,k是归一化因子,保证对完美系统NDCG的值为1, m是返回文档的位置
信息检索与数据挖掘
2015/4/13
15
从文档集合如何构建测试集
需要
2015/4/13
12
R正确率
Precision@k
前k个结果的查准率
R-Precision
检索结果中,在所有相关文档总数位置上的准确率。 如某个查询的相关文档总数为Rel,返回的结果中前 Rel个中r个是相关文档,则R正确率是r/Rel。
R正确率能够适应不同的相关文档集的大小
例:Rel=8;r=8。此时R正确率是1,但是P@20=0.4
一个完美的系统的R-precision=1
信息检索与数据挖掘
2015/4/13
13
GMAP

GMAP(GeometricMAP): TREC2004 Robust 任务引进 先看一个例子

从MAP来看,系统A好于系统B,但是从每个查询来看,3个查询中有2个 Topic B比A有提高,其中一个提高的幅度达到300%
实际上是正确率和召回率的调和平均数(harmonic mean)
信息检索与数据挖掘
2015/4/13
9
正确率-召回率曲线
每个点对应top k上的结果 (k = 1, 2, 3, 4, . . .). 插值 (红色): 将来所有点上的最高结果 插值的原理:如果正确率和召回率都升高,那么用户可能 愿意浏览更多的结果
信息检索与数据挖掘
2015/4/13
10
平均的 11-点正确率/召回率曲线
计算每个召回率点(0.0, 0.1, 0.2, . . .)上的插值正确率 对每个查询都计算一遍 在查询上求平均 该曲线也是TREC评测上常用的指标之一
信息检索与数据挖掘
2015/4/13
11
MAP
平均正确率(Average Precision, AP):对 不同召回率点上的正确率进行平均
信息检索与数据挖掘
2015/4/13
17
计算kappa统计量
Judge 2 Relevance Yes Judge 1 Relevance Yes No 300 10 No 20 70 Total 320 80
Total
310
90
400
Observed proportion of the times the judges agreed
用于测试的查询 相关性的判定
用于测试的查询
必须和测试文档集合有密切关系 最好由领域的专家设计 随机的查询并不好
相关性的判定
人工判定耗时较长 使用一组人进行判定是否是最好的方式?
信息检Βιβλιοθήκη Baidu与数据挖掘
2015/4/13
16
相关性判定之间的一致性
Kappa统计量
衡量不同人意见的一致性 对随机的一致性的简单校正
Kappa = [ P(A) – P(E) ] / [ 1 – P(E) ] P(A) – 实际观察到的一致性判断比率 P(E) – 随机情况下所期望的一致性判断的比率 Kappa = 0 和随机判断的情况一样, 1 完全一致. k在 [2/3, 1.0]时,判定结果是可以接受的 如果k值比较小,那么需要对判定方法进行重新设 计
相关文档
最新文档