搜索引擎检索性能评价实验报告

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息资源开发与管理

实验报告

实验名称:检索性能评价

姓名:** 学号:2016***** 专业:信息管理与信息系统班级:16***

指导教师:**

实验成绩:

批阅教师签字:

一、实验目的

通过绘制P-R图、11点插值图和计算MAP比较百度和谷歌的检索性能,加强对单个查询检索性能评价方法的应用能力,进一步巩固和理解课堂中所学的信息检索性能评价方法。

二、实验内容与实验步骤

(一)实验内容

以百度、谷歌为例,在两个搜索引擎中输入同一个Query,并设定该Query的相关文档总数为*** 篇。查看前20条返回的记过的相关性,对检索性能进行评价,并绘制P-R图、11点插值图,分别计算百度和谷歌的MAP。

(二)实验步骤

1.复习信息检索评价方法原理及P-R图、11点插值图绘制方法,学习并掌握使用Excel绘

制图表方法;

2.在百度、谷歌中分别输入相同的检索词,统计前20个结果hit情况并计算对应的

precision、recall值及11点对应的precision值;

3.绘制P-R图、11点插值图,计算MAP;

4.评价并比较谷歌和百度的检索性能。

三、实验环境

1.操作系统:windows 7

2.软件:Excel2007

四、实验过程与分析

1.在百度和谷歌中输入检索词:tcp/ip协议工作原理,得到检索结果部分如下图1所示:

2.用Excel分别统计不同搜索引擎前20个结果的hits、presicion、recall、和11点对应的值。如图所示:

3.绘制百度、谷歌P-R图并比较。

百度、谷歌P-R图

分析:******************

5.绘制百度、谷歌的11点插值图并比较检索性能。

百度、谷歌11点插值图

分析:**************************

6.分别计算百度和谷歌的MAP。

(1)百度MAP=(1/1+2/2+3/3+4/7+5/8+6/9+7/10+8/17+9/20)/20=

(2)谷歌MAP=

五、实验结果总结与思考

相关文档
最新文档