搜索引擎检索性能评价实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息资源开发与管理
实验报告
实验名称:检索性能评价
姓名:** 学号:2016***** 专业:信息管理与信息系统班级:16***
指导教师:**
实验成绩:
批阅教师签字:
一、实验目的
通过绘制P-R图、11点插值图和计算MAP比较百度和谷歌的检索性能,加强对单个查询检索性能评价方法的应用能力,进一步巩固和理解课堂中所学的信息检索性能评价方法。
二、实验内容与实验步骤
(一)实验内容
以百度、谷歌为例,在两个搜索引擎中输入同一个Query,并设定该Query的相关文档总数为*** 篇。查看前20条返回的记过的相关性,对检索性能进行评价,并绘制P-R图、11点插值图,分别计算百度和谷歌的MAP。
(二)实验步骤
1.复习信息检索评价方法原理及P-R图、11点插值图绘制方法,学习并掌握使用Excel绘
制图表方法;
2.在百度、谷歌中分别输入相同的检索词,统计前20个结果hit情况并计算对应的
precision、recall值及11点对应的precision值;
3.绘制P-R图、11点插值图,计算MAP;
4.评价并比较谷歌和百度的检索性能。
三、实验环境
1.操作系统:windows 7
2.软件:Excel2007
四、实验过程与分析
1.在百度和谷歌中输入检索词:tcp/ip协议工作原理,得到检索结果部分如下图1所示:
2.用Excel分别统计不同搜索引擎前20个结果的hits、presicion、recall、和11点对应的值。如图所示:
3.绘制百度、谷歌P-R图并比较。
百度、谷歌P-R图
分析:******************
5.绘制百度、谷歌的11点插值图并比较检索性能。
百度、谷歌11点插值图
分析:**************************
6.分别计算百度和谷歌的MAP。
(1)百度MAP=(1/1+2/2+3/3+4/7+5/8+6/9+7/10+8/17+9/20)/20=
(2)谷歌MAP=
五、实验结果总结与思考