基于贝叶斯推理的点击模型及其实现
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中图分类号
点击 日志 点击模型 贝 叶斯推理 搜 索引擎 日志分析
T P 3 9 1 文献标识码 A D O I : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 0 - 3 8 6 x . 2 0 1 3 . O 1 . 0 0 2
CLI CK M oDEL BAS ED oN BAYESI AN I NFERENCE AND I TS I M PLEM ENTATI oN
( G r a d Ⅱ 口 t e U n i v e i t y o fC h i e A c a d e
Ab s t r a c t
& e M , B e in g 1 0 0 1 9 0 , C h i n a)
I n o r d e r t o b e t t e r e x p l a i n u s e r b e h a v i o u r f r o m c l i c k l o g s i n s e a r c h e n g i n e o r s p o n s o r e d s e a r c h,we i mp l e me n t a B a y e s i a n c l i c k
S u n F u we i ・源自文库 L i J u a n Ya n g Da
( N a t i o n a l E n g i n e e r i n g R e s e a r c h C e n t e r o fF u n d a me n t a l S o tw f a r e I n s t i t u t e o fS o f t w a r e , C h i n e s e A c a d e m y o fS c i e n c e s , B e in g 1 0 0 1 9 0, C h i n a )
孙付伟 李 娟 杨 达
北京 1 0 0 1 9 0) 北京 1 0 0 1 9 0 ) ( 中国科学 院软件研究所基础软件 国家研究 中心 ( 中国科学 院研究生 院
摘 要
为能更好地 解释搜 索引擎和 商务搜 索的点击 日志 中的用户行为 , 实现 一种 用于分析 日志 中包含 的用户行为 的贝叶斯点
击模型。通过分析 中国最大电子商务 网站 的约9 2 7万条用户搜 索点 击 日志数据 , 发现 一个 的文档 的点击是 受其上下位置 点击过 的
文档共 同影响的, 然后基 于此发现提 出并实现一种新 的基于贝 叶斯推理 的点击模 型, 并给 出并行版本 的算 法实现。最后通过利用来 自用 户搜 索的一个 月 日志数据验证 , 结果表 明该模型优于现有 的点击模 型。 关键词
mo d e l f o r a n a l y s i n g u s e r b e h a v i o u r s i n c l u d e d i n l o g s .B y a n a l y s i n g a b o u t 9. 2 7 mi l l i o n c l i c k l o g d a t a c o l l e c t e d f r o m a l a r g e s t e ・ c o mme r c e s i t e o f C h i n a,t h e r e i f n d s t h a t t h e c h c k p r o b a b i l i t y o f a d o c u me n t i s a f f e c t e d b y t h e c l i c k e d d o c u me n t s a b o v e a n d b e l o w i t .T h e n w e p r o p o s e a n d i mp l e me n t a n e w c l i c k mo d e l b a s e d o n B a y e s i a n i n f e r e n c e a c c o r d i n g t o t h e p h e n o me n o n ou f n d,t o g e t h e r wi t h t h e i mp l e me n t a t i o n o f a n a l g o r i t h m i n p ra a l l e l v e r s i o n .A t l a s t ,w e v a l i d a t e t h e mo d e l t h r o u g h a l o g d a t a s e t c o l l e c t e d a b o u t a mo u t h f r o m u s e r s e a r c h,a n d t h e r e s u l t s h o ws t h a t t h e p r o p o s e d mo d e l o u t p e f r o r ms e x i s t i n g c l i c k mo d e l s . Ke y wo r d s C l i c k l o g Cl i c k mo d e l B a y e s i a n i n f e r e n c e S e a r c h e n g i n e L o g a n ly a s i s
第3 0卷 第 1 期
2 0 1 3年 1月
计 算机应 用 与软件
Co mp u t e r Ap p l i c a t i o ns a n d S o f t wa r e
Vo 1 . 3 0 No . 1
J a n .2 0 1 3
基 于 贝 叶 斯 推 理 的点 击模 型及 其 实 现
点击 日志 点击模型 贝 叶斯推理 搜 索引擎 日志分析
T P 3 9 1 文献标识码 A D O I : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 0 - 3 8 6 x . 2 0 1 3 . O 1 . 0 0 2
CLI CK M oDEL BAS ED oN BAYESI AN I NFERENCE AND I TS I M PLEM ENTATI oN
( G r a d Ⅱ 口 t e U n i v e i t y o fC h i e A c a d e
Ab s t r a c t
& e M , B e in g 1 0 0 1 9 0 , C h i n a)
I n o r d e r t o b e t t e r e x p l a i n u s e r b e h a v i o u r f r o m c l i c k l o g s i n s e a r c h e n g i n e o r s p o n s o r e d s e a r c h,we i mp l e me n t a B a y e s i a n c l i c k
S u n F u we i ・源自文库 L i J u a n Ya n g Da
( N a t i o n a l E n g i n e e r i n g R e s e a r c h C e n t e r o fF u n d a me n t a l S o tw f a r e I n s t i t u t e o fS o f t w a r e , C h i n e s e A c a d e m y o fS c i e n c e s , B e in g 1 0 0 1 9 0, C h i n a )
孙付伟 李 娟 杨 达
北京 1 0 0 1 9 0) 北京 1 0 0 1 9 0 ) ( 中国科学 院软件研究所基础软件 国家研究 中心 ( 中国科学 院研究生 院
摘 要
为能更好地 解释搜 索引擎和 商务搜 索的点击 日志 中的用户行为 , 实现 一种 用于分析 日志 中包含 的用户行为 的贝叶斯点
击模型。通过分析 中国最大电子商务 网站 的约9 2 7万条用户搜 索点 击 日志数据 , 发现 一个 的文档 的点击是 受其上下位置 点击过 的
文档共 同影响的, 然后基 于此发现提 出并实现一种新 的基于贝 叶斯推理 的点击模 型, 并给 出并行版本 的算 法实现。最后通过利用来 自用 户搜 索的一个 月 日志数据验证 , 结果表 明该模型优于现有 的点击模 型。 关键词
mo d e l f o r a n a l y s i n g u s e r b e h a v i o u r s i n c l u d e d i n l o g s .B y a n a l y s i n g a b o u t 9. 2 7 mi l l i o n c l i c k l o g d a t a c o l l e c t e d f r o m a l a r g e s t e ・ c o mme r c e s i t e o f C h i n a,t h e r e i f n d s t h a t t h e c h c k p r o b a b i l i t y o f a d o c u me n t i s a f f e c t e d b y t h e c l i c k e d d o c u me n t s a b o v e a n d b e l o w i t .T h e n w e p r o p o s e a n d i mp l e me n t a n e w c l i c k mo d e l b a s e d o n B a y e s i a n i n f e r e n c e a c c o r d i n g t o t h e p h e n o me n o n ou f n d,t o g e t h e r wi t h t h e i mp l e me n t a t i o n o f a n a l g o r i t h m i n p ra a l l e l v e r s i o n .A t l a s t ,w e v a l i d a t e t h e mo d e l t h r o u g h a l o g d a t a s e t c o l l e c t e d a b o u t a mo u t h f r o m u s e r s e a r c h,a n d t h e r e s u l t s h o ws t h a t t h e p r o p o s e d mo d e l o u t p e f r o r ms e x i s t i n g c l i c k mo d e l s . Ke y wo r d s C l i c k l o g Cl i c k mo d e l B a y e s i a n i n f e r e n c e S e a r c h e n g i n e L o g a n ly a s i s
第3 0卷 第 1 期
2 0 1 3年 1月
计 算机应 用 与软件
Co mp u t e r Ap p l i c a t i o ns a n d S o f t wa r e
Vo 1 . 3 0 No . 1
J a n .2 0 1 3
基 于 贝 叶 斯 推 理 的点 击模 型及 其 实 现