基于概率潜在语义分析的Web用户聚类
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于概率潜在语义分析的Web用户聚类
俞辉;景海峰
【期刊名称】《计算机工程与应用》
【年(卷),期】2008(44)23
【摘要】Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助.通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概率转换为隐式变量Z对会话S的条件概率,然后在聚类分析中以此作为相似度计算依据.聚类算法采用了基于距离的k-medoids算法,以进一步改善聚类精度.实验结果验证了该算法的有效性和局限性.
【总页数】3页(P160-162)
【作者】俞辉;景海峰
【作者单位】中国石油大学,计算机与通信工程学院,山东,东营,257061;中国石油大学,计算机与通信工程学院,山东,东营,257061
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于混合概率潜在语义分析模型的Web聚类 [J], 王治和;王凌云;党辉;潘丽娜
2.基于多重特征的双层Web用户聚类方法 [J], 王钊;樊钊
3.基于ART1用户聚类的Web预取模型研究 [J], 姚瑶;张慧
4.基于K-Means算法的Web日志用户聚类研究 [J], 陈洲; 陆南
5.基于概率潜在语义分析的Web用户会话识别 [J], 高春贞;吴军华
因版权原因,仅展示原文概要,查看原文内容请购买。