用户偏好统计模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用户偏好统计模型

用户偏好统计模型

用户偏好模型在信息系统中是一个很具挑战性的问题。目前主要处理自动发现用户的偏好,并且使用该模型。随着个性化和推荐服务在互联网和电子商务逐渐流行起来,了解用户偏好变得越来越重要。智能信息系统可以分析用户需要什么,并且预测用户未来选择的商品。在用户不同的偏好的基础之上,智能系统能够对每个用户推荐其感兴趣的商品和提供个性化服务。

目前,描述用户偏好的方法主要有,相似性、概率和相关性。向量相似性主要应用在协同过滤和内容过滤中;概率主要通过贝叶斯网络预测用户未来的行为;关联规则挖掘中,用关联来描述商品之间的关联性。

向量相似性缺点:无法直观地描述用户对商品的喜欢和不喜欢

概率缺点:概率不能直接描述用户的喜好,只能描述访问的可能性

关联性:主要用来发现有用的规则,并不是偏好

积极和消极的偏好都需要通过偏好模型表示出来

1用户偏好模型

V表示用户通过行为产生的一系列商品(购买,浏览,搜索等等)

商品x是用一些列特征表示的,

用户profile是由用户对每个特征的一组偏好值组成,

特征偏好pref(w),只根据历史记录计算用户对某个特征的喜欢和不喜欢程度

无法直接比较用户profile和商品之间的关系,需要将他们通过特征来描述。对商品的偏好可以通过平均特征偏好来表示

M(x)是一个规范化的变量,即某个商品的特征数目

互信息作为偏好度量方式

用户选择某个商品的概率主要由两个因素决定:商品偏好和商品访问可能性

实际偏好定义如下:

P(X(w)):非条件特征概率,商品包含的特征数在整个特征集中的概率P(X(w)|V)条件特征概率,商品包含的特征在用户的特征历史中的概率上式描述的就是互信息

相关文档
最新文档