用户偏好统计模型

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

用户偏好统计模型

用户偏好模型在信息系统中是一个很具挑战性的问题。目前主要处理自动发现用户的偏好，并且使用该模型。随着个性化和推荐服务在互联网和电子商务逐渐流行起来，了解用户偏好变得越来越重要。智能信息系统可以分析用户需要什么，并且预测用户未来选择的商品。在用户不同的偏好的基础之上，智能系统能够对每个用户推荐其感兴趣的商品和提供个性化服务。

目前，描述用户偏好的方法主要有，相似性、概率和相关性。向量相似性主要应用在协同过滤和内容过滤中；概率主要通过贝叶斯网络预测用户未来的行为；关联规则挖掘中，用关联来描述商品之间的关联性。

向量相似性缺点：无法直观地描述用户对商品的喜欢和不喜欢

概率缺点：概率不能直接描述用户的喜好，只能描述访问的可能性

关联性：主要用来发现有用的规则，并不是偏好

积极和消极的偏好都需要通过偏好模型表示出来

1用户偏好模型

V表示用户通过行为产生的一系列商品（购买，浏览，搜索等等）

商品x是用一些列特征表示的，

用户profile是由用户对每个特征的一组偏好值组成，

特征偏好pref（w），只根据历史记录计算用户对某个特征的喜欢和不喜欢程度

无法直接比较用户profile和商品之间的关系，需要将他们通过特征来描述。对商品的偏好可以通过平均特征偏好来表示

M(x)是一个规范化的变量，即某个商品的特征数目

互信息作为偏好度量方式

用户选择某个商品的概率主要由两个因素决定：商品偏好和商品访问可能性

实际偏好定义如下：

P（X（w））:非条件特征概率，商品包含的特征数在整个特征集中的概率P（X（w）|V）条件特征概率，商品包含的特征在用户的特征历史中的概率上式描述的就是互信息