基于模糊朴素贝叶斯方法的客户消费行为预测研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方法得到了不同的应用, 例如 , 模式分类【 【 4 】 , 模糊规则 , 空间特征分离应用 等。 在这部分研究中, 我们把每个属性看 成一个语义变量 , 该语义变量又分成不同的语义值。一个语义变量的值为自然语言中的语言单词或句子【 8 ] 【 】 【 l 0 】 【 l l 】 。
贝叶斯网络 又称作置信 网络, 是一种基于概率推理的图形化表达 方式, 主要 以图形化 的方式描述变 量或事件之 间的概
De c . 2 0 1 3
基 于模 糊 朴 素 贝叶斯 方 法 的
客 户消费行为预测研 究
杨 琼 唐振平 陈建华 蒋建军 韦海峰
( 1 . 南华大学 经济管理学院管理科 学与工程系 ;2 . 南华大学 经济管理学院信息管理与信 息系统系 ,湖南 衡 阳 4 2 1 0 0 1 )
摘 要 :面对 当前 日 益竞争的市场环境 , 以客 户消 费为研 究对 象,以客户 消费因子为关键 点, 提出了 一种基 于客户消 费
行 为预测的模糊朴素 贝叶斯 方法。针对客户消费影响因子所呈现 的连续及 离散性 , 分别建立 了相应的模 糊表 示方法,以此为
基础 ,对客户消 费行为预 测建立了朴素 贝叶斯方法 ,并用 实例对提 出的方法进行 了分析说明。 关键词:客 户消费;模糊表示法;朴素 贝 叶斯 方法
第3 4 卷 第1 2 期
2 0 1 3年 1 2月
湖南科技学院学报
J o u na r l o f Hu n a n Un i v e r s i t y o f S c i e n c e a n d En g i n e e r i n g
、 bl _ 3 4 No . 1 2
1 . 0
年龄 ( a g e )
0 30 6 0
图2. 对于年龄属性 ( 0 到6 O )当c = 3 时的图形描述
1 . 0
0
2 0
年龄 ( a g e )
4 0
图3 . 对 于年龄属 性 ( O 到6 0 )当c = 4 时的图形描 述
上述 图中的属性模糊表示 方法 ,如 :V 2 . a g 。 ,V2 , 2 a g e ,……V , 4 。 可看成模糊格 1 - 项集 。对于 多维模糊格通过类 似的方法 能够进行描述 ,例如 ,如果 我们要把 年龄 ( a g e ), 用 x 1表示 ,和薪水 ( s a l a r y )用 x 2表示 ,这 两个属性 分成 三个语义值 , 那么一个特征空 间被分成 3 * 3的 2维模糊格 。如果要表示年龄及薪水这两个属性的任意 2维模糊格 , 可以这样描述 : V 3 , 1
率关系或因果 关系。贝 叶斯 网络广泛应用于 许多领域 ,如 :故 障诊断 】 ,评价系统可 靠性 】 1 5 ] ,可靠性模型 【 ,人工智 能 驯 u 等等。一般来说 ,属性值有定量的和定性 的,为此 ,下面分两个部分进行 论述 。
2 . 1 定量属 性的模糊格表 示方法
定量属性能分成 c个不同语义值 ,例如 ,属性 “ 年龄” ,其范围可以为 : [ O , 6 0 ] 。 我们可 以假设分三种情况 ,即 :c = 2 , c = 3 , c = 4 ,为方便描述 ,下面分别用三个图形来表示 :
V 32
.
s a l a r y
。
2 . 2定性属 性的模糊格表 示方法 定性属性 的可能取值 是有 限的 , 且值 之间没有顺序关系 。如果不 同的属性值为 n ( n 是有 限的) , 那 么这个属性只能被 n 个语义值进行划分 。例如 ,每个语义值 的语义句 子在 定义 “ s e x ” 时可以这样描述 :
中图分类号 :F 5 9 文献标识码:A 文章编号 :1 6 7 3 — 2 2 1 9( 2 0 1 3 )1 2 — 0 1 2 2 — 0 0 6
1引 言
客户消费行为预测是每个企业都急需解决的一个难题 , 因为客户在购买产 品时具有多选择性 , 客户 的选择对企业 的生存
与发展会产生严重影响。就 目前研究情况来看 ,对客户消费分析 的大部分成果体现在客户划分及客户价 值方面的研究 ,或仅 仅利用历史数据进行常规统计 ,得到 的结果 比较肤浅 ,无法为企业决策人 员提供帮助 。当前 ,客户消费 已呈现多样化 ,客户 消费数据库 不断增大 , 消费特征 发生了根本性变化 , 基于这种 状况 , 本文针对客户消费行为预测提出了模糊朴素 贝叶斯方法 。
2 客 户属性 模糊 因子段 表示 方法
本部分主 要使 用的变量说 明:( 1 ) c : 语言变量 中的语义值 个数 ; ( 2 ) v i :
.
定义于 属性 n l 中, c个变量语义值 中的第 i 个语义值 ,1 < =i < = c ; ( 3 )a : 属性值个数, a > = 1 。 已有研究提 出不 同的模糊语义值能用于 模式识别及模糊推理[ 1 ] , 因此该
se x V 2i
,
.
ma l e
( 1 )
及
v2 . 2 s e x . f e ma l
( 2来自百度文库)
每个语义值可看成是模糊格 1 一 项集 ,多维模糊格项集表示 方法在定量属性 的模糊格表示 方法 中已经讲述 。
3 客户 消费 行为 预测 的朴 素 贝叶斯 方法
在很多应 用方面 ,类变量与属性之 间的关系很难 确定 ,也就是说 ,虽然被测试 的记 录属性与有 些训练样本相 同,但 即便 这样也无法保证能完全正确地预测其类标号 。这一 部分主要讲述客户属性 集与客 户类变量 的概率 关系推理 方法 , 是一种把类
1 . 0
年龄 ( a g e )
0
图1 . 对 于年龄属性 ( O 到6 0 )当c = 2 时的图形描述
收稿 日期 :2 0 1 3 —1 0 一O 9 作者简介 :杨琼 ( 1 9 7 5 一) ,女 ,硕士 ,南华大学经济管理学 院教师 ,研究方向为数据挖 掘。
1 2 2