基于BP神经网络的用户评论意愿预测研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有 用 性(PU)、 感 知 易 用 性(PEOU)、 互 惠(RE)、 声誉(REP)、社交(SI)、乐于助人(EH)、感知乐趣 (FE)、 经 济 报 酬(ER) 和 评 论 成 本(RC) 作 为 自 变 量,评论意愿(INT)为因变量,样本采用用户评论意愿 问卷调查取得的中美两国用户数据。在对所有变量相应测 度项的值取平均后,对数据进行归一化(标准化)处理。 处理的目的是将输入输出数据限制在 [0,1] 区间内。常 用的变换式为: x = xi − xmin (2-1) i xmax − xmin 式(2-1)中,Xi 表示输入或输出数据,Xmin 表示输 入(出)数据的最小值,Xmax 表示输入(出)数据的最 大值。 本文为便于评估电商平台用户在线消费评论意愿,对 评论意愿因变量测度项值取平均后的数值,重新进行了分 类和编码。将用户评论意愿分为两类:愿意和不愿意,凡 均值小于 4 的表示不愿意(重新用编码“0”表示),凡 均值大于等于 4 的表示愿意(重新用编码“1”表示), 数据处理后的评论意愿因变量用符号 BPint 表示。 2、网络参数设置 (1)网络结构。BP 神经网络往往由网络结构(神经 元间的连接)、激活函数和学习规则决定。本研究以九个 影响因素(自变量)为神经网络的输入层神经元节点,用 户评论意愿(INT)为因变量即目标输出层,输出层节点 数为 2(本文将评论意愿与否,设为二值分布),建立用
m = n + l + a (2-2)
m = log 2 n
(2-3)
m = nl (2-4)
上式 (2-2)、(2-3) 和 (2-4) 中,m 为隐含层神经元节 点数,n 为输入层神经元节点数,L 为输出层神经元节点 数,a 为 1~10 间的常数。对隐含层数的确定,通常先考 虑设一个隐含层,当一个隐含层的神经元节点数很多仍不 能改善网络性能时,才考虑再增加隐含层数量。本文经过 多次试验,发现当一个隐含层且其神经元节点数为 7 时, 网络具有很好的学习收敛效果,并且误差最小。 根据现有文献对电商平台用户在线消费评论意愿影响 因素的研究,结合 BP 神经网络特点,本文最终采用快速 训练法的网络结构:输入层神经元节点数 n 为 9,一个隐 含层,其神经元节点数 m 为 7,输出层节点数 L 为 2,即 9 - 7 - 2 的网络结构。 (2) 激 活 函 数。 根 据 本 研 究 样 本 数 据 特 点, 本 文输入层到隐含层的传递函数采用 S 型双曲正切函数 (tanh-sigmoid)。 由 于 本 研 究 的 因 变 量 为 分 类 变 量, 所以隐含层到输出层的激活函数选用柔性最大值函数 (Softmax),以柔化输出值,减小值之间的差。 (3)学习规则。为确保模型的泛化能力,本研究采 用调整的共轭梯度优化算法,允许误差为 (即训练错误 的最小相对变化),最初学习率为 0.4。 3、网络测试 本文运用 SPSS 神经网络分析功能中的多层感知器 (multilayer perception, MLP)方法评估预测电商平台用 户在线消费评论意愿。为防止网络训练过度,将中国和美
当代经济
2016 年 12 月刊 第 3 6 期
基于 BP 神经网络的用户评论意愿预测研究
李丹丹,李亚琴,朱雨晴
(扬州大学 信息工程学院,江苏 扬州 225127)
摘要:本文基于 BP 神经网络建模、预测电商平台用户评论意愿,测试结果表明 BP 网络可以很好地用于 用户评论意愿建模和预测。 关键词:BP 神经网络;用户评论;意愿;预测 基金项目:扬州大学 2016 年大学生学术科技创新基金项目,“社会化商务平台用户在线消费推荐意愿研 究”,项目编号:20160412;“电商平台用户评论意愿影响因素研究”,项目编号:20160443。
表 1 样本检验结果
ѝഭ ṧᵜ
ᐢ㿲⍻ нᝯ нᝯ 䇝㓳 ᝯ ᙫփ∄ֻ˄%˅ нᝯ ⍻䈅 ᝯ ᙫ䇑Ⲯ࠶∄ нᝯ ؍ᤱ ᝯ ᙫ䇑Ⲯ࠶∄ 28 8 21.8 8 2 25 4 2 30 ᐢ亴⍻ ᝯ 14 115 78.2 3 27 75 0 14 70 ↓⺞⦷˄%˅ 66.7 93.5 86.7 72.7 93.1 87.5 100 87.5 90 нᝯ 22 8 29.4 7 2 31 2 0 20
户在线消费评论意愿神经网络预测模型。网络结构往往较 难确定,其中输入层和输出层节点数根据影响因素和研究 目的确定即可,而隐含层节点数的确定则相对较困难,因 为隐含层神经元节点数过多可能出现网络过度拟合现象, 如果神经元节点数过少的话,则可能出现网络无法达到学 习收敛性与函数逼近精度的要求。目前隐含层节点数确定 常采用试凑法,即从较少的隐含层节点数开始,然后逐渐 增加节点数训练网络,从中选择网络误差最小时对应的神 经元节点数。在试凑时也可以借助于一些经验公式来粗略 估计节点数,常用的几种估算隐含层神经元节点数的经验 公式有:
二、应用 BP 神经网络识别用户评论动因及预 测建模
神经网络模型是一种基于机器学习的非参数回归方 法,可以较好地处理非线性问题,具有适用面广,抗噪能 力强的特点,无需假定变量的分布,适合解决无先验分布 假定条件下的预测问题。现有研究表明,影响电商平台用 户在线消费评论意愿的因素众多(如电商平台技术因素、 用户心理因素、社会因素、跨文化因素等),运用传统的 统计回归分析方法往往很难达到预期的分析目的,而 BP 神经网络模型的自身特征和较强的学习功能,通过对历史 数据样本的学习,掌握预测对象与影响因素之间的函数映 射关系,能够较好地达到评估预测电商平台用户在线消费 评论意愿倾向的研究目的,同时还可用于分析不同影响因 素的重要性程度。本文将集中运用神经网络强有力的学习 和联想泛化能力,在电商平台用户在线消费评论系统中运 用 BP 神经网络来建模,以甄别不同用户评论意愿。 1、数据预处理 本文根据现有相关研究结果,以九个影响因素:感知
通讯作者:李亚琴
— 110 —
CONTEMPORARY
ECONOMICS
No.36, December.2016
国样本数据随机分成训练集、测试集和验证集三部分。其 中训练集主要用于估计网络参数,进行网络建模,测试集 主要用于防止网络训练过度,而验证集则用于检验评估最 终网络模型。 由于本研究样本数据量相对较少,因此采用批处理的 训练方法,以使总误差最小。相应地采用调整的共轭梯度 优化算法估计权重值。中国和美国样本网络训练结果见表 1,对于中国样本,表 1 中表明 123 位愿意发表评论的受 试用户中有 115 位分类正确,42 位不愿意发表评论的受 试用户中有 28 位分类正确,整体上 86.7% 训练个案分类 正确,三部分样本的错误预测率大致相同(10% 左右); 而对于美国样本,64 位愿意发表评论的受试用户中有 56 位分类正确,38 位不愿意发表评论的受试用户中有 22 位 分类正确,整体上 76.5% 训练个案分类正确,三部分样本 的错误预测率大致相同(20% 左右)。Fra bibliotek一、引言
随着 web2.0 技术的广泛应用,用户生成内容的网络 社区得到了前所未有的快速发展,但同时我们注意到在电 商平台的用户往往在购物前乐意参考其他用户分享的消费 体验,而不愿意主动贡献自己的购物经验。对于电商企业 和电商平台而言,如何有效识别用户分享购物体验或消费 评论背后的动因,具有非常重要的理论和实践意义。基于 此,本研究试图运用神经网络的方法识别预测用户评论 意愿。