基于评论产品属性情感倾向评估的虚假评论识别研究_陈燕方
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
改善评论质量 , 从而辅助消费者在可信前提下
做出正确的购物决策。模型的实验结果表明 , 该模 型具备较强的适应性和可扩展性以及较高的消费者 辅助决策满意度。
表1
通用类型 词典项目 客户服务 服务评价 发货物流服务 包装服务 使用体验 尺寸规格 产品评价 产品质量 产品价格 产品描述 对比性评价 指导性评价 “ 评论 ”评价 推荐与告诫 整体性评价 代买与赠送 泛指评价 词典代码 CS LS PS CU DI PQ PP PD CR RR RW GF GR
三个方面展开:
82
现代图书情报技术
总第 250 期
2014 年
第9期
基于元数据特征与虚假评论或评论者的相关性评估模 型 [4,8-9], 基于评论文本特征的相似度检测模型 [3,10-11], 基于文本特征内容评价模型[12]等。 笔者认为 , 虚假评论的识别应以增加用户对评 论内容的体验效用为出发点 , 展开模型的设计与评 价。 如众多研究者所述 [1,6-7,10]: 虚假评论的识别目的 是减少虚假评论对消费者的误导 , 辅助消费者进行 正确的决策。那么虚假评论的识别问题和在线商品 效用排序的问题应该是紧密联系的。换句话说 , 评 论的可信度越低 , 则对消费者的效用也就越低。因 此 , 在 RAPBEE 模型构建的末尾环节 , 在基于评论 可信度排序的基础上 , 进一步利用评论效用排序算 法
总第 250 期
2014 年
第9期
基于评论产品属性情感倾向评估的虚假 评论识别研究*
陈燕方 1,2 李志宇 1,2,3 1 (华中师范大学信息管理学院 武汉 430079)
2 3
(华中师范大学湖北省电子商务研究中心 武汉 430079) (中国人民大学信息学院 北京 100872)
摘要: 【目的】 提出一种基于评论产品属性情感倾向评估模型(Review Attribute of Product-Based Emotion Evaluate, RAPBEE 模型), 用于在线商品虚假评论的识别。 【方法】 针对在线商品虚假评论采用评论产品属性情感倾向离群 度量方法, 结合已有评论效用研究对评论结果进行综合排序, 从而得出评论的可信度序列。 【结果】基于 R 语言 实现, 在模型试验集上, 通过 RAPBEE 模型识别处理后的评论序列和当前商品真实情况的符合度为 86.2%, 实 验结果表明 RAPBEE 模型有较强的实际应用能力与适应度。 【局限】需要依赖于已有属性词典的建模方式, 在 大规模的数据运行效率上有待改进。 【结论】提供一种新的针对中文商品虚假评论识别处理方法, 具有较强的 扩展能力。 关键词: 情感倾向 虚假评论 垃圾评论 商品评论 虚假评论识别 分类号: TP391
随着用户评论数量的增多, 商品个性化属性词典越加 丰富和完善。
图2
通用属性词典和个性化属性词典的关系
XIANDAI TUSHU QINGBAO JISHU
83
情报分析与研究
定义 3: 情感倾向词典。情感倾向词典的构建是 RAPBEE 模型实施的基础, 因此一个较好的情感倾向 词典将在一定程度上决定模型的识别效果。目前而 言,常用的中文情感词典主要包括知网 HowNet 情感 词库
收稿日期: 2014-03-24 收修改稿日期: 2014-04-23 *本文系国家大学生创新性实验计划(A 类) 基金项目“在线商品虚假评论识别及其治理研究”(项目编号: 220-20111201316)的研究成果之一。
XIANDAI TUSHU QINGBAO JISHU
81
情报分析与研究
1
1.1
通用属性词典字段
词项解释 Customer Service, 包括售前售后的沟通交流等服务进行评价特征词 Logistics Service, 包括发货、运输、配送等服务的特征词 Packaging Services, 包括产品包装服务特征词 Customer Using, 包括用户使用产品和服务后的体验特征词 Dimensions, 包括产品尺寸、大小、轻重等规格的特征词 Product Quality, 包括产品质量、真假、好坏的特征词 Product Price, 包括产品性价比的特征词 Product Describe, 包括产品与商家描述是否相符的特征词 Contrast of Review, 包括和商家、平台、以前和现在使用感受对比特征词 Review others’ Review, 包括对其他评论者评论进行评价的特征词 Recommend and Warning, 推荐与告诫其他买家是否值得购买的特征词 Gift for Friends, 该产品非本人使用或代其他人购买的特征词 General Review, 泛指性评价 , 没有针对特定属性进行评价的特征词
随着现代电子商务的高速发展 , 在线商品评论 已经成为消费者进行网络购物决策的重要参考依据 之一 , 同时也能够为商家进行服务或商品的改进提 供良好的指导依据[1]。近年来, 国内外关于在线商品 评论的研究重点逐步由观点挖掘转向虚假评论的识 别(Review Spam Detection)。其中, 国外较为具有代 表性的研究是 Jindal 等[1-4]的系列文章, 这也使得虚 假评论成为社会计算方向下有关情感分析和观点挖 掘的重要研究热点之一。相对来说, 国内有关这方面 的研究起步较晚 , 且研究内容相对国外而言缺乏新 颖性和实质性的进步 。 本文首先对在线商品评论的分类进行重新界定 , 并就在线商品“虚假评论”与“垃圾评论”的区别进行了 辨析 , 然后针对现有虚假评论识别方案存在的问题 ,
[6]
图1
在线商品评论的分类
在线商品评论从评论信息效用的角度可以分为有 用和无用评论。有用评论是指能够对消费者的购物决 策产生作用(这种作用既可能是正面的促进, 也有可能 是负面的误导)的评论, 而无用则是指类似广告、乱码 之类和商品本身无关的信息评论, 无用评论信息往往 对于消费者而言极易辨别, 无法误导其购物决策。在 有用评论中 , 根据其对消费者购物决策的作用类型 , 将其分为“正面作用”和“负面作用”。正面作用能够辅 助消费者做出正确的购买决策, 包括促使消费者购买 到符合心理预期的产品和阻止消费者购买到掺假虚夸 的产品; 负面作用评论则是误导消费者进行错误购买 决策的相关评论, 包括阻止消费者购买到符合心理预 期的产品和诱导消费者购买到掺假虚夸的产品。因此 在处理模型中, 最终目的是将可能的负面作用评论识 别出来, 即进行可信度排序。 1.2 在线商品虚假评论的识别模型 在已有的研究中, 在线商品虚假评论识别主要从 (1) 元数据特征 : 包括评论者元数据 ( 评论者信 誉、年龄、方式等)、评论内容元数据(包括评论字数、 有用性得票、评论时间等)、产品元数据(包括产品价 格、平均得分等)等; (2) 文本特征: 评论内容的相似度、评论行为(风 格)的相似度、评论特征内容(如第一人称、第二人称 等)等; (3) 情感特征: 评论积极、消极词汇比例(数目)、 句子的主客观程度等。较为常用的识别模型主要有 :
定义 2: 个性化属性词典。 个性化属性词典是基于 特定评论内容以及产品介绍而产生的属性词典。对于 特定的商品, 个性化属性词典与通用属性词典关系如 图 2 所示(以某款咖啡为例)。个性化属性词典的产生 算法将在 2.3 节详细展开。个性化属性词典主要用于 获取属于该商品特殊属性的相关词语, 在意义上和通 用属性词典既有交叉重叠部分, 也有自身的特征, 它 的完善与好坏取决于当前商品的评论数量。一般而言,
背景知识及相关工作
在线商品评论和在线商品虚假评论 在线下市场 , 消费者购买商品时的决策依据在
Байду номын сангаас
论最终的作用主体——消费者为起点进行分类 , 即 从评论信息效用的角度进行分类。分类方式如图 1 所示 :
很大程度上依赖于现实生活中相互之间的产品口碑 传播。随着互联网应用的高速发展 , 在线商品评论 开始产生 , 传统口碑开始向电子口碑过渡 , 在线商 品 评 论信 息已 成 为消 费者 进 行网 络购 物 决策 时的 重要参考依据之一。伴随着在线商品评论的丰富化 和多样化, 在线商品虚假评论开始逐步进入人们 的视野。 在线商品虚假评论至今并没有一个独立统一的定 义 , 由于目前对在线商品虚假评论的研究多等同于 “垃圾评论”的研究, 因而大部分学者采用 Jindal 等[3] 提出的对“垃圾评论”的定义和分类, 即“垃圾评论”分 为虚假评论(Untruthful Opinion)、 无关评论(Reviews on Brands Only)以及非评论信息(Non-reviews)三种类别。 孟美任等 将 “ 虚 ”和 “假 ”分开定义 , 其中 “ 虚 ”是指滥 发却没有任何价值的评论信息, 事实上这里的“虚”即 指 Jindal 等定义中的第二和第三类垃圾评论。而笔者 认为 , 国内学者在对 Jindal 等文章中关于 “Review Spam” 一词的引用存在误解 , 即将它释义为 “ 垃圾评 论”是有偏差的。 国内学者在引用 “ 垃圾 ” 一词时 , 多源自 “ 垃圾邮 件、垃圾链接”之类的计算机专业术语。但从本义上来 讲, 这里的“Review Spam”则应被称为“虚假评论”。在 Jindal 等的研究网站[7]中, 关于“Review Spam”列出了 三个等价词语 : “Fake Review” 、 “Bogus Review” 和 “Deceptive Review”, 由此可以看出以前国内学者将这 类评论定义为“垃圾评论”是存在误解的, 如果解释为 “垃圾”则更加倾向于“无用”之意, 因此笔者将其改称 “虚假评论”。然而无论是将虚假评论等同于垃圾评论 来研究 , 或是将 “虚 ”和 “假 ”分开 , 以上学者对在线商 品虚假评论的界定都是从行为主体者动机出发。即虚 假评论指那些为达到促销自家商品、提升自身信誉或 诋毁竞争者商品的目的而发表的不真实的过高或过低 的评论, 从而故意误导消费者或是干扰平台意见挖掘 系统。这里的行为动机主要来源于商家为提升自身销 售量, 实现利益最大化。 笔者认为 , 在线商品虚假评论的分类应该从评
[5]
提出了基于评论产品属性情感倾向评估方案 (Review Attribute of Product-Based Emotion Evaluate, RAPBEE) 的逻辑模型, 并分析了模型实现的两个主要算法及其 特点, 进而采用 R 语言实现。 本文的主要贡献包括: (1) 提出利用产品评论属性情感倾向的离群度对 在线商品可信度进行排序的方法, 以此达到对虚假评 论进行有效处理的目的, 为虚假评论的识别提供了一 个新的可行方案。 (2) 解决了当前中文虚假评论识别存在的问题 , 并取得了良好的实验效果, 为社会计算方向下——观 点挖掘与情感分析的扩展提供了一定的思路。 (3) 基于 R 语言实现 , 并公开了全部的词典和数 据, 为后续研究增加了可行的实验方案和材料。
[14]
(1) 忽视了新增评论对已有评论造成影响的可能 性。由于在线商品评论的实时性与动态性, 时刻都可 能有新的评论产生, 因此对于特定商品的新评论是否 会影响已有评论的有效性和真实性, 这在以往研究中 往往被忽略。 (2) 忽视了商家服务或者商品本身发生变化而导 致已有评论“失真”的可能性。商家以盈利为基本目的, 因此商家极有可能在得到一定的好评数后降低服务质 量 , 但由于多数识别处理方案无法处理此类情形, 使 得降低质量后的差评无法得到有效的展示而使消费者 受害。反之, 同样可能存在商家发现自身服务或者商 品存在不足后予以改进 , 此时 , 以前发表的有关不足 的评论将变得“不真实”。 RAPBEE 模型在解决上述不足的基础上, 形成了 如图 3 所示的逻辑解决方案。
[13]
2
基于产品属性情感倾向动态评估模型: RAPBEE 模型
2.1
关键词典定义 RAPBEE 模型中的关键词典主要包含三个部分: 定义 1: 通用属性词典。 通用属性词典是指由用于
通用属性词典、个性化属性词典、情感倾向词典。 描述商品或者服务的特征词组成的词典, 主要包括服 务评价、产品评价、指导性评价、整体性评价 4 个方 面。通用属性词典是对产品评论的抽象集合, 即消费 者有关产品属性的评论内容集中于表 1 所示的部分, 并且具备很强的相关性。该词典总共包含 743 个通用 特征属性词汇, 由近 100 万条来自淘宝、京东、当当 网等大型网络购物商城的商品评论通过分词、词频统 计后分类筛选而来 , 具备较强的通用性和代表性, 词 典中字段及其释义如表 1 所示: