基于买家评论文本分析的C2C电子商务推荐信任研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于买家评论文本分析的C2C电子商务推荐信任研究
作者:王兴芬杜惠英
来源:《中国流通经济》2018年第11期
摘要:买家在线评论是顾客考核商家信任度的重要依据,对买家评论文本进行分析具有重要意义。
为更加准确地分析评论信息内容,挖掘其真实推荐价值,可从评论文本分析着手构建新的信任推荐模型。
一方面,针对好、中、差三类评论与所对应评论内容不匹配的现象,构建评论文本中心度因子和评论情感因子,同时综合考虑交易时间、金额等因素,引入反馈机制,建立一种全面客观的推荐模型;另一方面,结合算法编程对模型进行模拟仿真实现,有效挖掘评论的真实推荐价值,提高计算所得信任值对买家决策的參考价值和推荐的可靠性。
根据该模型研究结果,为更好地帮助电商提高推荐信任度,帮助买家进行购买决策,对电商和在线平台而言,一定要在保障产品质量的同时,努力提高在线评论信息获取的便捷度和内容的可信度,提高推荐参考价值,确保用户信息与财务安全,增强买家信任感;对买家而言,一定要提高在线评论信息分辨能力,合理挖掘买家在线评论所体现的信息,科学判断电商平台信誉度,并由此形成更为理性的消费,更好地保障自身权益;对监管机构而言,一定要切实发挥监督管理职能,协同电商和消费者营造良好购物环境,确保电子商务健康有序发展。
关键词:买家评论;文本中心度因子;情感因子;推荐信任
中图分类号:F724.6文献标识码:A文章编号:1007-8266(2018)11-0022-09
一、引言
近年来,电子商务发展迅速,伴随着互联网的发展逐渐渗透到人们生活的方方面面。
中国电子商务研究中心发布的《2017年中国电子商务市场数据监测报告》显示,2017年中国电子商务交易额达到29.16万亿元,同比增长11.7%,电子商务交易规模继续扩大并保持高速增长态势。
网购用户已经达到5.33亿人,同比增长14.3%。
我国电子商务在快速发展的同时,投诉率居高不下。
据统计, 2017年零售电商投诉占比最高,达到60.59%,同比增长7.91%。
由此引发了诸多社会问题,其中信任问题最为严峻,对用户决策具有重要影响。
电子商务以互联网为媒介,可使交易变得更加便捷、快速、高效,但依然无法解决信息不对称问题,阻碍了用户信任感的提升,且随着互联网传播速度的加快,用户在线购买意愿也受到了极大影响。
交易平台设计的信誉系统可在一定程度上缓解这种状况,对提高用户对平台的信心和信任感具有重要意义,然而其有效性却一直饱受诟病。
本文基于相关研究理论与成果,结合当前研究存在的问题与不足,针对评论文本分析和信任模型开展深入研究,构建新的信任
推荐模型,通过以电子商务平台数据为支撑的实证分析为买家决策提供一定支撑,为电子商务平台提高信任度提供一定借鉴。
二、研究现状综述
迄今为止,已有众多学者对信任进行了研究,并结合当时的背景和环境融入个人理解给出了各种不同的定义和解释,其中有几类得到了广泛采用。
社会学家卢曼(Luhmann N)等[ 1 ]认为,信任是一种广义上的期望,期望他人能够保持自己的人格,这种人格至少是他已经显露且为社会看到的人格,在这种期望下他会控制自我、控制欲图非分之举的内心,这表明信任是主观的、乐观的,且不对期望值进行估计的的一种感性行为。
科泽(Cos er L A)等[ 2 ]从三个方面入手对信任进行了解释。
首先,相信自然秩序、社会秩序是公平的、有利于自身的;其次,相信对方有能力胜任其扮演的角色;其三,相信对方是负责任的,并且会履行义务。
当前有关信任的研究主要集中在两个方面,一是对信任影响因素的研究;二是对信任计算模型的深入研究。
信任影响因素主要从消费者对环境、技术、安全、制度等的感知层面入手进行研究;采用的信任计算模型大多为基于反馈评分的累加模型。
有关信任影响因素的研究成果非常丰富,研究人员从不同的角度和层面入手进行了深入的挖掘和总结。
金(Kim D J)等[ 3 ]从六个维度入手研究了电子商务信任的影响因素,包括内容维度、产品维度、交易维度、技术维度、消费者行为维度。
坦(Tan F B)等[ 4 ]从三个维度入手阐述了信任的影响因素,包括个人维度、制度维度和人际维度。
其中,个人维度指个人特征、家庭环境和文化因素等;制度维度包括网络经历和保护认知因素两方面;人际维度包括有关竞争力、可信度、善良对待他人和忠诚度的知识。
瓦尔楚赫(Walczuch R)等[ 5 ]将影响信任的因素分为个体因素、认知因素、经历因素和知识因素。
邵兵家等[ 6 ]将影响信任的因素归纳为企业自身、企业网站、消费者个人因素和环境因素。
耶尔文佩(Jarvenpaa S L)等[ 7 ]将影响信任的因素分为施信方过去的经历、战略定位、信任倾向和对控制的感知。
杰芬(Gefen D)[ 8 ]认为,信任受对受信方熟悉程度以及个人信任倾向的影响,并由此推断信任与施信方个人特征及对受信方的感知存在较大关系。
信任模型是一种量化的评论体系,使得平台的信任程度可用数值进行衡量。
国内外有关信任计算模型的研究已经取得了较多成果,提出了各类拓展的信任度量模型。
通过梳理各类信任模型相关文献,根据直接交互信任计算方式的不同,将之分为基于概率论的信任模型和基于评分累加的信任模型;根据应用范围的不同,将之分为P2P电子商务信任模型、文件共享信任模型、数据管理信任模型和协同计算信任模型。
其中,甘早斌等[ 9 ]构造了一个信任网络,以形式化语言进行描述,认为信任由直接信任和间接信任两部分组成,同时提出了影响信任的时间衰减因子,采用评论相似度来衡量信任推荐的可信度。
李道全等[ 10 ]对推荐节点进行扩展,除考虑具有直接交易关系的节点外,还引入了二层节点即有间接交易关系的节点,综合考虑时间、金额、交易失败次数等因素,针对交易失败次数设置惩罚因子,该模型在理论上能够提高推荐的准确性并有效遏制恶意节点的攻击,但二层节点的推荐权重问题并未得到解决。
巴尔加
瓦(Bhargava K)等[ 11 ]对评论内容进行分析,根据情感分析结果修正评分,提出了基于评论内容分析的信任模型,该模型能够挖掘评论文本所表达的主观信息,减少根据客观评分判断买家情感出现的偏差,但对评论本身是否具有推荐价值缺乏考虑。
波恩特拉科(Porntrakoon P)等[ 12 ]采用神经语言程序学(NLP)方法对评论文本进行信息抽取,得出评论所涉及的维度,对不同维度赋予不同权重,对每一个维度结构(中心词,修饰语)中的修饰语进行情感分析,计算该维度信任得分,结合各维度权重获取每条评论的信任得分,最后对所有评论信任得分进行求和获得对该商家的信任值,在各维度权重的选取上,只是根据该维度评论条数占所有维度评论总量的比重来确定,其合理性和必要性有待进一步研究。
应志恒等[ 13 ]考虑交易时间、金额等因素的影响,引入反馈机制,建立了全新的信任推荐模型,该模型能够有效挖掘评论的真实推荐价值,提高计算所得信任值对买家决策的参考价值,且具有较高的可靠性。
基于已有研究成果,本研究以真实的消费者对消费者(C2C)电子商务交易过程为出发点,结合交易现状开展研究。
首先,对当前研究存在的问题进行了归纳:一是买家购物后发表的评论通常为习惯性好评,买家交易信息获取难度大;二是买家之间几乎没有交流,无法建立有效的熟悉度关系;三是多数买家仅在第一次与某商家接触时才会进行信任判断,若是发起第二次交易,则说明买卖双方信任已经建立,而如果第一次交易失败,那么買卖双方将无法建立有效信任。
买家对卖家的初始信任一般通过其他买家对商家的推荐建立,而推荐的主体便是买家在交易完成后给出的评论信息。
在信任研究中,对评论信息的利用通常是凭借评论标签,即好评、中评、差评进行信任的累加,并没有对评论信息的内容进行分析,而根据观察,评论标签与实际评论内容存在不相对应的情况,好评标签下的评论内容可能并非好评,存在评论内容反映信息较少的情况,无法产生推荐效果。
接下来,对评论信息进行有针对性的分析,对评论信息分析算法进行拓展,挖掘其真实推荐价值。
具体评论信息分析步骤如下:
第一步:标准评论信息词组的确定。
选定标准评论信息,涵盖物流、商家、产品、服务四个方面,取四个词的相关词语各十个,形成标准评论信息词组。
第二步:推荐权重的确定。
依据评论文本与标准评论词组的相似度,确定评论推荐权重。
第三步:评论文本情感分析。
对评论文本进行情感分析,得到评论的真实情感倾向,进而综合考虑时间、金额等信息,建立推荐信任模型。
三、评论文本相似度分析
标准评论信息词组是某一维度评论词语的集合,这组词语能够较为准确、全面地代表该维度可能出现的评论内容。
因此,这组词语所代表的评论内容对消费者具有较高价值。
如果某一
文本内容与有关词组相似,那么相似程度越高,评论文本对消费者的推荐价值就越接近,利用相似度,我们可以较为准确地衡量两个文本内容的接近程度。
文本的相似度指两个文本特征的匹配程度。
当前计算文本相似度较为常用的方法主要可分为两类:一类是基于统计的方法,包括基于向量空间模型的词频—逆文档频率(TF-IDF)算法、基于汉明距离的相似度算法和基于隐性语义索引的相似度算法;另一类是基于语义理解的相似度算法,这类方法依赖于语义词典。
对于买家评论,评论文本一般篇幅较短,包含的词语较少,反映文本特征的特征词也比较少且频数低,利用统计的方法无法通过有限的特征词来表达文本的主题,因此将文本相似度的计算转化为特征词之间相似度的计算是一种较为合理的方法。
本文采用的是基于知网语义词典的相似度分析方法,其优势在于不需要复杂的计算,不必考虑数据稀疏问题,且对语料的依赖程度相对较低,对电子商务网站评论信息的分析具有较好的适用性。
(一)词语相似度
在知网语义词典中,收录了1 618个义原,这些义原按照上下位关系形成了层次体系严密的义原树,所有义原形成了多个义原树,分别是事件、实体、属性、属性值、数量值、次要特征、语法、动态角色与特征。
其中,前面七个为基本义原,后面两个分别为语法义原和关系义原,此外在描述概念的语言表达式中还会包含一些符号,称为符号义原。
实词的语言描述表达式均由基本义原(Basic)表达式、语法义原(Grammar)表达式、关系义原(Relation)表达式、符号义原(Symbol)表达式组成,其中基本义原表达式是必要的,而虚词的语言描述表达式则由关系义原表达式或语法义原表达式组成。
六、模拟仿真
研究数据来源于某知名电子商务网站,共选取10家销售U盘的店铺,每个店铺选取1 000条评论数据。
得到的信息包括买家用户名、买家信用等级、买家评论等级(好、中、差)、评论文本、产品类型、产品规格和评论时间,形成了多属性的样本数据。
仿真内容为对比直接按照好、中、差评标签累积信任值和按照本文模型进行信任累积的变化趋势。
采用Python软件对实验进行模拟仿真。
结合样本数据和研究对象特点,选择表1所示的主要参数和取值。
(一)信任累积趋势分析
信任的累积指通过好评加1、中评加0、差评减1的方式,对所有相关评论进行累加求和,以获取消费者对商家的信任值,信任值的高低可在一定程度上反映商家的可信程度。
本节选取了1 000条评论,其中好评500条,中评300条,差评200条,模拟随着评论的增加一般信任累加模型与本文模型信任值的变化情况。
一般信任累加模型根据评论标签所对应的分值进行信任累加。
由图3可以清楚地发现,一般信任累加模型的信任累加值仅反映了评论数量的变化,而本文模型的信任累加值则呈曲线变化趋势,累加速度更缓慢,更符合实际信任增长情况。
此外,还模拟了对信任取平均值时信任值随交易次数增加而产生的变化情况。
对信任取平均值时,一般信任累加模型的信任值没有任何变化,本文模型能够根据评论的内容动态反映信任值的变化。
因此,本文模型能够更加真实地反映信任值在交易过程中的变化。
图3对信任值的求和模拟过程展现了不同类别评论的混合累加,好评和差评产生的累加速率较一般信任累加模型低,中评也对信任累加产生了影响。
因此,一方面,本文模型有效区分了好评、中评、差评三类评论对信任累加的影响;另一方面,本文模型不同于一般信任累加模型,体现了对某一类别不同评论的区分。
在对信任值取平均值的实验过程中,选取某一类评论进行分析,结果发现本文模型能够打破既定评论类别划分界限,挖掘评论文本潜在意义。
综合以上分析,说明模型既符合信任累加的一般规律,又体现了优化信任累积的效用。
(二)交易成功率分析
交易成功率指总交易次数中成功交易次数所占的比重,抽取20家店铺共20 000条评论,以好评数作为成功交易次数,对本文模型与一般信任累加模型进行比较,即在信任值相同的情况下对本文模型的信任值与一般累加模型的交易成功率进行比较。
由图4可以看出,在信任值相同的情况下,交易成功率高于一般信任累加模型,即在交易次数相同的情况下,为使本文模型的信任值与一般信任累加模型一致,需要数量更多的好评。
因此,本文模型能够更加真实地反映真实信任的积累,所得到的信任值也更具可信度,具有较好的适应性与实用价值。
七、总结与启示
(一)研究结论与局限性
目前有关推荐信任的研究大多基于买家评分,却没有考虑评分与评论内容的一致性,即没有分析好评的内容是否表达了积极情绪,中评的内容是否完全中性,差评的内容是否表达了负面情绪,因此直接进行评分累加将导致信任评估失准。
而且,当所有评论都是好评时,计算得到的信任值将无法体现商家的实际信用状况。
此外,没有考虑评论文本是否具有推荐价值,即评论所表达的主题与购买商品是否相关或具有一定的相关性。
而本研究则解决了上述问题,主要结论如下:
1.在理论上,本文从评论文本分析入手建立了新的推荐信任模型,通过比较评论文本与选定标准文本相似度,分析评论文本情感值来确定文本推荐价值,并引入评论文本中心度和评论文本情感因子作为信任的影响因子,此外还考虑了交易时间、交易金额等因素,使模型更具客观性。
2.设计了合理的情感分析方法。
本研究借助了知网语义词典,其中存在一些贬义或褒义词。
对评论内容进行情感分析得到正向、中性和负向情绪,对不同词语分别赋予不同的情感值senV以表達不同的情感,对不同情绪下的信任累积分别进行处理,以更加真实、有效地反映商家的实际信用状况。
3.在情感分析实现工具上,本文采用Python软件的分词模块对文本进行分割,去掉停用词后得到表征文本情感的几个词语组合,将词语组合中的词语与所建立的情感词典进行匹配,对词语组合的情感值进行加权平均,得到文本的情感极性值。
4.在实证分析上,本文采用Python软件对实验进行模拟。
仿真结果表明,与一般信任累加模型相比,本文模型的信任累加值呈曲线变化趋势,累加速度更缓慢,更符合实际信任增长情况。
从平均信任累计趋势看,一般信任累加模型的信任值没有任何变化,本文模型能够根据评论的内容动态反映信任值的变化。
从交易成功率看,在信任值相同的情况下,本文得到的交易
成功率高于一般信任累加模型,因此本文模型能够更加真实地反映真实的信任积累,得到的信任值也更具可信度,具有较好的适应性和实用价值。
综上所述,在理论方面,本研究拓展了文本分析方法,对文本相似度分析算法和情感分析算法进行了研究和优化,基于评论文本分析提出了综合考量文本相似度、文本中心度、评论文本情感等因素的信任影响因子体系,对研究电子商务平台信任具有一定的理论意义。
在实证分析方面,以电子商务网站实际评论数据为支撑,结合Python算法编程加以实现,验证了算法的有效性,形成了切实可行的算法体系,具有一定的实践指导意义,为电子商务网站提高信任度和帮助用户购买决策提供了科学合理的理论支撑。
因此,本文模型对推荐信任模型构建具有重要指导意义,能够为消费者提供有效的决策支持。
当然,本研究仍然存在很多局限性。
评论文本相似度分析采用基于语义的方法,基于语言表达特性对评论文本按照标点符号进行切分,匹配出最大相似度对,并以所有匹配对相似度的算术平均值作为两个文本的相似度,并没有对匹配对的内容进行识别,即两个匹配对可能均为针对同一维度的评论,因此后续研究需要对匹配对的内容进行预处理。
在情感分析方面,评论文本中包含很多表达特定情感的中性词,为准确识别评论所表达的情感倾向,还需要进一步扩充情感词典。
此外,本文对恶意差评、共谋评论识别能力有限,需要对这些类型的评论加以特性分析并进行相应处理,以提高评论的可靠度。
(二)启示
1.对电商而言,消费者信任对电商平台发展具有重要影响,是电商平台的核心竞争力之一,因此电商应当在保障产品质量的同时,致力于提高平台的信誉度和便捷度。
此外,电商平台还需要在恶意差评规避、好评可信度保障、用户信息与财务安全等方面作进一步的考量和提升。
对平台而言,在设计评论模块时,需要重点结合相似度分析方法,通过比较评论文本与选定标准文本的相似度和分析评论文本的情感值来确定文本推荐价值,并考虑交易时间、交易金额等因素的影响来确定推荐度,这样有助于提高评论文本的参考价值。
2.对消费者而言,在线评论信息是消费者判断电商平台信任度的重要依据。
只有结合在线评论文本分析与情感分析,科学合理挖掘买家在线评论所体现的信息,才能科学判断电商平台信誉度,由此形成更加理性的消费,更好地保障消费者权益。
3.监管机构的严格监督以及各类政策法规的规范是电子商务健康发展的重要保障。
电商、消费者和监管机构只有共同努力,才能营造良好购物环境,保障电子商务健康有序发展。
参考文献:
[1]LUHMANN N,POGGI G,BURNS T,et al.Trust and power:two works[M].Ann Arbor:U-M-I Out of Print Books on De mand,1979:83.
[2]COSER L A,BARBER B.The logic and limits of trust [J].Po litical science quarterly,1983,2(3):77-78.
[3]KIM D J,SONG Y,BRAYNOV S,et al.A b-to-c trust mod el for on-line
exchange[EB/OL]. [2018-08-15].https://www. /publication/243768104_A_b- to-
c_trust_ model_for_on-line_exchange.
[4]TAN F B,SUTHERLAND P.Online consumer trust:a multidimensional model[J].Journal of electronic commerce in or ganizations,2004,2(3):40-58.
[5]WALCZUCH R,LUNDGREN H.Psychological antecedents of institution-based consumer trust in e-retailing[J].Informa tion & management,2004,42(1):159-177.
[6]邵兵家,孟宪强.中国B2C电子商务中消费者信任影响因素的实证研究[J].科技进步与对策,2005,22(7):166-169.
[7]JARVENPAA S L,TRACTINSKY N,VITALE M.Consumer trust in an internet
store[J].Information technology and man agement,2000,1(1-2):45-71.
[8]GEFEN D.E-commerce:the role of familiarity and trust[J]. Omega,2000,28(6):725-737.
[9]甘早斌,曾灿,马尧,等.基于信任网络的C2C电子商务信任算法[J].软件学报,2015,26(8):1 946-1 959.
[10]李道全,吴兴成,郭瑞敏.一种基于二层节点和客观风险的电子商务交易信任模型[J].计算机科学,2016,43(5):117-121.
[11]BHARGAVA K,GUJRAL T,CHAWLA M,et ment based seller trust model for e- commerce[C].International conference on computational techniques in information and communication technologies,IEEE,2016:387-391.
[12]PORNTRAKOON P,MOEMENG C.A model for multi-di mensional trust measurement in Thailand e- marketplace[C].International conference on electrical engineering/elec tronics,computer,telecommunications and information technology,2017:73-76.。