产品评论中的发现和评论情感分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

CONTENTS
02




数据来自京东一个商品手机的评论 爬虫获取数据; 清理数据,获得各个字段信息; 保存评论和对应的得分的星星个数。
CONTENTS
03




1. 字段分析 2. 情感分析和评论分类
1. 字段分析
Biblioteka Baidu
1. 字段分析
2. 评论内容语义分析和评论分类
2.1 词典法 词典:程度副词、否定词和情感词 情感得分公式:
Thank you
谢 谢 观 赏
产品评论
CONTENTS
01 研究现状 02 获取数据 03 数 据 分 析
CONTENTS
01




人们可以在购物站点上发布评论来表达自己的使用 体验,或者在博客,论坛,社交站点,甚至是新闻 评论上对任何产品,服务或事件发布自己的观点或 表达自己的情感。 所以,对这些数据进行分析很有必要,对普通消费 者,公司组织,和国家政府等各级别的用户都有重 要作用。
MLP—多层感知机
是一种非线性分类, 由数据集学习网络 的输入层、隐含层 和输出层的参数 分类准确率:0.91, 是三种方法中最好 的。
w10
w10
w11 w12 w20 w21 w22
w11 w12
w20 w21
w22
三种方法的比较:
方法 词典法 PCA+SVM(RBF) MLP 分类准确率 0.75 0.89 0.91
2. 评论内容语义分析和分类
2.1 词典法 实验结果: 评价正确的评论 有6661条,总评 论有8934条,正 确率为 6661/8934=0.75。
2. 评论内容语义分析和分类
2.2 机器学习方法 PCA+SVM(RBF) MLP 特征选择: word2vec
PCA+SVM(RBF)
PCA(主成份分析) 是用来降维, 降维效果: 10040 图中表示方差越大, 降维效果越好,丢 失原始数据的信息 量越少。
PCA+SVM(RBF)
SVM(支持向量机), 是用来分类。 该方法主要是找到一个超平面,把数据划分成两部 分。实验中采用的核函数是径向基函数(RBF)。 分类准确率:0.90,显然,比使用词典的方法更好。
相关文档
最新文档