情感分析概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
性能比较
机器学习
优点
克服了新词的邮箱 将文本转化为结构化数据进行处理
语料库自动扩充
缺点来自百度文库
各特征都看做了孤立元素 不能体现文本内在联系
Thanks
情感分析概述
主讲内容
业界做法 处理流程 分析方法
注意事项
性能比较
业界做法
情感倾向方向
正面情感 负面情感
中性情感
情感倾向度
权值
一般处理流程
文本预处理
特征提取
特征权重计算
情感分析
分析方法
情感倾向方向
算法
基于情感词典的方法;依赖情感词典
基于机器学习的方法,依赖大规模人工标注的语料库
机器学习
训练集测试集的自动标注 特征提取 特征项权重计算
向量空间模型及降维处理
机器学习分类(SVM、NB、ME、KNN等)
性能比较
情感词典
优点
能够体现文本的非结构化数据特征 更利于挖掘文本内在联系和所表达的情感
缺点
依赖构建的情感词典 词语不规范 新词 变形词
情感倾向度
注意事项
情感词典
新名词
词典扩展方法
基于语义计算HowNet语义相识度算法; 基于统计分析,通过计算目标词与基准情感词之前的点互信息值来获取目标词的情感倾向。
变形词
程度副词 否定副词 标点符号
断句作用 情感强弱 情感极性
表情符号
注意事项