《文本数据挖掘》
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
”“+-+-+_ ― - —I —I — —I -+-+- 11“ 1111____I ____I ____
《文本数据挖掘》
宗成庆,夏睿•张家俊著+
+ 文本数据挖掘是通过机器学习、自然语言处理和推理分析等方法,根据文本内容完成信息抽取、关[[系发现、热点预测、文本分类和自动摘要等具体任务的信息+处理技术。
随着互联网和移动通信技术的快速发展和普及t 应用,这项技术已在众多领域得到了广泛应用。
本书旨在全+
t 面介绍与文本数据挖掘相关的基本概念、理论模型和实现算■法,内容覆盖数据预处理、文本表示、文本分类、文本聚类、主[题模型、情感分析与观点挖掘、话题检测与跟踪、信息抽取以 +及文本自动摘要等,以期帮助广大对文本数据挖掘感兴趣的+科研技术人员快速掌握相关技术。
+
t 全书分为10章,开篇介绍文本数据挖掘的基本概念;第j 2〜6章介绍相关基础模型.从文本预处理(包括英文的和中 ;文的文本预处理)方法开始,随后给出文本表示方法,包括向 ;量空间模型和词汇、短语、句子及文档的分布式表示.都从统 +计建模和深度学习建模两个角度进行了阐述;之后针对文本 +分类问题介绍了特征选择方法、统计学习方法和深度神经网 +j 络方法;接下来是文本聚类•包括简单的类别相似性度量和各种聚类算法以及性能评价方法;然后是主i ■题模型•包括潜在语义分析、概率潜在语义分析和潜在狄利克雷分析。
在对上述文本挖掘基础理论和方i ;法进行介绍之后•该书第7〜10章介绍了文本挖掘技术的具体应用,包括情感分析和观点挖掘、主题发j I 现与跟踪、信息抽取及自动文摘。
这些都是目前文本挖掘领域活跃的前沿研究课题,该书不但给予了全j +面而透彻的介绍,而且在传统方法和最新进展(包括深度学习方法)之间进行了很好的平衡。
;+ ;
本书可作为高校计算机、自动化、信息处理等专业的高年级本科生或研究生教材.也可供相关领域i
t +t 的研究人员和工程技术人员阅读参考。
++
* 1 - —'—1— - —'—'—'—'—'— —t —I — - + - —I —f —I —I — - —f —t —I —t —I —I —I —I — - —I —I —I —I —I —I —I —I — -+“
/。