SPSS Clementine 贝叶斯分析 第七章

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据挖掘原理与SPSS Clementine应用宝典
元昌安 主编 邓 松 李文敬
刘Biblioteka Baidu涛
编著
电子工业出版社
第七章 贝叶斯分析
本章内容
贝叶斯定理 贝叶斯分类 EM算法
贝叶斯定理
贝叶斯分类
贝叶斯分类的基本过程 朴素贝叶斯分类 贝叶斯信念网络

贝叶斯分类-基本过程
贝叶斯分类方法基于贝叶斯定理进行分类,一般 分为以下两个步骤: (1)建立分类模型,描述预定的数据类集或概念集。 通过分析有属性描述的数据集中的属性来构造贝 叶斯分类模型 (2)使用建立的分类模型对新的数据集进行划分, 主要考虑分类规则的准确性、矛盾划分的取舍等。 一个好的分类规则集合应该是对新的数据集而言 具有很高的准确性、尽可能少的矛盾划分和较少 的规则集。
朴素贝叶斯分类-贝叶斯假设
朴素贝叶斯分类-朴素贝叶斯计算
根据类属性的不同有不同的计算方法: 离散属性的条件概率计算: 连续属性的条件概率计算 朴素贝叶斯分类提供了两种办法用来估计连续属性 的条件概率: (1)将连续属性离散化,使用离散区间来代理连续属 性 (2)利用概率分布函数进行计算
朴素贝叶斯分类-贝叶斯信念网络
EM算法-基本步骤
贝叶斯网络具有如下的特点: 贝叶斯网络通过网络结构图的方法来描述数据间 的关系,语意清晰,可理解性强,有助于利用数 据间的因果关系进行预测分析。 贝叶斯网络适合处理不完整的数据。 贝叶斯信念网络本身没有输入和输出的概念,各 个结点的计算是独立的。
EM算法-基本概念
EM(expectation-maximization)算法是最 常用的从不完整数据条件下统计概率分布的方法。 它是“求期望-取最大”的迭代循环过程,“求期 望”步骤计算不完整数据样本中每个事件在当前概 率分布条件下发生的期望充分统计量;“取最大” 步骤按照期望分布统计量把不完整数据转换成完整 数据,找到使似然性最大的概率分布。
相关文档
最新文档