第7章贝叶斯网络.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Hangover
Brain Tumor
如果头疼,患脑 瘤的概率有多大?
Headache
如果参加了晚会,
并且头疼,那么 患脑瘤的概率有
Smell Alcohol
多大?
Pos Xray
2019/10/19
数据仓库与数据挖掘
3
7.2 贝叶斯概率基础
7.2.1 先验概率、后验概率和条件概率 7.2.2 条件概率公式 7.2.3 全概率公式 7.2.4 贝叶斯公式
2019/10/19
数据仓库与数据挖掘
10
7.3.2 贝叶斯网络的优越性
对已有的信息要求低,可以进行信息 不完全、不确定情况下的推理;
具有良好的可理解性和逻辑性;
专家知识和试验数据的有效结合相辅 相成,忽略次要联系而突出主要矛盾, 可以有效避免过学习;
推理结果说服力强,贝叶斯网络对先 验概率的要求大大降低。
输出:节点t发生的概率。 (1)把证据向量输入到贝叶斯网络B中; (2)对于B中的每一个没处理过的节点n,如果它具有发生的事实(证据),则
标记它为已经处理过;否则继续下面的步骤; (3)如果它的所有父节点中有一个没有处理过,则不处理这个节点;否则,继
续下面的步骤; (4)根据节点n的所有父节点的概率以及条件概率或联合条件概率计算节点n的
2019/10/19
数据仓库与数据挖掘
12
7.4 贝叶斯网络的预测、诊断和 训练算法
7.4.1 概率和条件概率数据 7.4.2 贝叶斯网络的预测算法 7.4.3 贝叶斯网络的诊断算法 7.4.4 贝叶斯网络预测和诊断的综合算
法 7.4.5 贝叶斯网络的建立和训练算法
2019/10/19
数据仓库与数据挖掘
数据仓库与数据挖掘
第7章 贝叶斯网络
2019/10/19
1
第7章 贝叶斯网络
7.1 引例 7.2 贝叶斯概率基础 7.3 贝叶斯网络概述 7.4 贝叶斯网络的预测、诊断和训练算法 7.5 工具包应用
2019/10/19
数据仓库与数据挖掘
2
7.1 引例
Party
参加晚会后,第 二天早晨呼吸中
有酒精味的可能 性有多大?
i1
独立互斥且完备的先验事件概率可以 由后验事件的概率和相应条件概率决 定
2019/10/19
数据仓库与数据挖掘
8
7.3 贝叶斯网络概述
7.3.1 贝叶斯网络的组成和结构 7.3.2 贝叶斯网络的优越性 7.3.3 贝叶斯网络的3个主要议题
2019/10/19
数据仓库与数据挖掘
9
7.3.1 贝叶斯网络的组成和结构
概率分布,并把节点n标记为已处理; (5)重复步骤(2)-(4)共m次。此时,节点t的概率分布就是它的发生/不发
2019/10/19
数据仓库与数据挖掘
5
7.2.2 条件概率公式 P(A | B) P(B | A)P(A) P(wenku.baidu.com)
条件概率的计算可以通过两个事件的 发生概率,以及相反方向的条件概率 得到。
2019/10/19
数据仓库与数据挖掘
6
7.2.3 全概率公式
n
P( A) P(Bi )P( A | Bi )
13
7.4.1 概率和条件概率数据
P(PT)
P(BT)
P(HO|PT)
PT=True
True False
0.200 0.800
0.001 0.999
True False
0.700 0.300
PT=False 0
1.000
左表给出了事件发生的概率:PT发生 的概率是0.2,不发生的概率是0.8
右表给出了事件发生的条件概率:PT 发生时,HO发生的概率是0.7
2019/10/19
数据仓库与数据挖掘
11
7.3.3 贝叶斯网络的3个主要议题
贝叶斯网络预测:从起因推测一个结果的理论, 也称为由顶向下的推理。目的是由原因推导出结 果。
贝叶斯网络诊断:从结果推测一个起因的推理, 也称为由底至上的推理。目的是在已知结果时, 找出产生该结果的原因。
贝叶斯网络学习:由先验的贝叶斯网络得到后验 贝叶斯网络的过程。
2019/10/19
数据仓库与数据挖掘
4
7.2.1 先验概率、后验概率和条件 概率
先验概率:根据历史的资料或主观判断所 确定的各种时间发生的概率。没有经过试 验证实,属于检验前的概率。
后验概率:通过贝叶斯公式,结合调查等 方式获取了新的附加信息,对先验概率修 正后得到的更符合实际的概率。
条件概率:某事件发生后该事件的发生概 率。
计算已知参加晚会的情况下,第二天早晨呼吸有 酒精味的概率。
P(+SA)=P(+HO)P(+SA|+HO)+P(-HO)P(+SA|-HO)
计算已知参加晚会的情况下,头疼发生的概率。
2019/10/19
数据仓库与数据挖掘
15
7.4.2 贝叶斯网络的预测算法
输入:给定贝叶斯网络B(包括网络结构m个节点以及某些节点间的连线、原因 节点到中间节点的条件概率或联合条件概率),给定若干个原因节点发生与 否的事实向量F(或者称为证据向量);给定待预测的某个节点t。
贝叶斯网络是描述随机变量(事件)之间 依赖关系的一种图形模式,是一种用来进 行推理的模型。
贝叶斯网络由网络结构和条件概率表两部 分组成。
网络结构是一个有向无环图,由结点和有向弧段组成。每 个结点代表一个事件或者随机变量,变量值可以是离散的 或连续的,结点的取值是完备互斥的。有向弧段代表随机 变量间的因果关系或概率依赖关系,通过在各变量之间画 出它们的因果关系。弧段是有向的,不构成回路。
2019/10/19
数据仓库与数据挖掘
14
7.4.2 贝叶斯网络的预测算法
计算结点HA的概率。 完善结点概率:在不知结点明确信息情况下的预 测。
P(+HA)=P(+BT)P(+HO)P(+HA|+BT+HO)+P(+BT) P(-HO)P(+HA|+BT-HO)+P(-BT)P(+HO)P(+HA|BT+HO)+P(-BT)P(-HO)P(+HA|-BT-HO)
i1
基本事件的互斥性 Bi B j ,i j,i, j 1,2,......, n 基本事件的完备性 B1 B2 ...... Bn
2019/10/19
数据仓库与数据挖掘
7
7.2.4 贝叶斯公式
P(Bi | A)
P(Bi )P( A | Bi )
n
P(Bi )P( A | Bi )