第3章Bayes决策理论_2

合集下载

贝叶斯决策理论5456525

第二章贝叶内斯决容策纲理要论
指出了机器自动识别出现错分类的条件；错分类的可能性如何计算；如何实现使错分类出现可能性最小。
15
2.研1 究Ba目yes的决和策意的基义本概念 2）基于最小错误风险的Bayes决策
第二章贝叶内斯决容策纲理要论
引入了“风险”与“损失”概念，希望做到使风险最小，减小危害大的错分类情况。
P(1
|
X

) P( 2
|
X
)

X

12
39
2.研2 究基目于最的小和错意误义率的Bayes决策
第二章贝叶内斯决容策纲理要论
判别函数还有另外两种形式，即似然比形式：
由统计资料表明总药品数为n，其中正常药品数为 n1 ，异常药品数为 n2
则
P(1 )

n1 n
先验概率!
P(2 )

n2 n
显然在一般情况下正常药品占比例大，即 P(1) P(2)
由先验概率所提供的信息太少！！！
22
2.研1 究Ba目yes的决和策意的基义本概念 2、类条件概率密度函数 P(X | i )
第二章贝叶内斯决容策纲理要论
类条件概率密度函数 P(X | i ) 是指在已知某类别的特征空间中，出现特征值X的概率密度，
即第 i 类样品它的属性X是如何分布的。
23
2.研1 究Ba目yes的决和策意的基义本概念
第二章贝叶内斯决容策纲理要论
假定只用某一个特征进行分类，即d＝1。并已知这两类的类条件概率函数分布，如图4－3所示。

i
)]

1 (X 2

i )T
Si 1 ( X

2Bayes决策理论

第九页，共66页。
前往(qiánwǎng)
第十页，共66页。
结束放映前往(qiánwǎng)本
3.2 最小风险(fēngxiǎn)的Bayes 决策
在上一节我们引见了最小错误率的Bayes决策，并且证明了运用这种决策法那么时，平均错误概率是
最小的。但实际上有时需求思索一个比错误率更为普遍的概念——风险(fēngxiǎn)，举例说明。无须置疑，任何风险(fēngxiǎn)都会带来一定损失。看一个普通的决策表。
前往(qiánwǎng)本
普通的多类效果(xiàoguǒ)中，设损失函数为0-1损失函
数
(i
,
j
)
0 1
i j i j
i, j 1, 2, , c
c
c
R(i x) (i , j )P( j x) P( j x)
j1
j1
勇于开始，才能找到成功的路
i j
c
R(k x) min R(i x) P( j x)
0 p(t 1)
t
p(t 2 )
0
p(x 2 )dx 0
R1
勇于开始，才能找到成功的路
R1 ( t) R2 (t )
与最小错误率的Bayes决策(juécè)的比拟
P(1 x) P(2 x) P(1 x) P(2 x)
1 2
p(x p(x
1 ) 2 )
p(x p(x
1 ) 2 )
x2 x1
1 p(x 1)dx p(x 2 )dx0
R1
R1
10 p(x 2 )dx p(x 1)dx
R1
R1
10 p(x 2 ) p(x 1)dx
R1

统计决策理论-bayes定理

于是由先验概率 P( j ) 转化为后验概率 P(ωj|x) 。
如果对待分类模式的特征我们得到一个观察值x，经上式计
算出结果 P(1 x)>P(2 x)，则判决X属于 1，反之，属于 2 。
13
2.2 Bayes决策
14
2.2 Bayes决策
例1：在细胞的化验中，要区分正常和异常的两种类型，分别用w1和w2表示，已知p(w1)=0.85, p(w2)=0.15,现有一待测细胞，其观测值为X，从类条件概率密度分析曲线上查得p(x/w1)=0.15, p(x/w2)=0.45,试对该细胞进行分类。
2
• 统计学以数据为研究内容，但仅仅收集数据，决不构成统计学研究的全部。
• 下面介绍几种最常用、也是最基本的统计决策方法。这些方法是以后各种模式识别方法的基础。
3
2.1 Bayes定理
贝叶斯决策理论方法是统计模式识别中的一个基本方法，用这种方法进行分类时要求满足以下两个条件：
（1）各类别总体的概率分布是已知的；（2）要决策的类别数是一定的。
15
所以这次化验的细胞被判断为正常类型细胞。 16
2.2 Bayes决策
2.2.2 最小风险Bayes决策
最小风险Bayes决策是考虑各种错误造成损失不同而提出的一种决策规则。
例如，通过化验判断细胞是不是癌细胞，可能做出两种错误判决：一是把癌细胞错判为正常细胞；一种是把正常细胞错判为癌细胞。这两种错误判决带来的风险显然是不同的。
5
先验概率预先已知的或者可以估计的模式识别系统位于某
种类型的概率，即根据大量统计确定某类事物出现的比例。如我国理工科大学男女生比例大约为8:2，则在这类学校一个学生是男生的先验概率为0.8，而为女生的概率是0.2，两个概率之和为1。

统计学中的贝叶斯统计和决策理论

统计学中的贝叶斯统计和决策理论统计学是研究数据收集、分析和解释的学科，而贝叶斯统计和决策理论是统计学中的两个重要分支。

贝叶斯统计理论是一种基于贝叶斯定理的统计推断方法，而决策理论则关注如何在面对风险或不确定性时做出最佳决策。

一、贝叶斯统计1. 贝叶斯理论的基本思想贝叶斯统计理论是以英国数学家Thomas Bayes的名字命名的，其基本思想是通过先验知识和新收集的数据来进行参数估计。

与传统频率统计不同，贝叶斯统计将概率看作是描述人们对不确定性的信念，通过更新这些信念来进行推理。

2. 先验概率和后验概率在贝叶斯统计中，先验概率是在考虑新数据之前已经拥有的关于参数的概率分布。

随着新数据的不断积累，我们可以更新先验概率，得到后验概率，从而更加准确地估计参数的值。

3. 贝叶斯公式贝叶斯公式是贝叶斯统计的核心公式。

根据贝叶斯公式，我们可以计算参数的后验概率，从而基于数据来更新我们对参数的估计。

4. 贝叶斯推断的优点和应用贝叶斯统计有一些独特的优点。

首先，它允许我们将先验知识与数据结合，从而得到更加准确的推断。

此外，贝叶斯统计还可以通过使用先验概率来处理缺乏数据的情况。

贝叶斯统计在各个领域中都有广泛的应用，包括医学诊断、金融风险评估和机器学习等。

二、决策理论1. 决策理论的基本概念决策理论是研究在面对不确定性和风险时如何做出最佳决策的学科。

决策问题涉及到选择行动和评估不同行动的后果。

决策理论包括概率理论、效用理论和风险管理等概念。

2. 概率理论在决策中的应用概率理论是决策理论中的一项重要概念，它用于描述事件发生的可能性。

决策者可以使用概率理论来估计不同决策的结果，并在不确定性下做出合理的决策。

3. 效用理论和决策权衡效用理论是决策理论中的另一个关键概念，它描述了个体对不同结果的偏好程度。

根据效用理论，决策者可以根据结果的效用来评估不同决策的价值，并选择效用最大化的决策。

4. 风险管理和决策优化决策理论还涉及到风险管理和决策优化。

贝叶斯决策理论课件

R R x | xpxdx
期望风险R反映对整个特征空间上所有x的取值采取相应的决策(x)所带来的平均风险。
条件风险R(i|x)只是反映对某一观察值x，
采取决策i时，所有类别状态下带来风险的平均值。
显然，我们要求采取的一系列决策行动(x) 使期望风险R最小。
如果在采取每一个决策或行动时，都使其条件风险最小，则对给定的观察值x作出决策时，其期望风险也必然最小。这样的决策就是最小风险贝叶斯决策。其规则为：
p(x 1)P(1)dx p(x 2 )P(2 )dx
R2
R1
P(1)P1(e) P(2 )P2 (e)
对应图中黄色和橘红色区域面积
px
|
1
dx
px
|
2
dx
R2
R1
对多类决策（假设有c类），很容易写出相应的最小错误率贝叶斯决策规则：
形式一：
如果P( x) max P( x)，则x
它是在c个类别状态中任取某个状态j时，采
用决策i的风险(i|j)相对于后验概率 P(j/x)的条件期望。
▪ 观察值x是随机向量，不同的观察值x，采取决策i时，其条件风险的大小是不同的。所以，究竟采取哪一种决策将随x的取值而定。
▪ 决策看成随机向量x的函数，记为(x), 它也是一个随机变量。我们可以定义期望风险R：
(i
,
j
)
0 1
i j i j
i, j 1, 2, , c
此时的条件风险为：
c
c
R(i x) (i , j )P( j x) P( j x)
j1
j1
i j
表示对x采取决策i的条件错误概率
所以在0-1损失函数时，使

正态分布中的Bayes决策

贝叶斯定理的公式为：P(A|B) = (P(B|A) * P(A)) / P(B)，其中P(A|B)是在B发生的条件下P(A)是A发生的概率，P(B)是B发生的概率。
贝叶斯决策的优势
01
贝叶斯决策方法能够考虑不确定性和主观性，使得决策更加科学和合理。
先验概率
在Bayes决策中，先验概率是指在做出决策之前，对各个可能结果发生概率的估计。在正态分布中，先验概率可以通过已知的数据和概率密度函数计算得出。
计算方法
根据正态分布的性质，先验概率可以通过以下公式计算：P(μ) = 1 / (σ√(2π))，其中μ是正态分布的均值，σ是标准差，π是圆周率。
理论依据坚实
Bayes决策理论基于贝叶斯定理和最大期望效用原则，通过计算后验概率和期望效用来做出最优决策。在正态分布中，这一理论能够为决策者提供坚实的理论依据，帮助其做出更加科学和准确的决策。
灵活性强
Bayes决策理论可以根据不同的先验信息和数据分布，灵活地调整模型参数和决策规则，从而更好地适应各种复杂情况。在正态分布中，这一优点能够使得Bayes决策更加灵活和实用。
利用正态分布计算最优决策
最优决策
在Bayes决策中，最优决策是指根据先验概率和后验概率做出的最优选择。在正态分布中，最优决策可以通过最大化后验概率或最小化损失函数得出。
计算方法
根据最大后验概率准则，最优决策可以通过以下步骤得出：首先计算各个可能结果的损失函数值，然后选择损失函数值最小的那个结果作为最优决策。如果需要更严谨的决策准则，可以考虑最小化期望损失函数或最大化期望效用函数。
在贝叶斯决策中，决策者通常会根据历史数据和经验对事件发生的概率进行先验估计，并在获得新的信息后，利用贝叶斯定理更新这些估计。

正态分布中的Bayes决策

如果取0－1损失函数，最小风险判决规则和最大似然比判决规则均与最小错误判决规则等价。
下面以最小错误判决规则为例来研究Bayes分类方法在正态分布中的应用。
由最小错误率判决规则抽象出来的判决函数如下：
g i ( x ) ( x |w i ) P ( w i )i 1 , 2 , , c
如果类概率密度是正态分布的，
由于 gi(x)w iTxwi0为线性函数，
其决策面由线性方程 gi(x)gj(x)0构成
决策面是一个超平面。
在 i 2 I 的特殊情况下，决策面方程可改写成
wT(xx0)0
wi j x01 2(ij)i 2 j 2lnP P ((w wij))(ij)
满足 wT(xx0)0 的x的轨迹是wi 与x )d x x i (x i)dix
其中xi为边缘分布，
(x i) (x ) d x 1 d x 2 d x i 1 d x i 1 d x d
i2jE[x(ii)x(jj)]
(x ii)(x jj) (x i,x j)d x id x j
协方差矩阵：
2 11
2 12
2 12
2 22
2 1d
2 2d
是一个对称矩阵，只 1考2d 虑S22为d
2 dd
正定矩阵的情况，也就是:
|S|所有的子式都大于0
同单变量正态分布一样，多元正态分布x可以由和S完全确定，常记为N(,S)。
(2) 多元正态分布的性质
参数μ和Σ完全决定分布等概率密度轨迹为超椭球面不相关性等价于独立性边缘分布和条件分布的正态性线性变换的正态性线性组合的正态性
⑤.线性变换的正态性对于多元随机向量的线性变换，仍为多元正态

贝叶斯决策理论

两类分类器的功能：计算判别函数，再根据计算结果的符号将 x 分类
g(x)
判别计算
阈值单元
决策
贝叶斯决策理论
2.3 正态分布时的统计决策
重点分析正态分布情况下统计决策的原因是： ①正态分布在物理上是合理的、广泛的 ②正态分布数学表达上简捷，如一维情况下只
有均值和方差两个参数，因而易于分析
贝叶斯决策理论
贝叶斯决策理论
目标：所采取的一系列决策行动应该使期望风险达到最小
手段：如果在采取每一个决策时，都使其条件风险最小，则对所有的 x 作决策时，其期望风险也必然达到最小
决策：最小风险Bayes决策
贝叶斯决策理论
最小风险Bayes决策规则：
其中
采取决策
贝叶斯决策理论
最小风险Bayes决策的步骤
2.2.6 分类器设计
要点： • 判别函数 • 决策面（分类面） • 分类器设计
贝叶斯决策理论
决策面（分类面）
对于 c 类分类问题，按照决策规则可以把 d 维特征空间分成 c 个决策域，我们将划分决策域的边界面称为决策面（分类面）
贝叶斯决策理论
判别函数
用于表达决策规则的某些函数，则称为判别函数
E{ xi xj } = E{ xi } E{ xj }
贝叶斯决策理论
相互独立
成立
成立？？多元正态分布的任
不相关
意两个分量成立！
贝叶斯决策理论
说明：正态分布中不相关意味着协方差矩阵
是对角矩阵
并且有
贝叶斯决策理论
④边缘分布(对变量进行积分)和条件分布(固定变量)的正态性
⑤线性变换的正态性
y=Ax A为线性变换的非奇异矩阵。若 x 为正态分布，

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

取值而定，引入函数 (x) ，表示对 x 的决策。对整个特
征空间上所有 x的取值采取相应的决策 (x) 所带来的平
均风险
R R((x) x)p(x)dx
显然，我们对连续的随机模式向量按最小风险Bayes决策规则采取的一系列决策行动可以使平均风险最小。到此为止，我们已经分析了两种分别使错误率和风险达到最小的Bayes决策规则，下面分析一下两种决策规则的关系。
第3章 Bayes决策理论
第3章 Bayes决策理论
3.1 最小错误概率的Bayes决策 3.2 最小风险的Bayes决策 3.3 Neyman-Pearson决策 3.4 最小最大决策 3.5 Bayes分类器和判别函数 3.6 正态分布时的Bayes决策法则 3.7 离散情况的Bayes决策
第3章 Bayes决策理论
p(x p(x
1 ) 0 1 ) 0
xR2 xR1
p( p(
x x
2 2
) )
p( p(
x x
1 1
) )
0 0
x2 x1
p(x p(x p(x p(x
1 ) 2 ) 1 ) 2 )
x2 x1
返回本章首页
第3章 Bayes决策理论
取得极小值的边界条件
0 p(t 1)
t
p(t 2 )
Neyman—Pearson决策即限定一类错误率条件下使另一类错误率为最小的两类别决策。
返回本章首页
第3章 Bayes决策理论
p(x 1)P(1)dx P(1)P1(e)
R2
p(x 2 )P(2 )dx P(2 )P2 (e)
R1
P1(e) p(x 1)dx
R2
P2 (e) p(x 2 )dx 0
0
p(x 2 )dx 0
R1
R1 ( t) R2 (t )
与最小错误率的Bayes决策的比较
P(1 x) P(2 x) 1
P(1 x) P(2 x)
2
p(x p(x
1 ) 2 )
p(x p(x
1 ) 2 )
x2 x1
返回本章首页
第3章 Bayes决策理论
3.4 最小最大决策
有时我们必须设计在整个先验概率范围上都能很好的进行操作的分类器。比如，在我们的有些分类问题中可能设想尽管模式的有些物理属性恒定不变，然而先验概率可能变化范围很大，并且以一种不确定的方式出现。或者，我们希望在先验概率不知道的情况下使用此分类器，那么一种合理的设计分类器的方法就是使先验概率取任何一种值时所引起的总风险的最坏的情况尽可能小，也就是说，最小化最大可能的总风险。以二类模式识别问题为例，进行讨论。
损失。根据Bayes公式，后验概率为：
P( j
x)
p( x j )P( j )
5
p( x i )P(i )
i1
j 1, 2, ,5
返回本章首页
第3章 Bayes决策理论
对于刚才的决策表考虑如下的一个条件期望损失，即给
定x ，我们采取决策 i 情况下的条件期望损失（条件风
险）：
5
R(i x) (i , j )P( j x) E (i , j ) i1,2, ,5
观察到一个模式时，得到特征 x ，就可利用后验概率作
出分类的决策，同时也会带来一定的错误概率。若观察
到大量的模式，对它们作出决策的平均错误概率 P(e) 应是 P(e x) 的数学期望。
返回本章首页
第3章 Bayes决策理论
平均错误概率
P(e) P(e x)p( x)dx
从式可知，如果对每次观察到的特征值 x ， P(e 1) 是
返回本章首页
第3章 Bayes决策理论
对模式识别的主要统计方法是Bayes决策理论，它是用概率论的方法研究决策问题，要求（1）各类别先验概率以及条件概率密度均为已知，即各类别总体的概率分布是已知的；（2）要决策分类的类别是一定的；
返回本章首页
第3章 Bayes决策理论
3.1 最小错误概率的Bayes决策
返回本章首页
第3章 Bayes决策理论
返回本章首页
第3章 Bayes决策理论
x ——观察或测量到的 d 维模式特征向量；
1 , 2 , 3 , 4 , 5 ——状态或模式类空间
1 , 2 , 3 , 4 , 5 ——决策空间
(i , j ) i 1, 2, ,5 j 1, 2, ,5 ——损失函数，表示真实状态为 j 而所采取的决策为 i 时所带来的某种
c
x
p(x i )P(i )
i1
（2）利用计算出的后验概率及决策表（专家根据经验确
定），计算条件风险
c
R(i x) (i , j )P( j x) i 1, 2, , a
j1
（3）最小风险决策
R(k x) min R(i x)
i1,2, ,a
返回本章首页
第3章 Bayes决策理论
这样按最小风险的Bayes决策规则，采取的决策将随 x 的
在上一章，我们介绍了线性判别函数，作了一个假设——抽取到的模式样本的边界是“整齐”而不混杂的，而且以后遇到的待分类模式基本上不超过学习样本的分布范围，从而利用这些样本得到的分类边界是无误差的。但是实际上因为试验的样本是从总体中随机抽取的，不能保证用过去的抽取的样本训练得到的分类边界对新的模式样本也能较好地分类。因此，考虑样本不确定性的模式识别方法是非常重要的。另外，还有特征选择不完善所引起的不确定性，模式数据采集和预处理和特征抽取过程中干扰和噪声引起的不确定性。综上，我们引出统计决策的方法。
x) x)
1 2
R(2 x)R(1 x)(21 11)P(1 x)(22 12 )P(2 x)
(21 (21
11 11
)P(1 )P(1
x)(12 22 )P(2 x)(12 22 )P(2
x) x)
1 2
返回本章首页
第3章 Bayes决策理论
在两类问题中，若有 21 11 12 22 ，决策规则变为
(i
,
j
)
0 1
i j i j
i, j 1, 2, , c
c
c
R(i x) (i , j )P( j x) P( j x)
j1
j1
i j
c
R(k x) min R(i x) P( j x)
i1,2, ,c
j1
i j
返回本章首页
第3章 Bayes决策理论
c
c
P( j
p( x j )P( j )
R2
R1
P(1)P1(e) P(2 )P2 (e)
返回本章首页
第3章 Bayes决策理论
结束放映返回本章首页
第3章 Bayes决策理论
3.2 最小风险的Bayes决策
在上一节我们介绍了最小错误率的Bayes决策，并且证明了应用这种决策法则时，平均错误概率是最小的。但实际上有时需要考虑一个比错误率更为广泛的概念——风险，举例说明。毋庸置疑，任何风险都会带来一定损失。看一个一般的决策表。
尽可能小的话，则上式的积分必定是尽可能小的这就证实了最小错误率的Bayes决策法则。下面从理论上给予证明。以两类模式为例。
返回本章首页
第3章 Bayes决策理论
P(e) P(xR2 ,1) P(xR1,2 ) P(xR2 1)P(1) P(xR1 2 )P(2 )
p(x 1)P(1)dx p(x 2 )P(2 )dx
x)
j1 c
1
j1
p( x i )P(i )
i1
R(k x) min R(i x) i1,2, ,c
c
min P( j x) i1,2, ,c j1
ji
min
i1,2, ,c
1
P(i
x
)
max
i1,2, ,c
P(i
x)
返回本章首页
第3章 Bayes决策理论
3.3 Neyman—Pearson决策
x) x)
1 2
总风险公式
R R( (x) x)p( x)dx
返回本章首页
第3章 Bayes决策理论
假定决策域已经确定，我们以R1 表示分类器判为1 时的特征空间中的区域，同样有R2和2 ，于是总风险用条件风险的形式表示为
R R(1 x)p( x)dx R(2 x)p( x)dx
R1
R2
j1
采取那种决策呢？ 1,2,3,4,5
最小风险Bayes决策规则：
R(k x) min R(i x)
i1,2, ,a
k
返回本章首页
第3章 Bayes决策理论
综上，可知该规则的进行步骤为：（1）根据已知，计算出后验概率；
P( j ) p(x j )P( j
x)
p(x j )P( j )
R2
R1
1 p(x 1)dx p(x 2 )dx0
R1
R1
10 p(x 2 )dx p(x 1)dx
R1
R1
10 p(x 2 ) p(x 1)dx
R1
返回本章首页
第3章 Bayes决策理论
10 p(x 2 ) p(x 1)dx
R1
min
p(x p(x
2 2
) )
返回本章首页
第3章 Bayes决策理论
先验概率已知
铁螺丝出现的概率—— P(1) 铜螺丝出现的概率—— P(2 )
它们反映了我们在下一个样品出现前对它的类别可能性的先验知识，称这种先于事件的概率为先验概率。
合理的决策规则：
P(1 P(1