《模式识别》 第二章 2.1
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( ) ( ) P ωi x
=
max P
j =1,2 ," ,c
ωj
x
先验概率与类条件概率密度相联系的形式 :
( ) ( ) ( ) ( ) P
x ωi
P ωi
= max P j =1,2,",c
x ωj
P ωj
,则
x ∈ωi
19
小结
贝叶斯公式:
P(ωi | x) =
p(x | ωi )P(ωi )
=
−
ln
p(x
|
ω1 )
+
ln
p(x
|
ω2
)
< ln
>
⎛ ⎜ ⎝
P(ω1) P(ω2 )
⎞ ⎟ ⎠
x ∈ ⎧⎨⎩ωω12
15
基于最小错误率的贝叶斯决策
例:假设在某个局部地区细胞识别中正常和异常两类的先验概率 分别为
正常状态:P(ω1) = 0.9
异常状态:P(ω2 ) = 0.1
现有一待识别的细胞,其观察值为x,类条件概率密度分别
基于最小错误率的贝叶斯决策
鲈鱼/鲑鱼例子
自然状态下,先验的类别状态,ωi, i=1,2
ωi类别状态是一个随机变量, P(ωi) 表示为先验概率。 捕获鲈鱼和鲑鱼的几率相等。
P(ω1) = P(ω2) (先验) P(ω1) + P( ω2) = 1 (排除其它鱼的种类)
基于最小错分布 (先验概率和类条件 概率密度) 是已知的
要决策分类的类别数是一定的
决策
黑色:第一类
粉色:第二类
绿色:哪一类?
统计决策理论就是 根据每一类总体的 概率分布决定未知 类别的样本属于哪 一类!
决策准则
评价决策有多种标准,对于同一个问题,采用 不同的标准会得到不同意义下“最优”的决策
因此, P(error | x) = min [P(ω1 | x), P(ω2 | x)] (基于最小错误的贝叶斯决策Bayes decision)
基于最小错误率的贝叶斯决策
基于最小错误率的贝叶斯决策规则:
等价形式
P(ω1 | x) > P(ω2 | x) x ∈ω1 P(ω1 | x) < P(ω2 | x) x ∈ω2
为 p(x | ω1) = 0.2, p(x | ω2 ) = 0.4 , 试对该细胞x进行分类。
解:
∑ P(ω1 | x) =
2
p(x | ω1)P(ω1) p(x | ω j )P(ω j
)
=
0.2 ×
0.2× 0.9 0.9 + 0.4×
0.1
=
0.818
j =1
P(ω2 | x) = 1− P(ω1 | x) = 0.182
贝叶斯决策常用的准则:
最小错误率准则 最小风险准则 Neyman-Pearson准则 最小最大决策准则
基本概念
在连续情况下,假设对要识别的物理对象有d种特征
观察量x1,x2,…xd,这些特征的所有可能的取值范围构 成了d维特征空间。
称向量 x = [ x1, x2,", xd ]T x ∈ Rd 为d维特征向量。
|
x)
p(x)dx
∫ ∫ =
t −∞
p(x
| ω 2 ) P (ω 2 )dx
+
∞ t
p(x
| ω1 ) P (ω1 )dx
= P (ω 2 ) P2 (e) + P (ω1 ) P1 (e)
18
3
2013-10-22
C类别情况下最下错误率
在C类别情况下最小错误率贝叶斯决策规则的后验 概率形式:
P(ω1 | x) = 0.818 > P(ω2 | x) = 0.182 ∴ x ∈ω1
最小错误率的讨论
以一维情况为例讨论基于最小错误率的贝叶斯 决策确实对应最小错误率
统计意义上的错误率,即平均错误率,用P(e)表示
∞
∞
∫ ∫ P (e) = P (e, x)dx = P (e | x) p ( x)dx
仅含先验信息的判别规则
⎧ ⎨ ⎩
P(ω1 P(ω1
) )
> <
P(ω2 P(ω2
), ),
ω1 ω2
这种分类决策没有意义
由先验概率所提供的信息太少
采用类条件信息——类条件概率密度函数
p(x|ω1):鲈鱼的属性分布 p(x|ω2) :鲑鱼的属性分布。
基于最小错误率的贝叶斯决策
鲈鱼和鲑鱼判别中的类条件概率密度函数 (以光泽度为例)
假设要研究的分类问题有c个类别,类型空间表示
为:
Ω = {ω1,ω2 ,",ωc}
1
2013-10-22
几个重要概念
• 先验概率: P(ωi ) 未获得观测数据之前类别的分布
( ) • 类条件概率:p x ωi 表示在ωi 类条件下x的概率分布密度 ( ) • 后验概率: P ωi x 在x出现条件下ωi 类出现的概率
(1)P(ωi
|
x)
=
max j =1,2
P(ω
j
|
x)
x ∈ωi
(2)
p(x
|
ωi
)P(ωi
)
=
max j =1, 2
p(x
|
ω
j
)P(ω
j
)
x ∈ωi
(3)l(x) = p(x | ω1) > P(ω2 ) p(x | ω2 ) < P(ω1)
x ∈ ⎧⎨⎩ωω12
似然比形式
(4)h(x)
=
−
ln[l(x)]
类别状态= ω1 类别状态 = ω2
因此,无论何时观测到某一个特定值x,概率误差为:
P(error|x)=P(ω1|x) 判定为ω2 (错误选择ω1); P(error|x)=P(ω2|x) 判定为ω1(错误选择ω2 );
错误概率的最小化判定规则: 如果 P(ω1|x)>P(ω2|x),判定为ω1; 否则,判定为ω2。
10
基于最小错误率的贝叶斯决策
贝叶斯公式
先验概率,后验概率,概率密度函数之间关系
P(ωi | x) =
p(x | ωi )P(ωi )
2
∑ p(x | ω j )P(ω j )
j =1
i = 1, 2
2
∑ 其中,p(x) = p(x | ω j )P(ω j )为一因子 j =1
贝叶斯公式通过类条件概率密度形式的观察值, 将先验概率转化为后验概率。
基于最小错误率的贝叶斯决策
后验概率含义 P (ω1|x):当观测向量为x值时, 是鲈鱼的概率。 P (ω2|x):当观测向量为x值时, 是鲑鱼的概率。
2
2013-10-22
基于后验分布的判别规则:
存在一个观察值x(特征)
如果P(ω1 | x) > P(ω2 | x) 如果P(ω1 | x) < P(ω2 | x)
2
∑ p(x | ω j )P(ω j )
j =1
基于最小错误率的贝叶斯决策规则:
P(ω1 | x) > P(ω2 | x) P(ω1 | x) < P(ω2 | x)
x ∈ω1 x ∈ω2
i = 1, 2
20
4
−∞
−∞
其中,P(e |
x)
=
⎧ ⎨ ⎩
P(ω1 P(ω2
| |
x) x)
当P(ω2 当P(ω1
| x) > | x) >
P(ω1 P(ω2
| x) | x)
17
最小错误率的讨论
∞
∫ P (e) = P (e | x) p ( x)dx −∞
∫ ∫ =
t −∞
P (ω 2
|
x)
p(x)dx
+
∞ t
P (ω1
2013-10-22
第二章 贝叶斯决策理论
引言 贝叶斯决策理论 最小误差率分类 分类器、判别函数及决策面 正态分布密度(The Normal Density) 正态分布的判别函数
上次课的内容
模式识别系统框图
引言
统计决策理论 是模式分类问题的基本理论之一
贝叶斯决策理论 是统计决策理论中的一个基本方法