第三章 线性判别分析非参数判别分类方法第四次课

合集下载

《多元统计分析》第三章 判别分析

《多元统计分析》第三章  判别分析

v (1) 回代法
Ø 令n(2|1)——样本中来自π1而误判为π2的个数,n(1|2)——样本中来自π2
而误判为π1的个数,则P(2|1) 和P(1|2) 可估计为

2
| 1

n
2
| 1
,
Pˆ 1 | 2 n 1 | 2
n1
n2
Ø 该方法简单、直观,且易于计算。但它给出的估计值通常偏低,当样
目标2(描述方面):分离。 就是用图形(通常二维,有时三维或一维,一般 通过降维实现)方法或代数方法描述来自各组的 样品之间的差异性,最大限度地分离各组。
判别分类方法: 距离判别、贝叶斯 (Bayes)判别和 费希尔(Fisher) 判别等。
判别分离方法: 费希尔判别(它 更多地是用于分 离)。
1

x x

1 2
, ,
若d 2 x,1 d 2 x, 2 若d 2 x,1 d 2 x, 2
Σ1=Σ2=Σ时的判别
v省略的 步骤见 书中第 115页。
d 2 x,1 d 2 x,2 x μ1 Σ 1 x μ1 x μ2 Σ 1 x μ2
Ø 令n*(2|1)——样本中来自π1而误判为π2的个数,n*(1|2)——样本中来自
π2而误判为π1的个数,则两个误判概率P(2|1)和P(1|2)的估计量为
Pˆ 2 |1 n* 2 |1 , Pˆ 1 | 2 n* 1 | 2
n1
n2
v 以上所述误判概率的这三种非参数估计方法同样适用于其它的判别方
v μi可估计为
xi

1 ni
ni
xij

第三章 线性与非线性判别函数ppt课件

第三章 线性与非线性判别函数ppt课件

正法
a(k1)a(k)rk(bka(k)Tyk)yk
编辑版pppt
27
MSE方法的例解
MSE 准则
例3.1:已知两类的训练样本:1: (0,0)T; (0,1)T,2: (1,0)T; (1,1)T
,试用最小均方误差算法求解向量 w *
0 0 1
解:训练样本的增广矩阵:
x
0
1
1
1 0 1
1
• 例:设计一个一维分类器,使其功能为:
如 果 xbb或 xxaa
则 决 策 x1 则 决 策 x2
判 别 函 数 : g (x ) (x a ) (x b )
二次函数的一般形式:
g(x)c0c1xc2x2
编辑版pppt
11
广义线性判别函数(2)
引言
二次函数的一般pppt
14
线性分类器设计步骤
引言
线性分类器设计任务:给定样本集K,确定线性 判别函数g(x)=wTx的各项系数w。步骤:
1. 收集一组样本K={x1,x2,…,xN} 2. 按需要确定一准则函数J(K,w),其值反映分类器的性
能,其极值解对应于“最好”决策。 3. 用最优化技术求准则函数J的极值解w*,从而确定判
N /N 1
...
b
N
N
/N 1
/
N
2
...
N
/N
2
N1个
N2个
MSE解等价于Fisher解
编辑版pppt
25
MSE方法与Bayes方法的关系
MSE 准则
当N→∞,b=uN= [1,1, …, 1]T 时,则它以 最小均方误差逼近Bayes判别函数:
g (x ) P (1|x ) P (2|x )

非参数判别分类方法(1)

非参数判别分类方法(1)
进一步化为W显函数的形式:
2020/10/5
中国矿业大学 计算机科学与技术学院
(31)27
~
同样 Si2也可推出与W的关系:
Fisher准则函数为:
2020/10/5
中国矿业大学 计算机科学与技术学院
(31)28
2. 最佳W值的确定
• 最佳W值的确定实际上就是对准则函数求取其取极大值时 的W*
• 设计一拉格朗日函数:
2020/10/5
中国矿业大学 计算机科学与技术学院
(31)25
样本在一维Y空间的一些描述量
(1)各类样本均值
(2)样本类内离散度矩阵与总类内离散度矩阵
2020/10/5
中国矿业大学 计算机科学与技术学院
(31)26
Fisher准则的函数形式
根据Fisher选择投影方向W的原则,使原样本向量在该方向上的 投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要 求,因此,用以评价投影方向W的函数为:
a0 c0
a
a1
c1
i 1
a2 c2
• g(x)为广义线性判别函数,a称为广义权向量。
2020/10/5
中国矿业大学 计算机科学与技术学院
(31)16
写成另一种形式
d
d
g(x) w0 wi xi ai yi aTY
i 1
i 1
其中
1
Y
x1
x2
1
X
xd
2020/10/5
中国矿业大学 计算机科学与技术学院
(31)23
对线性方程的理解:二维空间中一条直线的任何一点到空 间某一单位向量的投影值相同,换句话说,该直线是到这 个向量投影值相同的点的集合。

第三章线性判别分析非参数判别分类方法-第二次课

第三章线性判别分析非参数判别分类方法-第二次课

第3章 线性判别分析
(2) r g(x) w
g(x)是x到超平面距离的一种代数距离。
当x=0时, g(x)=w0,
若w0>0, 则原点在超平面的正侧; 若w0<0, 则原点在超平面的负侧; 若w0=0, 则超平面通过原点。
r0
w0 w
第3章 线性判别分析
结论: 对于两类情形, 利用线性函数进行分类, 实质上 就是用一个超平面H把Rd分成两个决策区域; H的方向由权向量w确定, 它的位置由阈值权w0 确定; 判别函数g(x)正比于x点到H的代数距离; 当x在H的正侧时, g(x)>0; 在负侧时, g(x)<0。
Cm2
1 2
m(m
1)
第3章 线性判别分析
Hij的方程为
gij (x) wTij x w0ij
g ji (x) gij (x)
其中, i<j, i, j=1, 2, …, m。
gij(x)判决准则为:
gij
(x)
0 0
x i (i, j 1, 2, , m) xj
对于3类问题, 可用3个超平面: g12(x)=0, g13(x)=0和g23(x)=0 把ω1、 ω2、 ω3
g(x) w0 wi xi vT y
i 1
第3章 线性判别分析
3.1.3
g(x) wT x w0
➢设计线性分类器, 是指所用的判别函数、分界面方程的类型 已选定为线性类型, 主要的设计任务是确定线性方程的两个参 数, 一个是权向量w, 另一个是阈值w0。 ➢使所设计的线性分类器在性能上要满足一定的要求, 这种要 求通过一种准则来体现, 并且要表示成一种准则函数, 以便能 通过将准则函数值优化的方法确定w和w0。

线性判别分析(LinearDiscriminantAnalysis,LDA)

线性判别分析(LinearDiscriminantAnalysis,LDA)

线性判别分析(LinearDiscriminantAnalysis,LDA)⼀、LDA的基本思想线性判别式分析(Linear Discriminant Analysis, LDA),也叫做Fisher线性判别(Fisher Linear Discriminant ,FLD),是模式识别的经典算法,它是在1996年由Belhumeur引⼊模式识别和⼈⼯智能领域的。

线性鉴别分析的基本思想是将⾼维的模式样本投影到最佳鉴别⽮量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的⼦空间有最⼤的类间距离和最⼩的类内距离,即模式在该空间中有最佳的可分离性。

如下图所⽰,根据肤⾊和⿐⼦⾼低将⼈分为⽩⼈和⿊⼈,样本中⽩⼈的⿐⼦⾼低和⽪肤颜⾊主要集中A组区域,⿊⼈的⿐⼦⾼低和⽪肤颜⾊主要集中在B组区域,很显然A组合B组在空间上明显分离的,将A组和B组上的点都投影到直线L上,分别落在直线L的不同区域,这样就线性的将⿊⼈和⽩⼈分开了。

⼀旦有未知样本需要区分,只需将⽪肤颜⾊和⿐⼦⾼低代⼊直线L的⽅程,即可判断出未知样本的所属的分类。

因此,LDA的关键步骤是选择合适的投影⽅向,即建⽴合适的线性判别函数(⾮线性不是本⽂的重点)。

⼆、LDA的计算过程1、代数表⽰的计算过程设已知两个总体A和B,在A、B两总体分别提出m个特征,然后从A、B两总体中分别抽取出、个样本,得到A、B两总体的样本数据如下:和假设存在这样的线性函数(投影平⾯),可以将A、B两类样本投影到该平⾯上,使得A、B两样本在该直线上的投影满⾜以下两点:(1)两类样本的中⼼距离最远;(2)同⼀样本内的所有投影距离最近。

我们将该线性函数表达如下:将A总体的第个样本点投影到平⾯上得到投影点,即A总体的样本在平⾯投影的重⼼为其中同理可以得到B在平⾯上的投影点以及B总体样本在平⾯投影的重⼼为其中按照Fisher的思想,不同总体A、B的投影点应尽量分开,⽤数学表达式表⽰为,⽽同⼀总体的投影点的距离应尽可能的⼩,⽤数学表达式表⽰为,,合并得到求从⽽使得得到最⼤值,分别对进⾏求导即可,详细步骤不表。

第三章 线性与非线性判别函数

第三章 线性与非线性判别函数
T T
wT (11)x21 = (− 2 0 1)(− 1 0 − 1) = 1 > 0 ∴ w(12 ) = w(11) = (− 2 0 1)
T T T
w (12)x22 = (− 2 0 1)(− 1 − 1 − 1) = 1 > 0 ∴ w(13) = w(12 ) = (− 2 0 1)
T
权向量有修正,需进行第四轮迭代
感知器准则函数
例3.2解答(续)
wT (13)x11 = (− 2 0 1)(0 0 1) = 1 > 0 第四轮迭代:
T
∴ w(14 ) = w(13) = (− 2 0 1)
T
T T
w (14 )x12 = (− 2 0 1)(0 1 1) = 1 > 0 ∴ w(15) = w(14 ) = (− 2 0 1)
例3.1
有两类样本
ω1 : (0 0 0 ) , (1 0 1) , (1 0 0) , (1 1 0)
T T T
ω2
{ ( : {0
0 1) , (0 1 1) , (0 1 0 ) , (1 1
T T T
} 1) }
T T
试用Fisher准则降维分类。
Fisher线性判别
例3.1解答
由于原始样本为3维,采用Fisher准则降到 − ω * = sω1 (m1 − m2 ) 一维,知:投影方向为 时,投影后的一维样本最易分类。所以, 先求 ω * ,再投影分类。
Fisher线性判别
例3.1解答(续)
(2)求 yk = w*T xk y11 = (1 − 1 − 1)(0 0 0 ) = 0
T
y12 = (1 − 1 − 1)(1 0 1) = 0

非参数判别分类方法

非参数判别分类方法

2014-5-16
六、感知准则函数方法
这种方法提倡用错分类提供的信息修正错误,这种 思想对机器学习的发展以及人工神经元网络的发生 发展产生深远影响。
七、近邻法
近邻法训练样本数量较多时,从逐渐错误率角度看, 其错误率比较小,是经常使用的模式识别分类方法, 比较适合在多类别情况下使用。当每类的样本数很 多时,存储量与计算量要求都偏高,使用剪辑近邻 法与压缩近邻法,特别是压缩近邻法可大量减少训 练样本的数量。
支持向量机利用特征映射的思想
W * ai* yi xi
* 其中, ai , i 1,2,...,n
(3-104)
i
是以下式子求极大值的解 1 (3-105) LD ai ai a j yi y j xi .x j
i
计算上式的极大值只用到训练样本数据间的点积 <xi.xj>,而使用的分类器判别函数中权向量的作用也 是通过权向量与样本的点积体现出来的,而从(3104)式子中可以看出,权向量是训练样本中的支持 向量的线性组合,因此WTX 值的计算可以写成
核函数型式的函数 k ( x, xi ) exp(
| x xi |2

2
)
(3-112)
(3-113)
S行函数,如
k ( x, xi ) tanh( v xi x c)
2014-5-16
本章小结
一、参数判别分类方法与非参数判别分类方法的区别
参数判别方法:它的提前是对特征空间中的各类样 本的分布清楚,因此一旦要测试分类样本的特征向量值X 已知,就可以确定X对各类的后验概率,也就是可按相应 的准则计算与分类,所以判别函数等的确定取决于样本 统计分布的有关知识。

03第三章非参数判别分类方法31-32 共33页

03第三章非参数判别分类方法31-32 共33页
广义线性判别函数
• 基本思想:g(X)不再是x的线性函数,而是一个二次函数, 此时通过选择一种映射X→Y,即将原样本特征向量X映射成 另一向量Y,从而把二次函数转换成线性函数。
g(x)(xa)x (b)
g(x)c0c1xc2x2
10.07.2019
中国矿业大学 计算机科学与技术学院
(31)15
g(x)W*TXw0 *
g(x)a*TY
10.07.2019
中国矿业大学 计算机科学与技术学院
(31)21
第三章 非参数判别分类方法
3.2 Fisher线性判别
Fisher线性判别函数是研究线性判别函数中最有影响的方 法之一。对线性判别函数的研究就是从R.A.Fisher在1936 年发表的论文开始的。
• 用近邻法进行分类。
• 通过相应数学工具的运用进一步提高运用数学的本领。
10.07.2019
中国矿业大学 计算机科学与技术学院
(31)4
第三章 非参数判别分类方法
本章重点
1、非参数判别分类器的基本原理,与参数判别分类方法的 比较。
2、线性分类器的三种典型方法——以Fisher准则为代表的 传统模式识别方法,以感知准则函数为代表的机器自学 习方法,以及支持向量机代表的统计学习理论。
Y


x1


x2


1

X

x d
w0
a


w
1


w
2


w0

W

w d
Y为增广样本向量,a为增广权向量。
10.07.2019

第3章非参数判别分类方法

第3章非参数判别分类方法

进一步化为W的显函数
分子
分母
分母:
3.3.2 最佳W值的确定
最佳W值的确定: 求取使JF达极大值时的 w* 设计一拉格朗日函数
对向量的求导(或偏导)的定义是
由于Sw非奇异,两边乘以Sw-1得
最佳法线向量
使Fisher准则函数JF达极大值的解,也就是按 Fisher准则将d维X空间投影到一维Y空间的最 佳投影方向。
使用什么典型的分类决策方法 利用训练样本集提供的信息确定这些函数中 的参数。
§3.2 线性分类器
3.2.1 线性判别函数的基本概念 两类别问题中线性判别函数的一般形式
ω0是一个常数,称 为阈值权
决策规则
g(X)=0就是相应的决策面方程,在线性判别 函数条件下它对应d维空间的一个超平面
a 2
共梯度法求解 1 sgn( yi a ) 2、jq 2 , 2 i 1
N
1 yi a 0 sgn( yi a ) 1 yi a 0
J q 2 ( a* ) max J q 2 ( a )
a
搜索法求解
最小平方误差准则
不等式组写为: aTyn=bn>0 方程组:Ya=b
线性可分性
设已知样本集{y1,y2,…,yN}, yn是d维增广样 本向量。分属于ω 1 和ω 2类。 若存在权向量a,使任何y∈ω 1 ,都有:aTy>0 y∈ω 2 ,都有:aTy<0 则称这组样本集线性可分。
或:若样本集是线性可分的,则必存在一个 权向量a,可使每个样本正确分类。
学习目的
掌握非参数判别分类法的原理 掌握机器自学习的原理。 学习线性分类器的几种典型算法 用近邻法进行分类 通过相应数学工具的运用进一步提高运用数 学的本领

模式识别-线性判别函数

模式识别-线性判别函数
y
y 21

Y

... ...
T
y N yN 1
T
1
T
1
y12
...
y22
...
...
...
yN 2
...
y1dˆ

y2 dˆ

...

y Ndˆ
最小平方误差准则函数
引入余量(目标向量) b=[b1, b2, …, bN] T, bi任
Fisher线性判别分析
Fisher线性判别分析
Fisher线性判别分析
至此,我们还没有解决分类问题,只是将d
维映射到1维,将d维分类问题转划为1维
分类问题,如何分类?
确定阈值
Fisher线性判别分析
感知准则函数
Perceptron
感知准则函数是五十年代由Rosenblatt提出
模式识别
第四章 线性判别函数
内容
引言
线性判别函数的基本概念
Fisher线性判别函数
感知准则函数
最小平方误差准则函数
多类问题
引言
第三章主要讲了类条件概率密度函数的估计
参数估计方法
最大似然估计
贝叶斯估计
非参数估计方法
训练样本集
样本分布的
统计特征:
概率密度函数
最小平方误差准则函数
MSE方法的迭代解
单样本修正调整权向量
Widrow-Hoff算法/最小均方根算法/LMS算法
+ = + ( − () )
其中 是使得() ≠ 的样本
最小平方误差准则函数

03第三章非参数判别分类方法36精品PPT课件

03第三章非参数判别分类方法36精品PPT课件
08.10.2020
中国矿业大学 计算机科学与技术学院
(39)13
第三章 非参数判别分类方法
将(3.6-7)与(3.6-6)相比较,
(3.6-6)相当于(3.6-7)中k
=1的情况,而在(3.6-7)
中当k增大时PkN→∞(e|X) 是单调递减的。因此可
以得出结论,在N→∞的
条件下,k-近邻法的错
中国矿业大学 计算机科学与技术学院
(39)6
第三章 非参数判别分类方法
最近邻法错误率分析
• 如果所用训练样本集的样本数量N极大,即N→∞时,可以 想像X'将趋向于X,或者说处于以X为中心的极小邻域内, 此时分析错误率问题就简化为在X样本条件下X与一个X(X' 的极限条件)分属不同类别的问题。如果样本X的两类别后验 概率分别为P(ω1|X)与P(ω2|X),那么对X值,在N→∞条件下, 发生错误决策的概率为:
第三章 非参数判别分类方法
重点
• 弄清楚近邻法的定义(包括k近邻法),与基本做法
• 弄清“近邻法性能好”是在什么意义上讲的。知 道渐进平均错误率的定义
• 快速搜索方法是使用怎样的原理?
• 剪辑近邻法的原理是什么? 而压缩近邻法与剪辑近邻 法有什么不同之处?
08.10.2020
中国矿业大学 计算机科学与技术学院
(39)2
第三章 非参数判别分类方法
3.6.1 近邻法原理及其决策规则
近邻法是由Cover和Hart于1968年提出的,随后得到理 论上深入的分析与研究,是非参数法中最重要的方法之 一。这一节将讨论其基本原理,错误率分析及若干改进 方法。
08.10.2020
中国矿业大学 计算机科学与技术学院
(39)3

2-模式识别原理课件-第3章--判别函数及几何分类法

2-模式识别原理课件-第3章--判别函数及几何分类法
0
0
0
23
13
12
ï
þ
ï
ý
ü
<
>
<
d
d
d
5
5
3
0
分类时:每分离出一类,需要与I 有关的M-1个判决函数;要分开M类模式,共需M(M-1)/2个判决函数。对三类问题需要3(3-1)/2=3个判决函数。即:每次从M类中取出两类的组合:
例3.4 已知dij(X)的位 置和正负侧,分析三 类模式的分布区域 。
此法将 M 个多类问题分成M个两类问题,识别每一类均 需M个判别函数。识别出所有的M类仍是这M个函数。
例3.1 设有一个三类问题,其判别式为:
现有一模式,X=[7,5]T,试判定应属于哪类?并画出三类模式的分布区域。
解:将X=[7,5]T代入上三式,有:
三个判别界面分别为:
图示如下:
当ωi /ωj两分法中的判别函数dij(X) ,可以分解为
时,那么di(X) >dj(X)就相当于多类情况2中的dij(X) >0。
两分法特例
(3)多类情况3:
因此对具有判别函数
的M类情况,判别函数性质为:
或:
识别分类时:
判别界面需 要做差值。对ωi 类,应满足: di>其他所有d
例3.3 一个三类问题,三个判决函数为:
问模式
属于哪类?
解:计算得
可写成:
(4,3)
x2
x1
d23(X)=0
d12(X)=0
d13(X)=0
5
5
3
0
1
w
2
w
2
x
1
x
-
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
gin ( x) g k j ( x)
其中, n∈{1, 2, …, li}, k∈{1, 2, …, lj}, li和lj分别表示 第i类和第j类的子类数目。
第3章
线性判别分析
3.3.2 分段线性距离分类器
正态分布条件下,两类别问题在各特征统计独立、同方差、 且先验概率相等情况下,最小错误率决策可按最小距离决策, 最小距离分类器的判决函数为
第3章
线性判别分析
第三章 线性判别分析 —— 非参数判别分类方法
第3章
线性判别分析
本章内容
3.1 3.2 3.3 线性判别函数 线性分类器
感知准则函数
Fisher线性判决
分段线性分类器
3.4
总结
近邻分类器
习题
第3章
线性判别分析
3.2 线 性 分 类 器
3.2.2

Fisher
Fisher 线性判决的基本思想
第3章
(i 1, 2,
, N)
引入余量bi, 用超平面:
z v bi 0
T i
( i 1, 2,
b1 b b 2 bN
, N)
代替zTiv>0, 则引入余量后的解区在原解区之内。 将上式写 成矩阵形式即为
Z v b
T z1 T z2 Z T zN
, N)
v*能将所有样本正确分类。 若v*不能使某个样本zj正确分类, 即(v*)Tzj≠bj, 则e2j=(vTzj- bj)2。 错分样本的结果是使Js(v)增大, 因此, Js(v)越小越好, 其 最小值0为理想分类结果, 实现所有样本的正确分类。 求使Js(v)最小的v*有两种方法: 梯度下降法和解析法。
己பைடு நூலகம்识事物本领的过程,随意确定判别函数初始值,该
值在对样本分类训练过程中逐步修正直至最终确定。

基本思想:寻找一个权向量,使规范化增广样本向量
集的错分类样本数最少。
第3章
线性判别分析
一、基本概念
1.线性可分性
已知来自ω1和ω2两类的样本集{x1, x2, …, xN}, 两类的
线性
g ( yi ) vT yi

1 x 1 < > x 2 x 2 1 2 2 < x 1 x 2 > 0 x 2
2 2
这时类间的决策面为
x - 1 x - 2
2
2
它是两类均值点连线的垂直平分面。
第3章
线性判别分析
最小距离分类器
两类物体在特征空间的分布
b (1,1, ,1)T
第3章
线性判别分析
3.3 分段线性分类器
线性分类器的分界面是一个超平面。当类与类之间 不能用任何一个超平面实现划分时, 类间的分界面应是
一个超曲面。曲线可以由多个线段近似表达, 曲面可以
由多个平面逼近, 因此, 可以用多个超平面近似表达超
曲面, 分段线性分类器正是基于这种思路而设计的一种
– 设计分段线性分类器的前提条件是有一组已知类别的 样本集, 其关键在于解决以下两个问题:
(1) 根据样本集确定子类数目及各子类的划分;
(2) 利用样本集计算各子类判别函数的权向量和阈值权。 根据已知条件的不同, 可以分别采取不同的方法。 (1)子类数目及各子类划分已知; (2)子类数目已知, 各子类划分不知; (3)子类数目未知。
l 1,2, ,li
称这种分类器为分段线性距离分类器。
第3章
线性判别分析
注意: 线性距离分类器使用的是马氏距离, 分段
线性距离分类器使用的则是欧几里德距离, 由最小距
离分类器的导出过程可知, 仅当所有子区的协方差阵 相同且等于σ2I时, 才具有较好的分类效果。
第3章
线性判别分析
3.3.3 分段线性分类器设计的一般考虑
正侧的向量满足vTzi>0。
第3章
线性判别分析
相应地, N个样本确定了N个超平面, 每个超平面把 权空间分为两个半空间。所以, 满足vTzi>0(i=1, 2, …, N)的
权向量必在这N个超平面正侧的交叠区, 称这一交叠区为
解区, 解区中的任意向量都是解向量v*。
第3章
线性判别分析
二、感知准则函数
第3章
线性判别分析
设Z={z1, z2, …, zN}是经过规范化的一组样本集,
T ( v z)
定义感知准则函数:
J p (v)
zZ k
其中, Zk是被权向量v错分类的样本集合, 当z∈Zk时,
vT z 0
显然, Jp(v)≥0。 梯度下降算法求Jp(v)准则函数的极小值。 迭代公式为
1 第二步:计算最优投影方向, w* S w (μ1 μ2 )
并将样本往该方向上投影
y (w * ) T x
第三步:决策。在投影空间内的决策准则为: 若y>y0, 则 x∈ω1, 否则x∈ω2。
第3章
线性判别分析
3.2.3 感知准则函数
采用类似于人认知错误、纠正错误、通过自学习改善自
Z T Zv* Z T b
(3-79)
ZTZ为(d+1)×(d+1)方阵, 一般是满秩的, 因此有唯一解: (3-80) v* (Z T Z )1 Z T b Z b 其中 T -1 T Z (Z Z ) Z (3-81) 是Z的左逆矩阵, Z的右逆矩阵定义为 (3-82) Z Z (Z T Z )1 b
是寻找一个最好的投影方向 ,
当特征向量x从d维空间映射到
这个方向上时 , 两类能最好地 分开。

这个方法实际上涉及特征维
数的压缩问题。
第3章
线性判别分析
分析 w1 方向之所以比 w2 方向优 越, 可以归纳出这样一个准则:即向 量 w 的方向选择应能使两类样本投 影的均值之差尽可能大些, 而使类内 样本的离散程度尽可能小。这就是 Fisher准则函数的基本思路。
yi为增广样本向量, v为增广权向量。 线性可分:如果存在一个线性分类器能把每个样本正确分类, 即若存在一个权向量v, 使得对于任何yi∈ω1, 都有vTyi>0, 而对 于任何yi∈ω2, 都有vTyi<0, 则称这组样本集线性可分; 否则称 为线性不可分。 反过来, 若样本集是线性可分的, 则必然存在一个权向量v, 能将每个样本正确地分类。
第3章
线性判别分析
1. 梯度下降法
对Js(v)
J s (v) 2Z T (Zv b)
相应地,梯度下降算法为
v(k 1) v(k ) k Z T (Zv(k ) b)
(3-78)
其中,ρk为学习速率; 初值v(0)可任意选取。
第3章
线性判别分析
2. 解析法 解析法得到的是伪逆解。 令Js(v)=0
分类器。
第3章
线性判别分析
3.3.1 分段线性分类器的定义



线性判决函数只能解决线 性可分问题。 在线性不可分的情况下, 可以采用分段线性判别或 二次函数判别等方法。 分段线性判决函数确定的 决策面是由若干段超平面 组成的。
第3章
线性判别分析
与线性判别函数相比,分段线性判别函数设计中首先 要解决的问题是分段线性判别函数的分段段数问题。
上发展起来的多层感知器在原理上能解决非线性分类、多
类划分,以及非线性拟和非线性映射等多种问题。
第3章
线性判别分析
3.2.4 最小平方误差准则函数
设由X={x1, x2, …, xN}得到的规范化增广向量集合为 {z1, z2, …, zN}, 分类器设计的任务就在于寻找一个矢量v, 满足:
vT zi 0
第3章
线性判别分析
把属于类ωi的样本区域Ri分为li个两两不相交的子区, 对每
个子类定义一个线性判决函数:
l gil ( x) (wil )T x w0 i
(l 1, 2,
i
, li i 1, 2,
, m)
l g ( x ) max g , m) 定义类ωi的判别函数: i i ( x) (i 1, 2, l 1,2, ,l
第3章
线性判别分析
e Z v b
定义误差向量:
定义平方误差准则函数:
J s (v) e (v zi bi )
2 T i 1
N
2
Js(v)是一个非负函数, 当 Z v b 有解时, Js(v)达到最小值0, 此时的矢量v*满足:
(v* )T zi bi 0
(i 1, 2,
分段段数过少,其分类效果必然要差;但段数又要尽
可能少,以免分类判别函数过于复杂,增加分类决策 的计算量。
在有些实际的分类问题中,同一类样本可以用若干个
子类来描述,这些子类的数目就可作为确定分段段数 的依据。
在有些情况下样本分布及合适子类划分并不知道,往
往需要采用一种聚类的方法,设法将样本划分成相对 密集的子类,然后用各种方法设计各段判别函数。
感知准则函数方法利用错分类对现决策权向量进行修正直至收 敛。这种方法只对线性可分情况适用,并且只适用于两类判决。
感知准则函数方法的思路是:先随意找一个初始向量 v,写作 v(0),然后用训练样本集中的每个样本来计算。一旦发现有的 zi,使vTzi<0,则说明当前的广义权向量 v(0)不适合还需要进一 步修正。
gi ( x) ,则x∈ωj 若 g j ( x) max i
称gi(x)(i=1, 2, …, m)为分段线性判决函数, 相应的分类器称为 分段线性分类器。
第3章
线性判别分析
当类由多个子类构成时, 其决策面方程是由各子 类的判决函数确定的, 若第i类的第n个子类和第j类的 第k个子类相邻, 则该段决策面方程为
相关文档
最新文档