模式识别-第7讲-非线性判别函数

合集下载

模式识别-线性判别函数

模式识别-线性判别函数
j
线性判别函数可写为: g(Y) A' Y 判别面 A' Y 0 的超平面 根据判别函数的性质 对于二类问题有 : , 若g(Y) A' Y 0, 则 Y 1类 若g(Y) A' Y 0, 则 Y 2类
2013-8-9 37
现对2类样本进行归一化处理 即令所有2类样本 , Y -Y 则二类分类问题变为: 由N各学习样本,找到权矢量A,使得 对所有的学习样本有: A' Yi 0, i 1,..., N 满足上述条件的向量 称为解向量 A 可见每个学习样本都对 解向量进行了限制 解向量是不唯一的 , 显然,若存在解向量A使得二类样本分类正确 则样本 , 是线性可分的
w0 r0 w
多类问题(情况一)



每一类模式可以用一个超平面与其它 类别分开; 这种情况可以把c个类别的多类问题分 解为c个两类问题解决,需要c个线性 分类界面; 第i类与其它类别之间的判别函数:
gi x a x
t i
(1)二分法
x2

IR 1

1
IR 2
2
IR 4
结论:无不确定区间
例:假设判别函数为:
d1 ( x ) x1 x2 问 x (1,1) 属 d 2 ( x ) x1 x2 1 于哪一类。 d ( x ) x 2 3 解: d1 ( x ) x1 x2 d 2 ( x ) x1 x2 1 d ( x ) x 2 3

Fisher线性判别
当考虑先验概率时: S w P(1 ) S1 P( 2 ) S 2 S B P(1 ) P( 2 )(m1 m2 )(m1 m2 )' P( 2 ) N 2 / N N1m1 N 2 m2 N1w' m1 N 2 w' m2 取阈值:yt N1 N 2 N1 N 2 N1m1 N 2 m2 w' w' m N1 N 2 P(1 ) N1 / N ,

模式识别原理课件第章判别函数及几何分类法

模式识别原理课件第章判别函数及几何分类法
di(X )W iTX , i1 , ,M
的M类情况,判别函数性质为:
d i ( X ) d j X , j i ; i , j 1 , 2 , , M ,若 X i
或: d i ( X ) m d k X , a k 1 , x , M ,若 X i
d (X ) - d X 0
区域 。
x
d
(X ) - d
X
0
2
1
3
-
1
d (X ) - d
X
0
1
2
-
3
2
x
1 O
-
d
(X ) - d
X
0
2
3
3. 小结
(1) 明确概念:线性可分。 一旦线性判别函数的系数Wk被确定以后,这些函数就可以
作为形式分类的根底。
(2) i i 与 分法i的 比较j :
i i 对于M类模式的分类, 两分法共需要M个判别函数,但
判别函数性质:
d i X j 0 , j i ; i , j 1 , 2 , , M ,若 X i
识别分类时:
在 M 类模式中,与i 有关的M-1个判决函数全为正时,X∈ωi。其中若有一个为负, 则为IR区。
如:对一个三类问题,如果
, d12(X)0
则 X 类,而1
d 在判别23类( X模式)时不起作用。 1
两分法 ii
i
j 两分法
两分法特例 ij
(1)多类情况1:
两分法 ii
用线性判别函数将属于ωi类的形式与其余不属于ωi类的 形式分开。
d i(X ) W iT X 0 0 ,,
若 X i 若 X i
i 1 , , M

模式识别-第7讲-非线性判别函数

模式识别-第7讲-非线性判别函数

g 2 ( x) g3 ( x) 0 g 3 ( x) g 2 ( x) 3 g 3 ( x ) g1 ( x ) g1 ( x) g 2 ( x) 0


结论:不确定区间没有了,所以这种是最好情况。
3。第三种情况(续)

问假设未知模式x= (x1,x2)T= (1,1)T ,则x属于那一类。 把它代入判别函数:g1 ( x), g2 ( x), g3 ( x). 得判别函数为:g1 ( x) 0, g2 ( x) 1, g3 ( x) 1 因为 g2 ( x) g3 ( x), g2 ( x) g1 ( x) 所以模式x= (1,1)T属于 2 类。
串课通知:
下周五的课,串至周三下午5、6节 地点:研究生1101阶
模式识别
授课教师 薛耀红 xueyh@
第7讲 非线性判别函数
本节课主要内容
1 多类情况下的线性判别函数 2 分段线性判别函数 3 二次判别函数

判别函数

假设对一模式X已抽取n个特征,表示为:
X ( x1 , x2 , x3 ,..., xn )T X 是n维空间的一个向量
则判别边界为:
1
g1 ( x) g3 ( x)
2
3
g2 ( x) g3 ( x)
g1 ( x) g 2 ( x) 2 x1 1 0 g1 ( x) g 3 ( x) x1 2 x2 0 g ( x) g ( x) x 2 x 1 0 3 1 2 2
2
gij ( x) g ji ( x)
g 21 0, g 23 0
判别区
3
1判别区

模式识别 张学工

模式识别 张学工

x j Y i
y
j
j
, i 1,2
~ S i2
x j Y i
(y
~ ) 2 , i 1,2 m i
~ ~2 ~ 2 S w S1 S 2 ~ ~ m ~ )2 S b2 (m 1 2
Fisher 准则函数(Fisher’s Criterion):
~ m ~ )2 (m 2 max J F ( w) ~12 ~ S1 S 22
T

* (Y T Y ) 1 Y T b Y b
Y (Y T Y ) 1 Y T
:伪逆
T ˆd ˆ 方阵,一般非奇异) (Y Y 是 d
Xuegong Zhang, Tsinghua University
18
张学工《模式识别》教学课件
几个关系: 1. 若 b 取为
*
N / N 1 , if y i 1 bi , N / N 2 , if y i 2
类间离散度矩阵 between-class scatter
Xuegong Zhang, Tsinghua University
S b ( m1 m 2 )( m1 m 2 ) T
6
张学工《模式识别》教学课件
在 Y 空间(一维投影) :
类均值 类内离散度 总类内离散度 类间离散度
~ 1 m i Ni
T 如果样本 y k 被错分,则有 yk 0 ,因此可定义如下的感知准则函数:
J P ( )
y j Y

( T y j )
k
其中 Y k 是被 错分样本的集合。
Xuegong Zhang, Tsinghua University

模式识别课后习题答案

模式识别课后习题答案
• 2.10 随机变量l(x)定义为l(x) = p(x|w1) ,l(x)又称为似然比,试证明 p(x|w2)
– (1) E{ln(x)|w1} = E{ln+1(x)|w2} – (2) E{l(x)|w2} = 1 – (3) E{l(x)|w1} − E2{l(x)|w2} = var{l(x)|w2}(教材中题目有问题) 证∫ 明ln+:1p对(x于|w(12)),dxE={ln∫(x()∫p(|wp(x(1x|}w|w=1)2))∫n)+nl1nd(xx)所p(x以|w∫,1)Ed{xln=(x∫)|w(1p(}p(x(=x|w|Ew1)2{))ln)n+n+11d(xx)又|wE2}{ln+1(x)|w2} = 对于(2),E{l(x)|w2} = l(x)p(x|w2)dx = p(x|w1)dx = 1
对于(3),E{l(x)|w1} − E2{l(x)|w2} = E{l2(x)|w2} − E2{l(x)|w2} = var{l(x)|w2}
• 2.11 xj(j = 1, 2, ..., n)为n个独立随机变量,有E[xj|wi] = ijη,var[xj|wi] = i2j2σ2,计 算在λ11 = λ22 = 0 及λ12 = λ21 = 1的情况下,由贝叶斯决策引起的错误率。(中心极限 定理)
R2
R1
容易得到


p(x|w2)dx = p(x|w1)dx
R1
R2
所以此时最小最大决策面使得P1(e) = P2(e)
• 2.8 对于同一个决策规则判别函数可定义成不同形式,从而有不同的决策面方程,指出 决策区域是不变的。
3
模式识别(第二版)习题解答

模式识别——非线性分类器

模式识别——非线性分类器

模式识别——非线性分类器非线性分类器是指一种能够处理非线性问题的模式识别算法。

在现实世界中,很多问题都是非线性的,比如图像分类、语音识别等。

传统的线性分类器,比如逻辑回归和支持向量机,在处理非线性问题时表现不佳,因此非线性分类器的出现对于模式识别领域具有重要意义。

非线性分类器主要有以下几种类型:核函数方法、神经网络方法和深度学习方法。

首先,核函数方法是一种常见的非线性分类器方法。

核函数方法的核心思想是通过对训练样本进行非线性映射,将其映射到一个高维特征空间中,在高维空间中采用线性分类器进行分类。

常见的核函数包括多项式核函数、高斯核函数等。

核函数方法有很好的分类性能,并且计算效率较高,因此在实际应用中被广泛采用。

其次,神经网络方法也是一种常用的非线性分类器。

神经网络模拟了生物神经系统的结构和功能,能够处理复杂的非线性问题。

神经网络由多个神经元组成,每个神经元接收来自前一层的输入,并将其加权求和后经过激活函数输出。

神经网络具有较强的学习能力和适应性,可以自动提取数据的特征表示,因此在图像、语音等领域取得了很好的效果。

最后,深度学习方法是当前非线性分类器的研究热点。

深度学习模型具有多个隐藏层、大量参数和复杂的结构,能够处理非常复杂的非线性问题。

深度学习模型如卷积神经网络、循环神经网络等在图像、语音和自然语言处理等领域已经取得了很大的突破。

深度学习模型的主要优点是能够自动学习特征表示,并且可以通过增加网络深度提高模型的表达能力。

为了克服这些挑战,可以采取以下方法。

首先,结合核函数方法和神经网络方法,可以提高分类器的性能和泛化能力。

其次,利用迁移学习和半监督学习等方法,可以减少标注样本的需求,提高分类器的效率。

此外,引入集成学习和混合模型等技术,可以进一步提高分类器的性能和鲁棒性。

总之,非线性分类器在模式识别领域具有重要意义。

核函数方法、神经网络方法和深度学习方法是常见的非线性分类器方式。

未来的研究方向包括提高分类器的性能和泛化能力,降低模型复杂度,减少标注样本的需求等。

模式识别-线性判别函数

模式识别-线性判别函数
y
y 21

Y

... ...
T
y N yN 1
T
1
T
1
y12
...
y22
...
...
...
yN 2
...
y1dˆ

y2 dˆ

...

y Ndˆ
最小平方误差准则函数
引入余量(目标向量) b=[b1, b2, …, bN] T, bi任
Fisher线性判别分析
Fisher线性判别分析
Fisher线性判别分析
至此,我们还没有解决分类问题,只是将d
维映射到1维,将d维分类问题转划为1维
分类问题,如何分类?
确定阈值
Fisher线性判别分析
感知准则函数
Perceptron
感知准则函数是五十年代由Rosenblatt提出
模式识别
第四章 线性判别函数
内容
引言
线性判别函数的基本概念
Fisher线性判别函数
感知准则函数
最小平方误差准则函数
多类问题
引言
第三章主要讲了类条件概率密度函数的估计
参数估计方法
最大似然估计
贝叶斯估计
非参数估计方法
训练样本集
样本分布的
统计特征:
概率密度函数
最小平方误差准则函数
MSE方法的迭代解
单样本修正调整权向量
Widrow-Hoff算法/最小均方根算法/LMS算法
+ = + ( − () )
其中 是使得() ≠ 的样本
最小平方误差准则函数

模式识别-判别函数

模式识别-判别函数
或:
di (X ) maxdk X , k 1,, M , 若X i
x2
d1(X) - d2 X 0
+-
识别分类时:
1
d1 d2 d1 d3
d2 d1 d2 d3
d1(X) - d3X 0
+ -
判别界面需
2
要做差值。对ωi
类,应满足:
x1
+
1
CM2

M M -1
2!
例 已知dij(X)的位 置和正负侧,分析三 类模式的分布区域 。
2
O
+
- d12 ( X ) 0 x1
例 一个三类问题,三个判决函数为:
d12 ( X ) -x1 - x2 + 5 d13( X ) -x1 + 3 d23( X ) -x1 + x2 问模式 X [4,3]T 属于哪类?
di>其他所有d
0
d3 d1
3
d3 d2
+ -
d2 (X) - d3X 0
例 一个三类模式(M=3)分类器,其判决函数为:
d1( X ) -x1 + x2 d2 ( X ) x1 + x2 -1 d3( X ) -x2 试判断X0=[1,1]T属于哪一类,且分别给出三类的判决界面。
- x2 +1 0
x2
4
d1(X ) -x1 + x2 +1
d2 (X ) x1 + x2 - 4
d3(X ) -x2 +1
+
d1 ( X )
-

0
(7, 5)

(模式识别)Fisher线性判别

(模式识别)Fisher线性判别

Fisher 判别
各类样本均值
1
mi Ni yi y, i 1, 2
样本类内离散度和总类内离散度
Si ( y mi )2, i 1,2 yi
样本类间离散度
Sw S1 S2 Sb (m1 m2 )2
以上定义描述d维空间样本点到一向量投影的分 散情况,因此也就是对某向量w的投影在w上的 分布。样本离散度的定义与随机变量方差相类似
Sw1(m1 m2 )R
w*
R
Sw1(m1
m2 )
Sw1(m1 m2 )
10
8
判别函数的确定
Fisher 判别
前面讨论了使Fisher准则函数极大的d维向 量w*的计算方法,判别函数中的另一项w0 (阈值)可采用以下几种方法确定:
w0
m1
2
m2
w0
N1m1 N2m2 N1 N2
m
w0
m1
m2 2
lnP(1) / P( 1 y wT x w0 0 x 2
Fisher线性判别
线性判别函数y=g(x)=wTx:
• 样本向量x各分量的线性加权 • 样本向量x与权向量w的向量点积 • 如果|| w ||=1,则视作向量x在向量w上的投

Fisher准则的基本原理:找到一个最合适的 投影轴,使两类样本在该轴上投影之间的距 离尽可能远,而每一类样本的投影尽可能紧 凑,从而使分类效果为最佳。
Si (x mi )(x mi )T , i 1,2 xi
Sw S1 S2
样本类间离散度矩阵Sb:Sb (m1 m2 )(m1 m2 )T
离散矩阵在形式上与协方差矩阵很相似,但协方 差矩阵是一种期望值,而离散矩阵只是表示有限 个样本在空间分布的离散程度

《非线性判别函数》课件

《非线性判别函数》课件

相关机器学习算法介绍
决策树
通过递归分割特征空间来实 现分类和回归,具有易解释、 易实现、易可视化的优点。
贝叶斯分类器
基于贝叶斯定理,通过计算 各类别的先验概率和条件概 率来进行分类和预测。
聚类分析
通过找到数据中的群体和类 别,来进行分类、分析和可 视化。
非线性判别函数在模式识别中的应用
人脸识别
通过比对图片库和实时图像, 来判断是否为同一个人。
1 问题
如何对时间序列进行滞后分析和趋势预测?
2 解决
使用深度学习和循环神经网络,结合移动平均模型和差分变换等技术,来提高时间序列 的预测准确性和稳定性。
3 应用
股票预测、商品价格预测、交通流量预测、生产销售预测等方面有广泛的应用。
非线性判别函数未来发展趋势
智能化
非线性函数将嵌入在更智能的 系统和设备中,为人类带来更 多的便利和创新。
声音识别
通过识别声音的频谱和波形, 来识别说话人和语音内容。
文本分类
通过处理语料和特征向量,来 对文本进行分类和情感分析。
非线性判别函数在图像识别中的实践
1 问题
2 解决
3 应用
如何在海量数据中识别、 检测和分类物体?
使用深度学习和卷积神 经网络,结合GPU并行 计算和数据增强等技术, 来提高图像识别的准确 性和效率。
灵活性
非线性函数可以拟合任意形状的数据,解决了线性函数的局限性。
复杂度
非线性函数可以处理复杂的问题,如图像和声音识别,文本分类和时间序列数据预测等。
准确性
非线性函数可以避免过拟合和多重共线性问题,提高模型的准确性和泛化能力。
为什么需要使用非线性判别函数?
1
数据形状

模式识别第二版答案完整版

模式识别第二版答案完整版
• 2.5
1. 对c类情况推广最小错误率率贝叶斯决策规则; 2. 指出此时使错误率最小等价于后验概率最大,即P (wi|x) > P (wj|x) 对一切j ̸= i
成立时,x ∈ wi。
2
模式识别(第二版)习题解答
解:对于c类情况,最小错误率贝叶斯决策规则为: 如果 P (wi|x) = max P (wj|x),则x ∈ wi。利用贝叶斯定理可以将其写成先验概率和
(2) Σ为半正定矩阵所以r(a, b) = (a − b)T Σ−1(a − b) ≥ 0,只有当a = b时,才有r(a, b) = 0。
(3) Σ−1可对角化,Σ−1 = P ΛP T


h11 h12 · · · h1d
• 2.17 若将Σ−1矩阵写为:Σ−1 = h...12
h22 ...
P (w1) P (w2)
= 0。所以判别规则为当(x−u1)T (x−u1) > (x−u2)T (x−u2)则x ∈ w1,反
之则s ∈ w2。即将x判给离它最近的ui的那个类。
[
• 2.24 在习题2.23中若Σ1 ̸= Σ2,Σ1 =
1
1
2
策规则。
1]
2
1
,Σ2
=
[ 1

1 2

1 2
] ,写出负对数似然比决
1
6
模式识别(第二版)习题解答
解:
h(x) = − ln [l(x)]
= − ln p(x|w1) + ln p(x|w2)
=
1 2 (x1

u1)T
Σ−1 1(x1

u1)

1 2 (x2

07 线性判别函数

07 线性判别函数

J r ( w) || Xw b ||2 ( wt xi bi ) 2
i 1
n

这个误差最小的点就是它的梯度等于0的点。
J r 2 X t ( Xw b) 0 X t Xw X t b

w (X X ) X b X b 其中X+叫做X的伪逆。它通常是存在的,尤其 是如果将X+定义为如下形式:

说明wt与超平面上任意的向量都正交。

任意一点x到超平面的距离是:
| g ( x) | r || w ||

当x是原点的时候: | w0 | r || w ||
总结:线性判别函数对应着超平面。超平面的 方向由法向量w决定,超平面的位置由w0决定。

2. 多类问题

定义c个判别函数:
gi ( x) w x wi 0
t

此时,基本梯度下降训练算法中的更新 项变成了: w(k 1) w(k ) (k ) X t ( Xw b)
w(k 1) w(k ) (k )(b(k ) w (k ) x(k ))x(k )
t


LMS算法看似和松弛算法类似。但是松弛 算法是使用分类错误的样例进行训练; LMS是使用所有的样例训练。当样例不是 线性可分的时候,松弛算法是不收敛的。 MSE算法和LMS算法无论在样例是否线性 可分的时候都可以找到解。但是并不保 证正确的分割位置:

if w0 w1 x1 0 otherwise
其中x1>-w0/w1是一个点。

如果特征向量x仅仅包含两个特征x1和x2, 那么上面的判别就变成了:
1 x 2 if w0 w1 x1 w2 x2 0 otherwise

模式识别-判别函数

模式识别-判别函数

d1 0, d2, d3 0
IR,可能
属于1 或3
d1, d2 0, d3 0
1
全部<0 不属任何类
3
d3 0,
确定区(indefinite
d2 0, d1, d3 0
2
region ,IR)。
-
IR,可能 + d3 ( X ) 0
属于3 或 2
x 1
d1, d2 0
数,则有利于模式分类的实现。
2.2 广义线性判别函数
• 基本思想 设有一个训练用的模式集{x},在模式空间x中 线性不可分,但在模式空间x*中线性可分, 其中x*的各个分量是x的单值实函数,x*的维 数k高于x的维数n,即若取
x* = (f1(x), f2(x), …., fk(x)), k>n 则分类界面在x*中是线性的,在x中是非线性 的,此时只要将模式x进行非线性变换,使之 变换后得到维数更高的模式x*,就可以用线 性判别函数来进行分类。
2. 设 d面13为 和(x多 多)=类类d2情情(x)况况, d222,的3(x并区)=使域d:。3(xd)。12(绘x)=出d其1(x判),别界 3. 设d1(x), d2(x)和d3(x)是在多类情况3的条
件下确定的,绘出其判别界面和每类的区 域。
2.2 广义线性判别函数
• 出发点
– 线性判别函数简单,容易实现; – 非线性判别函数复杂,不容易实现; – 若能将非线性判别函数转换为线性判别函
(1)判别函数的几何性质:线性的和非线性的函数。
• 线性的是一条直线; • 非线性的可以是曲线、折线等; • 线性判别函数建立起来比较简单(实际应用较多); • 非线性判别函数建立起来比较复杂。

模式识别感知器算法求判别函数

模式识别感知器算法求判别函数

模式识别感知器算法求判别函数模式识别感知器算法(Perceptron Algorithm)是一种二分类的线性分类器算法。

它通过训练集中的数据样本来学习一组权重,将输入数据映射到一些特定类别。

判别函数是这组权重与输入数据的线性组合。

具体来说,假设我们有一个包含n个特征的输入向量x,模式识别感知器算法的判别函数可以表示为:f(x) = sign(w · x)其中,w是一组权重向量,·表示向量的内积,sign是符号函数,即如果内积结果大于等于0,结果为1,否则为-1算法的目标是找到一组权重w,使得对于所有的输入样本x,f(x)能够准确地将其分类为正类(+1)或者负类(-1),从而实现分类任务。

具体求解判别函数的过程分为两个步骤:初始化和更新权重。

1.初始化:初始权重可以设置为0向量或者一个随机的小值向量。

2.更新权重:通过迭代训练样本来逐步调整权重,直到达到收敛的条件。

a. 对于每个样本x,计算预测输出值y_pred = sign(w · x)。

c. 对于不同的特征i,更新权重w_i = w_i + η * (y - y_pred) * x_i,其中η是学习率(learning rate),控制权重的调整速度。

d.重复以上步骤直到达到收敛条件。

收敛条件可以是预先设定的最大迭代次数或者当所有的样本分类正确时停止。

在实际应用中,算法通常需要对输入数据进行预处理,例如特征缩放、特征选择等,以提高算法的性能和效果。

此外,模式识别感知器算法只能解决线性可分的问题,对于线性不可分的问题,需要使用更加复杂的算法或者进行数据转换处理。

总结起来,模式识别感知器算法的判别函数是通过一组权重与输入数据的线性组合来实现的。

该算法通过迭代训练样本来更新权重,直到达到收敛条件。

虽然该算法在处理线性可分问题中表现优秀,但对于线性不可分问题需要使用其他算法。

04-模式识别-非线性分类

04-模式识别-非线性分类

由多层感知器的第一个隐层的神经元形成的多面体,其中(101)
为虚顶点,不与任何区域相对应,但这并不影响分类(fēn lèi)任务的完成
2022/1/5
11
第十一页,共七十三页。
例如,001顶点对应于如下(rúxià)位置的域:
g1 (x)=0的负侧 g2 (x)=0的负侧 g3 (x)=0的正侧
超平面将000-001-011构 成的类与其它顶点构成的
1
A
1
1
0
B
2022/1/5
2
第二页,共七十三页。
❖ 不存在一条线(或超平面)可以把类A和B分开(fēn kāi),与此相反, AND何OR问题都是线性可分的问题。
2022/1/5
3
第三页,共七十三页。
❖ The Two-Layer Perceptron(双层感知器)
➢ For the XOR problem, draw two, instead, of one lines
以阴影内外(nèiwài)的两个带来分出类A和类B
2022/1/5
4
第四页,共七十三页。
➢ Then class B is located outside the shaded area and class A inside. This is a two-phase design(二阶段(jiēduàn)设计). • Phase 1: Draw two lines (hyperplanes)
2022/1/5
12
第十二页,共七十三页。
❖ Three layer-perceptrons(三层感知器) ➢ The architecture
➢ 三层感知器可以分离由多面体区域的任何并集产生的类
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性判别函数


我们现在对两类问题和多类问题分别进行讨论。 (一)两类问题 即:
i ( , 2 ) , M 2
T
1
1. 二维情况 :取两个特征向量
X ( x1 , x 2 ) , n 2
T
x1 w 2 x 2 w 3
对于任一模式X如果它的 g1(x) >0 , g2(x) <0 , g3(x) <0 则该模式属于ω1类。相应ω1类的区域由直线-x2+1=0 的正边、直线-x1+x2-5=0 和直线-x1+x2=0的负边来确定。
5
g1( x) 0 g 2 (x) 0 g (x) 0 3

0 .5



1

g 2 ( x) g1 ( x) g 2 (x) g3 (x)
1。第一种情况(续)
如果某个X使得>=2个判别函数 gi(x)
>0 ,则此模式X就无 法作出确切的判决,如图中IR1,IR3,IR4区域。
另一种情况是IR2区域,判别函数都为负值。IR1,IR2,
IR3,IR4。都为不确 定区域。
5
g1( x) 0 g 2 ( x) 0 g ( x) 0 3
模式识别
授课教师 薛耀红 xueyh@
第7讲 非线性判别函数
本节课主要内容
1 多类情况下的线性判别函数 2 分段线性判别函数 3 二次判别函数

判别函数

假设对一模式X已抽取n个特征,表示为:
X ( x1 , x 2 , x 3 , ..., x n )
T
X 是 n维 空 间 的 一 个 向 量
T
2. n维情况
模式分类:
g (x) W
T
0, x 1 X 0, x 2
当 g1(x)
=WTX=0 为判别边界 。当n=2时,二维 情况的判别边界为一直线。当n=3时,判别边界 为一平面,n>3时,则判别边界为一超平面。
(二) 多类问题

对于多类问题,模式有 ω1 ,ω2 , … , ωc 个类别。可分 三种情况: 1。第一种情况:每一模式类与其它模式类间可用单 个判别平面把一个类分开。这种情况,M类可有M个判 别函数,且具有以下性质:

因此三个判别边界为:
g 1 ( x ) x1 x 2 0 g 2 ( x ) x1 x 2 5 0 g (x) x 1 0 2 3
1。第一种情况(续)
作图如下:
5
x2
IR 1

g1 ( x) 0

g1( x) 0 g 2 (x) 0 g (x) 0 3
gi (x) Wi
T
0, X i X 0 , 其 它 , i 1, 2 , ..., C。
T
式中 W i ( w i 1 , w i 2 ,..., w in , w in 1 , ) 为第 i 个判别函数的 权向量。
1。第一种情况

每一类别可用单个判别边界与其它类别相分开 。 如果一模式X属于ω1,则由图可清楚看出:这时g1(x) >0而 g2(x) <0 , g3(x) <0 。 ω1 类与其它类之间的边界由 g1(x)=0确定.
1
IR 4
1

2
g1( x) 0 g 2 (x) 0 g (x) 0 3
IR 2
3
g1( x) 0 g 2 (x) 0 g (x) 0 3
5

g3 (x) 0
IR 3
x1


g 2 (x) 0
1。第一种情况(续)



x1
2。第二种情况(续)
结论:判别区间增大,不确定 区间减小,比第一种情况小的多. 问:未知模式X=(x1,x2)T=(4,3)T属 于那一类

5
2判 别 区
x2 g 12 0
g
23
0


g 23 ( x ) 0
1
判别区
代入判别函数可得:
g 12 ( x ) 2 , g 13 ( x ) 1, g 23 ( x ) 1
3。第三种情况(续)
用上列方程组作图如下:

0 .5



1

0 .5
g 2 ( x) g1 ( x) g 2 (x) g3 (x)
g1 ( x) g 2 ( x) g1 ( x) g 3 ( x)
2
3
1 .0
g1 ( x) g 3 ( x) 0
3。第三种情况(续)
右图所示是M=3
的例子。对于ω 1类模式,
g1 ( x) g 2 ( x)
必然满足g1(x)
>g2(x) 和 g1(x) >g3(x) 。
假设判别函数为:
g 1 ( x ) x1 x 2 g 2 ( x ) x1 x 2 1 g (x) x 2 3
1
g1 ( x) g 3 ( x)
2
3
g 2 (x) g3 (x)
则判别边界为:
g 1 ( x ) g 2 ( x ) 2 x1 1 0 g 1 ( x ) g 3 ( x ) x1 2 x 2 0 g (x) g (x) x 2 x 1 0 3 1 2 2
2

x1
2. n维情况

现抽取n个特征为:
X ( x 1 , x 2 , x 3 ,... x n )
T
判别函数: ( x ) w1 x1 w 2 x 2 ...... w n x n w n 1 g
W 0 X w n 1
T
W 0 ( w 1 , w 2 ,..., w n ) 为权向量,
x2
IR 1

g1 ( x) 0



2
g1( x ) 0 g 2( x ) 0 g 3( x ) 0
1
IR 4
1
IR 2


3
IR 3
g3 (x) 0
x1
g1( x) 0 g 2 (x) 0 g (x) 0 3
5


g 2 (x) 0
1。第一种情况(续)

问当x=(x1,x2)T=(6,5)T时属于那一类
代入判别函数方程组 :
g 1 ( x ) x1 x 2 g 2 ( x ) x1 x 2 5 g (x) x 1 2 3
得:
g 1 ( x ) 1, g 2 ( x ) 6 , g 3 ( x ) 4 .
T
X = ( x 1 , x 2 ,..., x n ) 为模式向量。
另外一种表示方法: g ( x ) W
T
T
T
X
W ( w 1 , w 2 , ..., w n , w n 1 ) 为 增 值 权 向 量 , X = ( x1 , x 2 , ..., x n, 为 增 值 模 式 向 量 。 1)
w 为参数, x 1 , x 2 为坐标向量
1. 二维情况
在两类别情况,判别函数 g (x) 具有以下性质:
0, X 1 gi (x) 0, X 2
g ( x ) 0 , X 不定
这是二维情况下判别由判别边界分类. 情况如图:
x2

1
g ( x ) w1 x1 w 2 x 2 w 3
2。第二种情况(续)
判别函数性质: g ij ( x ) g ji ( x )
g 12 ( x ) x 1 g 13 ( x ) x 1 假设判别函数为: g (x) x 1 23 g 12 ( x ) x 1 判别边界为: g 13 ( x ) x 1 用方程式作图: g 23 ( x ) x 1

模式识别问题就是根据模式X的n个特征来判 别模式属于ω1 ,ω2 , … , ωc 类中的那一类。
判别函数(续)
例如下图:三类的分类问题,它们的边界线就是一 个判别函数 x2

2
1
x1
边界
3
判别函数(续)

判别函数包含两类:
一类 是线性判别函数: 线性判别函数
广义线性判别函数
(所谓广义线性判别函数就是把非线性判别函数映射到另 外一个空间变成线性判别函数) 另一类是非线性判别函数 分段线性判别函数 二次判别函数

g 2 (x) g3 (x) 0
g3 (x) g 2 (x) g 3 ( x) g1 ( x) g1 ( x) g 2 ( x) 0

结论:不确定区间没有了,所以这种是最好情况。
3。第三种情况(续)

问假设未知模式x= (x1,x2)T= (1,1)T ,则x属于那一类。 把它代入判别函数:g 1 ( x ), g 2 ( x ), g 3 ( x ). 得判别函数为:g 1 ( x ) 0 , g 2 ( x ) 1, g 3 ( x ) 1 因为 g 2 ( x ) g 3 ( x ), g 2 ( x ) g 1 ( x ) 所以模式x= (1,1)T属于 2 类。
2 判别区
g
21
x2 5 3 x2 x2 5 0 3 0 x2 0
相关文档
最新文档