模式识别习题2017杭电模式识别

合集下载

模式识别练习题

模式识别练习（1）主题：1．“基于最小错误率的贝叶斯决策”模式识别练习2．“基于最小风险的贝叶斯决策”模式识别练习3．基于“主成分分析”的贝叶斯决策模式识别练习已知训练样本集由“”、“”组成：={(0,0),(0,1),(1,0)};={(4,4),(4,5),(5,4),(5,5)}，而测试样本集为C={(2,2),(2.2,2.2),(3,3)}。

（1）利用“基于最小错误率的贝叶斯决策”判别测试集为C中的样本的归类；（2）利用“基于最小风险的贝叶斯决策”判别测试集为C中的样本的归类；（3）在进行“主成分分析”的基础上，采用90%的主成分完成前面的（1）、（2），比较结果的异同。

模式识别练习（2）主题：很多情况下，希望样本维数（特征数）越少越好，降维是解决问题的一个有效的方法。

主成分分析希望得到较少的特征数，而Fisher准则方法则将维数直接降到1维。

一、已知训练样本集由“”、“”组成：={(0,0),(0,1),(1,0)};={(4,4),(4,5),(5,4),(5,5)}，而测试样本集为C={(i,i)|i=0:0.005:5}。

分别利用基于最小错误率的贝叶斯决策、基于最小风险的贝叶斯决策、仅使用第一主成分、使用Fisher准则等四种方法（自编函数文件或用书上的函数文件）计算出测试集C中线段(0,0)-(5,5)的临界点；要求：将计算结果自动写入数据文件中二、已知训练样本集为教材上的10类手写数字集。

分别利用基于最小错误率的贝叶斯决策、基于最小风险的贝叶斯决策、仅使用第一主成分、使用Fisher准则等四种方法，统计出各大类的错误率和计算机cpu的计算时间，采用的测试集C依旧是10类手写数字集（虽然分类已知，但用不同的方法实际判别时可能有误判情况！）要求：使用书上的函数文件，并将计算结果自动写入数据文件中模式识别练习（3）一、已知训练样本集由“”、“”组成：={(0,0),(0,1),(1,0)}；={(4,4),(4,5),(5,4),(5,5)}，而测试样本集为C={(i,i)|i=0:0.01:5}。

模式识别作业三道习题

1 ( x ) 1 ( x1 , x2 ) H 0 ( x1 ) H 0 ( x2 ) 1 2 ( x ) 2 ( x1 , x2 ) H 0 ( x1 ) H1 ( x2 ) 2 x2 3 ( x ) 3 ( x1 , x2 ) H 0 ( x1 ) H 2 ( x2 ) 4 x22 2 4 ( x ) 4 ( x1 , x2 ) H1 ( x1 ) H 0 ( x2 ) 2 x1 5 ( x ) 5 ( x1 , x2 ) H1 ( x1 ) H1 ( x2 ) 4 x1 x2 6 ( x ) 6 ( x1 , x2 ) H1 ( x1 ) H 2 ( x2 ) 2 x1 (4 x22 2) 7 ( x ) 7 ( x1 , x2 ) H 2 ( x1 ) H 0 ( x2 ) 4 x21 2 8 ( x ) 8 ( x1 , x2 ) H 2 ( x1 ) H1 ( x2 ) 2 x2 (4 x21 2) 9 ( x ) 9 ( x1 , x2 ) H 2 ( x1 ) H 2 ( x2 ) (4 x21 2)(4 x22 2)
K7 ( X ) K6 ( X ) 1 第八步：取 X 4 w2 ， K 7 ( X 4 ) 32 0 ，故 0 K8 ( X ) K 7 ( X ) 0 第九步：取 X 1 w1 ， K8 ( X 1 ) 32 0 ，故 1 K 9 ( X ) K8 ( X ) 0 第十步：取 X 2 w1 ， K9 ( X 2 ) 32 0 ，故 1 K10 ( X ) K9 ( X )
2
K ( X , X k ) exp{ || X X k || 2} exp{[( x 1 xk 1) 2 ( x 2 xk 2 ) 2]} x1 X = x2 ，训练样本为 X k 。其中

模式识别习题集

2.6 简述最小张树算法的优点。
2.7 证明马氏距离是平移不变的、非奇异线性变换不变的。 2.8 设，类有
p 、 q 的重心分别为 x p 、 xq ，它们分别有样本 n p 、 n q 个。将和 q 合并为 l ，则 l
个样本。另一类
2 Dkl

nl n p nq
k 的重心为 x k 。试证明 k 与 l 的距离平方是
，JH 越（
），说明模式的

）(i=1,2,…,c)时，JH 取极大值。
1.20 Kn 近邻元法较之于 Parzen 窗法的优势在于（上述两种算法的共同弱点主要是（）。）。
1.21 已知有限状态自动机 Af=(，Q，，q0，F)，={0，1}；Q={q0，q1}；：(q0，0)= q1，(q0，1)= q1，(q1，0)=q0，(q1，1)=q0；q0=q0；F={q0}。现有输入字符串：(a) 00011101011，(b) 1100110011，(c) 101100111000，(d)0010011，试问，用 Af 对上述字符串进行分类的结果为（ 1.22 句法模式识别中模式描述方法有：（1）符号串（2）树（3）图（4）特征向量）。。
《模式识别》习题集
一、基本概念题 1.1 是： 1.2、模式分布为团状时，选用 1.3 欧式距离具有。马式距离具有模式识、别的三大、聚类算法较好。。核心问。题
（1）平移不变性（2）旋转不变性（3）尺度缩放不变性（4）不受量纲影响的特性 1.4 描述模式相似的测度有：（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度；（2）个技术途径。；。
（1）

模式识别试卷

模式识别试卷专业：班级：姓名：学号：一、计算题1、样本n=10，样本空间维数为3，计算线性超平面的二分能力，并指出在3维特征空间线性分类器的))(sgn(),(310∑=+=i i iw x w w x f 的VC 维是多少？ 2、已知有两类样本 ω1=（x1,x2）={(1,0,1),(0,1,1)}; ω2=（x3,x4）={(1,1,0),(0,1,0)}试用感知器算法来设计线性分类器3．})5,6()6,5(,)5,4(,)4,5(,)5,5{(1T T T T T w ----------=})5,4()4,5(,)5,6(,)6,5(,)5,5{(2T T T T T w =试使用K-L 变换做一维特征提取。

4. 二维正态分布1(1,0)T u =-，2(1,0)T u =，12()()P P ωω=。

试分别写出以下两种情况的负对数似然比决策规则（负对数似然比定义为()ln[()]h l =-x x ）：（1）12I ==ΣΣ（2）1112112⎡⎤⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦Σ，2112112⎡⎤-⎢⎥=⎢⎥⎢⎥-⎢⎥⎣⎦Σ 5. 设总体分布密度为(,1),N μμ-∞<<+∞，并设12{,,,}N x x x χ= ，分别用最大似然估计和贝叶斯估计计算ˆμ。

已知ˆμ的先验概率分布()~(0,1)p N μ。

二、程序设计题从/download.html 数据中任选一题；要求如下：1、试卷上写明使用的方法原理，分类结果（错误率），所用方法的优缺点等2、源程序发送到xudong1118@ （注：源程序不要打印在卷面上）三、综合题1、结合自己的课题方向谈谈模式识别的应用。

模式识别习题及答案

模式识别习题及答案模式识别习题及答案模式识别是人类智能的重要组成部分，也是机器学习和人工智能领域的核心内容。

通过模式识别，我们可以从大量的数据中发现规律和趋势，进而做出预测和判断。

本文将介绍一些模式识别的习题，并给出相应的答案，帮助读者更好地理解和应用模式识别。

习题一：给定一组数字序列，如何判断其中的模式？答案：判断数字序列中的模式可以通过观察数字之间的关系和规律来实现。

首先，我们可以计算相邻数字之间的差值或比值，看是否存在一定的规律。

其次，我们可以将数字序列进行分组，观察每组数字之间的关系，看是否存在某种模式。

最后，我们还可以利用统计学方法，如频率分析、自相关分析等，来发现数字序列中的模式。

习题二：如何利用模式识别进行图像分类？答案：图像分类是模式识别的一个重要应用领域。

在图像分类中，我们需要将输入的图像分为不同的类别。

为了实现图像分类，我们可以采用以下步骤：首先，将图像转换为数字表示，如灰度图像或彩色图像的像素矩阵。

然后，利用特征提取算法，提取图像中的关键特征。

接下来，选择合适的分类算法，如支持向量机、神经网络等，训练模型并进行分类。

最后，评估分类结果的准确性和性能。

习题三：如何利用模式识别进行语音识别？答案：语音识别是模式识别在语音信号处理中的应用。

为了实现语音识别，我们可以采用以下步骤：首先，将语音信号进行预处理，包括去除噪声、降低维度等。

然后，利用特征提取算法，提取语音信号中的关键特征，如梅尔频率倒谱系数（MFCC）。

接下来，选择合适的分类算法，如隐马尔可夫模型（HMM）、深度神经网络（DNN）等，训练模型并进行语音识别。

最后，评估识别结果的准确性和性能。

习题四：如何利用模式识别进行时间序列预测？答案：时间序列预测是模式识别在时间序列分析中的应用。

为了实现时间序列预测，我们可以采用以下步骤：首先，对时间序列进行平稳性检验，确保序列的均值和方差不随时间变化。

然后，利用滑动窗口或滚动平均等方法，将时间序列划分为训练集和测试集。

(完整word版)模式识别题目及答案(word文档良心出品)

一、（15分）设有两类正态分布的样本集，第一类均值为T1μ=（2,0），方差11⎡⎤∑=⎢⎥⎣⎦11/21/2，第二类均值为T2μ=（2,2），方差21⎡⎤∑=⎢⎥⎣⎦1-1/2-1/2，先验概率12()()p p ωω=，试求基于最小错误率的贝叶斯决策分界面。

解根据后验概率公式()()()()i i i p x p p x p x ωωω=， (2’)及正态密度函数11/21()exp[()()/2]2T i i i i nip x x x ωμμπ-=--∑-∑ ,1,2i =。

(2’) 基于最小错误率的分界面为1122()()()()p x p p x p ωωωω=， (2’) 两边去对数，并代入密度函数，得1111112222()()/2ln ()()/2ln T T x x x x μμμμ----∑--∑=--∑--∑ (1) (2’)由已知条件可得12∑=∑，114/3-⎡⎤∑=⎢⎥⎣⎦4/3-2/3-2/3，214/3-⎡⎤∑=⎢⎥⎣⎦4/32/32/3，(2’)设12(,)Tx x x =，把已知条件代入式（1），经整理得1221440x x x x --+=， (5’)二、（15分）设两类样本的类内离散矩阵分别为11S ⎡⎤=⎢⎥⎣⎦11/21/2, 21S ⎡⎤=⎢⎥⎣⎦1-1/2-1/2,各类样本均值分别为T 1μ=（1,0），T2μ=（3,2），试用fisher 准则求其决策面方程，并判断样本Tx =（2,2）的类别。

解：122S S S ⎡⎤=+=⎢⎥⎣⎦200 (2’) 投影方向为*112-2-1()211/2w S μμ-⎡⎤⎡⎤⎡⎤=-==⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦1/200 (6’)阈值为[]*0122()/2-1-131T y w μμ⎡⎤=+==-⎢⎥⎣⎦(4’)给定样本的投影为[]*0-12241T y w x y ⎡⎤===-<⎢⎥-⎣⎦，属于第二类 (3’)三、（15分）给定如下的训练样例实例 x0 x1 x2 t(真实输出) 1 1 1 1 1 2 1 2 0 1 3 1 0 1 -1 4 1 1 2 -1用感知器训练法则求感知器的权值，设初始化权值为0120w w w ===；1 第1次迭代（4’）2 第2次迭代（2’）3 第3和4次迭代四、（15分）i. 推导正态分布下的最大似然估计；ii. 根据上步的结论，假设给出如下正态分布下的样本{}1,1.1,1.01,0.9,0.99，估计该部分的均值和方差两个参数。

20xx年模式识别试题及参考答案

20xx年模式识别试题及参考答案2017年模式识别试题及参考答案(一) 1、举出日常生活或技术、学术领域中应用模式识别理论解决问题的实例。

答：我的本科毕设内容和以后的研究方向为重症监护病人的状态监测与预诊断，其中的第一步就是进行ICU病人的死亡率预测，与模式识别理论密切相关。

主要的任务是分析数据库的8000名ICU病人，统计分析死亡与非死亡的生理特征，用于分析预测新进ICU病人的病情状态。

按照模式识别的方法步骤，首先从数据库中采集数据，包括病人的固有信息，生理信息，事件信息等并分为死亡组和非死亡组，然后分别进行数据的预处理，剔除不正常数据，对数据进行插值并取中值进行第一次特征提取，然后利用非监督学习的方法即聚类分析进行第二次特征提取，得到训练样本集和测试样本集。

分别利用判别分析，人工神经网络，支持向量机的方法进行训练，测试，得到分类器，实验效果比传统ICU中采用的评价预测系统好一些。

由于两组数据具有较大重叠，特征提取，即提取模式特征就变得尤为重要。

语音识别，图像识别，车牌识别，文字识别，人脸识别，通信中的信号识别; ①文字识别汉字已有数千年的历史，也是世界上使用人数最多的文字，对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋。

所以在信息技术及计算机技术日益普及的今天，如何将文字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈，也关系到计算机能否真正在我过得到普及的应用。

目前，汉字输入主要分为人工键盘输入和机器自动识别输入两种。

其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识别输入及语音识别输入。

从识别技术的难度来说，手写体识别的难度高于印刷体识别，而在手写体识别中，脱机手写体的难度又远远超过了联机手写体识别。

到目前为止，除了脱机手写体数字的识别已有实际应用外，汉字等文字的脱机手写体识别还处在实验室阶段。

②语音识别语音识别技术技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

模式识别试题答案及评分标准B卷

《模式识别》试题答案及评分标准（B卷）姓名：学号：成绩：一、填空与选择填空（本题答案写在此试卷上，30分）1、模式识别系统的基本构成单元包括：模式采集、特征提取与选择和模式分类。

2、统计模式识别中描述模式的方法一般使用特真矢量；句法模式识别中模式描述方法一般有串、树、网。

3、聚类分析算法属于（1）；判别域代数界面方程法属于（3）。

（1）无监督分类 (2)有监督分类（3）统计模式识别方法（4）句法模式识别方法4、若描述模式的特征量为0-1二值特征量，则一般采用（4）进行相似性度量。

（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度5、下列函数可以作为聚类分析中的准则函数的有（1）（3）（4）。

（1）（2） (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在（2）中进行。

（1）二维空间（2）一维空间（3）N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有（1）；线性可分、不可分都适用的有（3）。

（1）感知器算法（2）H-K算法（3）积累位势函数法8、下列四元组中满足文法定义的有（1）（2）（4）。

（1）({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A)（2）({A}, {0, 1}, {A→0, A→ 0A}, A)（3）({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S)（4）({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A)二、(15分)简答及证明题（1）影响聚类结果的主要因素有那些？（2）证明马氏距离是平移不变的、非奇异线性变换不变的。

（1）(5分)答：分类准则，模式相似性测度，特征量的选择，量纲。

（2）(10分)证明：(2分)(2分)(1分)设，有非奇异线性变换：(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。

模式识别习题及答案-精品资料

第一章绪论1 •什么是模式？具体事物所具有的信息。

模式所指的不是事物本身，而是我们从事物中获得的—信息__。

2. 模式识别的定义？让计算机来判断事物。

3. 模式识别系统主要由哪些部分组成？数据获取一预处理一特征提取与选择一分类器设计/分类决策。

第二章贝叶斯决策理论P ( W 2 ) / p ( w 1 ) _,贝V X1. 最小错误率贝叶斯决策过程？答：已知先验概率，类条件概率。

利用贝叶斯公式得到后验概率。

根据后验概率大小进行决策分析。

2 .最小错误率贝叶斯分类器设计过程？答：根据训练数据求出先验概率P ( W i ), i类条件概率分布p ( x | W i ), i 1 , 2 利用贝叶斯公式得到后验概率P (W i | x)P(X | W j )P(W j )j 1如果输入待测样本 X ,计算X 的后验概率根据后验概率大小进行分类决策分析。

3. 最小错误率贝叶斯决策规则有哪几种常用的表示形式?决策规则的不同形式(董点)C1^ 如vr, | JV ) = max 戶(vr ] WJ A * U vtvEQ 如杲尹a H ; )2^(ir, ) = max |沪0輕』),则x e HpCx |=尸4 "J"匕< 4) 如!4i= — 1IL | /( JV )] = — 111 戸(兀 | w”. ) -+- 11111r a4. 贝叶斯决策为什么称为最小错误率贝叶斯决策？答：最小错误率Bayes 决策使得每个观测值下的条件错误率最小因而保证了 (平均)错误率最小。

Bayes 决策是最优决策：即，能使决策错误率最小。

5 .贝叶斯决策是由先验概率和(类条件概率)概率，推导(后验概率)概率，然后利用这个概率进行决策。

模式识别试题及总结.doc

《模式识别》试卷（ A）一、填空与选择填空（本题答案写在此试卷上，30 分）1、模式识别系统的基本构成单元包括：模式采集、特征提取与选择和模式分类。

2、统计模式识别中描述模式的方法一般使用特真矢量；句法模式识别中模式描述方法一般有串、树、网。

3、聚类分析算法属于（1）；判别域代数界面方程法属于（3）。

（1）无监督分类(2)有监督分类（3）统计模式识别方法（4）句法模式识别方法4、若描述模式的特征量为0-1 二值特征量，则一般采用（4）进行相似性度量。

（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度5、下列函数可以作为聚类分析中的准则函数的有（1）（3）（4）。

（1）（2）(3)(4)6、Fisher 线性判别函数的求解过程是将N 维特征矢量投影在（2）中进行。

（1）二维空间（2）一维空间（3）N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有（1）；线性可分、不可分都适用的有（3）。

（1）感知器算法（2）H-K算法（3）积累位势函数法8、下列四元组中满足文法定义的有（1）（2）（4）。

（1）({A, B}, {0, 1}, {A 01, A0A1 ,A1A0 , B BA , B0}, A)（2）({A}, {0, 1}, {A 0, A0A}, A)（3）({S}, {a, b}, {S 00S, S11S, S00, S11},S)（4）({A}, {0, 1}, {A 01, A0A1, A1A0}, A)9、影响层次聚类算法结果的主要因素有（计算模式距离的测度、（聚类准则、类间距离门限、预定的类别数目））。

10、欧式距离具有（1、 2）；马式距离具有（1、2、3、 4）。

（1）平移不变性（ 2）旋转不变性（ 3）尺度缩放不变性（ 4）不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是（正（负）表示样本点位于判别界面法向量指向的正（负）半空间中；绝对值正比于样本点到判别界面的距离。

（完整word版）模式识别试题答案

（完整word版）模式识别试题答案模式识别非学位课考试试题考试科目：模式识别考试时间考生姓名：考生学号任课教师考试成绩一、简答题（每题6分，12题共72分）：1、监督学习和非监督学习有什么区别？参考答案：当训练样本的类别信息已知时进行的分类器训练称为监督学习，或者由教师示范的学习；否则称为非监督学习或者无教师监督的学习。

2、你如何理解特征空间？表示样本有哪些常见方法？参考答案：由利用某些特征描述的所有样本组成的集合称为特征空间或者样本空间，特征空间的维数是描述样本的特征数量。

描述样本的常见方法：矢量、矩阵、列表等。

3、什么是分类器？有哪些常见的分类器？参考答案：将特征空中的样本以某种方式区分开来的算法、结构等。

例如：贝叶斯分类器、神经网络等。

4、进行模式识别在选择特征时应该注意哪些问题？参考答案：特征要能反映样本的本质；特征不能太少，也不能太多；要注意量纲。

5、聚类分析中，有哪些常见的表示样本相似性的方法？参考答案：距离测度、相似测度和匹配测度。

距离测度例如欧氏距离、绝对值距离、明氏距离、马氏距离等。

相似测度有角度相似系数、相关系数、指数相似系数等。

6、你怎么理解聚类准则？参考答案：包括类内聚类准则、类间距离准则、类内类间距离准则、模式与类核的距离的准则函数等。

准则函数就是衡量聚类效果的一种准则，当这种准则满足一定要求时，就可以说聚类达到了预期目的。

不同的准则函数会有不同的聚类结果。

7、一种类的定义是：集合S 中的元素x i 和x j 间的距离d ij 满足下面公式：∑∑∈∈≤-S x S x ij i jh d k k )1(1，d ij ≤ r ，其中k 是S 中元素的个数，称S 对于阈值h ，r 组成一类。

请说明，该定义适合于解决哪一种样本分布的聚类？参考答案：即类内所有个体之间的平均距离小于h ，单个距离最大不超过r ，显然该定义适合团簇集中分布的样本类别。

8、贝叶斯决策理论中，参数估计和非参数估计有什么区别？参考答案：参数估计就是已知样本分布的概型，通过训练样本确定概型中的一些参数；非参数估计就是未知样本分布概型，利用Parzen 窗等方法确定样本的概率密度分布规律。

模式识别试题及总结

一、填空与选择填空（本题答案写在此试卷上，30分）1、模式识别系统的基本构成单元包括：模式采集、特征提取与选择和模式分类。

2、统计模式识别中描述模式的方法一般使用特真矢量；句法模式识别中模式描述方法一般有串、树、网。

3、聚类分析算法属于（1）；判别域代数界面方程法属于（3）。

（1）无监督分类(2)有监督分类（3）统计模式识别方法（4）句法模式识别方法4、若描述模式的特征量为0-1二值特征量，则一般采用（4）进行相似性度量。

（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度5、下列函数可以作为聚类分析中的准则函数的有（1）（3）（4）。

（1）（2）(3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在（2）中进行。

（1）二维空间（2）一维空间（3）N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有（1）；线性可分、不可分都适用的有（3）。

（1）感知器算法（2）H-K算法（3）积累位势函数法8、下列四元组中满足文法定义的有（1）（2）（4）。

（1）({A,B},{0,1},{A®01,A®0A1,A®1A0,B®BA,B®0},A)（2）({A},{0,1},{A®0,A®0A},A)（3）({S},{a,b},{S®00S,S®11S,S®00,S®11},S)（4）({A},{0,1},{A®01,A®0A1,A®1A0},A)9、影响层次聚类算法结果的主要因素有（计算模式距离的测度、（聚类准则、类间距离门限、预定的类别数目））。

10、欧式距离具有（1、2）；马式距离具有（1、2、3、4）。

（1）平移不变性（2）旋转不变性（3）尺度缩放不变性（4）不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是（正（负）表示样本点位于判别界面法向量指向的正（负）半空间中；绝对值正比于样本点到判别界面的距离。

模式识别试题及总结

模式识别试题及总结⼀、填空与选择填空（本题答案写在此试卷上， 30分）1、模式识别系统的基本构成单元包括：模式采集、特征提取与选择 _________和模式分类。

2、统计模式识别中描述模式的⽅法⼀般使⽤特真⽮量 ;句法模式识别中模式描述⽅法⼀般有串树、⽹。

3、聚类分析算法属于（1）;判别域代数界⾯⽅程法属于（3）。

（1）⽆监督分类（2）有监督分类（3）统计模式识别⽅法（4）句法模式识别⽅法4、若描述模式的特征量为0-1⼆值特征量，则⼀般采⽤（4）进⾏相似性度量。

（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度3 = 2 （函-两》（函-m ）⑷⼆6、 Fisher 线性判别函数的求解过程是将N 维特征⽮量投影在（2）中进⾏。

（1）⼆维空间（2） —维空间（3） N-1维空间7、下列判别域界⾯⽅程法中只适⽤于线性可分情况的算法有（1）;线性可分、不可分都适⽤的有(3)8、下列四元组中满⾜⽂法定义的有（1）（ 2）（ 4）(1) ({ A ，B }，{0, ， A >01, A 0 A 1 , A-. 1 A0 , B-. BA , B )0}, A )(2) ({ A }, {0, 1}, {A >0, A —； 0 A }, A )(3) ({ S }, { a, b }, { S — 00 S , S 11 S , S-00,S > 11},S )(4) ({A }, {0, 1}, {A >01, A > 0A 1, A > 1 A 0}, A )9、影响层次聚类算法结果的主要因素有（计算模式距离的测度、（聚类准则、类间距离门限、预定的类别数⽬））。

10、欧式距离具有（1、2 ）;马式距离具有（1、2、3、4）。

（1）平移不变性（2）旋转不变性（3）尺度缩放不变性（4）不受量纲影响的特性11、线性判别函数的正负和数值⼤⼩的⼏何意义是（正（负）表⽰样本点位于判别界⾯法向量指向的正（负）半空间中；绝对值正⽐于样本点到判别界⾯的距离。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《模式识别》课后习题
注：章和习题编号与《模式识别》（第二版，清华大学出版社）一致，请按内容与其它教材对应，另有部分补充题目单独编号。

第二章贝叶斯决策理论
习题作业
2.3 证明：在两类情况下12()()1P x P x ωω+= 2.4 分别写出在以下两种情况（1）
（2）
下的最小错误率贝叶斯决策规则。

2.9 写出两类和多类情况下最小风险贝叶斯决策判别函数和决策方程。

2.20 对的特殊情况，证明
(1) 若
，则超平面靠近先验概率较小的类；
(2) 在什么情况下，先验概率对超平面的位置影响不大。

2.24 二维正态分布，
写出负对数似然比决策规则。

第三章概率密度函数的估计
3.1设总体分布密度为N (μ,1 )，-∞< μ < +∞，并设 R ={x 1,x 2,…,x N } ，分别
用最大似然估计和贝叶斯估计计算求 , 已知μ的先验分布p(μ)~ N (0,1 )。

（3-2）试分析用Parzen 窗法估计的类概率密度函数，窗口尺寸h 过大或过小可能产生的影响，比较Kn 近邻估计较之于Parzen 窗法的优势。

12()()
p x p x ωω=12()()P P ωω=2
i
I σ∑=()()
i j P P ωω≠1212111122(1,0) (1,0) 111122T T
μμ⎡⎤⎡
⎤-⎢⎥⎢⎥=-=∑=∑=⎢⎥⎢⎥⎢⎥⎢⎥
-⎢⎥⎢⎥⎣⎦⎣⎦，，，12()()P P ωω=ˆμ
第四章线性判别函数
4.4 对于二维线性判别函数12g()22x x x =+- (1)将判别函数写成0()T g x w x w =+的形式，并画出()0g x =的几何图形。

(2)映射成广义七次线性函数()T
g x a y =；
(3)指出上述X 空间实际是Y 空间的一个子空间，且0T
a y =对于X 子空间的
划分和原空间中00T
w w +=对原空间的划分相同，并在图上表示出来。

（4-2）两类样本点
用感知器算法设计分类器。

（4-3）两类样本点
用MSE 准则函数方法，取b i ＝1，设计分类器。

第五章非线性判别函数与近邻法
6.5 有7个二维向量：1234(1,0),(0,1),(0,1),(0,0),T
T
T
T
x x x x ===-=
567(0,2),(0,2),(2,0),T T T x x x ==-=-假定前三个为1w 类，后四个为2w 类。

(1) 画出最近邻法决策面
(2) 求样本均值12,m m ，若按离样本均值距离的大小进行分类，试画出决策
面。

第六章特征的选择与提取
8.1 三类123,,w w w ，求,w b S S 。

1w 类的样本点{(1,0),(2,0),(1,1)},T T T
2w 类的样本点{(0,1)
,(1,0),(1,1)},T
T T --
12:(1,0),(0,1);:(0,1),(1,0)T T T T
ωω--12
:(1,2),(2,0);:(3,1),(2,3)T T T T
ωω
3w 类的样本点{(0,1),(1,1),(0,2)}T T T ----。

9.1 若有下列两类样本集
1w 2w
1234(0,0,0)(1,0,0)(1,0,1)(1,1,0)T T T T
x x x x ====
1234(0,0,1)(0,1,0)(0,1,1)(1,1,1)T T T T
y y y y ====
用K-L 变换，分别把特征空间维数降到d=2和d=1维，并用图画出样本在该特征空间中的位置
第七章非监督学习方法
10. 5 设现有下列三种划分：
证明对于平方误差和准则，第三种划分最好，而若用准则，前两种划分为好。

（10-2）设有样本集，
试用C-均值算法对样本集分类。

{(0,0),(0,1),(1,0),(4,4),(4,5),(5,4),(5,5)}T T T T T T T 1234(4,5),(1,4),(0,1),(5,0)T T T T
x x x x ====112234114223112324(1) {,}, {,}(2) {,}, {,}(3) {,,}, {}
x x x x x x x x x x x x X =X =X =X =X =X =w S。